dwg.ru forum rss xml
| Правила | Регистрация | Пользователи | Поиск | Сообщения за день | Все разделы прочитаны |  Справка по форуму |

Вернуться   Форум DWG.RU > Поиск литературы, чертежей, моделей и прочих материалов > Ваши сканы, наша обработка и перевод в DJVU.

Ваши сканы, наша обработка и перевод в DJVU.

Версия для печати
 
Ответ
Опции темы Поиск в этой теме
Непрочитано 29.07.2009, 10:34 15 |
Ваши сканы, наша обработка и перевод в DJVU.
Armin
 
Проектирование зданий и частей зданий
 
Екатеринбург
Регистрация: 12.06.2007
Сообщений: 2,952

Armin вне форума Вставить имя

Тема-побратим.
ScanKromsator Программа для обработки сканов книг. Вопросы, советы, хитрости, обсуждение.

Сетевой каталог отсканированной литературы от Wer666.

Чтобы посмотреть выложенную в данной теме литературу (все вложения в данной теме) заходим в раздел "Поиск литературы, чертежей, моделей и прочих материалов". Возле названия темы "Ваши сканы, наша обработка и перевод в DJVU" жмём на изображение скрепки (см. рис).




КРЫЛОВ СМ - Экспериментальное исследование работы железобетонных перекрытий каркасных зданий (статья).
Руководство по проектированию свайных фундаментов 1980
Клейн ГК = Расчет подпорных стен_1964 OCR HypLink (версия от Armin)
ДПМ-Пульс-01_60 (серия по противопожарным дверям)
Пособия по проектированию ЖБК без предварительного напряжения
СНиП 3.02.01-87 Земляные сооружения, основания и фундаменты (2007)
СНиП 2.02.01-83* Основания зданий и сооружений (не окончательная версия)
Макаров ЕВ Светлаков НД = Справочные таблицы весов строительных материалов (версия от Armin)
Строительные работы в зимних условиях Справочное пособие 1953
Пешковский ОИ "Технология изготовления металлических конструкций"
Мурашев ВИ "Трещиноустойчивость, жесткость и прочность железобетона" 1950 (версия от Armin)
Слицкоухов Ю.В. Индустриальные деревянные конструкции 1991 (версия от Armin)
Филиппов Н.А. Константинов И.А. Примеры расчёта и проектирования деревянных конструкций. 1965 (версия от ЛАО)
Арленинов Д.К. и др. Конструкции из дерева и пластмасс. 2002 (версия от ЛАО)
Арленинов Д.К. и др. Конструкции из дерева и пластмасс. 2002 (версия от Armin)
пока до #160

Старое название темы.
Умеeшь сканировать, но не умеешь обрабатывать сканы и переводить в DJVU? Постараемся помочь.

Про ценность отсканированной литературы, выкладываемой в общий доступ, понятно всем.

У многих есть возможность отсканировать и выложить необработанные сканы в инете (на файлообменниках и т.п.).
Но вот умения/возможности/времени обработать сканы (удалить мусор, на страницы порезать, перевести всё это в формат DJVU и т.д.) нет.

У меня есть предложение для таких людей.
Выкладывайте свои сканы, а я (и другие заинтересованные формучане) поможем вам обработать данные растровые файлы и поможем привести в божеский вид.

Естественно всё один я не потяну и интересны мне в основном книги связанные с проектированием (расчет/конструирование) железобетонных и прочих конструкций, зданий и сооружений (особенно старые, годов с 30-ых).

Предлагаю выкладывать в данной теме название книги, которую Вы имеете возможность отсканировать + один отсканированный лист, чтоб была возможность подсказать, как лучше сделать (в каком лучше разрешении и формате сканировать, чтоб получился хороший результат).

Статьи по поводу сканирования с http://djvu-soft.narod.ru

Сканирование бумажной книги. В результате получаются т.н. "сырые сканы"- серые или цветные необработанные изображения страниц книги. Смысл - получение "сырья" для будущей электронной книги. Рекомендуемая программа - Irfan View.

1. Не используйте программу ABBYY FineReader версий 7, 8 или ниже для сканирования книг. Она корёжит получаемые скан-изображения страниц книги. Можно использовать программу ABBYY FineReader 9 для этого - но перед сканированием сбросьте там в опциях галку "Исправлять перекос страниц".

2. Не сканируйте книги в чёрно-белом режиме (Black-White или Line Art или 1-bit), а ТОЛЬКО в режиме серого (Greyscale, или 8-bit) или цветного (Color, или 32-bit) - если книга содержит цветные рисунки. Сканирование в чёрно-белом режиме приводит в итоге к необратимому ухудшению качества получаемой DjVu-эл.книги. Данный режим сканирования задаётся в интерфейсе сканера - т.е. в том окне, которое появляется после нажатия в программе кнопки "Сканировать".

3. Не сканируйте в формат JPG. Формат JPG "размывает" скан-изображения страниц книги.

4. Не используйте опцию "Заменять неуверенно-распознанные символы их изображениями" - когда создаёте Pdf-эл.книгу в ABBYY FineReader - такие эл. книги выглядят ужасно.

5. Сканируйте книги в формат TIF и с разрешением не менее 300 DPI. Для наиболее высокого качества сканируйте с разрешением 600 DPI.

Эта мини-инструкция в картинках, описывающая полный цикл создания электронной версии научно-технической книги, и предназначена для человека, искренне захотевшего сделать приемлемого качества е-книгу, но не знающего с чего начать. Важно понимать, что существует немало апробированных методов создания достаточно качественных e-книг, все они характеризуются тем, что на выходе книга, как правило, научно-техническая, имеет разрешения 600 dpi ч/б (все книги в 300 dpi ч/б, несмотря на все старания создателей, явно проигрывают в качестве).

Рассматриваемая здесь метода, основана на сканировании в 300 dpi, в градациях серого (600 dpi ч/б будет после обработки). По этому поводу следует заметить, что уменьшение геометрического размера сырого скана в 4 раза, по сравнению со сканированием в 600 dpi, практически компенсируется увеличением глубины цвета в 8 раз (зато скорость сканирования возрастает в 2 раза ), а также уменьшением количества паразитного мусора (чистить практически не надо будет).

Беря в руки увесистую книгу, многие думают, что отсканировать ее может только маньяк. Совершенно верно, именно так. Без применения научно-организованного подхода, любая работа превращается в мучение, но, сделав работу незаметной, хоть большого удовольствия и не получишь, но дело сделаешь.

Для сканирования сгодится любая программа, способная взаимодействовать с TWAIN-драйвером сканера и сохранять отсканированные изображения на диск, нумеруя их удобным способом. Сойдет любой просмотровщик графических файлов: ACDSee, IrfanView, XnView… Если ваш сканер поддерживается программой сканирования VueScan, можете использовать и ее.

Например, в IrfanView (скачайте свежую версию этой бесплатной программы) это выглядит примерно так:
- В меню Файл жмем пункт Выбрать TWAIN-источник…
- Далее, там же, выбираем пункт меню Получить изображение/пакетное сканирование…

здесь выбираем, как будут нумероваться файлы сканов, где они будут складироваться и тип графического формата. Не забудем проверить Опции графического формата:

можно выбрать или Без сжатия или LZW (внимание, не все программы корректно с ним работают), в последнем случае размер файла на выходе будет примерно в два раза меньше. Можно, наверное, и ZIP, но это проверьте самостоятельно.
- жмем на кнопку OK и переходим в окно TWAIN Вашего сканера.

Сама техника сканирования незатейлива:
Берется книга, кладется разворотом (т.е. двумя страницами) на стекло, прижимается если надо сверху рукой (это быстрее, чем использовать груз).
Делается предварительное сканирование.
Картинка, если это возможно, в окне сканирования, разворачивается на 90 градусов (в нормальное положение).
Выбирается область сканирования с некоторым запасом, как правило по горизонтали (по вертикали трудно промахнутся).
Мышкой жмется кнопка основного сканирования.
После того, как данный разворот отсканирован, во время обратного движения каретки сканера, переворачиваем страницу книги, кладем на то же место и жмем опять на левую кнопку мыши (курсор ведь остался на кнопке сканирования), и так пока книга не кончится.

Т.е. идея проста, сканируем развороты вслепую. Этим достигаем максимальной скорости сканирования, которая ограничена только техническими характеристиками сканера, и полной свободы головы. Таким образом, во время сканирования, Вы можете заниматься многими другими вещами, да хоть кино посмотреть.

Небольших перекосов, отсканированных страниц, бояться не стоит, это будет исправлено при последующей обработке, но все же надо соблюдать аккуратность. Желательно всё ж таки серединку прижимать посильнее, исправление геометрических искажений строк здесь не будет рассмотрено.

Не забываем, что сканируем с разрешением 300 дпи и в градациях серого (greyscale), если будете сканировать в черно-белом режиме при 300 дпи, то просто потеряете время (хорошая книжка уже не получится).

На выходе этого этапа получаем так называемый сырой материал – файлы в формате tiff с разрешением 300 dpi в градациях серого, обычно размер каждого файла, без использования сжатия, составляет примерно 8 мегабайт (4 при LZW).

Скорость сканирования может достигать до 200 и даже более разворотов (400 страниц) в час, на сканере со скоростью 16 секунд на сканирование А4, т.е. сканирование среднестатистической книги, займет не более 2 часов времени! Ну, а если у Вас Plustek OpticBook 3600, то за час можно отсканировать более 500 страниц (250 разворотов).

Обычно первый и последний разворот книги содержат по одной странице. Ну, так и сканируем их по одной, т.е. все-таки придется сделать 3 предварительных сканирования на книгу .


Лично я раньше сканировал книги в формате tiff (CCITT Fax 4) 600 dpi ч/б. Приемлимо только для новых книг (белая бумага и чёткий текст и картинки).
У нас на работе инженерная машина (принтер/копир/сканер) только этот формат поддерживала. На данный момент аппаратуру обновили и сканирую только в tiff 600 dpi с оттенками серого или в цвете.
Повторюсь, что не надо сканировать в jpeg.
Самое лучшее - несжатый tiff в оттенках серого 600 dpi (чтоб по менее файлы весили можно использовать сжатие ZIP или LZW - потерь не будет).
В большинстве случаев хватит и разрешения 300 dpi при сканировании в формате tiff в оттенках серого.

Пересохранять файлы tiff с разным сжатием можно с помощью бесплатной программы Irfan View.

Многое зависит от качества бумажного оригинала.
По этому я и предлагаю для начала отсканировать из книги один лист/разворот и выложить в теме. Посмотрим на качество и сформулируем рекомендации для конкретного данного случая.

Жутко простая и жутко удобная программка на русском языке для обработки сканов Scan Tailor.
С хорошо сделанными сканами справляется на ура. Саму программу см. вложение scantailor-0.9.10-install.zip


Ссылка на программу СканКромсатор версии 5.91
Описание работы с программой СканКромсатор (ScanAndShare1.07, пдф-ка)
Полезныя ссылка на статью по поводу создания книг DJVU
Как сделать DJVU-книгу

Добавлено (февраль 2012).
По поводу внедрения текстового слоя (ссылку на статью убрал, ибо стала не рабочей).
Советую программу ABBYY FineReader 11.0. Открываем в ней книгу в формате DJVU, распознаём, сохраняем в DJVU (уже с текстовым слоем).
Раньше для внедрения текстового слоя приходилось использовать несколько программ, сейчас всё намного проще.

Ссылка на пост с программкой и инструкцией по её использованию для автоматического внедрения текстового слоя с помощью ABBYY FineReader 11.0 сразу в несколько книг (пакетная обработка). Благодарствие DEM
Сделать оглавление в книге можно легко с помощью Pdf & DjVu Bookmarker Просто попробуйте
Просьба. Если у кого есть в бумажном виде:
1) М.Я. Штаерман, А.М. Ивянский "Безбалочные перекрытия" 1953.
2) Голышев А. Б. и др. "Железобетонные конструкции" (часть I и часть 2) 2001
3) Железобетонные стены сейсмостойких зданий: Исследования и основы проектирования / под редакцией Г.Н. Ашкинадзе и М.Е. Соколова
Москва, Стройиздат, 1988

отсканируйте пожалуйста в хорошем разрешении (не менее 300 dpi) в tiff в оттенках серого.
На сайте уже есть эти книги, но не в очень хорошем качестве.

PPS: Самое основное и главное требование к сканам книг, которые вы делаете или будете делать и в дальнейшем выкладывать в общий доступ.
...
Делайте, как для себя.


http://djvu-spec.narod.ru
О том как правильно делать OCR в DJVU (FineReader 11)

Миниатюры
Нажмите на изображение для увеличения
Название: загрузка_1.jpg
Просмотров: 82361
Размер:	91.6 Кб
ID:	86765  Нажмите на изображение для увеличения
Название: загрузка_2.jpg
Просмотров: 81947
Размер:	95.5 Кб
ID:	86766  

Вложения
Тип файла: zip scantailor-0.9.11-32bit-install.zip (5.07 Мб, 1091 просмотров)

__________________
«Точно знают, только когда мало знают. Вместе со знанием растет сомнение». Иоганн Вольфганг Гете

Последний раз редактировалось Armin, 19.08.2018 в 10:39.
Просмотров: 1390870
 
Непрочитано 28.01.2010, 12:54
#141
Shea


 
Регистрация: 28.01.2010
Сообщений: 2


Цитата:
Сообщение от Armin Посмотреть сообщение
У меня названия файлов (сканов страниц книги) содержат только цифры (арабские), соответственно номеру страницы.
01...99, 001...999, 0001...9999 и т.п.

Что-то тут кроме этого ещё.

Если дело в кирилице в имени самого файла DJVU, то и тут пробовал файл обзывать по разному. Не помогало.
выложите куда-нибудь, я посмотрю
Shea вне форума вставить имя Обратить внимание модератора на это сообщение  
 
Автор темы   Непрочитано 28.01.2010, 13:08
#142
Armin

Проектирование зданий и частей зданий
 
Регистрация: 12.06.2007
Екатеринбург
Сообщений: 2,952


Сейчас конкретный файл, с коим были проблемы, не могу вспомнить.
Как только возникнет опять проблема, выложу в данной теме DJVU-шник.
PS: Заранее благодарен за участие.
__________________
«Точно знают, только когда мало знают. Вместе со знанием растет сомнение». Иоганн Вольфганг Гете
Armin вне форума вставить имя Обратить внимание модератора на это сообщение  
 
Непрочитано 28.01.2010, 13:16
#143
Paralelno

АС КЖ
 
Регистрация: 20.02.2008
Архангельск
Сообщений: 121


Цитата:
Сообщение от Armin Посмотреть сообщение
2. Обработка сканов.

Поворот спаренных страниц и резка на отдельные страницы - IrfanView (бесплатная и для данного дела самое оно).

Выравнивание, удаление мусора, заливка дырок, приведение страниц к одному формату и т.п. - Spotlight Pro 7.0 (имеет руссификатор и примеры, к сожалению, не совсем бесплатная). В основном пользовал пакетную обработку файлов, ну и много ручками, естественно, чистил.
Для последнего пользуюсь Paint.NET http://www.getpaint.net/download.html#download
небольшой, шустрый, а главное бесплатный редактор
__________________
(.)(.)
Paralelno вне форума вставить имя Обратить внимание модератора на это сообщение  
 
Автор темы   Непрочитано 01.02.2010, 19:42
#144
Armin

Проектирование зданий и частей зданий
 
Регистрация: 12.06.2007
Екатеринбург
Сообщений: 2,952


Слицкоухов Ю.В. Индустриальные деревянные конструкции 1991
Выложил Ахат.
http://dwg.ru/dnl/7498 - 51 623 кБ (в серых тонах)
обработал СканКромсатором и перевёл в ч/б DJVU.
__________________
«Точно знают, только когда мало знают. Вместе со знанием растет сомнение». Иоганн Вольфганг Гете
Armin вне форума вставить имя Обратить внимание модератора на это сообщение  
 
Непрочитано 01.02.2010, 20:32
#145
Рyslan


 
Регистрация: 25.07.2007
Сообщений: 2,234


перевел книгу весом 140мб из pdf в djvu...теперь весит 420мб
тем, чем вы советовали pdftodjvu_le_v0_1
почему так?
Рyslan вне форума вставить имя Обратить внимание модератора на это сообщение  
 
Автор темы   Непрочитано 01.02.2010, 22:08
#146
Armin

Проектирование зданий и частей зданий
 
Регистрация: 12.06.2007
Екатеринбург
Сообщений: 2,952


Выложи ПДФ-ку где-нибудь, допустим в Download (на время, потом заменишь на менее ёмкий файл).
Переведу тебе в DJVU.
Гарантирую вес менее 400 мегабайт (и даже менее 140 мегабайт!) при том же качестве, что и в ПДФ.
Прогу pdftodjvu_le_v0_1 не щупал, но было дело, что при неправильной настройке виртуального DJVU-принтера, тоже выскакивали черезчур объёмные файлы.
Данные файлы после разбивки на tiff и обратной сборки (той же DJVUSmall), при том же качестве весили в разы меньше.

По просьбам трудящихся выкладываю програмку СканКромсатор версии 5.91 (вложение scan_kromsator_v5_91_full.rar, просто разархивировать и можно работать) и описание работы с ней (миниатюра ScanAndShare1.07, пдф-ка).
Вложения
Тип файла: rar scan_kromsator_v5_91_full.rar (3.26 Мб, 997 просмотров)
Тип файла: pdf ScanAndShare1.07.pdf (915.3 Кб, 1101 просмотров)
__________________
«Точно знают, только когда мало знают. Вместе со знанием растет сомнение». Иоганн Вольфганг Гете

Последний раз редактировалось Armin, 02.02.2010 в 07:09.
Armin вне форума вставить имя Обратить внимание модератора на это сообщение  
 
Непрочитано 02.02.2010, 07:22
#147
Рyslan


 
Регистрация: 25.07.2007
Сообщений: 2,234


Армин, эту книгу Берната выкладывал, потом ее Админ убрал. Авторские права чтоли. Ты лучше расскажи как пдф в тиф перевести. Какой прогой, я скачивал универсальный конвертор, только это демо версия была, она свой штамп ставила на картинках
Рyslan вне форума вставить имя Обратить внимание модератора на это сообщение  
 
Автор темы   Непрочитано 02.02.2010, 09:13
#148
Armin

Проектирование зданий и частей зданий
 
Регистрация: 12.06.2007
Екатеринбург
Сообщений: 2,952


Цитата:
Сообщение от Рyslan Посмотреть сообщение
Армин, эту книгу Берната выкладывал, потом ее Админ убрал. Авторские права чтоли. Ты лучше расскажи как пдф в тиф перевести. Какой прогой, я скачивал универсальный конвертор, только это демо версия была, она свой штамп ставила на картинках
Различным конвертерам не сильно доверяю.
Пользуюсь програмками, которые есть на компьютере, по возможности легальными.
Мой метод такой:
1) Засовываешь/открываешь pdf-ку в ABBYY FineReader.
2) Не распознавая, тупо сохраняешь все страницы в отдельные файлы tiff не сжатые (пункт меню сохранить изображение). Можно и со сжатием, в зависимости от качества и цветности сканов.
3) В дальнейшем обрабатываю сканы, либо просто кодирую в DJVU.

PS: Что за книга?
Если разместишь на Народе и дашь ссылку, думаю особого криминала не будет.
__________________
«Точно знают, только когда мало знают. Вместе со знанием растет сомнение». Иоганн Вольфганг Гете
Armin вне форума вставить имя Обратить внимание модератора на это сообщение  
 
Непрочитано 02.02.2010, 10:08
#149
Кочетков Андрей

Разработчик Java
 
Регистрация: 03.02.2006
Сообщений: 4,537


Кромсатор 5.93
Несмотря на то, что это бетка, но некоторые вещи выполняются на порядок лучше.
Например ошибки с deskew практически исчезли.
По моему в 91 версии еще не было финализации, обратите на это внимание.
Актуальная инструкция по Кромсатору:
http://torrents.ru/forum/viewtopic.php?t=2160930
Вложения
Тип файла: rar ScanKromsator v5.93.rar (3.65 Мб, 343 просмотров)
Кочетков Андрей вне форума вставить имя Обратить внимание модератора на это сообщение  
 
Непрочитано 02.02.2010, 11:58
#150
Рyslan


 
Регистрация: 25.07.2007
Сообщений: 2,234


Цитата:
Сообщение от Armin Посмотреть сообщение

PS: Что за книга?
Дэн Эббот. Автокад. Секреты, которые должен знать каждый пользователь
Рyslan вне форума вставить имя Обратить внимание модератора на это сообщение  
 
Непрочитано 02.02.2010, 12:56
#151
Yuzer

Мозговой штурм
 
Регистрация: 26.10.2008
Рідна ненька - Україна, Харків
Сообщений: 4,820
Отправить сообщение для Yuzer с помощью ICQ Отправить сообщение для Yuzer с помощью Skype™


Цитата:
Сообщение от Рyslan Посмотреть сообщение
перевел книгу весом 140мб из pdf в djvu...теперь весит 420мб
тем, чем вы советовали pdftodjvu_le_v0_1
почему так?
У меня старый вирт. принтер лизардтечь так косячил. Поставил версию по-новее - таких глюков не наблюдал. Сейчас не конвертирую, а просто распечатываю на новом принтере.
__________________
Не доходит через голову?! Дойдет через руки и ноги!
Tekla Structures тоже я.
Yuzer вне форума вставить имя Обратить внимание модератора на это сообщение  
 
Непрочитано 02.02.2010, 13:27
1 | #152
ЛАО

"Студент вечный"
 
Регистрация: 04.02.2008
Самара
Сообщений: 235


Филиппов Н.А. Константинов И.А. Примеры расчёта и проектирования деревянных конструкций. 1965
Арленинов Д.К. и др. Конструкции из дерева и пластмасс. 2002
Ранее выложил Ахат:
http://dwg.ru/dnl/7499
http://dwg.ru/dnl/7408

Порезал, почистил, вот что получилось и вроде бы качество не потерялось:

Последний раз редактировалось ЛАО, 02.02.2010 в 18:37.
ЛАО вне форума вставить имя Обратить внимание модератора на это сообщение  
 
Автор темы   Непрочитано 02.02.2010, 19:05
1 | #153
Armin

Проектирование зданий и частей зданий
 
Регистрация: 12.06.2007
Екатеринбург
Сообщений: 2,952


Для изобилия (раз уж тоже обработал) и моя версия.
Арленинов Д.К. и др. Конструкции из дерева и пластмасс. 2002

обработал СканКромсатором (то, что выложил Ахат) и перевёл в ч/б DJVU.
DJVU ч/б 600 dpi.

PS: ЛАО, советую пощупать СканКромсатор.
__________________
«Точно знают, только когда мало знают. Вместе со знанием растет сомнение». Иоганн Вольфганг Гете
Armin вне форума вставить имя Обратить внимание модератора на это сообщение  
 
Непрочитано 02.02.2010, 19:36
#154
ЛАО

"Студент вечный"
 
Регистрация: 04.02.2008
Самара
Сообщений: 235


Armin, я сделал тоже сначала в всё ч/б варианте, но мне не понравились рисунки-фотки (плохо видно их было) и я решил сделать их в сером цвете, из-за этого разница в размерах и получилась. Эти рисунки-фотки из 9.7 Мб занимают добрые 8 Мб. Как всегда "красота требует жертв", а в данном случае размера файла....
ЛАО вне форума вставить имя Обратить внимание модератора на это сообщение  
 
Автор темы   Непрочитано 02.02.2010, 20:14
#155
Armin

Проектирование зданий и частей зданий
 
Регистрация: 12.06.2007
Екатеринбург
Сообщений: 2,952


На счёт рисунков-фоток согласен.
Мне в СканКромсаторе понравилось, как он со сканами в серых тонах работает.
И как из 300 dpi в серых тонах -> 600 dpi в ч/б делает.
Там, кстатится, можно картинку выделять областью и она аккуратнее обрабатывается (что типа того, пока не разобрался).

В Спутлайт такого увеличением разрешения и сглаживания не достигнешь + крайне офигенная опция illumination в СканКромсаторе имеется.

Цитата:
Дэн Эббот. Автокад. Секреты, которые должен знать каждый пользователь
Глянул я данную книженцию (на торрент.ру закачал), лучше оставить как есть.
Тут тема такая же, как в сообщении #135
__________________
«Точно знают, только когда мало знают. Вместе со знанием растет сомнение». Иоганн Вольфганг Гете

Последний раз редактировалось Armin, 02.02.2010 в 20:25.
Armin вне форума вставить имя Обратить внимание модератора на это сообщение  
 
Непрочитано 02.02.2010, 21:11
#156
ЛАО

"Студент вечный"
 
Регистрация: 04.02.2008
Самара
Сообщений: 235


Я в СканКромсаторе вообще пока только резать умею даже с изображениями в серых тонах не разобрался, все времени нет а уж про опцию illumination и не говорю Все по старинке - в Spotlight'е довожу.
ЛАО вне форума вставить имя Обратить внимание модератора на это сообщение  
 
Непрочитано 03.02.2010, 20:59
#157
Рyslan


 
Регистрация: 25.07.2007
Сообщений: 2,234


Армин, прикольная штука получилась. Через Файн Ридер создал пакет пдфки, он распознал до определенного листа, а дальше пустые листы книги . То что распознал- сохранил как изображение в отенках серого несжатый, уже 1.6 гига получилось
Рyslan вне форума вставить имя Обратить внимание модератора на это сообщение  
 
Автор темы   Непрочитано 04.02.2010, 06:27
#158
Armin

Проектирование зданий и частей зданий
 
Регистрация: 12.06.2007
Екатеринбург
Сообщений: 2,952


Цитата:
Сообщение от Рyslan Посмотреть сообщение
Армин, прикольная штука получилась. Через Файн Ридер создал пакет пдфки, он распознал до определенного листа, а дальше пустые листы книги . То что распознал- сохранил как изображение в отенках серого несжатый, уже 1.6 гига получилось
Так и должны не сжатые tiff весить.
Сохраняя серые сканы, как tiff не сжатый, можешь быть уверен, что качество не ухудшиш.
Ежели бы в jpeg сохранил или в tiff со сжатием, могло бы качество ухудшится (размытие, усреднение и т.п.).
В PDF-ке использовались jpeg-и скорее всего.

Ты с этой книгой какую цель преследуешь?
Переконвертить в DJVU с тем же качеством?
Ну кодируешь в foto, ну получишь файл поменьше PDF-ки, но всё равно достаточно крупного размера.
Если будешь с другими кодировками баловаться, то картинки могут сделаться трудно читаемыми. Всё в них упирается.
Был бы только текст - загнал бы в ч/б и весил бы файл DJVU мегабайт 5-10, а можно и меньше.

Если хочешь нормальный DJVU создать, надо обрабатывать сканы (долго и муторно).

В данном случае присоединяюсь к Солиду.
Цитата:
... цветную книжку целесообразнее паковать в PDF, а не в DJVU
Ежели время есть.
Данную книгу вообще целесообразнее распознать и сохранить в doc.* с картинками (картинки в jpeg сером).
Текст там не замороченный (формулами и греческими символами не изобилует), качество сканов для распознания - хорошее. Главное строки кода (лисп) внимательно проверить.
Из doc.* потом можешь мелкую PDF-ку состряпать + OCR сразу будет, ежели вдруг приспичит.

С не большими брошюрками/методичками не изобилующими формулами и греческими символами, я так и поступаю.
__________________
«Точно знают, только когда мало знают. Вместе со знанием растет сомнение». Иоганн Вольфганг Гете

Последний раз редактировалось Armin, 04.02.2010 в 06:58.
Armin вне форума вставить имя Обратить внимание модератора на это сообщение  
 
Непрочитано 04.02.2010, 07:08
#159
Рyslan


 
Регистрация: 25.07.2007
Сообщений: 2,234


я хочу чтобы книга весила меньше. а почему файн ридер не может распознать все листы??? до определенного листа есть изображение, а после пустые листы.
Рyslan вне форума вставить имя Обратить внимание модератора на это сообщение  
 
Непрочитано 05.02.2010, 07:36
#160
WYW


 
Регистрация: 05.02.2010
Сообщений: 9


По случаю в виде сканов получил следующую книгу. Мразик, Шкалоуд, Тохачек "Расчет и проектирование стальных конструкций с учетом пластических деформаций", 1986 г. Формат файлов jpg, как получил. У кого руки золотые, сделайте книжку, пожалуйста.
Исходники здесь: размер 70Мб http://narod.ru/disk/17599405000/%D0...D0%BA.rar.html
WYW вне форума вставить имя Обратить внимание модератора на это сообщение  
Ответ
Вернуться   Форум DWG.RU > Поиск литературы, чертежей, моделей и прочих материалов > Ваши сканы, наша обработка и перевод в DJVU.

Размещение рекламы
Опции темы Поиск в этой теме
Поиск в этой теме:

Расширенный поиск

Быстрый переход

|| Главная || Каталог САПР || Тендеры || Публикации || Объявления || Биржа труда || Download || Галерея ||
|| Библиотека || Кунсткамера || Каталог предприятий || Контакты || Файлообменник || Блоги ||