| Правила | Регистрация | Пользователи | Поиск | Сообщения за день | Все разделы прочитаны |  Справка по форуму | Файлообменник |

Вернуться   Форум DWG.RU > Поиск литературы, чертежей, моделей и прочих материалов > Ваши сканы, наша обработка и перевод в DJVU.

Ваши сканы, наша обработка и перевод в DJVU.

Ответ
Поиск в этой теме
Непрочитано 29.07.2009, 10:34 16 |
Ваши сканы, наша обработка и перевод в DJVU.
Armin
 
Проектирование зданий и частей зданий
 
Екатеринбург
Регистрация: 12.06.2007
Сообщений: 3,042

Тема-побратим.
ScanKromsator Программа для обработки сканов книг. Вопросы, советы, хитрости, обсуждение.

Сетевой каталог отсканированной литературы от Wer666 (пока без ссылки, ищем сетевой ресурс).

Чтобы посмотреть выложенную в данной теме литературу (все вложения в данной теме) заходим в раздел "Поиск литературы, чертежей, моделей и прочих материалов". Возле названия темы "Ваши сканы, наша обработка и перевод в DJVU" жмём на изображение скрепки (см. рис).




КРЫЛОВ СМ - Экспериментальное исследование работы железобетонных перекрытий каркасных зданий (статья).
Руководство по проектированию свайных фундаментов 1980
Клейн ГК = Расчет подпорных стен_1964 OCR HypLink (версия от Armin)
ДПМ-Пульс-01_60 (серия по противопожарным дверям)
Пособия по проектированию ЖБК без предварительного напряжения
СНиП 3.02.01-87 Земляные сооружения, основания и фундаменты (2007)
СНиП 2.02.01-83* Основания зданий и сооружений (не окончательная версия)
Макаров ЕВ Светлаков НД = Справочные таблицы весов строительных материалов (версия от Armin)
Строительные работы в зимних условиях Справочное пособие 1953
Пешковский ОИ "Технология изготовления металлических конструкций"
Мурашев ВИ "Трещиноустойчивость, жесткость и прочность железобетона" 1950 (версия от Armin)
Слицкоухов Ю.В. Индустриальные деревянные конструкции 1991 (версия от Armin)
Филиппов Н.А. Константинов И.А. Примеры расчёта и проектирования деревянных конструкций. 1965 (версия от ЛАО)
Арленинов Д.К. и др. Конструкции из дерева и пластмасс. 2002 (версия от ЛАО)
Арленинов Д.К. и др. Конструкции из дерева и пластмасс. 2002 (версия от Armin)
пока до #160

Старое название темы.
Умеeшь сканировать, но не умеешь обрабатывать сканы и переводить в DJVU? Постараемся помочь.

Про ценность отсканированной литературы, выкладываемой в общий доступ, понятно всем.

У многих есть возможность отсканировать и выложить необработанные сканы в инете (на файлообменниках и т.п.).
Но вот умения/возможности/времени обработать сканы (удалить мусор, на страницы порезать, перевести всё это в формат DJVU и т.д.) нет.

У меня есть предложение для таких людей.
Выкладывайте свои сканы, а я (и другие заинтересованные формучане) поможем вам обработать данные растровые файлы и поможем привести в божеский вид.

Естественно всё один я не потяну и интересны мне в основном книги связанные с проектированием (расчет/конструирование) железобетонных и прочих конструкций, зданий и сооружений (особенно старые, годов с 30-ых).

Предлагаю выкладывать в данной теме название книги, которую Вы имеете возможность отсканировать + один отсканированный лист, чтоб была возможность подсказать, как лучше сделать (в каком лучше разрешении и формате сканировать, чтоб получился хороший результат).

Статьи по поводу сканирования с http://djvu-soft.narod.ru

Сканирование бумажной книги. В результате получаются т.н. "сырые сканы"- серые или цветные необработанные изображения страниц книги. Смысл - получение "сырья" для будущей электронной книги. Рекомендуемая программа - Irfan View.

1. Не используйте программу ABBYY FineReader версий 7, 8 или ниже для сканирования книг. Она корёжит получаемые скан-изображения страниц книги. Можно использовать программу ABBYY FineReader 9 для этого - но перед сканированием сбросьте там в опциях галку "Исправлять перекос страниц".

2. Не сканируйте книги в чёрно-белом режиме (Black-White или Line Art или 1-bit), а ТОЛЬКО в режиме серого (Greyscale, или 8-bit) или цветного (Color, или 32-bit) - если книга содержит цветные рисунки. Сканирование в чёрно-белом режиме приводит в итоге к необратимому ухудшению качества получаемой DjVu-эл.книги. Данный режим сканирования задаётся в интерфейсе сканера - т.е. в том окне, которое появляется после нажатия в программе кнопки "Сканировать".

3. Не сканируйте в формат JPG. Формат JPG "размывает" скан-изображения страниц книги.

4. Не используйте опцию "Заменять неуверенно-распознанные символы их изображениями" - когда создаёте Pdf-эл.книгу в ABBYY FineReader - такие эл. книги выглядят ужасно.

5. Сканируйте книги в формат TIF и с разрешением не менее 300 DPI. Для наиболее высокого качества сканируйте с разрешением 600 DPI.

Эта мини-инструкция в картинках, описывающая полный цикл создания электронной версии научно-технической книги, и предназначена для человека, искренне захотевшего сделать приемлемого качества е-книгу, но не знающего с чего начать. Важно понимать, что существует немало апробированных методов создания достаточно качественных e-книг, все они характеризуются тем, что на выходе книга, как правило, научно-техническая, имеет разрешения 600 dpi ч/б (все книги в 300 dpi ч/б, несмотря на все старания создателей, явно проигрывают в качестве).

Рассматриваемая здесь метода, основана на сканировании в 300 dpi, в градациях серого (600 dpi ч/б будет после обработки). По этому поводу следует заметить, что уменьшение геометрического размера сырого скана в 4 раза, по сравнению со сканированием в 600 dpi, практически компенсируется увеличением глубины цвета в 8 раз (зато скорость сканирования возрастает в 2 раза ), а также уменьшением количества паразитного мусора (чистить практически не надо будет).

Беря в руки увесистую книгу, многие думают, что отсканировать ее может только маньяк. Совершенно верно, именно так. Без применения научно-организованного подхода, любая работа превращается в мучение, но, сделав работу незаметной, хоть большого удовольствия и не получишь, но дело сделаешь.

Для сканирования сгодится любая программа, способная взаимодействовать с TWAIN-драйвером сканера и сохранять отсканированные изображения на диск, нумеруя их удобным способом. Сойдет любой просмотровщик графических файлов: ACDSee, IrfanView, XnView… Если ваш сканер поддерживается программой сканирования VueScan, можете использовать и ее.

Например, в IrfanView (скачайте свежую версию этой бесплатной программы) это выглядит примерно так:
- В меню Файл жмем пункт Выбрать TWAIN-источник…
- Далее, там же, выбираем пункт меню Получить изображение/пакетное сканирование…

здесь выбираем, как будут нумероваться файлы сканов, где они будут складироваться и тип графического формата. Не забудем проверить Опции графического формата:

можно выбрать или Без сжатия или LZW (внимание, не все программы корректно с ним работают), в последнем случае размер файла на выходе будет примерно в два раза меньше. Можно, наверное, и ZIP, но это проверьте самостоятельно.
- жмем на кнопку OK и переходим в окно TWAIN Вашего сканера.

Сама техника сканирования незатейлива:
Берется книга, кладется разворотом (т.е. двумя страницами) на стекло, прижимается если надо сверху рукой (это быстрее, чем использовать груз).
Делается предварительное сканирование.
Картинка, если это возможно, в окне сканирования, разворачивается на 90 градусов (в нормальное положение).
Выбирается область сканирования с некоторым запасом, как правило по горизонтали (по вертикали трудно промахнутся).
Мышкой жмется кнопка основного сканирования.
После того, как данный разворот отсканирован, во время обратного движения каретки сканера, переворачиваем страницу книги, кладем на то же место и жмем опять на левую кнопку мыши (курсор ведь остался на кнопке сканирования), и так пока книга не кончится.

Т.е. идея проста, сканируем развороты вслепую. Этим достигаем максимальной скорости сканирования, которая ограничена только техническими характеристиками сканера, и полной свободы головы. Таким образом, во время сканирования, Вы можете заниматься многими другими вещами, да хоть кино посмотреть.

Небольших перекосов, отсканированных страниц, бояться не стоит, это будет исправлено при последующей обработке, но все же надо соблюдать аккуратность. Желательно всё ж таки серединку прижимать посильнее, исправление геометрических искажений строк здесь не будет рассмотрено.

Не забываем, что сканируем с разрешением 300 дпи и в градациях серого (greyscale), если будете сканировать в черно-белом режиме при 300 дпи, то просто потеряете время (хорошая книжка уже не получится).

На выходе этого этапа получаем так называемый сырой материал – файлы в формате tiff с разрешением 300 dpi в градациях серого, обычно размер каждого файла, без использования сжатия, составляет примерно 8 мегабайт (4 при LZW).

Скорость сканирования может достигать до 200 и даже более разворотов (400 страниц) в час, на сканере со скоростью 16 секунд на сканирование А4, т.е. сканирование среднестатистической книги, займет не более 2 часов времени! Ну, а если у Вас Plustek OpticBook 3600, то за час можно отсканировать более 500 страниц (250 разворотов).

Обычно первый и последний разворот книги содержат по одной странице. Ну, так и сканируем их по одной, т.е. все-таки придется сделать 3 предварительных сканирования на книгу .


Лично я раньше сканировал книги в формате tiff (CCITT Fax 4) 600 dpi ч/б. Приемлимо только для новых книг (белая бумага и чёткий текст и картинки).
У нас на работе инженерная машина (принтер/копир/сканер) только этот формат поддерживала. На данный момент аппаратуру обновили и сканирую только в tiff 600 dpi с оттенками серого или в цвете.
Повторюсь, что не надо сканировать в jpeg.
Самое лучшее - несжатый tiff в оттенках серого 600 dpi (чтоб по менее файлы весили можно использовать сжатие ZIP или LZW - потерь не будет).
В большинстве случаев хватит и разрешения 300 dpi при сканировании в формате tiff в оттенках серого.

Пересохранять файлы tiff с разным сжатием можно с помощью бесплатной программы Irfan View.

Многое зависит от качества бумажного оригинала.
По этому я и предлагаю для начала отсканировать из книги один лист/разворот и выложить в теме. Посмотрим на качество и сформулируем рекомендации для конкретного данного случая.

Жутко простая и жутко удобная программка на русском языке для обработки сканов Scan Tailor.
С хорошо сделанными сканами справляется на ура. Саму программу см. вложение scantailor-0.9.10-install.zip


Ссылка на программу СканКромсатор версии 5.91
Описание работы с программой СканКромсатор (ScanAndShare1.07, пдф-ка)
Полезныя ссылка на статью по поводу создания книг DJVU
Как сделать DJVU-книгу

Добавлено (февраль 2012).
По поводу внедрения текстового слоя (ссылку на статью убрал, ибо стала не рабочей).
Советую программу ABBYY FineReader 11.0. Открываем в ней книгу в формате DJVU, распознаём, сохраняем в DJVU (уже с текстовым слоем).
Раньше для внедрения текстового слоя приходилось использовать несколько программ, сейчас всё намного проще.

Ссылка на пост с программкой и инструкцией по её использованию для автоматического внедрения текстового слоя с помощью ABBYY FineReader 11.0 сразу в несколько книг (пакетная обработка). Благодарствие DEM
Сделать оглавление в книге можно легко с помощью Pdf & DjVu Bookmarker Просто попробуйте
Просьба. Если у кого есть в бумажном виде:
1) М.Я. Штаерман, А.М. Ивянский "Безбалочные перекрытия" 1953.
2) Голышев А. Б. и др. "Железобетонные конструкции" (часть I и часть 2) 2001
3) Железобетонные стены сейсмостойких зданий: Исследования и основы проектирования / под редакцией Г.Н. Ашкинадзе и М.Е. Соколова
Москва, Стройиздат, 1988

отсканируйте пожалуйста в хорошем разрешении (не менее 300 dpi) в tiff в оттенках серого.
На сайте уже есть эти книги, но не в очень хорошем качестве.

PPS: Самое основное и главное требование к сканам книг, которые вы делаете или будете делать и в дальнейшем выкладывать в общий доступ.
...
Делайте, как для себя.


http://djvu-spec.narod.ru
О том как правильно делать OCR в DJVU (FineReader 11)
Последний релиз Scantailor

Миниатюры
Нажмите на изображение для увеличения
Название: загрузка_1.jpg
Просмотров: 115263
Размер:	91.6 Кб
ID:	86765  Нажмите на изображение для увеличения
Название: загрузка_2.jpg
Просмотров: 114065
Размер:	95.5 Кб
ID:	86766  

Вложения
Тип файла: zip scantailor-0.9.11-32bit-install.zip (5.07 Мб, 1428 просмотров)

__________________
«Точно знают, только когда мало знают. Вместе со знанием растет сомнение». Иоганн Вольфганг Гете

Последний раз редактировалось Armin, 25.12.2019 в 06:25.
Просмотров: 1959971
 
Непрочитано 13.12.2018, 20:29
#3101
Flexxxxxxxx


 
Регистрация: 01.07.2008
Сообщений: 1,588
Отправить сообщение для Flexxxxxxxx с помощью Skype™


Могу пересканировать в тифы. 600 дпи. В цвете. Только диск в обьеме ме выдержит. Это принципиально?
Flexxxxxxxx вне форума  
 
Непрочитано 13.12.2018, 21:38
#3102
eilukha


 
Регистрация: 10.09.2007
Сообщений: 10,592


Цитата:
Сообщение от Flexxxxxxxx Посмотреть сообщение
пересканировать в тифы. 600 дпи. В цвете.
- это идеально.
Цитата:
Сообщение от Flexxxxxxxx Посмотреть сообщение
диск в обьеме ме выдержит
- какой диск?
Цитата:
Сообщение от Flexxxxxxxx Посмотреть сообщение
принципиально?
- весьма.

Последний раз редактировалось eilukha, 13.12.2018 в 22:04.
eilukha вне форума  
 
Непрочитано 14.12.2018, 05:15
#3103
uvl77


 
Регистрация: 12.12.2010
Сообщений: 248


Цитата:
Сообщение от Flexxxxxxxx Посмотреть сообщение
Могу пересканировать в тифы. 600 дпи. В цвете. Только диск в обьеме ме выдержит
Можно сканировать частями и выкладывать части в файлообменник, тогда диск выдержит.

По поводу дпи. 600 - это идеально (лучший вариант), 300 - это минимально допустимый.
Попробуйте отсканировать пробных страниц 5 в 300 и 600 дпи (помотрите какие наиболее хуже получились в предыдущем скане, те и выбирайте)
Выложите пробу здесь. И вам подскажут - 600 или остановиться на 300 дпи.
uvl77 вне форума  
 
Непрочитано 15.12.2018, 15:12
#3104
Flexxxxxxxx


 
Регистрация: 01.07.2008
Сообщений: 1,588
Отправить сообщение для Flexxxxxxxx с помощью Skype™


Цитата:
Сообщение от uvl77 Посмотреть сообщение
Можно сканировать частями и выкладывать части в файлообменник, тогда диск выдержит.

По поводу дпи. 600 - это идеально (лучший вариант), 300 - это минимально допустимый.
Попробуйте отсканировать пробных страниц 5 в 300 и 600 дпи (помотрите какие наиболее хуже получились в предыдущем скане, те и выбирайте)
Выложите пробу здесь. И вам подскажут - 600 или остановиться на 300 дпи.
Хорошо, сегодня попробую
Flexxxxxxxx вне форума  
 
Непрочитано 15.12.2018, 17:02
#3105
Liukk

нестандартное оборудование, Пневмо-Гидро Системы
 
Регистрация: 28.12.2011
СПб
Сообщений: 1,707


Не выдержал. Flexxxxxxxx. Можно вопрос Вы каким сканером и в какой программе сканируете? Ибо качество подобного тому, что Вы выложили, я вообще не смог получить. У меня, даже в режиме "черное+белое" качество выше. То, что Вы выкладываете это бесполезная трата времени (вашего при сканировании и чужого при обработке)
Я сканирую старым Epson 4870 в бесплатной программе Epson Scan (прилагалась к сканеру) и в jpg 300 dpi, и разницы с тифом не заметил (всё равно качество будет "съедено" при конвертации в djvu). Все настройки делаю при сканировании (обрезка, настройки полутонов, резкость и тп). Тем самым облегчаю себе дальнейшую обработку. Потом профиль запоминается и дальше остаётся только менять страницы. Весьма старый мобильный сканер CanoScan LiDE отнёс на работу у того использую VueScan. Этот сканер даёт картинку немного туже, чем Эпсон, но НАМНОГО лучше, чем у Вас. ABBY для сканирования не использую - только для распознавания текста.
Вот примеры моих работ. Всё сканировано в jpg. Djvu файлы создаю в программе Djvu solo 3.1
https://dwg.ru/lib/3112
"Программа индивидуальной подготовки слесарей 3,4. 5 разрядов" 1959г. http://forum.dwg.ru/attachment.php?a...6&d=1544449572

Последний раз редактировалось Liukk, 15.12.2018 в 17:11.
Liukk вне форума  
 
Непрочитано 15.12.2018, 20:50
#3106
Flexxxxxxxx


 
Регистрация: 01.07.2008
Сообщений: 1,588
Отправить сообщение для Flexxxxxxxx с помощью Skype™


Цитата:
Сообщение от Liukk Посмотреть сообщение
Не выдержал. Flexxxxxxxx. Можно вопрос Вы каким сканером и в какой программе сканируете? Ибо качество подобного тому, что Вы выложили, я вообще не смог получить. У меня, даже в режиме "черное+белое" качество выше. То, что Вы выкладываете это бесполезная трата времени (вашего при сканировании и чужого при обработке)
Я сканирую старым Epson 4870 в бесплатной программе Epson Scan (прилагалась к сканеру) и в jpg 300 dpi, и разницы с тифом не заметил (всё равно качество будет "съедено" при конвертации в djvu). Все настройки делаю при сканировании (обрезка, настройки полутонов, резкость и тп). Тем самым облегчаю себе дальнейшую обработку. Потом профиль запоминается и дальше остаётся только менять страницы. Весьма старый мобильный сканер CanoScan LiDE отнёс на работу у того использую VueScan. Этот сканер даёт картинку немного туже, чем Эпсон, но НАМНОГО лучше, чем у Вас. ABBY для сканирования не использую - только для распознавания текста.
Вот примеры моих работ. Всё сканировано в jpg. Djvu файлы создаю в программе Djvu solo 3.1
https://dwg.ru/lib/3112
"Программа индивидуальной подготовки слесарей 3,4. 5 разрядов" 1959г. http://forum.dwg.ru/attachment.php?a...6&d=1544449572
Сканировал штатными средствами винды. Нр 1212 mf в режиме оттенки серого. Сейчас пересканил в 300 dpi, tif, на epson sx100
Flexxxxxxxx вне форума  
 
Непрочитано 15.12.2018, 21:41
#3107
Liukk

нестандартное оборудование, Пневмо-Гидро Системы
 
Регистрация: 28.12.2011
СПб
Сообщений: 1,707


Цитата:
Сообщение от Flexxxxxxxx Посмотреть сообщение
Нр 1212 mf ... epson sx100
Ясно... почему полутонов вообще нет и качество отвратительное, да и ещё:
Цитата:
Сообщение от Flexxxxxxxx Посмотреть сообщение
Сканировал штатными средствами винды.
Совет. попробуйте специализированную программу для сканирования, и не сканируйте на автомате, НИКОГДА, если конечно хотите получить нормальную картинку.
Цитата:
Сообщение от Flexxxxxxxx Посмотреть сообщение
Сейчас пересканил в 300 dpi, tif,
Выложите одну страницу, на пробу, можно в jpg со средним качеством сжатия.Чтобы оценить качество сканирования.
Liukk вне форума  
 
Непрочитано 15.12.2018, 21:59
#3108
eilukha


 
Регистрация: 10.09.2007
Сообщений: 10,592


Цитата:
Сообщение от Liukk Посмотреть сообщение
можно в jpg
- не развращайте людей, только тиф и без всяких сжатий (это надо специально проверить в настройках)!
eilukha вне форума  
 
Непрочитано 15.12.2018, 22:58
#3109
Flexxxxxxxx


 
Регистрация: 01.07.2008
Сообщений: 1,588
Отправить сообщение для Flexxxxxxxx с помощью Skype™


https://drive.google.com/open?id=1Lc...oOYwr-TOs1X8Ve
Попробуйте. 300 dpi, tif. Если не устраивает, то я сдаюсь. 2 часа сканил

Последний раз редактировалось Flexxxxxxxx, 15.12.2018 в 23:35.
Flexxxxxxxx вне форума  
 
Непрочитано 15.12.2018, 23:31
#3110
eilukha


 
Регистрация: 10.09.2007
Сообщений: 10,592


Цитата:
Сообщение от Flexxxxxxxx Посмотреть сообщение
Посоветуйте прогу для скана.
- а родная не подходит?
Также вроде бы в IrfanView сканирование можно настроить.

Последний раз редактировалось eilukha, 16.12.2018 в 00:40.
eilukha вне форума  
 
Непрочитано 15.12.2018, 23:46
#3111
eilukha


 
Регистрация: 10.09.2007
Сообщений: 10,592


Цитата:
Сообщение от Flexxxxxxxx Посмотреть сообщение
https://drive.google.com/open?id=1zg...2yi14IXno0I_2H
- странные тифы, не сжимаются при архивировании. Причина тут.

----- добавлено через ~21 мин. -----
Цитата:
Сообщение от Flexxxxxxxx Посмотреть сообщение
Попробуйте
- пойдёт, но много излишне обрубленных сканов. Отсканировать лишнее не надо бояться, надо с запасом поля брать, лишнее автоматически в программе обрубается.
Миниатюры
Нажмите на изображение для увеличения
Название: 111.png
Просмотров: 59
Размер:	25.7 Кб
ID:	209119  
eilukha вне форума  
 
Непрочитано 16.12.2018, 00:36
#3112
eilukha


 
Регистрация: 10.09.2007
Сообщений: 10,592


Варианты обработки на скорую руку, для оценки возможного качества и принятия решения о пересканировании.
Если будет пересканирование, то (в порядке важности):
  1. Расширить* с запасом поля сканирования.
  2. Плотнее прижимать разворот книги к сканеру.
  3. Убрать* сжатие в формате тиф. Признак отсутствия сжатия: существенное сжатие (в 1,5-3 раза) при архивировании.
  4. Разрешение 600 дпи вместо 300 дпи, особенно, если это не влияет на скорость сканирования.
_________________
* В настройках сканера или сканирующей программы
Вложения
Тип файла: djvu Вариант_1.djvu (3.28 Мб, 47 просмотров)
Тип файла: djvu Вариант_2.djvu (2.97 Мб, 36 просмотров)

Последний раз редактировалось eilukha, 16.12.2018 в 00:58.
eilukha вне форума  
 
Непрочитано 16.12.2018, 09:34
#3113
Liukk

нестандартное оборудование, Пневмо-Гидро Системы
 
Регистрация: 28.12.2011
СПб
Сообщений: 1,707


Цитата:
Сообщение от eilukha Посмотреть сообщение
- не развращайте людей, только тиф и без всяких сжатий
А это смотря какую степень сжатия использовать...
Найдите разницу между jpg с качество 95% и tiff, без сжатия. Я лично не нашёл. Разница в "весе" файлов - пять раз
Причём сначала jpg был получен из тифа (уже сжатие с потерями) и после кропа при сохранении ещё сжатие... При сканировании и сохранении сразу в jpg непосредственно в сканере будет только одно сжатие с потерей. Вот только степень сжатия jpg нужно выбирать минимальную (максимальное качество)
А вот качество сканированной картинки с её вылезающими изображениями с обратной стороне страницы требует дополнительного вмешательства. И это вмешательство губит мелкие нюансы чертежа. А в технической литературе чертежи (иллюстрации) и формулы часто более важны чем текст. И делать эти настройки лучше непосредственно при сканировании, когда больше исходной информации, чем при последующей обработке картинки, когда часть информации безвозвратно утеряна (даже при сохранении в тифе без сжатия). Хотя LZW сжатие тифа происходит без потерь, а "вес" файла снижается раза в два
Хотя в одном с Вами соглашусь - для "чайников" действительно лучше сканировать в тифе - выше вероятность получения нормального конечного результата
Вложения
Тип файла: rar сельский дом_005.rar (4.94 Мб, 58 просмотров)
Liukk вне форума  
 
Непрочитано 16.12.2018, 10:34
#3114
eilukha


 
Регистрация: 10.09.2007
Сообщений: 10,592


Цитата:
Сообщение от Liukk Посмотреть сообщение
Разница в "весе" файлов - пять раз
- с учётом того, что тиф сжимается в три раза при архивировании, реальный эффект по весу будет значительно скромнее: 1,5-2 раза.
Цитата:
Сообщение от Liukk Посмотреть сообщение
LZW сжатие тифа происходит без потерь
- где про это написано?
eilukha вне форума  
 
Непрочитано 16.12.2018, 11:35
1 | #3115
uvl77


 
Регистрация: 12.12.2010
Сообщений: 248


Цитата:
Сообщение от eilukha Посмотреть сообщение
Цитата: Сообщение от Liukk. LZW сжатие тифа происходит без потерь
- где про это написано?
LZW - алгоритм "Лемпеля — Зива — Велча" (wiki)
Цитата:
Алгори́тм Ле́мпеля — Зи́ва — Ве́лча (Lempel-Ziv-Welch, LZW) — это универсальный алгоритм сжатия данных без потерь, созданный Авраамом Лемпелем (англ. Abraham Lempel), Яаковом Зивом (англ. Jacob Ziv) и Терри Велчем (англ. Terry Welch). Он был опубликован Велчем в 1984 году в качестве улучшенной реализации алгоритма LZ78, опубликованного Лемпелем и Зивом в 1978 году.
uvl77 вне форума  
 
Непрочитано 16.12.2018, 12:34
2 | #3116
Liukk

нестандартное оборудование, Пневмо-Гидро Системы
 
Регистрация: 28.12.2011
СПб
Сообщений: 1,707


Ещё по-поводу jpg и конечного djvu
Во вложение сравнение картинки jpg после сканирования (справа)и эта же страница (8) из "варианта 1" от eilukha (слева). Критические ошибки либо обведены, либо указаны стрелкой (пропала ножка цифры 7 и десятичные точки в числах в djvu файле).
Ну где больше потери качества? А ведь в технике пропущенная запятая или распознавание 7 как 2 или 1 может быть весьма и весьма чревато!!! И хорошо, если грамотный инженер сможет догадаться об "опечатке" (по масштабу например), а если чертёж будет таким, что это невозможно будет сделать?
А есть ещё греческие буквы, которые весьма часто используются в формулах и от их правильного распознавания часто зависит результат расчёта, а иногда и жизни людей!
Миниатюры
Нажмите на изображение для увеличения
Название: проверка качества.jpg
Просмотров: 72
Размер:	337.0 Кб
ID:	209126  
Liukk вне форума  
 
Непрочитано 16.12.2018, 12:48
#3117
eilukha


 
Регистрация: 10.09.2007
Сообщений: 10,592


Liukk, см:

Цитата:
Сообщение от eilukha Посмотреть сообщение
Варианты обработки на скорую руку
- удаляемость полезных точек вместе мусором не проверялась. В исходниках много обрублено лишнего, поэтому в любом случае полноценный источник не получится.

----- добавлено через ~5 мин. -----
Цитата:
Сообщение от Liukk Посмотреть сообщение
весьма чревато
- не сочетаемо.
eilukha вне форума  
 
Непрочитано 16.12.2018, 12:59
#3118
Liukk

нестандартное оборудование, Пневмо-Гидро Системы
 
Регистрация: 28.12.2011
СПб
Сообщений: 1,707


Цитата:
Сообщение от eilukha Посмотреть сообщение
В исходниках много обрублено лишнего, поэтому в любом случае полноценный источник не получится.
НО, в исходнике точки то есть, так что не надо уходить в сторону.
Я как раз про то, что в исходнике проблем очень много. Часть из них Вы уже перечислили, и с ними я полностью согласен
Цитата:
Сообщение от eilukha Посмотреть сообщение
Расширить* с запасом поля сканирования.
Плотнее прижимать разворот книги к сканеру.
Убрать* сжатие в формате тиф. Признак отсутствия сжатия: существенное сжатие (в 1,5-3 раза) при архивировании.
Разрешение 600 дпи вместо 300 дпи, особенно, если это не влияет на скорость сканирования.
Я только категорически настаиваю, что обработка файла должна быть ещё на этапе сканирования.
Цитата:
Сообщение от Liukk Посмотреть сообщение
И делать эти настройки лучше непосредственно при сканировании, когда больше исходной информации, чем при последующей обработке картинки, когда часть информации безвозвратно утеряна (даже при сохранении в тифе без сжатия).
И при ПРАВИЛЬНОМ сканировании исходника в jpg потерь смысла в конечном djvu будет намного меньше, чем при красивом некачественном, но в тифе!

Цитата:
Сообщение от eilukha Посмотреть сообщение
- не сочетаемо.
Прекрасно сочетается, просто похоже не сталкивались.
Liukk вне форума  
 
Непрочитано 16.12.2018, 13:15
#3119
eilukha


 
Регистрация: 10.09.2007
Сообщений: 10,592


Цитата:
Сообщение от Liukk Посмотреть сообщение
уходить в сторону
- пояснил почему нет смысла терять время на качество.
Цитата:
Сообщение от Liukk Посмотреть сообщение
обработка файла должна быть ещё на этапе сканирования
- при сканировании нет обработки, есть только настройки формата (см. *).

Цитата:
Сообщение от Liukk Посмотреть сообщение
сочетается
- как и выражение «маленько беременная».
eilukha вне форума  
 
Непрочитано 16.12.2018, 14:19
#3120
uvl77


 
Регистрация: 12.12.2010
Сообщений: 248


Цитата:
Сообщение от eilukha Посмотреть сообщение
- при сканировании нет обработки, есть только настройки формата (см. *).
Да нет, есть.
Но только у разных сканеров по разному. Наверно у вашего сканера нету.
А вот например у сканера Mustek 1200UB Plus драйвер сканирования выглядит так:
Нажмите на изображение для увеличения
Название: Mustek ScanExpress 1200UB Plus 01.jpg
Просмотров: 46
Размер:	38.4 Кб
ID:	209130 Нажмите на изображение для увеличения
Название: Mustek ScanExpress 1200UB Plus 02.jpg
Просмотров: 36
Размер:	59.2 Кб
ID:	209131 Нажмите на изображение для увеличения
Название: Mustek ScanExpress 1200UB Plus 03.jpg
Просмотров: 34
Размер:	53.4 Кб
ID:	209132
uvl77 вне форума  
Ответ
Вернуться   Форум DWG.RU > Поиск литературы, чертежей, моделей и прочих материалов > Ваши сканы, наша обработка и перевод в DJVU.

Размещение рекламы
Опции темы Поиск в этой теме
Поиск в этой теме:

Расширенный поиск