Реклама i
|
||
| Правила | Регистрация | Пользователи | Поиск | Сообщения за день | Все разделы прочитаны | Справка по форуму | Файлообменник | |
|
![]() |
Поиск в этой теме |
![]() |
#1 | |
Технология создания DJVU-книг застыла в прошлом?
Регистрация: 10.04.2009
Сообщений: 134
|
||
Просмотров: 33335
|
|
||||
Регистрация: 10.09.2007
Сообщений: 10,592
|
- если сканы нормальные (а не полученные от криво сделанной эл. книги), то ST достаточно для отличного качества. Кромсатор не позаботился об элементарной вещи для удобства юзеров - перевести фейс на русский (хотя на руборде автор пишет на русском). Не стоит тратить на кромсатор время ради навороченного функционала, т. к. эти навороты вряд ли потребуются, сам автор не готов сделать детище удобным другим. Кстати, в кромсаторе нет автораспознавания зон картинок - только вручную, это нехило замедлит работу.
Последний раз редактировалось eilukha, 15.02.2021 в 20:41. |
|||
![]() |
|
||||
Регистрация: 10.04.2009
Сообщений: 134
|
Хорошо. С помощью ST я приведу в порядок сканы. С помощью DjvuLibre можно создать из них djvu-файл (Пусть без оглавления и текстового слоя, пока обойдусь)? С консолью справлюсь, если нужно. Там сложная технология разделения и потом обратного соединения текстовых частей страницы и графических для кодирования разными алгоритмами, если я правильно понял. Чтобы такое провернуть, обязательно пользоваться теми прогами из двухтысячных, которые я описал ранее?
Последний раз редактировалось ГОСТ&ОПОКА, 15.02.2021 в 18:03. Причина: DjvuLibre пропустил слово |
|||
![]() |
|
||||
Лучше отдать предпочтение PDF-формату. DJVU - формат негибкий, неудобный для работы с файлом из-за отсутствия вменяемого редактора.
Для работы с PDF есть отличнейший редактор PDF-XChange. А djvu -формат застыл и не развивается, раньше он был более актуален из-за большой разницы размера с файлом PDF, более шустро работал за счет этого, но сейчас при хорошей обработке и пдф-файлы небольшие и шустрые ... |
||||
![]() |
|
||||
Регистрация: 10.04.2009
Сообщений: 134
|
Я по-прежнему ощущаю, что djvu листается гораздо быстрее сканированных pdf. Но у меня все компы, которыми пользуюсь не супер новые. А кроме скорости pdf тоже больше нравится. А может медленно pdf листается, потому что сделан плохо. Попробовал PDF-XChange 6.0 на скорую руку сжать pdf сделанный из tiff 300 dpi 1 bit сжатие LZW, под 200 страниц размер 30 Мб. Состояние картинок отличное. При сжатии выбрал алгоритм JBIG2, насколько я понял это алгоритм аналог DJVU, должен разбирать побуквенно и очень сильно уменьшать размер. Но размер файла после сжатия не уменьшился ни на байт. У вас получалось таким алгоритмом получить приемлимый результат?
Еще читал, что djvu сжатие можно настроить lossless, чтобы "проблему инь" изсключить. Говорят, что на качественных сканах оно не вылазит. Говорят что у JBIG2 этот глюк еще менее вероятен, но мне хотелось бы полностью исключить такую вероятность. У JBIG2 есть lossless режим? В PDF-XChange не нашел опции. |
|||
![]() |
|
||||
Регистрация: 10.09.2007
Сообщений: 10,592
|
- чем?
- нет такой проблемы, если сканы и обработка нормальные, она возникает от малого количества пикселей на одну букву. - так и есть, в отдельных случаях вес как у текстового документа (оно как и должно быть, т. к. практически создаётся новый шрифт и им пишется документ). При одинаковом качестве растровых документов джвю сильно лучше пдф по весу и функционалу работы с документом. Цитата:
----- добавлено через ~2 мин. ----- - я «не читал, но осуждаю», а чем DjVu Small не устроил? ----- добавлено через ~5 мин. ----- Цитата:
----- добавлено через ~17 мин. ----- Имхо: стоит только подзаморочиться с «вклейкой» тоновых картинок, т. к. это сильно снижает вес и ускоряет просмотр документа. Там просто добавляется одна программка при обработке. А совсем для полного счастья, можно побавить тестовый слой и ссылочное оглавление. ----- добавлено через ~5 мин. ----- - это какие? Последний раз редактировалось eilukha, 15.02.2021 в 20:38. |
|||
![]() |
|
||||
Регистрация: 10.04.2009
Сообщений: 134
|
Offtop: Привычными, знакомыми техниками работы с пдф, то есть субъективное. Да я не об этом хотел узнать, того и гляди холивар pdf vs djvu начнется. Я то и сам по опыту использования склоняюсь к тому, что для сканов - djvu. О нем и спрашивал. Про остальное завтра отвечу...
|
|||
![]() |
|
||||
Регистрация: 10.09.2007
Сообщений: 10,592
|
В пдф нельзя:
|
|||
![]() |
|
||||
Регистрация: 10.04.2009
Сообщений: 134
|
Цитата:
Просто передал своими словами, как понял. Читал здесь:2а этап. Метод разделённых сканов, еще где-то. Встречал файлы djvu с сильно искаженными фотографиями, почти исчезнувшими мелкими подписями на чертежах, расчетных схемах и графиках. Как я предполагаю - из за того, что создатели файла не потрудились отдельно обработать рисунки, и алгоритм сжатия, предназначенный для букв, прошелся по графике. Да еще пока не пробовал, не знаю устроит или нет. Только разведываю путь. Но спрашиваю, есть ли альтернативы, потому что в FAQ cказано, что "Эта программа использует "фирменные" консольные утилиты от LizardTech", то есть это коммерческое ПО, по-видимому заброшенное, со всеми вытекающими (см стартовый пост). Вот этот кладезь я имел ввиду. Там все выглядит очень устаревшим, и даже специальная графа в таблице про кряки. Сегодня почти для любой востребованной технологии есть свободный инструментарий с сообществом, баг-репортами, фич-реквестами, документацией, обратной связью с разработчиками, и т.п. Вот и спрашиваю - есть ли альтернативы. Если нет - то, конечно, буду ехать (а не шашечки искать). Конечно, я ничего из этого еще не испробовал. Сам сайт, с которого я начал погружаться в тему - djvu-soft.narod.ru давно не обновлялся. Я хочу спросить, прежде чем погружаться в тему, действительно ли этот набор инструментов используется и сегодня? Не устарела эта информация? |
|||
![]() |
|
||||
Moderator
Конструктор (машиностроение) Регистрация: 23.10.2006
Россия
Сообщений: 23,284
![]() |
Ага, сеть завалена бесплатными редакторами PDF...
|
|||
![]() |
|
||||
Регистрация: 10.09.2007
Сообщений: 10,592
|
- это то, что я назвал «вклейкой картинок», там ничего сложного.
- это если без вклейки делать с одновременным желанием малого веса. Вклейка даёт малый вес и качество одновременно. Программы:
|
|||
![]() |
|
||||
Регистрация: 10.04.2009
Сообщений: 134
|
> Ага, сеть завалена бесплатными редакторами PDF...
Ага, метко подмечено. Но, специфический случай, но все же, для компьютерных джедаев есть pdftk server, PyPDF2, и PyMuPDF, и еще бесчисленное незнакомых мне инструментов, с помощью которых можно наколхозить невообразимые вещи. ----- добавлено через ~42 мин. ----- Главное, и, наверное единственное, чего мне не хватает в работе djvu по сравнению с pdf - это сохранение аннотаций внутри файла. Здесь развенчан этот миф № 6 о том, что djvu не поддерживает встроенных аннотаций, и даже приведен пример файла. Но, к сожалению, просмотрщик WinDjView сохраняет аннотации в реестре системы, а не в файле. А Document Express Editor, котрый может сохранять в файле аннотации, не подходит для просмотра: нет вида двух страниц рядом, перелистывание с клавиатуры затруднено. Цитата:
|
|||
![]() |
|
||||
Регистрация: 10.04.2009
Сообщений: 134
|
Поиск с выводом запрятан глубоко. Нужно нажать ctrl+shift+f или кнопку рядом пред полем ввода обычного поиска. Откроется боковая панель. Там можно искать разными способами, даже во множестве pdf-файлах сразу. На скринах покажу, где кнопка, настройку поиска и результатов. При выделении найденного вхождения, переходит к нему и подсвечивает бледно красным. Советую изменить на тёмно-красный, для этого надо нажать шестиренку справа от поля поиска и там свойства.
Для двух страниц в полноэкранном режиме нужно снять галку "По одной странице" в настройках проги в разделе Полноэкранный режим. Скопировать фрагмент картинки - Alt+7 или Снимок на Главной вкладке, первая панель Утилиты. Если не устраивает полученный dpi (актуально для векторной графики) его можно установить настройках какой нужно. |
|||
![]() |
|
||||
идущий по граблям Регистрация: 26.05.2005
Сообщений: 5,187
|
Цитата:
Теперь разрешающая способность современных камер позволяет быстро получать изображения не хуже, чем с планшетного сканера, если есть нормальный свет и средства взаимного размещения книги и камеры. http://doko.pro/scanner/catalog/2?yc...99410283036414 Можно даже фоткать с рук на телефон с приличной камерой (вроде redmi 8 pro) и получить удовлетворительный результат. Можно купить для телефона подставку вроде тех, что по ссылке и получить результат "на уровне". https://for-extreme.com.ua/mount/sta...-dlya-telefona PS Из программ надо вспомнить Book Restorer (по-моему, тоже уже не поддерживаемый). Если исходные изображения - фотографированные при каком попало освещении, вспышке и т.д. - без его фильтров выравнивания яркости не обойтись. В других прогах их либо вообще нет, либо гораздо хуже ( или я не видел других нормальных) Последний раз редактировалось kp+, 16.02.2021 в 00:31. |
|||
![]() |
|
||||
Регистрация: 10.09.2007
Сообщений: 10,592
|
- ридеры неудобно, т. к. правка часто нужна (а две программы тоже неудобно юзать, хотя дело вкуса).
----- добавлено через ~4 мин. -----
|
|||
![]() |
|
||||
Регистрация: 10.04.2009
Сообщений: 134
|
Так и есть. Если камера хорошая и экран большой (например планшет), есть приложения-"сканеры", например SwiftScan (вывший ScanBot), которые на лету исправят искажение перспективы, обрежут страницу, поправят яркость/котнраст/гамму и вот это все, распознают текст и добавят ocr-слой при желании, и сохранят в многостраничный pdf в облако. Получается приличный результат, особенно когда фотаешь что то старое в архивах втихаря или с разрешения, где не требуется стирать фон и чернобелить, а наоборот нужно сохранить рукописные пометки и штампы, цвет и структуру старой бумаги, линии бланка документа, текст может быть весь рукописный, или на печатной машинке или через копирку сделаный еле видно. Отличный вариант.
|
|||
![]() |
|
||||
идущий по граблям Регистрация: 26.05.2005
Сообщений: 5,187
|
Цитата:
Но для профессионалов и истинных ценителей - только хардкор : https://elarscan.ru/modelnyj-ryad/ Последний раз редактировалось kp+, 16.02.2021 в 01:02. |
|||
![]() |
|
||||
Thượng Tá Quân Đội Nhân Dân Việt Nam Регистрация: 14.03.2005
44d32'44"С, 33d26'51"В
Сообщений: 13,372
|
Цитата:
Скопировать картинку в буфер? Да пожалуйста. Инструмент Снимок. Хоть кусочек, хоть всю страницу - одним щелчком. Вывод сразу всех результатов? "Ух ты, какая..." А Word например, умеет это делать? Слова разорваны? Так надо уметь PDF готовить, чтобы не разрывались. Две страницы? Да хоть две, хоть четыре, хоть справа налево, хоть наоборот. Ах, непременно надо в полноэкранном? Ну, тады ой. А вот "родной" "Акробат" - самый тормозной просмотрщик, именно поэтому появилось столько альтернативных, в том числе полностью бесплатных. Как ни крути, PDF стал фактическим стандартом и самым удобным средством для публикации. Еще и с возможностями редактирования документа - комментарии, маркеры, рисунки поверх и прочее. А вот djvu не стал. Хотя мог бы, но сами разработчики его и загубили, потому и тема такая возникла. Жалко, но "умерла, так умерла". И теперь остается всего лишь не очень распространенной "религией", имеющей своих агрессивных поклонников, которые выискивают настоящие и выдуманные недостатки других форматов. Котоые будут кричать "не спешите хоронить". А ведь в "научных кругах" есть еще и другие "секты" со своими вообще экзотичными форматами... |
|||
![]() |
|
||||
Регистрация: 10.04.2009
Сообщений: 134
|
Недавно я увидел выложенный eilukha СП 20 с измами и подумал - мне тоже так хочется!
Вот результат моего эксперимента, прошедшего благодаря обсуждению в этой теме: СП 16.13330-2017 с Изм 1, 2, переделанный в djvu и pdf (оба без текстового слоя) из картинок, опубликованных на faufcc. Все на настройках по умолчанию, в результат еще не успел всмотреться особо. Пакет программ DjVuLibre прекрасно сработал, все сделано по краткой документации почти с первого раза. Использовал именно его из интереса ответить на вопрос, который поднял данной темой - застыл ли формат совсем или нет? Получилось, что не совсем. DjVuLibre - проект с открытым исходным кодом, разработка, не знаю, насколько активно, но ведется. Последний релиз в прошлом месяце. Все что нужно, на мой взгляд познакомившегося с форматом только вчера человека, там наверняка есть - от слоев всяких до закладок. Главный недостаток по сравнению с DjvuSmall - DjVuLibre не может использовать общий словарь "букв" на множество страниц, кодирует каждую страницу отдельно, а потом просто сшивает. И конечно же есть классика: много-много-летний фич-реквест на этот общий словарь, в котором прогер отвечает - да, хорошо бы, но мне некогда =) Но это понятно. Все равно результат по размеру мне показался приемлимым. Там на форуме обсуждаются и сравниваются и другие djvu-библиотеки (miniDjvu например, он может общий словарь делать), их производительность на 64-битных системах с многоядерными процессорами и результирующие файлы сравниваются с результатами коммерческих кодеков весьма оптимистично. Выбирают, что интегрировать в ScanTailor. Судя по тому, что, у них в хранилище исходников есть каталог "[LizardTech DjVu (obsolete)]", DjVuLibre отпочковался этого кодека, перед тем, как тот стал закрытым и коммерческим. DjvuSmall это интерфейс ко взломанному бинарнику коммерческой версии утилиты командной строки от того же LizardTech, и поэтому у него нет шансов быть интегрированным ScanTailor и всего такого. На форуме мелькают имена и фамилии, похожие на русские. В поставку DjVuLibre входит полностью переведенная на русский язык спецификация формата DJVU! Так что у поборников одновременно формата djvu и свободного ПО есть современный здоровый инструментарий - ScanTailor и DjVuLibre, не хватает скриптов и оберток для последнего, например, по аналогии того же DjVuSmall. Или пользоваться так, разобравшись что к чему. Ни СканТейлор, ни СканКромсатор я не использовал. Просто перевел jpeg в tiff 1bit без сжатия. Потом страницы tiff переводятся в djvu: Цитата:
В полученных jpg есть текст на желтом фоне. При переводе в черно-белый цвет с настройками по умолчанию, на месте желтого фона получилась "мошкара". Ключ -clean нужен для удаления этой "мошкары." После ее удаления страница по умолчанию кодируестся в lossless режиме. Теперь склейка всех страниц в один djvu: Цитата:
Цитата:
Текст получился светловат и шероховат, поля страницы не очень подходят для двусторонней печати и просмотра по разворотам. Если постараться, а не просто ковертнуть в ч/б тиф, то можно добиться лучшего. Вообще мне бы хотелось иметь и версии с желтым фоном под текстом. Так выделены пункты, входящие в "обязательный перечень". Но я не знаю как это правильно сделать. Если кто то знает как этого добиться с помощью Тейлора, Кромсатора, DjvuSmall или чего то еще, подскажите пожалуйста (примеры страниц с желтым фоном 1, 2). Последний раз редактировалось ГОСТ&ОПОКА, 16.02.2021 в 12:27. |
|||
![]() |
|
||||
Регистрация: 10.09.2007
Сообщений: 10,592
|
Цитата:
----- добавлено через ~40 мин. ----- Цитата:
|
|||
![]() |
|
||||
Thượng Tá Quân Đội Nhân Dân Việt Nam Регистрация: 14.03.2005
44d32'44"С, 33d26'51"В
Сообщений: 13,372
|
А это всегда у поклонников "свободного" ПО. Под "свободным" понимается, что какие-то добрые дяденьки его, от нечего делать, разрабатывают и раздают всем бесплатно.
Но добрые дяденьки тоже хотят кушать и зарабатывать. Крупные "свободные" проекты кем-то спонсируются. Как OpenOffice, который делали назло Майкрософт. Потом "пошел по рукам" - Sun, Oracle, Apache. Потом разработчики разбежались и Oo сдох. Начали LibreOffice якобы "за счет пожертвований". Ну и много наши поклонники пожертвовали? И этот проект неизбежно загнется. Ну а про мелочи наподобие вьюверов и говорить нечего. Надоело разработчикам, устали, умерли, сменили ориентацию - и конец. |
|||
![]() |
|
||||
пенсионер Регистрация: 09.04.2018
Украина
Сообщений: 2,318
|
Offtop: Где работал, покупной офис применяли только там, где он требовался в связке с другим ПО, как у сметчиков, к примеру. А остальным хватало свободного (можно ведь и платный взять, раз уж так кому принципиально) офиса. "Неизбежного загибания" как-то не произошло за десяток лет, хоть еще со Стар Офис начиналось и ООО и Либре закончилось... Загнётся и ладно, будет другое. Формат жив, да и шедевры не все ваяют... Банальное - "80% пользователей достаточно 20% возможностей" вполне себе работает. Зачем тратить больше.
|
|||
![]() |
|
||||
Конструктор-Проектировщик Регистрация: 24.12.2008
Сообщений: 2,589
|
Для публикации да, а для пользования отнюдь. Проблема ПДФ в его не масштабируемости на гаджетах. На электронной книге весьма тяжело без проблем охватить всю страничку, тогда как дежавю устанавливает столько слов на страницу, чтобы тебе было удобно читать текст не напрягаясь, как обычную книгу с любым привычным тебе шрифтом, что немаловажно, лично для меня ... хотя я перепутал))) с .fb2
__________________
Если невнятное ТЗ, то результат получится ХЗ. Последний раз редактировалось РастОК, 16.02.2021 в 23:14. Причина: укыфеыук |
|||
![]() |
|
||||
Инженер-философ Регистрация: 24.04.2019
Хабаровск
Сообщений: 2,076
|
Как свести фоновую картинку с черным текстом - написано в инструкциях по созданию DJVU (метод разделенных сканов). Для страницы нужно сохранить две картинки - только текст и только фон. Весь вопрос в том, как отделить желтые выделения минстроя от текста.
|
|||
![]() |
|
||||
Thượng Tá Quân Đội Nhân Dân Việt Nam Регистрация: 14.03.2005
44d32'44"С, 33d26'51"В
Сообщений: 13,372
|
Да, это так. Ну так для ридеров другие форматы предназначены. В том числе и с "картинками".
Вот мне очень много приходится готовить документации - и программы, и несколько книг с иллюстрациями. Все их готовлю в очень удобной программе Help And Maual. Готовый проект могу опубликовать в PDF, CHM, DOC, ePUB, MOBi, eWriter (последние три специально для гаджетов). Еще ePUB перевожу в FB2, более удобный. У каждого формата свои потребители. Ну а что бы делал, если ради "свободы" решил делать в DJVU? Ну, а AutoCAD вообще подлежит проклятию - как его чертежи на гаджетах хотя бы смотреть. Я же не против DJVU "как класса". Но надо понимать достоинства, недостатки, и риски. И "это ж-ж неспроста" - Технология создания DJVU-книг застыла в прошлом? |
|||
![]() |
|
||||
ЭПБ, обследование стр. конструкций Регистрация: 09.10.2009
Сибирь
Сообщений: 2,659
|
Люди, которые в одной программе просматривают сканы серий, типовых проектов, даже не догадываются, что смотрят сканы из файлов djvu. Т.к. это нигде не отображается, можно узнать, если базу данных открыть.
|
|||
![]() |
|
||||
Thượng Tá Quân Đội Nhân Dân Việt Nam Регистрация: 14.03.2005
44d32'44"С, 33d26'51"В
Сообщений: 13,372
|
Цитата:
Насчет "нигде не отображается" - зря. Может "в одной программе" и не отображается, а в другой, правильной, прямо в заголовке показано. Это правильно, потому что человек должон знать, что он смотрит и представлять, что с этим можно сделать. |
|||
![]() |
|
||||
Moderator
Конструктор (машиностроение) Регистрация: 23.10.2006
Россия
Сообщений: 23,284
![]() |
Цитата:
Но пришла эра оптоволоконного интернета и терабайтных дисков. И это перестало играть роль. |
|||
![]() |
|
||||
Thượng Tá Quân Đội Nhân Dân Việt Nam Регистрация: 14.03.2005
44d32'44"С, 33d26'51"В
Сообщений: 13,372
|
Цитата:
Хотя вот у меня две одинаковых книги одного и того же автора, в каждой по 127 страниц. Основное содержимое - картинки нот и минимум текста. Изданы в разные годы, отличаются только первыми страницами. Так PDF весит 5 091 768, а djvu 12 392 798. При этом иллюстрации с фото человеков в PDF намного лучше. Поиск по тексту не работает и там и там. Конечно, многое зависит и от книгоделателя. Но тут скорее просто пристрастия, как с архиваторами. Ну а главное - развивается то, что принимается солидными производителями софта. Они же не будут рекомендовать "скачать с narod.ru". |
|||
![]() |
|
||||
идущий по граблям Регистрация: 26.05.2005
Сообщений: 5,187
|
В продолжение темы. Нарыл по случаю по бросовой цене потрепанный, но рабочий книжный сканер plustek opticbook 3600. Тот, который без одного поля и позволяет сканировать без теней на корешке, не повреждая книгу.
Теперь можно сравнить затраты времени на: - получение исходных изображений "дедовским" (сканер) и "новым" (фото камерой высокого разрешения) методом; - обработку этих изображений. Пока что, как ни странно, с помощью этого сканера несколько быстрее. Т.к. он сам по себе весьма шустрый и сразу выдает ч/б изображения 600 dpi без геометрических искажений, пересветов, теней и прочих присущих фотографии моментов. Из минусов - очень шумный. Ну и оригинал каждый раз переворачивать приходится, что не очень хорошо сказывается на состоянии ветхих книг. Последний раз редактировалось kp+, 12.03.2021 в 12:48. |
|||
![]() |
|
||||
идущий по граблям Регистрация: 26.05.2005
Сообщений: 5,187
|
Слышал о таких рекомендациях, но как по мне, для изначально ч.б. оригиналов это надо при неудобных условиях сканирования, нечеткой печати, загаженном оригинале и т.п. Когда оригинал четкий, более-менее чистый, полностью лежит на стекле, и сканер с нормальной глубиной резкости - ничего никуда не пропадает. Чаще встречалось, что детали пропадают при переводе серого в ч/б и прочих "улучшениях". Что вынуждало отказываться от такой операции и оставлять часть листов (или даже все) в сером.
Последний раз редактировалось kp+, 12.03.2021 в 13:58. |
|||
![]() |
|
||||
ЭПБ, обследование стр. конструкций Регистрация: 09.10.2009
Сибирь
Сообщений: 2,659
|
Цитата:
И ч.б. изображения от мусора уже сложнее очищать, в основном вручную. |
|||
![]() |
|
||||
Регистрация: 02.10.2016
Сообщений: 205
|
Цитата:
https://blogs.apache.org/OOo/ |
|||
![]() |
![]() |
|
Опции темы | Поиск в этой теме |
|
|
![]() |
||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Ваши сканы, наша обработка и перевод в DJVU. | Armin | Поиск литературы, чертежей, моделей и прочих материалов | 3866 | 02.04.2025 09:21 |
Планшет для чтения DJVU и PDF (отзывы, советы, впечатления). | Armin | Разное | 313 | 08.01.2020 10:47 |
технология создания расчетных схем в Лире (опрос) | LS2012 | Лира / Лира-САПР | 60 | 31.05.2013 12:24 |
Технология BIM, практическое внедрение. | VES1 | Технология и организация строительства | 1 | 13.04.2012 09:12 |
Правильно ли мой проект называть словом Технология | olish | Технология и организация строительства | 14 | 08.06.2011 15:52 |