|
||
| Правила | Регистрация | Пользователи | Сообщения за день | | Поиск | | Справка по форуму | Файлообменник | |
|
Поиск в этой теме |
15.02.2021, 17:12 | #1 | |
Технология создания DJVU-книг застыла в прошлом?
Регистрация: 10.04.2009
Сообщений: 134
|
||
Просмотров: 32515
|
|
||||
Регистрация: 10.09.2007
Сообщений: 10,592
|
- если сканы нормальные (а не полученные от криво сделанной эл. книги), то ST достаточно для отличного качества. Кромсатор не позаботился об элементарной вещи для удобства юзеров - перевести фейс на русский (хотя на руборде автор пишет на русском). Не стоит тратить на кромсатор время ради навороченного функционала, т. к. эти навороты вряд ли потребуются, сам автор не готов сделать детище удобным другим. Кстати, в кромсаторе нет автораспознавания зон картинок - только вручную, это нехило замедлит работу.
Последний раз редактировалось eilukha, 15.02.2021 в 20:41. |
|||
|
||||
Регистрация: 10.04.2009
Сообщений: 134
|
Хорошо. С помощью ST я приведу в порядок сканы. С помощью DjvuLibre можно создать из них djvu-файл (Пусть без оглавления и текстового слоя, пока обойдусь)? С консолью справлюсь, если нужно. Там сложная технология разделения и потом обратного соединения текстовых частей страницы и графических для кодирования разными алгоритмами, если я правильно понял. Чтобы такое провернуть, обязательно пользоваться теми прогами из двухтысячных, которые я описал ранее?
Последний раз редактировалось ГОСТ&ОПОКА, 15.02.2021 в 18:03. Причина: DjvuLibre пропустил слово |
|||
|
||||
Лучше отдать предпочтение PDF-формату. DJVU - формат негибкий, неудобный для работы с файлом из-за отсутствия вменяемого редактора.
Для работы с PDF есть отличнейший редактор PDF-XChange. А djvu -формат застыл и не развивается, раньше он был более актуален из-за большой разницы размера с файлом PDF, более шустро работал за счет этого, но сейчас при хорошей обработке и пдф-файлы небольшие и шустрые ... |
||||
|
||||
Регистрация: 10.04.2009
Сообщений: 134
|
Я по-прежнему ощущаю, что djvu листается гораздо быстрее сканированных pdf. Но у меня все компы, которыми пользуюсь не супер новые. А кроме скорости pdf тоже больше нравится. А может медленно pdf листается, потому что сделан плохо. Попробовал PDF-XChange 6.0 на скорую руку сжать pdf сделанный из tiff 300 dpi 1 bit сжатие LZW, под 200 страниц размер 30 Мб. Состояние картинок отличное. При сжатии выбрал алгоритм JBIG2, насколько я понял это алгоритм аналог DJVU, должен разбирать побуквенно и очень сильно уменьшать размер. Но размер файла после сжатия не уменьшился ни на байт. У вас получалось таким алгоритмом получить приемлимый результат?
Еще читал, что djvu сжатие можно настроить lossless, чтобы "проблему инь" изсключить. Говорят, что на качественных сканах оно не вылазит. Говорят что у JBIG2 этот глюк еще менее вероятен, но мне хотелось бы полностью исключить такую вероятность. У JBIG2 есть lossless режим? В PDF-XChange не нашел опции. |
|||
|
||||
Регистрация: 10.09.2007
Сообщений: 10,592
|
- чем?
- нет такой проблемы, если сканы и обработка нормальные, она возникает от малого количества пикселей на одну букву. - так и есть, в отдельных случаях вес как у текстового документа (оно как и должно быть, т. к. практически создаётся новый шрифт и им пишется документ). При одинаковом качестве растровых документов джвю сильно лучше пдф по весу и функционалу работы с документом. Цитата:
----- добавлено через ~2 мин. ----- - я «не читал, но осуждаю», а чем DjVu Small не устроил? ----- добавлено через ~5 мин. ----- Цитата:
----- добавлено через ~17 мин. ----- Имхо: стоит только подзаморочиться с «вклейкой» тоновых картинок, т. к. это сильно снижает вес и ускоряет просмотр документа. Там просто добавляется одна программка при обработке. А совсем для полного счастья, можно побавить тестовый слой и ссылочное оглавление. ----- добавлено через ~5 мин. ----- - это какие? Последний раз редактировалось eilukha, 15.02.2021 в 20:38. |
|||
|
||||
Регистрация: 10.04.2009
Сообщений: 134
|
Offtop: Привычными, знакомыми техниками работы с пдф, то есть субъективное. Да я не об этом хотел узнать, того и гляди холивар pdf vs djvu начнется. Я то и сам по опыту использования склоняюсь к тому, что для сканов - djvu. О нем и спрашивал. Про остальное завтра отвечу...
|
|||
|
||||
Регистрация: 10.09.2007
Сообщений: 10,592
|
В пдф нельзя:
|
|||
|
||||
Регистрация: 10.04.2009
Сообщений: 134
|
Цитата:
Просто передал своими словами, как понял. Читал здесь:2а этап. Метод разделённых сканов, еще где-то. Встречал файлы djvu с сильно искаженными фотографиями, почти исчезнувшими мелкими подписями на чертежах, расчетных схемах и графиках. Как я предполагаю - из за того, что создатели файла не потрудились отдельно обработать рисунки, и алгоритм сжатия, предназначенный для букв, прошелся по графике. Да еще пока не пробовал, не знаю устроит или нет. Только разведываю путь. Но спрашиваю, есть ли альтернативы, потому что в FAQ cказано, что "Эта программа использует "фирменные" консольные утилиты от LizardTech", то есть это коммерческое ПО, по-видимому заброшенное, со всеми вытекающими (см стартовый пост). Вот этот кладезь я имел ввиду. Там все выглядит очень устаревшим, и даже специальная графа в таблице про кряки. Сегодня почти для любой востребованной технологии есть свободный инструментарий с сообществом, баг-репортами, фич-реквестами, документацией, обратной связью с разработчиками, и т.п. Вот и спрашиваю - есть ли альтернативы. Если нет - то, конечно, буду ехать (а не шашечки искать). Конечно, я ничего из этого еще не испробовал. Сам сайт, с которого я начал погружаться в тему - djvu-soft.narod.ru давно не обновлялся. Я хочу спросить, прежде чем погружаться в тему, действительно ли этот набор инструментов используется и сегодня? Не устарела эта информация? |
|||
|
||||
Moderator
Конструктор (машиностроение) Регистрация: 23.10.2006
Россия
Сообщений: 22,997
|
Ага, сеть завалена бесплатными редакторами PDF...
|
|||
|
||||
Регистрация: 10.09.2007
Сообщений: 10,592
|
- это то, что я назвал «вклейкой картинок», там ничего сложного.
- это если без вклейки делать с одновременным желанием малого веса. Вклейка даёт малый вес и качество одновременно. Программы:
|
|||
|
||||
Регистрация: 10.04.2009
Сообщений: 134
|
> Ага, сеть завалена бесплатными редакторами PDF...
Ага, метко подмечено. Но, специфический случай, но все же, для компьютерных джедаев есть pdftk server, PyPDF2, и PyMuPDF, и еще бесчисленное незнакомых мне инструментов, с помощью которых можно наколхозить невообразимые вещи. ----- добавлено через ~42 мин. ----- Главное, и, наверное единственное, чего мне не хватает в работе djvu по сравнению с pdf - это сохранение аннотаций внутри файла. Здесь развенчан этот миф № 6 о том, что djvu не поддерживает встроенных аннотаций, и даже приведен пример файла. Но, к сожалению, просмотрщик WinDjView сохраняет аннотации в реестре системы, а не в файле. А Document Express Editor, котрый может сохранять в файле аннотации, не подходит для просмотра: нет вида двух страниц рядом, перелистывание с клавиатуры затруднено. Цитата:
|
|||
|
||||
Регистрация: 10.04.2009
Сообщений: 134
|
Поиск с выводом запрятан глубоко. Нужно нажать ctrl+shift+f или кнопку рядом пред полем ввода обычного поиска. Откроется боковая панель. Там можно искать разными способами, даже во множестве pdf-файлах сразу. На скринах покажу, где кнопка, настройку поиска и результатов. При выделении найденного вхождения, переходит к нему и подсвечивает бледно красным. Советую изменить на тёмно-красный, для этого надо нажать шестиренку справа от поля поиска и там свойства.
Для двух страниц в полноэкранном режиме нужно снять галку "По одной странице" в настройках проги в разделе Полноэкранный режим. Скопировать фрагмент картинки - Alt+7 или Снимок на Главной вкладке, первая панель Утилиты. Если не устраивает полученный dpi (актуально для векторной графики) его можно установить настройках какой нужно. |
|||
|
||||
идущий по граблям Регистрация: 26.05.2005
Сообщений: 5,095
|
Цитата:
Теперь разрешающая способность современных камер позволяет быстро получать изображения не хуже, чем с планшетного сканера, если есть нормальный свет и средства взаимного размещения книги и камеры. http://doko.pro/scanner/catalog/2?yc...99410283036414 Можно даже фоткать с рук на телефон с приличной камерой (вроде redmi 8 pro) и получить удовлетворительный результат. Можно купить для телефона подставку вроде тех, что по ссылке и получить результат "на уровне". https://for-extreme.com.ua/mount/sta...-dlya-telefona PS Из программ надо вспомнить Book Restorer (по-моему, тоже уже не поддерживаемый). Если исходные изображения - фотографированные при каком попало освещении, вспышке и т.д. - без его фильтров выравнивания яркости не обойтись. В других прогах их либо вообще нет, либо гораздо хуже ( или я не видел других нормальных) Последний раз редактировалось kp+, 16.02.2021 в 00:31. |
|||
|
||||
Регистрация: 10.09.2007
Сообщений: 10,592
|
- ридеры неудобно, т. к. правка часто нужна (а две программы тоже неудобно юзать, хотя дело вкуса).
----- добавлено через ~4 мин. -----
|
|||
|
||||
Регистрация: 10.04.2009
Сообщений: 134
|
Так и есть. Если камера хорошая и экран большой (например планшет), есть приложения-"сканеры", например SwiftScan (вывший ScanBot), которые на лету исправят искажение перспективы, обрежут страницу, поправят яркость/котнраст/гамму и вот это все, распознают текст и добавят ocr-слой при желании, и сохранят в многостраничный pdf в облако. Получается приличный результат, особенно когда фотаешь что то старое в архивах втихаря или с разрешения, где не требуется стирать фон и чернобелить, а наоборот нужно сохранить рукописные пометки и штампы, цвет и структуру старой бумаги, линии бланка документа, текст может быть весь рукописный, или на печатной машинке или через копирку сделаный еле видно. Отличный вариант.
|
|||
|
||||
идущий по граблям Регистрация: 26.05.2005
Сообщений: 5,095
|
Цитата:
Но для профессионалов и истинных ценителей - только хардкор : https://elarscan.ru/modelnyj-ryad/ Последний раз редактировалось kp+, 16.02.2021 в 01:02. |
|||
|
||||
Thượng Tá Quân Đội Nhân Dân Việt Nam Регистрация: 14.03.2005
44d32'44"С, 33d26'51"В
Сообщений: 13,381
|
Цитата:
Скопировать картинку в буфер? Да пожалуйста. Инструмент Снимок. Хоть кусочек, хоть всю страницу - одним щелчком. Вывод сразу всех результатов? "Ух ты, какая..." А Word например, умеет это делать? Слова разорваны? Так надо уметь PDF готовить, чтобы не разрывались. Две страницы? Да хоть две, хоть четыре, хоть справа налево, хоть наоборот. Ах, непременно надо в полноэкранном? Ну, тады ой. А вот "родной" "Акробат" - самый тормозной просмотрщик, именно поэтому появилось столько альтернативных, в том числе полностью бесплатных. Как ни крути, PDF стал фактическим стандартом и самым удобным средством для публикации. Еще и с возможностями редактирования документа - комментарии, маркеры, рисунки поверх и прочее. А вот djvu не стал. Хотя мог бы, но сами разработчики его и загубили, потому и тема такая возникла. Жалко, но "умерла, так умерла". И теперь остается всего лишь не очень распространенной "религией", имеющей своих агрессивных поклонников, которые выискивают настоящие и выдуманные недостатки других форматов. Котоые будут кричать "не спешите хоронить". А ведь в "научных кругах" есть еще и другие "секты" со своими вообще экзотичными форматами... |
|||
|
||||
Регистрация: 10.04.2009
Сообщений: 134
|
Недавно я увидел выложенный eilukha СП 20 с измами и подумал - мне тоже так хочется!
Вот результат моего эксперимента, прошедшего благодаря обсуждению в этой теме: СП 16.13330-2017 с Изм 1, 2, переделанный в djvu и pdf (оба без текстового слоя) из картинок, опубликованных на faufcc. Все на настройках по умолчанию, в результат еще не успел всмотреться особо. Пакет программ DjVuLibre прекрасно сработал, все сделано по краткой документации почти с первого раза. Использовал именно его из интереса ответить на вопрос, который поднял данной темой - застыл ли формат совсем или нет? Получилось, что не совсем. DjVuLibre - проект с открытым исходным кодом, разработка, не знаю, насколько активно, но ведется. Последний релиз в прошлом месяце. Все что нужно, на мой взгляд познакомившегося с форматом только вчера человека, там наверняка есть - от слоев всяких до закладок. Главный недостаток по сравнению с DjvuSmall - DjVuLibre не может использовать общий словарь "букв" на множество страниц, кодирует каждую страницу отдельно, а потом просто сшивает. И конечно же есть классика: много-много-летний фич-реквест на этот общий словарь, в котором прогер отвечает - да, хорошо бы, но мне некогда =) Но это понятно. Все равно результат по размеру мне показался приемлимым. Там на форуме обсуждаются и сравниваются и другие djvu-библиотеки (miniDjvu например, он может общий словарь делать), их производительность на 64-битных системах с многоядерными процессорами и результирующие файлы сравниваются с результатами коммерческих кодеков весьма оптимистично. Выбирают, что интегрировать в ScanTailor. Судя по тому, что, у них в хранилище исходников есть каталог "[LizardTech DjVu (obsolete)]", DjVuLibre отпочковался этого кодека, перед тем, как тот стал закрытым и коммерческим. DjvuSmall это интерфейс ко взломанному бинарнику коммерческой версии утилиты командной строки от того же LizardTech, и поэтому у него нет шансов быть интегрированным ScanTailor и всего такого. На форуме мелькают имена и фамилии, похожие на русские. В поставку DjVuLibre входит полностью переведенная на русский язык спецификация формата DJVU! Так что у поборников одновременно формата djvu и свободного ПО есть современный здоровый инструментарий - ScanTailor и DjVuLibre, не хватает скриптов и оберток для последнего, например, по аналогии того же DjVuSmall. Или пользоваться так, разобравшись что к чему. Ни СканТейлор, ни СканКромсатор я не использовал. Просто перевел jpeg в tiff 1bit без сжатия. Потом страницы tiff переводятся в djvu: Цитата:
В полученных jpg есть текст на желтом фоне. При переводе в черно-белый цвет с настройками по умолчанию, на месте желтого фона получилась "мошкара". Ключ -clean нужен для удаления этой "мошкары." После ее удаления страница по умолчанию кодируестся в lossless режиме. Теперь склейка всех страниц в один djvu: Цитата:
Цитата:
Текст получился светловат и шероховат, поля страницы не очень подходят для двусторонней печати и просмотра по разворотам. Если постараться, а не просто ковертнуть в ч/б тиф, то можно добиться лучшего. Вообще мне бы хотелось иметь и версии с желтым фоном под текстом. Так выделены пункты, входящие в "обязательный перечень". Но я не знаю как это правильно сделать. Если кто то знает как этого добиться с помощью Тейлора, Кромсатора, DjvuSmall или чего то еще, подскажите пожалуйста (примеры страниц с желтым фоном 1, 2). Последний раз редактировалось ГОСТ&ОПОКА, 16.02.2021 в 12:27. |
|||
|
|
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Ваши сканы, наша обработка и перевод в DJVU. | Armin | Поиск литературы, чертежей, моделей и прочих материалов | 3806 | 11.04.2024 19:23 |
Планшет для чтения DJVU и PDF (отзывы, советы, впечатления). | Armin | Разное | 313 | 08.01.2020 10:47 |
технология создания расчетных схем в Лире (опрос) | LS2012 | Лира / Лира-САПР | 60 | 31.05.2013 12:24 |
Технология BIM, практическое внедрение. | VES1 | Технология и организация строительства | 1 | 13.04.2012 09:12 |
Правильно ли мой проект называть словом Технология | olish | Технология и организация строительства | 14 | 08.06.2011 15:52 |