| Правила | Регистрация | Пользователи | Поиск | Сообщения за день | Все разделы прочитаны |  Справка по форуму | Файлообменник |

Вернуться   Форум DWG.RU > Программное обеспечение > Прочее. Программное обеспечение > Технология создания DJVU-книг застыла в прошлом?

Технология создания DJVU-книг застыла в прошлом?

Ответ
Поиск в этой теме
Непрочитано 15.02.2021, 17:12
Технология создания DJVU-книг застыла в прошлом?
ГОСТ&ОПОКА
 
Регистрация: 10.04.2009
Сообщений: 134

Пытаюсь освоить создание djvu книг из сканов. Пока что бегло поизучал первый пост темы "Ваши сканы, наша обработка...", сайт http://djvu-soft.narod.ru/. Повсюду на скорую руку составленные руководства десителетней и более давности, ссылки на программы в rar-архивах на файлообменниках, кряки, кейгены, русификаторы и все такое в стиле двухтысячных.

У поразительной по своим возможностям программы ScanKromsator ни сайта, ни документации, ни истории версий. Вместо этого сотни страниц-портянок на ru-board и pdf-компиляция из них на 400 страниц!

Луч света в этом темном царстве - ScanTailor Advanced, но по возможностям, видимо, сильно уступает кромсатору.

Несколько разновидностей DEE - Document Express Editor, Enterpeise, Pro, еще всякие разные, и разные версии, и разные сборки. Производитель программы то ли LizzardTech, то ли Caminova, то ли Сuminas. Все их сайты полумертвые, ни о стоимости ПО, ни о поддержке, ни о чем там не узнать.

DjvuSolo, DjvuSmall - не буду подробно останавливаться, примерно то же состояние.

Форум http://www.djvu-scan.ru/forum/index.php мертв и заспамлен.

Так как же сегодня выглядит технология создания книг в формате Djvu? Застыла в прошлом? Судя по качеству лучших djvu-файлов, даже если и так, то в тот момент, когда была хорошо развита. А если весь этот кладезь собранных по закоулкам интернета не поддерживаемых крякнутых программ перестанет работать в одной из следующих версий windows, то все, пиши пропало? Или просто нет возможности или желания, не важно по каким причинам, использовать ломанное и устаревшее ПО?

Наличие "живых" свободных ScanTailor и DjvuLibre вселяют надежду. Можно ли с помощью только этих программ создать хорошую электронную книгу в формате DJVU? Какие еще есть развивающиеся, поддерживаемые, современные инструменты для создания книг djvu?

Последний раз редактировалось ГОСТ&ОПОКА, 15.02.2021 в 22:14. Причина: сделал ссылка на тему, из которой выделили обсуждение
Просмотров: 32494
 
Непрочитано 16.02.2021, 12:59
1 | #21
eilukha


 
Регистрация: 10.09.2007
Сообщений: 10,592


Цитата:
Сообщение от ГОСТ&ОПОКА Посмотреть сообщение
у поборников одновременно формата djvu и свободного ПО есть современный здоровый инструментарий - ScanTailor и DjVuLibre
- шибко высокопарно, на рекламные цитаты смахивает.

----- добавлено через ~40 мин. -----
Цитата:
Сообщение от ГОСТ&ОПОКА Посмотреть сообщение
Вообще мне бы хотелось иметь и версии с желтым фоном под текстом. Так выделены пункты, входящие в "обязательный перечень". Но я не знаю как это правильно сделать. Если кто то знает как этого добиться с помощью Тейлора, Кромсатора, DjvuSmall или чего то еще, подскажите пожалуйста (примеры страниц с желтым фоном 1, 2).
- см. тут, последнее сообщение (сам я там ничего не понял).
eilukha вне форума  
 
Непрочитано 16.02.2021, 14:55
#22
ShaggyDoc

Thượng Tá Quân Đội Nhân Dân Việt Nam
 
Регистрация: 14.03.2005
44d32'44"С, 33d26'51"В
Сообщений: 13,381


Цитата:
Сообщение от eilukha Посмотреть сообщение
шибко высокопарно, на рекламные цитаты смахивает.
А это всегда у поклонников "свободного" ПО. Под "свободным" понимается, что какие-то добрые дяденьки его, от нечего делать, разрабатывают и раздают всем бесплатно.

Но добрые дяденьки тоже хотят кушать и зарабатывать. Крупные "свободные" проекты кем-то спонсируются. Как OpenOffice, который делали назло Майкрософт. Потом "пошел по рукам" - Sun, Oracle, Apache. Потом разработчики разбежались и Oo сдох. Начали LibreOffice якобы "за счет пожертвований". Ну и много наши поклонники пожертвовали? И этот проект неизбежно загнется.

Ну а про мелочи наподобие вьюверов и говорить нечего. Надоело разработчикам, устали, умерли, сменили ориентацию - и конец.
ShaggyDoc вне форума  
 
Непрочитано 16.02.2021, 15:57
#23
Бим

пенсионер
 
Регистрация: 09.04.2018
Украина
Сообщений: 1,921


Цитата:
Сообщение от ShaggyDoc Посмотреть сообщение
И этот проект неизбежно загнется
Offtop: Где работал, покупной офис применяли только там, где он требовался в связке с другим ПО, как у сметчиков, к примеру. А остальным хватало свободного (можно ведь и платный взять, раз уж так кому принципиально) офиса. "Неизбежного загибания" как-то не произошло за десяток лет, хоть еще со Стар Офис начиналось и ООО и Либре закончилось... Загнётся и ладно, будет другое. Формат жив, да и шедевры не все ваяют... Банальное - "80% пользователей достаточно 20% возможностей" вполне себе работает. Зачем тратить больше.
Бим вне форума  
 
Непрочитано 16.02.2021, 23:09
#24
РастОК

Конструктор-Проектировщик
 
Регистрация: 24.12.2008
Сообщений: 2,588


Цитата:
Сообщение от ShaggyDoc Посмотреть сообщение
Как ни крути, PDF стал фактическим стандартом и самым удобным средством для публикации.
Для публикации да, а для пользования отнюдь. Проблема ПДФ в его не масштабируемости на гаджетах. На электронной книге весьма тяжело без проблем охватить всю страничку, тогда как дежавю устанавливает столько слов на страницу, чтобы тебе было удобно читать текст не напрягаясь, как обычную книгу с любым привычным тебе шрифтом, что немаловажно, лично для меня ... хотя я перепутал))) с .fb2
__________________
Если невнятное ТЗ, то результат получится ХЗ.

Последний раз редактировалось РастОК, 16.02.2021 в 23:14. Причина: укыфеыук
РастОК вне форума  
 
Непрочитано 17.02.2021, 01:26
#25
kp+

идущий по граблям
 
Регистрация: 26.05.2005
Сообщений: 5,091


Offtop:
Цитата:
Сообщение от РастОК Посмотреть сообщение
На электронной книге весьма тяжело без проблем охватить всю страничку
Ждем, когда подешевеют на вторичном рынке эл. книги крупного формата - 13,3" типа sony dpt1.
kp+ вне форума  
 
Непрочитано 17.02.2021, 06:02
1 | #26
Нубий-IV

Инженер-философ
 
Регистрация: 24.04.2019
Хабаровск
Сообщений: 1,869


Цитата:
Сообщение от ГОСТ&ОПОКА Посмотреть сообщение
кто то знает как этого добиться с помощью Тейлора
Как свести фоновую картинку с черным текстом - написано в инструкциях по созданию DJVU (метод разделенных сканов). Для страницы нужно сохранить две картинки - только текст и только фон. Весь вопрос в том, как отделить желтые выделения минстроя от текста.
  • Тейлор прекрасно отделяет текст, так что первую картинку лучше всего получать с его помощью.
  • Отделить фон может G'MIC - это консольный редактор картинок . Автоматически отделить большие цветные области, удалив мелкие буквы, умеет фильтр "сегментация". Вот эту команду надо сохранить как командный файл в папку с исходными JPG-ами, и после запуска она сохранит в этой же папке PNG-и, где текст стерт:
    Код:
    [Выделить все]
    for %%f in (*.jpg) do C:\Programs\GMIC\gmic.exe -i  "%%f" -fx_segment_watershed 0.1,0.5,0,0,0,50,50 -o "%%f.png"
    Работает не идеально, оставляя иногда большие черные объекты, типа таблиц или рисунков. Результаты надо просмотреть, и что-то слегка поправить вручную.
    Но в нескольких файлах стереть лишние оставшиеся части намного легче, чем редактировать вручную вообще все.

    Можно скачать G'MIC как плагин для GIMP (тогда у G'MIC будет графический интерфейс) и подбирать параметры не на ощупь. Можно в настройках плагина указать выводить настройки в имя слоя.
    Тогда после применения фильтра можно посмотреть, какие параметры использовать в командных файлах.
    Можно поставить плагин BIMP для GIMPа, и делать пакетную обработку файлов в папке из графического интерфейса GIMP, без возни с командными файлами.
    Возможно, аналогичные фильтры есть во всяких фотошопах.
Миниатюры
Нажмите на изображение для увеличения
Название: Фильтр.png
Просмотров: 330
Размер:	226.7 Кб
ID:	234609  Нажмите на изображение для увеличения
Название: GMIC.png
Просмотров: 327
Размер:	97.8 Кб
ID:	234610  Нажмите на изображение для увеличения
Название: Слои.png
Просмотров: 321
Размер:	17.1 Кб
ID:	234611  Нажмите на изображение для увеличения
Название: BIMP.png
Просмотров: 335
Размер:	118.4 Кб
ID:	234612  
Нубий-IV вне форума  
 
Непрочитано 17.02.2021, 06:36
#27
ShaggyDoc

Thượng Tá Quân Đội Nhân Dân Việt Nam
 
Регистрация: 14.03.2005
44d32'44"С, 33d26'51"В
Сообщений: 13,381


Цитата:
Сообщение от РастОК Посмотреть сообщение
Проблема ПДФ в его не масштабируемости на гаджетах.
Да, это так. Ну так для ридеров другие форматы предназначены. В том числе и с "картинками".

Вот мне очень много приходится готовить документации - и программы, и несколько книг с иллюстрациями. Все их готовлю в очень удобной программе Help And Maual. Готовый проект могу опубликовать в PDF, CHM, DOC, ePUB, MOBi, eWriter (последние три специально для гаджетов). Еще ePUB перевожу в FB2, более удобный. У каждого формата свои потребители.

Ну а что бы делал, если ради "свободы" решил делать в DJVU?

Ну, а AutoCAD вообще подлежит проклятию - как его чертежи на гаджетах хотя бы смотреть.

Я же не против DJVU "как класса". Но надо понимать достоинства, недостатки, и риски. И "это ж-ж неспроста" - Технология создания DJVU-книг застыла в прошлом?
ShaggyDoc вне форума  
 
Непрочитано 17.02.2021, 07:48
#28
tankist

ЭПБ, обследование стр. конструкций
 
Регистрация: 09.10.2009
Сибирь
Сообщений: 2,609


Цитата:
Сообщение от ShaggyDoc Посмотреть сообщение
Я же не против DJVU "как класса". Но надо понимать достоинства, недостатки, и риски. И "это ж-ж неспроста" - Технология создания DJVU-книг застыла в прошлом?
Люди, которые в одной программе просматривают сканы серий, типовых проектов, даже не догадываются, что смотрят сканы из файлов djvu. Т.к. это нигде не отображается, можно узнать, если базу данных открыть.
tankist вне форума  
 
Непрочитано 17.02.2021, 08:13
#29
Нубий-IV

Инженер-философ
 
Регистрация: 24.04.2019
Хабаровск
Сообщений: 1,869


Что-то я затупил. Удалить остатки черного и подчистить светлый мусор можно там же, в батнике. Достаточно добавить команды замены черного цвета на белый и слегка подкрутить кривые:
Код:
[Выделить все]
for %%f in (*.jpg) do C:\Programs\GMIC\gmic.exe -i  "%%f" -fx_segment_watershed 0.1,0.5,0,0,0,50,50 -replace_color 100,0,30,30,30,255,255,255 -apply_curve 1,0,0,180,180,240,255 -o "%%f.png"
Миниатюры
Нажмите на изображение для увеличения
Название: Фильтр.png
Просмотров: 313
Размер:	303.1 Кб
ID:	234614  
Нубий-IV вне форума  
 
Непрочитано 17.02.2021, 09:25
#30
ShaggyDoc

Thượng Tá Quân Đội Nhân Dân Việt Nam
 
Регистрация: 14.03.2005
44d32'44"С, 33d26'51"В
Сообщений: 13,381


Цитата:
Сообщение от tankist Посмотреть сообщение
Люди, которые в одной программе просматривают сканы серий, типовых проектов, даже не догадываются, что смотрят сканы из файлов djvu. Т.к. это нигде не отображается, можно узнать, если базу данных открыть.
Ну и пусть смотрят. И я смотрю и спасибо говорю тем, кто сканировал, собрал в какой-то формат.

Насчет "нигде не отображается" - зря. Может "в одной программе" и не отображается, а в другой, правильной, прямо в заголовке показано. Это правильно, потому что человек должон знать, что он смотрит и представлять, что с этим можно сделать.
ShaggyDoc вне форума  
 
Непрочитано 17.02.2021, 11:48
#31
Солидворкер
Moderator

Конструктор (машиностроение)
 
Регистрация: 23.10.2006
Россия
Сообщений: 22,991
<phrase 1=


Цитата:
Сообщение от ShaggyDoc Посмотреть сообщение
И "это ж-ж неспроста" - Технология создания DJVU-книг застыла в прошлом?
Мне кажется, что дело тут вот в чем. Чем был хорош DJVU? Адовой степенью сжатия сканов текста без потери читабельности. Книга в PDF могла быть в десятки раз тяжелее, чем книга в DJVU.
Но пришла эра оптоволоконного интернета и терабайтных дисков. И это перестало играть роль.
Солидворкер вне форума  
 
Непрочитано 17.02.2021, 15:02
#32
ShaggyDoc

Thượng Tá Quân Đội Nhân Dân Việt Nam
 
Регистрация: 14.03.2005
44d32'44"С, 33d26'51"В
Сообщений: 13,381


Цитата:
Сообщение от Солидворкер Посмотреть сообщение
Мне кажется, что дело тут вот в чем. Чем был хорош DJVU? Адовой степенью сжатия сканов текста без потери читабельности. Книга в PDF могла быть в десятки раз тяжелее, чем книга в DJVU.
Но пришла эра оптоволоконного интернета и терабайтных дисков. И это перестало играть роль.
Ну и это влияло.
Хотя вот у меня две одинаковых книги одного и того же автора, в каждой по 127 страниц. Основное содержимое - картинки нот и минимум текста. Изданы в разные годы, отличаются только первыми страницами.

Так PDF весит 5 091 768, а djvu 12 392 798. При этом иллюстрации с фото человеков в PDF намного лучше. Поиск по тексту не работает и там и там.

Конечно, многое зависит и от книгоделателя.

Но тут скорее просто пристрастия, как с архиваторами. Ну а главное - развивается то, что принимается солидными производителями софта. Они же не будут рекомендовать "скачать с narod.ru".
ShaggyDoc вне форума  
 
Непрочитано 12.03.2021, 12:07
#33
kp+

идущий по граблям
 
Регистрация: 26.05.2005
Сообщений: 5,091


В продолжение темы. Нарыл по случаю по бросовой цене потрепанный, но рабочий книжный сканер plustek opticbook 3600. Тот, который без одного поля и позволяет сканировать без теней на корешке, не повреждая книгу.
Теперь можно сравнить затраты времени на:
- получение исходных изображений "дедовским" (сканер) и "новым" (фото камерой высокого разрешения) методом;
- обработку этих изображений.
Пока что, как ни странно, с помощью этого сканера несколько быстрее. Т.к. он сам по себе весьма шустрый и сразу выдает ч/б изображения 600 dpi без геометрических искажений, пересветов, теней и прочих присущих фотографии моментов.
Из минусов - очень шумный. Ну и оригинал каждый раз переворачивать приходится, что не очень хорошо сказывается на состоянии ветхих книг.

Последний раз редактировалось kp+, 12.03.2021 в 12:48.
kp+ вне форума  
 
Непрочитано 12.03.2021, 13:24
#34
tankist

ЭПБ, обследование стр. конструкций
 
Регистрация: 09.10.2009
Сибирь
Сообщений: 2,609


Цитата:
Сообщение от kp+ Посмотреть сообщение
и сразу выдает ч/б изображения 600 dpi
В сером надо сканировать, в ч/б качество будет уже как есть, не улучшить, могут пропасть некоторые фрагменты.
tankist вне форума  
 
Непрочитано 12.03.2021, 13:43
#35
kp+

идущий по граблям
 
Регистрация: 26.05.2005
Сообщений: 5,091


Слышал о таких рекомендациях, но как по мне, для изначально ч.б. оригиналов это надо при неудобных условиях сканирования, нечеткой печати, загаженном оригинале и т.п. Когда оригинал четкий, более-менее чистый, полностью лежит на стекле, и сканер с нормальной глубиной резкости - ничего никуда не пропадает. Чаще встречалось, что детали пропадают при переводе серого в ч/б и прочих "улучшениях". Что вынуждало отказываться от такой операции и оставлять часть листов (или даже все) в сером.

Последний раз редактировалось kp+, 12.03.2021 в 13:58.
kp+ вне форума  
 
Непрочитано 12.03.2021, 13:58
#36
tankist

ЭПБ, обследование стр. конструкций
 
Регистрация: 09.10.2009
Сибирь
Сообщений: 2,609


Цитата:
Сообщение от kp+ Посмотреть сообщение
Когда оригинал более-менее чистый, полностью лежит на стекле, и сканер с нормальной глубиной резкости - ничего никуда не пропадает.
Пытался раз чертежи 3 формата, изначально распечатанные в ч.б. хорошем качестве сканировать на ксероксе в ч.б. формат, часть тонких линий теряется, даже при максимальном разрешении. При сканировании в сером и дальнейшем переводе в ч.б. все нормально получалось.
И ч.б. изображения от мусора уже сложнее очищать, в основном вручную.
tankist вне форума  
 
Непрочитано 12.03.2021, 14:22
#37
kp+

идущий по граблям
 
Регистрация: 26.05.2005
Сообщений: 5,091


Ну не знаю, может от сканера зависит, раньше не встречался с таким. Да и тема о сканировании (старых) книг, там таких проблем обычно не бывает.
kp+ вне форума  
 
Непрочитано 12.03.2021, 14:45
#38
CalcProg


 
Регистрация: 02.10.2016
Сообщений: 205


Цитата:
Сообщение от ShaggyDoc Посмотреть сообщение
А это всегда у поклонников "свободного" ПО. Под "свободным" понимается, что какие-то добрые дяденьки его, от нечего делать, разрабатывают и раздают всем бесплатно.

Но добрые дяденьки тоже хотят кушать и зарабатывать. Крупные "свободные" проекты кем-то спонсируются. Как OpenOffice, который делали назло Майкрософт. Потом "пошел по рукам" - Sun, Oracle, Apache. Потом разработчики разбежались и Oo сдох. Начали LibreOffice якобы "за счет пожертвований". Ну и много наши поклонники пожертвовали? И этот проект неизбежно загнется.

Ну а про мелочи наподобие вьюверов и говорить нечего. Надоело разработчикам, устали, умерли, сменили ориентацию - и конец.

https://blogs.apache.org/OOo/
CalcProg вне форума  
Ответ
Вернуться   Форум DWG.RU > Программное обеспечение > Прочее. Программное обеспечение > Технология создания DJVU-книг застыла в прошлом?

Размещение рекламы
Опции темы Поиск в этой теме
Поиск в этой теме:

Расширенный поиск


Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Ваши сканы, наша обработка и перевод в DJVU. Armin Поиск литературы, чертежей, моделей и прочих материалов 3797 вчера 16:16
Планшет для чтения DJVU и PDF (отзывы, советы, впечатления). Armin Разное 313 08.01.2020 10:47
технология создания расчетных схем в Лире (опрос) LS2012 Лира / Лира-САПР 60 31.05.2013 12:24
Технология BIM, практическое внедрение. VES1 Технология и организация строительства 1 13.04.2012 09:12
Правильно ли мой проект называть словом Технология olish Технология и организация строительства 14 08.06.2011 15:52