|
||
| Правила | Регистрация | Пользователи | Сообщения за день | | Поиск | | Справка по форуму | Файлообменник | |
|
![]() |
Поиск в этой теме |
|
||||
Регистрация: 11.02.2014
Сообщений: 53
|
Книга с подробным Оглавлением и OCR - отсюда
Последний раз редактировалось Vslav16m, 04.10.2024 в 18:10. |
|||
![]() |
|
||||
маркшейдер Регистрация: 25.09.2021
Москва
Сообщений: 189
|
Забыл сказать: с оглавлением всё норм, а вот OCR ты походу в процессе где то посеял. Так что просто книга с оглавлением, без OCR.
![]()
__________________
Keep it simple, stupid. |
|||
![]() |
|
||||
Регистрация: 11.02.2014
Сообщений: 53
|
Есть сканы разворотов методички Коваленко. Градостроительная климатология. 1980 - здесь
Ждет желающего сверстать эл. версию |
|||
![]() |
|
||||
маркшейдер Регистрация: 25.09.2021
Москва
Сообщений: 189
|
Цитата:
Цилиндрическая модель искажений STEX выбрана именно потому, что очень подходит к изгибу страниц. Но на данном материале она не работает. Как я понял, это происходит потому, что в данном случае то ли "цилиндр" расположен под каким то жутким углом, то ли их вообще два. Интересно, есть ли какое-нибудь простое ПО способное достойно исправлять такой тип искажения? И какую модель при этом используют?
__________________
Keep it simple, stupid. |
|||
![]() |
|
||||
маркшейдер Регистрация: 25.09.2021
Москва
Сообщений: 189
|
Собственно, суть вопроса вот: STEX: research: distortion model not working?
__________________
Keep it simple, stupid. |
|||
![]() |
|
||||
маркшейдер Регистрация: 25.09.2021
Москва
Сообщений: 189
|
Цитата:
Обрабатывал в STEX последнего релиза. На всех страницах использовались новые регулировки модели "Исправления искажений".
__________________
Keep it simple, stupid. |
|||
![]() |
|
||||
у-Строитель Регистрация: 15.09.2007
град Воронеж
Сообщений: 4,760
|
Прошу прощения, но можно буквы сделать более читаемыми. Сейчас после пятой страницы бросаешь читать. Рваный контур у букв. Вроде бы такие были первые книги и их из=за этого переделывали и заново выкладывали.
__________________
С уважением, yarrus77 |
|||
![]() |
|
||||
маркшейдер Регистрация: 25.09.2021
Москва
Сообщений: 189
|
Более чем согласен.
Но я исправлял искажения и форматирование. И при этом надо было довести до минимума потери от исходника. Как результат размер раздувается без значительной разницы в качестве, но в умеренных пределах. Это от того, что исходник изначально обработан плохо (именно обработан, а не отсканирован). Исходная обработка значима. Пример: Проблемы технологии бетона - обработка убила материал настолько, что не подлежит восстановлению даже с дополнительными затратами в размере. И любые попытки (была такая совсем недавно) лишь добивают материал. Это негодно: и первичная обработка в данном случае негодная и дальнейшее убивание материала. Такие вот дела.
__________________
Keep it simple, stupid. |
|||
![]() |
|
||||
маркшейдер Регистрация: 25.09.2021
Москва
Сообщений: 189
|
Цитата:
__________________
Keep it simple, stupid. |
|||
![]() |
|
||||
Administrator
Регистрация: 21.08.2003
Сообщений: 4,462
|
Данная тема предназначена для обсуждения процесса обработки сканов и для конкретных запросов пользователей на сканирование и обработку.
Просьба не использовать тему как файлохранилище. Обработанные книги просьба загружать в Библиотеку - https://dwg.ru/lib Библиотека позволяет систематизировать книги по тематике, позволяет производить поиск по названию, автору, году выпуска, оглавлению. Если есть желание обработать скан, который находится в Библиотеке или улучшить выложенную обработку просьба не создавать новую загрузку, а воспользоваться функцией "Добавить / Изменить" (см. скриншот) Благодаря этому на одной странице можно собрать несколько вариантов обработки одной книги, а также исходные сканы. Добавлять загрузки и вносить изменения может любой пользователь, не зависимо от того, кто сделал первоначальную загрузку. |
|||
![]() |
|
||||
маркшейдер Регистрация: 25.09.2021
Москва
Сообщений: 189
|
Смотрю куда показано (см. вложение) и вижу фигу. Для того чтобы эти пункты появились случайно не нужно ли быть модератором?
__________________
Keep it simple, stupid. |
|||
![]() |
|
||||
Administrator
Регистрация: 21.08.2003
Сообщений: 4,462
|
zvezdochiot, адрес этой страницы https://dwg.ru/dnl/12252 книга размещена в разделе "Скачать" https://dwg.ru/dnl с ограниченным функционалом, там действительно нет "Добавить / Изменить"
Раздел "Библиотека" https://dwg.ru/lib с функционалом ориентированным именно на книги появился позже. |
|||
![]() |
|
||||
маркшейдер Регистрация: 25.09.2021
Москва
Сообщений: 189
|
Цитата:
__________________
Keep it simple, stupid. Последний раз редактировалось zvezdochiot, 23.12.2024 в 21:47. Причина: лишнее удаляю |
|||
![]() |
|
||||
Инженер-философ Регистрация: 24.04.2019
Хабаровск
Сообщений: 2,069
|
Дедушка мороз на новый год принес мне шило, и я нашел, куда его деть. Обновление форка ScanTailor Universal, куда перенесены из STEX пороги и развертка:
Копипаста кода завершена, теперь надо отлавливать глюков. Про кривые эскизы знаю, они первые в списке. Жалобы можно отправлять по месту жительства: https://github.com/ImageProcessing-E...tailor-deviant Архив устарел, удален Последний раз редактировалось Нубий-IV, 20.02.2025 в 11:38. |
|||
![]() |
|
||||
Инженер-философ Регистрация: 24.04.2019
Хабаровск
Сообщений: 2,069
|
По результатам тестирования версии ScanTailor с деварпом от STEX пришлось выломать тамошний алгоритм построения развертки (из научной статьи), и начать пришивать новый (колхозный). До конца еще бесконечно долго, но уже есть промежуточная условно-рабочая версия. Она восстанавливает страницы с фото аккуратно раскрытых книг. Листы должны быть изогнуты по цилиндрической поверхности. То есть, если сильно хочется что-нибудь прижать, прижимать надо весь свободный край листа по всей длине. Прижатые за угол, примятые в середине другие подобные деформации не распознаются и не чинятся. Тестовый пример тут: https://github.com/ImageProcessing-E...set0005/03.jpg.
Самая противная часть - подбор поля зрения камеры, на него завязаны все расчеты в алгоритме. В режиме "автомат" оно вычисляется по 4 углам, которые оттрассировал алгоритм поиска строк в ST. Автомат надежно работает только с фото, где есть сильная перспектива с двумя близкими точками схода. Но, если камеру держали ровно (как обычно фотографируют бумагу), и лист к ее оси почти перпендикулярен - 4 точек математически мало, и насчитается совершенно левое значение. Это видно по бегунку, упершемуся в одну из границ, по кривым линиям, не совпадающим со строками, и очевидно неправильным значениям выгиба. Тогда автомат придется выключить, и подобрать значение на глаз. В моих тестах хорошие результаты были, если FOV сначала определить для своего телефона, а потом вбивать ответ. Достаточно поднести телефон к листу бумаги так, чтобы тот занял всю высоту в камере, измерить расстояния до листа, и поделить высоту листа на расстояние: FOV = Height / Distance. Кадр - это параметры исходного фото. Если фото не обрезано - оставлять в автомате. Если вместо честного фото обрабатывается неизвестный огрызок - придется переводить в ручной режим и угадывать. Выгиб неплохо работает в автомате, если правильно определен FOV. Для длиннофокусных фото, когда выгиб слабо заметен, или при сильных линзовых искажениях, оставлена возможность подкрутить ответ вручную. Окончательные размеры пока слегка плавают - тут еще придется прикручивать дополнительные кнопки и выдумывать формулы. У кого есть полезные идеи по улучшению - можно посмотреть обсуждение тут: https://github.com/ImageProcessing-E...viant/issues/5, и что-нибудь присоветовать. Сборка лежит в релизах на гитхабе. Последний раз редактировалось Нубий-IV, 02.04.2025 в 09:22. |
|||
![]() |
|
||||
Регистрация: 12.12.2010
Сообщений: 250
|
Здравствуйте.
Возможно ль обработать вот это: https://dwg.ru/dnl/7923 |
|||
![]() |