| Правила | Регистрация | Пользователи | Поиск | Сообщения за день | Все разделы прочитаны | Справка по форуму | Файлообменник | |
|
Поиск в этой теме |
|
||||
Цитата:
----- добавлено через ~14 мин. ----- Не удаляйте, пусть будут варианты обработки. |
||||
|
||||
Корочка для ГИПа Регистрация: 12.04.2011
РБ
Сообщений: 343
|
Подчищаю свою библиотеку и архив...
Сотвори и ты, как я предлагал в #3586: "А опробуй свою методику на https://dwg.ru/lib/3999 ..." ----- добавлено через ~12 мин. ----- Наслаждайся! Доработал бы САМ(!) (разделил бы страницы в pdf-файле, почистил их, вставил обложку и т.п.), комментатор...
__________________
Талант не пропьёшь, ... :tease: |
|||
|
||||
Корочка для ГИПа Регистрация: 12.04.2011
РБ
Сообщений: 343
|
"Ушел" от ответа на #3586: "А опробуй свою методику на https://dwg.ru/lib/3999". Не творец ты, даже со "смыслом". Ничего...
__________________
Талант не пропьёшь, ... :tease: Последний раз редактировалось Николаевич, 07.03.2023 в 21:17. |
|||
|
||||
Инженер-философ Регистрация: 24.04.2019
Хабаровск
Сообщений: 1,869
|
Цитата:
A4 при 600dpi должен иметь размеры: Ширина = 210 / 25.4 * 600 = 4961 px Высота = 297 / 25.4 * 600 = 7016 px А тут 2907x4546. Даже соотношение сторон неправильное. Либо сшивали со сканера "как есть", либо криво обрезали, либо вставляли на страницу в какой-то программе (откуда-то же взялись белые поля вокруг серого скана). Даже подтирания засеренного выглядят, как рисование квадратной кисточкой в Paint. А 600dpi просто указали в настройках от балды. У нас таких парочка. Размер стекла - с запасом, и метки "A5", "Letter" и т.п. И они не делают "размер в пикселях точно под A4", получается больше. Ничего не менять - будет страница больше формата. Обрезать - лишнее время тратить. А если скан "вписать в страницу", у него как раз dpi получится не круглый. Видимо, тут в исходниках так же. А умный FR берет и вписывает новое "правильное разрешение" в файл. Чтобы исправить - надо масштабировать и резать заново. Некоторые программы могут разрешение принять всерьез, и начать по нему что-нибудь делать. Даже Scan Tailor, если видит 330 dpi, будет ужимать картинку до заказанных 300, тогда как делать как раз ничего нельзя. Лишние растяжения - лишние проблемы. Например, при низком качестве исходника "проблему ИНЬ" поймать можно; ее даже в сканерах известных фирм ловили: Сканеры и копиры Xerox могут менять цифры в документах при копировании (в комментах айтишники массово выпадают в осадок ))) ). |
|||
|
||||
маркшейдер Регистрация: 25.09.2021
Москва
Сообщений: 146
|
Вы хоть одну книгу A4 видели? Я нет. Или у вас бумажных книг нема?
331 dpi? Правда, чтоле?
__________________
Keep it simple, stupid. |
|||
|
||||
Корочка для ГИПа Регистрация: 12.04.2011
РБ
Сообщений: 343
|
Цитата:
Успехов!
__________________
Талант не пропьёшь, ... :tease: |
|||
|
||||
Инженер-философ Регистрация: 24.04.2019
Хабаровск
Сообщений: 1,869
|
Я даже эту книгу вживую не видел. Но точно могу сказать, что ширина у нее никак не может быть 2907 px / 600 dpi * 25.4 mm/inch = 123 мм. Кто думает, что это карманный справочник - может распечатать страничку-другую в мастшабе 100% и попробовать почитать, вечером на улице и без лупы. Однозначно, указанные 600dpi - лажа. А сколько по правде надо - это только с линейкой с оригинала теперь восстановить можно.
Свежевыданный скан, разумеется, имеет честные круглые DPI - 300, или сколько там в настройках было. Но размер в пикселях - больше, чем А4. Никто не желает эти сканы резать в ST, а печатают как есть, в режиме "вписать" (или вообще вписать в поля принтера). После чего копия имеет те самые 331, 346 или 352 dpi, смотря как галочки в программах лягут. А то, что где-то внутри PDF зашит JPG с 300dpi в тегах, так кому же это интересно. Вот если после импорта книги, помеченной 600dpi, экспортированная версия имеет 331 - значит, программа где-то поумничала, или лишняя галочка притаилась, которая страницу принудительно в A4 вписывает. Это надо ловить и настраивать, а то она еще и картинки пережмет с очередной потерей качества. |
|||
|
||||
маркшейдер Регистрация: 25.09.2021
Москва
Сообщений: 146
|
Но по факту "это" сделано либо специально, либо нарочно. На вопрос "зачем?" была выдана откровенная пурга. Дальнейшая беседа стала бессмысленной и неинтересной, поэтому я решил данный "вопрос" технически (есть такая возможность на данном форуме).
__________________
Keep it simple, stupid. |
|||
|
||||
|
||||
|
||||
|
||||
|
||||
Корочка для ГИПа Регистрация: 12.04.2011
РБ
Сообщений: 343
|
Цитата:
Отдельные страницы, разделенные и подчищенные от мусора, выровненные и с полями, готовность к распечатке (при необходимости) или к хранению в Библиотеке?! Не вопрос, коллега, пользуйся тем, что есть по ссылке, если "воображения" хватает только на то, чтобы "скачать"... ----- добавлено через 28 сек. ----- Зачем так кричать?! Я аж проснулся...
__________________
Талант не пропьёшь, ... :tease: |
|||
|
||||
Инженер-философ Регистрация: 24.04.2019
Хабаровск
Сообщений: 1,869
|
Вообще-то да:Как минимум, проблема ИНЬ есть. В мелких цифрах и формулах можно ожидать того же. А все низкое разрешение оригинала - около 100dpi. Я даже СП с сайта минстроя с их 200dpi не рискую перводить в DJVU, они у меня сшиты как есть - оригинальные JPG в PDF. Места они, конечно, сожрали полтора десятка гигов, зато не надо думать, не перепутался ли где в индексах i с j, не превратилась ли i в l, и т.п.
Кстати, кто в курсе - нейросетки могут чинить такие сканы? Вот первый попавшийся аниме-апскейлер в Stable Diffusion:Есть что-то подобное, но натасканное на тексты и чертежи? |
|||
|
||||
маркшейдер Регистрация: 25.09.2021
Москва
Сообщений: 146
|
Не уверен (вылезают артефакты jpeg и не только):
* CNN (https://github.com/ImageProcessing-E...tb-image-srcnn): Другие методы: * FRPF2 (https://github.com/ImageProcessing-E...tb-image-frpf2): * Image Interpolation with Geometric Contour Stencils (https://github.com/IPOL-Fork/iminterp): Да и "нешустрые" все они. PS: Урезал образцы, чтобы движок форума не резал.
__________________
Keep it simple, stupid. Последний раз редактировалось zvezdochiot, 10.03.2023 в 18:18. |
|||
|
||||
Инженер-философ Регистрация: 24.04.2019
Хабаровск
Сообщений: 1,869
|
Что-то по ссылкам программы маленькие. Несерьезно как-то. Где многогигабайтные модели?
Я имел ввиду что-то из того, чьими рисунками теперь весь интернет завален, типа ESRGAN или Stable Diffusion. Там есть разные модели - одни при увеличении дорисовывают похожие текстуры; другие, наоборот, сглаживают; есть и такие, что JPG чистят. На примере бабочки из первой ссылки: А вот специализированная, для восстановления текстов:Во вложении - пример PDF с тремя страницами:
Кому интересно поиграть (нужна видеокарта посвежее и места побольше):
|
|||
|
||||
маркшейдер Регистрация: 25.09.2021
Москва
Сообщений: 146
|
Ежели интересуют различные "памяти нейросетей", обученные различными способами, то вам тогда нужен https://github.com/ImageProcessing-E...pencv_superres . Но он требует OpenCV, ибо формат этих "памятей нейросетей" (Protocol Buffers: *.pb) достаточно своеобразный, и OpenCV - единственная известная мне библиотека, в которой работа с этим форматом достаточно проработана.
PS: Кстати, а что за формат такой - *.pth? Цитата:
__________________
Keep it simple, stupid. Последний раз редактировалось zvezdochiot, 11.03.2023 в 14:12. |
|||
|
||||
Инженер-философ Регистрация: 24.04.2019
Хабаровск
Сообщений: 1,869
|
Починялки JPG из upscale.wiki даже чуть лучше работают:Обе починялки обломались на одном и том же: в оригинале части букв бледнее шума:Вряд ли хоть какой-то алгоритм, который обрабатывает пиксели, или даже области, сообразит, что одних светло-серых мочить надо, а других жалеть. А вот сетка, которая умеет буквы опознавать, может, и справится. Тут ведь не увеличение надо, и не шум почистить, а настоящую реставрацию сделать.
|
|||