|
||
| Правила | Регистрация | Пользователи | Сообщения за день | | Поиск | | Справка по форуму | Файлообменник | |
|
![]() |
Поиск в этой теме |
|
||||
Регистрация: 11.02.2014
Сообщений: 53
|
Цитата:
|
|||
![]() |
|
||||
Инженер-философ Регистрация: 24.04.2019
Хабаровск
Сообщений: 2,069
|
Какой софт умеет распознавать и исправлять вот такой текст?Я не геолог, и терминов таких не знаю. В оригинале я могу прочитать что написано, в обработанной версии - нет. Был учебник - стал справочник.
Кстати, даже на faufcc запросто выкладывают битые документы. Документы очевидно не сканированные, а полученные из электронного оригинала, но даже там у разных страниц - разные разрешения (включая 223x225 и т.п.), повернутые страницы и покореженный текст: Чем в автомате чинить такое можно, чтобы, например, двойка в знаменателе восстановилась в двойку? |
|||
![]() |
|
||||
Цитата:
Не нужно быть геологом , чтобы знать слова : мантия , ядро, кора . Хотя бы в школу ходить на уроки географии надо было. Нормальный подход - найти какие-то недоработки , обратиться , чтобы их устранить или самому устранить и сбросить улучшенную pdf ; ненормальный - писать из-за одной картинки : " Был учебник - стал справочник." Обработайте сами - сбросьте результат. Посмотрим как стоит обрабатывать криво сделанные pdf. |
||||
![]() |
|
||||
Инженер-философ Регистрация: 24.04.2019
Хабаровск
Сообщений: 2,069
|
По сути, там все мелкие шрифты превращены в вариацию известной картинки:Мелкий текст и в оригинале-то не слишком читаемый местами, а после обработки он уже и не текст. Для технической литературы с цифрами и формулами это перебор.
Чтобы, например, наизусть знать радиусы всех ядер и толщины всех слоев. Чтобы, например, знать, в каких слоях распространяются продольные сейсмические волны, а то на картинке их условное обозначение потерялось. Если нужно, чтобы результат читался - никак. О чем честно заявлено в шапке темы, и повторено в нескольких постах. Тут только один вопрос возможен: появился ли софт, который может восстанавливать настолько битые сканы. Без него никакая быстрая обработка невозможна, только ручная реставрация с постраничным вычитыванием каждой буковки и каждой черточки. В загрузке полно DJVU даже с более приличных сканов, в которых буквы и индексы подменены. В теме выкладывали и СП с повреждениями. В техэксперте, который явно с хороших сканов распознают, встречаются опечатки и ошибки в формулах. У меня даже нормативка с сайта faufcc зашита в PDF как есть, без обработки. Папка весит 21G, зато мне не надо месяцами вычитывать каждую страницу в поисках очередного косяка обработки. И я не возьмусь помогать с реставрацией настолько похабных исходников. Мои посты - не претензии, это мелкие уточнения технической стороны вопроса. Честь и хвала всем, кто тратит время на обработку. Но тем, кто качает результаты - предупреждение, не спешите заменять большой оригинал на уменьшенную копию, можно сильно пожалеть. |
|||
![]() |
|
||||
СП 15.13330.2020.
|
||||
![]() |
|
||||
Руководство по обслуживанию и ремонту шахтных интерферометров. - М.: Недра, 1985.- 88 с.
Последний раз редактировалось ingt, 17.04.2023 в 08:28. |
||||
![]() |
|
||||
СП 294.1325800.2017_Изм 1, 2, 3.
|
||||
![]() |
|
||||
Регистрация: 11.02.2014
Сообщений: 53
|
Нашел файл хорошей книги с родными цветными иллюстрациями - https://disk.yandex.ru/d/lynXOf3vhrheIA
Но там не разрезаны страницы. Есть еще только ч/б , с более видимыми формулами https://disk.yandex.ru/d/QJXqLUHXtBoOLA Может у кого-то есть возможность довести файл до ума. и заменить вместо этого черно-белого - https://dwg.ru/lib/1138 Последний раз редактировалось Vslav16m, 26.05.2023 в 16:35. |
|||
![]() |
|
||||
геолог Регистрация: 30.01.2016
КМВ
Сообщений: 160
|
Картинки с плохим разрешением, уж лучше
https://b.twirpx.one/file/1813006/ |
|||
![]() |
|
||||
Не открывается ссылка.
|
||||
![]() |
|
||||
Регистрация: 11.02.2014
Сообщений: 53
|
помощь здесь ----- добавлено через ~9 мин. ----- Цитата:
|
|||
![]() |
|
||||
Лучше не сделать без исходных сканов.
Цветная книжка лучше. Без цветных картинок эта книжка потеряла дух (такие книжки хочется читать, сейчас таких нет или очень мало). |
||||
![]() |
|
||||
Инженер-философ Регистрация: 24.04.2019
Хабаровск
Сообщений: 2,069
|
Прикольно! Сопромат в комиксах! А интересно, есть сопромат - эротические карты?
В режиме безысходных сканов можно взять картинки из одной версии, а текст - из другой: |
|||
![]() |
|
||||
Регистрация: 11.02.2014
Сообщений: 53
|
Цитата:
Но странное дело. Пытался к нему добить слой OCR с оглавлением. Но слойOCR копируется, а содержимое страниц полностью исчезает. Мой чб файл с OCR, подготовленный из Вашего, прилагаю - |
|||
![]() |