|
||
| Правила | Регистрация | Пользователи | Сообщения за день | | Поиск | | Справка по форуму | Файлообменник | |
|
![]() |
Поиск в этой теме |
|
||||
Регистрация: 24.03.2009
Украина
Сообщений: 382
|
раз пошла такая тема, то под шумок, и мои сканы обработайте - рекомендации по расчету и проектированию звукопоглощающих облицовок
|
|||
![]() |
|
||||
В строительном проектировании с 05.10.2004 Регистрация: 01.05.2008
Новосибирск
Сообщений: 5,219
|
Цитата:
|
|||
![]() |
|
||||
КМ Регистрация: 06.07.2010
Севастополь
Сообщений: 302
|
Цитата:
Интересно, а никто не натыкался на качественный скан Пособия к СНиПу Каменные и армокаменные конструкции? а то я нашел в даунлоде файл на 40 метров и пишет автор bap, что качество не очень... Так может, пока есть возможность у меня, я его того, отсканирую? Последний раз редактировалось Сергей Козовник, 03.03.2012 в 00:12. |
|||
![]() |
|
||||
Moderator
Конструктор (машиностроение) Регистрация: 23.10.2006
Россия
Сообщений: 23,258
![]() |
Цитата:
![]() |
|||
![]() |
|
||||
Moderator
Конструктор (машиностроение) Регистрация: 23.10.2006
Россия
Сообщений: 23,258
![]() |
|
|||
![]() |
|
||||
Регистрация: 24.03.2009
Украина
Сообщений: 382
|
Цитата:
|
|||
![]() |
|
||||
Регистрация: 29.07.2004
Сообщений: 48
|
FR-11 это действительно FineReader 11
http://www.abbyy.ru/finereader/ Программа платная, я покупаю, начиная с 8 версии, но … не мне Вас учить, короче. ![]() Суть распознанного слоя в файле-контейнере (pdf, djvu) – это перевод информационного потока большой мощности (отдельная книга, или целая библиотека книг) из категории «База данных» в категорию «База знаний». Если Вы откроете файл djvu то увидите текст и сможете его прочесть и понять задействуя для этого приобретенную (в школе) способность распознавать графические образы (буквы), преобразовывая их в смысловые. Читать короче. Компьютер воспринимает тот-же файл как графический образ, как картинку. Компьютер «видит» не буквы, а набор пикселов, соответственно он не может выполнить рутинную работу по поиску, каталогизации, упорядочению, выстроению семантических связей и т.д. над информацией. Извлечь информацию из djvu файла может только человек, читая книгу. А это затраты времени, порой неоправданно большие или ненужные – ну нет нужной информации в книге, но об этом узнаешь только прочитав книгу (как минимум – просмотрев). Чтобы автоматизировать рутину по работе с информацией была разработана технология, когда под графическим слоем располагается т.н. текстовый слой. Преобразовывает графику в текст и «подкладывает» текстовый слой к уже имеющимся графическим Fine Reader. Есть и другие программы, но FR общепризнанный лидер. И хотя сам формат djvu по умолчанию предполагал возможность внедрения текстового слоя, донедавна формат djvu был обделен в этом вопросе в основном потому, что ABBYY не развивала это направление. Существовала программа (скрипты, насколько я понял) от болгарского программиста Генчо, которая в весьма запутанный способ, и используя промежуточные результаты все того-же FR создавала djvu с текстовым слоем (djvu + OCR). Но это был очень громоздкий, сложный и запутанный процесс. Тем не менее именно стараниями Генчо «djvu + OCR» начал понемногу развиваться. Нижайший ему поклон за это. Много лет группа энтузиастов выедала моск ABBYY (разработчик FR) на ихнем Форуме с просьбой ввести функцию создания djvu с текстовым слоем. Проблема заключалась в том, что ABBYY нужно было покупать лицензии на кодирование в djvu (открытие не требует лицензий). Короче начиная с FR-9 появилась функция открытия djvu (с сохранением распознанного в pdf) а в FR-11 уже полноценно работает сохранеие в «djvu + OCR». Следует признать, что сохранение в djvu в FR-11 не совсем отработано (в первую очередь скорость выгонки файла) но работать уже вполне можно, а на мощных компах недостатки практически незаметны. Если оценивать потребительскую ценность электронной книги, то 90% я бы отдал на наличие текстового слоя, и уже остальные 10% - на все остальные «украшательства» - поля, фон, красивости, порезанные страницы и т.д. Уважаемый Модератор – я тут немного наофтопичил. Может в отдельную тему?
__________________
------------------ Админ Весьбетона |
|||
![]() |
|
||||
Moderator
Конструктор (машиностроение) Регистрация: 23.10.2006
Россия
Сообщений: 23,258
![]() |
Сергей Ружинский, а ничего, что Armin еще в первом посте расписал про OCR, причем есть софт, который оптимизирован под DJVU и при этом абсолютно бесплатен?
А самое главное, текстовый слой уже давно с успехом применяется, в т.ч. в этой теме? |
|||
![]() |
|
||||
Java/Kotlin/Go Регистрация: 03.02.2006
Сообщений: 5,786
|
Это хорошая затея, но честно говоря на обработку есть очень мало времени. Если еще заниматься распознаванием, то времени станет еще меньше ))) С другой стороны, если процесс распознавания и внедрения текстового слоя выполнить в полностью автоматическом режиме, то и времени это сильно много не займет, но и качество распознавания пострадает.
|
|||
![]() |
|
||||
Регистрация: 29.07.2004
Сообщений: 48
|
Цитата:
А вот качество распознавания у FR намного лучше, чем у остальных аналогичных проектов OCR. Во всяком случае для русскоязычных текстов. Цитата:
То, что, как я догадываюсь, скрыто под этой ссылкой – рекомендации Соколова Д.С. как раз и иллюстрируют мою мысль о «…очень громоздкий, сложный и запутанный процесс…». Во всяком случае, испробовав много вариантов внедрения OCR в djvu, я пришел к выводу, что рекомендуемый мной способ (FR-11) на сегодняшний день лучший. Это сугубо мое личное мнение, руководствуясь которым я уже именно в такой способ переработа около 4000 файлов. Но не смею его навязывать. Делайте как кому удобней. Цитата:
Я говорил вообще-то не о «применяется/не применяется» а о том, что обязательным признаком качества внешней обработки (с задействованием усилий стронних узких специалистов) должен стать именно стандарт «djvu + OCR». И рекомендовал свой личный опыт для этого. Не смею настаивать.
__________________
------------------ Админ Весьбетона |
|||
![]() |
|
||||
Java/Kotlin/Go Регистрация: 03.02.2006
Сообщений: 5,786
|
Рекомендации по расчету и проектированию звукопоглощающих облицовок
http://rghost.ru/36824377 http://narod.ru/disk/42628602001.637...D0%B8.pdf.html DJVU |
|||
![]() |
|
||||
Moderator
Конструктор (машиностроение) Регистрация: 23.10.2006
Россия
Сообщений: 23,258
![]() |
Сергей Ружинский, я просто намекаю, что на FR свет клином не сошелся
![]() |
|||
![]() |
|
||||
КМ Регистрация: 06.07.2010
Севастополь
Сообщений: 302
|
Ну, вроде с кириллицей хорошо справляется, нижний индекс распознает, как рядовой текст. С латиницей посложнее, не всегда определяет их как латинские, особенно, когда специальные символы появляются; кириллический шрифт иногда распознает как латинский, когда он идет в одной строчке с латинским (нижний индекс). С формулами посложнее. Ну, а с греческим и латинским беда.
А так, ниче, можно использовать, только сверять надо. |
|||
![]() |
|
||||
В строительном проектировании с 05.10.2004 Регистрация: 01.05.2008
Новосибирск
Сообщений: 5,219
|
как то достаточно давно попалось
Руководство по проектированию и устройству кровель из битумно-полимерных материалов кровельной компании ТехноНИКОЛЬ формат очень не удобный, стандартные средства его плохо смотрят - многостраничный тиф, так и не понял чем его можно распоковать постранично http://www.avral.ru/0aa46da9772ff6ec9df690917c9e5cb7 |
|||
![]() |
|
||||
Регистрация: 29.07.2004
Сообщений: 48
|
Конвертировал этот файл из многостраничного tif в djvu + OCR при помощи FR-11
Загрузка – 71 сек Распознавания – 51 сек Выгонка в djvu – 75 сек Итого: - 197 сек (i7-2600, ОЗУ – 4 Гб, + eBoostr – 8 Гб, W7)
__________________
------------------ Админ Весьбетона |
|||
![]() |