| Правила | Регистрация | Пользователи | Сообщения за день |  Справка по форуму | Файлообменник |

Вернуться   Форум DWG.RU > Программное обеспечение > Программирование > LISP > Преобразование текста из полилиний в текст или Мтекст

Преобразование текста из полилиний в текст или Мтекст

Ответ
Поиск в этой теме
Непрочитано 14.05.2023, 14:44 #1
Преобразование текста из полилиний в текст или Мтекст
Ingpro
 
Регистрация: 11.07.2022
Сообщений: 495

Добрый день.
После преобразования pdf в dwg, некоторые тексты (буквы) создаются в виде полилиний.
Есть ли возможность программно заменить полилинии на текст? В полилинии превращаются только шрифты .shx,
с Arial всё нормально. В Express Tools есть функция разбиения текста на линии, а обратной функции нет...
Спасибо...

Вложения
Тип файла: dwg
DWG 2013
ПЛ в текст.dwg (43.2 Кб, 53 просмотров)


Последний раз редактировалось Ingpro, 16.05.2023 в 11:47.
Просмотров: 2687
 
Автор темы   Непрочитано 16.05.2023, 11:43
#2
Ingpro


 
Регистрация: 11.07.2022
Сообщений: 495


Может кому пригодится, у меня AutoCAD 2015, не могу проверить...
Начиная с версии AutoCAD 2018 есть функция PDFSHXTEXT (ПДФГЕОМТЕКСТ).
При импорте файла PDF, который содержит объекты геометрии SHX, можно использовать
команду ПДФГЕОМТЕКСТ в качестве инструмента последующей обработки для преобразования
выбранной геометрии в однострочные текстовые объекты.
Вложения
Тип файла: docx ПДФГЕОМТЕКСТ.docx (17.9 Кб, 134 просмотров)
Тип файла: docx PDFSHXTEXT.docx (15.9 Кб, 65 просмотров)
Ingpro вне форума  
 
Непрочитано 16.05.2023, 15:45
#3
kp+

идущий по граблям
 
Регистрация: 26.05.2005
Сообщений: 5,095


Посмотрите здесь, последнее сообщение:
https://forum.dwg.ru/showthread.php?t=124135
kp+ вне форума  
 
Автор темы   Непрочитано 23.05.2023, 11:43
#4
Ingpro


 
Регистрация: 11.07.2022
Сообщений: 495


Цитата:
Сообщение от kp+ Посмотреть сообщение
Посмотрите здесь, последнее сообщение:
https://forum.dwg.ru/showthread.php?t=124135
tankist: "FineReader текст в pdf распознал, сохранил pdf с распознанным текстом. Получится скан с текстовым слоем.
Далее в автокад вставляете векторный pdf и pdf с распознанным текстом.
Распознанный текст из pdf в автокаде будет в виде шрифта.
Далее на векторный чертеж текст перенести".
Немного длительный процесс, когда много небольших текстов и выносок .shx...
А лисп может заменить тексты из полилиний на текст?
Ingpro вне форума  
 
Непрочитано 23.05.2023, 13:26
#5
kp+

идущий по граблям
 
Регистрация: 26.05.2005
Сообщений: 5,095


Предлагаете написать аналог PDFSHXTEXT на ЛИСП? Нет ничего невозможного, может, кто-то из гуру мог бы и взяться, но за какую цену? И, главное, зачем, когда все уже написано...

Последний раз редактировалось kp+, 23.05.2023 в 13:48.
kp+ вне форума  
 
Автор темы   Непрочитано 23.05.2023, 14:30
#6
Ingpro


 
Регистрация: 11.07.2022
Сообщений: 495


Цитата:
Сообщение от kp+ Посмотреть сообщение
может, кто-то из гуру мог бы и взяться
Я в лиспе совсем не того...
Но предлагаю такой алгоритм, может у кого-нибудь будут мысли на этот счёт...
или скажите, что в лиспе это невыполнимо...
Прикрепляю набор букв из полилиний. Каждой букве из полилиний назначить соответствующую букву simplex.shx.
Слово - это буквы из полилиний без пробелов
Слово и слово... - это строка...
Всего 64 с заглавными (без Ё, без спецзнаков) буквы и 10 цифр.
Только надо как-то надо проигнорить коэфф. сжатия...
Вложения
Тип файла: dwg
DWG 2013
Буквы simplex.shx.dwg (82.8 Кб, 33 просмотров)
Ingpro вне форума  
 
Непрочитано 24.05.2023, 14:52
#7
Boxa

КЖ; C#
 
Регистрация: 03.11.2005
Санкт-Петербург
Сообщений: 2,588


Offtop: Прошу прощения за то, что влезаю в ЛИСП раздел, но если бы мне нужно было решить эту задачу, то я бы использовал, что то типа этого: https://www.keanw.com/2016/02/captur...using-net.html для получения картинки, а потом с помощью EMGUCV + tesseract-ocr (https://github.com/tesseract-ocr/) получил бы текст, который вставлял бы в чертеж, поверх взорванного текста на отдельном слое, МРП с универсальным распознавателем для различных шрифтов можно собрать за пару часов... но это на С#... а вот как это все рулить на лиспе.... собрать под отдельный шрифт, наклон, размер еще как то можно, но ну его нафиг такое.
Примерно так :
- найти центр тяжести для каждой буквы
- от центра тяжести получить список векторов до каждой вершины буквы
- возможно отсортировать вектора по длине и выровнять угол по самому длинному вектору, неплохо бы нормализовать, что бы не зависеть от размера
- сопоставить каждому списку векторов свою букву

- по расстоянию между ц.т. букв собирать буквы в слова
- собрать слова в строки...
- и т.д убиться в хлам и так для каждого шрифта, наклона
- профит
Boxa вне форума  
 
Непрочитано 25.05.2023, 07:10
#8
trir


 
Регистрация: 18.12.2010
Сообщений: 5,057


для этого неронки есть
trir вне форума  
 
Непрочитано 25.05.2023, 08:01
#9
Boxa

КЖ; C#
 
Регистрация: 03.11.2005
Санкт-Петербург
Сообщений: 2,588


trir, ну я собственно об этом и писал, tesseract-ocr - обученные модели нейронок для различных языков
Boxa вне форума  
Ответ
Вернуться   Форум DWG.RU > Программное обеспечение > Программирование > LISP > Преобразование текста из полилиний в текст или Мтекст

Размещение рекламы


Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Вставка множества значений атрибутов, текста через запятую в текст в виде полей Павлов Андрей LISP 6 10.12.2021 08:37
Мои динамические блоки [2] Кулик Алексей aka kpblc Динамические блоки 4334 22.04.2019 09:16
Преобразование текста в мультивыноску с сохранением поля. shartal Программирование 23 08.12.2015 19:07
не отображается текст в окне редактора текста Евгений Буш AutoCAD 12 23.07.2012 14:40