Имя: Пароль:
1C
1С v8
Распознавание картинок штрихкодов из файла pdf
0 ammorf
 
25.12.24
09:32
Приветствую всех! Скажите, существует ли какое то решение в виде компоненты или библиотеки которые позволят считывать из загруженного pdf файла картинки штрихкодов и выводить их значение в виде строки. Спасибо заранее :)
1 Asmody
 
25.12.24
09:58
У 1С есть целый сервис распознавания документов
2 Asmody
 
25.12.24
10:00
Можно в какую-нибудь нейроночку кидать, они тоже с таким справляются. Кажется, Низамов у себя в ютубчике показывал, как что-то такое на коленке собрать.
3 LinuxOrg
 
25.12.24
10:15
Pyzbar
ZXing
ZXing.net

Google Vision API
AWS Rekognition
Zebra Crossing (ZXing) REST API

Dynamsoft Barcode Reader
4 ammorf
 
25.12.24
10:18
(3) да я в гитхабе их и нашел, и похоже что бы их использовать придется свою библиотеку делать... Google Vision API вроде ничего.
5 LinuxOrg
 
25.12.24
10:34
Barcode4J
6 LinuxOrg
 
25.12.24
10:35
(4) кого - их?
7 H A D G E H O G s
 
25.12.24
10:59
(0) Вас ждет дорога приключений.
8 ammorf
 
25.12.24
11:08
(7) я уж понял как только в инет полез искать инфу)))
9 ammorf
 
25.12.24
11:09
(6) сервисы типа ZXing
10 LinuxOrg
 
25.12.24
11:10
11 LinuxOrg
 
25.12.24
11:13
(9) то есть вы выбираете Zxing rest api?
12 2mugik
 
25.12.24
11:33
(0)имэйдж мейджик + зебар. Но вначале в картинку(пнг) из пдф с помощью чего-то что использует кайро.
13 ammorf
 
25.12.24
12:00
(11) пока изучаю все) спасибо всем за советы))
14 MWWRuza
 
25.12.24
12:17
Немного не в тему, топик-стартеру, как я понял, нужно решение для постоянной работы, что-бы это автоматом работало из 1С, и ШК, как я понял, линейные... Но, на ИнфоСтарте было решение, под похожую задачу: https://infostart.ru/1c/tools/1310318/
Правда, там не совсем автоматом это все делается - сначала одной обработкой из PDFки выдергиваются картинки ШК DM в отдельные файлы JPEG, а потом, они распознаются, и получается текстовый файл с содержимым ШК DM.
Посмотрите, может поможет и натолкнет на путь решения Вашей задачи.

PS Мне в свое время, эта публикация очень помогла - когда была "акция по маркировки "левых остатков тапочек и шмоток" в рознице", клиенты массово заказывали ШК марок в ЧЗ... Но, бестолковость не позволяла сохранять их сразу в csv - "типа, че это такое непонятное - ???", сохраняли в PDF (ну, типа а чего не так, готовые марки!), а там формат, ну мягко говоря "не для удобной печати на наклейки"... А второй раз скачать уже полученные ШК в текст - ЧЗ не давал...
Говорят - "надо напечатать!" А как? Их тысячи... В ручную не переформатировать. Эти обработки очень помогли, после них, у меня были файлы текстовые с марками, а уж напечатать наклейки по ним - дело техники, там-же на ИнфоСтарте есть моя обработка для этого :-)

PSS А вообще, конечно надо задачу смотреть - если это разово, то можно воспользоваться решением с ИнфоСтарта с минимальными доработками, а если действительно нужно "на постоянку", то проще избавиться от такого гимороя - поставить вопрос, что-бы документы присылали в ЭДО с нормальными ШК строкой, а не картинки распознавать.
15 Garykom
 
25.12.24
12:24
(0) хехе, какие интересные темы всплывают
"github.com/makiuchi-d/gozxing"
"github.com/sunshineplan/imgconv"
"github.com/sunshineplan/pdf"
16 Garykom
 
25.12.24
12:27
(15)+ суть преобразовываем pdf в картинки png
затем через gozxing (порт либы zxing на go) распознаем ШК

работает замечательно пока качество хорошее, например чеки с электронных магазинов сразу в pdf
на реальных же сканах хренового качества с выцветших чековых лент - все плохо
17 2mugik
 
25.12.24
12:28
(14)Может у него потоковое  сканирование документов или как там это называется.
18 2mugik
 
25.12.24
12:30
(16)Да при плохом качестве процент распознания тоже плохой.) Может нейронки  помогут? Ну так в качестве бреда...
19 Garykom
 
25.12.24
12:32
(18) ИИ помогут подбирать параметры предобработки картинок
для изменения контрастности и т.д.
и вырезки ШК в отдельные картинки
еще в чб или оттенки серого переводить если цветные и т.д.
короче все сложно и потянет на отдельный подпроект
самое главное откуда обучающую выборку брать
20 АгентБезопасной Нацио
 
25.12.24
12:42
21 Злоп
 
25.12.24
12:47
(14) у меня именно так и было, менеджеры хреновы. В результате что о качнул с ИС, восьмерочник наш подделал и все получилось. Но тонкости уже не помню.
22 H A D G E H O G s
 
25.12.24
12:58
Веселые истории экран покажет наш.
Автор, знай, если это ЧестныйЗнак, то там вполне могут быть не картинки.
23 Garykom
 
25.12.24
13:30
(22) если это ЧЗ то лучше как картинки
ибо формат внутри PDF может поменяться в любой момент
а с хорошего качества (не сканов) штрихкоды прекрасно через zxing читаются
24 H A D G E H O G s
 
25.12.24
13:37
Матрица Datamatrix может быть набрана квадратиками при помощи языка TrueScript, прямо внутри pdf файла, без всякого хранения картинки.

Ииии, чтобы что-то при этом распознать - pdf нужно отрендерить встроенными pdf-средствами. Живите теперь с этим.
25 Звездец
 
25.12.24
13:39
у каждой задачи есть начало. Может и не надо каждую задачу решать в лоб, а стоит уточнить там где этот файл сделали по поводу других форматов?
26 ammorf
 
25.12.24
14:24
(23) все именно таки обстоит.. я теперь в легкой прострации)))
27 ammorf
 
25.12.24
14:25
(24) я пробовал онлайн сервисом парсить pdf файл и он расшифровал эти штрихкоды в текст
28 LinuxOrg
 
25.12.24
14:39
(24) TrueScript нет такого языка
29 LinuxOrg
 
25.12.24
14:43
(19) Примеры в студию
30 LinuxOrg
 
25.12.24
23:00
(15) там же не все портировано
31 Волшебник
 
25.12.24
23:30
(28) ошиблись?