Имя: Пароль:
1C
 
Распознавание и синтезатор речи
0 lEvGl
 
гуру
03.06.24
07:14
Доброго всем, у кого был опыт с этими средствами от 1С? Насколько адекватно распознает, нужно ли иметь дикторские способности, насколько это жизнеспособно? Спасибо за любую информацию
1 Волшебник
 
03.06.24
07:51
Применяются внешние движки
2 lEvGl
 
гуру
03.06.24
08:05
я видел, у них сервисы есть, для первого запуска к ним надо подключиться, он (видимо) выкачивает модель на локальный комп и потом позволяет без нэта уже работать, локально. Подходит такой вариант, вопрос в способности взаимодействия с людьми с несовершенным произношением русского языка, в идеале бы еще один из азиатских иметь, но пока хотя бы русский
если онлайн движки, то постоянный доступ нужен и время будет больше, несовсем то
по-другому вопрос: насколько сильные деффекты при произношении прощает обработчик
3 Волшебник
 
03.06.24
09:04
"с людьми с несовершенным произношением русского языка"

А где Вы видели людей с совершенным произношением русского языка?
Постоянно путают ударения, путают порядок слов, подменяют слова и смыслы, несут галиматью, сами не знают, что хотят сказать.
4 spiller26
 
03.06.24
09:08
Одно слово "зачем оно там?".
5 Волшебник
 
03.06.24
09:11
(4) Бывают бизнес-задачи по произнесению и распознаванию речи, например, терминалы самообслуживания покупателей в супермаркетах, вендинговые автоматы, взаимодействие с высшим руководством, которые лишний раз не хотят палец о кнопку ударять 🤟
6 lEvGl
 
гуру
03.06.24
09:17
(3) может будет кто то, кто практически юзал
(4) точно не от нечем заняться
7 lEvGl
 
гуру
03.06.24
12:13
апнем
8 Андрюха
 
03.06.24
12:20
(0) Распознавание делал на движке 1С, у них есть демо-конфигурация, можно потестить.
9 NorthWind
 
03.06.24
12:27
(4) полно задач где это полезно, особенно синтез. Дисплеи хрупки и дороги, а наушники или динамик стоят копейки. Можно делать всякого рода голосовые меню для поганых условий эксплуатации.
10 lEvGl
 
гуру
03.06.24
13:55
(8) добавил в самописку на бсп модель с русским, база сразу 2гБ памяти оторвала дополнительно, + грузит проц, через время после запуска отпускает. Дт стала весить на 1кБ больше, пользовательский режим запускается немного дольше, конф - без изменений.
(9) где-то так

пока итог: сильно (не то чтобы прям) страдают ресурсы, что и было обещано для локального использования

зы. не найду предметного материала по программной работе с этими объектами. демо есть, но там как всегда придется копаться через 3 езды колено, чтобы найти просто включение микрофона
11 Garykom
 
гуру
03.06.24
14:04
Еще бы распознавание текстов из сканов сделали
12 lEvGl
 
гуру
03.06.24
14:07
(11) + еще 2-3 Гб памяти как корова языком слижет)
13 Garykom
 
гуру
03.06.24
14:12
(12) ну дык чтобы модели подгружались при первом использовании
14 lEvGl
 
гуру
03.06.24
14:31
(13) при каждом запуске такая ерунда, память подолгу не отпускает, проц почти сразу
15 АгентБезопасной Нацио
 
03.06.24
15:10
Это под мобильное, или под настольный?
16 lEvGl
 
гуру
03.06.24
15:12
(15) настольный
мобильный в локальном варианте наверно не вариант будет
17 Волшебник
 
03.06.24
15:13
(11) Ещё бы сделали распознавание истинных потребностей пользователей по радужной оболочке глаза...

18 АгентБезопасной Нацио
 
03.06.24
15:15
(17) если оболочка радужная....
19 lEvGl
 
гуру
03.06.24
16:09
по речи все, как и всегда, в ЖКК написано, сразу не увидел

(15)
Распознавание речи не поддерживается:
● В том случае, если информационная база создана в режиме совместимости Версия 8.1.
● В веб-клиенте, который доступен только по протоколу HTTP и не является locahost.
● В веб-клиенте, который работает под управлением:
● веб-браузера Google Chrome версии 65 и предшествующих.
● веб-браузера Microsoft Internet Explorer любых версий.
● веб-браузера Mozilla Firefox любых версий.
● веб-браузера Safari любых версий.
● веб-браузеров на основе Chromium версии 65 и предшествующих.
● В автономном сервере.
● Распознавание речи может работать некорректно в 32-разрядных системах. Модели распознавания речи и дополнительные грамматики загружаются в оперативную память и имеют существенный размер. Поэтому ограниченного объема оперативной памяти 32-разрядных систем может не хватить для загрузки.

В следующих случаях поддерживается только распознавание с помощью сервиса (не поддерживается локальное распознавание):

● На компьютерах фирмы Apple (в файловом варианте информационной базы).
● В учебной версии системы «1С:Предприятие».

В следующих случаях поддерживается только отложенное распознавание речи и распознавание с помощью сервиса (не поддерживается потоковое распознавание):

● При работе под управлением ОС Windows XP или Windows Server 2003.
20 lEvGl
 
гуру
03.06.24
16:04
в общем работает, не идеально, но возможно обучение этой сети, наполнение словаря. Подъемно в общем.

Описание нормальное
https://its.1c.ru/db/v8323doc#bookmark:dev:TI000002692



что он делает с памятью так и не понял, снала +2гБ, потом отпускает до 0 или до +1гБ, начинаешь диктовать конечно разрастается, потом освобождает. Но в любом случае при запуске базы пара гигов допом под это уходит
21 mmg
 
03.06.24
23:27
(2) С чего вы взяли, что в онлайн варианте время будет больше? Напротив, оно будет меньше, а качество лучше. Зависит, конечно, от провайдера, но у них сейчас +/- одинаково, потому как конкуренция. К тому же провайдера всегда можно поменять на более шустрого, более качественного. У Сбера, кстати, казахский заявлен, как один из возможных. Yandex поддерживает казахский и узбекский
22 mmg
 
03.06.24
23:30
(2) Насколько сильные дефекты прощает обработчик? Это смотря как вы этот обработчик сделаете. Если после транскрибации, вы примените к тексту GPT, то GPT простит вам практически все (сейчас это верно для русского языка, но не для азиатских)
23 lEvGl
 
гуру
04.06.24
09:00
(21) ну да, встал работник такой "запусти.. запусти.. запускай .ля" и стоит ждет, когда нэт появится или когда сервис разгребет всю очередь обращений. "Одинаково" не значит быстро и стабильно, +- одинаково у провайдеров и есть, это да. А сменить провайдера.. что то я устал писать про глупоси
24 mmg
 
04.06.24
09:11
(23) Вы пробовали? Сбер и Yandex работают быстро и стабильно.
25 lEvGl
 
гуру
04.06.24
09:15
(24) с коммуникациями как у них?
добавьте сюда же коммуникации потребителя
26 mmg
 
04.06.24
09:17
(25) Просто попробуйте и сравните скорость и качество с вашим локальным вариантом. Что впустую говорить
27 lEvGl
 
гуру
04.06.24
09:19
(26) я пробую каждый день, не первый год, когда открываю гугл, и что то меня останавливает юзать на провайдере завязанный функционал. Мне не для надиктовки писем, оперативная работа
Пользователь не знает, чего он хочет, пока не увидит то, что он получил. Эдвард Йодан