Преимущества сервиса
![]() Распознавание записи телефонных звонков или совещаний при хорошем качестве аудиозаписи. Поддерживается работа с дополнительной грамматикой: в начале работы вы можете передать какие-то специфичные термины. |
![]() Применимо в задачах по роботизации звонков для сбора информации, в голосовых системах самообслуживания, для речевой аналитики работы с клиентами, а также при создании интерфейсов для людей с ограниченными возможностями. |
|
|
|
|
![]() Длинный текст проще надиктовать, чем вводить на клавиатуре. Можно использовать голосовое управление так, чтобы по команде пользователя открывались нужные формы, строились отчеты, выполнялся поиск, заполнялись реквизиты. |
![]() Распознавание речи может осуществляться локально с использованием скачанной модели распознавания, аудиоданные никуда не будут отправляться, что может быть важно при особых требованиях к конфиденциальности. |
Дополнительно
Возможности
- Потоковое распознавание – пользователь отправляет аудиоданные в режиме реального времени, в ответ периодически получает распознанный текст. Удобно при диктовке текста или при управлении интерфейсом программы.
- Длительность одного сеанса при потоковом распознавании речи с помощью облачного сервиса имеет ограничение в 2 часа. При локальном распознавании речи ограничений длительности сеанса нет.
- Файловое распознавание – пользователь отправляет на распознавание файл с аудиозаписью и в ответ получает идентификатор задачи, по которому в дальнейшем сможет получить результат распознавания. В данном случае пользователь может отправить готовый аудиофайл, например, запись совещания. Распознанный текст будет предоставлен пользователю с задержкой, которая зависит от длительности аудиофайла и текущей загрузки облачного сервиса.
- Файловое распознавание может обрабатывать многоканальные аудиозаписи, в этом случае каждый канал будет распознаваться и тарифицироваться независимо. Для распознавания принимаются форматы аудио WAV signed 16 bit little-endian и Opus в контейнере ogg. Частота дискретизации аудио – от 8 кГц до 48кГц. Максимальный размер аудиофайла – 1Гб длительностью до 4 часов. Результаты распознавания доступны для скачивания в течение 7 суток после выполнения задания.
- Функция разделения по спикерам - позволяет получить расшифровку аудиофайла с делением её на собеседников. В результате распознавания пользователь получит текст, в котором будут отображены результаты отдельно по каждому из спикеров.
- Функцию можно использовать, например, для получения транскрибации разговоров при проведение собеседований, опросов пользователей, совещаний, оценке качества звонков и так далее.
- В настоящее время поддерживается распознавание речи на русском и английском языках. В дальнейшем состав доступных языков планируется расширять.
Условия использования
Работает в программах:
- 1С:Документооборот 3.0 (диктовка текста электронных писем, задач, отчетов и резолюций, голосовой подбор адресатов писем)
Программа 1С, в которую встраиваются механизмы распознавания, должна быть на официальной поддержке.
При локальном распознавании речи рекомендуется учитывать минимальные требования к ресурсам оборудования:
- x64: процессор Intel Core i5 или AMD Ryzen 5 и последующие модели, оперативная память 12 Гбайт и выше,
- x32: процессор Intel Core i5 или AMD Ryzen 5 и последующие модели, оперативная память 4 Гбайт и выше. Качество распознавания речи на платформе x32 снижено.
Техподдержка
Поддержка пользователей обеспечивается партнерами и линией консультаций фирмы "1С" по электронной почте ailab@1c.ru.
Использование распознавания речи в локальном режиме не тарифицируется.
В облачном режиме стоимость зависит от типа распознавания и длительности аудио.
- Потоковое распознавание. Единица тарификации распознавания равна 1 секунде потокового распознавания. Списание стоимости выполняется за каждые полные или неполные 20 секунд аудиоданных. Например, за распознавание потокового аудио длительностью 12 секунд будет списано 20 единиц тарификации, а для потокового аудио длительностью 64 секунды – 80 единиц.
- Файловое распознавание. Единица тарификации распознавания равна 4 секундам файлового распознавания. Списание стоимости выполняется за каждые полные или неполные 20 секунд аудиофайла. Например, за распознавание файла длительностью 12 секунд будет списано 5 единиц тарификации, а для аудиофайла длительностью 64 секунды – 20 единиц.
Работа с компанией "ДЖИНН" — это
![]() Оперативная помощь Поможем решить задачи вашего бизнеса |
![]() Индивидуальный подход Предложим персональное решение |
![]() Гарантия качества Более 5 лет внедряем программы 1С |
![]() Сильные специалисты Постоянно повышаем свою квалификацию |