Программы для перевода голоса в текст
Любой пользователь компьютера может столкнуться с ситуацией, когда необходимо голосом ввести какой-либо текст на компьютере. Помимо стандартных решений Windows, существуют сторонние приложения, позволяющие сделать это. Предлагаем рассмотреть лучшие из них.
MSpeech
Первым делом рассмотрим бесплатную утилиту MSpeech от независимого разработчика Михаила Григорьева, распространяющего свой продукт бесплатно с открытым исходным кодом. В основе решения лежит технология Google Voice API, предназначенная для распознавания человеческой речи и дальнейшего ее преобразования в текст. Распознанный текст вводится в специальное окно, откуда его можно легко перенести в другие приложения разными способами. Поддерживается порядка 50 различных языков, включая русский. Доступны горячие клавиши для удобной активации и завершения записи.
Предусмотрен простой текстовый редактор, в котором можно выполнить первичную коррекцию полученного текста: заменить определенные слова другими или изменить первые буквы предложений на прописные. В качестве источника звука можно использовать любое устройство, подключенное к компьютеру. Если их несколько, то MSpeech предложит выбрать подходящее. Меню программы поддерживает русский язык. Помимо этого, она совместима со следующими интерфейсами: Microsoft SAPI, Google Text-to-Speech, iSpeech Text-to-Speech, Yandex Text-to-Speech и др.
Lossplay
На очереди еще одно простое приложение для транскрибации, которое изначально создавалось командой разработчиков с разных стран. Сейчас в качестве создателя выступает один независимый программист, продолжающий развивать его. LossPlay можно использовать не только для перевода голоса в текст, но и в качестве обычного плеера для прослушивания музыки и других аудиофайлов. Решение поддерживает любое актуальное расширение от MP3 до WMA. Управление воспроизведением осуществляется с помощью настраиваемых горячих клавиш.
LossPlay оптимизирован для работы с текстовыми документами Microsoft Word. Распознаваемый текст вводится в программе без участия пользователя. Помимо этого, предусмотрена функция автоматической вставки тайм-кодов всех фраз. Интерфейс рассматриваемого решения представлен в виде привычного плеера с дополнительными функциями. При этом с меню справится даже начинающий пользователь. LossPlay распространяется на бесплатной основе на русском языке.
Transcriber-Pro
Transcriber-Pro — программа от российских разработчиков, предназначенная для ручной расшифровки аудио и видеофайлов в текст. Присутствует встроенный текстовый редактор со всеми необходимыми функциями для качественной транскрибации: вставка временных меток и дикторов, простая навигация по записи, коррекция без повторного прослушивания, формирование профессиональное стенограммы и др. Управление осуществляется с помощью настраиваемых горячих клавиш, что делает решение более удобным.
Рассматриваемое приложение позволяет работать в команде над одним проектом. Предусмотрена оперативная техническая поддержка для обладателей платной лицензии. Подписка оформляется на год. На официальном сайте можно ознакомиться с системными требованиями, посмотреть наглядный видеоролик по работе с Transcriber-Pro, а также увидеть подробное руководство пользователя.
Изменение языковых параметров
Так как русской локализации Cortana на текущий момент не существует, ее работа отключена для России. Чтобы включить голосовую помощницу, вам потребуется сменить регион и язык интерфейса своей операционной системы Windows 10.
Для этого сделайте следующее:
- Нажмите Win + I, чтобы открыть панель параметров или вызовите ее с помощью кнопки в меню «Пуск».
- Перейдите в категорию, которая называется «Время и язык».
- На панели закладок слева выберите раздел «Регион и язык».
- В графе «Страна и Регион» установите «США».
- В разделе «Языки» щелкните по «English (United States)» и нажмите Использовать как основной.
- Теперь перейдите ко вкладке «Распознавание голоса».
- Выберите язык «Английский (США)».
- Если ваше произношение далеко от идеала, установите отметку напротив пункта «Распознавать неродные акценты этого языка».
- Перезагрузите персональный компьютер, чтобы обновить интерфейс Windows 10.
Онлайн сервисы для набора текста голосом
На данный момент есть очень большой выбор сервисов и программных приложений для голосового набора команд и управления.
Голосовой блокнот speechpad.ru
Преимущества:
Для использования онлайн версии следует перейти на сайт https://speechpad.ru/, пролистать страницу вниз, включить запись и получить готовый текст. Для браузера потребуется скачать и установить расширение.
Инструкция по использованию:
- Кликните по кнопке «Включить запись». (если Вы первый раз это делаете, то в правом верхнем углу возникнет всплывающее уведомление о том, что нужно разрешить доступ сервису к микрофону).
- Постарайтесь как можно четче и ближе к микрофону произносить слова. Стоит учитывать, что проговариваемый текст будет появляться там, где находится курсор. А если случайно перед этим был выделен текст, то он затрется.
- Можно активировать опцию «Отключить управление заглавными буквами» и тогда Google не будет обновлять регистр в зависимости от пунктуации. А для изменения необходимо будет воспользоваться кнопкой с текстом А/а, она увеличит или уменьшит размер той буквы рядом с курсором.
- Для удаления действия нужно нажать кнопку «Отменить».
- Для расстановки знаков препинания есть специальные кнопки на панели, активировать кликом левой кнопки мыши. Также Вы можете отметить для использования функцию «Заменять слова пунктуации» и тогда сможете голосом расставлять знаки препинания.
- Для того, чтобы поменять язык, необходимо нажать на данное поле и появится выпадающий список, в котором следует найти и выбрать требуемый. При условии, что нет нужного, необходимо зарегистрироваться и добавить в личном кабинете.
- Чтобы давать команды сервису при помощи голоса, активируйте пункт «Выполнять команды».
- Также вывод текста можно делать не только в поле на сайте сервиса, но и в буфер обмена после выбора использования такой функции на странице и установке расширения для блокнота.
Голосовой ввод текста в Гугл документах
Преимущества и возможности:
- Запись, редактирование и форматирование информации голосом.
- Удобство: нет необходимости устанавливать программу на устройство.
- Мультиязычность.
Пошаговая инструкция применения:
- Перейти в браузере в раздел «Инструменты».
- Откройте из предложенных пунктов «Голосовой ввод».
- Активируйте кликом иконку микрофона (разрешите использование).
- Начинайте громко и четко произносить то, что следует записать.
Расширение для браузера Войснот II
Достоинства:
- Удобство.
- Интуитивно понятный интерфейс: достаточно простое управление.
- Есть возможность создать ярлык для быстрого доступа к сервису.
- Мультиязычность.
- Исправление написания слов при нечетком или неправильном произношении.
- Сохранение информации в браузере, кэше, буфере обмена.
Инструкция использования:
- Установка:
- Перейти в магазин расширений Google: http://goo.gl/oMx8Xx;
- Установить и разрешить использование микрофона.
- Создание ярлыка на рабочем столе:
- Перейти на страницу расширений, которые установлены.
- Нажать на иконку Войснот.
- Выбрать в появившемся меню «Создать ярлык».
- Запуск/остановка:
- Нажать на кнопку с изображением микрофона.
- Или активировать сочетание клавиш Ctrl+Пробел.
- Запись текста предполагает расставление знаков препинания с учетом правил русского языка и пауз в процессе диктовки.
- Чтобы отредактировать, следует воспользоваться панелью инструментов: стереть, сохранить, скопировать, исправить регистр букв, добавить недостающие знаки пунктуации, перейти на новую строку.
Распознавание речи в браузере TalkTyper
Преимущества:
- Бесплатный сервис;
- Мультиязычность.
- Исправление написания слов при нечетком или неправильном произношении.
Инструкция:
Голосовой блокнот August4u
Достоинства:
- Простота использования.
- Является уникальной разработкой.
- Высокий уровень качества и скорости распознавания.
- Использовать можно бесплатно.
Инструкция:
- Перейти на страницу сервиса: https://august4u.net/?speech2text.
- Можно выбрать один из 6 языков.
- Нажать на иконку микрофона и разрешить доступ к устройству.
- Автоматически включена расстановка знаков препинания, но нажав на кнопку с текстом «.,!» можно отключить данную функцию.
- По окончании диктовки можно сохранить, копировать, отправить на электронную почту полученный текст и очистить поле, нажав на иконку с крестиком.
Программы и онлайн-сервисы голосового набора
Пользователь может выбрать для себя максимально удобный вариант, воспользоваться софтом, скачав его на ПК или использовать веб-ресурсы. Программы для перевода речи и аудиозаписей в текст могут находиться в свободном доступе для скачивания или распространяться на коммерческой основе.
MSpeech
Программа для набора текста голосом, применяющая Google Voice API, распознаёт речь более чем на 50 языках, доступен выбор интерфейса (русский, английский) и имеется широкий набор опций, в том числе передача распознанного текста в редакторы, возможность добавления собственных команд и назначения «горячих клавиш» для активации/остановки процесса записи для распознавания. Приложение MSpeech полностью бесплатно, несмотря на это его функциональность и качество работы на достойном уровне. К сожалению, функционировать без подключения к сети Интернет программа не сможет.
Приложение, выполняющее набор текста с помощью голоса, имеет достаточно большой словарный запас в 85 000 слов. В расширенных версиях программы включены дополнительные тематические словари, благодаря которым доступно применение терминологии. Софт Voco Professional и Voco Enterprise, кроме диктовки посредством микрофона устройства, распознают также аудиозапись. Пунктуация выполняется по команде, а в случае с переводом записей аудио формата в текст, знаки препинания расставляются в автоматическом режиме. Программа распространяется на платной основе, доступна для версий Windows 7 и выше. Большим плюсом ПО является возможность использования при отсутствии подключения к Интернету, что очень удобно, если много пишешь, но часто находишься вне зоны действия сети.
Dictate
Расширение для Microsoft Office вышло в 2017 году, и воспользоваться инструментом можно установив его дополнительно к пакету. В обновлённых версиях Word, PowerPoint и Outlook по умолчанию сервис Dictate не включён. Бесплатное дополнение позволяет набрать текст голосом более чем на 20 языках мира и имеет функцию перевода на 60 языков. Скачать инструмент можно на официальном сайте Майкрософт, выбрав при этом подходящую разрядность системы. После простой инсталляции скачанного файла Dictate с помощью мастера установки в Word появится вкладка Dictation, где присутствует возможность диктовки текста и при необходимости перевода на другой язык. Для тех, кто работает с данным редактором, это отличная опция, позволяющая ускорить темпы производительности, вместо того, чтобы часами стучать по клавишам.
SpeechPad
Бесплатный голосовой блокнот SpeechPad от Google является отличным инструментом для преобразования речи в текстовый формат информации. Для использования сервис требует установку гугловского браузера Chrome, что не всем удобно, но функционал однозначно достоин внимания. Блокнотом могут воспользоваться владельцы ОС Windows, Linux и Mac, подключение к сети Интернет обязательно. В онлайн-сервисе доступны опции преобразования аудио и видео в текст, перевода на другие языки, для удобства можно назначить «горячие клавиши». Кроме того, при установке расширений для SpeechPad вы имеете дополнительные возможности прямого ввода текста. Модуль интеграции для операционной системы позволит использовать речевой ввод в каждом из установленных в системе приложений.
VoiceNote II
Очередной продукт для набора текста при помощи голоса от Google, соответственно по аналогии с блокнотом SpeechPad запускается в браузере Chrome. Войснот можно установить как расширение или приложение на компьютер. Какой бы вариант вы не выбрали, освоить работу с инструментом несложно. Начать процедуру записи можно нажатием на значок микрофона, после чего просто наберите голосом сообщение. Во избежание большого количества ошибок нужно говорить чётко и внятно, делая небольшие паузы.
TalkTyper
Данный инструмент для преобразования речи в текст также хорошо печатает под диктовку, проверяет результаты на пунктуационные и грамматические ошибки, имеет функцию перевода текстовой информации на разные языки. Кроме того, преимуществом использования приложения является очень нужная опция, предлагающая возможность выбора вариантов для слов, которые TalkTyper неточно распознал, они будут подсвечиваться.
Использование распознавания речи в Windows
Просмотрите это видео об использовании распознавания речи для работы с компьютером. (Чтобы просмотреть субтитры, нажмите кнопку «Субтитры».)
Просмотрите это видео об использовании диктовки с распознаванием речи. (Чтобы просмотреть субтитры, нажмите кнопку «Субтитры».)
Распознавание речи Windows делает использование клавиатуры и мыши необязательным. Вместо этого теперь можно управлять компьютером с помощью голоса и диктовать текст для ввода.
Примечание: Распознавание речи доступно только для следующих языков: английский (США и Соединенное Королевство), французский, немецкий, японский, мандаринский диалект (китайский (упрощенное и традиционное на китайском языке) и испанский.
Прежде чем использовать распознавание речи, необходимо выполнить несколько действий. Сначала нужно настроить микрофон. Затем можно научить компьютер распознавать ваш голос.
Прежде чем приступить к настройке функции распознавания речи, убедитесь, что микрофон подключен к компьютеру, иначе настройка не удастся.
Выполните прокрутку от правого края экрана и нажмите кнопку Поиск. (Если вы используете мышь, найдите правый нижний угол экрана, переместите указатель мыши вверх и нажмите кнопку «Поиск».)
Поиск также можно открыть с помощью клавиатуры, нажав клавиши Windows+Q.
Введите в поле поиска настройка микрофона, а затем выберите элемент Настройка микрофона.
Следуйте указаниям на экране.
Примечание: По возможности используйте микрофон гарнитуры — это снижает вероятность фонового шума.
Обучение компьютера распознаванию речи
Программа распознавания речи использует особый речевой профиль для распознавания голоса пользователя и произносимых команд. Чем дольше вы пользуетесь распознаванием речи, тем более подробным становится ваш речевой профиль и тем лучше компьютер интерпретирует ваши команды.
Выполните прокрутку от правого края экрана и нажмите кнопку Поиск. (Если вы используете мышь, найдите правый нижний угол экрана, переместите указатель мыши вверх и нажмите кнопку «Поиск».)
Поиск также можно открыть с помощью клавиатуры, нажав клавиши Windows+Q.
Введите в поле поиска распознавание речи, а затем коснитесь элемента Распознавание речи или щелкните его.
Нажмите или щелкните элемент Обучить компьютер для улучшения распознавания вашего голоса.
Следуйте инструкциям по настройке речевого ввода для распознавания речи.
При помощи голосовых команд можно выполнять многие задачи, например заполнять электронные формы или писать письма. Когда вы произносите слова в микрофон, программа распознавания речи преобразует их в текст, который отображается на экране.
Диктовка текста с помощью программы распознавания речи
Выполните прокрутку от правого края экрана и нажмите кнопку Поиск. (Если вы используете мышь, найдите правый нижний угол экрана, переместите указатель мыши вверх и нажмите кнопку «Поиск».)
Поиск также можно открыть с клавиатуры, нажав клавиши Windows +Q.
Введите в поле поиска распознавание речи, а затем коснитесь элемента Распознавание речи Windows или щелкните его.
Произнесите команду «Start listening» либо коснитесь кнопки микрофона или нажмите ее, чтобы войти в режим прослушивания.
Лучшие онлайн сервисы для перевода голоса в текст
Преобразование речь в текст можно осуществлять онлайн. Для этого используются специальные сервисы, перейти в которые вы можете при помощи поисковой строки в Яндексе и Гугле. Главным условием является только наличие доступа к сети интернет.
Какие есть программы для набора текста по голосу онлайн? Мы рассмотрим самые популярные сервисы, к которым вы можете обратиться в случае возникновения необходимости оцифровки аудиофайла в текстовый формат.
Спичпад
Speechpad – это голосовой блокнот, возможностями которого можно воспользоваться при помощи браузера Гугл Хром. Следовательно, как вы уже могли догадаться, для начала вам необходимо установить эту программу на свой компьютер. Хотя она вполне успешно функционирует и на телефоне, и на планшете.
Как установить данный голосовой блокнот онлайн? Для этого вы можете загрузить его прямо в свой браузер, либо перейти непосредственно на сайт https://speechpad.ru/. Далее можете переходить непосредственно к работе с сервисом. Алгоритм действий следующий:
- Выберите язык записи в блокноте для речевого ввода Спичпад. По умолчанию в программе установлен русский язык, но при необходимости вы можете его поменять.
- После осуществления основных настроек вы можете переходить непосредственно к озвучиванию текста голосом онлайн. Нажмите кнопку «Включить запись», после чего начинайте произносить текст, который необходимо трансформировать в печатный вариант.
Важно! Во избежание множественных ошибок, старайтесь максимально четко озвучивать каждое слово. Если необходимо поставить знак препинания, назовите его словом (например, «запятая», «двоеточие», «тире» и пр.). Когда работа в речевом блокноте будет закончена, просто остановите запись и перепроверьте текст на наличие ошибок
Когда вы это сделаете, просто скопируйте запись с текстового редактора программы и перенесите его в нужный файл
Когда работа в речевом блокноте будет закончена, просто остановите запись и перепроверьте текст на наличие ошибок. Когда вы это сделаете, просто скопируйте запись с текстового редактора программы и перенесите его в нужный файл.
Голосовой ввод текста онлайн при помощи Спичпад в Google можно осуществлять не только на компьютере. Через планшет или смартфон это расширение тоже работает довольно успешно.
August4u
Для преобразования голоса в текст выберите язык, нажав на значок флага. Также вам нужно настроить функцию пунктуации: для этого на панели инструментов есть отдельная кнопка. Чтобы сделать запись, нажмите на кнопку с микрофоном, и начинайте говорить. После окончания процесса нажмите на кнопку с микрофоном повторно – и запись прекратится.
Talk Typer
Записать речь в тексте онлайн можно и при помощи данного сервиса. К слову, он был разработан зарубежными программистами, и пользуется довольно большой популярностью у российских пользователей. Работу с этим сервисом можно осуществлять через любой браузер.
Онлайн набор текста под диктовку с помощью этого приложения происходит практически по тому же алгоритму, который характерен для предыдущих программ.
Dictation.io
На заметку. Если вам необходимо удалить текст из формы, нажмите Clear. Для сохранения файла в текстовом формате нажмите Save.
Поисковая строка Гугл
Если вам необходимо срочно что-то найти в интернете, вы можете воспользоваться голосовым набором текста на устройстве, работающим на базе Андроид. И сделать это можно при помощи поисковой строки Гугл.
Практически все современные портативные девайсы имеют встроенные Гугл сервисы, включающие Гугл Карты, браузер Гугл Хром, Гугл Диск и прочие функции. В мобильном браузере Google Chrome имеется уже настроенная функция голосового поиска. Вам только необходимо нажать на значок микрофона, который находится рядом с поисковой строкой, и продиктовать ваш запрос. Он автоматически будет переведен в текстовый формат, и в считанные секунды вы получите результат в поисковой системе.
Гугл документы
Это еще один способ голосового ввода – Гугл документы. Чтобы открыть сервис, вам необходимо перейти во вкладку «Инструменты», после чего выбрать «Голосовой ввод». Это расширение очень легко в использовании, принцип которого практически ничем не отличается от всех ранее рассмотренных приложений.
Войснот 2
Это отличный способ голосового набора текста на компьютере или любом другом современном портативном устройстве. Данный сервис нужно устанавливать в браузер Гугл Хром, после чего он автоматически появится в списке сервисов. Вот ссылка на дополнение.
Чтобы начать или закончить запись, вам нужно нажать на значок микрофона.
Сервис Dictate
По умолчанию эта функция в программе «Ворд» отсутствует и никакие обновления не помогут. Для этой цели нужно использовать сторонний сервис Dictate.
Данное дополнение позволяет вводить текст при помощи голоса более чем на 20 языках. Более того, оно может переводить слова в режиме онлайн на 60 различных языков. И самое главное – этот сервис полностью бесплатный.
Для того чтобы в вашем офисе появилась возможность надиктовки, нужно выполнить следующие шаги.
- Откройте официальную страницу разработчиков. Нажмите на ссылку «Download for Office 32-bit» или на «For Office 64-bit click here».
Для того чтобы определить разрядность своей системы и скачать правильную версию программы, нажмите на горячие клавиши Win + Pause/Break .
- Нажмите на кнопку «Сохранить».
- Запустите скачанный файл.
- Соглашаемся с лицензионным соглашением и кликаем на «Next».
- После небольшого ожидания завершаем установку нажатием на «Finish».
- Запускаем редактор Word и переходим на вкладку «Dictation».
- Если вы не собираетесь переводить текст, то в обоих полях выберите русский язык.
- Убедитесь, что у вас подключен микрофон и он работает. Сделайте правый клик по иконке со звуком.
- Выберите пункт «Записывающие устройства».
- Скажите что-нибудь в микрофон. При этом шкала должна загореться. Если ничего не происходит – это плохо. Значит, устройство выключено или не работает.
- Убедитесь, что именно этот микрофон указан по умолчанию. В противном случае набор текста будет невозможен.
Задать устройство по умолчанию можно при помощи контекстного меню (нужно сделать правый клик по выбранному пункту).
- Если всё хорошо, то нажмите на кнопку «OK».
- Возвращаемся в редактор «Ворд». Для того чтобы начать набирать текст при помощи голосовых команд, нужно всего лишь кликнуть на иконку «Start».
- Попробуем сказать что-нибудь.
- Всё работает отлично. Согласитесь, так печатать текст намного удобнее и проще. А самое главное – это очень быстро. Для остановки записи нужно нажать на кнопку «Stop».
Запись автоматически отключается, если вы длительное время не обращались к вордовскому документу (находились в другом приложении) или молчали.
Сервис Dictate
По умолчанию эта функция в программе «Ворд» отсутствует и никакие обновления не помогут. Для этой цели нужно использовать сторонний сервис Dictate.
Данное дополнение позволяет вводить текст при помощи голоса более чем на 20 языках. Более того, оно может переводить слова в режиме онлайн на 60 различных языков. И самое главное – этот сервис полностью бесплатный.
Для того чтобы в вашем офисе появилась возможность надиктовки, нужно выполнить следующие шаги.
- Откройте официальную страницу разработчиков. Нажмите на ссылку «Download for Office 32-bit» или на «For Office 64-bit click here».
- Нажмите на кнопку «Сохранить».
- Запустите скачанный файл.
- Соглашаемся с лицензионным соглашением и кликаем на «Next».
- После небольшого ожидания завершаем установку нажатием на «Finish».
- Запускаем редактор Word и переходим на вкладку «Dictation».
- Если вы не собираетесь переводить текст, то в обоих полях выберите русский язык.
- Убедитесь, что у вас подключен микрофон и он работает. Сделайте правый клик по иконке со звуком.
- Выберите пункт «Записывающие устройства».
- Скажите что-нибудь в микрофон. При этом шкала должна загореться. Если ничего не происходит – это плохо. Значит, устройство выключено или не работает.
- Убедитесь, что именно этот микрофон указан по умолчанию. В противном случае набор текста будет невозможен.
- Если всё хорошо, то нажмите на кнопку «OK».
- Возвращаемся в редактор «Ворд». Для того чтобы начать набирать текст при помощи голосовых команд, нужно всего лишь кликнуть на иконку «Start».
- Попробуем сказать что-нибудь.
- Всё работает отлично. Согласитесь, так печатать текст намного удобнее и проще. А самое главное – это очень быстро. Для остановки записи нужно нажать на кнопку «Stop».
Как подключить Dictate
Надстройка Dictate скачивается с официального сайта dictate.ms
- Скачайте бесплатное расширение Dictate с сайта dictate.ms
- Откройте Outlook и пройдите по пунктам меню «Файл» → «Параметры» →«Надстройки». Управление настройками Microsoft Office — подключение Dictate
Теперь кликните на «Управление: надстройки COM» и выберите в новом окне «Добавить».
- Пройдите к тому месту, где сохранили расширение, которое предварительно скачали, выберите его и нажмите затем на кнопку «ОK».
- Убедитесь в том, что напротив «Microsoft Dictate» есть галочка, и сохраните настройки нажатием на кнопку «ОK».