Голосовой ввод текста: 9 онлайн-сервисов и программ

Голосовой ввод текста позволяет быстро записывать мысли на виртуальную бумагу, так как печатаем мы медленнее, чем говорим. Так почему бы не сэкономить время? Можно взять функциональный онлайн-сервис и переводить в текст объемные аудиофайлы, а можно просто установить мобильное приложение и делать заметки голосом – все зависит от вашей конечной цели. Мы разберем и те, и другие инструменты.

Содержание

Онлайн-сервисы
Google Docs
Speechpad
Расширение сервиса
Мобильное приложение «Голосовой блокнот»
Voice Notepad
TalkTyper
Программы для компьютера
MSpeech
Speak A Message
Мобильные приложения
Написать голосом
Transkriptor
Голосовые заметки

Онлайн-сервисы

Если у вас стационарный компьютер, вам нужно дополнительно приобрести съемный микрофон. Если у вас ноутбук, вы можете использовать встроенный модуль для записи звуков.

Google Docs

Набирать текст голосом можно в привычных документах Google. Для доступа к сервису необходимо иметь аккаунт почты gmail.

Так как голосовой набор здесь только как опция, его нельзя использовать для преобразования аудиофайлов в текстовые документы. Можно попробовать включить запись в обычном проигрывателе на другом устройстве и одновременно активировать голосовой ввод в Google Docs. Но в этом случае качество транскрибации будет низким, особенно если человек очень быстро говорит – сервис будет не успевать записывать все фразы. Речь должна быть медленная и внятная.

Как включить набор текста голосом в Google Docs:

Перейдите на сайт сервиса и нажмите на кнопку «Открыть Google Документы». Войдите в свой аккаунт Google.
Откройте «Пустой файл», чтобы создать новый текстовый документ голосом.
Кликните по разделу «Инструменты» на верхней панели и нажмите «Голосовой ввод». Либо зажмите на клавиатуре три клавиши: Ctrl + Shift + S.
На странице появится панель с нарисованным микрофоном. Сначала выберите свой язык в выпадающем меню. По умолчанию уже стоит русский, но, возможно, вам нужен другой.
Нажмите на иконку с микрофоном, чтобы запустить инструмент для распознавания устной речи.
Разрешите сайту использовать микрофон вашего устройства.
Кнопка с микрофоном станет красного цвета. Начните проговаривать текст – медленно и как можно четче. Вы увидите, как сервис станет сам печатать ваши слова.
Если у вас стабильный скоростной интернет, сайт будет автоматически сохранять изменения в документе – вам этого делать не нужно. Затем вы можете оставить документ храниться в облаке либо скачать его на устройство в формате docx.

Speechpad

Speechpad – один из самых функциональных инструментов для голосового набора текста. Здесь можно переводить аудио- и видеофайлы в обычный печатный текст. Принимаются только записи формата html5 (то есть те, которые опубликованы в интернете, нужно ввести ссылку URL) и видео из YouTube (необходимо указать ID ролика).

Недостаток сервиса – он работает только в браузере Google Chrome на Windows, Mac и Linux. Также разработчики рекомендуют использовать внешний микрофон, даже если у вас ноутбук с встроенным модулем.

Кроме этого, есть ограничения по языкам (их не так много, как в тех же Google Документах). Доступны русский, английский, немецкий, итальянский, армянский, литовский и некоторые другие.

Как происходит диктовка текста в этом сервисе:

Перейдите на сайт Speechpad. Прочитайте при необходимости небольшую инструкцию, как пользоваться сервисом, или посмотрите видео.
Если вам нужно, чтобы сайт просто записал под диктовку ваши слова, настройте язык голосового ввода и отключите при желании управление заглавными буквами Google. Можно оставить включенной удобную функцию «Заменять слова пунктуации» – так вы сможете проговаривать названия знаков препинания, а сервис будет заменять их самими значками. С помощью кнопки «Отменить» вы сможете удалить из результирующего окна последний введенный фрагмент, а за счет клавиши «Скопировать» поместить текст в буфер обмена. Кнопки «А_» и «АА» помогут вовремя менять регистр букв.
Нажмите «Включить запись» и разрешите сайту доступ к микрофону.
Наговорите текст. Отредактируйте его с помощью кнопок со знаками препинания. Также вы можете вносить изменения в текст прямо со своей клавиатуры, либо с помощью виртуальной (открыть ее можно нажав соответствующую кнопку над полем).
Когда закончите проговаривать текст, нажмите «Отключить запись». Отредактированный текст скачайте на устройство с помощью одноименной кнопки под «Результирующим полем». Браузер загрузит на ПК файл в формате txt.

Как включить транскрибацию аудио- или видеофайла:

Нажмите на кнопку «+ Транскрибацию» под «Результирующим полем».
Сайт перезапустится. Появится новая панель для преобразования в текст отдельных аудио- и видеофайлов. Выберите тип медиа. По умолчанию стоит значение «HTML5 audio». Если выберите другой вид, страница также перезагрузится. Мы поставим значение «Youtube video» и вставим ссылку на него в специальное поле. В иных случаях можно загрузить файл аудио или видео в формате HTML с компьютера – с помощью специальной кнопки.
Скопируйте ID ролика на YouTube – это комбинация разных цифр и букв в конце ссылки после «v=».
Вставьте ID в поле и нажмите «Обновить». На экране появится сам ролик.
При необходимости настройте транскрибацию. Поставьте защиту от шумов, укажите скорость воспроизведения ролика, язык голосового ввода, настройте перемотку видео, если нужно перевести в текст только часть ролика. Функция «Запускать синхронно с записью» позволит преобразовать аудиозапись плохого качества (у вас появится возможность самостоятельно проговаривать те фрагменты, которые мало различимы при воспроизведении файла – в этом случае нужно будет использовать наушники). Нажмите «Включить запись». Также запустите сам ролик на странице Speechpad.

Сервис начнет печатать текст за человеком, который говорит в ролике. При необходимости можете ставить запись на паузу и редактировать текст по мере его ввода. Когда текст будет готов, нажмите «Скачать» – браузер загрузит на ПК txt-файл.

Расширение сервиса

У Speechpad есть расширение для браузера Google Chrome. Плюс его использования: можно вводить текст голосом в любое поле, открытое в веб-обозревателе. При установленном дополнении вы также сможете отправлять проговариваемый текст не в результирующее поле, а в буфер обмена, чтобы затем вставить его в нужный вам редактор.

Расширением можно пользоваться бесплатно. Приобрести можно только дополнительную функцию – интеграция с Windows или Mac. Она позволяет вводить текст голосом не только в браузере, но и во всех других программах, установленных на ПК: Word, Excel и т. д. Для подключения интеграции нужно сначала зарегистрироваться на сайте Speechpad, опробовать бесплатную версию, а затем подключить платный вариант:

1 месяц — 100 руб.;
3 месяца — 250 руб.;
12 месяцев — 800 руб.

Как пользоваться дополнением к браузеру:

Перейдите в магазин расширений Google Chrome. Нажмите «Установить».
Подтвердите действие в новом окне.
На панели справа от адресной строки появится значок Speechpad. Если он появился и исчез, нажмите на иконку в виде пазла и закрепите кнопку расширения на панели.
Нажмите на иконку Speechpad, чтобы открыть меню настроек. Здесь вы можете указать язык ввода, включить функцию продолжительного распознавания (когда вы сами включаете и отключаете голосовой набор). Для сохранения изменений нажмите «Save» и перезапустите браузер.
Чтобы настроить горячие клавиши для включения и выключения голосового ввода текста, перейдите по ссылке: chrome://extensions/shortcuts. Опуститесь до раздела с нашим расширением. Установите необходимые комбинации клавиш.
Чтобы включить расширение для определенного текстового поля в браузере, кликните по нему правой кнопкой мыши. Выберите «Speechpad». Либо зажмите комбинацию клавиш Ctrl + Shift + 7 (или любую другую, установленную на предыдущем шаге).
Разрешите сайту доступ к микрофону вашего устройства.
Текстовое поле станет розового цвета. Это означает, что микрофон работает – можно говорить. Введите текст голосом. Когда закончите, зажмите ту же комбинацию клавиш либо нажмите снова правой кнопкой мыши на поле и выберите «Speechpad».

Мобильное приложение «Голосовой блокнот»

По функционалу программа «Голосовой блокнот» (версия для Андроид) отличается от онлайн-сервиса. Здесь можно записывать заметки только в режиме реального времени – нет возможности транскрибировать готовый файл. Зато есть два режима работы: из аудио в текст и из текста в аудио (приложение может зачитать написанную вами заметку).

Но стоит отметить, что в версии для iOS есть функция для расшифровки готовых аудиофайлов и экспорта текста в формат субтитров.

Заметку можно копировать в буфер обмена, сохранять в виде отдельного файла или сразу отправлять в любой мессенджер, установленный на телефоне.

Приложением можно пользоваться бесплатно. Но есть премиум-версия (стоит около 240 рублей). В нее входит темный режим экрана, негаснущий дисплей, мгновенный счетчик слов, отметка даты в начале текста.

Как работать в мобильном приложении:

Запустите программу и разрешите ей доступ к микрофону.
Выберите нужный язык в правом верхнем углу. Затем тапните по зеленой кнопке с микрофоном, чтобы активировать запись звука.
Проговорите текст вслух. При необходимости подправьте его, а затем кликните по желтой кнопке, чтобы остановить запись.
Нажмите на три точки справа вверху. Выберите «Сохранить как».
Напишите имя документа. Тапните «ОК». Текст заметки будет сохранен локально в программе.
Чтобы выгрузить его в память смартфона, щелкните по трем линиям вверху слева. Нажмите «Экспорт заметки». С помощью этого же меню вы можете отправить заметку в любой мессенджер, установленный на вашем телефоне, копировать или вырезать текст, найти определенные фразы, вывести заметку на печать. В разделе «Режим перевода» можно переключаться между двумя вариантами использования приложения: из речи в текст и из текста в речь.
Если вы захотите перейти в ранее созданную заметку, нажмите на три точки справа вверху и тапните «Открыть». Далее выберите документ с нужным текстом.
Чтобы зайти в настройки приложения, нажмите на три линии слева вверху и тапните по одноименному пункту. Здесь вы можете отключать автозамену по время диктовки текста, управлять заглавными буквами, настраивать интерфейс и величину шрифта.

Voice Notepad

Voice Notepad распознает более 120 языков. Надиктованный текст можно сохранить отдельным файлом на ПК, скопировать в буфер обмена, отправить на распечатку в принтер, отослать по электронной почте. Сайт также расставит за вас знаки препинания, если вы проговорите их названия голосом.

На верхней панели есть инструменты для настройки шрифта: жирный, курсив, подчеркнутый. Также здесь можно указать цвет букв и заливки, настроить абзацы и сделать списки (нумерованные и маркированные). На этом функционал заканчивается.

Единственный минус сервиса – английский интерфейс, но в нем легко разобраться:

Перейдите на сайт Voice Notepad и выберите язык распознавания на панели справа.
Щелкните по кнопке «Start» либо по иконке микрофона справа.
Запишите текст голосом. Когда закончите диктовать, нажмите «Stop». Далее отредактируйте речь, если в каких-то местах она была воспринята некорректно. Важные фразы выделите жирным, подчеркнутым шрифтом или курсивом. Добавьте при необходимости отступы для абзацев и списки.
Далее скопируйте текст в буфер обмена («Copy»); сохраните его на ПК («Download»); опубликуйте в этом же сервисе («Publish») или на своей странице в Twitter; запустите робота, который прочитает введенный текст («Play»); отправьте речь по email либо выведите его для печати на принтере («Print»). С помощью кнопки «Clear» вы можете очистить поле от надиктованного текста.

TalkTyper

В TalkTyper меньше языков для распознавания, чем в предыдущем сервисе (всего 37), но шире функционал. Здесь вы можете выбирать размер и тип шрифта, переводить текст на другие языки (с помощью сайта Google Translate), выбирать фразы и слова среди нескольких вариантов распознавания.

Текст нельзя сохранить в виде отдельного файла и скачать его на ПК. Его можно только скопировать в буфер обмена либо отправить по электронной почте или на свою страницу в Твиттере. Есть кнопка для вывода текста на принтер.

Сервис распознает в речи названия основных знаков препинания и вставляет сами значки вместо слов. Сайт полностью бесплатный – вам даже не предложат купить платную версию.

Как происходит распознавание речи в текст в TalkTyper:

Откройте сайт сервиса и выберите язык – для интерфейса и голосового набора.
Нажмите на зеленую иконку с микрофоном и разрешите сайту доступ к устройству.
Проговорите текст – сервис распознает вашу речь и запишет все в первом поле. При необходимости отредактируйте ее. Если текст был распознан некорректно, можете нажать на кнопку с тремя линиями, чтобы посмотреть другие варианты написания. Если хотите, чтоб робот сайта произнес ваши фразы, кликните по иконке с динамиком. Когда текст будет готов к сохранению, нажмите на зеленую кнопку со стрелкой – сайт переместит его во второе поле.
Если нажмете на шестеренку слева вверху, откроются настройки сервиса. Здесь вы можете отключить автосохранение надиктованного текста, выбрать тип и размер шрифта.
С помощью кнопки с тремя точками расставьте знаки препинания, если не сделали этого ранее.
Далее скопируйте текст в буфер обмена для дальнейшей его вставки в другое поле – с помощью первой кнопки с двумя листами либо за счет клавиш Ctrl+C (предварительно выделите текст мышкой). Также вы можете отправить свою речь по электронной почте либо опубликовать на своей странице в Твиттере.
С помощью последней кнопки на панели справа переведите надиктованный текст на другой язык, если есть такая необходимость. Нажмите на иконку, укажите язык в выпадающем меню и нажмите «Перевести». Вас перебросят на сайт Google Переводчика – там уже будет вставлен текст на языке оригинала и перевода.

Программы для компьютера

Для перевода устной речи в тексты можно также установить специальную программу для ПК – небольшое приложение MSpeech или более функциональный инструмент Speak A Message, который подходит для распознавания английской речи.

MSpeech

MSpeech – простой и универсальный инструмент для набора текста голосом. После остановки записи речь отправляется в буфер обмена уже в текстовом формате. Ее вы можете вставить в Word или в любую другую программу, которая предполагает работу с текстом.

Для распознавания здесь используется технология Google Voice API. Поддерживается русский, английский, украинский, корейский и некоторые другие языки. В настройках можно задать горячие клавиши для старта и остановки записи, подключить прокси-сервер, выбрать источник звука (если, например, вы используете съемный микрофон, а не встроенный), включить коррекцию текста до ее отправки в буфер обмена (замена слов, изменения первых букв предложений на прописные и т. д.).

Программа бесплатная, но вы можете отправить донат разработчику на том же сайте в разделе «Поддержать проект».

Как пользоваться приложением:

Скачайте файл и установите программу на ПК. Далее запустите ее с ярлыка на Рабочем столе. Откроется маленькое окошко. Для начала перейдите в настройки.
Здесь вы можете выбрать интерфейс программы (язык, прозрачность окна и всплывающие окна). Настроить микрофон перед записью речи, язык распознавания, подключение через прокси-сервер, горячие клавиши для включения и остановки записи. Указать способ отправки текста, включить коррекцию речи при передаче. Если вы изменили какие-либо параметры, нажмите «Сохранить настройки».
Для включения записи, кликните «Начать». Когда завершите диктовку, щелкните «Остановить».
Далее откройте любой текстовый редактор и вставьте записанную речь в поле.

Speak A Message

Speak A Message – более сложная программа для записи голосовых сообщений и перевода их в текст. Ее можно использовать только для английской, немецкой, французской или испанской речи.

Приложение использует для распознавания голоса собственный API. Для работы в ней не нужен интернет. Лучше всего подходит для записи подкастов с одновременным просмотром презентаций, так как здесь есть функция показа слайдов, сделанных в Power Point. Голосовые сообщения сохраняются в виде отдельных файлов на жестком диске ПК.

Этим инструментом можно пользоваться бесплатно. Функционал при этом будет ограничен. Версия Pro стоит 29$. В нее входят скриншоты с голосовым сопровождением, добавление голосовых комментариев к документам Microsoft Word, интеграция с Microsoft Outlook и некоторые другие опции.

Программа подходит для Windows XP, Vista, 7, 8, 8.1 и 10. У нее английский интерфейс, но мы поможем в нем разобраться:

Установите и запустите приложение. Нажмите на кнопку «Options».
Откройте общие настройки программы («General»).
Укажите язык распознавания. Кликните «ОК».
Вернитесь к главному экрану и нажмите «Record».
Проговорите фразы, которые вы хотите транскрибировать. Откройте раздел «Transcribe» внизу и щелкните «Speech to text», чтобы преобразовать голосовое сообщение в текст.
Кликните «Save transcription».
Выделите текст мышкой, кликните по нему правой кнопкой и выберите «Копировать», чтобы отправить речь в буфер обмена. Либо просто зажмите клавиши Ctrl + C.
Все голосовые записи, сделанные в этой программе, будут храниться на жестком диске ПК в разделе «Документы» на системном диске (папка «My Voice Messages»).

Мобильные приложения

Чтобы набирать обычные заметки в виде мыслей и идей, используйте приложение «Голосовые заметки» или «Написать голосом». Для транскрибации готовых аудиофайлов скачайте программу Transkript.

Написать голосом

Приложение «Написать голосом» отличается простым функционалом и современным дизайном интерфейса. Это небольшая программа для тех, кто хочет создавать в телефоне заметки, но кому лень печатать текст самостоятельно.

Заметки сохраняются локально в программе. Также их можно отправить в любой мессенджер, скопировать в буфер обмена или загрузить на Google Диск. В настройках вы можете изменить язык, параметры распознавания голоса, тему оформления, размер текста.

В программе доступна расшифровка голоса в офлайн-режиме, но в этом случае нужно предварительно загрузить языковые пакеты в приложении Google.

Как пользоваться приложением:

Запустите программу. На экране появится редактор заметки. Нажмите на синюю кнопку снизу по центру. Разрешите приложению доступ к микрофону.
Продиктуйте текст. При необходимости отредактируйте его с помощью обычной клавиатуры на телефоне. С помощью стрелки и щетки внизу слева вы можете отменить последнее действие в документе либо очистить поле. Чтобы отправить текст в мессенджер или загрузить его в Google Диск, тапните по иконке в виде самолетика.
Выберите приложение, установленное на вашем смартфоне.
Если кликните по шестеренке справа вверху, откроются настройки программы. Здесь вы можете настроить параметры распознавания: язык, варианты автозамены, расшифровка голоса офлайн. А также установить новую тему оформления и размер шрифта.
Чтобы создать новый документ с текстом, кликните по трем линиям слева вверху и нажмите на одноименный пункт. В этом меню будут также перечислены все раннее созданный заметки – вы можете открыть их в любое время.

Transkriptor

Transkriptor отличается от всех других программ, описанных в статье. Здесь обязательна регистрация – неавторизованные пользователи не смогут работать в приложении. Возможен вход через аккаунт Google.

В программу можно загрузить готовый аудиофайл для расшифровки. Также дается возможность записывать аудио через встроенный диктофон. Но и в том, и в другом случае текст заметки вы увидите только после обработки файла (она может занять несколько минут). Поддерживаются форматы файлов mp4, mp3, wav, m4a. Готовую заметку можно загрузить на Google Диск – в формате txt или pdf. Также можно поделиться текстом документа через мессенджеры.

В приложение можно загрузить первые 90 бесплатных минут записи. Далее нужно приобрести подписку. Доступны два тарифных плана:

850 рублей за 300 минут в месяц;
2120 рублей за 3000 минут в месяц.

Как работать в этой программе:

Запустите приложение и войдите в систему с помощью аккаунта Google либо зарегистрируйте учетную запись с помощью электронной почты.
Выберите вариант загрузки аудио в программу: готовый файл для расшифровки или мгновенная запись в режиме реального времени. Мы решили записать аудио.
Нажмите «Начать запись» и разрешите программе доступ к микрофону и памяти устройства.
Проговорите текст, который хотите транскрибировать. Когда закончите, тапните «Стоп» (красная кнопка). Также вы можете нажать при необходимости на «Паузу» (желтая клавиша).
Когда закончите запись аудио, тапните «Перевести в текст».
Выберите язык в выпадающем меню. Нажмите «Подтверди это».
Подождите, пока система обработает только что записанный файл с аудиозаметкой.
В итоге откроется раздел приложения «Мои транскрипции».
Если этого не произошло, кликните по трем линиям слева вверху и перейдите в одноименное меню.
При необходимости нажмите на три точки рядом с названием файла. Откроется меню. С помощью него вы можете дать другое имя документу, переместить его в другую папку или удалить.
Тапните по самому названию файла. На экране появится текст заметки. Если вам нужно его отредактировать, щелкните по карандашу справа вверху.
Внесите необходимые изменения и нажмите «Сохранить».
Чтобы загрузить текстовый документ на Google Диск, щелкните на стрелку справа внизу. Выберите формат файла.
Если указали txt, выберите программу для открытия документа в специальном меню.
Дождитесь, пока система загрузит документ на Google Диск. Если вы авторизовались в программе Transkript через электронную почту, дополнительно нужно будет ввести данные от аккаунта Google.

Голосовые заметки

«Голосовые заметки» также поддерживают распознавание голоса в офлайн-режиме, то есть программа может работать без интернета. Но перед этим нужно загрузить языковые пакеты в приложение Google.

У сервиса простой функционал – такой же, как и у приложения «Написать голосом». Им можно пользоваться бесплатно, но в этом случае будут показываться рекламные баннеры. Стоимость подписки – от 125 до 4590 рублей.

Как записать заметку голосом:

Запустите программу и нажмите на желтую кнопку с карандашом справа внизу.
Разрешите сервису доступ к микрофону. Запишите текст голосом. При необходимости отредактируйте его.
Кликните по кнопке «Поделиться» справа вверху, а затем укажите, куда отправить текст: в мессенджер, на электронную почту, в Google Диск, в буфер обмена (скопировать его, чтобы вставить в любое поле), во строенные заметки телефона и т. д.
После этого снова откроется главная страница приложения. Здесь будут располагаться все ранее созданные документы.
Если нажмете на шестеренку справа вверху, откроются настройки программы. Здесь вы можете настроить распознавание голоса, тему оформления, размер текста, размер текста в списке заметок и другие параметры.

***

Самый функциональный вариант для перевода речи в текст – онлайн-сервис Speechpad. У этого сайта есть также фирменное мобильное приложение и расширение для Google Chrome. Если вам нужно транскрибировать готовый аудиофайл с телефона, попробуйте программу Transkriptor. Мобильные варианты для быстрой фиксации идей и мыслей: «Написать голосом» и «Голосовые заметки».

Обложка: Goodfirms