No Image

Как преобразовать текст в аудиозапись

СОДЕРЖАНИЕ
4 просмотров
16 декабря 2019

Друзья! В самой первой статье нашего сайта рассказывается о трёх помощниках слабовидящим пользователям ПК, которые обеспечивают комфортную работу на компьютере, практически не напрягая глаз. Экранный диктор может прочитать любой текст на экране компьютера. Это очень удобно, но нам приходится сидеть за монитором.

Если же нам нужно, например, изучать какой- то учебник, но не хочется сидеть за компом, можно перевести текст учебника в аудиофайл, например, в MP3 и слушать его, сидя на любимом диване или в кресле. А поможет нам в этом замечательная и бесплатная программа Govorilka.

Как Вы понимаете, программа позволяет также перевести Ваши любимые электронные книги в аудиоформат и слушать их, например, в аудиоплеере, занимаясь домашними делами.

Кроме того в программе, по умолчанию, установлены дикторы с голосами на русском и английском языках, что может пригодиться Вам на начальном этапе изучения английского языка.

Вот, например, как прозвучит текст знаменитой песни Мерлин Монро.

И ещё несколько возможностей программы Govorilka.

1. Программа открывает большие текстовые файлы в кодировках DOS и Windows. Вы можете копировать и вставлять в программу тексты из файлов MS Word и HTML, причём размер этих файлов не ограничен.

2. Программа позволяет устанавливать новые голоса и пополнять словари произношений, которые позволяют корректировать произношение отдельных слов и словосочетаний.

3. Запись речи осуществляется в распространённые аудиоформаты WAV и MP3. При Записи речь автоматически разбивается на несколько аудиофайлов, что очень удобно использовать затем при прослушивании, например, в MP3-плеерах.

УСТАНОВКА ПРОГРАММЫ

Последнюю версию программу Govorilka 2.22 можно скачать с сайта разработчика по ссылке: СКАЧАТЬ Govorilka

Установка программы стандартная и не требует особых знаний компьютера. Вам лишь следует точно выполнять указания установщика.

Однако, если у Вас на компьютере ещё не был установлен экранный диктор NVDA и Вы впервые ставите Говорилку, обратите внимание на следующее:

В Windows XP и Windows Vista по-умолчанию уже установлена библиотека SAPI 5 и один американский голос. Так что английские тексты можно слушать сразу после установки программы. Русскоязычные голоса необходимо устанавливать отдельно (если они не установлены).

Оптимальная последовательность установки Говорилки:

1 1. Скачать и установить самую свежую версию Говорилки.

2. Скачать и установить (если не установлен) хороший речевой движок. Например, Acapela Elan Nikolai. Установочный пакет легко находится в Интернете поиском: acapela elan tts .

Программу вместе с речевым движком Николай можно скачать со стороннего сервиса. Но эта ссылка может быть изменена автором сайта.

Пока программу можно скачать по ссылке: СКАЧАТЬ Govorilka + Николай.

Здесь через торрент-файл можно скачать сразу:

— саму программу Govorilka 2.22,

— речевой движок Николай, полное название движка: Acapela-Elan-TTS-SpeechCube-5.1-RUS-Nicolai_MmE255,

— словарь ударений и правильных произношений для программ синтезации речи: Russian Nicolai.dic. Обновлённую версию этого словаря можно скачать также по ссылке: СКАЧАТЬ Russian Nicolai.dic.

Я рекомендую скачать программу именно с диктором Николай, потому что, на мой взгляд, это лучший на сегодня русскоговорящий диктор. Он хорошо произносит слова на русском языке, чего нельзя, правда, сказать про произношение английских слов. Но для чтения электронных книг, это лучший вариант. Вот послушайте!

Давайте рассмотрим пошаговую установку программы :

1. После скачивания программы нужно разархивировать полученный файл

2. Открыть папку с программой,

3. Установить программу Govorilka2.22. При установке желательно не изменять предлагаемую установщиком директорию.

4. Установить Acapela-Elan-TTS-SpeechCube-5.1-RUS-Nicolai_MmE255.

5. Скопировать в разархивированной ранее папке словарь Digalo Russian Nicolai.dic и вставить его в папку с программой C:Program FilesГоворилкаDic.

6. Запустить Говорилку и в окне Голос выбрать ELAN TTS Russian (Nicolai 16Khz), Если голос уже стоит то, надо выбрать любой другой, затем снова ELAN TTS Russian (Nicolai 16Khz), иначе возможны неправильные установки.

7. В окне Словари выбрать Digalo Russian Nicolai.

НАСТРОЙКА ПРОГРАММЫ

После установки программы можно зайти в меню Файл, выбрать строку Открыть и в новом окне выбрать нужный текстовый файл на Вашем компьютере.

Текст также можно вставить в окно из буфера обмена, скопировав его предварительно в другой программе или на странице интернета.

Затем нажать кнопку с треугольником и прослушать текст. Правда при этом может оказаться, что шрифт текста очень маленький, а голос еле слышен.

Однако это поправимо. Программа Govorilka имеет очень простой, удобный интерфейс. Давайте настроим программу.

1. Прежде всего, нужно нажать кнопку «Дополн.», после чего в верхней части программы откроется расширенная панель с дополнительными параметрами.

2. Здесь можно выбрать понравившийся голос, установить его громкость, высоту и скорость. Можно одновременно настроить 8 разных вариантов произношений для восьми окон.

3. На нижней строчке панели расположены 8 кнопок: от 1 до 8, которые позволяют моментально открыть любой из восьми, загруженных Вами текстов.

4. Каждый из восьми текстов можно настроить по-разному. Чтобы настроить шрифт в первом окне, нажмите кнопку 1.

5. В меню Сервис выберите строчку Настройка текущего текстового окна.

6. В открывшемся окне выберите вкладку Вид, а затем Шрифт.

7. Открывшееся окно позволит выбрать нужный шрифт и фон окна.

8. Теперь, поставив курсор в начало текста и, нажав кнопку с треугольником, Вы сможете, если захотите, следить за произносимым текстом. При этом прочитанный текст будет выделяться другим цветом.

9. Остановить чтение Вы сможете в любой момент, нажав кнопку справа от кнопки с треугольником.

ЗАПИСЬ ТЕКСТА В ЗВУКОВОЙ ФАЙЛ

Чтобы перевести текст в аудиоформат:

— откройте одну из восьми страниц, на которой находится нужный текст,

Читайте также:  Как получить права доступа к файлу

— на панели управления, слева от кнопки «Дополн.» найдите и нажмите кнопку со значком плеера,

— в открывшемся окне, в строке Выходной файл выберите папку для сохранения и введите название будущего аудиофайла,

— при записи текстов большого размера аудио будет разбита на несколько файлов. Размер каждой части можно выбрать в строке Размер части: от 1 Мб до 512 Мб,

— нажмите OK,

— в новом открывшемся окне Вы сможете контролировать процесс записи. В результате в заданную Вами папку будут выведены один или несколько аудиофайлов Вашего текста.

Теперь Вы можете не смотреть на экран, изучая какой-нибудь учебник и не сидеть за компьютером читая любимую электронную книгу.

Чтобы слушать тексты на плеере, записывайте аудиофайла небольшого размера. А объёма в 512 Мб хватит на внушительный текст, который можно прослушать с компьютера, сидя в удобном кресле.

А пока, садитесь по удобнее и послушайте, как некоторые умельцы научили петь Говорилку:

Программа Govorilka является простой, но довольно эффективной программой. Если Вы в ней разобрались, то теперь сможете с лёгкостью освоить программу Балаболка.

Это программа, мне кажется немного сложнее, но имеет больше функций. В частности возможность использования голосов на других языках кроме русского и английского, например, можно установить диктора на французском и даже украинском языках. Балаболка также является бесплатной программой.

Для записи аудиофайлов из текста Вы также можете использовать платную программу BookMania, которая была создана специально для записи аудиофайлов из текста.

Желаю всем удачи, и берегите своё зрение!

Если Вам понадобился перевод аудио в текст, то Вам понадобятся программы для транскрибации. Можно конечно, и вручную переводить. Точнее “в ушную” 🙂 Но, согласитесь, это как-то сильно уж неправильно… Хотя я лично знаю таких вундеркиндов, которые зарабатывали на транскрибации без всяких программ некоторое время. Просто потому, что не знали, что они существуют 🙂 Но я отвлекся…

Итак. Для транскрибации, то есть перевода голоса в текст, можно использовать или программы, или специальные онлайн сервисы. Или комплексный вариант, оффлайн-программа + онлайн-сервис. Сейчас я расскажу, какие программы и сервисы для расшифровки аудиозаписей я знаю.

Содержание статьи:

Небольшое замечание! Я убрал ссылки на конкретные программы из текста статьи. Почему? Дело в том, что некоторые программы изменили ссылки. Другие выпустили новые версии. Короче, я это сделал, чтобы Вас не путать. Все указанные ниже программы легко находятся путем “загугливания” 🙂 . В крайнем случае напишите мне – подскажу..

Транскрибация вручную

Если Вы хотите экстрима, то попробуйте перевести речь в текст вручную. Даже если Вы планируете в дальнейшем для транскрибации активно использовать программы или сайты, о которых я расскажу ниже, все равно попробуйте это поделать “ручками”. Точнее “ушками”.

Это достаточно сложно. Точнее, технически-то, как раз ничего сложного нет. Берете аудиозапись, прослушиваете несколько секунд. Записываете. Возвращаетесь. Слушаете снова. Проверяете, все ли верно записали. И так следующий кусок. То есть, идея простая.

Сложность заключается в том, что сразу запомнить большой объем информации очень сложно. Вы играли когда-либо в “глухие телефончики”? 🙂 Вот такой же итог часто получается в случае “ручной транскрибации”, когда “переводчик” пытается запомнить сразу много информации.

Так зачем же я Вам советую попробовать ручную расшифровку аудио в текст? Дело в том, что какие-бы ни были классные программы для транскрибирования, о которых я буду рассказывать дальше, иногда они не могут помочь. Например:

  • В комнате шумно
  • Диктор говорит тихо
  • Диктор говорит с сильным акцентов
  • У диктора “фефекты фикции”
  • Записан на плохой микрофон
  • Одновременно говорит много людей
  • Диктор “вклинивает” иностранные фразы. Или малоупотребительные

Короче, “кочек”, на которых может застопориться Ваша программа масса. И в этом случае нужно подключать транскрибацию “вручную”.

Субтитры Ютуб

Если Вам лень устанавливать какие-либо программы, а Вам нужно срочно провести транскрибацию аудиозаписи в текст, то… то просто воспользуйтесь Ютубом. Точнее субтитрами Ютуб. Как это сделать? Все просто.

Шаг 1. Залейте видео на свой канал Ютуб.

Шаг 2. Включите субтитры

Шаг 3. Нажать кнопку “Посмотреть расшифровку видео”

Шаг 4. Копируйте себе в блокнот полученный текст.

Шаг 5. Удалите метки времени и “причешите текст. Вот и все.

Субтитры Ютуб создает достаточно качественные. Единственное, много времени уходит на приведение текста в порядок. Но и в других программах, расстановка знаков препинания и приведение текста к нормальному виду тоже нужно делать. Так что…

Программа Express Scribe (Экспресс Скрайб)

Это наверное, одна из самых популярных программ для транскрибации

Программа на английском языку, но она интуитивно понятна. Кроме того, есть масса инструкций на Ютубе, как работать в ней.

В этой программе можно переводить аудиофайлы в текст. Эта программа позволяет удобно корректировать текст, изменять скорость прокрутки аудио. Можно поставить медленную скорость для того, чтобы писать под диктовку. Есть горячие клавиши для ускорения, пауз, перемотки и т.п. Можно делать метки тайм-кодов.

Express Scribe поддерживает все известные мне (и не известные 🙂 ) аудиофайлы… Без проблем интегрируется с Вордом. Короче, работать с программой очень приятно и удобно.

Но… она ограниченно бесплатная. То есть, некоторое время ей можно пользоваться, а потом она перестает работать. Нужно покупать. Или удалять и ставить заново. Если Вы собираетесь профессионально зарабатывать, то можно и потратиться на пробретение Экспресс Скрайб.

Программа Lossplay

Вот еще одна программа для профессиональной расшифровки аудиофайлов. Программа ЛоссПлей. Это плеер от “нашего” разработчика. Поэтому удобен для русскоязычного транскрибатора.

Читайте также:  Как выяснить где находится абонент

Программа идеально подходит для новичка, который занимается расшифровкой аудио. В программе есть удобные быстрые клавиши.Этот плеер для транскрибации легко интегрируется с Word. Можно вставлять тайм-коды. Поддерживается огромное количество форматов аудиофайлов. Регулировка скорости воспроизведения. И многое-многое другое. Есть видеоуроки!

Сайт и программа Speechpad (Спичпэд)

Еще одна, любимая многими программа и одновременно онлайн-сервис. Голосовой блокнот Speechpad.

Можно заниматься транскрибацией прямо онлайн. На сайте. Можно установить расширение для Гугл Хром. Можно интегрировать это все в операционную систему для ввода в нужные программы. Кстати, это одна из немногих программ, которая работает в моем любимом Линукс Минт!

Вообще, функционал сервиса SpeechPad воистину огромен. Давайте посмотрим на него внимательней:

  • Голосовой набор текста с микрофона. Кстати, этот сервис один из лидеров по правильному распознаванию речи (на мой взгляд). Ввод текста идет синхронно “говорению”. Можно по ходу сразу же править текст и вставлять знаки препинания.
  • Транскрибация с аудиофайла или прямо с ролика Ютуб. Достаточно указать путь к аудиофайлу или видеоролику, включить транскрибатор, и начнется перевод. Правда, у меня почему-то не всегда получается это с первого раза. Может, потому что стоит Линукс.
  • Есть озвучивание субтитров. Да и простого текста. Используется голос Гугл переводчика. Немного коряво, но в принципе “слушательно”
  • Можно делать проверку произношения. Это пригодится тем, кто изучает иностранный язык

Если внимательно посмотреть, то можно много чего еще найти в сервисе для перевода аудио в текст SpeechPad. Есть подробные видеоуроки по каждому пункту. Есть просто подсказки. Можно сохранить готовый текст в файлы.

И да, он тоже бесплатен! Во всяком случае, на момент написания данной статьи!

Онлайн-сервис dictation.io

Этот сервис для перевода аудио в текст не может подключать аудиофайлы или видеофайлы. Тут для транскрибации нужно проиграть аудиофайл на другом устройстве, и записать на микрофон в dictation.io.

Чем же хорош это сервис для перевода аудио в текст? Своей лаконичностью. Ничего лишнего! И, кстати, качество распознавания речи вполне себе на уровне! Удобно сохранять распознанный текст на компьютер. Сервис полностью бесплатный. Жалко только, что нельзя транскрибировать аудиофайлы

Сайт и программа RealSpeaker

Нужно знать, что сейчас оффлайн версии, то есть, программы для транскрибации ReaLSpeaker уже нет. Если Вы хотите пользоваться именно программой, то ищите старую версию.

Сейчас же можно работать только в режиме онлайн-сервиса.

Некоторым транскрибаторам эта программа (и сайт) очень нравится. Некоторым не очень. Я предлагаю Вам ответить на этот вопрос самостоятельно. Потестируйте немного ее, и узнаете.

В плюсы Реалспикера можно отнести то, что она работает с загруженными аудиофайлами. Есть много языков, которые RealSpeaker понимает. Из минусов – программа и сервис платные. Правда цена не очень высокая, но все-таки…

Программа Transcriber-pro

Еще одна офф-лайн профессиональная программа для расшифровки аудио и видео записей. С помощью Transcriber – pro Вы легко переведете аудио в текст!

Эта программа для транскрибации достаточно удобна. Есть горячие клавиши. Можно загружать аудио и видеофайлы и их заниматься переводом аудио в текст. Одна из “фишек” Транскрибера – Про – это командная работа над проектом. Единственное, эта программа не умеет распознавать речь. Это узкоспециализированный инструмент, предназначенный только для транскрибации!

Программа RSPlayer

Многие хвалят эту программу для профессиональной транскрибации.

Однако, сейчас официальный сайт этой программы не работает. Может в ближайшем будущем эта программа возродится вновь, но пока я сделать обзор на нее не могу. Если где-то найдете старую рабочую версию РСплеера, проверьте на вирусы. Рекомендую 🙂

Приложение Windows – VOCO

Эта программа распознавания речи профессионального уровня.

Основной функционал Windows-приложения перевода аудио в текст VOCO:

  • Голосовой набор текста с микрофона
  • Расстановка знаков препинания устными командами
  • Распознавание знаков препинания в аудиофайлах. Это круто!
  • Само-собой есть распознавание речи из аудиозаписей.
  • Есть сопряжение с Word
  • Можно подключать словари
  • Ну и есть свой, достаточно большой словарный запас

Короче, программа просто находка для профессионального транскрибатора! Но программа платная! Правда, есть демо-версия, в которой Вы можете ознакомиться с основным функционалом бесплатно. Правда, нужно подать заявку скачивание демо-версии Voco.

Программа Virtual Audio Cable

Для некоторых сервисов (например, для speechpad.ru) может понадобиться так называемый виртуальный кабель. Он нужен для того, чтобы напрямую передать аудиофайл в систему распознавания аудио, а не транслировать через микрофон. То есть, чтобы не терялось качество речи и все распознавалось как можно лучше.

Для настройки всего этого дела придется потанцевать с бубнами, то есть повозиться с настройками. Но, как я писал выше, некоторые программы без этой Virtual Audio Cable работать не будут.

К сожалению, проконсультировать по поводу настройки этих виртуальных кабелей я не смогу. У меня базовая система Линукс Минт. А эти программы предназначены для Windows. Впрочем, если будет интересно, скину ссылки на статьи других авторов, где все подробненько расписано.

Гугл Документы

На последнем месте в списке стоят гугл документы. Но не на последнем месте по значимости. В гугл документах тоже есть голосовой ввод!

Кстати, этот голосовой ввод работает на удивление очень хорошо. Вы даже можете голосом расставлять знаки препинания. К сожалению, сюда нельзя подключить аудиофайлы для прямой транскрибации. Только “динамик-к-микрофону”. Качество перевода аудио в текст при этом может пострадать. Зато Гугл Документы совершенно бесплатны!

А в этой статье я рассказываю, как заработать на транскрибации. Нажмите сюда для чтения статьи!

Итого:

Теперь Вы знаете, какие есть программы для транскрибатора, то есть для перевода аудио в текст. Возможно, есть еще что-то, что я не знаю. Тогда напишите мне о них и я расскажу об этом! И еще. Я не рассказывал про мобильные приложения для расшифровки аудиофайлов. Почему? Потому что, такие программы для смартфонов нужны в основном для записи своих мыслей простым людям, а также журналистам и писателям. профессиональные транскрибаторы мобильными программами практически не пользуются.

Вот здесь Вы можете познакомиться с моим курсом по заработку на транскрибации .

Да и с другими способами заработка в интернете. Ну и чтобы не пропустить выход нового курса (на случай, если курса еще нет) вступите в эту группу Вконтакте . Туда я сообщаю о новостях

Читайте также:  Как подключить вай фай на стационарном компьютере

Посмотрите на видео ниже, как это выглядит “вживую”.

Кстати, я собрал все свои бесплатные видеоуроки в одном месте. Вот тут – ТЫНЦ СЮДА ! Теперь Вы можете посмотреть все на одной станице! Желаю полезного просмотра!

Обычно Google translate используют для перевода речи транслируемой микрофоном.

Но в один момент, автору потребовалось перевести подкаст Медузы в текст.

Идея лежала на поверхности и наверняка программы для этого должны были присутствовать. Так -же как сделано в Gogle translate.

Но, гуглением, программы не нашлось, кроме двух сайтов. Которые использовали по уверениям их авторов всю мощь искусственного интеллекта Google.

Но, как бы не было обидно, магия не сработала.

Результат — тот же. Но, было в отличие от предыдущего — объяснение.

Там было показано, как реализовать, казалось бы, простую идею: пустить в качестве сигнала микрофона — аудио файл.

Для этого необходим драйвер VB-CABLE Virtual Audio Device Он OpenSourse.

Искренняя благодарность "прогнившим западным" альтруистам!

Устанавливаем (проверено под Win 10) и настраиваем микрофонный вход в системе, на этот драйвер.

Открываем Gogle translate, нажимаем кнопочку с изображением микрофона и запускаем любой плейер с аудио — файлом.

И — Вааля! Магия работает, на ваших глазах появляются строки текста.

Точность распознавания, на глаз 85-97 %. Но, есть ограничение — 5 тыс. символов, что немало. Поэтому приходиться останавливать запись, копировать текст и продолжать далее.

Заодно происходит перевод на второй выбранный язык. О боже, сколько странных переводов появится!

Дополнение: есть способ без ограничений на количество символов. — это Google Docs, он так-же работает но, только без перевода на второй язык. Спасибо dioneo

Как мне кажется, Google блокирует постоянные подключения с одних IP. Поэтому ценность этого способа — в том, что все IP не заблокируешь и соответственно, этот способ более работоспособен. Тут уже слово разработчикам и большим "гуру", чем автор.

Всем добра и удобства.

Читают сейчас

Похожие публикации

  • 4 декабря 2014 в 12:11

Учимся работать с новым Google Translate Community

Обновление Google Translate (части речи и синонимы)

В Gmail и Google Docs появилось распознавание рукописного текста

Вакансии

AdBlock похитил этот баннер, но баннеры не зубы — отрастут

Комментарии 28

Да! Спасибо это ценно .

Да не работает этот API нормально. В свое время прикрутил Web Speech API для распознавания записей Call-центра, чтобы можно было анализировать качество ответов операторов без прослушивания каждой записи. Думали, прочитаем расшифровку разговора, и поймем: есть ли косяки и нужно ли переслушивать уже детально. Но качество таково, что понять даже смысл разговора не получается. Выглядит расшифровка воn так (звездочками заменил все персданные, и это — прям реальный разговор вчерашнего дня). Текст сохранен именно в такой форме, как он возвращается из API. Разбивку на фразы — тоже делает Google, точнее — пытается.

  • Здравствуйте Вы позвонили в интернет магазин **** Меня зовут Юрий нас не могу вам помочь Я хотела спросить Просто я сделал заказ и Перенесли доставку Они снимают доставление можно как-то проверить на пункт самовывоза могу я заехать забрать или его ещё ко мне скажите пожалуйста как я поняла вы пункт самовывоза заказов потом позвонили сказали что у меня больше не фармации какой-нибудь полмесяца ночь не успевая и поехала к животному значит Скажи погоду на Лукина 1 с
  • слушать прямо на дракончика когда посмотри уродина ***** ****** до 1 1 ЛСР
  • Светлана 1 с
  • хорошо есть возможность заказа тошнить
  • Мутко
  • Скажи пожалуйста относительно вашего заказа Вам пришло сообщение о том что она Он поступил в комп самовывоза это название он ничего не пришло хорошо договоримся доставки На какой день было ** ** да да
  • прошу минуту пожалуйста оставайтесь на линии 2 связаться с руководителем уточнить формат исполком заказа
  • да да да да да ты поняла запрос сейчас позвонить в детскую службу узнаю по поводу наличие перезвоню когда вам хорошо спасибо пожалуйста

Ну и что из этого можно понять? 🙂 Список «плюс»-слов естественно сформирован и передается в Web Speech API, но совершенно не помагает.

Ну и что из этого можно понять?

Это частности. А вот суть разговора можете понять? О чем это? Попробуйте выдвинуть гипотезу, я потом расскажу правду. 🙂

Ну и плюс — конечно, догадаться о каждой фразе можно. Вопрос только что быстрее: пытаться в голове декодировать этот текст, или потратить 3:23 на прослушивание записи? Ведь задача была быстрее, чем при прослушивании, понимать, насколько корректно оператор Call-центра отрабатывает скрипт.

Комментировать
4 просмотров
Комментариев нет, будьте первым кто его оставит

Это интересно
No Image Компьютеры
0 комментариев
No Image Компьютеры
0 комментариев
No Image Компьютеры
0 комментариев
Adblock detector