Программы чтения текста (речевые синтезаторы)

Создал | Раздел , | Когда: 16:20


Недавно посмотрел новости, передавали что появилась новая программа для перевода текстовой информации в речевую. Называется синтезатор речи или читалка. По телевизору эта программа говорила не хуже человека.

Я решил найти самую последнюю версию похожей программы чтобы проверить её возможности.

Докапаться до правды и узнать насколько далеко шагнуло человечество в создании искусственного интеллекта!


На деле всё было не так просто, как выглядело на тв. Я не буду рассказывать о таких примитивных программах как Горыныч или Говорилка, это пережиток прошлого, и без сурдопереводчика не понять - чем пытается прочитать программа, написанный тобой текст.

Пришлось много разбираться чтобы найти что-то схожее с тв-версией программы. В итоге оказалось что: Программы для синтеза речи состоят из нескольких независимых компонентов. И чтобы компьютер начал читать мой текст, необходимо установить несколько независимых компонентов: Движок программы (Text to Speech/TTS), Синтезатор речи (Для TTS голосовую речь в виде диктора) и оболочку программы - через которую управлять этим (совершенно любую, я пробовал TalkerPro и TextAloud).

Более того, эти компоненты находятся в открытом коде, и можно править их самостоятельно, доводя речь диктора до совершенства, и создавая словари для синтезатора.
Я решил опубликовать наиболее достойные разработки синтеза речи. Российские разработчики этим не занимаются, а занимаются лишь крупные иностранные компании. Поэтому русскоязычных программ для превращения текста в речь не много.

В итоге мой взор пал на 3 компании, у которых есть синтезаторы речи и движки. Это:Nuance.com (Речевой синтезатор "Катерина" СканСофт);
Acapela-group.com (Речевые синтезаторы "Алёна" и "Николай")
и Loquendo.com (голос "Дмитрий" и "Ольга").
Также для сравнения я продемонстрирую возможности устаревшей компании Sakrament.com (Синтезатор "Ольга").

Компания Acapela-group.com
Голос "Алёна"


Голос "Николай" 16Khz


Это самый последний синтезатор искусственной речи, который я смог найти в интернете. Дата создания: конец 2008г для "Алёны". Правда у меня возникли большие трудности в установке этой программы на компьютер. На сайте компании есть он-лайн синтезатор, где можно протестировать его. Но чтобы установить его у себя, потребуется установить TTS Infovox Desktop 2.2, который отказался у меня устанавливаться. И пришлось его искать на других пиратских сайтах. Сам синтезатор речи "Алёна" занимает 150Мб до установки!

Частота звука у синтезатора "Алёна" 22Khz (2008г), а у синтезатора "Николай" 16Khz (2005г). Это заметная разница при прослушивании. После установки, появляется собственная оболочка для работы с диктором, называется SpeechPad - работает только с "Алёной". "Николай" можно скачать в полном архиве всех синтезаторов, внизу темы. На сайте Акапелла, его не найти.


Компания Nuance.com СканСофт
Голос "Катерина"


На сайте компании, также имеется онлайн синтезатор, где можно протестировать его самостоятельно. Правда там находится другой голос - Милена (скачать можно отсюда - http://mytts.forum2x2.r...). И сам синтезатор переименован теперь в Vocalizer5, всё же движок не изменился, читает не лучше Катерины. Дата: около 2008 года, хотя не уверен. С самой программой трудностей у меня не возникло, необходимо было установить лишь сам синтезатор речи "Катерина" и она заработала во всех голосовых читалках. Также нашёл ещё один синтезатор "Катерина 2" - читает не плохо, но почему то чувство что обкурилась баба, смеялся до слёз. Данный синтезатор отличается от синтезатора в архиве внизу темы.
Голос "катерина 2"


Компания Loquendo
Синтезатор "Ольга"


Синтезатор "Дмитрий" лишь демо.


На сайте есть онлайн синтезатор, правда у меня отказался работать. Синтезаторы работают на частоте 32Khz. Сам движок от компании Loquendo и синтезатор "Ольга" появились давно, около 2008 года. А "Дмитрий" гораздо позже, в середине 2009 года, поэтому это самый последний синтезатор речи, который я смог найти. Установка не трудная, скачать движок и голос "Ольга" можно здесь (торрент). После установки, появляется собственная программная оболочка для работы с голосом, называется Loquendo TTS 7 Director. Синтезатор "Дмитрия" я так и не смог найти, возможно это его голос и звучал по тв. Лицензионная версия стоит огромных денег, поэтому буду ждать когда хакеры опубликуют его движок в открытом месте.


Компания Sakrament.com
Голос "Ольга"


Эта версия программы прошлого поколения, демонстрирую для смеха, версия 2000-х годов. Трудности в установки нет. На сайте онлайн копии нет. Больше всего потребовалось устанавливать дополнительных программ и отдельных движков, чтобы она заработала.

Увы, более стоящего я найти не смог, возможно плохо искал, хотя потратил много времени. Ходил по небезопасным сайтам, где было много вирусов. Поэтому не советую повторять мои подвиги без антивируса. Архив со всеми программами для речи, находится ниже.
Заметил особенность: В зависимости от программы оболочки, в которой вводится текст - произношение дикторов меняется. Не стоит устанавливать все движки и синтезаторы сразу. Кто знает что-то лучшее в достижении науки - пишите ниже.
Подробнее узнать о речевых движках или голосовых синтезаторах - здесь или здесь или здесь


Добавлено 30 мая:
Уже после написания темы я наконец нашёл тот речевой движок, о котором говорилось по тв. Это сайт ЦРТ - центр реч. технологий. Онлайн демо синтезатора Vital Voice. Петербургская разработка.



Добавлено 10 марта 2011 года:

[ссылка] Архив со всеми программами и инструкциями (кроме Дмитрия Локвендо и Владимира ЦРТ), 400Мб
Быстрое озвучивание текста носителями языка - Alconost.com.

Не схожие статьи:

Комментарии (72)

Отправить комментарий

Напишите своё мнение, просьба свою почту не указывать! И не будьте анонимусами!