自然发声的文字到语音?
我正在寻找一些易于安装的Ubuntu文本到语音软件听起来很自然。 我安装了Festival
, Gespeaker
等,但没有什么听起来很自然。 所有非常合成和难以理解。
有什么建议吗?
SVOX pico2wave
除了其他答案:
非常简约的TTS,比espeak或mbrola(在我看来)更好的声音。
一些信息:
https://launchpad.net/ubuntu/precise/+source/svox/
我不明白为什么pico2wave与espeak或mbrola相比,很少讨论。 它很小,但听起来真的很好(自然)。 没有修改,你会听到一个自然发声的女声。
AND …与Mbrola相比,它识别单位并以正确的方式说出来!
例如:
- 2°C→两度
- 2米→两米
- 2kg→两公斤
安装后我在脚本中使用它:
#!/bin/bash pico2wave -l=de-DE -w=/tmp/test.wav "$1" aplay /tmp/test.wav rm /tmp/test.wav
然后使用所需的文本运行它:
.sh "hello world"
或者读取整个文件的内容:
.sh "$(cat )"
这就是在Ubuntu上拥有轻量级,稳定的TTS。
我相信我已经使用名为“SpeakIt”的Google Chrome扩展程序免费找到了最好的TTS软件。 这只适用于Ubuntu上的Chrome浏览器。 由于某种原因,它不适用于Chromium。 SpeakIt带有两个女性声音,与其他所有声音相比,听起来非常逼真。 如果您使用“TTS”作为查询搜索Chrome网上应用店,则Chrome扩展程序中至少会列出四个男声和女声。
用于网站。 您突出显示要阅读的文本,右键单击“SpeakIt”或单击Chrome顶部栏上停靠的SpeakIt图标。
Firefox用户也有两种选择。 在Firefox插件中,搜索TTS,您应该找到“Click Speak”和“Text to Voice”。 声音不如Chrome SpeakIt声音好,但绝对可用。
SpeakIt扩展使用iSpeech技术,每年20美元的价格,该网站可以将文本转换为MP3音频文件。 您可以输入文本,URL,RSS源以及TXT,DOC和PDF等文档并输出到MP3。 你可以制作播客,嵌入音频等。这是一个链接……
http://www.ispeech.org/free.text.to.speech.tts.software
和他们的音频样本(不知道链接将持续多长时间)……
简单的Google™TTS
由于缺乏更好的替代方案,我编写了一个bash脚本 ,它与Michal Fapso的perl脚本连接 ,通过Google Translate提供TTS。 从项目描述:
目的是通过谷歌的语音合成系统为文本到语音输出提供一个易于使用的界面。 如果没有找到Internet连接,使用pico2wave的后备选项会自动提供TTS合成。
就目前而言,包装器支持从标准输入,纯文本文件和X选择(突出显示的文本)中读取。
主要特点是:
- 在线TTS合成通过谷歌翻译
- 通过pico2wave进行离线TTS合成
- 支持各种不同的语言
- 可以从CLI,文本文件和突出显示的文本中读取
- 支持使用固定格式读取突出显示的文本(例如PDF文件)
安装和使用记录在项目页面上 。
如果你尝试一下,我会很高兴的。 欢迎提供错误报告和任何其他反馈 !
对于高质量的Ubuntu,我的文本到语音高低不一。 空无一人。 我的声带瘫痪了,所以我需要TTS为我的Ubuntuvideo添加语音指令。 你可以在这里获得商业高质量的Linux文本到语音软件: http : //wizzardsoftware.com/att_desktop_overview.php这真的很贵。 我最终以40美元的价格购买了Natural Reader for Windows(不能在Ubuntu下使用Wine)。 也许以后我会得到Linux。
我希望有所帮助。
我一直在研究最好的声音和容易调整的文本到语音的声音。 下面列出了我认为按音质排序的前五大产品。 与这些产品相关的大多数网站都有一个交互式演示,可以让您自己做出决定。
- NeoSpeech
- 伊沃娜
- Acapela
- AT&T自然的声音
- CereProc的声音
Pico和espeak很有趣,很容易上class,但它们并不是那么好。 默认的节日声音也不是那么好。 然而,Festival是一个基于方案的语音框架,许多研究人员已经建立了更好的插件语音。 您可以轻松超越Ubuntu的pico2wave质量,因为其中一种声音可作为现成的包装提供。
为了让音乐节听起来自然,这里是做什么的:
sudo apt-get install festival sudo apt-get install festvox-us-slt-hts festival -i festival> (voice_cmu_us_slt_arctic_hts) festival> (SayText "Don't hate me, I'm just doing my job!")
您可以使用-b
(或--batch
)从命令行执行此操作,并将每个命令放入单引号中:
festival -b '(voice_cmu_us_slt_arctic_hts)' \ '(SayText "The temperature is 22 degrees centigrade and there is a slight breeze from the west.")'
您可以从Nitech存储库中获得其他相当好的声音,但安装它们很挑剔,并且默认路径已更改,因此可能需要手动编辑捆绑的方案文件中的文件名引用以处理库存Ubuntu。
将SVOX工具(pico)与LibreOffice结合使用:
SVOX(微微)工具易于安装,并在Ubuntu中带来高质量的声音。 安装它:
sudo apt-get install libttspico0 libttspico-utils libttspico-data
您可以将LibreOffice与SVOX(微微)工具结合使用,安装“Read Text”扩展,并获得这个优秀TTS软件的“GUI”:
使用Tools – Add-ons 设置Read Text Extension的选项 – 读取选择….使用/ usr / bin / python作为外部程序。 选择包含令牌(PICO_READ_TEXT_PY)的命令行选项,您可能想要尝试其中一些。
现在你只需要在LO Writer,Calc,Impress或Draw中选择一些文字,然后在添加为工具栏的图标上选择clic(带有气球的快乐脸)。
我发现Nitech HTS在节日上的声音非常自然,并且比我听过的任何其他声音更令人安慰。 请参阅此链接 ,了解如何使用festival设置Nitech和其他声音。 我没有找到一个好的gui,我可以使用它来配置这些声音,但通过festival.scm设置仍然有效。 该post很老,您可能希望使用“locate festival”命令找到实际的安装目录
以下是我为pdf和其他文本文件提供纯自然语音所做的工作(其他解决方案不是自然的,或者它们只是付费服务)。 这实际上是使用铬或铬的工作,但工作快速简便。
- 安装SpeakIt! 铬或铬的延伸。
- 如果您正在使用铬(Chrome已经免费提供pdf查看器),请安装PDF Viewer ,并在chrome的扩展设置中选中“允许隐身”和“允许访问文件URL”选项。
- 将pdf拖放到浏览器中。
- 现在突出显示一些文本并右键单击并选择SpeakIt! 所以你可以听纯自然的文本到语音。
还有一些方法可以在chrome中打开像.doc和.txt这样的其他文件并执行相同的操作。 Chrome的其他扩展程序可以查看pdf文件,检查它是否更适合您。 此外,您可以在Google云端硬盘中上传所有类型的文字并使用SpeakIt! 为你读它。 另一个名为“Speak text”的扩展以相同的方式工作并具有自然语音。
当搜索更好的tts引擎与新的firefox 49叙述模式一起使用时,我发现了pico tts (svox) – 我最喜欢的TTS引擎。
sudo apt install espeak libttspico0 libttspico-data libttspico-utils
如何更改系统的默认语音合成引擎?
arch linux的人们把我带到了正确的道路上( https://bbs.archlinux.org/viewtopic.php?id=217411 ):
取消注释您喜欢的模块并将其设置为语音调度程序设置中的默认值:
#> vim /etc/speech-dispatcher/speechd.conf [...] # -----OUTPUT MODULES CONFIGURATION----- # Each AddModule line loads an output module. #AddModule "espeak" "sd_espeak" "espeak.conf" AddModule "pico-generic" "sd_generic" "pico-generic.conf" [...] #DefaultModule espeak DefaultModule pico-generic
重启守护进程:
#> sudo systemctl restart speech-dispatcher.service
但是,当再次启动Firefox时,没有任何反应。 根据上面的链接(拱论坛post#10和#16)与节日合作(没试过),但pico的语音调度员没有列出可用的声音。 它不会运行。
任何想法都会受到高度赞赏;-)
我最喜欢的文本到语音转换程序叫做Magic English,但是和Joe Steiger提到的Natural Reader一样,它是一个Windows程序,我不确定它是否会在Wine下运行。
AT&T Natural Voices可作为演示在线提供,但这更像是一种解决方案而非解决方案……
为此,我为Google Chrome构建了智能扬声器 – 扩展程序。 它甚至可以在没有选择的情况下读取页面(当文本滞留正确时)。
谷歌TTS
Pico,mbrola,cmu,festival,flite,2017年所有的SUCK(它们在90年代都令人惊叹)。 AT&T自然语音(这太棒了)不是linux compat而且它不是免费的,因此我们使用谷歌
git clone https://github.com/Glutanimate/simple-google-tts.git sudo apt install xsel libnotify-bin libttspico0 libttspico-utils libttspico-data libwww-perl libwww-mechanize-perl libhtml-tree-perl so$ cd simple-google-tts sudo ln -s `pwd`/simple_google_tts /usr/local/bin simple_google_tts en "Text to speech is now installed" cd -