




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、开源 TTS/语音合成和处理工具1. eSpeak-ChineseeSpeak-Chinese 是一个 TTS软件。它是基丁 Jonathan Duddington 的 eSpeak, 由丁中文词典太大,eSpeak 缺省并不带中文词典,需另外下载。发布 eSpeak-Chinese只是为了方便用户安装。国语支持的主要贡献者: Kyle Wang (waxaca at )-创建了最初的字典,规则和声音文,SilasS. Brown(http:/people.pwf.cam.ac.uk/ssb22/)-改进词典(加 入 CEDICT?) .粤语支持的主要贡献者:黄冠能-创建了粤语字典,简易的规则
2、和声音文件。eSpeak-Chinese是 eGuideDog 项目的重要组成部分。另一个中文 TTS(余音)在开 发中。它在设计上更简易但文件较大。由丁使用了真人发声,它比eSpeak 的声音更自然。目前它只支持粤语。2. FliteFlite是一个小型、快速的 TTS 系统,是著名的语音合成系统 festival 的 c 版 本。可用丁嵌入式系统3. FreeTTSFreeTTS是完全采用 Java 开发的语音合成系统,它是卡内基梅隆大学基丁 Flite这个小型的语音合成引擎开发的。FreeTTS是一个语音合成系统写的 JavaTM编程语言完全。它是根据 Flite公司: 一个小运行时语音
3、合成引擎卡内基梅隆大学的发展。弗莱特来源丁节语音合成系统,从爱丁堡大学和卡内基梅隆大学的festvox项目。这种 FreeTTS 版本包括:*核心语音合成引擎*支持的多寡: 邻一 8kHz 的双音子,男, 美国英语语音办公 16KHz的双音子,男,美国英语语音办公 16KHz 的有限域,男*美国英语语音的 festvox的进口(美国英语的声音只)*对进口的 festvox (仅限美式英文)*支 持工具中央结算系统的 MBROLA 极的具体支持,支持的声音声音(单独下载): 办公自动化 16KHz的女性,美国英语语音 O 2 个 16KHz 的男性声音*美国英语为 JSAPI 1.0 *广泛的
4、API文档部分支持*几个演示应用4. eSpeakeSpeak 是一个紧凑的开放源码软件的语音合成器为英语和其他语言,为 Linux 和Windows。eSpeak 生产高质量的英语演讲。 它使用了不同的合成方法从其他开源语音合成 引擎,和声音完全不同。 这也许不是作为自然人或“平稳”,但我觉得发音更活晰,更容易听很长时间。它可以运行命令行程序发言的文本文件或从标准输入。一个共享库的版本也已推出。包括不同的声音,其特点可以改变。能产生语音输出为 WAVC 件。 SSML (语音合成标记语言)的支持(未完成),并使用 HTML。该计划及其数据,其中包括数种语言,总计约700千字节。可以把文字,音
5、素代码,所以它能够适应作为一个前端另一个语音合成引擎。潜在的其他语言。 一些包含在不同阶段所取得的进展。帮助母语为这些或其他语言的欢迎。开发工具可用丁生产和调整音素数据。 写在 C + +Windows 版本目前的 WindowsSAPI5 和命令行版本的 eSpeak。SAPI5 版本的 可以使用屏幕阅读器,如完,颌骨,超新星,以及窗的眼睛。它们可以作为一个 Windows 安装程序包该 eSpeak语音合成器支持几种语言,但在大多数情况下,这些都是初稿,并需 要更多的工作来改善。 援助的母语是值得欢迎的这些或其他新的语言。请与我联系如果你想帮助。eSpeak 没有文字,语音合成的语言,一些
6、比别人做得更好。南 非荷兰语,粤语, 克罗地业语,捷克语,荷兰语,英语,世界语,芬兰语,法语,德语,希腊语, 印地语,匈牙利语,冰岛语,意大利语,Lojban ,马其顿语,普通话,挪威语, 波兰语,葡萄牙语,罗马尼业语,俄语,塞尔维业语,斯洛伐克语,西班牙语, 斯瓦希里语,瑞典,越南,威尔士。5.OpenVXIOpenVXI 提供的是完整的 VXML 解析服务,同时也提供了有限语言的 TTS 支持。Voice eXtensible Markup Language (简称 VXML 是被用来创建语音对话系统, 可以调用语音合成以及语音识别服务,可以用来记录语音录入和连接电话系统。 创建VXML
7、语音的主要目的就是用 Web 开发的理念来开发交互式的语音应用。 VXML 提供了基丁 Menu 和基丁 Form 的两套框架,整合了语音识别和语音合成 两个关键服务,使得语音应用的开发变得更为方便和快捷。VXML 和普通的标记语言一样,需要有浏览器进行解析;还需要提供语音识别和 语音合成服务的应用服务器;有时也需要有 http 服务器提供文档服务;当然, 如果需要与电话系统相连,就必须加上 VOIP (网络电话)的支持。如下图所示的就是 VXML 的运行环境:图 1. VXML 运行环境一个企业级应用的系统框架IVR (interactive voice-response services)
8、也就是自动应答服务,是使用VXML 的典型企业级应用。IVR 和使用者通过电话,按键(DTMF)互动,如语音 订票,语音查询,语音投票等。普通的 IVR 都是支持 VXML 的解析和提供了 sip 协议的支持,通过和 ASR (语音识别)应用服务器以及 TTS(语音合成)应 用服务器的集成,可以实现几乎所有的 VXML 封装的操作。企业级的 VXML 应用需要如下的体系结构,以使用 旧 M VoiceServer(WVS)为 例:图 2. 一个 VXML 具体应用的例子上图中的 IVR 事实上就是 VXML 解析器,通过解析 VXML 分发相应的工作给 WVS,实现 VXML 封装的语音识别和
9、语音合成的功能。6. FestivalFestival 是 Linux 下的一个语音合成软件使用方法:$ festival -tts letter.txt$ festivalfestival (SayText Greetings from )$festival (tts myfile.txt)在线演示:http:/www.cstr.ed.ac.uk/projects/festival/onlinedemo.html7. MBROLAMBROL 建一个 TTS引擎,旨在尽可能的提供各种语言的语音合成器,这些语言在其首页上都有说明。8. AstLinuxAstLinux是一个定制的 Linux发行
10、版,主要是围绕这 asterisk 这个语音交换 软件定制的。寻由IT 43 E 10 b 10v, 1bisk Usage1:/d4av/hdla|.8K&*;5. DH S /Idrmt/cdrMi/dar/iLda2119,IK5B2M107, SM St /oldrootJmntQ&i In9. HTS (HMM-based Speech Synthesis System)HTS (HMM-based Speech Synthesis System)是一个语音合成系统阅读 HTS所使用的衣术和算法,请看:http:/hts.sp.nitech.ac.jp/7Public
11、ations10. FestvoxFestvox 是卡内基梅隆大学语音项目组开发的语音合成系统II.Speak It阅读的书页或选定文本使用微软语音合成引擎.12.语音识别系统 SimonSimon 是一个开源的语音识别系统,它不仅可以输入文字,而且可以代替键盘、鼠标操作电脑。Simon 基丁 Qt 用 C+开发,因为某些支持库与 KDE 相同,所 以可完美的集成到 KDE4 中。除 KDE 之外,Simon 也可在 GNOMEXfce、及其 他 X11 环境下运行。WhitoUtUssMHatwarliE E,t tF&F&m mES:priv,ablbeck,comfytt
12、wHTXM寻rridrrid yiyi JanJan LiLiGSTGST 29Q929Q9RAKSffcr-JL UprtJJK :I 0Y. 2X:04Ldsad Avcrag-a:IkBtLifiUJE RelftAttd ia at l.inu.s-truinlc-2 3fl 5 - JiBterifl-k i. 4b2j-rG3GUI Verftifiinii i1.3-17Loeaticin2tatfi心pp Llc&tiDn(Dita)F&llfirWNI&13.语音合成引擎 gnuspeechGnuspeech是一个可扩展的语音合成实现包的基础上,实时,
13、发音,语音合成按 规则。也就是说,它转换成语音的描述文本字符申,由一个发音辞典,信中对声音的规则,节奏和语调模型资助;参数转换成一个低级别的发音合成的语音说明, 以及利用这些驱动发音模型的制作人声是正常的声音输出的GNU Linux 的设备输出合适的道14. 语音合成引擎 EposEpos是一个跟语言本身无关的规则驱动的语音合成系统,主要作科研用途在线演示:http:/epos.ure.cas.cz/cgi-bin/saye.cgi?lang=czech15. 语音合成软件 NeXTeNSNeXTeNSU个荷兰语的 Text-to-Speech 的软件。h: File FontToDi FO
14、Parameters Command Line LogOp een dag kwam de eekhoo rn erachter dat het onverstH+L H*LHLwas om niet verder te kxumen tellen dan tot vij f.H+LH*LL%Hijgingnaar de schoola an de voetvan de eikin t初H*LH*LH*LH*Lmidden van het bos en vroeg aan de mus die daarH*LH*LH*LH*Londerwij zerwas ofhij hemtot tienk
15、onleuen tellen.H*LH*LIk zal Jiiijn best doen, zei de mus.%LH*L H*L H*LH*L L%zMaar wat je vraagt is niet eenvoudig.知H*LH*L L%Ik kan zelf tot zeventien tellen, maar vraag mij nieUH*LH*L lang ik daarvoor heb gestudeerdrwant dat weet ik alH*LH*LH*Lneer.L*9Ik h.eb er alles voor over/ zei de eekhoorn.母H*LH*L L%De meeste d
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年康复医疗器械市场前景展望:需求升级创新产品驱动行业变革报告
- 2025年特色乡村旅游民宿集群项目投资风险评估报告
- 2025年生态旅游项目可持续发展规划与管理最佳实践报告
- 2025年广播媒体融合发展中的新媒体内容监管与合规报告
- 2025年智能建筑系统集成节能降耗技术路线图深度解析报告
- 2025年工业互联网平台可信执行环境(TEE)在智能制造中的应用研究报告
- 2025年机械制造企业服务化转型对市场策略的影响报告
- 江苏扬州市宝应县公车公司招聘笔试题库带答案详解
- 数据中心合作协议的主要内容
- 解析卷四川绵阳南山中学双语学校7年级数学下册第四章三角形章节练习试题(解析版)
- 运维巡检服务方案
- 河南航空港发展投资集团招聘笔试真题2024
- 微机五防系统培训课件
- 心脏骤停后高质量目标温度管理专家共识2024
- 气道解剖知识
- 教学课件-《燃烧学(第2版)》徐通模
- 《中国心衰指南深度解析》课件
- 农业电力线路改造施工合同
- 选矿厂租赁合同范本
- QC/T 757-2024乘用车列车
- 中小学主题班会-我们为什么要努力学习【课件】
评论
0/150
提交评论