TTS开发步骤_基于图形界面.doc_第1页
TTS开发步骤_基于图形界面.doc_第2页
TTS开发步骤_基于图形界面.doc_第3页
TTS开发步骤_基于图形界面.doc_第4页
TTS开发步骤_基于图形界面.doc_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

事件驱动的文本语音转换(TTS)实例介绍一个基本的文字转语音的例子,应用程序使用图形界面(非控制台应用程序)建立项目首先,创建一个新的windows 32平台应用程序项目,在向导中,选择一个典型的“Hello world!”应用。由此产生的项目代码比命令行版本的长,且大多数新的复杂代码与sapi关系不大,但是是实现图形界面所必须的代码。 设置sapi的路径与SAPI相关的文件路径必须在项目中声明。以下是设置“sapi.h”路径的步骤: 1,在菜单上,选择工具“Tools”,然后单击选项“Options”。2,单击“Directories”选项卡。 3,选择“Include Files”下拉式选单4,单击最后一行闲置在路径清单,并输入“sapi.h”的文件路径:“C:/Program Files/Microsoft Speech SDK 5.1/Include”5,选择“Library Files”下拉式选单,并输入“sapi.lib”的文件路径: “C:/Program Files/Microsoft Speech SDK 5.1/Lib/i386”。最后单击确定。 创建“Speak”菜单命令为了使应用程序响应我们发出“Speak”命令,并且发出声音,需要对自动生成的菜单项做一些修改。读者可以通过VC6.0的资源管理器,在“File”菜单下面,增加一个“Speak”命令项,并且将该命令项的资源ID设置为“IDM_SPEAK”。后文再讲述如何处理这个命令事件的代码。现在先来编译和运行这个应用程序,确保以上的设置准确无误。程序除了在屏幕上面显示“Hello world”之外,其它什么事情也没做,但是它确实可以运行起来了。使用这个实例第1步:初始化com 第2步:设置声音第3步:讲!第4步:设置感兴趣的事件第5步:确定事件类型第6步:响应事件第1步:初始化com 用一个winmain中的程序段说明。唯一的限制是在使用任何sapi的特定代码前com必须是初始化完成了,并且在运行sapi过程中,COM一直都是活动的。既然sapi是用initinstance来实例化的,COM的初始化就应该在initinstance之前被初始化 ,并在消息环之后被撤销。程序清单1:粗体字代表着这个例子的新代码 if( FAILED( CoInitialize(NULL) ) ) return FALSE; / Perform application initialization: if (!InitInstance (hInstance, nCmdShow) return FALSE; hAccelTable = LoadAccelerators(hInstance, (LPCTSTR)IDC_GUIAPP); / Main message loop: while (GetMessage(&msg, NULL, 0, 0) if (!TranslateAccelerator(msg.hwnd, hAccelTable, &msg) TranslateMessage(&msg); DispatchMessage(&msg); CoUninitialize();第2步:设置声音 一旦com运行后,下一步就是要创建语音对象。这里需要用到cocreateinstance() 。正如上一篇中的命令例子中说, sapi使用很多智能的默认配置。所以只要进行很少的初始化,你即时可以使用语音对象。这些默认配置放在在语音属性,控制面板,一个可选的声音模式(如果你的系统有一个以上的),和语言(英文,日文等)。有些则默认是显而易见的,其他的就没这么明显(如讲话速率,基音周期等)。不过,你可以以编程的方式或通过控制面板来改变所有的默认配置。 为求简洁和方便起见,这个例子使用了特别的处理方式。首先,它使用initinstance ( )来初始化的声音。这是最简单的初始化过程。在其他一些应用中,特别是使用语音识别(SR)实例中,程序可能有专门的初始化模块,这样可以使SAPI相关的代码与普通的程序代码独立开来。第二,这个语音对象是全局性的。根据你的应用程序的设计和要求,你可能不需要一个全局的语音对象。第三,对下面的代码来说,语音对象建立之后,对象本省和用到的内存立即被释放。显然,如果这个对象有其它用途的话,它是不能被释放的。这过渡性的代码,只是为了做一个简单的说明。最后,如果初始化失败,应用程序应该有更强有力的检查错误机制,更广泛的报告和更详细的资料。 程序清单2:ISpVoice *pVoice; /SAPI voiceBOOL InitInstance(HINSTANCE hInstance, int nCmdShow) HWND hWnd; hInst = hInstance; / Store instance handle in our global variable hWnd = CreateWindow(szWindowClass, szTitle, WS_OVERLAPPEDWINDOW, CW_USEDEFAULT, 0, CW_USEDEFAULT, 0, NULL, NULL, hInstance, NULL); if (!hWnd) return FALSE; ShowWindow(hWnd, nCmdShow); UpdateWindow(hWnd); /Initialize SAPI HRESULT hr = CoCreateInstance(CLSID_SpVoice, NULL, CLSCTX_ALL, IID_ISpVoice, (void *)&pVoice); if( SUCCEEDED( hr ) ) pVoice-Release(); pVoice = NULL; else return FALSE; return TRUE;第3步:讲! 要讲话的内容用一个参数传给语音对象。这些内容可以根据程序的具体应用来改变。如前所述,常是从一个对话框或一个文件获取字符串的。另外,字符串也可以从一个流中获取,但就要使用另外一个调用 ispvoice: speakstream 。这个例子使用一个简单的,代码化的句子。Speak函数可以使用类似于下面的文本 Speak(L”I am glad to speak.”,spf_async ,NULL); 这个调用代码是放在windows的消息处理函数wndproc ( )相应的消息处理中的 。选择从文件菜单,选择Speak命令,计算机将开始讲: 我很高兴发言。 程序代码3:ISpVoice *pVoice; /SAPI voiceBOOL InitInstance(HINSTANCE hInstance, int nCmdShow) HWND hWnd; hInst = hInstance; / Store instance handle in our global variable hWnd = CreateWindow(szWindowClass, szTitle, WS_OVERLAPPEDWINDOW, CW_USEDEFAULT, 0, CW_USEDEFAULT, 0, NULL, NULL, hInstance, NULL); if (!hWnd) return FALSE; ShowWindow(hWnd, nCmdShow); UpdateWindow(hWnd); /Initialize SAPI HRESULT hr = CoCreateInstance(CLSID_SpVoice, NULL, CLSCTX_ALL, IID_ISpVoice, (void *)&pVoice); if( SUCCEEDED( hr ) ) pVoice-Release(); pVoice = NULL; else return FALSE; return TRUE;第4步:设置事件 在COM组件中有很多交互动作,这些交互信息将以信息形式出现。sapi是也一样。信息是在TTS或SR引擎中产生的,某个特定的事件也是在那里开始和结束的.很多时候, sapi或sapi的引擎产生的事件是对应用程序有用的。举例来说,当一个识别过程开始的时候,应用程序会得到相应的通知或消息,最终的用户也可以得到相应的通知。同样,应用或许会有兴趣知道什么时候完成了所有的处理,处理完成后,也许要通知用户,甚至关闭引擎或应用本身时。 应用程序处理这些消息时要进行两个步骤的操作。 首先,它需要接收一个来自sapi的或sapi的引擎的消息。这个消息是程序自定义的.但是,所有的活动sapi都使用相同的消息通知应用程序。要确定确切的正在发生的活动,更多的资料是由sapi的提供的。一个完整的清单,请参见speventenum。 第二个步骤。得到通知后,应用程序要检查一个事件结构,这个事件结构是由SAPI完成的.利用这个结构来确定具体是发生了什么事件(见第五步骤). 设定感兴趣的事件: 程序可以用setinterest 来设置感兴趣的事件。默认情况下,TTS不向程序发出任何事件通知,而语音识别只发出( spei_recognition )消息。也就是说,如果程序忽略了setinterest的调用,TTS应用程序是得不到任何事件通知的,而SR程序只能得到识别完成的通知和消息。在任何时候都可以改变感兴趣的事件。 设定消息不论以何种事件,应用程序都应该将一个消息与sapi联系起来 。程序通过调用setnotifywindowmessage来完成这个任务 。有三类消息可以使用,但至少少用其中一种。第四类是为多线程应用的,在这里没有用到。这四种消息可以参见ispnotifysource节的介绍。实际使用的消息名字和值由程序决定,本例子使用了WM_USER消息。程序清单4: /Initialize SAPI HRESULT hr = CoCreateInstance(CLSID_SpVoice, NULL, CLSCTX_ALL, IID_ISpVoice, (void *)&pVoice); if( SUCCEEDED( hr ) ) pVoice-SetInterest( SPFEI(SPEI_WORD_BOUNDARY),SPFEI(SPEI_WORD_BOUNDARY) ); pVoice-SetNotifyWindowMessage( hWnd, WM_USER, 0, 0 ); else return FALSE;第5步:确定事件如前所述,使用事件来工作需要2个步骤。首先是使用一个简单和标准的做法社设置和使用Windows消息。消息是被发送到程序的消息环中的。在这个例子里, wndproc( )接收wm_user讯息。一旦讯息是捕获,其余事情靠sapi函数 来完成。 第二个步骤是,以确定哪些消息发生了。 Sapi使用 spevent和getevents方法来确定具体的事件和消息。通过这两个函数,你可以获取指定的事件信息和事件类型。在SPEVENT的成员eeventid恰恰是setinterest所设定的值 。该spevent结构必须在首次使用时被初始化。而且重新使用之前也要被清除。可以使用spclearevent来完成清除工作。 有可能事件和消息发生的速度比应用处理速度要快。这是一个常见的情况。 getevents可以一次性取出一个以上事件。这程序对这些这些事件进行批处理,一般专业应用程序是需要这样做的。另一种方式来处理这种情况,是用一个while循环。一个一个的检索出每一事件。请看下例。程序清单5:case WM_USER: SPEVENT eventItem; memset( &eventItem, 0,sizeof(SPEVENT); while( pVoice-GetEvents(1, &eventItem, NULL ) = S_OK ) switch(eventItem.eEventId ) case SPEI_WORD_BOUNDARY : break; default: break; SpClearEvent( eventItem );第6步:响应事件 一旦事件和消息是确定后,编程变得更加标准了。在这个例子中,应用程序使用spei_word_boundary消息来取定每一个单词。可以用getstatus函数和spvoicestatus结构。来获取更详细的信息。 一个独立的单词,可以用事件发生时的第一个字母和最后一个字母的位置来确定。在这个例子中,使用MessageBoxW来显示所讲的单词。在说话过程中,屏幕是实时更新的,并显示实际发言的文字。这个特点是由spf_async标志控制的。如果在Speak函数中使用NULL参数,而不是SPF_ASYNC参数,那样就要等整句话说完之后,才显示消息框。pVoice-Speak( theString, SPF_ASYNC, NULL);程序代码6: case SPEI_WORD_BOUNDARY : SPVOICESTATUS eventStatus; pVoice-GetStatus( &eventStatus, NULL ); ULONG start, end; start = eventStatus.ulInputWordPos; end = eventStatus.ulInputWordLen; wcsncpy( tempString, theString + start , end ); tempString end = /0; MessageBoxW( hWnd, tempString, LGUIApp, MB_OK|MB_ICONWARNING ); break;总结:最后,总结一下这个例子的主要知识点:1,初始化COM: CoInitialize和CoUninitialize2,建立语音对象实例:CoCreateInstance3,讲话:Speck4,设置感兴趣的事件:SetInterest 设定SAPI返回的消息 :setnotifywindowmessage5,消息来时,确定事件类型:GetEvents 清除事件结构:SpClearEvent6,相应事件时,用GetStatus确定当前SAPI的状态最后完整的实例代码:/ GUIApp.cpp : Defines the entry point for the application.#include stdafx.h#include SetInterest( SPFEI(SPEI_WORD_BOUNDARY),SPFEI(SPEI_WORD_BOUNDARY) ); pVoice-SetNotifyWindowMessage( hWnd, WM_USER, 0, 0 ); else return FALSE; return TRUE;/FUNCTION: WndProc(HWND, unsigned, WORD, LONG)/PURPOSE:Processes messages for the main window./WM_COMMAND - process the application menu/WM_PAINT - Paint the main window/WM_DESTROY - post a quit message and return/LRESULT CALLBACK WndProc(HWND hWnd, UINT message, WPARAM wParam, LPARAM lParam) int wmId, wmEvent; PAINTSTRUCT ps; HDC hdc; TCHAR szHelloMAX_LOADSTRING; LoadString(hInst, IDS_HELLO, szHello, MAX_LOADSTRING); WCHAR tempString30; switch (message) case WM_COMMAND: wmId = LOWORD(wParam); wmEvent = HIWORD(wParam); / Parse the menu selections: switch (wmId) case IDM_ABOUT: DialogBox(hInst, (LPCTSTR)IDD_ABOUTBOX, hWnd, (DLGPROC)About); break; case IDM_EXIT: DestroyWindow(hWnd); break; case IDM_SPEAK: wcscpy( theString, LI am glad to speak. ); pVoice-Speak( theString, SPF_ASYNC, NULL); break; default: return DefWindowProc(hWnd, message, wParam, lParam); break; case WM_USER: SPEVENT eventItem; memset( &eventItem, 0,sizeof(SPEVENT); while( pVoice-GetEvents(1, &eventItem, NULL ) = S_OK ) switch(eventItem.eEventId ) case SPEI_WORD_BOUNDARY : SPVOICESTATUS eventStatus; pVoice-GetStatus( &eventStatus, NULL ); ULONG start, end; start = eventStatus.ulInputWordPos; end = eventStatus.ulInputWordLen; wcsncpy( tempString, th

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论