中国IT动力,最新最全的IT技术教程
最新100篇 | 推荐100篇 | 专题100篇 | 排行榜 | 搜索 | 在线API文档 | 网通镜像
首 页 | 程序开发 | 操作系统 | 软件应用 | 图形图象 | 网络应用 | 精文荟萃 | 教育认证 | 硬件维护 | 未整理篇 | 站长教程
ASP JS PHP工程 ASP.NET 网站建设 UML J2EESUN .NET VC VB VFP 网络维护 数据库 DB2 SQL2000 Oracle Mysql
服务器 Win2000 Office C DreamWeaver FireWorks Flash PhotoShop 上网宝典 CorelDraw 协议大全 网络安全 微软认证
硬件维护  CPU  主板  硬盘  内存  显卡  显示器  键盘鼠标  声卡音箱  打印机  机箱电源  BIOS  网卡  C#  Java  Delphi  vs.net2005
  当前位置:> 程序开发 > 编程语言 > .NET > C#
语音合成与识别技术在C#中的应用
作者:未知 时间:2004-06-10 12:12 出处:互联网 责编:chinaitpower
              摘要:暂无
在.net中,对英文语音有较好的支持,但是对中文语音的支持还没有加入进来,我们要想实现中文发音或中文语音识别,必需先安装微软的Speech Application SDK(SASDK),它的最新版本是 SAPI 5.1 他能够识别中、日、英三种语言,你可以在这里下载:http://www.microsoft.com/speech/download/sdk51/,需要安装这两个文件Speech SDK 5.1和5.1 Language Pack,其中5.1 Language Pack可以选择安装支持的语言。

  安装好以后,我们就可以开始进行语音程序的开发了,当然,在这之前我们需要把SAPI.dll通过如下图所示添加到引用中


  下面我们设计一个能够朗读中英文混合语言的类:

  我们将用单例模式实现该类,类的代码如下,我们将详细解释:

public class Speach
{
 private static Speach _Instance = null ;
 private SpeechLib.SpVoiceClass voice =null;
 private Speach()
 {
  BuildSpeach() ;
 }

public static Speach instance()
{
 if (_Instance == null)
  _Instance = new Speach() ;
  return _Instance ;
}

private void SetChinaVoice()
{
 voice.Voice = voice.GetVoices(string.Empty,string.Empty).Item(0) ;
}

private void SetEnglishVoice()
{
 voice.Voice = voice.GetVoices(string.Empty,string.Empty).Item(1) ;
}

private void SpeakChina(string strSpeak)
{
 SetChinaVoice() ;
 Speak(strSpeak) ;
}

private void SpeakEnglishi(string strSpeak)
{
 SetEnglishVoice() ;
 Speak(strSpeak) ;
}

public void AnalyseSpeak(string strSpeak)
{
 int iCbeg = 0 ;
 int iEbeg = 0 ;
 bool IsChina = true ;
 for(int i=0;i<strSpeak.Length;i++)
 {
  char chr = strSpeak[i] ;
  if (IsChina)
  {
   if (chr<=122&&chr>=65)
   {
    int iLen = i - iCbeg ;
    string strValue = strSpeak.Substring(iCbeg,iLen) ;
    SpeakChina(strValue) ;
    iEbeg = i ;
    IsChina = false ;
   }
  }
  else
  {
   if (chr>122||chr<65)
   {
    int iLen = i - iEbeg ;
    string strValue = strSpeak.Substring(iEbeg,iLen) ;
    this.SpeakEnglishi(strValue) ;
    iCbeg = i ;
    IsChina = true ;
   }
  }
 }//end for
 if (IsChina)
 {
  int iLen = strSpeak.Length - iCbeg ;
  string strValue = strSpeak.Substring(iCbeg,iLen) ;
  SpeakChina(strValue) ;
 }
 else
 {
  int iLen = strSpeak.Length - iEbeg ;
  string strValue = strSpeak.Substring(iEbeg,iLen) ;
  SpeakEnglishi(strValue) ;
 }
}

private void BuildSpeach()
{
 if (voice == null)
  voice = new SpVoiceClass() ;
}

public int Volume
{
 get
 {
  return voice.Volume ;
 }
 set
 {
  voice.SetVolume((ushort)(value)) ;
 }
}

public int Rate
{
 get
 {
  return voice.Rate ;
 }
 set
 {
  voice.SetRate(value) ;
 }
}

private void Speak(string strSpeack)
{
 try
 {
  voice.Speak(strSpeack,SpeechVoiceSpeakFlags.SVSFlagsAsync) ;
 }
 catch(Exception err)
 {
  throw(new Exception("发生一个错误:"+err.Message)) ;
 }
}

public void Stop()
{
 voice.Speak(string.Empty,SpeechLib.SpeechVoiceSpeakFlags.SVSFPurgeBeforeSpeak) ;
}

public void Pause()
{
 voice.Pause() ;
}

public void Continue()
{
 voice.Resume() ;
}

}//end class


  在 private SpeechLib.SpVoiceClass voice =null;这里,我们定义个一个用来发音的类,并且在第一次调用该类时,对它用BuildSpeach方法进行了初始化。

  我们还定义了两个属性Volume和Rate,能够设置音量和语速。

  我们知道,SpVoiceClass 有一个Speak方法,我们发音主要就是给他传递一个字符串,它负责读出该字符串,如下所示。

private void Speak(string strSpeack)
{
  try
 {
  voice.Speak(strSpeack,SpeechVoiceSpeakFlags.SVSFlagsAsync) ;
 }
 catch(Exception err)
 {
  throw(new Exception("发生一个错误:"+err.Message)) ;
 }
}

  其中SpeechVoiceSpeakFlags.SVSFlagsAsync表示异步发音。





  但是,这个方法本身并不知道你给的字符串是什么语言,所以需要我们它这个字符串用什么语言读出。SpVoiceClass 类的Voice 属性就是用来设置语种的,我们可以通过SpVoiceClass 的GetVoices方法得到所有的语种列表,然后在根据参数选择相应的语种,比如设置语种为汉语如下所示:

private void SetChinaVoice()
{
 voice.Voice = voice.GetVoices(string.Empty,string.Empty).Item(0) ;
}

  0表示是汉用,1234都表示英语,就是口音不同。

  这样,我们就设置了语种,如果结合发音方法,我们就可以设计出一个只发汉语语音的方法

private void SpeakChina(string strSpeak)
{
 SetChinaVoice() ;
 Speak(strSpeak) ;
}

  只发英语语音的方法也是类似的,上面程序里有。

  对于一段中英文混合的语言,我们让程序读出混合语音的方法就是:编程把这段语言的中英文分开,对于中文调用SpeakChina方法,英文调用SpeakEnglishi方法;至于怎样判断一个字符是英文还是中文,我采用的是判断asc码的方法,具体的类方法是通过AnalyseSpeak实现的。

  这样,对于一段中英文混合文字,我们只需把它作为参数传递给AnalyseSpeak就可以了,他能够完成中英文的混合发音。

  当然,对于发音的暂定、继续、停止等操作,上面也给出了简单的方法调用,很容易明白。

  下面简单介绍一下中文语音识别的方法:

  先把该语音识别的类源代码贴在下面,然后再做说明:

public class SpRecognition
{
 private static SpRecognition _Instance = null ;
 private SpeechLib.ISpeechRecoGrammar isrg ;
 private SpeechLib.SpSharedRecoContextClass ssrContex =null;
 private System.Windows.Forms.Control cDisplay ;
 private SpRecognition()
 {
  ssrContex = new SpSharedRecoContextClass() ;
  isrg = ssrContex.CreateGrammar(1) ;
  SpeechLib._ISpeechRecoContextEvents_RecognitionEventHandler recHandle = new _ISpeechRecoContextEvents_RecognitionEventHandler(ContexRecognition) ;
  ssrContex.Recognition += recHandle ;
 }

 public void BeginRec(Control tbResult)
 {
  isrg.DictationSetState(SpeechRuleState.SGDSActive) ;
  cDisplay = tbResult ;
 }
 public static SpRecognition instance()
 {
  if (_Instance == null)
   _Instance = new SpRecognition() ;
   return _Instance ;
 }

 public void CloseRec()
 {
  isrg.DictationSetState(SpeechRuleState.SGDSInactive) ;
 }
 private void ContexRecognition(int iIndex,object obj,SpeechLib.SpeechRecognitionType type,SpeechLib.ISpeechRecoResult result)
 {
  cDisplay.Text += result.PhraseInfo.GetText(0,-1,true) ;
 }
}

  我们定义了ssrContex 和isrg为语音识别的上下文和语法,通过设置isrg的DictationSetState方法,我们可以开始或结束识别,在上面的程序中是BeginRec和CloseRec方法。cDisplay 是我们用来输出识别结果的地方,为了能够在大部分控件上都可以显示结果,我用了一个Control 类来定义它。当然,每次语音识别后都会触发ISpeechRecoContextEvents_RecognitionEventHandler 事件,我们定义了一个这样的方法ContexRecognition来响应事件,并且在这个方法里输出识别结果。

  这样,中文语音处理的一些最基本的问题就有了一个简单的解决方法,当然,这种方法还有很多不完善的地方,希望大家多提出批评意见,共同提高。
关闭本页
 
首页 | 投资与合作 | 服务条款 | 隐私政策 | 收藏本站 | 设为首页 | 新用户注册 | 免责声明 | 使用帮助
Copyright ©2005-2008 chinaitpower.com All rights reserved. www.chinaitpower.com 版权所有