當前位置:歷史故事大全網 - 故事大全 - 語音識別系統的原理是什麽?

語音識別系統的原理是什麽?

根據語音識別實際應用中的不同,語音識別系統可以分為:特定人與非特定人的語音識別、獨立詞與連續詞的語音識別、小詞匯量與大詞匯量以及無限詞匯量的語音識別。但無論哪種語音識別系統,其基本原理和處理方法大體相同。語音識別原理語音信號輸入之後,預處理和數字化是進行語音識別的前提條件。其中,預處理主要是進行預濾波,保留正常人的300~3400Hz的語音信號;數字化是要進行A/D轉換及抗混疊等處理;特征提取是進行語音信號訓練和識別必不可少的步驟。能夠體現語音信號特征的參數包括:(1)基於LPC的倒譜參數;(2)Mel系數的倒譜參數;(3)采用前沿數字信號處理技術的特征分析手段,如小波分析、時/頻域分析、人工神經網絡等。本文采用基於LPC的倒譜參數表示方法,提取出的特征值存入參考模式庫中,用來匹配待識別語音信號的特征值。匹配計算是進行語音識別的核心部分,由待識別人的語音經過特征提取後,與系統訓練時產生的模板進行匹配,在說話人辨認中,取與待識別語音相似度最大的模型所對應的語音作為識別結果,這就是語音識別的整個過程。語音識別技術從應用類分為特定人語音識別和非特定人語音識別。特定人語音識別技術是針對指定人的語音識別,其他人的話玩具不識別,應用模式是使用前需要指定人的語音訓練過程,壹般按照玩具提示訓練2遍語音詞條,然後就可以使用了;非特定人語音識別是不用針對指定的人的識別技術,不分年齡,性別,只要說相同語言就可以,應用模式是在產品定型前按照確定的十幾個語音交互詞條,采集200人左右的聲音樣本,經過我們的PC算法處理得到交互詞條的語音模型和特征數據庫,然後燒錄到我們的芯片上,應用我們芯片的玩具就具有交互的功能了。非特定人語音識別應用有的是基於音素的算法,這種模式下不需要采集很多人的聲音樣本,就可以做交互識別,但是缺點是識別率不高,識別性能不穩定。在PC領域,Microsoft的Word軟件就有語音識別技術

  • 上一篇:節奏天國switch可以玩嗎
  • 下一篇:企业营业利润计算公式
  • copyright 2024歷史故事大全網