語音識別系統的原理是什麽？

根據語音識別實際應用中的不同，語音識別系統可以分為：特定人與非特定人的語音識別、獨立詞與連續詞的語音識別、小詞匯量與大詞匯量以及無限詞匯量的語音識別。但無論哪種語音識別系統，其基本原理和處理方法大體相同。語音識別原理語音信號輸入之後，預處理和數字化是進行語音識別的前提條件。其中，預處理主要是進行預濾波，保留正常人的300～3400Hz的語音信號；數字化是要進行A/D轉換及抗混疊等處理；特征提取是進行語音信號訓練和識別必不可少的步驟。能夠體現語音信號特征的參數包括：(1)基於LPC的倒譜參數；(2)Mel系數的倒譜參數；(3)采用前沿數字信號處理技術的特征分析手段，如小波分析、時/頻域分析、人工神經網絡等。本文采用基於LPC的倒譜參數表示方法，提取出的特征值存入參考模式庫中，用來匹配待識別語音信號的特征值。匹配計算是進行語音識別的核心部分，由待識別人的語音經過特征提取後，與系統訓練時產生的模板進行匹配，在說話人辨認中，取與待識別語音相似度最大的模型所對應的語音作為識別結果，這就是語音識別的整個過程。語音識別技術從應用類分為特定人語音識別和非特定人語音識別。特定人語音識別技術是針對指定人的語音識別，其他人的話玩具不識別，應用模式是使用前需要指定人的語音訓練過程，壹般按照玩具提示訓練2遍語音詞條，然後就可以使用了；非特定人語音識別是不用針對指定的人的識別技術，不分年齡，性別，只要說相同語言就可以，應用模式是在產品定型前按照確定的十幾個語音交互詞條，采集200人左右的聲音樣本，經過我們的PC算法處理得到交互詞條的語音模型和特征數據庫，然後燒錄到我們的芯片上，應用我們芯片的玩具就具有交互的功能了。非特定人語音識別應用有的是基於音素的算法，這種模式下不需要采集很多人的聲音樣本，就可以做交互識別，但是缺點是識別率不高，識別性能不穩定。在PC領域，Microsoft的Word軟件就有語音識別技術