久久久久久久久久久福利观看,丁香五月中文字幕

本文目錄一覽

1，語音識別是什么
2，手機是怎樣來實現(xiàn)語音識別的
3，語音識別的聲學(xué)模型

1，語音識別是什么

語音識別系統(tǒng)，用于識別你的話語執(zhí)行程序

就是你說了一句話。然后識別出來。比如說你說：“打開XXX程序”識別過后。就會下達指令啟動這個東西。也可以用來聽寫。說什么。就識別什么字出來。

語音識別是什么

2，手機是怎樣來實現(xiàn)語音識別的

語音識別的方法有三種： 1) 基于聲道模型和語音知識的方法、 2) 模板匹配的方法 3) 利用人工神經(jīng)網(wǎng)絡(luò)的方法。語音識別的步驟主要包括： 1) 語音信號預(yù)處理與特征提取; 2) 聲學(xué)模型與模式匹配; 3) 語言模型與語言處理語音識別的分類：語音識別系統(tǒng)可以根據(jù)對輸入語音的限制加以分類。從說話者與識別系統(tǒng)的相關(guān)性考慮可以將識別系統(tǒng)分為3類：(1)特定人語音識別系統(tǒng)：僅考慮對于專人的話音進行識別；(2)非特定人語音系統(tǒng)：識別的語音與人無關(guān)，通常要用大量不同人的語音數(shù)據(jù)庫對識別系統(tǒng)進行學(xué)習(xí)；(3)多人的識別系統(tǒng)：通常能識別一組人的語音，或者成為特定組語音識別系統(tǒng)，該系統(tǒng)僅要求對要識別的那組人的語音進行訓(xùn)練。

手機是怎樣來實現(xiàn)語音識別的

3，語音識別的聲學(xué)模型

語音識別系統(tǒng)的模型通常由聲學(xué)模型和語言模型兩部分組成，分別對應(yīng)于語音到音節(jié)概率的計算和音節(jié)到字概率的計算。本節(jié)和下一節(jié)分別介紹聲學(xué)模型和語言模型方面的技術(shù)。HMM聲學(xué)建模：馬爾可夫模型的概念是一個離散時域有限狀態(tài)自動機，隱馬爾可夫模型HMM是指這一馬爾可夫模型的內(nèi)部狀態(tài)外界不可見，外界只能看到各個時刻的輸出值。對語音識別系統(tǒng)，輸出值通常就是從各個幀計算而得的聲學(xué)特征。用HMM刻畫語音信號需作出兩個假設(shè)，一是內(nèi)部狀態(tài)的轉(zhuǎn)移只與上一狀態(tài)有關(guān)，另一是輸出值只與當(dāng)前狀態(tài)（或當(dāng)前的狀態(tài)轉(zhuǎn)移）有關(guān)，這兩個假設(shè)大大降低了模型的復(fù)雜度。HMM的打分、解碼和訓(xùn)練相應(yīng)的算法是前向算法、Viterbi算法和前向后向算法。語音識別中使用HMM通常是用從左向右單向、帶自環(huán)、帶跨越的拓撲結(jié)構(gòu)來對識別基元建模，一個音素就是一個三至五狀態(tài)的HMM，一個詞就是構(gòu)成詞的多個音素的HMM串行起來構(gòu)成的HMM，而連續(xù)語音識別的整個模型就是詞和靜音組合起來的HMM。上下文相關(guān)建模：協(xié)同發(fā)音，指的是一個音受前后相鄰音的影響而發(fā)生變化，從發(fā)聲機理上看就是人的發(fā)聲器官在一個音轉(zhuǎn)向另一個音時其特性只能漸變，從而使得后一個音的頻譜與其他條件下的頻譜產(chǎn)生差異。上下文相關(guān)建模方法在建模時考慮了這一影響，從而使模型能更準確地描述語音，只考慮前一音的影響的稱為Bi- Phone，考慮前一音和后一音的影響的稱為Tri-Phone。英語的上下文相關(guān)建模通常以音素為基元，由于有些音素對其后音素的影響是相似的，因而可以通過音素解碼狀態(tài)的聚類進行模型參數(shù)的共享。聚類的結(jié)果稱為senone。決策樹用來實現(xiàn)高效的triphone對senone的對應(yīng)，通過回答一系列前后音所屬類別（元/輔音、清/濁音等等）的問題，最終確定其HMM狀態(tài)應(yīng)使用哪個senone。分類回歸樹CART模型用以進行詞到音素的發(fā)音標注。

語音識別的聲學(xué)模型