强奸久久久久久久|草草浮力在线影院|手机成人无码av|亚洲精品狼友视频|国产国模精品一区|久久成人中文字幕|超碰在线视屏免费|玖玖欧洲一区二区|欧美精品无码一区|日韩无遮一区二区

首頁 > 產(chǎn)品 > 問答 > 語音識別技術(shù)原理,語音識別是什么

語音識別技術(shù)原理,語音識別是什么

來源:整理 時(shí)間:2023-04-02 18:21:28 編輯:智能門戶 手機(jī)版

本文目錄一覽

1,語音識別是什么

語音識別系統(tǒng),用于識別你的話語執(zhí)行程序
就是你說了一句話。然后識別出來。比如說你說:“打開XXX程序”識別過后。就會下達(dá)指令啟動(dòng)這個(gè)東西。也可以用來聽寫。說什么。就識別什么字出來。

語音識別是什么

2,手機(jī)是怎樣來實(shí)現(xiàn)語音識別的

語音識別的方法有三種: 1) 基于聲道模型和語音知識的方法、 2) 模板匹配的方法 3) 利用人工神經(jīng)網(wǎng)絡(luò)的方法。語音識別的步驟主要包括: 1) 語音信號預(yù)處理與特征提取; 2) 聲學(xué)模型與模式匹配; 3) 語言模型與語言處理 語音識別的分類:語音識別系統(tǒng)可以根據(jù)對輸入語音的限制加以分類。 從說話者與識別系統(tǒng)的相關(guān)性考慮 可以將識別系統(tǒng)分為3類:(1)特定人語音識別系統(tǒng):僅考慮對于專人的話音進(jìn)行識別;(2)非特定人語音系統(tǒng):識別的語音與人無關(guān),通常要用大量不同人的語音數(shù)據(jù)庫對識別系統(tǒng)進(jìn)行學(xué)習(xí);(3)多人的識別系統(tǒng):通常能識別一組人的語音,或者成為特定組語音識別系統(tǒng),該系統(tǒng)僅要求對要識別的那組人的語音進(jìn)行訓(xùn)練。

手機(jī)是怎樣來實(shí)現(xiàn)語音識別的

3,語音識別的聲學(xué)模型

語音識別系統(tǒng)的模型通常由聲學(xué)模型和語言模型兩部分組成,分別對應(yīng)于語音到音節(jié)概率的計(jì)算和音節(jié)到字概率的計(jì)算。本節(jié)和下一節(jié)分別介紹聲學(xué)模型和語言模型方面的技術(shù)。HMM聲學(xué)建模:馬爾可夫模型的概念是一個(gè)離散時(shí)域有限狀態(tài)自動(dòng)機(jī),隱馬爾可夫模型HMM是指這一馬爾可夫模型的內(nèi)部狀態(tài)外界不可見,外界只能看到各個(gè)時(shí)刻的輸出值。對語音識別系統(tǒng),輸出值通常就是從各個(gè)幀計(jì)算而得的聲學(xué)特征。用HMM刻畫語音信號需作出兩個(gè)假設(shè),一是內(nèi)部狀態(tài)的轉(zhuǎn)移只與上一狀態(tài)有關(guān),另一是輸出值只與當(dāng)前狀態(tài)(或當(dāng)前的狀態(tài)轉(zhuǎn)移)有關(guān),這兩個(gè)假設(shè)大大降低了模型的復(fù)雜度。HMM的打分、解碼和訓(xùn)練相應(yīng)的算法是前向算法、Viterbi算法和前向后向算法。語音識別中使用HMM通常是用從左向右單向、帶自環(huán)、帶跨越的拓?fù)浣Y(jié)構(gòu)來對識別基元建模,一個(gè)音素就是一個(gè)三至五狀態(tài)的HMM,一個(gè)詞就是構(gòu)成詞的多個(gè)音素的HMM串行起來構(gòu)成的HMM,而連續(xù)語音識別的整個(gè)模型就是詞和靜音組合起來的HMM。上下文相關(guān)建模:協(xié)同發(fā)音,指的是一個(gè)音受前后相鄰音的影響而發(fā)生變化,從發(fā)聲機(jī)理上看就是人的發(fā)聲器官在一個(gè)音轉(zhuǎn)向另一個(gè)音時(shí)其特性只能漸變,從而使得后一個(gè)音的頻譜與其他條件下的頻譜產(chǎn)生差異。上下文相關(guān)建模方法在建模時(shí)考慮了這一影響,從而使模型能更準(zhǔn)確地描述語音,只考慮前一音的影響的稱為Bi- Phone,考慮前一音和后一音的影響的稱為Tri-Phone。英語的上下文相關(guān)建模通常以音素為基元,由于有些音素對其后音素的影響是相似的,因而可以通過音素解碼狀態(tài)的聚類進(jìn)行模型參數(shù)的共享。聚類的結(jié)果稱為senone。決策樹用來實(shí)現(xiàn)高效的triphone對senone的對應(yīng),通過回答一系列前后音所屬類別(元/輔音、清/濁音等等)的問題,最終確定其HMM狀態(tài)應(yīng)使用哪個(gè)senone。分類回歸樹CART模型用以進(jìn)行詞到音素的發(fā)音標(biāo)注。

語音識別的聲學(xué)模型

文章TAG:語音識別技術(shù)原理語音語音識別語音識別技術(shù)

最近更新

相關(guān)文章

問答最新文章