强奸久久久久久久|草草浮力在线影院|手机成人无码av|亚洲精品狼友视频|国产国模精品一区|久久成人中文字幕|超碰在线视屏免费|玖玖欧洲一区二区|欧美精品无码一区|日韩无遮一区二区

首頁 > 廠商 > 知識(shí) > mfcc特征提取,如何對(duì)聲音文件提取MFCC特征和LPC特征

mfcc特征提取,如何對(duì)聲音文件提取MFCC特征和LPC特征

來源:整理 時(shí)間:2023-08-18 22:03:25 編輯:智能門戶 手機(jī)版

本文目錄一覽

1,如何對(duì)聲音文件提取MFCC特征和LPC特征

ygfgyh

如何對(duì)聲音文件提取MFCC特征和LPC特征

2,MATLAB中提取MFCC特征

利用函數(shù)melcepst.m可以得到直接計(jì)算語音信號(hào)s的MFCC參數(shù):c = melcepst(s, fs。這一命令默認(rèn)地以256點(diǎn)為幀長(zhǎng)計(jì)算12階MFCC參數(shù),如果s比較長(zhǎng),將會(huì)按照128點(diǎn)的間隔將s分為若干幀,再分別計(jì)算。即s為你定義的信號(hào),不是長(zhǎng)度,fs可以取8000。

MATLAB中提取MFCC特征

3,MATLAB中提取MFCC特征

利用函數(shù)melcepst.m可以得到直接計(jì)算語音信號(hào)s的MFCC參數(shù):c = melcepst(s, fs。這一命令默認(rèn)地以256點(diǎn)為幀長(zhǎng)計(jì)算12階MFCC參數(shù),如果s比較長(zhǎng),將會(huì)按照128點(diǎn)的間隔將s分為若干幀,再分別計(jì)算。即s為你定義的信號(hào),不是長(zhǎng)度,fs可以取8000。

MATLAB中提取MFCC特征

4,plp特征提取方法可mfcc有什么區(qū)別

MFCC:Mel頻率倒譜系數(shù)的縮寫。Mel頻率是基于人耳聽覺特性提出來的,它與Hz頻率成非線性對(duì)應(yīng)關(guān)系。Mel頻率倒譜系數(shù)(MFCC)則是利用它們之間的這種關(guān)系,計(jì)算得到的Hz頻譜特征。MFCC參數(shù)的提取包括以下幾個(gè)步驟:預(yù)濾波:CODEC前端帶寬為300-3400Hz的抗混疊濾波器。A/D變換:8kHz的采樣頻率,12bit的線性量化精度。預(yù)加重:通過一個(gè)一階有限激勵(lì)響應(yīng)高通濾波器,使信號(hào)的頻譜變得平坦,不易受到有限字長(zhǎng)效應(yīng)的影響。分幀:根據(jù)語音的短時(shí)平穩(wěn)特性,語音可以以幀為單位進(jìn)行處理,實(shí)驗(yàn)中選取的語音幀長(zhǎng)為32ms,幀疊為16ms。加窗:采用哈明窗對(duì)一幀語音加窗,以減小吉布斯效應(yīng)的影響。快速傅立葉變換(Fast Fourier Transformation, FFT):將時(shí)域信號(hào)變換成為信號(hào)的功率譜。

5,plp特征提取方法可mfcc有什么區(qū)別

MFCC:Mel頻率倒譜系數(shù)的縮寫。Mel頻率是基于人耳聽覺特性提出來的,它與Hz頻率成非線性對(duì)應(yīng)關(guān)系。Mel頻率倒譜系數(shù)(MFCC)則是利用它們之間的這種關(guān)系,計(jì)算得到的Hz頻譜特征。MFCC參數(shù)的提取包括以下幾個(gè)步驟:預(yù)濾波:CODEC前端帶寬為300-3400Hz的抗混疊濾波器。A/D變換:8kHz的采樣頻率,12bit的線性量化精度。預(yù)加重:通過一個(gè)一階有限激勵(lì)響應(yīng)高通濾波器,使信號(hào)的頻譜變得平坦,不易受到有限字長(zhǎng)效應(yīng)的影響。分幀:根據(jù)語音的短時(shí)平穩(wěn)特性,語音可以以幀為單位進(jìn)行處理,實(shí)驗(yàn)中選取的語音幀長(zhǎng)為32ms,幀疊為16ms。加窗:采用哈明窗對(duì)一幀語音加窗,以減小吉布斯效應(yīng)的影響??焖俑盗⑷~變換(Fast Fourier Transformation, FFT):將時(shí)域信號(hào)變換成為信號(hào)的功率譜。
期待看到有用的回答!

6,如何提取特征三類韻律特征音質(zhì)特征mfcc參數(shù)

特征提取 一、 low-level,主要是MFCC,以及基于MFCC并對(duì)其優(yōu)化的一些方法。 1、 MFCC 2、 抗噪聲較優(yōu)的方法: WMVDR:warped minimum variance distortionless response Multitaper MFCC:思想是用multiple windows(tapers)來代替漢明窗。 MHEC:mean Hilbert envelope coefficients.此方法對(duì)抗汽車噪聲很有用。 3、 對(duì)抗回聲較優(yōu)的方法(reverberant robustness): FDLP: frequency domain linear prediction 4、 融合MFCC的方法(fusion with MFCC): SCF/SCM: spectral centroid frequency/magnitude 該方法的提出,是考慮到MFCC子帶中無法體現(xiàn)能量分布,而FM(frequency modulation)計(jì)算量太大。 FFV: fundamental frequency variation,該方法同時(shí)考慮到了MFCC和韻律(prosodic)信息. HSCC: Harmonic structure cepstral coefficient,該方法體現(xiàn)了能量分布,實(shí)現(xiàn)用到了LDA。 二、 high-level,主要是基于phone ,syllable ,word 一級(jí)。 1、 韻律特征(prosodic features) 目前研究的有 pitch distribution和non-uniform extraction region features(NERFs) 2、 音素特征(phonetic features) 建模可以用N-gram,也可以用SVM建模。 3、 語法特征(lexical features) 詞一級(jí)的N-gram,建模的方法有LLR(log likelihood ration)和SVM.SVM的效果應(yīng)該更好一些。 4、 cepstral-derived features 實(shí)現(xiàn)用最大似然線性回歸MLLR(maximum likelihood linear regression) 一些特征: MFCC PLP 感知線性預(yù)測(cè) LPC 線性預(yù)測(cè)系數(shù) 過零率 LSP 短時(shí)能量 子帶流量比 亮度 基頻 頻譜峰值點(diǎn) SDC CEP 線譜對(duì) 頻譜能量 Delt(MFCC)

7,語音信號(hào)特征提取用mfcc提取完后的圖看不懂matlab程序求解釋一下圖

MFCC是一種語音特征提取技術(shù),它產(chǎn)生與20世紀(jì)80年代。MFCC為了從人發(fā)出的音頻中去除噪音和情感的影響,提取特征值便于我們進(jìn)行進(jìn)一步的分析。人的發(fā)聲由很多部位共同影響的結(jié)果,如嘴形、牙齒等因素,這種形狀可以決定聲音的輸出。如果我們可以精確的確定形狀,那么我們就可以對(duì)發(fā)出的因素進(jìn)行科學(xué)的表示。這篇文章將帶你走進(jìn)MFCC技術(shù),解釋它為什么能夠很好的用于語音識(shí)別領(lǐng)域以及如何實(shí)現(xiàn)它。首先我們來確定一下如何進(jìn)行MFCC的步驟:-----1.將音頻分解為幀;-----2.對(duì)于每一幀,計(jì)算周期功率譜;-----3.將mel濾波器應(yīng)用到功率譜中,計(jì)算每個(gè)濾波器的能量和;-----4.計(jì)算能量的對(duì)數(shù)值;-----5.對(duì)每個(gè)對(duì)數(shù)能量進(jìn)行離散余弦變換(DCT);-----6.保留DCT的2-13個(gè)系數(shù),其余系數(shù)舍去;現(xiàn)在我們來探討一下每一步的細(xì)節(jié)以及為什么要這么做。一個(gè)音頻信號(hào)通常是不斷變化的,為了簡(jiǎn)化,我們通常假設(shè)一個(gè)較短時(shí)間內(nèi)音頻信號(hào)不會(huì)有較大的變化(我們指統(tǒng)計(jì)上),所以我們把每一幀劃分成20-40ms為宜,若該時(shí)間太短,則沒有足夠的信號(hào)來進(jìn)行功率估計(jì);方之,若太長(zhǎng),則每一幀信號(hào)變化太多。下一步是計(jì)算每一幀的周期功率譜,這個(gè)源自人的耳鍋,它隨聲音的大小而發(fā)生不同頻率的振動(dòng)。通過耳鍋的不同位置上的振動(dòng),不同的神經(jīng)元將會(huì)通知大腦現(xiàn)在聽到的音頻頻率。我們的周期圖同樣為我們做出這種工作,確定幀中存在哪些頻率。周期圖同樣存在一些ASR(Automatic Speech Recognition)不需要的信息。實(shí)際上耳鍋無法辨別兩個(gè)空間上相近的頻率。當(dāng)頻率變大時(shí),這種影響更明顯。因此,我們采取周期圖塊,并且將它們進(jìn)行累加來得知在不同頻率區(qū)域的能量是多少。這個(gè)是有我們的mel濾波器完成的,第一個(gè)濾波器非常狹窄,可以告訴我們頻率為0Hz附近的能量是多少,當(dāng)頻率漸漸變高時(shí),我們的濾波器也會(huì)越來越寬,我們只關(guān)心每一個(gè)點(diǎn)能量是多少。mel級(jí)別告訴我們?nèi)绾稳澐譃V波器以及濾波器的寬度如何選擇。一旦我們有了濾波器的能量,我們對(duì)它取對(duì)數(shù),這也是受人類聽力啟發(fā)的;通常我們無法聽出線性級(jí)別的音量,通常若聲音擴(kuò)大兩倍,我們需要放入8倍的能量進(jìn)去。這就意味著能量上有較大的變化并不代表聲音大小變化很大,為什么這里我們使用對(duì)數(shù)而不是取平方根,那是因?yàn)槲覀兛梢允褂胏epstral mean subtraction,它是一個(gè)頻道歸一化的技巧。最后一步是計(jì)算對(duì)數(shù)能量的DCT,關(guān)于這個(gè)有兩點(diǎn)原因:因?yàn)槲覀兊臑V波器通常都有交疊,因此濾波器能量彼此相關(guān);DCT對(duì)能量進(jìn)行去相關(guān),意味著協(xié)方差的對(duì)角矩陣可以用來對(duì)HMM分類器進(jìn)行建模。但是注意,DCT中26個(gè)系數(shù)只有12個(gè)被保留下來,這是因?yàn)镈CT的高階系數(shù)代表濾波器能量的快速變化,事實(shí)證明這些快速變化影響ASR的表現(xiàn),所以我們?nèi)コ唠A系數(shù)。什么是mel scale(梅爾規(guī)模)?mel scale將感知頻率與音頻的實(shí)際頻率相聯(lián)系起來,人們更容易區(qū)分低頻中的微小頻率變化,而對(duì)高頻中的微小頻率變化則難以區(qū)分。使用mel scale可以幫助更加模擬人的聽覺。從頻率到mel scale的計(jì)算公式為反過來,從mel scale回到頻率的公式為實(shí)現(xiàn)步驟:我們從一段語音信號(hào)開始,假設(shè)該信號(hào)的采樣頻率為16KHz。1.將信號(hào)以20-40ms為一幀進(jìn)行劃分,25ms較為標(biāo)準(zhǔn)。這意味著對(duì)于一個(gè)16KHz的信號(hào),共有0.025*16000=400個(gè)樣本。幀的間隔通常為10ms,即160個(gè)樣本,即第一幀400個(gè)樣本從樣本0開始,第二幀400個(gè)樣本從樣本160開始,幀之間具有交疊部分,直到達(dá)到語音文件結(jié)尾為止。如果語音文件不能劃分成偶數(shù)個(gè)幀,用0填滿它。下一步是進(jìn)行對(duì)每個(gè)單一幀進(jìn)行提取12個(gè)MFCC系數(shù),我們約定為我們的時(shí)域信號(hào),為第i幀的時(shí)域型號(hào),n的取值為1-400,但我們計(jì)算復(fù)數(shù)離散傅立葉變換,我們得到,i表示第i幀,是第i幀的功率譜。2.為了計(jì)算每一幀的DFT,執(zhí)行下面的運(yùn)算:其中,h(n)為樣本分析的漢明窗,K是DFT的長(zhǎng)度。接下來每一幀的功率譜估計(jì)即這就是功率譜的周期圖估計(jì),我們將會(huì)進(jìn)行512個(gè)點(diǎn)的FFT,只保留開始的257個(gè)系數(shù)。3.計(jì)算梅爾間距濾波器。這里一般有20-40(26最好)個(gè)三角形濾波器,應(yīng)用到第2步的功率譜上面,我們的濾波器有26個(gè)向量組成,每個(gè)向量元素個(gè)數(shù)為257,每個(gè)向量大部分為0,但是有一部分頻率的值非零。為了計(jì)算濾波器的能量,我們把每一個(gè)濾波器與功率譜進(jìn)行相乘,然后系數(shù)相加,最后這就給了我們26個(gè)數(shù)值,它們代表每一個(gè)濾波器上面的能量。下圖說明了這些細(xì)節(jié):4.分別計(jì)算第3步中26個(gè)能量的對(duì)數(shù)值。5.對(duì)26個(gè)對(duì)數(shù)能量進(jìn)行DCT,得到26個(gè)系數(shù),我們只取前12個(gè)。這樣,我們對(duì)于每一幀得到的12個(gè)數(shù)稱為Mel Frequency Cepstral Coefficients,即梅爾頻率倒譜系數(shù)。關(guān)于計(jì)算梅爾間距濾波器的細(xì)節(jié)部分:這一部分為了方便講解我們使用10個(gè)濾波器,實(shí)際中應(yīng)該使用26-40個(gè)濾波器。我們首先要選擇頻率上下限,一般取300Hz為最小頻率,8000Hz為最大頻率。當(dāng)然如果語音的采樣頻率為8000Hz,那么我們的最大頻率修改為4000Hz。然后進(jìn)行如下步驟:1.使用方程1,將頻率轉(zhuǎn)化為梅爾頻率,即300Hz變?yōu)?01.25Mels,8000Hz變?yōu)?834.99Mels。2.對(duì)于這個(gè)例子,我們需要10個(gè)濾波器,因此需要找到12個(gè)點(diǎn)。意味著我們要在梅爾最大最小頻率之間再插10個(gè)等間隔頻率,即m(i) = 401.25, 622.50, 843.75, 1065.00, 1286.25, 1507.50, 1728.74,1949.99, 2171.24, 2392.49, 2613.74, 2834.993.我們使用方程2將梅爾頻率還原成頻率h(i) = 300, 517.33, 781.90, 1103.97, 1496.04, 1973.32, 2554.33, 3261.62, 4122.63, 5170.76, 6446.70, 80004.由于我們不知道每個(gè)頻率應(yīng)該放在FFT過后的哪個(gè)點(diǎn)處,所以我們需要對(duì)這些頻率進(jìn)行轉(zhuǎn)為相應(yīng)的FFT過后的點(diǎn), f(i) = floor((nfft+1)*h(i)/samplerate)然后我們計(jì)算出結(jié)果 f(i) = 9, 16, 25, 35, 47, 63, 81, 104, 132, 165, 206, 256注意這里我們之前說了采樣頻率為16KHz,然后nfft=512。5.現(xiàn)在我們可以來建立濾波器了,第一個(gè)濾波器應(yīng)該從第一個(gè)點(diǎn)開始,在第二個(gè)點(diǎn)處到達(dá)峰值,在第三個(gè)點(diǎn)處為0......同理可得其他,公式如下所示:最后,10個(gè)濾波器的圖像如下所示:(工作時(shí),頻率從300Hz開始)最后一點(diǎn):Deltas and Delta-Deltas又名差和加速系數(shù),MFCC特征系數(shù)僅僅概括單一幀的功率譜,但是語音信號(hào)似乎是動(dòng)態(tài)的,例如MFCC特征系數(shù)隨時(shí)間變化的軌跡如何,實(shí)踐表明,計(jì)算MFCC后,再加上一些原始的特征向量能夠提高ASR的表現(xiàn)。(如果我們有12個(gè)MFCC,又有12個(gè)delta系數(shù),這樣一共得到24個(gè)系數(shù))計(jì)算delta系數(shù)的公式如下:其中是一個(gè)delta系數(shù),由和計(jì)算而來,N的典型值一般取2,差和加速系數(shù)計(jì)算方法類似,不過它們的是對(duì)delta來求的,而不是c。
文章TAG:特征特征提取提取如何mfcc特征提取

最近更新

  • 怎么畫機(jī)器人好看,二年級(jí)畫機(jī)器人又好看又簡(jiǎn)單怎么畫機(jī)器人好看,二年級(jí)畫機(jī)器人又好看又簡(jiǎn)單

    機(jī)器人女生怎么畫機(jī)器人,機(jī)器人怎么畫1。準(zhǔn)備一把紙刷,畫出機(jī)器人的頭部和身體,那么我們來看看機(jī)器人《簡(jiǎn)筆畫步驟圖解教程》,看看機(jī)器人《簡(jiǎn)筆畫》是怎么畫的,你會(huì)覺得畫畫其實(shí)是一件很簡(jiǎn).....

    知識(shí) 日期:2023-08-18

  • tlc和qlc,新技術(shù)QLC來了固態(tài)硬盤壽命有多長(zhǎng)tlc和qlc,新技術(shù)QLC來了固態(tài)硬盤壽命有多長(zhǎng)

    新技術(shù)QLC來了固態(tài)硬盤壽命有多長(zhǎng)2,QLC閃存固態(tài)硬盤SSD需要害怕嗎3,臺(tái)式機(jī)電腦配置如圖兩個(gè)硬盤哪個(gè)好為什么TLC比MLC的速度還快4,F(xiàn)lash芯片總述及SLCMLCTLC和QLC的區(qū)別5,現(xiàn)在QLCTLC的SSD.....

    知識(shí) 日期:2023-08-18

  • 調(diào)光,照相機(jī)照片光線怎么調(diào)光調(diào)光,照相機(jī)照片光線怎么調(diào)光

    照相機(jī)照片光線怎么調(diào)光2,怎樣調(diào)光度3,怎么樣調(diào)整光度4,華為手機(jī)拍照如何調(diào)光5,led燈具如何實(shí)現(xiàn)調(diào)光6,汽車的燈光如何調(diào)整1,照相機(jī)照片光線怎么調(diào)光直接曲線提亮。2,怎樣調(diào)光度顯示器上有個(gè)按.....

    知識(shí) 日期:2023-08-18

  • esp01s,奧迪A6L30 用鑰匙啟動(dòng)無反應(yīng)顯示ESP故障是否與變速箱電腦故esp01s,奧迪A6L30 用鑰匙啟動(dòng)無反應(yīng)顯示ESP故障是否與變速箱電腦故

    奧迪A6L30用鑰匙啟動(dòng)無反應(yīng)顯示ESP故障是否與變速箱電腦故2,ESP警報(bào)出現(xiàn)了要注意什么3,汽車安全配置sep具有什么功能4,上古卷軸5NMM的MOD文件esp排序求大神幫我整理一下順序讓我進(jìn)5,esp故.....

    知識(shí) 日期:2023-08-18

  • 單片機(jī)英語,單片機(jī)英語怎么說單片機(jī)英語,單片機(jī)英語怎么說

    單片機(jī)英語怎么說2,單片機(jī)英語文章翻譯3,幫忙翻譯單片機(jī)英文摘要4,單片機(jī)英文翻譯謝謝大家急用15,單片機(jī)翻譯1,單片機(jī)英語怎么說Singlechip例句:給出了單片機(jī)自動(dòng)控制系統(tǒng)的硬件和軟件設(shè)計(jì)圖.....

    知識(shí) 日期:2023-08-18

  • 大數(shù)據(jù)團(tuán)隊(duì)口號(hào),最有氣勢(shì)的團(tuán)隊(duì)口號(hào)大數(shù)據(jù)團(tuán)隊(duì)口號(hào),最有氣勢(shì)的團(tuán)隊(duì)口號(hào)

    所謂厚度數(shù)據(jù)和重點(diǎn)數(shù)據(jù)size數(shù)據(jù)是不一樣的。好的數(shù)據(jù)視圖通常來自厚的數(shù)據(jù)而不是大的數(shù)據(jù),團(tuán)隊(duì)管理計(jì)劃第一章一.團(tuán)隊(duì)設(shè)立計(jì)劃圖二,討論并最終決定本團(tuán)隊(duì)Our團(tuán)隊(duì)Name:TrustOur-1,如何做.....

    知識(shí) 日期:2023-08-18

  • 感抗和容抗的計(jì)算公式,感抗和容抗公式感抗和容抗的計(jì)算公式,感抗和容抗公式

    感抗和容抗公式2,容抗和感抗公式是什么3,感抗與容抗4,感抗和容抗的計(jì)算公式是什么5,感抗容抗公式的推導(dǎo)過程6,感抗和容抗的公式7,在正弦交流電路中純電感的感抗等于電容器的容抗等于8,感抗和.....

    知識(shí) 日期:2023-08-18

  • spi是什么,psi是什么單位表示的是什么單位怎么換算的spi是什么,psi是什么單位表示的是什么單位怎么換算的

    psi是什么單位表示的是什么單位怎么換算的2,SPI和IO區(qū)別3,什么是硫化氫4,spa是什么意思5,ESP是什么呢6,ftp是什么啊1,psi是什么單位表示的是什么單位怎么換算的是壓力單位,1psi=6.895kpa2,SPI.....

    知識(shí) 日期:2023-08-18