為了提高語(yǔ)音
信號(hào)處理技術(shù)在工業(yè)生產(chǎn)及日常溝通中的應(yīng)用效果,本文首先對(duì)當(dāng)前語(yǔ)音信號(hào)處理技術(shù)的
發(fā)展及應(yīng)用進(jìn)行了概述,并針對(duì)實(shí)時(shí)或嵌入式情況下,語(yǔ)音信號(hào)的處理及傳輸問(wèn)題,提出一種基于STM32芯片的語(yǔ)音信號(hào)處理及傳輸系統(tǒng),并且針對(duì)系統(tǒng)在復(fù)雜噪聲
環(huán)境下的語(yǔ)音傳輸?shù)馁|(zhì)量問(wèn)題,在系統(tǒng)中引入基于包含兩個(gè)子網(wǎng)絡(luò)的循環(huán)神經(jīng)網(wǎng)絡(luò)的語(yǔ)音增強(qiáng)模型對(duì)其進(jìn)行優(yōu)化。實(shí)驗(yàn)結(jié)果表明,在引入所提改進(jìn)循環(huán)神經(jīng)網(wǎng)絡(luò)的語(yǔ)音增強(qiáng)模型后,降噪語(yǔ)音相較于原始混合語(yǔ)音信號(hào),相關(guān)聲學(xué)特征更明顯,PSSQ和STOI分別提高了30.57%和11.27%。相較于DTLN模型,所提模型不僅在復(fù)雜度有了大大降低,Params和FLOPS分別減少了62.77%和62.42%,語(yǔ)音增強(qiáng)的性能也有一定程度地提高,綜合效果最好。