問題已開啟
(普通問題)
現(xiàn)有通信系統(tǒng)的語音編碼器都有哪些啊?詳細(xì)介紹一下喂,謝謝了!
最好能分別介紹第一代、第二代(GSM)和第三代(CDMA)及(TD-SCDMA)分別用了哪些編碼器?它們的原理和技術(shù)特點(diǎn)分別是什么?
• 有通信工程師找單位嗎?? 2020-08-20
• 剛購買的電腦版5G移動(dòng)通信與架構(gòu)在哪里打開 2020-08-03
• 移動(dòng)的volte通信中視頻編碼是誰負(fù)責(zé)會(huì)不會(huì)根據(jù)網(wǎng)絡(luò)環(huán)境動(dòng)態(tài)調(diào)整碼率? 2020-07-31
• 怎樣了解5G通信 2020-07-30
• 怎樣了解5G通信 2020-07-30
• 怎樣了解5G通信 2020-07-30
• 怎樣報(bào)考通信工程師認(rèn)證? 2020-07-30
• 有沒高級通信,中級通信工程師可以掛資質(zhì)的 2020-07-29
• 剛購買的電腦版5G移動(dòng)通信與架構(gòu)在哪里打開 2020-08-03
• 移動(dòng)的volte通信中視頻編碼是誰負(fù)責(zé)會(huì)不會(huì)根據(jù)網(wǎng)絡(luò)環(huán)境動(dòng)態(tài)調(diào)整碼率? 2020-07-31
• 怎樣了解5G通信 2020-07-30
• 怎樣了解5G通信 2020-07-30
• 怎樣了解5G通信 2020-07-30
• 怎樣報(bào)考通信工程師認(rèn)證? 2020-07-30
• 有沒高級通信,中級通信工程師可以掛資質(zhì)的 2020-07-29
問題答案
( 1 )
語音編解碼器
語音編碼器分為三種類形:(a)波形編器;(b)聲碼器;(c)混合編碼器。
波形編碼器會(huì)盡可能構(gòu)出包括背景噪單在內(nèi)的模擬波形。由于波形編碼器作用于所有輸入信號,因此會(huì)產(chǎn)生高質(zhì)量的樣值。然而,波形編碼器工作在高比特率。例如:ITU-G.711規(guī)范(PCM)用的比特率為64Kbps。 聲碼器(vocoder)不會(huì)再生原始波形。這組編碼器會(huì)提取一組參數(shù),這組參數(shù)被送到接收端,用來導(dǎo)出語音產(chǎn)生模形。線性預(yù)測編碼(LPC)用來獲取一時(shí)變數(shù)字濾波器的參數(shù)。這個(gè)濾波器用來模擬說話人的聲道輸出[WEST96]。在電話系統(tǒng)中使用聲碼器,語音質(zhì)量不夠好。在VOIP中常用的語音編碼器是混合編碼器,它融入了波形編碼器和聲器的長處,它的另一特點(diǎn)是它工作在非常低的比特率(4-6Kbps);旌暇幋a器采用合成分析(AbS)。
為了說明問題,考慮人的聲道產(chǎn)生的一個(gè)語音模式:當(dāng)人說話產(chǎn)生語音信號時(shí)就會(huì)發(fā)出濁音(如音素pa、da等)和清音(如音素sh、th)。激勵(lì)信號就是由輸入的語音信號導(dǎo)出的,其方法是使合成語音與輸入語音的差別非常小。LPC的用法、激勵(lì)的產(chǎn)生以及對合成分析(AbS)系統(tǒng)的誤差檢查均如圖4-1所示。 長話質(zhì)量編碼器在比特率高于8Kbps時(shí)容易實(shí)現(xiàn),如圖4-2所示。長話質(zhì)量的語音平均意見得分(MOS)必須在分或許分以上。傳統(tǒng)的PCN語音在比特率小于32 Kbps,語音質(zhì)量會(huì)嚴(yán)重惡化,在這里就不討論P(yáng)CN了。混合編碼和聲碼器在比特率相當(dāng)?shù)偷腗OS上的得分是可接受的。在現(xiàn)階段,大多數(shù)基于VOIP的編碼器的工作范圍在5.2~8kbps。研究表明,標(biāo)準(zhǔn)的編碼器在比特率為4 Kbps時(shí)能提供可接受的NOS得分,一些分用系統(tǒng)在4.8 Kbps的MOS上的得分為3.8。 矢量量化和碼激勵(lì)線性預(yù)測 一種較好的方法就是用預(yù)測存儲(chǔ)的最優(yōu)參數(shù)(碼元矢量)的碼本對輸入語音信號的表示矢量進(jìn)行編碼,這種技術(shù)稱為矢量量化(VQ,vector quantization)。 將VQ和AbS技術(shù)結(jié)合在一起會(huì)進(jìn)一步提高編碼性能。AbS VQ是技術(shù)構(gòu)成CELP的基礎(chǔ)。VQ和AbS VQ的主要區(qū)別在于進(jìn)行矢量量化碼簿搜索時(shí)采用的量化失真測量定義的不同
如果以8 kHz采樣率及13位精度來對出自GSM蜂窩手機(jī)麥克風(fēng)的音頻數(shù)據(jù)進(jìn)行采樣,則可得到104kbps的源數(shù)據(jù)速率。GSM系統(tǒng)中有四種編解碼器,分別執(zhí)行:全速率、增強(qiáng)型全速率(EFR)、自適應(yīng)多速率(AMR)及半速率語音壓縮。表1給出了一些聲碼器的參數(shù)比較。
全速率
全速率語音編解碼器是改良的線性預(yù)測編碼器(LPC),它將人類聲域建模成一系列不同寬度的圓柱體。通過迫使空氣通過這些柱體,即可產(chǎn)生語音。LPC編碼器用一組聯(lián)立方程來進(jìn)行建模。
標(biāo)準(zhǔn)LPC編碼器不能提供電話系統(tǒng)所需的話音質(zhì)量(雖能聽清語句,但很難或不可能分辨出說話的人)。GSM系統(tǒng)中采用兩種技術(shù)來提高LPC編碼器的質(zhì)量,即:長期預(yù)測(LTP)與規(guī)則脈沖激勵(lì)(RPE),而全速率編解碼器就被稱為RPE-LTP線性預(yù)測編碼器。
輸入至RPE-LTP編碼器的數(shù)據(jù)為包括160個(gè)采樣值的20ms語音,每一個(gè)采樣值都擁有13位精度。數(shù)據(jù)首先通過預(yù)加重濾波器來提高信號的高頻分量,以獲得更好的傳輸效率。濾波器一般還消除信號上的任何偏移以簡化進(jìn)一步的計(jì)算。
正如前面所提到的,語音產(chǎn)生模型可看成是空氣通過一組不同大小的圓柱體。短期分析級采用自動(dòng)相關(guān)來計(jì)算與模型所用的8個(gè)圓柱體有關(guān)的8個(gè)反射系數(shù),同時(shí)采用一種稱為Schur遞歸的技術(shù)來有效地求解所得到的方程組。參數(shù)被變換成可以更少的位數(shù)來進(jìn)行更佳量化的LAR(log-area ratio)。這些是傳輸流的前8個(gè)參數(shù)。
然后再將編碼后的LAR解碼成系數(shù),并用來對輸入采樣值進(jìn)行濾波。解碼LAR的原因是為了確保編碼器使用解碼器上的相同信息來進(jìn)行濾波。這一級上的其余采樣值用于編解碼器的LTP級。
160個(gè)采樣值被分成4個(gè)子窗口,每一個(gè)子窗口都擁有40個(gè)采樣值。長期預(yù)測器為每一子窗口產(chǎn)生2個(gè)參數(shù):滯后與增益。滯后由當(dāng)前幀與后兩幀之間的交叉相關(guān)峰值確定,而增益則由歸一化交叉相關(guān)系數(shù)決定。滯后與增益參數(shù)被應(yīng)用到長期濾波器上,同時(shí)對現(xiàn)有短期剩余信號進(jìn)行預(yù)測。
RPE級通過十取一及交錯(cuò)將40個(gè)剩余采樣值轉(zhuǎn)換成13個(gè)參數(shù),并用APCM將所得出的13個(gè)值編碼,其中最大值用對數(shù)編碼成6位,然后再將13個(gè)參數(shù)均表示成3位,總共45位。
最后一級是從計(jì)算出的長期剩余及分析信號來更新短期剩余信號,然后再用此數(shù)據(jù)來計(jì)算下一幀。
增強(qiáng)型全速率
全速率編解碼器是一種用來傳輸語音并在計(jì)算上相當(dāng)有效的方法,但通過使用更為密集的算法,語音質(zhì)量還能提高。全速率編解碼器首先在1990年代初的DSP上實(shí)現(xiàn),當(dāng)時(shí)在經(jīng)濟(jì)上雖不能采用質(zhì)量更好的編碼器但卻是一種更為密集的算法。
至1990年代中,功能更強(qiáng)的DSP內(nèi)核的可用性已不再是一個(gè)問題,因此增強(qiáng)型全速率編解碼器開始在手機(jī)中出現(xiàn)。
EFR聲碼器是一種代數(shù)碼激勵(lì)線性預(yù)測(ACELP)編碼器,且不同于采用分析加合成方法的全速率系統(tǒng)。它計(jì)算雖更加密集但能在輸出端得到更為精確的結(jié)果。預(yù)處理級由80Hz高通濾波器及一些縮減電路組成,以使實(shí)現(xiàn)更為容易。每幀進(jìn)行兩次短期分析,由與兩個(gè)30mS(1.5個(gè)語音幀)、長度集中在不同子幀上的不同非對稱窗口自動(dòng)關(guān)聯(lián)。所得到的系數(shù)被變換成線譜對(line spectral pairs)并被量化成38位,以獲得更好的傳輸效率。
同時(shí)執(zhí)行開環(huán)間隔(pitch)分析來計(jì)算每幀的間隔滯后估計(jì)值,然后再用此估計(jì)值啟動(dòng)閉環(huán)搜索(以得出更快的結(jié)果)。再將所得到的閉環(huán)值應(yīng)用于合成器及與非量化輸入比較后的結(jié)果上(即分析加合成),最小的加權(quán)誤差從自適應(yīng)編碼本(codebook)上得出并被編碼成每子幀35位。
然后再用代數(shù)(固定) 編碼本、并再一次用分析加合成方法來對量化后余下的剩余信號進(jìn)行建模。所得到的編碼本增益被編碼成每子幀5位。
最后,正如全速率聲碼器中一樣,針對下一幀將存儲(chǔ)器刷新。
EFR聲碼器的12.2kbps輸出等于每幀244位。但編碼語音是通過擁有260位容量的常規(guī)GSM全速率空中信道來傳輸,其余16位被填以CRC以及重復(fù)一些用于冗余的最重要編解碼器參數(shù)。
自適應(yīng)多速率
當(dāng)全部參數(shù)均能解碼時(shí),全速率及EFR編解碼器可實(shí)現(xiàn)良好的語音再現(xiàn)。由于傳輸信道的冗余(請記住,原始信道容量比數(shù)據(jù)載荷大10kbps),故許多原始位可以出錯(cuò)且參數(shù)仍能恢復(fù)。
但當(dāng)參數(shù)丟失或錯(cuò)誤時(shí),所接收信號的質(zhì)量將迅速下降(參見圖3中的最右側(cè)黑色曲線)。
這也是AMR編解碼器組所試圖解決的問題。通過指定8個(gè)全都共享公共數(shù)學(xué)算法的聲碼器組,可改變信道的冗余量。以此種方式,語音傳輸?shù)馁|(zhì)量可能會(huì)由于降至更低的編碼速率上而稍微有所下降,但覆蓋編碼參數(shù)的信心則得以提高。
結(jié)果是在載波干擾增加的情況下可獲得感覺更好的語音信號質(zhì)量(如圖3)。
AMR編解碼器組由速率從12.2kbps至4.75kbps的ACELP聲碼器組成,故可提供87%至480%的冗余。在一種很糟的情況下,即全速率及EFR幀丟失很久后,4.75kbps編解碼器數(shù)據(jù)仍能恢復(fù)。
半速率
GSM所采用的空中接口允許使用兩個(gè)完全獨(dú)立的半速率子信道,故能使蜂窩單元的語音容量加倍。半速率聲碼器采用矢量和激勵(lì)線性預(yù)(VSELP)編碼器,它以一種類似EFR及AMR編解碼器的分析加合成方式工作,速率為5.7kbps。
半速率聲碼器的輸出幀包含用來指示幀聲音內(nèi)容的2個(gè)位。該聲碼器工作方式在每種模式下略微有些不同,故可獲得最佳的音頻數(shù)據(jù)再現(xiàn)質(zhì)量。
人們對半速率語音的感覺普遍不佳,所以今天一般不采用此項(xiàng)技術(shù)。但以其自適應(yīng)模式,AMR聲碼器的6種較低速率將適合半速率空中信道的可用容量,結(jié)果是采用帶AMR的半速率信道將在高流量領(lǐng)域變得更為普遍。
非連續(xù)傳輸
在典型的談話過程中,語音僅占總時(shí)間的大約40%。為減少對無線接口的干擾,可采用非連續(xù)傳輸(DTX),即移動(dòng)電話僅在有語音信號時(shí)才進(jìn)行傳輸。此功能要求有如下幾項(xiàng)內(nèi)容,即:語音活動(dòng)檢測(VAD)、用于空中接口的靜寂描述符(SID)幀及舒適噪音產(chǎn)生等。
為減少猝發(fā)傳輸?shù)目倳r(shí)間,語音解碼器必須能確定什么時(shí)候有語音。由于編碼的自然特性,可通過分析中間參數(shù)來精確確定是否有語音。重要的是要保證閾值合適,太靈敏會(huì)由于無線傳輸次數(shù)太多而對空中接口不利,而靈敏度不夠則會(huì)切斷語音并使聲音質(zhì)量嚴(yán)重下降。
盡管在理論上VAD是實(shí)現(xiàn)DTX所需的全部,但來自接收器的完全靜寂降低整體感覺質(zhì)量。為解決此問題,接收器采用了“舒適噪音”功能,即利用SID幀參數(shù)的逐漸衰減來產(chǎn)生類似發(fā)射器背景噪音的聲音。
當(dāng)VAD確定沒有語音時(shí),在空中接口上不進(jìn)行傳輸(實(shí)際情況比這更復(fù)雜一些,但其基本原理一樣)。經(jīng)過一段預(yù)定時(shí)間間隔后,再發(fā)送一個(gè)包含一組參數(shù)的SID幀,這些參數(shù)用于接收器舒適噪音產(chǎn)生功能。
最佳實(shí)現(xiàn)
語音編碼功能可解釋為像卷積這樣的數(shù)學(xué)密集型處理,在帶有處理這類計(jì)算指令(例如乘法-累加指令)的專用DSP上能得到最佳實(shí)現(xiàn)。盡管這可以在通用處理器上實(shí)現(xiàn),但要求有更高數(shù)量級的時(shí)鐘速度來與同樣的執(zhí)行速度相匹配。
不同處理內(nèi)核中所實(shí)現(xiàn)的EFR及全速率聲碼器執(zhí)行速度不同。作為一種與時(shí)鐘速度有關(guān)的比較,DSP全速率實(shí)現(xiàn)的速度大約要比奔騰處理器實(shí)現(xiàn)的速度快3.5倍,而經(jīng)徹底優(yōu)化后的SC140實(shí)現(xiàn)的速度要比奔騰處理器實(shí)現(xiàn)的速度整整快18倍。
在語音編解碼器中采用了許多優(yōu)化技術(shù)。最初一般將數(shù)據(jù)偏移以使計(jì)算更加容易并能再利用存儲(chǔ)器空間。例如,用剩余濾波器寫入輸入陣列而不使用新存儲(chǔ)器空間。
處理器可采用定制浮點(diǎn)實(shí)現(xiàn)來在內(nèi)核中提供浮點(diǎn)支持。這些實(shí)現(xiàn)不是位精確的,這意味著它們不能得出像定點(diǎn)參考實(shí)現(xiàn)一樣精確的數(shù)學(xué)結(jié)果。但通過軟硬件中針對這類數(shù)學(xué)算法的優(yōu)化,速度可明顯提高。而輸出參數(shù),當(dāng)被送入定點(diǎn)解碼器時(shí),將產(chǎn)生感覺上一樣的聲音幀。
測試位序列
為檢驗(yàn)依從性,ETSI頒布了一組全面的測試位序列。它們由輸入文件(160個(gè)13位采樣值)、編碼文件(通過解碼器的結(jié)果)、一些解碼文件(用于直接提供給解碼器)以及輸出文件(代表來自輸出的160個(gè)采樣值)組成。
而像VAD及舒適噪音產(chǎn)生等額外功能,則用各種序列進(jìn)行隱含測試。同時(shí)也對不同輸入壓縮擴(kuò)展方案(A-law和(-law)進(jìn)行測試。
浮點(diǎn)實(shí)現(xiàn)一般不遵循ETSI位序列,但能產(chǎn)生一組感覺上與定點(diǎn)編碼器及解碼器相兼容的參數(shù)。
對語音編碼器實(shí)現(xiàn)的定性評價(jià),可用Racal儀器公司帶VQA的AIME系統(tǒng)來測試。這種系統(tǒng)允許建立原始流量信道(無需完全的GSM協(xié)議實(shí)現(xiàn)),且能執(zhí)行全速率的空中傳輸雙向語音編碼。
語音編碼器分為三種類形:(a)波形編器;(b)聲碼器;(c)混合編碼器。
波形編碼器會(huì)盡可能構(gòu)出包括背景噪單在內(nèi)的模擬波形。由于波形編碼器作用于所有輸入信號,因此會(huì)產(chǎn)生高質(zhì)量的樣值。然而,波形編碼器工作在高比特率。例如:ITU-G.711規(guī)范(PCM)用的比特率為64Kbps。 聲碼器(vocoder)不會(huì)再生原始波形。這組編碼器會(huì)提取一組參數(shù),這組參數(shù)被送到接收端,用來導(dǎo)出語音產(chǎn)生模形。線性預(yù)測編碼(LPC)用來獲取一時(shí)變數(shù)字濾波器的參數(shù)。這個(gè)濾波器用來模擬說話人的聲道輸出[WEST96]。在電話系統(tǒng)中使用聲碼器,語音質(zhì)量不夠好。在VOIP中常用的語音編碼器是混合編碼器,它融入了波形編碼器和聲器的長處,它的另一特點(diǎn)是它工作在非常低的比特率(4-6Kbps);旌暇幋a器采用合成分析(AbS)。
為了說明問題,考慮人的聲道產(chǎn)生的一個(gè)語音模式:當(dāng)人說話產(chǎn)生語音信號時(shí)就會(huì)發(fā)出濁音(如音素pa、da等)和清音(如音素sh、th)。激勵(lì)信號就是由輸入的語音信號導(dǎo)出的,其方法是使合成語音與輸入語音的差別非常小。LPC的用法、激勵(lì)的產(chǎn)生以及對合成分析(AbS)系統(tǒng)的誤差檢查均如圖4-1所示。 長話質(zhì)量編碼器在比特率高于8Kbps時(shí)容易實(shí)現(xiàn),如圖4-2所示。長話質(zhì)量的語音平均意見得分(MOS)必須在分或許分以上。傳統(tǒng)的PCN語音在比特率小于32 Kbps,語音質(zhì)量會(huì)嚴(yán)重惡化,在這里就不討論P(yáng)CN了。混合編碼和聲碼器在比特率相當(dāng)?shù)偷腗OS上的得分是可接受的。在現(xiàn)階段,大多數(shù)基于VOIP的編碼器的工作范圍在5.2~8kbps。研究表明,標(biāo)準(zhǔn)的編碼器在比特率為4 Kbps時(shí)能提供可接受的NOS得分,一些分用系統(tǒng)在4.8 Kbps的MOS上的得分為3.8。 矢量量化和碼激勵(lì)線性預(yù)測 一種較好的方法就是用預(yù)測存儲(chǔ)的最優(yōu)參數(shù)(碼元矢量)的碼本對輸入語音信號的表示矢量進(jìn)行編碼,這種技術(shù)稱為矢量量化(VQ,vector quantization)。 將VQ和AbS技術(shù)結(jié)合在一起會(huì)進(jìn)一步提高編碼性能。AbS VQ是技術(shù)構(gòu)成CELP的基礎(chǔ)。VQ和AbS VQ的主要區(qū)別在于進(jìn)行矢量量化碼簿搜索時(shí)采用的量化失真測量定義的不同
如果以8 kHz采樣率及13位精度來對出自GSM蜂窩手機(jī)麥克風(fēng)的音頻數(shù)據(jù)進(jìn)行采樣,則可得到104kbps的源數(shù)據(jù)速率。GSM系統(tǒng)中有四種編解碼器,分別執(zhí)行:全速率、增強(qiáng)型全速率(EFR)、自適應(yīng)多速率(AMR)及半速率語音壓縮。表1給出了一些聲碼器的參數(shù)比較。
全速率
全速率語音編解碼器是改良的線性預(yù)測編碼器(LPC),它將人類聲域建模成一系列不同寬度的圓柱體。通過迫使空氣通過這些柱體,即可產(chǎn)生語音。LPC編碼器用一組聯(lián)立方程來進(jìn)行建模。
標(biāo)準(zhǔn)LPC編碼器不能提供電話系統(tǒng)所需的話音質(zhì)量(雖能聽清語句,但很難或不可能分辨出說話的人)。GSM系統(tǒng)中采用兩種技術(shù)來提高LPC編碼器的質(zhì)量,即:長期預(yù)測(LTP)與規(guī)則脈沖激勵(lì)(RPE),而全速率編解碼器就被稱為RPE-LTP線性預(yù)測編碼器。
輸入至RPE-LTP編碼器的數(shù)據(jù)為包括160個(gè)采樣值的20ms語音,每一個(gè)采樣值都擁有13位精度。數(shù)據(jù)首先通過預(yù)加重濾波器來提高信號的高頻分量,以獲得更好的傳輸效率。濾波器一般還消除信號上的任何偏移以簡化進(jìn)一步的計(jì)算。
正如前面所提到的,語音產(chǎn)生模型可看成是空氣通過一組不同大小的圓柱體。短期分析級采用自動(dòng)相關(guān)來計(jì)算與模型所用的8個(gè)圓柱體有關(guān)的8個(gè)反射系數(shù),同時(shí)采用一種稱為Schur遞歸的技術(shù)來有效地求解所得到的方程組。參數(shù)被變換成可以更少的位數(shù)來進(jìn)行更佳量化的LAR(log-area ratio)。這些是傳輸流的前8個(gè)參數(shù)。
然后再將編碼后的LAR解碼成系數(shù),并用來對輸入采樣值進(jìn)行濾波。解碼LAR的原因是為了確保編碼器使用解碼器上的相同信息來進(jìn)行濾波。這一級上的其余采樣值用于編解碼器的LTP級。
160個(gè)采樣值被分成4個(gè)子窗口,每一個(gè)子窗口都擁有40個(gè)采樣值。長期預(yù)測器為每一子窗口產(chǎn)生2個(gè)參數(shù):滯后與增益。滯后由當(dāng)前幀與后兩幀之間的交叉相關(guān)峰值確定,而增益則由歸一化交叉相關(guān)系數(shù)決定。滯后與增益參數(shù)被應(yīng)用到長期濾波器上,同時(shí)對現(xiàn)有短期剩余信號進(jìn)行預(yù)測。
RPE級通過十取一及交錯(cuò)將40個(gè)剩余采樣值轉(zhuǎn)換成13個(gè)參數(shù),并用APCM將所得出的13個(gè)值編碼,其中最大值用對數(shù)編碼成6位,然后再將13個(gè)參數(shù)均表示成3位,總共45位。
最后一級是從計(jì)算出的長期剩余及分析信號來更新短期剩余信號,然后再用此數(shù)據(jù)來計(jì)算下一幀。
增強(qiáng)型全速率
全速率編解碼器是一種用來傳輸語音并在計(jì)算上相當(dāng)有效的方法,但通過使用更為密集的算法,語音質(zhì)量還能提高。全速率編解碼器首先在1990年代初的DSP上實(shí)現(xiàn),當(dāng)時(shí)在經(jīng)濟(jì)上雖不能采用質(zhì)量更好的編碼器但卻是一種更為密集的算法。
至1990年代中,功能更強(qiáng)的DSP內(nèi)核的可用性已不再是一個(gè)問題,因此增強(qiáng)型全速率編解碼器開始在手機(jī)中出現(xiàn)。
EFR聲碼器是一種代數(shù)碼激勵(lì)線性預(yù)測(ACELP)編碼器,且不同于采用分析加合成方法的全速率系統(tǒng)。它計(jì)算雖更加密集但能在輸出端得到更為精確的結(jié)果。預(yù)處理級由80Hz高通濾波器及一些縮減電路組成,以使實(shí)現(xiàn)更為容易。每幀進(jìn)行兩次短期分析,由與兩個(gè)30mS(1.5個(gè)語音幀)、長度集中在不同子幀上的不同非對稱窗口自動(dòng)關(guān)聯(lián)。所得到的系數(shù)被變換成線譜對(line spectral pairs)并被量化成38位,以獲得更好的傳輸效率。
同時(shí)執(zhí)行開環(huán)間隔(pitch)分析來計(jì)算每幀的間隔滯后估計(jì)值,然后再用此估計(jì)值啟動(dòng)閉環(huán)搜索(以得出更快的結(jié)果)。再將所得到的閉環(huán)值應(yīng)用于合成器及與非量化輸入比較后的結(jié)果上(即分析加合成),最小的加權(quán)誤差從自適應(yīng)編碼本(codebook)上得出并被編碼成每子幀35位。
然后再用代數(shù)(固定) 編碼本、并再一次用分析加合成方法來對量化后余下的剩余信號進(jìn)行建模。所得到的編碼本增益被編碼成每子幀5位。
最后,正如全速率聲碼器中一樣,針對下一幀將存儲(chǔ)器刷新。
EFR聲碼器的12.2kbps輸出等于每幀244位。但編碼語音是通過擁有260位容量的常規(guī)GSM全速率空中信道來傳輸,其余16位被填以CRC以及重復(fù)一些用于冗余的最重要編解碼器參數(shù)。
自適應(yīng)多速率
當(dāng)全部參數(shù)均能解碼時(shí),全速率及EFR編解碼器可實(shí)現(xiàn)良好的語音再現(xiàn)。由于傳輸信道的冗余(請記住,原始信道容量比數(shù)據(jù)載荷大10kbps),故許多原始位可以出錯(cuò)且參數(shù)仍能恢復(fù)。
但當(dāng)參數(shù)丟失或錯(cuò)誤時(shí),所接收信號的質(zhì)量將迅速下降(參見圖3中的最右側(cè)黑色曲線)。
這也是AMR編解碼器組所試圖解決的問題。通過指定8個(gè)全都共享公共數(shù)學(xué)算法的聲碼器組,可改變信道的冗余量。以此種方式,語音傳輸?shù)馁|(zhì)量可能會(huì)由于降至更低的編碼速率上而稍微有所下降,但覆蓋編碼參數(shù)的信心則得以提高。
結(jié)果是在載波干擾增加的情況下可獲得感覺更好的語音信號質(zhì)量(如圖3)。
AMR編解碼器組由速率從12.2kbps至4.75kbps的ACELP聲碼器組成,故可提供87%至480%的冗余。在一種很糟的情況下,即全速率及EFR幀丟失很久后,4.75kbps編解碼器數(shù)據(jù)仍能恢復(fù)。
半速率
GSM所采用的空中接口允許使用兩個(gè)完全獨(dú)立的半速率子信道,故能使蜂窩單元的語音容量加倍。半速率聲碼器采用矢量和激勵(lì)線性預(yù)(VSELP)編碼器,它以一種類似EFR及AMR編解碼器的分析加合成方式工作,速率為5.7kbps。
半速率聲碼器的輸出幀包含用來指示幀聲音內(nèi)容的2個(gè)位。該聲碼器工作方式在每種模式下略微有些不同,故可獲得最佳的音頻數(shù)據(jù)再現(xiàn)質(zhì)量。
人們對半速率語音的感覺普遍不佳,所以今天一般不采用此項(xiàng)技術(shù)。但以其自適應(yīng)模式,AMR聲碼器的6種較低速率將適合半速率空中信道的可用容量,結(jié)果是采用帶AMR的半速率信道將在高流量領(lǐng)域變得更為普遍。
非連續(xù)傳輸
在典型的談話過程中,語音僅占總時(shí)間的大約40%。為減少對無線接口的干擾,可采用非連續(xù)傳輸(DTX),即移動(dòng)電話僅在有語音信號時(shí)才進(jìn)行傳輸。此功能要求有如下幾項(xiàng)內(nèi)容,即:語音活動(dòng)檢測(VAD)、用于空中接口的靜寂描述符(SID)幀及舒適噪音產(chǎn)生等。
為減少猝發(fā)傳輸?shù)目倳r(shí)間,語音解碼器必須能確定什么時(shí)候有語音。由于編碼的自然特性,可通過分析中間參數(shù)來精確確定是否有語音。重要的是要保證閾值合適,太靈敏會(huì)由于無線傳輸次數(shù)太多而對空中接口不利,而靈敏度不夠則會(huì)切斷語音并使聲音質(zhì)量嚴(yán)重下降。
盡管在理論上VAD是實(shí)現(xiàn)DTX所需的全部,但來自接收器的完全靜寂降低整體感覺質(zhì)量。為解決此問題,接收器采用了“舒適噪音”功能,即利用SID幀參數(shù)的逐漸衰減來產(chǎn)生類似發(fā)射器背景噪音的聲音。
當(dāng)VAD確定沒有語音時(shí),在空中接口上不進(jìn)行傳輸(實(shí)際情況比這更復(fù)雜一些,但其基本原理一樣)。經(jīng)過一段預(yù)定時(shí)間間隔后,再發(fā)送一個(gè)包含一組參數(shù)的SID幀,這些參數(shù)用于接收器舒適噪音產(chǎn)生功能。
最佳實(shí)現(xiàn)
語音編碼功能可解釋為像卷積這樣的數(shù)學(xué)密集型處理,在帶有處理這類計(jì)算指令(例如乘法-累加指令)的專用DSP上能得到最佳實(shí)現(xiàn)。盡管這可以在通用處理器上實(shí)現(xiàn),但要求有更高數(shù)量級的時(shí)鐘速度來與同樣的執(zhí)行速度相匹配。
不同處理內(nèi)核中所實(shí)現(xiàn)的EFR及全速率聲碼器執(zhí)行速度不同。作為一種與時(shí)鐘速度有關(guān)的比較,DSP全速率實(shí)現(xiàn)的速度大約要比奔騰處理器實(shí)現(xiàn)的速度快3.5倍,而經(jīng)徹底優(yōu)化后的SC140實(shí)現(xiàn)的速度要比奔騰處理器實(shí)現(xiàn)的速度整整快18倍。
在語音編解碼器中采用了許多優(yōu)化技術(shù)。最初一般將數(shù)據(jù)偏移以使計(jì)算更加容易并能再利用存儲(chǔ)器空間。例如,用剩余濾波器寫入輸入陣列而不使用新存儲(chǔ)器空間。
處理器可采用定制浮點(diǎn)實(shí)現(xiàn)來在內(nèi)核中提供浮點(diǎn)支持。這些實(shí)現(xiàn)不是位精確的,這意味著它們不能得出像定點(diǎn)參考實(shí)現(xiàn)一樣精確的數(shù)學(xué)結(jié)果。但通過軟硬件中針對這類數(shù)學(xué)算法的優(yōu)化,速度可明顯提高。而輸出參數(shù),當(dāng)被送入定點(diǎn)解碼器時(shí),將產(chǎn)生感覺上一樣的聲音幀。
測試位序列
為檢驗(yàn)依從性,ETSI頒布了一組全面的測試位序列。它們由輸入文件(160個(gè)13位采樣值)、編碼文件(通過解碼器的結(jié)果)、一些解碼文件(用于直接提供給解碼器)以及輸出文件(代表來自輸出的160個(gè)采樣值)組成。
而像VAD及舒適噪音產(chǎn)生等額外功能,則用各種序列進(jìn)行隱含測試。同時(shí)也對不同輸入壓縮擴(kuò)展方案(A-law和(-law)進(jìn)行測試。
浮點(diǎn)實(shí)現(xiàn)一般不遵循ETSI位序列,但能產(chǎn)生一組感覺上與定點(diǎn)編碼器及解碼器相兼容的參數(shù)。
對語音編碼器實(shí)現(xiàn)的定性評價(jià),可用Racal儀器公司帶VQA的AIME系統(tǒng)來測試。這種系統(tǒng)允許建立原始流量信道(無需完全的GSM協(xié)議實(shí)現(xiàn)),且能執(zhí)行全速率的空中傳輸雙向語音編碼。
回答者:
wangyuan072
回答時(shí)間:2009-05-17 14:03


• 上海德專信息技術(shù)有限公司
聘:內(nèi)蒙古初級后臺
需求人數(shù):2 人 地點(diǎn):內(nèi)蒙古
• 河南創(chuàng)賽通信科技有限公司 聘:5G測試實(shí)習(xí)生
需求人數(shù):30 人 地點(diǎn):濟(jì)南市,棗莊市,淄博市,東營市,煙臺市
• 嘉環(huán)科技股份有限公司 聘:核心網(wǎng)工程師-IMC青海
需求人數(shù):2 人 地點(diǎn):西寧市
• 杭州華星博鴻通信技術(shù)有限公司 聘:優(yōu)化規(guī)劃工程師(后臺-安徽)
需求人數(shù):5 人 地點(diǎn):馬鞍山市
• 杭州東信網(wǎng)絡(luò)技術(shù)有限公司 聘:華為高端優(yōu)化項(xiàng)目(南京)
需求人數(shù):1 人 地點(diǎn):南京市
• 重慶信科通信工程有限公司 聘:南昌電信中興原廠高級
需求人數(shù):2 人 地點(diǎn):南昌市
• 廣東世炬網(wǎng)絡(luò)科技股份有限公司 聘:AI工程師
需求人數(shù):1 人 地點(diǎn):云南省
• 南京順盛通信科技有限責(zé)任公司 聘:中高級優(yōu)化工程師
需求人數(shù):35 人 地點(diǎn):宜春市,贛州市,萍鄉(xiāng)市
• 元道通信股份有限公司 聘:愛立信督導(dǎo)/黑龍江哈爾濱
需求人數(shù):1 人 地點(diǎn):哈爾濱市
• 西安長河通訊有限責(zé)任公司 聘:網(wǎng)絡(luò)資源管理工程師
需求人數(shù):3 人 地點(diǎn):香港
需求人數(shù):2 人 地點(diǎn):內(nèi)蒙古
• 河南創(chuàng)賽通信科技有限公司 聘:5G測試實(shí)習(xí)生
需求人數(shù):30 人 地點(diǎn):濟(jì)南市,棗莊市,淄博市,東營市,煙臺市
• 嘉環(huán)科技股份有限公司 聘:核心網(wǎng)工程師-IMC青海
需求人數(shù):2 人 地點(diǎn):西寧市
• 杭州華星博鴻通信技術(shù)有限公司 聘:優(yōu)化規(guī)劃工程師(后臺-安徽)
需求人數(shù):5 人 地點(diǎn):馬鞍山市
• 杭州東信網(wǎng)絡(luò)技術(shù)有限公司 聘:華為高端優(yōu)化項(xiàng)目(南京)
需求人數(shù):1 人 地點(diǎn):南京市
• 重慶信科通信工程有限公司 聘:南昌電信中興原廠高級
需求人數(shù):2 人 地點(diǎn):南昌市
• 廣東世炬網(wǎng)絡(luò)科技股份有限公司 聘:AI工程師
需求人數(shù):1 人 地點(diǎn):云南省
• 南京順盛通信科技有限責(zé)任公司 聘:中高級優(yōu)化工程師
需求人數(shù):35 人 地點(diǎn):宜春市,贛州市,萍鄉(xiāng)市
• 元道通信股份有限公司 聘:愛立信督導(dǎo)/黑龍江哈爾濱
需求人數(shù):1 人 地點(diǎn):哈爾濱市
• 西安長河通訊有限責(zé)任公司 聘:網(wǎng)絡(luò)資源管理工程師
需求人數(shù):3 人 地點(diǎn):香港
熱點(diǎn)問題
更多精彩
聯(lián)系我們 - 問通信專家 | Powered by MSCBSC 移動(dòng)通信網(wǎng) © 2006 - |