引言:
在數(shù)字化浪潮席卷的今天,音頻質(zhì)量直接影響著從VoIP通話、視頻會議到智能音箱等應(yīng)用的沉浸式體驗。音頻質(zhì)量評估與測試,不僅是電信、廣播和消費電子領(lǐng)域的技術(shù)基石,更是確保用戶感知卓越的關(guān)鍵環(huán)節(jié)。主觀方法如MOS評分直觀反映人類聽感,而客觀方法如PESQ和E-model以高效算法驅(qū)動自動化測試,二者結(jié)合為行業(yè)提供了精準(zhǔn)的質(zhì)量評估方案。
本文將深入解析音頻質(zhì)量評估的核心方法與測試實踐,帶您走進高品質(zhì)音頻的科學(xué)世界!
音頻質(zhì)量評估簡介
語音質(zhì)量評估就是通過人類或自動化的方法評價語音質(zhì)量。在實踐中,有很多主觀和客觀的方法評價語音質(zhì)量。
主觀評價
主觀評估通過人類聽眾直接評分,反映真實聽覺體驗。常見方法包括:
(1) MOS(Mean Opinion Score,平均意見得分):
MOS值作為一種主觀測試方法,將用戶接聽和感知語音質(zhì)量的行為進行調(diào)研和量化,由不同的調(diào)查用戶分別對原始標(biāo)準(zhǔn)語音和經(jīng)過無線網(wǎng)傳播后的衰退聲音進行主觀感受對比,評出MOS分值。國際電信聯(lián)盟(International Telecommunication Union,ITU)將MOS評測規(guī)范化為ITU-T P.800,其中絕對等級評分(Absolute Category Rating,ACR)應(yīng)用最為廣泛,ACR的詳細(xì)評估標(biāo)準(zhǔn)如下表所示。

(2)CMOS(Comparative Mean Opinion Score)和ABX Test:
CMOS比較處理前后音頻,評估處理(如噪聲抑制)對質(zhì)量的影響。ABX Test用于比較兩段音頻(A為參考,B為處理后,X隨機選擇),聽眾判斷X與A/B的相似性,適合算法對比。
主觀評估直觀,但耗時且受聽眾主觀性、環(huán)境噪聲影響,適合關(guān)鍵場景驗證或客觀方法校準(zhǔn)。
客觀評價
客觀評估通過算法預(yù)測質(zhì)量,分為有參考(Intrusive)和無參考(Non-Intrusive)兩大類,效率高但需與主觀結(jié)果校準(zhǔn)。MOS值是廣泛認(rèn)同的語音質(zhì)量評估標(biāo)準(zhǔn),無論主觀評價或者客觀評價采用何種方法最終所有測量結(jié)果都需要對應(yīng)到MOS值。
(1) 有參考客觀評價
需要原始音頻信號作為參考,常見方法包括:PESQ(Perceptual Evaluation of Speech Quality,基于ITU-T P.862標(biāo)準(zhǔn))、POLQA(Perceptual Objective Listening Quality Analysis,ITU-T P.863標(biāo)準(zhǔn)),STOI(Short-Time Objective Intelligibility,用于評估語音可懂度,基于信號處理算法)和BSSEval(用于盲源分離場景,評估分離音頻的質(zhì)量)。
作為使用最為廣泛使用的PESQ是評價音頻質(zhì)量的常用方法,基于ITU-T P.862標(biāo)準(zhǔn)(2001年發(fā)布),為全參考(Full-Reference)算法,需原始信號和測試信號進行比較。
工作原理:
● 將參考信號(原始語音)和測試信號(經(jīng)過網(wǎng)絡(luò)傳輸?shù)恼Z音)進行時間對齊,補償網(wǎng)絡(luò)延遲和抖動。
● 使用感知模型將信號從時間-幅度域轉(zhuǎn)換為頻率-響度域,模擬人類聽覺。
● 計算兩信號的感知差異,輸出Objective Difference Grade(ODG),范圍0(無損害)到-4(嚴(yán)重?fù)p害)。
● 通過ITU-T P.862.1映射為MOS-LQO(Listening Quality Objective),范圍1(差)到5(優(yōu)秀)。

(2) 無參考客觀評價
無需原始音頻,適合實時場景,常見方法包括:ITU-T P.563(基于信號,用于單端語音質(zhì)量評估)、ANIQUE+(基于聽覺模型,預(yù)測單端語音質(zhì)量)和E-Model(ITU-T G.107,基于傳輸規(guī)劃模型)。
E-Model是國際電信聯(lián)盟電信標(biāo)準(zhǔn)化部門(ITU-T)在G.107推薦中定義的計算模型,主要用于傳輸規(guī)劃。它預(yù)測電話通話的感知質(zhì)量,特別適用于評估VoIP網(wǎng)絡(luò)中的語音質(zhì)量。
工作原理:
E-Model算法主要通過三個網(wǎng)絡(luò)參數(shù)計算出MOS值,Latency、Jitter以及Packet loss。
■ Latency:依賴于RTCP中的SR和RR報文

RTT = T1 - T0 - (t1 - t0)
RTT = receive time ntp - send time ntp - delay_since last srt
■ Jitter
抖動的定義是信號在某特定時刻相對于其理想時間位置上的短期偏離。在網(wǎng)絡(luò)傳輸中,數(shù)據(jù)包可能會經(jīng)過不同的路由鏈路,當(dāng)時的網(wǎng)絡(luò)或擁塞或空閑,最終到達目的地時,與預(yù)期會有所偏差。通過數(shù)據(jù)包的到達情況,我們可以反過來估測網(wǎng)絡(luò)的狀態(tài)變化,用來對發(fā)送端進行指導(dǎo)。抖動的計算只依賴RTP packet。

■ Packet Loss:根據(jù)RTP報文中的Sequence Number計算丟包率
Packet Loss = (Expected RTP Packet Number - RIP Received Packet Number) / Expected RTP Packet Numnber。
信而泰音頻質(zhì)量評估測試方案
在音頻質(zhì)量測試中,通常使用SIP(Session Initiation Protocol)和RTP(Real-time Transport Protocol)流量來模擬和評估實時語音通信。SIP作為信令協(xié)議,負(fù)責(zé)建立、修改和終止會話,通過與SDP(會話描述協(xié)議)配合,協(xié)商媒體參數(shù)(如RTP端口和編碼格式)。RTP則負(fù)責(zé)傳輸音頻數(shù)據(jù),基于UDP協(xié)議提供低延遲傳輸,通過時間戳和序列號確保數(shù)據(jù)同步和順序,RTCP(實時傳輸控制協(xié)議)輔助監(jiān)控傳輸質(zhì)量(如丟包率、抖動)。
信而泰VoIP測試方案以DarPeng2000E測試設(shè)備為核心,模擬企業(yè)IP電話通過CE路由器接入WAN云,再經(jīng)PE路由器連接VoIP網(wǎng)絡(luò)/SIP服務(wù)器與遠(yuǎn)程IP電話的通信場景,通過生成SIP和RTP流量,并結(jié)合標(biāo)準(zhǔn)化算法(如PESQ、E-Model)分析音頻質(zhì)量,延遲,抖動和丟包等指標(biāo),確保測試結(jié)果符合ITU-T標(biāo)準(zhǔn)(如P.862),從而為客戶提供可靠的語音通信優(yōu)化支持,幫助客戶識別潛在問題并提供針對性地優(yōu)化建議,確保語音通信系統(tǒng)的高質(zhì)量和穩(wěn)定性,適用于企業(yè)部署優(yōu)化、運營商網(wǎng)絡(luò)驗證及網(wǎng)絡(luò)質(zhì)量測試,幫助識別瓶頸并提供針對性改進建議。

信而泰VoIP測試方案應(yīng)用場景
1. 在音頻質(zhì)量測試中,用戶可以通過信而泰自主研發(fā)的應(yīng)用與安全仿真平臺ALPS,直接調(diào)用內(nèi)置的SIP+RTP音頻流模板,快速生成標(biāo)準(zhǔn)化的語音通信流量,用于呼叫建立、媒體傳輸?shù)热鞒虦y試。同時,系統(tǒng)也支持用戶自定義構(gòu)建SIP信令和RTP媒體流,以模擬真實業(yè)務(wù)中的各種語音場景。

2. 在測試過程中,用戶可以靈活選擇音頻輸入方式,既可以使用系統(tǒng)默認(rèn)提供的標(biāo)準(zhǔn)語音樣本文件進行測試,也支持上傳真實的業(yè)務(wù)音頻文件,以更貼近實際應(yīng)用場景。默認(rèn)音頻文件便于快速開展基準(zhǔn)測試,而真實音頻文件則有助于驗證在具體語音內(nèi)容和編碼格式下的傳輸質(zhì)量。

3. 關(guān)鍵網(wǎng)絡(luò)性能指標(biāo)統(tǒng)計,如丟包率、時延和抖動,全面評估語音質(zhì)量的穩(wěn)定性與清晰度。同時,結(jié)合ITU-T推薦的E-Model算法計算R-Factor和MOS值,以及PESQ算法的MOS評分,兼顧客觀建模與主觀聽感模擬。多維度的質(zhì)量評估幫助用戶全面掌握語音通信在不同網(wǎng)絡(luò)環(huán)境下的真實表現(xiàn),為產(chǎn)品優(yōu)化和部署提供有力支持。

信而泰應(yīng)用和安全測試儀
信而泰DarPeng2000E是一款基于新一代x86架構(gòu)設(shè)計的高性能安全測試平臺,具備高計算能力、高吞吐能力、高集成度與高能效比四大核心優(yōu)勢。該設(shè)備配合信而泰自主研發(fā)的基于B/S架構(gòu)的新一代測試軟件ALPS,可實現(xiàn)真實業(yè)務(wù)場景下的應(yīng)用層流量仿真。其HTTP/TCP協(xié)議的新建連接能力可達數(shù)百萬級,并發(fā)連接支持億級規(guī)模,充分滿足超大規(guī)模網(wǎng)絡(luò)環(huán)境的測試需求。
DarPeng2000E不僅能夠精確仿真正常業(yè)務(wù)流量,還可模擬各類攻擊流量、惡意行為與病毒傳播行為。在加密協(xié)議測試方面,全面支持IPsec、SSL等協(xié)議的加解密功能,并兼容國密算法,滿足政企級安全合規(guī)需求。同時,在應(yīng)用層協(xié)議仿真中具備音視頻服務(wù)質(zhì)量測試能力,可實現(xiàn)QoE/QoS等關(guān)鍵性能指標(biāo)的全面評估,適用于下一代網(wǎng)絡(luò)安全測試、攻防演練與深度業(yè)務(wù)性能驗證。

DarPeng2000E