每日微信報(bào)
人物專訪監(jiān)管
制造芯片
6G 運(yùn)營(yíng)
大數(shù)據(jù)物聯(lián)網(wǎng)
移動(dòng)互聯(lián)網(wǎng)量子
云計(jì)算互聯(lián)網(wǎng)
報(bào)告衛(wèi)星

解鎖高品質(zhì)音頻體驗(yàn)：探索音頻質(zhì)量評(píng)估與測(cè)試的科學(xué)之道

2025年7月22日 09:49信而泰

引言：

在數(shù)字化浪潮席卷的今天，音頻質(zhì)量直接影響著從VoIP通話、視頻會(huì)議到智能音箱等應(yīng)用的沉浸式體驗(yàn)。音頻質(zhì)量評(píng)估與測(cè)試，不僅是電信、廣播和消費(fèi)電子領(lǐng)域的技術(shù)基石，更是確保用戶感知卓越的關(guān)鍵環(huán)節(jié)。主觀方法如MOS評(píng)分直觀反映人類聽(tīng)感，而客觀方法如PESQ和E-model以高效算法驅(qū)動(dòng)自動(dòng)化測(cè)試，二者結(jié)合為行業(yè)提供了精準(zhǔn)的質(zhì)量評(píng)估方案。

本文將深入解析音頻質(zhì)量評(píng)估的核心方法與測(cè)試實(shí)踐，帶您走進(jìn)高品質(zhì)音頻的科學(xué)世界！

音頻質(zhì)量評(píng)估簡(jiǎn)介

語(yǔ)音質(zhì)量評(píng)估就是通過(guò)人類或自動(dòng)化的方法評(píng)價(jià)語(yǔ)音質(zhì)量。在實(shí)踐中，有很多主觀和客觀的方法評(píng)價(jià)語(yǔ)音質(zhì)量。

主觀評(píng)價(jià)

主觀評(píng)估通過(guò)人類聽(tīng)眾直接評(píng)分，反映真實(shí)聽(tīng)覺(jué)體驗(yàn)。常見(jiàn)方法包括：

（1） MOS（Mean Opinion Score，平均意見(jiàn)得分）：

MOS值作為一種主觀測(cè)試方法，將用戶接聽(tīng)和感知語(yǔ)音質(zhì)量的行為進(jìn)行調(diào)研和量化，由不同的調(diào)查用戶分別對(duì)原始標(biāo)準(zhǔn)語(yǔ)音和經(jīng)過(guò)無(wú)線網(wǎng)傳播后的衰退聲音進(jìn)行主觀感受對(duì)比，評(píng)出MOS分值。國(guó)際電信聯(lián)盟（International Telecommunication Union，ITU）將MOS評(píng)測(cè)規(guī)范化為ITU-T P.800，其中絕對(duì)等級(jí)評(píng)分（Absolute Category Rating，ACR）應(yīng)用最為廣泛，ACR的詳細(xì)評(píng)估標(biāo)準(zhǔn)如下表所示。

（2）CMOS（Comparative Mean Opinion Score）和ABX Test：

CMOS比較處理前后音頻，評(píng)估處理（如噪聲抑制）對(duì)質(zhì)量的影響。ABX Test用于比較兩段音頻（A為參考，B為處理后，X隨機(jī)選擇），聽(tīng)眾判斷X與A/B的相似性，適合算法對(duì)比。

主觀評(píng)估直觀，但耗時(shí)且受聽(tīng)眾主觀性、環(huán)境噪聲影響，適合關(guān)鍵場(chǎng)景驗(yàn)證或客觀方法校準(zhǔn)。

客觀評(píng)價(jià)

客觀評(píng)估通過(guò)算法預(yù)測(cè)質(zhì)量，分為有參考（Intrusive）和無(wú)參考（Non-Intrusive）兩大類，效率高但需與主觀結(jié)果校準(zhǔn)。MOS值是廣泛認(rèn)同的語(yǔ)音質(zhì)量評(píng)估標(biāo)準(zhǔn)，無(wú)論主觀評(píng)價(jià)或者客觀評(píng)價(jià)采用何種方法最終所有測(cè)量結(jié)果都需要對(duì)應(yīng)到MOS值。

（1）有參考客觀評(píng)價(jià)

需要原始音頻信號(hào)作為參考，常見(jiàn)方法包括：PESQ（Perceptual Evaluation of Speech Quality，基于ITU-T P.862標(biāo)準(zhǔn)）、POLQA（Perceptual Objective Listening Quality Analysis，ITU-T P.863標(biāo)準(zhǔn)），STOI（Short-Time Objective Intelligibility，用于評(píng)估語(yǔ)音可懂度，基于信號(hào)處理算法）和BSSEval（用于盲源分離場(chǎng)景，評(píng)估分離音頻的質(zhì)量）。

作為使用最為廣泛使用的PESQ是評(píng)價(jià)音頻質(zhì)量的常用方法，基于ITU-T P.862標(biāo)準(zhǔn)（2001年發(fā)布），為全參考（Full-Reference）算法，需原始信號(hào)和測(cè)試信號(hào)進(jìn)行比較。

工作原理：

● 將參考信號(hào)（原始語(yǔ)音）和測(cè)試信號(hào)（經(jīng)過(guò)網(wǎng)絡(luò)傳輸?shù)恼Z(yǔ)音）進(jìn)行時(shí)間對(duì)齊，補(bǔ)償網(wǎng)絡(luò)延遲和抖動(dòng)。

● 使用感知模型將信號(hào)從時(shí)間－幅度域轉(zhuǎn)換為頻率-響度域，模擬人類聽(tīng)覺(jué)。

● 計(jì)算兩信號(hào)的感知差異，輸出Objective Difference Grade（ODG），范圍0（無(wú)損害）到-4（嚴(yán)重?fù)p害）。

● 通過(guò)ITU-T P.862.1映射為MOS-LQO（Listening Quality Objective），范圍1（差）到5（優(yōu)秀）。

（2）無(wú)參考客觀評(píng)價(jià)

無(wú)需原始音頻，適合實(shí)時(shí)場(chǎng)景，常見(jiàn)方法包括：ITU-T P.563（基于信號(hào)，用于單端語(yǔ)音質(zhì)量評(píng)估）、ANIQUE+（基于聽(tīng)覺(jué)模型，預(yù)測(cè)單端語(yǔ)音質(zhì)量）和E-Model（ITU-T G.107，基于傳輸規(guī)劃模型）。

E-Model是國(guó)際電信聯(lián)盟電信標(biāo)準(zhǔn)化部門（ITU-T）在G.107推薦中定義的計(jì)算模型，主要用于傳輸規(guī)劃。它預(yù)測(cè)電話通話的感知質(zhì)量，特別適用于評(píng)估VoIP網(wǎng)絡(luò)中的語(yǔ)音質(zhì)量。

工作原理：

E-Model算法主要通過(guò)三個(gè)網(wǎng)絡(luò)參數(shù)計(jì)算出MOS值，Latency、Jitter以及Packet loss。

■ Latency：依賴于RTCP中的SR和RR報(bào)文

RTT = T1 - T0 - (t1 - t0)

RTT = receive time ntp - send time ntp - delay_since last srt

■ Jitter

抖動(dòng)的定義是信號(hào)在某特定時(shí)刻相對(duì)于其理想時(shí)間位置上的短期偏離。在網(wǎng)絡(luò)傳輸中，數(shù)據(jù)包可能會(huì)經(jīng)過(guò)不同的路由鏈路，當(dāng)時(shí)的網(wǎng)絡(luò)或擁塞或空閑，最終到達(dá)目的地時(shí)，與預(yù)期會(huì)有所偏差。通過(guò)數(shù)據(jù)包的到達(dá)情況，我們可以反過(guò)來(lái)估測(cè)網(wǎng)絡(luò)的狀態(tài)變化，用來(lái)對(duì)發(fā)送端進(jìn)行指導(dǎo)。抖動(dòng)的計(jì)算只依賴RTP packet。

■ Packet Loss：根據(jù)RTP報(bào)文中的Sequence Number計(jì)算丟包率

Packet Loss = (Expected RTP Packet Number - RIP Received Packet Number) / Expected RTP Packet Numnber。

信而泰音頻質(zhì)量評(píng)估測(cè)試方案

在音頻質(zhì)量測(cè)試中，通常使用SIP（Session Initiation Protocol）和RTP（Real-time Transport Protocol）流量來(lái)模擬和評(píng)估實(shí)時(shí)語(yǔ)音通信。SIP作為信令協(xié)議，負(fù)責(zé)建立、修改和終止會(huì)話，通過(guò)與SDP（會(huì)話描述協(xié)議）配合，協(xié)商媒體參數(shù)（如RTP端口和編碼格式）。RTP則負(fù)責(zé)傳輸音頻數(shù)據(jù)，基于UDP協(xié)議提供低延遲傳輸，通過(guò)時(shí)間戳和序列號(hào)確保數(shù)據(jù)同步和順序，RTCP（實(shí)時(shí)傳輸控制協(xié)議）輔助監(jiān)控傳輸質(zhì)量（如丟包率、抖動(dòng)）。

信而泰VoIP測(cè)試方案以DarPeng2000E測(cè)試設(shè)備為核心，模擬企業(yè)IP電話通過(guò)CE路由器接入WAN云，再經(jīng)PE路由器連接VoIP網(wǎng)絡(luò)/SIP服務(wù)器與遠(yuǎn)程IP電話的通信場(chǎng)景，通過(guò)生成SIP和RTP流量，并結(jié)合標(biāo)準(zhǔn)化算法（如PESQ、E-Model）分析音頻質(zhì)量，延遲，抖動(dòng)和丟包等指標(biāo)，確保測(cè)試結(jié)果符合ITU-T標(biāo)準(zhǔn)（如P.862），從而為客戶提供可靠的語(yǔ)音通信優(yōu)化支持，幫助客戶識(shí)別潛在問(wèn)題并提供針對(duì)性地優(yōu)化建議，確保語(yǔ)音通信系統(tǒng)的高質(zhì)量和穩(wěn)定性，適用于企業(yè)部署優(yōu)化、運(yùn)營(yíng)商網(wǎng)絡(luò)驗(yàn)證及網(wǎng)絡(luò)質(zhì)量測(cè)試，幫助識(shí)別瓶頸并提供針對(duì)性改進(jìn)建議。

信而泰VoIP測(cè)試方案應(yīng)用場(chǎng)景

1. 在音頻質(zhì)量測(cè)試中，用戶可以通過(guò)信而泰自主研發(fā)的應(yīng)用與安全仿真平臺(tái)ALPS，直接調(diào)用內(nèi)置的SIP+RTP音頻流模板，快速生成標(biāo)準(zhǔn)化的語(yǔ)音通信流量，用于呼叫建立、媒體傳輸?shù)热鞒虦y(cè)試。同時(shí)，系統(tǒng)也支持用戶自定義構(gòu)建SIP信令和RTP媒體流，以模擬真實(shí)業(yè)務(wù)中的各種語(yǔ)音場(chǎng)景。

2. 在測(cè)試過(guò)程中，用戶可以靈活選擇音頻輸入方式，既可以使用系統(tǒng)默認(rèn)提供的標(biāo)準(zhǔn)語(yǔ)音樣本文件進(jìn)行測(cè)試，也支持上傳真實(shí)的業(yè)務(wù)音頻文件，以更貼近實(shí)際應(yīng)用場(chǎng)景。默認(rèn)音頻文件便于快速開(kāi)展基準(zhǔn)測(cè)試，而真實(shí)音頻文件則有助于驗(yàn)證在具體語(yǔ)音內(nèi)容和編碼格式下的傳輸質(zhì)量。

3. 關(guān)鍵網(wǎng)絡(luò)性能指標(biāo)統(tǒng)計(jì)，如丟包率、時(shí)延和抖動(dòng)，全面評(píng)估語(yǔ)音質(zhì)量的穩(wěn)定性與清晰度。同時(shí)，結(jié)合ITU-T推薦的E-Model算法計(jì)算R-Factor和MOS值，以及PESQ算法的MOS評(píng)分，兼顧客觀建模與主觀聽(tīng)感模擬。多維度的質(zhì)量評(píng)估幫助用戶全面掌握語(yǔ)音通信在不同網(wǎng)絡(luò)環(huán)境下的真實(shí)表現(xiàn)，為產(chǎn)品優(yōu)化和部署提供有力支持。

信而泰應(yīng)用和安全測(cè)試儀

信而泰DarPeng2000E是一款基于新一代x86架構(gòu)設(shè)計(jì)的高性能安全測(cè)試平臺(tái)，具備高計(jì)算能力、高吞吐能力、高集成度與高能效比四大核心優(yōu)勢(shì)。該設(shè)備配合信而泰自主研發(fā)的基于B/S架構(gòu)的新一代測(cè)試軟件ALPS，可實(shí)現(xiàn)真實(shí)業(yè)務(wù)場(chǎng)景下的應(yīng)用層流量仿真。其HTTP/TCP協(xié)議的新建連接能力可達(dá)數(shù)百萬(wàn)級(jí)，并發(fā)連接支持億級(jí)規(guī)模，充分滿足超大規(guī)模網(wǎng)絡(luò)環(huán)境的測(cè)試需求。

DarPeng2000E不僅能夠精確仿真正常業(yè)務(wù)流量，還可模擬各類攻擊流量、惡意行為與病毒傳播行為。在加密協(xié)議測(cè)試方面，全面支持IPsec、SSL等協(xié)議的加解密功能，并兼容國(guó)密算法，滿足政企級(jí)安全合規(guī)需求。同時(shí)，在應(yīng)用層協(xié)議仿真中具備音視頻服務(wù)質(zhì)量測(cè)試能力，可實(shí)現(xiàn)QoE/QoS等關(guān)鍵性能指標(biāo)的全面評(píng)估，適用于下一代網(wǎng)絡(luò)安全測(cè)試、攻防演練與深度業(yè)務(wù)性能驗(yàn)證。

DarPeng2000E

編輯：孫秀杰

飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容，凡注明來(lái)源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有，未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像，違者必究。對(duì)于經(jīng)過(guò)授權(quán)可以轉(zhuǎn)載，請(qǐng)必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性，并完整標(biāo)注作者信息和飛象網(wǎng)來(lái)源。
2.凡注明“來(lái)源：XXXX”的作品，均轉(zhuǎn)載自其它媒體，在于傳播更多行業(yè)信息，并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問(wèn)題，請(qǐng)?jiān)谙嚓P(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系，我們將第一時(shí)間予以處理。
本站聯(lián)系電話為86-010-87765777，郵件后綴為cctime.com，冒充本站員工以任何其他聯(lián)系方式，進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為，均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。