現代語音通信已不再是傳統接線生時代的交換式系統,而是更依賴網路基礎建設的封包傳遞,取而代之的是各種通訊軟體。現代化語音服務的提供,更涉及了眾多不同的廠商,例如:網際網路服務供應商、手機製造商、通訊軟體供應商…等。因此在通信系統的快速發展過程中,如何在眾多服務堆疊的架構確保語音品質就變得很重要。在這當中,評估語音品質的方法就成為首要關鍵。
語音品質方法的應用對象,我們可以看到OPTICOM公司在ITU Workshop 的資料(如下)

可將它分成兩類: 終端設備的聲學性能、網路傳輸對語音的損傷。
終端設備的聲學性能:其中具體的終端設備例如像是耳機麥克風、視訊會議系統,筆電自帶的喇叭麥克風…等。這些設備也還有會連帶影響聲學性能的信號處理演算法、編解碼器、降噪算法…等。
網路傳輸對語音的損傷: 像是有線傳輸/無線傳輸、驅動程式、流量控制…等。
因此, 語音品質測試的應用對象, 在終端裝置方面, 不管是耳麥/手機/筆電/視訊會議系統…等都是適合的待測物. 在軟硬體方面, 通訊軟體/DSP算法/編解碼器…等也都是可以成為待測物的對象。

評估方法可概分為兩類:
主觀評估法
客觀評估法
傳統的主觀評估,需召集一組人,並要求他們判斷各種音頻片段的音質,通常判斷評分值介於1到5。將所有個人分數加總後再除以個體數。其結果稱之為平均值意見得分(MOS)。

雖然用真實的人類受試者進行測試成本高又耗時,但可以使用包含基於心理聲學建模(如 PESQ 或 POLQA)的算法來克服這些限制。如果正確使用,這些模型將非常匹配來自人類群體的結果。這種自動化允許開發中的快速迭代以及高效的生產線驗證。獲得的測量結果被歸類為客觀的,因為它們不受人的氣質或測試條件的影響,且結果是完全可重複的。
主觀評估法需要大量的測試人員及工時,耗費成本甚鉅。相對來說,客觀評估採用儀器設備就不會有這樣的問題。

PESQ是上一代應用於通信系統和語音編碼的端對端語音質量評估的客觀語音質量評估方法。它被定義在ITU-R Rec. P.862 標準中。但由於它的侷限性,國際電信聯盟ITU 發展了新的ITU-T Rec. P.863 標準,稱之為POLQA(Perceptual Objective Listening Quality Analysis)也就是『感知客觀 聆聽品質分析』。

其中,所謂的“感知”指的是使用演算法來預測真人聆聽的主觀得分。
PESQ和POLQA起源於 ITU-T 的客觀語音質量測量系列,該系列始於 1997 年的 P.861 (PSQM),2001 年被 P.862 (PESQ) 取代。它最初是為測試窄帶網絡而開發的。之後在 2010 年被ITU-T P.863 POLQA有效取代,並支援WebRTC 和 IP 的呼叫。

MOS 通常用於描述語音質量,範圍從1(質量差)到5(質量極好)。

百佳泰提供的POLQA服務, 採用Audio Precision 方案, 提供以下特性:
●  ITU-T P.863 語音質量感知評估,映射到 MOS 尺度
● 窄帶、寬帶和超寬帶操作
● 與聲學接口一起使用
● 輸入

  • 以 8、16 或 48 kHz 採樣的 16 位線性音頻 輸入長度為 6 到 12 秒的語音文件

● 測量

  • 單一MOS值
  • 瞬時 MOS值: 隨時間變化的MOS曲線圖
  • 平均 MOS值 (包含語音活動期和靜音期)
  • 批次處理: 逐一評估每個樣本音檔的MOS值

這些量測能力對於無線耳機、智慧型耳機、智慧型手機… 等產品的語音通訊品質, 將帶來莫大助益。

相關連結參考:
1. Perceptual Audio Test Options for APx500 Series Analyzers
2. POLQA Vs PESQ Objective quality scoring explained

【了解更多相關對於無線耳機、智慧型耳機、智慧型手機… 等產品的語音通訊品質測試問題,歡迎聯繫百佳泰】

聯繫專屬技術顧問 →  service@allion.com

立即加入百佳泰 LINE官方帳號,隨時掌握技術新訊