隨著對高清音頻的興趣持續攀升,對具有高級功能的高清 TWS 耳機的巨大需求正在達到頂峰。本文介紹了高清音樂傳輸背后的技術,以及音頻設計師如何滿足日益增長的需求。
行業專家注意到對高清音頻無線耳機的需求穩步增長。隨著各個年齡段的人(包括與年齡相關的聽力下降的人)尋求全高清聲音體驗,研究還指出,對聽覺個性化的需求不斷增加,以彌合音頻和聽覺之間的差距。這些趨勢正在推動音樂傳輸鏈各個階段的高清音頻支持的發展。
高清音頻的演變
術語高清音頻(或高分辨率音頻)沒有嚴格的技術定義。它通常用于描述支持比此類設備采用早期可用的更高數據速率的音頻系統。該術語最初用于描述可以支持比光盤 (CD) 標準更高的數據速率的數字音頻系統。這包括替代磁盤格式,以及后來包含數字音頻記錄的文件。它也被應用于音頻流,最近被應用于能夠提供比典型音頻質量更好的無線耳機。
音頻錄制和分發方面的改進提高了移動收聽者可用的數據速率。由于藍牙限制,無線耳機落后。然而,較新的藍牙編解碼器使無線耳機能夠提供高清音頻。這對包括驅動程序在內的音頻硬件提出了新的要求。本文將解釋與高清音頻相關的技術術語,描述從音源到耳機的音頻鏈的改進,以及如何使用平衡電樞 (BA) 高音揚聲器和動態低音揚聲器結合 ANC、減少遮擋、和聽力個性化。
技術背景
數字音頻格式最簡單地用它們的采樣率和位深度來描述。數字音頻通過及時快速采樣信號幅度來表示模擬聲音。測量每個樣本的幅度并保存為二進制數。每秒的樣本數就是采樣率。用來描述幅度的二進制數的大小就是位深度。
采樣率
圖 1:數字音頻中的采樣率和位深度。
歸功于奈奎斯特(以及香農和惠特克)的信息論指出,我們必須每個周期至少對正弦波進行兩次采樣,以準確捕獲其信息。否則,重建的輸出將是錯誤頻率處的混疊,如圖 2a 、 3和 2b 所示。別名是以“Nyquest 頻率”(采樣率的 1/2)為軸的頻域鏡像。
對于音樂,采樣率必須至少是要再現的最高頻率的 2 倍。因此,如果要表示的最大音頻頻率為 20 kHz,則需要 40 kHz 的采樣率。這需要在 ADC 上使用非常銳利的 20 kHz 低通濾波器。任何通過濾波器的 20 kHz 以上的音頻在轉換回模擬時都將被重新創建為可聽見的別名,從而降低音樂的保真度。因為沒有一個濾波器是完美的,所以在現實世界的實踐中,在要表示的最高頻率和采樣限制之間提供了一些余量。在光盤格式中,要采樣的音頻經過低通濾波到 20 kHz。采樣率設置為 44.1 kHz,略高于 40 kHz 的理論極限,以提供濾波器余量。
圖 2a 和 2b:時域和頻域中的別名
位深
用于描述樣本的詞的大小或位深度決定了每個樣本被數字化的準確程度。想象一下通過四舍五入來描述一個人的身高。然后你可以說某人有兩三米高。第二個數字會更好,可以將某人描述為 2.1 或 2.2 米高。這仍然有點粗糙,但可以繼續添加數字,直到提供足夠的分辨率。
數字音頻也是如此。每次在二進制字中使用一個附加位時,可以用兩倍數量的值來描述幅度。這反過來又將誤差減少了兩倍。雖然人們會直觀地認為四舍五入會導致失真,但事實證明,通過應用一點點稱為抖動的噪聲,誤差(量化誤差)可以從失真轉換為噪聲。因此,一個好的錄音系統沒有失真,并且每增加一位深度,本底噪聲就會下降 6 dB。最響亮的未失真聲音與本底噪聲之間的比率為 6 * 位深度。
由于數字系統是建立在 8 位的倍數之上的,因此數字音頻使用 8 位的倍數來表示其字長。非常早期的計算機音頻僅使用 8 位。將本底噪聲僅比最響亮的音樂低 48 分貝并不是很實用。光盤支持 16 位深度,提供 96 dB 的信噪比。這涵蓋了一個非常有用的范圍。如果將播放音量設置為合理的水平,則歌曲之間剩余的嘶嘶聲低于聆聽環境中的背景聲音。隨著音量的提高,歌曲之間或安靜的段落中可能會出現一些可聽見的嘶嘶聲。因此,可以提出使用更高位深度來減少總系統噪聲的該分量的論據。
圖 3:增加采樣率和位深度的影響
壓縮
光盤的組合比特率為 16 比特/樣本 ? 44,100 樣本/秒 ? 2 個通道 = 1,411 千比特/秒 (kbps)。這種數據速率太大,無法用于早期的數字音頻播放器。下載歌曲花費的時間太長,可用內存有限。為了解決這個問題,開發了壓縮方法。模式識別可用于對數據流中的 1 和 0 的模式提供更簡潔的描述。這就是在計算機中壓縮數據文件的想法。一些文件可以壓縮到小于原始大小的 1/10,然后在以后恢復而不會丟失。
使用這些方法無法大量壓縮音樂文件。通過使用線性預測算法,可以獲得一些改進。然而,壓縮比仍然很少超過 2:1。由于沒有數據丟失,這些被稱為無損編碼器。兩個流行的例子是 FLAC 和 Apple 無損壓縮。
為了進一步降低數據速率,可以使用人類聽覺的心理聲學模型來最小化丟棄數據的可聽度。一種聲音隱藏另一種聲音以防止人類感知是很常見的。(見圖 4。)4通過以較低的速率對隱藏的聲音進行編碼或完全丟棄它們,可以降低整體數據速率。雖然心理聲學壓縮方法有所改進,但即使是設計最好的編碼器仍會導致一些可聽偽影5。較低的壓縮率會以更大的文件和更高的數據速率為代價提供更少和更溫和的聲音偽像。這是高清音頻流運動背后的科學,通過以更高速度傳輸音樂的能力成為可能。
擴展帶寬
“高清音頻”和“高分辨率音頻”這兩個術語經常作為同義詞使用,但這可能會導致混淆。“高清音頻”用于描述具有比傳統使用更高數據速率的任何音頻。日本音頻協會 (JAS) 授權將“Hi-Res Audio”標志用于滿足特定要求的硬件,包括能夠再現高達 40 kHz 的音頻。(確切的要求可以從 JAS 獲得許可)。
圖 4:圖 4:響亮的聲音掩蔽對具有相似頻率的較安靜聲音的感知
高清音頻是增加采樣率、增加位的任意組合的結果 圖 3. 增加采樣率和位深度的效果。圖 4. 響亮的聲音掩蓋了具有相似頻率的較安靜聲音的感知。TWS 耳機/WP07 4 深度中的高清音頻,并降低壓縮率。如果采樣率增加到超過 44.1 kHz,數字化音頻將更接近原始信號,這反過來有助于在整個傳輸鏈中保持保真度。將帶寬擴展到 20 kHz 以上也成為可能。并非所有高清音頻格式和設備都具有超過 20 kHz 的帶寬,但有些有,尤其是那些以 JAS 認證為目標的設備。
音樂傳播鏈
為了讓聽眾聽到高清音頻,管道中的每一步都必須具有足夠的質量。其中包括原始歌曲準備過程、下載或流媒體服務、播放系統、耳機連接以及耳機驅動程序。
記錄和交付
音樂錄音設備廣泛可用,允許以各種采樣率和位深度進行存儲,其中許多超過了光盤規格。一旦音樂被記錄下來,它就必須交付給用戶。文件下載服務支持高清音頻已有一段時間了。最近,大多數流行的流媒體服務已經宣布或已經提供無損 CD 質量作為基準,并且它們的庫中越來越多的具有高比特率高清的子集,通常不收取額外費用。
音樂播放硬件
今天,人們可以使用各種設備(包括專用音樂播放器、手機、PC 等)收聽下載或流式傳輸的音頻。高清音頻播放在這些設備中廣泛可用。支持高清音頻的額外成本相對較低,通常支持高達 192 kHz 的采樣率和高達 32 位的字長。在某些情況下,這些設備(如果有的話)的模擬耳機輸出被限制在 20 kHz,并且通常不具有超過 16 位的噪聲性能。但是,在這些情況下,可以將外部 DAC 插入數字端口以獲得更高的性能。
耳機編解碼器
鏈條的最后一步是耳機。在無線耳機中,一個關鍵的限制因素是藍牙無線電鏈路。藍牙編解碼器 (COder/DECoder) 在傳輸到耳機之前會降低數據速率。為了滿足無線耳機和 TWS 中對優質音頻日益增長的需求,已經引入了具有更高數據速率的編解碼器。(表 1。)在設計合理的耳機中,這些較新的編解碼器可以提供更高保真度的聆聽體驗,即使不是完全無損。更進一步,高通最近宣布他們打算支持通過藍牙無損傳輸 CD 質量的音頻。6
一些新的高清藍牙編解碼器支持擴展帶寬。然后耳機可以再現 20 kHz 以上的頻率。圖 5 顯示了市售 TWS 耳機的響應曲線測量。高達 40 kHz 的顯著輸出可見。
表 1:CD 標準和常用藍牙編解碼器表 1:CD 標準和常用藍牙編解碼器
圖5:漫步者Neobuds Pro TWS帶寬對比
高清TWS耳機音頻設計
購買 HD TWS 耳機的客戶對音頻的期望值非常高。由于整體功能集和驅動系統可用的空間有限,聲學設計在 TWS 耳機中尤其具有挑戰性。TWS 耳機必須舒適地貼合耳朵,并且必須越來越多地提供 ANC 和其他高級功能。這給聲學設計師帶來了獨特的挑戰。
ANC 和高清音頻的需求之間的交互尤為重要。為了在嘈雜的環境中提供有效的 ANC,驅動器必須支持低失真的高低音輸出。用于減少遮擋的泄漏或半開放式設計對低音輸出提出了更高的要求。同時,高清音頻播放需要將高音輸出擴展至 20kHz 甚至更高,尤其是在尋求 JAS Hi-Res Audio Wireless 認證的情況下。隨著揚聲器尺寸的減小,使用單個動態揚聲器同時滿足這兩個要求變得越來越困難。然而,現代 TWS 設計的目標是小巧、舒適的外形。
圖 6:Knowles ref 的頻率響應。設計混合
為了滿足這些看似矛盾的需求,許多耳機使用單獨的動態低音揚聲器和 BA 高音揚聲器來代替單個全頻驅動器。這種混合配置提供了更平滑和更擴展的高頻響應,同時減少了對可增加功耗和減少動態余量的電子均衡的需求。低音揚聲器設計專注于為音樂、ANC 和減少遮擋提供強勁的低音,而 BA 高音揚聲器經過優化,可再現清晰獨特的高音以支持高清播放。
BA 高音揚聲器還支持以低功耗驅動高高音增益,使其成為提供聽覺個性化的耳機的理想選擇。當啟用個性化時,它們的密封、封閉式設計限制了對麥克風的聲學反饋的可能性。為了滿足這些看似矛盾的需求,許多耳機使用單獨的動態低音揚聲器和 BA 高音揚聲器來代替單個全頻驅動器。這種混合配置提供了更平滑和更擴展的高頻響應,同時減少了對可增加功耗和減少動態余量的電子均衡的需求。低音揚聲器設計專注于為音樂、ANC 和減少遮擋提供強勁的低音,而 BA 高音揚聲器經過優化,可再現清晰獨特的高音以支持高清播放。
這樣的設計還為驅動器的布置提供了更大的自由度。它可以將低音揚聲器移動到與耳塞不太直接對齊的位置或角度,同時仍將 BA 高音揚聲器保持在開口附近,以最大限度地減少高音揚聲器和耳塞之間滯留的空氣慣性。耳機整體形狀更加靈活,可實現最大的高音延伸,在不損失高頻性能的情況下提高用戶舒適度。
使用 BA 高音揚聲器可提供多種工具來調整高頻響應。可以對高音揚聲器開口附近的聲學特征進行整形以進一步細化高頻輸出。可以調整分頻器以平滑混合低音揚聲器和高音揚聲器信號。可以通過選擇更高或更低的線圈阻抗來調整高音揚聲器的靈敏度,以更好地匹配低音揚聲器。最終整形可以通過 DSP 調諧來完成。BA 高音揚聲器的高擴展輸出最大限度地減少了增加高音增益以產生所需基線響應的需要。
圖 7:Knowles RAN 高音揚聲器與典型 8 毫米動圈揚聲器相比的高音響應。高音揚聲器提供的額外動態余量減少了增加高音增益的需要,尤其是在個性化音頻時
每個驅動器都可以由自己的放大器驅動,從而在塑造響應方面更加靈活。Bowers & Wilkins PI7 7和 Edifier Neobuds Pro 8是使用獨立放大器和有源分頻器的 TWS 耳機的兩個示例。
還可以使用高音揚聲器提供遠高于 20 kHz 的響應。圖 7 將 Knowles BA 高音揚聲器模型 RAN 的高音輸出與典型的 8 毫米動態揚聲器進行了比較。BA 高音揚聲器提供了高清音頻所需的更高的高音輸出和擴展,包括支持聽覺個性化或增強的能力。
結論
消費者對 TWS 耳塞的高清音頻質量要求越來越高。向聽眾交付高清需要升級交付鏈中的所有階段。音樂流媒體服務、手機和藍牙編解碼器能夠提供比以往更高的保真度。現在是 TWS 耳機設計師充分利用這些變化來滿足消費者需求的時候了。為此,還必須密切關注驅動系統。帶有動態低音揚聲器和 BA 高音揚聲器的混合驅動器是高清音頻 TWS 耳機的最佳解決方案。
審核編輯:郭婷
評論
查看更多