最需要產業界同心協力的議題,卻往往最具爭議性,這實在是個很諷刺的狀況;在那些議題中,爭議性最大的又莫過于性能基準測試(performance benchmarking)。幸好,我們正緩慢地朝正確的方向前進,但還需要更多的努力。
測試基準被廣泛應用在評估各種電子裝置,為了取得高評價,芯片與系統供貨商都非常積極于目標測試基準的“優化”;但有的時候那些優化行動卻更像是人為操縱。科技新聞充斥著不公平的基準檢驗案例,那些只是冰山一角。
測試基準還面臨其他的局限;技術創新的高速度使得透過能反映各種平臺上實際使用者體驗的方式,精準體驗測試一套系統所有功能的任務成為挑戰。舉例來說,影像擷取以及編輯功能也許涉及眾多芯片以及應用程序編程接口(API),要在Android、iOS與Windows手機平臺之間做有意義的比較,是白費力氣的。
一套優良的測試基準應該包含五項要素
首先,最基本的是透明度(transparency)。測試基準有時候只比黑盒子好一點,只提供測試結果數字,但對測試的過程或計分方法透露甚少;甚至有時候連被測試的功能或是所依循的標準都不明確。
測試基準的擁有者往往以機密為理由,表示測試本身擁有知識產權或是利用了專屬信息;但我們認為,測試基準應該是經由一個跨產業的組織批準,且(或)所有的計分方式應是受公開審查的。此外,測試基準應該要包含受測功能與標準的列表。
優良測試基準的第二個要素,應該是能受獨立驗證的。通常基準檢驗執行機構會在公布結果之前先為其背書,有些使用者或供貨商也會自己上傳或進行某些基準檢驗;雖然系統調節如超頻(overclocking)能對測試結果產生影響,與眾多用戶的平均測試成績差距太大的系統,通常會被懷疑。
第三個要素是,測試基準需要某種形式的監督,以確保測試程序的一致性;優化在基準檢驗程序中是不應該被容忍的,所有的平臺所接受的測試程序應該都是相同的。
第四,一個真正的測試基準,特別是移動裝置的測試基準,應該要以某種形式的系統及測試來呈現。
特定零組件如CPU、GPU與內存,很容易被挑出來測試,但其他如無線網絡鏈接性、傳感器性能、電池壽命、顯示器功能等卻很難量化;而任何一種移動終端的終極測試應該是使用者體驗,優良的測試基準至少必須要能呈現這一點。最后一個測試基準要素是會定期更新,最好是每年一次;產業界應該停止使用不合時宜的測試基準。
有鑒于眾多棘手的問題,采用一系列基準來評估各種技術或平臺,似乎被視為最佳實踐方式;這通常導致有一長串的測試基準,而且測試結果各不相同。當使用者看到那些讓人眼花撩亂的不同測試結果,恐怕感到非常沮喪。
一個新興的移動終端測試基準
有個好消息是,一個最近推出的移動終端測試基準AndEBench,可望能為以上種種問題帶來解決方案;該基準是由嵌入式微處理器測試基準聯盟(Embedded Microprocessor Benchmark Consortium,EEMBC)所開發,聯盟成員包括ARM、Imagination Technologies、Intel、Marvell、Nvidia、Qualcomm與Samsung等大廠。
EEMBC還有管理委員會,能針對測試基準的變更,以及可公布那些性能數據做最終裁決;該測試基準的最新版本為AndEBench-Pro,是一個針對CPU、內存、儲存、3D繪圖以及整體平臺性能的Java架構測試,測試結果能以各自獨立、也能以匯總的形式來呈現。
AndEBench-Pro測試基準的各功能計分比重
目前AndEBench測試基準只鎖定Android平臺,而且并不支持最新的標準如OpenGL ES 3.0、OpenCL等,此外也缺乏測試全系統功能,或者是可能與特定使用模式相關的特定應用。不過該測試基準符合所有上述的優良測試基準要素,包括測試程序、計分方法的透明度,提供經管理單位驗證的測試結果,測試程序的一致性,以及定期更新。
不過AndEBench還不夠完善,EEMBC還在為采用該測試基準的模式訂定標準;而EEMBC也坦承,還需要更多的努力,來自產業界其他更多關鍵技術供貨商、行動裝置制造商的參與是必要的,才能改善基準檢驗的程序并確保該基準能支持不同的平臺。
長久以來,測試基準一直是產業界的爭議焦點;不該再抱怨,現在正是整個產業界采取行動、為行動裝置系統測試基準開發更完善標準的時候!
-
手機
+關注
關注
35文章
6853瀏覽量
157437 -
cpu
+關注
關注
68文章
10829瀏覽量
211183 -
gpu
+關注
關注
28文章
4703瀏覽量
128725
發布評論請先 登錄
相關推薦
評論