“作為一款PingCAP自主研發、面向全球用戶的開源數據庫,TiDB走在了技術的前沿。得益于第四代英特爾 至強 可擴展處理器卓越的代際性能提升,以及其搭載的多種硬件加速器,我們進一步提升了TiDB的性能表現。我們將繼續堅持開源的創新理念,將TiDB打造成一個領先的數據庫產品?!?/span>
部署新一代分布式數據庫已經成為用戶釋放數據價值、推動數字化轉型的重要方式,但隨著數據的快速增長以及上層負載的日益復雜化,數據庫的應用面臨著以下挑戰:
? 如何釋放CPU性能:在金融、電子商務、互聯網、游戲等行業用戶的數據庫部署實踐中,常常需要通過高性能的數據庫服務,滿足高讀寫等場景的應用需求,以提升應用體驗,由此導致用戶對數據庫性能的要求與日俱增。長期實踐已證實,CPU性能是制約數據庫性能提升的重要瓶頸。
? 如何平衡存儲空間與性能:海量數據存儲與處理需求意味著大量存儲空間占用,這會帶來相應的存儲成本壓力。而通過提升數據壓縮率等方式,有助于節約數據庫系統的存儲空間占用,降低成本壓力,但數據壓縮也可能導致性能開銷的增長,需要在壓縮率與性能方面實現更佳的平衡。
? 如何優化投資回報:在現代化的數據中心內,激增的數據帶來了數據庫方面不斷增長的投資需求,用戶希望能夠提升數據庫的性能密度,通過軟件優化等方式更好地激發硬件潛能,從而提升在數據庫領域的投資回報。
作為數字化體系的關鍵組成部分,數據庫連接著應用與數據,對于數據價值的挖掘有著至關重要的意義。隨著數字化轉型的深入,數據庫需要處理的結構化、非結構化數據出現了快速增長,用戶對于數據庫的性能、擴展性、服務質量提出了更高的要求,這驅動著數據庫技術融合發展,云原生和多云的需求進一步增強,數據庫與大數據的深度融合應用,以及存算分離也成為發展的主流。
PingCAP推出了TiDB開源分布式數據庫,以幫助行業客戶應對數字化轉型所帶來的挑戰。為了進一步提升數據庫性能并節省存儲空間,PingCAP測試了TiDB在第四代英特爾 至強 可擴展處理器平臺上的性能,依托處理器的代際性能提升,數據庫的讀性能與讀寫性能分別達到基準配置的1.62倍與1.43倍1 。此外,TiDB還可以利用第四代英特爾 至強 可擴展處理器集成的英特爾 In-Memory Analytics Accelerator(英特爾 IAA),在不影響性能的前提下,提升了數據壓縮率,節約了大量的存儲空間。
TiDB開源分布式數據庫
TiDB是PingCAP公司自主設計、研發的開源分布式數據庫,是一款同時支持在線事務處理與在線分析處理(Hybrid Transactional and Analytical Processing,HTAP)的融合型分布式數據庫產品,具備水平擴容或者縮容、金融級高可用、實時HTAP、云原生、兼容MySQL協議和MySQL生態等核心特性。TiDB為用戶提供一棧式聯機事務處理過程(OLTP)、聯機分析處理(OLAP)和HTAP解決方案,適用于高可用、強一致、數據規模較大等應用場景。
圖1. TiDB開源分布式數據庫產品架構與數據生態
TiDB開源分布式數據庫采用云原生架構,兼容MySQL,能夠有效減少遷移工作量。數據庫同時具備交易處理與數據分析能力,在多模態可擴展性和性能方面表現卓越。TiDB可提供以下優勢:
一鍵水平擴容或者縮容
得益于TiDB存儲計算分離的架構設計,可按需對計算、存儲分別進行在線擴容或者縮容,整個過程對應用運維人員透明。
金融級高可用
數據采用多副本存儲,數據副本通過Multi-Raft協議同步事務日志,多數派寫入成功事務才能提交,確保數據強一致性且少數副本發生故障時不影響數據的可用性??砂葱枧渲酶北镜乩砦恢?、副本數量等策略滿足不同容災級別的要求。
實時HTAP
提供行存儲引擎TiKV、列存儲引擎TiFlash兩款存儲引擎,TiFlash通過Multi-Raft Learner協議實時從TiKV復制數據,確保行存儲引擎TiKV和列存儲引擎TiFlash之間的數據強一致。TiKV、TiFlash可按需部署在不同的機器,解決混合負載資源隔離的問題。
云原生的分布式數據庫
為云設計的分布式數據庫,通過TiDB Operator可在公有云、私有云、混合云中實現部署工具化、自動化,依托公有云提供開箱即用的TiDB Cloud服務(DBaas)。
兼容MySQL協議和MySQL生態
兼容MySQL協議、MysQL常用的功能、MysQL生態,應用無需或者修改少量代碼即可從MySQL遷移到TiDB,提供豐富的數據遷移工具幫助應用便捷完成數據遷移。
采用第四代英特爾 至強 可擴展處理器優化性能并提升數據壓縮率
對于現代化的數據庫系統,CPU已經成為數據庫整體性能的關鍵影響因素。為了從CPU的迭代中獲益,TiDB開源分布式數據庫適配了第四代英特爾 至強 可擴展處理器。
第四代英特爾 至強 可擴展處理器通過創新架構增加了每個時鐘周期的指令,每個插槽多達60個核心,支持8通道DDR5內存,有效提升了內存帶寬與速度,并通過PCIe 5.0(80個通道)實現了更高的PCIe帶寬提升。第四代英特爾 至強 可擴展處理器提供了現代性能和安全性,可根據用戶的業務需求進行擴展。借助內置的加速器,用戶可以在AI、分析、云和微服務、網絡、數據庫、存儲等類型的工作負載中獲得優化的性能。通過與強大的生態系統相結合,第四代英特爾 至強 可擴展處理器能夠幫助用戶構建更加高效、安全的基礎設施。
圖2. 第四代英特爾 至強 可擴展處理器為數據中心提供多種優勢
對于數據庫應用而言,第四代英特爾 至強 可擴展處理器提供了更多的內核,以及更多的Sub-NUMA Clustering(SNC)節點,使得數據庫系統能夠實現明顯的代際性能提升。
在OLTP場景中,為了驗證CPU升級帶來的性能提升,PingCAP進行了測試,驗證了在Sysbench基準測試中,英特爾 至強鉑金 8380/8480+ 處理器的只讀、讀寫性能差異。測試數據如圖3、圖4所示,基于英特爾 至強 鉑金 8480+ 處理器的TiDB在Sysbench只讀測試中性能達到基準配置的1.62倍,在Sysbench讀寫測試中性能達到后者的1.43倍6 。
表1. 測試配置
圖3. 只讀測試性能
圖4. 讀寫測試性能
在OLAP場景中,PingCAP還希望能夠提升TiDB的海量數據壓縮存儲能力,從而減少存儲數據所需的空間,降低相應的成本投入。為此,TiDB采用了第四代英特爾 至強 可擴展處理器集成的英特爾 IAA加速器。
英特爾 IAA是一款硬件加速器,結合分析原始函數,能夠提供出色的吞吐量壓縮和解壓縮性能。英特爾 IAA主要針對大數據和內存分析數據庫等應用程序,以及內存頁壓縮等應用程序透明用途,能夠在分析查詢處理期間過濾數據。英特爾 IAA支持零壓縮等輕量級壓縮方案以及霍夫曼編碼和Deflate等較重的壓縮算法。對于Deflate格式,它支持對壓縮流進行索引,以實現高效的隨機訪問。
圖5. 英特爾 IAA加速流程
PingCAP對比了在不同處理器配置下,英特爾 IAA以及LZ4無損壓縮算法的壓縮率差異。測試數據如圖6所示,采用英特爾 IAA替代LZ4之后,TiDB壓縮率達到LZ4壓縮算法的1.4倍,主要針對列存儲引擎TiFlash的使用場景,能夠大幅節省存儲空間7 。
圖6. 不同處理器與壓縮算法下的壓縮率
此外,PingCAP還測試了在不同的處理器與壓縮算法的組合下,數據庫的性能差異。測試數據如圖7所示,在采用英特爾 IAA替代LZ4進行壓縮之后,數據庫的性能不僅沒有降低,還實現了一定的提升。
圖7. 不同處理器與壓縮算法下的性能差異
收益
在將CPU升級為第四代英特爾 至強 可擴展處理器之后,TiDB開源分布式數據庫提升了性能,節約了存儲空間,為客戶帶來了以下收益:
?數據庫的只讀和讀寫性能分別達到基準配置的1.62倍和1.43倍,結合TiDB自身的性能優勢,能夠幫助客戶加速數據處理與分析效率,應對大規模數據帶來的沖擊8 。
?英特爾 IAA壓縮算法的壓縮率達到傳統壓縮算法的1.4倍,為用戶節省了大量的硬盤空間,降低成本;結合CPU的迭代,性能提升可達到原配置的1.56倍,有助于客戶化解數據壓縮所帶來的性能困擾9 。
?結合軟硬件創新,TiDB能夠有效提高數據庫系統的性能/成本比,幫助用戶節省在數據庫上的投資。
移動互聯網、物聯網、人工智能等技術的快速發展推動了數據的爆發式增長,要求企業數據庫必須能應對海量數據和對瞬間的超大網絡請求,迫使傳統的IT架構必須提升其靈活性、可靠性、流動性、安全性?;诘谒拇⑻貭?至強 可擴展處理器TiDB具備高并發、高可用、熱分表等特性,并可同時處理交易類業務和分析類業務,有望為企業的數字化轉型進程注入充沛的動力。
PingCAP與英特爾的合作驗證了第四代英特爾 至強 可擴展處理器在加速數據庫負載方面的卓越潛力。除了當前的合作成果之外,雙方還將進一步加速軟硬件融合領域的合作,為用戶提供安全可靠、海量數據超高性能支持、彈性擴展能力、HTAP混合負載、資源靈活管控和共享等數據庫能力支撐,構建基于創新技術的基礎設施。
-
處理器
+關注
關注
68文章
19159瀏覽量
229112 -
互聯網
+關注
關注
54文章
11105瀏覽量
103009 -
數據庫
+關注
關注
7文章
3763瀏覽量
64274 -
開源
+關注
關注
3文章
3245瀏覽量
42396
原文標題:第四代至強? 可擴展處理器助TiDB開源分布式數據庫實現優化
文章出處:【微信號:英特爾中國,微信公眾號:英特爾中國】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論