1XDF(賽靈思開發者大會)在北京國際飯店舉行。作為業界最權威、最具深度的FPGA交流大會之一,Xilinx把行業最頂尖的FPGA專家和企業匯聚一堂,集思廣益,分享和交流FPGA產品開發經驗與應用方案,為業內軟硬件開發者與設計者提供獨到的見解和靈感。Xilinx CEO Victor Peng 、華為IT智能計算業務副總裁張小華、阿里云FPGA異構計算研發總監張振祥等業內領袖出席。同時,在會上,賽靈思推出了業界首款自適應計算加速平臺Versal和加速器Alveo,引爆現場。
作為Xilinx在中國智能汽車電子領域唯一的Certified member,深圳市自行科技有限公司(簡稱:自行科技)受邀參加,公司聯合創始人兼CTO諶璟博士在現場分享了“基于FPGA的計算機視覺系統設計與開發”的主題演講。諶璟博士結合其多年的深度學習與FPGA開發經驗,從性能、成本、開發難度等多個維度出發,提出一套系統化的FPGA深度神經網絡優化流程,受到了Xilinx AI及邊緣計算產品營銷總監Nick與機器學習產品營銷高級經理Andy等業內專家的高度贊賞。
圖文:自行科技聯合創始人兼CTO諶璟博士做主題演講
諶博認為,CNN與FPGA的結合可以組合利用多種算法模塊,充分發揮FPGA在計算速度、功耗、成本等方面的優勢,降低開發難度與周期,減少開發成本。但是CNN中存在大量冗余計算,因此如何在FPGA中實現CNN加速設計就尤為重要。
諶璟博士演講獲得現場嘉賓觀眾一致好評
自行科技通過多年CNN與FPGA自主研發經驗,開發出業內最具性價比的FPGA加速設計方案。會中,她表示,FPGA加速設計需要算法工程師和FPGA工程師共同參與。一方面,通過剪枝壓縮、權值壓縮等方法對網絡壓縮算法進行優化,以減少網絡冗余計算,釋放可用資源。例如,我們可以僅僅將少數“重要”的卷積核量化為8bit權值,其余卷積核用1bit權值表示,構造混合精度網絡,在確保網絡檢測性能的基礎上大幅度提高計算效率。另一方面,不同的FPGA架構需要適配對應的CNN網絡結構,因此需要有針對性地進行并行化和結構化設計,讓計算模塊得到充分利用,避免大量計算資源閑置。同時,在進行網絡設計時還要充分利用FPGA片內資源,避免DSP計算資源與邏輯資源的浪費。
以SSD網絡為例,在不考慮其他操作帶來的時延(DDR時延、FSM狀態轉移時延~等)的情況下,Xilinx zynq7020在CNN計算幀率最高可達5.7fps;但是,自行科技通過權值壓縮、并行化設計等CNN網絡加速設計和算法優化后,計算幀率提升了4-5倍,大大提高了芯片的運行效率,成為了業內低成本高效率FPGA應用典范!
最后,諶博總結到:“FPGA與CNN的結合具備廣泛的應用前景,但是在開發的過程中也需要我們不斷克服困難和挑戰。當前FPGA平臺技術與工具不斷迭代更新,這就需要我們時刻關注世界最前沿的技術。今天我非常高興在現場見證了業界首款自適應計算加速平臺Versal ACAP以及新一代FPGA加速器卡Alveo。這不僅可以加快公司軟硬件迭代創新進程,還為我們探索更優秀的FPGA加速方案提供了思路。未來,隨著CNN的計算量不斷上升,數據吞吐量也會顯著增大,這就需要不斷提高FPGA片內BRAM資源利用效率,深入研究CNN模型壓縮算法,優化基于FPGA的CNN框架,這也需要行業共同的努力!”
目前,該方案已經成功應用于公司的三大產品:前向ADAS系統、駕駛員監控(DMS)系統和智能環視影像系統,產品都已順利實現量產。基于FPGA平臺與CNN算法的深度結合,自行科技率先開發出國內首款基于深度學習技術的駕駛員監控(DMS)系統,打造出業內功能最全面、性價比最高的駕駛員監控(DMS)系統,成為國內駕駛員監控系統標桿企業。
除此之外,自行科技前向ADAS系統與智能環視影像系統以其可靠的目標檢測準確性和語義分割精度獲得國內眾多傳統車廠(乘用車與商用車)、新能源和互聯網造車公司和Tier1汽車零部件供應商的高度認可。相信隨著FPGA開發技術的不斷成熟,CNN加速設計將獲得更廣泛的應用,讓我們拭目以待!
-
監控系統
+關注
關注
21文章
3866瀏覽量
173511 -
高效率
+關注
關注
0文章
31瀏覽量
10436 -
異構計算
+關注
關注
2文章
99瀏覽量
16272
發布評論請先 登錄
相關推薦
評論