地平線發明的卷積處理引擎及控制方法,采用多個緩沖存儲器串聯的方式進行數據的傳輸,能有效降低AI芯片的硬件設計復雜度和成本以及提高芯片的處理效率。
早在2017年,在“AI芯·時代”發布會上,地平線就發布了中國首款全球領先的嵌入式人工智能芯片——面向智能駕駛的征程(Journey)1.0處理器和面向智能攝像頭的旭日(Sunrise)1.0處理器,同步發布的還有針對智能駕駛、智能城市和智能商業三大應用場景的人工智能解決方案。
地平線發布的“旭日 1.0”和“征程 1.0”是完全由地平線自主研發的人工智能芯片,具有全球領先的性能。我們知道,人工智能芯片及其使用的卷積神經網絡算法已經成功地應用于圖像處理、自動駕駛等諸多領域。
隨著應用需求的不斷發展,卷積神經網絡中涉及的乘加運算的運算量越來越多,對于用于卷積神經網絡運算的卷積神經網絡加速器的處理性能也提出越來越高的要求。但是,隨著數據量和運算量的增加,卷積神經網絡加速器消耗在存取數據上的時間急劇增加,并且在很多情況下成為制約卷積神經網絡加速器的處理性能的主要因素之一。
因此, 為實現AI芯片的高性能,地平線在18年11月6日申請了一項名為“卷積處理引擎及控制方法和相應的卷積神經網絡加速器”的發明專利(申請號:201811323140.7),申請人為地平線(上海)人工智能技術有限公司。
根據該專利目前公開的資料,讓我們一起來看看地平線的這項AI芯片技術吧。
如上圖,為該專利中發明的卷積處理引擎示意圖,為了提高卷積處理引擎的處理效率,該方案在卷積處理引擎中設置了多個高速緩沖存儲器(C1-Cn):用于緩存輸入數據的輸入高速緩沖存儲器和用于緩存輸出數據的輸出高速緩沖存儲器。
并且這些緩沖存儲器兩兩之間相互耦合,如下圖所示,例如C1的輸出端藕接到高速緩沖存儲器C2的輸入端,串聯在最開始位置處的存儲器C1將接收和緩存來自于卷積處理引擎外部的數據,并且最末尾的存儲器將緩存的數據傳送到引擎的外部,也就是運算后的結果數據。
這樣盡管有多個緩沖器,但是與外部數據進行交換的始終只有兩個,從而保證了數據的安全性以及簡化了芯片內部結構的設計。而與存儲器配合的是運算電路OC,運算電路中的乘法累加器陣列可以耦合到每個高速緩沖存儲器的輸入端,連接方式有直接互連和間接互連兩種。
如上圖,為該卷積處理引擎中的運算電路OC的結構示意圖,可以看到高速緩沖存儲器布置在其最頂部,通過共同的交叉開關或者單獨的交叉開關耦接到高速緩沖存儲器的輸出段。
值得一提的是,該專利發明的卷積處理引擎CE,不需要針對運算電路OC分別設置輸入和輸出高速緩沖存儲器,只有一個存儲器接收外部數據,也僅有一個存儲器向外輸出數據。因此,這種設計方案能夠簡化每個存儲器與處理引擎中其他部件之間的連線,同時簡化了數據傳輸的控制邏輯,從而能夠極大地降低硬件設置的復雜度和軟件控制復雜度,并且有利于降低功耗。
下面我們再來看看上面這種處理引擎在整個AI芯片中的整體布置示意圖。
可以看到,卷積神經網絡加速器包括兩個片外存儲器DDR1和DDR2以及四個卷積處理引擎CE1-CE4。每個卷積處理引擎包括運算電路、單獨的用于緩存運算參數的高速緩沖存儲器以及三個串聯在一起的高速緩沖存儲器,其中高速緩沖存儲器的輸入端還耦合到高速緩沖存儲器的輸出端。
另外,交叉開關CB跨越四個卷積處理引擎,因此能夠被每個卷積處理引擎中的串聯的三個緩沖存儲器所共用,這樣的配置可以允許一個卷積處理器引擎使用另一個卷積處理器引擎的高速緩沖存儲器。
最后,我們再來看看可以用于控制上述這種硬件結構中卷積處理引擎的方法,首先可以確定待處理的卷積神經網絡中連續的兩層中串聯在一起的高速緩沖存儲器的對應關系,也就是確定每層的輸入特征數與高速緩沖存儲器之間的對應關系。
其次,可以從卷積處理引擎外部接收輸入特征數據并存儲到高速緩沖存儲器的對應部分中,最后在執行操作中,控制卷積處理引擎中的運算電路執行第一操作。
以上就是地平線發明的卷積處理引擎及控制方法,這種卷積處理引擎采用多個緩沖存儲器串聯的方式進行數據的傳輸,每層中獲得的特征數據可以存儲在對應高速緩沖存儲器的對應部分。因此,這樣的設計方案可以以很低的硬件設計復雜度、控制復雜度、成本以及功耗來高效率地實現卷積運算。
關于嘉德
深圳市嘉德知識產權服務有限公司由曾在華為等世界500強企業工作多年的知識產權專家、律師、專利代理人組成,熟悉中歐美知識產權法律理論和實務,在全球知識產權申請、布局、訴訟、許可談判、交易、運營、標準專利協同創造、專利池建設、展會知識產權、跨境電商知識產權、知識產權海關保護等方面擁有豐富的經驗。
責任編輯:tzh
-
芯片
+關注
關注
453文章
50405瀏覽量
421812 -
AI
+關注
關注
87文章
30146瀏覽量
268411 -
人工智能
+關注
關注
1791文章
46858瀏覽量
237552
發布評論請先 登錄
相關推薦
評論