據IEEE報道,英國Pragmatic Semiconductor 公司及其同事研發的新型超低功耗 32 位微處理器可以在彎曲時運行,并可運行機器學習工作負載。該微芯片的開源 RISC-V 架構表明其成本可能不到一美元,使其能夠為可穿戴醫療電子產品、智能包裝標簽和其他廉價物品供電,其發明者補充道。
例如,“我們可以開發一種心電圖貼片,該貼片在胸部安裝有柔性電極,并在柔性電極上連接有柔性微處理器,通過處理患者的心電圖數據來對心律失常進行分類,”英國劍橋柔性芯片制造商 Pragmatic 的處理器開發高級總監 Emre Ozer 說道。他表示,檢測正常心律與心律失常“是一項機器學習任務,可以在柔性微處理器的軟件中運行”。
柔性電子產品具有與軟材料相互作用的任何應用的潛力,例如佩戴在身上或植入體內的設備。這些應用可能包括皮膚上的計算機、軟機器人和腦機接口。但是,傳統電子產品是由硅等剛性材料制成的。
開源、靈活、速度足夠快
Pragmatic 公司致力于開發一種柔性微芯片,其制造成本遠低于硅處理器。這款新設備名為 Flex-RV,是一款基于金屬氧化物半導體氧化銦鎵鋅 (IGZO ) 的 32 位微處理器。
嘗試用硅制造柔性設備需要對易碎的微芯片進行特殊封裝,以保護它們免受彎曲和拉伸的機械應力。相比之下,用 IGZO 制成的柔性薄膜晶體管可以直接在低溫下在柔性塑料上制造,從而降低成本。
新的微芯片基于RISC-V指令集。(RISC 代表精簡指令集計算機。)RISC-V 于 2010 年首次推出,旨在通過精簡處理器可執行的核心指令集來實現更小、更低功耗、性能更好的處理器。
“我們的最終目標是通過開發免許可的微處理器來實現計算的普及,”Ozer說。
RISC-V 既免費又開源,讓芯片設計人員可以避免與 x86 和 Arm 等專有架構相關的昂貴許可費用。此外,專有架構提供的定制機會有限,因為添加新指令通常受到限制。相比之下,RISC-V 鼓勵這種改變。
“我們在設計 Flex-RV 時選擇了Olof Kindgren 設計的Serv ... 作為開源 32 位 RISC-V CPU,”Ozer 說道。“Serv 是開源社區中最小的 RISC-V 處理器。”
其他處理器也采用柔性半導體制造,例如 Pragmatic 的 32 位PlasticARM以及由伊利諾伊州工程師設計的超廉價微控制器。與這些早期設備不同,Flex-RV 是可編程的,可以運行用 C 等高級語言編寫的編譯程序。此外,RISC-V 的開源性質還讓研究人員為 Flex-RV 配備了可編程的機器學習硬件加速器,從而實現人工智能應用。
每個 Flex-RV 微處理器都有一個 17.5 平方毫米的核心和大約 12,600 個邏輯門。研究小組發現 Flex-RV 的運行速度可以達到 60 千赫茲,而功耗卻不到 6 毫瓦。
所有之前的柔性非硅微處理器都是在制造它們的晶圓上進行測試的。相比之下,Flex-RV 是在柔性印刷電路板上進行測試的,這讓研究人員能夠看到它在彎曲時的表現如何。Pragmatic 團隊發現,當彎曲到半徑為 3 毫米的曲線時,Flex-RV 仍然可以正確執行程序。根據彎曲方式的不同,性能在 4.3% 的減速到 2.3% 的加速之間變化。“需要進一步研究,以了解方向、方位和角度等彎曲條件如何影響宏觀和微觀尺度上的性能,”Ozer 說。
硅微芯片可以以千兆赫的速度運行,比 Flex-RV 快得多,但 Ozer 表示這應該不是問題。“柔性電子領域的許多傳感器(例如溫度、壓力、氣味、濕度、pH 值等)通常以赫茲或千赫茲的頻率運行,運行速度非常慢,”他說。“這些傳感器用于智能包裝、標簽和可穿戴醫療電子產品,這些是柔性微處理器將大有裨益的新興應用。以 60 kHz 的頻率運行微處理器足以滿足這些應用的要求。”
Ozer 和他的團隊認為,每臺 Flex-RV 的成本可能不到一美元。盡管 Ozer 不愿透露成本可能低于一美元多少,但他表示,他們相信如此低的成本是可能的,“這要歸功于 Pragmatic 的低成本柔性芯片制造技術和免許可的 RISC-V 技術。”
以下為關于這項技術的論文全文翻譯:
半導體已經對社會產生了非常深遠的影響,加速了科學研究并推動了更大的連通性。未來的半導體硬件將在量子計算、人工智能和邊緣計算方面開辟新的可能性,用于網絡安全和個性化醫療等應用。就其精神而言,開放硬件為教育、學術研究和行業之間的更大合作和創新提供了機會。
這里我們介紹了 Flex-RV,這是一款基于開放 RISC-V指令集的 32 位微處理器,采用銦鎵氧化鋅薄膜晶體管在柔性聚酰亞胺基板上制造,可實現超低成本可彎曲微處理器。Flex-RV 還在微處理器內部集成了可編程機器學習 (ML) 硬件加速器,并演示了擴展 RISC-V 指令集以運行 ML 工作負載的新指令。它經過實現、制造和演示,運行頻率為 60 kHz,功耗不到 6 mW。其組裝到柔性印刷電路板上時的功能在平坦和緊密彎曲條件下執行程序時得到驗證,平均性能變化不低于 4.3%。
Flex-RV 開創了低于 1 美元的開放標準非硅 32 位微處理器時代,并將使計算訪問變得普及化,并解鎖可穿戴設備、醫療保健設備和智能包裝中的新興應用。
文章重點
我們推出了 Flex-RV,這是一款基于開源 32 位 RISC-V 中央處理單元 (CPU) 的 32 位 RISC-V 微處理器,并擴展了機器學習 (ML) 功能,采用銦鎵氧化鋅 (IGZO) 薄膜晶體管 (TFT) 制造,可為新興應用提供超低成本且適應性強的微處理器。
新興應用尚未嵌入微處理器,例如快速消費品(例如智能標簽和包裝)、醫療保健可穿戴設備(例如智能貼片和敷料)、一次性醫療保健植入物(例如神經接口)和一次性醫療保健測試條(例如橫向流動測試、微流體)主要是因為成本和外形尺寸。成本是實現這些應用的決定性因素,特別是在智能標簽和商品包裝中。
此外,就物理靈活性和可彎曲性而言,外形尺寸對于醫療保健可穿戴設備和植入物非常重要。這些新興應用對速度和通信帶寬的計算要求并不高。這些應用中的傳感器所需的數據采樣率不高于 200 Hz;在某些情況下,采樣率可以高達 1 kHz,因此以低時鐘頻率(例如 <100 kHz)工作的微處理器可以滿足應用的計算要求。
50 多年來,硅 (Si) 一直是開發微處理器的基礎半導體技術,在其發展道路上不斷改進性能、面積、功耗和成本,這主要受到摩爾定律的推動。在此期間,微處理器的速度從 kHz 提高到 GHz,因為晶體管的幾何尺寸從幾微米縮小到今天的 2-3 納米,低端微控制器的單位成本高達幾美元。然而,對于許多新興應用來說,微處理器幾美元的單位成本是行不通的。單位成本無法降至不到 1 美元的水平有三個主要原因:(1) Si 晶圓廠的資本成本;(2) CPU 指令集、知識產權 (IP) 許可和非經常性工程 (NRE) 成本;以及 (3) 微處理器芯片封裝成本。
1.硅晶圓廠資本:
最先進的硅制造廠需要數百萬的資本投資,主要專注于先進節點的高端微處理器(例如 2-3 納米)。低端微處理器(如嵌入式系統的微控制器)可以在較舊的傳統晶圓廠(>65 納米)中生產,以最大限度地降低投資成本。然而,工廠在傳統晶圓廠的投資相對較少,這會導致運營和合規成本隨著時間的推移而增加,同時還會帶來環境問題。
2.IP 許可和 NRE 成本:
每個微處理器都有一個 CPU,它根據其特定的指令集架構 (ISA) 執行程序,該架構可以是專有的(例如,Intel 和 AMD 的 x86、Arm 的 ARMvX)或開源的(即 RISC-V)。專有 ISA 提供了成熟的生態系統,但許可成本高昂,并且由于添加新指令通常受到限制,因此提供的定制有限。替代方案包括許可現有 CPU(會產生前期 IP 成本),或開發新的專有 ISA,這需要 CPU 設計 NRE 成本和軟件工具集開發費用,這兩者都會增加單位成本。
3.芯片封裝:
硅芯片對環境條件(包括機械應力)敏感。它們易碎,需要組裝到單獨的封裝(例如塑料、陶瓷)上以保護它們免受環境影響。芯片連接、組裝、封裝材料和封裝芯片測試的成本增加了微處理器的名義單位成本。此外,將剛性硅微處理器嵌入這些可穿戴或可植入設備之一具有挑戰性,因為微處理器的芯片封裝將限制設備在剛性和厚度方面的能力。必須消除剛性芯片封裝材料,以降低微處理器的成本并使其在新興應用中具有適應性。
我們需要一種超低成本、可適應并提供可接受性能的微處理器,以滿足新興應用的要求。為了實現價格低于 1 美元且物理上靈活的微處理器,兩種支持技術可以幫助我們克服以前的限制:
1.RISC-V ISA:
必須將低于 1 美元的微處理器中 CPU 的 NRE 成本降至最低(例如,ISA/IP 許可)。RISC-V是一種開放且免費的 ISA 標準,允許任何人開發實現 ISA 的 CPU,從而消除了 ISA 許可費,從而消除了微處理器開發的 NRE 成本。此外,RISC-V 生態系統鼓勵創新,不限制修改或擴展(例如,新指令),使設計人員能夠定制微處理器以滿足定制或應用需求,而無需承擔額外成本或限制性許可的負擔。
2.IGZO TFT:
低于 1 美元的微處理器必須采用替代 Si 的半導體技術在比 Si 晶圓廠(包括傳統晶圓廠)便宜幾個數量級且碳足跡更少的晶圓廠中制造,其中的碳足跡是指芯片設計和制造過程中的二氧化碳排放量。
IGZO 是一種金屬氧化物半導體材料,可用于使用低溫光刻工藝在柔性聚酰亞胺基板上開發 TFT 。TFT 是通過在絕緣體基板上沉積半導體、電介質和電極來制造的,而不是在剛性硅晶片上使用摻雜 Si 來開發 MOSFET(金屬氧化物半導體場效應晶體管)。
Pragmatic的FlexLogic晶圓廠可以制造由 IGZO TFT 制成的柔性芯片或 FlexIC ,與同等 Si 晶圓廠相比,每個 FlexIC 的碳足跡要低幾個數量級。此外,FlexIC 不需要像 Si 芯片那樣使用額外的芯片封裝(例如塑料、陶瓷)來保護它們免受機械應力,因為它們不易碎,可以抵抗彎曲等機械應力。這可以將微處理器的單位成本進一步降低到低于 1 美元的水平,同時還具有彎曲功能。
之前曾有過基于柔性基板的非硅微處理器原型。早期的研究基于使用低溫多晶硅 TFT 和有機、混合氧化物和金屬氧化物 TFT 的 8 位 CPU 。在下文中,作者?介紹了 PlasticARM -第一款基于專有ARM ISA 的 32 位微處理器,該 ISA 使用基于 IGZO 的TFT。
PlasticARM不是可編程微處理器,其片上只讀存儲器中只運行三個硬連線程序。雖然不是基于柔性基板,但展示了一種源自 RISC-V ISA 的 16 位 CPU,該 CPU 使用互補碳納米管晶體管在傳統硅晶片上構建。除了非硅微處理器外,先前的研究已經展示了使用在柔性基板上制造的 IGZO TFT 設計和實現的幾種ML ASIC(專用集成電路)。
Flex-RV 在三個方面不同于之前的非硅微處理器:(1)32 位微處理器是可編程的,可以運行用高級語言(例如 C)編寫的任意編譯程序。(2)RISC-V 的開源性質允許使用新指令擴展 ISA,因此 Flex-RV 還具有可編程 ML 加速器,該加速器與 CPU 緊密耦合,并添加了自定義 RISC-V 指令。(3)我們通過使用為此工作開發的創新技術(稱為邊緣印刷或 OEP)將微處理器裸片組裝到柔性印刷電路板 (FlexPCB) 上,展示了微處理器在晶圓級測試之外的功能,而所有其他以前的工作都是在晶圓級上演示的,無需從玻璃載體上釋放并切割。
這樣,我們就可以在運行程序的同時對 Flex-RV 進行物理彎曲測試,以驗證其在機械應力下的功能。我們演示了組裝到 FlexPCB 上的 Flex-RV 的功能,并在多個測試程序中量化了其性能。我們的結果表明,組裝在 FlexPCB 上的 Flex-RV 可以以高達 60 kHz 的速度運行,同時功耗不到 6 mW,并且可以彎曲到曲率半徑小于 5 mm 時仍能正確執行程序。
這項工作開啟了下一代智能、普適計算的大門,其中靈活、可編程的處理器與 ML 功能的集成將智能感知嵌入到日常物品中。
Flex-RV 系統架構
我們使用開源 Serv RISC-V CPU 來實現微處理器,這是迄今為止開發的最小的開源 RISC-V CPU 之一。Serv 是一種位串行 CPU,其中 32 位計算是逐位執行的,而不是像更典型的 CPU 那樣并行執行。這以犧牲性能為代價降低了 32 位 RISC-V 處理器的設計復雜性,其低設計復雜性是選擇 Serv 作為 Flex-RV 的 CPU 的主要原因。我們圍繞 Serv CPU 設計了一個簡單的片上系統 (SOC),以開發可以與外界通信的微處理器。
Flex-RV 被設計為一個簡單的 SOC,由一個 Serv RISC-V CPU 和附加外設組成。作為 Serv 參考平臺開發的 Servant SOC 被用作 Flex-RV 的起點。如圖1a所示,Servant 包含 Serv CPU、寄存器文件 (RF)、調試開關、多路復用器開關、仲裁器、隨機存取存儲器 (RAM) 接口、片上 RAM 塊和通用輸入/輸出 (GPIO) 接口。Serv 支持 RISC-V RV32I ISA,它具有 32 個通用寄存器和 4 個額外的控制和狀態寄存器。代碼和數據通過調試開關從外部存儲器加載到片上 RAM 中。GPIO 接口可用于與外部世界通信(例如顯示器)。
我們修改了 Servant 中的某些功能來開發 Flex-RV,如圖1b所示。例如,Serv 經過修改以支持 RV32E ISA,它支持與 RV32I 相同的指令集,但僅使用前 16 個寄存器。我們刪除了調試開關和片上 RAM。由于當前的 FlexIC 技術出于面積/功率原因不允許我們放置相當大的片上存儲器(例如,>1kB SRAM),我們選擇使用片外存儲器來訪問代碼和數據,因此添加了自定義串行外設接口 (SPI) 或 C-SPI 塊來與外部存儲器通信。C-SPI 塊從外部存儲器獲取 32 位 RISC-V 指令,并對存儲器執行 32 位數據加載/存儲操作。使用 C-SPI 與外部存儲器通信而不是使用并行數據、地址和控制總線訪問它的主要原因是為了減少片外焊盤的數量,從而簡化將 Flex-RV 組裝到 FlexPCB 上的過程。C-SPI 塊的詳細信息(包括內存事務)可在方法中找到。
我們還設計了一個可編程的 ML 加速器,它是一個 SIMD(單指令多數據)引擎,用于加速當代 ML 算法中常用的矩陣乘法和后處理操作。ML 加速器作為自定義功能單元 (CFU) 與 Serv 緊密耦合,并在 RV32E ISA 中添加了四條新指令,以便可以對加速器進行編程。方法中描述了 ML 模型、加速器架構、四條新指令和編程接口的詳細信息。
Flex-RV 已使用 RISC-V 架構合規套件針對 RV32E ISA 進行了驗證。還開發了幾個測試基準來驗證其功能,這些基準是用 C 語言編寫的(帶有一些內聯匯編代碼),并使用 RISC-V GNU 編譯器工具進行編譯。測試基準和編譯環境的詳細信息可以在方法中找到。
我們使用 Pragmatic 的 0.6 μm FlexIC 技術實現 Flex-RV,該技術采用由 n 型 IGZO TFT 和電阻上拉組成的單極邏輯。芯片實現(即綜合、布局布線、靜態時序分析、布局布線后仿真和簽核)是使用商用電子設計自動化 (EDA) 工具執行的。RF 是一個雙端口陣列,具有一個讀端口和一個寫端口,陣列大小為 20 × 32 位(或 80 字節)。它使用布局鄰接方法通過鎖存器實現,以增加陣列的密度(詳情請參閱方法 )。芯片的布局和芯片照片如圖2所示。測試芯片的芯片尺寸為 9 mm × 6 mm,有 20 個引腳,芯片中裝有兩個 Flex-RV 微處理器。每個 Flex-RV 微處理器的核心面積為 17.5 mm2 , NAND等效門數為 12,596,3 V 時的功耗為 5.8 mW。由于電阻上拉邏輯,5.8 mW 功耗主要是靜態的 (99%)。
測試芯片是在 Pragmatic 的 FlexLogic 晶圓廠中制造的,采用薄膜沉積工藝,在厚度為 30 μm 的 200 毫米聚酰亞胺晶圓上制造的,該工藝可創建金屬氧化物 TFT 和電阻器的圖案層,具有四個可布線的金屬層和一個額外的 RDL(重新分布層),用于將芯片的核心焊盤重新布線到將成為與外部世界接口的外圍焊盤。
測試基礎設施和結果
測試基礎設施由兩個完整階段組成:(1)玻璃晶圓測試和(2)FlexPCB 測試。
MicroZed Zynq-7000 現場可編程門陣列 (FPGA) 板用于測試 Flex-RV。FPGA 芯片經過編程以模擬外部存儲器,并通過同樣在 FPGA 上實現的 SPI 塊與晶圓上的 Flex-RV 通信。編譯后的測試基準的二進制文件被加載到 FPGA 上的內存中,FPGA 板重置測試芯片中的每個 Flex-RV,然后它們開始執行每個內核。測試基準的結果通過每個 Flex-RV 的 GPIO 引腳傳輸,該引腳通過 FPGA 連接到個人計算機 (PC) 的通用異步接收器-發送器 (UART) 接口,以在屏幕上顯示結果。FPGA 板還為每個測試芯片提供電源、時鐘和復位信號。
在第一階段,使用半自動晶圓探針臺(圖3a)對晶圓上的測試芯片進行功能測試,以識別功能正常的 Flex-RV。在第二階段,使用 OEP(一種為這項工作開發的新組裝方法)將第一階段識別的功能正常的 Flex-RV 組裝到 FlexPCB 上(圖3b)。然后,組裝好的 FlexPCB 通過 FPC 連接器連接到 FPGA 板(圖3c)。基于 FPGA 的測試基礎設施和 OEP 組裝過程的詳細信息可以在方法中找到。
圖3d顯示了測試芯片中的 Flex-RV 微處理器在 13 個組裝的 FlexPCB 上運行所有測試基準時可達到的最高時鐘頻率(以千赫茲 (kHz) 為單位)的分布。13 個 FlexPCB 上的平均和最大時鐘頻率分別為 52 kHz 和 60 kHz。
最后,我們在機械應力下驗證了 Flex-RV 組裝的 FlexPCB 的功能,并測量了最高可實現時鐘頻率的變化。機械應力是通過將每個 FlexPCB 沿著與 FlexPCB 連接器平行的軸(也沿著 Flex-RV 的長度)滾動在非導電圓柱體上來實現的,直到測試芯片彎曲到圓柱體的曲率半徑。已知 IGZO TFT 可以彎曲到 3 毫米的曲率半徑而不會損壞,并且器件參數(例如遷移率和閾值電壓)在不同的應變情況下會發生變化。但是,這些測試針對的是單個 IGZO TFT 器件,而我們主要研究 FlexIC 級別的可彎曲性公差。
目前尚未有研究證明像 Flex-RV 這樣的復雜 FlexIC 單獨或在 FlexPCB 上組裝時通電運行時的可彎曲性。我們使用三個不同的圓柱體(半徑分別為 3 毫米、4 毫米和 5 毫米)證明了組裝在 FlexPCB 上的 Flex-RV 的可彎曲性,并在拉伸(即芯片的曲率向外)和壓縮(即芯片的曲率向內)模式下對其進行測試,如圖4a、b分別所示。總共對包含九個 Flex-RV 微處理器的七個組裝 FlexPCB 進行了可彎曲性分析測試。這是一個動態可彎曲性測試,因為在芯片中的兩個 Flex-RV 微處理器都在運行測試基準時,會滾動 FlexPCB 并彎曲 Flex-RV 芯片——圖4c中顯示了一個示例。
當 FlexPCB 平放時,測試基準開始在微處理器上運行。在程序運行時,FlexPCB/Flex-RV 會繞圓柱體彎曲至拉伸模式,然后恢復至平坦狀態。接下來,它們會彎曲至壓縮模式,然后再恢復至平坦狀態。每個 FlexPCB 上的 Flex-RV 微處理器都會重復此操作兩次。
圖4d顯示了在三個不同彎曲半徑下彎曲實驗的加速結果。在動態彎曲測試期間,當芯片處于拉伸或壓縮模式時,在每個 Flex-RV 微處理器上運行測試基準直至完成。我們在拉伸或壓縮模式下測量 Flex-RV 微處理器在所有測試基準中可實現的最高時鐘頻率,并將其與平坦時可實現的最高時鐘頻率進行比較,即時鐘頻率的加速。我們的結果表明,當每個微處理器回到其最高可實現時鐘頻率時,即在兩個平坦位置、兩個拉伸和壓縮模式之間,Flex-RV 微處理器表現出靈活性。
我們還觀察到兩種趨勢:(1) Flex-RV 在拉伸模式下運行速度更快,但在壓縮模式下運行速度更慢,這歸因于設備(即 TFT 和電阻器)和導線參數(例如電阻和電容)的變化。(2) 隨著曲率半徑的減小,其在拉伸模式下的性能會提高。這是因為隨著芯片的拉伸力增加,器件和導線參數會按比例變化,從而提高 Flex-RV 的性能,而在壓縮模式下則相反。彎曲實驗表明,Flex-RV 在 3 毫米的彎曲半徑下可以正常工作,并且平均而言,與平坦位置相比,Flex-RV 在拉伸模式下的運行速度可以提高 2.3%,在壓縮模式下的運行速度可以降低 4.3%。
結論
我們開發了一款低于 1 美元、可彎曲且靈活的微處理器 Flex-RV,它采用基于 0.6 μm IGZO TFT 技術的非硅技術,并支持開放的 RISC-V 指令集。此外,我們在 Flex-RV 中加入了可編程硬件加速器,以支持 ML 應用。Flex-RV 在低成本、低環境足跡的 FlexLogic 晶圓廠中在厚度為 30 μm 的聚酰亞胺基板上制造,然后組裝到厚度為 45 μm 的 FlexPCB 上,構建超薄計算系統。我們的實驗結果表明,Flex-RV 的運行速度可以高達 60 kHz,總功耗不到 6 mW,并且可以在低至 3 mm 的彎曲曲率半徑內正常運行,運行程序時的性能變化范圍平均為加速 2.3% 到減速 4.3%。因此,它可以滿足快速消費品、可穿戴設備和醫療保健設備中許多新興應用的需求。
Flex-RV是構建不依賴任何傳統電子元件的超低成本可彎曲計算機的重要里程碑。
-
芯片
+關注
關注
453文章
50387瀏覽量
421783 -
RISC-V
+關注
關注
44文章
2228瀏覽量
46025 -
柔性芯片
+關注
關注
0文章
6瀏覽量
3253
原文標題:一款顛覆性的RISC-V芯片
文章出處:【微信號:HXSLH1010101010,微信公眾號:FPGA技術江湖】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論