在近日舉行的聯(lián)想創(chuàng)新科技大會(Lenovo Tech World 2022)上,NVIDIA 中國區(qū)軟件解決方案總監(jiān)卓睿與多位業(yè)內(nèi)專家就未來汽車技術(shù)和產(chǎn)品的發(fā)展趨勢展開了對話交流。卓睿回顧了 NVIDIA 在自動駕駛業(yè)務(wù)的發(fā)展歷程,并分享了 NVIDIA 的經(jīng)驗總結(jié)與思考。以下為內(nèi)容概要。
左一:NVIDIA 中國區(qū)軟件解決方案總監(jiān) 卓睿
右一:聯(lián)想集團副總裁車計算負責人 唐心悅
右二:聯(lián)寶科技 CEO 丁曉輝
右三:清華大學博導車輛學院副院長 李升波
右四:黑莓 QNX 中國區(qū)總經(jīng)理 董淵文
從專業(yè)圖形到汽車
NVIDIA 駛?cè)?a target="_blank">無人駕駛領(lǐng)域
無人駕駛是充分展現(xiàn) AI 實力的試金石
NVIDIA 開展自動駕駛業(yè)務(wù)的探索要從 2006 年說起。
2006 年,NVIDIA 推出革命性的CUDA架構(gòu),并應(yīng)用于顯卡中,同時還提供了 CUDA SDK。CUDA 是一種用于通用 GPU 計算的革命性架構(gòu),使科學家和研究人員能夠利用 GPU 的并行處理能力來應(yīng)對最復雜的計算挑戰(zhàn)。現(xiàn)在,無論在高性能計算的企業(yè)計算領(lǐng)域,還是在個人身邊的最為熱門的軟件,都可以利用 GPU 或者顯卡來為其提速。對于企業(yè)來說,這是一場革命,我們可以看到成千上萬基于 CUDA 的包括地質(zhì)勘探、醫(yī)學、數(shù)學、生命科學、金融、流體力學等運算,CUDA 通過 GPU 加速比原來高性能的 PC CPU 加速提速幾十甚至上百倍。
2012 年,AlexNet 在 ImageNet 競賽中以超過第二名 10.9 個百分點的絕對優(yōu)勢一舉奪冠,深度學習和卷積神經(jīng)網(wǎng)絡(luò)一舉成名。自此,深度學習的相關(guān)研究越來越多,行業(yè)也公認 2012 年是 AI 和深度學習神經(jīng)網(wǎng)絡(luò)技術(shù)爆發(fā)的起點。
在此之后,NVIDIA 基于 CUDA 技術(shù)支持業(yè)界流行的 TensorFlow、PythonTorch 等典型訓練框架,助力 AI 在不同領(lǐng)域的研發(fā)和落地。
在探索過程中,NVIDIA 發(fā)現(xiàn)無人駕駛是最復雜的一個 AI 應(yīng)用場景。如今,L2 級自動駕駛相對更為流行,但以車輛為主導的 L3/L4 級等高級別駕駛對 AI 來說更具挑戰(zhàn),這也是 NVIDIA 深入無人駕駛行業(yè)的動力。
NVIDIA 很早就認識到,AI 是由數(shù)據(jù)驅(qū)動的。而無人駕駛不只局限于 AI 本身,也需要考慮到嵌入式的 SoC。在做無人駕駛之前,NVIDIA 在 SoC 上有多年累積的經(jīng)驗,比如在手機、平板電腦、游戲盒子等應(yīng)用領(lǐng)域都有所涉獵,因此有快速啟動的基礎(chǔ)和條件。2016 年,NVIDIA 推出了第一款汽車相關(guān)的 SoC 產(chǎn)品——Parker,這也是 NVIDIA 無人駕駛征程的開始。
無人駕駛最關(guān)鍵的是功能安全,但 NVIDIA 發(fā)布的第一代 Parker 更多是基于 Linux 打通數(shù)據(jù)鏈路,例如攝像頭獲取數(shù)據(jù)后的前處理和推理等,把這個環(huán)節(jié)打通,但欠缺真正的功能安全。
NVIDIA 在 Parker 之后帶來了下一代產(chǎn)品DRIVE Xavier。DRIVE Xavier 有超過 90 億個晶體管,是全球第一個達到 ISO 26262 安全認證的復雜 SoC。由全球主要標準化機構(gòu)——國際標準化組織制定的 ISO 26262 是道路車輛系統(tǒng)、軟件和硬件功能安全領(lǐng)域中最具權(quán)威性的國際標準,要求計算系統(tǒng)能避免、識別并解決故障。為了達到這一標準,一款系統(tǒng)級芯片不僅需要有在運行時檢測到硬件故障的架構(gòu),開發(fā)時還要注意減少潛在的系統(tǒng)故障。這意味著它必須盡可能地避免故障,即使在無法避免的情況下也能檢測到故障并有所反應(yīng)。
NVIDIA 的認證主要分為兩部分:SoC 認證,以及在此之上的 DRIVE OS 認證。DRIVE OS 本身基于 QNX 的 QOS 而集成,整個芯片和 DRIVE OS 作為 SEooC 都可以滿足 ISO 26262 的功能安全標準,達到功能安全評級 ASIL- B。
在這個過程中,NVIDIA 也在優(yōu)化功耗。對于無人駕駛來說,AI 并不是全部,比如一些傳統(tǒng)的 CV(計算機視覺)算法也是非常重要,因此后來我們也加入了 PVA(Programmable Vision Accelerator),可編程視覺加速器,通過 API 加速各種 CV 算法,以滿足低功耗的需求。另外,GPU 雖然非常靈活,但 GPU 本身從能耗比來說表現(xiàn)還不是最好,所以 NVIDIA 又加入了 DLA(Deep Learning Accelerator),深度學習加速器,DLA 的設(shè)計方案,它的性能功耗比就非常好,這也是之后 NVIDIA 計算平臺的標配。目前,NVIDIA 用 GPU +PVA+DLA 相結(jié)合的方式,幫助客戶能夠更加靈活地將不同算法部署在不同引擎上,以達到更好的功耗比和性能表現(xiàn)。
從去年開始,很多中國車企都采用了NVIDIA DRIVE Orin SoC。作為 DRIVE Xavier 的下一代產(chǎn)品,DRIVE Orin 在算力方面有巨大提升。隨著無人駕駛的要求從基本的 NCAP 到 ADAS ,再到 L2+ 以及 L3 級以上,算力的需求也更加迫切。除算力之外,內(nèi)存瓶頸也時常發(fā)生。最終,DRIVE Orin Soc 的算力達到 254 TOPS,內(nèi)存帶寬被設(shè)定在 205GB/s,可以支持車載設(shè)備和傳感器 4 個 10G bps 的網(wǎng)絡(luò)接口,以及 H.265/HEVC/VP9 格式的 4K@60Hz 視頻編碼或者 8K@30H z 視頻解碼。
在功能安全方面,跟 Xavier 一樣,NVIDIA 一直是按照最高標準去作為產(chǎn)品要求。DRIVE Orin 符合 ISO 26262 的功能安全標準,達到最高的功能安全評級 ASIL-D。目前 DRIVE Orin 也是全球領(lǐng)先的車規(guī)級 SoC,在全球領(lǐng)先的 30 家電動汽車制造商中,有 20 家選擇 DRIVE Orin 作為首選的 AI 計算平臺。
NVIDIA DRIVE Orin SoC
除了產(chǎn)品的優(yōu)勢外,NVIDIA 的快速發(fā)展還得益于它廣泛且生機勃勃的合作伙伴生態(tài)。NVIDIA 在中國有很多合作伙伴,涵蓋眾多一級供應(yīng)商、軟件合作伙伴、攝像頭廠商、傳感器廠商等。作為平臺型公司,NVIDIA 與合作伙伴一同賦能車企,助力他們能夠基于 NVIDIA 產(chǎn)品快速開發(fā)企業(yè)專屬的無人駕駛軟件棧,加速自動駕駛汽車的開發(fā)和部署。
長板做長,特色做精
無人駕駛時代,NVIDIA 的“制勝法寶”
三位一體,讓算力得到充分應(yīng)用
現(xiàn)今,不管是車端還是其它 AI 相關(guān)領(lǐng)域,算力越來越多地被提及。特別是今年 9 月 GTC 大會上,NVIDIA 推出了新一代 SoC 、預(yù)計 2025 年量產(chǎn)上車的DRIVE Thor。大算力是 NVIDIA 在自動駕駛市場上的“制勝法寶”嗎?大算力是一個參數(shù)指標,如何讓客戶更好地用好這些算力,是一個更核心的訴求,也是 NVIDIA 一直努力的方向。如果談到 NVIDIA 在自動駕駛市場上的競爭策略,我們可以從以下三個層面去理解:
建立強大的軟件生態(tài)
如何更輕松地使用算力,是每家 AI 公司都會遇到的問題。我在前面也提到,NVIDIA 于 2006 年推出 CUDA,然后在 CUDA 的基礎(chǔ)上構(gòu)建推理框架 TensorRT。
NVIDIA TensorRT 是一個高性能的深度學習計算平臺。它包括深度學習計算優(yōu)化器和運行加速器,可以為深度學習計算應(yīng)用程序提供低延遲和高精度的計算。在 TensorRT 平臺上建立的應(yīng)用程序比 CPU 平臺的應(yīng)用程序運算速度快 40 倍。使用 TensorRT,客戶可以優(yōu)化在所有主框架中培訓的神經(jīng)網(wǎng)絡(luò)模型,最后部署到超大規(guī)模數(shù)據(jù)中心或汽車產(chǎn)品平臺。
不管是服務(wù)器端還是車端,NVIDIA 的所有 SDK 是通用的,都能夠用同樣的 API 幫助客戶從訓練端到推理端做遷移。全球了解 CUDA 和 TensorRT 的開發(fā)者非常多,這也幫助我們建立起了技術(shù)的“護城河”。引用 NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛一直在表達的觀點,NVIDIA 不是芯片公司,而是軟件公司。軟件公司能夠提供好的軟件生態(tài),能夠賦能開發(fā)者和車企,這是 NVIDIA 非常看重的一件事。
強大的 SoC 芯片
無人駕駛需要用到很多傳感器、攝像頭、毫米波雷達和激光雷達,需要通過不同的接口接入到整個域控制器,將數(shù)據(jù)傳到芯片里,進行快速的處理。芯片本身需要有很多引擎接口,以確保整個流程能夠滿足低延遲、實時性的要求。這是 NVIDIA 從另一維度,即在 SoC 的角度加入更多引擎。結(jié)合 QNX 功能安全,同時滿足信息安全這些行業(yè)標準之后, NVIDIA 能夠幫助客戶將更多時間用于算法的研發(fā)上,而不在底層平臺上。
提供端到端解決方案
最后也是最關(guān)鍵的一點,NVIDIA 不只是 SoC 供應(yīng)商,更是端到端解決方案供應(yīng)商。
首先,AI 是數(shù)據(jù)驅(qū)動型的,采集數(shù)據(jù)之后開發(fā)算法,離不開強大、開放的大算力服務(wù)器平臺。例如,NVIDIA DGX 服務(wù)器平臺可以讓客戶在平臺上輕松開發(fā)算法、提取數(shù)據(jù)。此外,之前我也提到過,NVIDIA SDK 支持業(yè)界流行的訓練框架,因此客戶可以用 Docker 方式開發(fā)自己的算法。
NVIDIA DRIVE Sim
其次,無人駕駛是非常復雜的工程,如果不對所開發(fā)出的算法進行大量仿真,那么車端應(yīng)用便不具備充足的安全功能性。NVIDIA Omniverse平臺能夠提供非常好的底層仿真環(huán)境,基于 Omniverse 的DRIVE Sim可以幫助客戶構(gòu)建一個物理屬性準確的仿真平臺,快速、高效地進行大規(guī)模的自動駕駛汽車測試和驗證。
另外,在仿真過程中,也會涉及到有效數(shù)據(jù)獲取的問題。有些數(shù)據(jù)可能非常容易獲取,而有些數(shù)據(jù)則很困難。比如,時間特別短的黃燈數(shù)據(jù)或是路面上的小障礙物數(shù)據(jù),在大部分情況下很難通過人工方式采集到。可是自動駕駛需要解決長尾場景的問題。NVIDIA 的仿真平臺可以在生成這些復雜的合成數(shù)據(jù)的同時,結(jié)合真實數(shù)據(jù)讓算法更加完美,以支持不同的應(yīng)用場景。
最后,客戶也可以通過 DRIVE Sim 仿真平臺,借助域控制器支持路測。從開發(fā)、訓練、測試,到自動駕駛車輛或域控制器的量產(chǎn),NVIDIA 可從多個維度、端到端地幫助客戶快速迭代,共同加速軟件定義時代的到來。
原文標題:探尋 NVIDIA 的自動駕駛發(fā)展之路
文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
-
英偉達
+關(guān)注
關(guān)注
22文章
3749瀏覽量
90851
原文標題:探尋 NVIDIA 的自動駕駛發(fā)展之路
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論