2019年,Michael Kagan在Mellanox Technologies 擔(dān)任首席技術(shù)官,領(lǐng)導(dǎo)加速網(wǎng)絡(luò)技術(shù)的開發(fā) ,這是他和八位同事在 20 年前創(chuàng)立的一家公司。然后在 2020 年 4 月,英偉達(dá)以 70 億美元的價(jià)格收購了該公司,Kagan接任了這家科技巨頭的首席技術(shù)官——這是他夢寐以求的工作。
英偉達(dá)總部位于加州圣克拉拉,但Kagan在公司位于以色列的辦公室工作。
在位于以色列 Yokneam Illit 的 Mellanox,Kagan 監(jiān)督了用于云數(shù)據(jù)中心計(jì)算和存儲(chǔ)的高性能網(wǎng)絡(luò)的開發(fā)。該公司生產(chǎn)適配器、電纜和高性能交換機(jī)等網(wǎng)絡(luò)設(shè)備,以及新型處理器 DPU。Kagan 說,該公司的高速 InfiniBand產(chǎn)品可以在世界上大多數(shù)最快的超級(jí)計(jì)算機(jī)中找到,其高速以太網(wǎng)產(chǎn)品也可以在大多數(shù)云數(shù)據(jù)中心中找到。
IEEE 高級(jí)成員現(xiàn)在的工作重點(diǎn)是整合豐富的 Nvidia 技術(shù)來構(gòu)建加速計(jì)算平臺(tái),其基礎(chǔ)是三個(gè)芯片:GPU、CPU 和 DPU,或數(shù)據(jù)處理單元。DPU 可以支持卸載、加速和隔離數(shù)據(jù)中心工作負(fù)載,從而減少 CPU 和 GPU 工作負(fù)載。
“在 Mellanox,我們致力于數(shù)據(jù)中心互連,但在 Nvidia,我們將最先進(jìn)的計(jì)算連接成一個(gè)單一的計(jì)算單元:數(shù)據(jù)中心,”Kagan 說。互連用于連接多個(gè)服務(wù)器并將整個(gè)數(shù)據(jù)中心組合成一個(gè)巨大的計(jì)算單元。
“我可以訪問并打開 Nvidia 技術(shù)的大門,”他說。“這就是讓我的生活令人興奮和有趣的原因。我們正在構(gòu)建未來的計(jì)算。”
從英特爾到 Mellanox
Kagan出生在俄羅斯的圣彼得堡——當(dāng)時(shí)被稱為列寧格勒。1975 年高中畢業(yè)后,他的家人搬到了以色列。與許多嶄露頭角的工程師一樣,他的好奇心使他分解和重新組裝東西以弄清楚它們是如何工作的。而且,由于家里有很多工程師,他說,從事工程職業(yè)是一個(gè)容易的決定。
他就讀于以色列理工學(xué)院Technion,因?yàn)椤八鞘澜缟献詈玫墓こ檀髮W(xué)之一,”他說。“我選擇電氣工程的原因是因?yàn)樗徽J(rèn)為是 Technion 最好的專業(yè)。”
Kagan 于 1980 年畢業(yè),獲得電氣工程學(xué)士學(xué)位。他于1983年加入位于以色列海法的英特爾,擔(dān)任設(shè)計(jì)工程師,并最終搬到位于俄勒岡州希爾斯伯勒的公司辦公室,在那里他從事 80387 浮點(diǎn)協(xié)處理器的工作。一年后,回到以色列后,Kagan 擔(dān)任 i8060XP 矢量處理器的架構(gòu)師,然后領(lǐng)導(dǎo)和管理 Pentium MMX 微處理器的設(shè)計(jì)。
在英特爾工作的 16 年中,他一路晉升為首席架構(gòu)師。1999 年,他準(zhǔn)備舉家遷往加利福尼亞,在那里他將領(lǐng)導(dǎo)公司的一個(gè)備受矚目的項(xiàng)目。然后,英特爾的前同事 Eyal Waldman 邀請(qǐng) Kagan 加入他和其他五個(gè)熟人的行列,組建了 Mellanox。
他回憶說,Kagan幾乎每周都拒絕加入初創(chuàng)公司的提議,但 Mellanox 及其聯(lián)合創(chuàng)始人團(tuán)隊(duì)和遠(yuǎn)見吸引了他。他說,他認(rèn)為這是一次“引人入勝的冒險(xiǎn),一個(gè)建立公司的機(jī)會(huì)基于我成長的核心價(jià)值觀的文化:卓越、團(tuán)隊(duì)合作和承諾。”
他說,在他在那里的 21 年里,他沒有后悔。
“這是我做過的最偉大的決定之一,”他說。“它最終使我生活的方方面面受益:專業(yè)、經(jīng)濟(jì)和所有的一切。”
Kagan 說,這家初創(chuàng)公司的突破性產(chǎn)品 InfiniBand 專為今天的云計(jì)算而設(shè)計(jì)。
“我們采用了 InfiniBand 的優(yōu)點(diǎn)并將它們固定在標(biāo)準(zhǔn)以太網(wǎng)之上,”他說。“因此,我們成為了最先進(jìn)的高性能計(jì)算網(wǎng)絡(luò)供應(yīng)商。500 強(qiáng)計(jì)算機(jī)公司中超過一半的機(jī)器使用 Mellanox 互連,現(xiàn)在是 Nvidia 互連。
“大多數(shù)云提供商,如 Facebook、Azure和阿里巴巴,都使用 Nvidia 的網(wǎng)絡(luò)和計(jì)算技術(shù)。無論你在互聯(lián)網(wǎng)上做什么,你最有可能通過我們設(shè)計(jì)的芯片運(yùn)行。”
Kagan 表示,Mellanox 和 Nvidia 之間的合作是“自然的”,因?yàn)閮杉夜疽呀?jīng)合作了近十年。
“我們作為獨(dú)立公司提供了很多創(chuàng)新解決方案,”他說。
BlueField 和 Omniverse 超級(jí)計(jì)算機(jī)
過去兩年,作為 Nvidia 的 CTO,Kagan 已經(jīng)將他的關(guān)注點(diǎn)從單純的網(wǎng)絡(luò)轉(zhuǎn)移到集成多種 Nvidia 技術(shù),包括構(gòu)建 BlueField數(shù)據(jù)處理單元和Omniverse實(shí)時(shí)圖形協(xié)作平臺(tái)。
他表示,英偉達(dá)對(duì)未來數(shù)據(jù)中心的愿景基于其三款芯片:CPU、DPU 和 GPU。
“這三個(gè)支柱與最初在 Mellanox 開發(fā)并在 Nvidia 進(jìn)一步開發(fā)的非常高效和高性能的網(wǎng)絡(luò)相連,”他說。
BlueField DPU 的開發(fā)現(xiàn)在是 Nvidia 的重中之重。它是一種芯片上的數(shù)據(jù)中心基礎(chǔ)設(shè)施,針對(duì)高性能計(jì)算進(jìn)行了優(yōu)化。它還卸載、加速和隔離各種網(wǎng)絡(luò)、存儲(chǔ)和安全服務(wù)。
“在數(shù)據(jù)中心,你無法控制你的客戶是誰,”Kagan說。“客戶很可能是一個(gè)壞人,想要侵入他的鄰居或你的基礎(chǔ)設(shè)施。你最好通過讓一個(gè)隔離的或不同的計(jì)算平臺(tái)運(yùn)行操作系統(tǒng)來將你自己和其他客戶彼此隔離開來,這基本上是基礎(chǔ)設(shè)施管理、資源管理和供應(yīng)。”
Kagan 對(duì) Omniverse 感到特別興奮,這是一種新的 Nvidia 產(chǎn)品,它使用皮克斯的通用場景描述軟件來創(chuàng)建虛擬世界——這就是眾所周知的元宇宙。Kagan 將 3D 平臺(tái)描述為“通過收集數(shù)據(jù)和對(duì)世界進(jìn)行物理上準(zhǔn)確的模擬來創(chuàng)造一個(gè)世界”。
汽車制造商正在使用 Omniverse 來試駕自動(dòng)駕駛汽車。無需在各種條件下在不同類型的道路上實(shí)際駕駛汽車,而是可以生成有關(guān)虛擬世界的數(shù)據(jù)來訓(xùn)練 AI 模型。
“你可以創(chuàng)造汽車必須在現(xiàn)實(shí)世界中處理但你不希望它在現(xiàn)實(shí)世界中遇到的情況,比如車禍,”Kagan說。“你不想讓汽車撞車來訓(xùn)練模型,但你確實(shí)需要讓模型能夠處理道路上的危險(xiǎn)情況。”
Omniverse 平臺(tái)可以生成數(shù)百萬公里的合成駕駛數(shù)據(jù),速度比實(shí)際駕駛汽車快幾個(gè)數(shù)量級(jí)。
Kagan說,英偉達(dá)正在大力投資自動(dòng)駕駛汽車技術(shù)。
該公司還在建造它所謂的最強(qiáng)大的氣候科學(xué)人工智能超級(jí)計(jì)算機(jī):Earth-2,地球的數(shù)字雙胞胎。Earth-2 旨在持續(xù)運(yùn)行模型以預(yù)測區(qū)域和全球?qū)用娴臍夂蚝吞鞖馐录?/p>
Kagan說,氣候建模技術(shù)將使人們能夠嘗試減緩全球變暖的技術(shù),并了解它們在 50 年后可能產(chǎn)生的影響。
該公司還與醫(yī)療保健行業(yè)密切合作,開發(fā)基于人工智能的技術(shù)。它的超級(jí)計(jì)算機(jī)通過生成合成數(shù)據(jù)來幫助識(shí)別癌癥,使研究人員能夠訓(xùn)練他們的模型以更好地識(shí)別腫瘤。Kagan說,它的人工智能和加速計(jì)算產(chǎn)品還有助于藥物發(fā)現(xiàn)和基因組研究。
“我們實(shí)際上正在以相當(dāng)不錯(cuò)的速度前進(jìn),”他說。“但問題是,你總是需要重新改造自己,更快更好地完成新事物,并且基本上以你擁有的東西取勝,而不是尋找無限的資源。這就是承諾的意義。
聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)發(fā)僅為更大范圍傳播,若有異議請(qǐng)聯(lián)系我們修改或刪除
審核編輯 黃昊宇
-
芯片
+關(guān)注
關(guān)注
454文章
50460瀏覽量
421980 -
DPU
+關(guān)注
關(guān)注
0文章
354瀏覽量
24136 -
英偉達(dá)
+關(guān)注
關(guān)注
22文章
3749瀏覽量
90863
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論