在將其Grace Hopper芯片直接與量子處理器集成,并在經典超級計算機上展示模擬量子系統的能力之間,英偉達本月在量子計算領域掀起了波瀾。
英偉達當然已經做好了利用后者的準備。它制造了超級計算機使用的GPU,與人工智能開發人員渴望的GPU相同。這些GPU作為在經典計算機上模擬數十個量子位的工具也很有價值。新的軟件開發意味著研究人員現在可以使用越來越多的超級計算資源來代替真正的量子計算機。
但模擬量子系統是一項要求極高的挑戰,而這些要求就在背后若隱若現。
經典計算機在模擬量子硬件方面有兩個作用。首先,量子計算機構建者可以使用經典計算來測試他們的設計。倫敦帝國理工學院博士后研究員Jinzhao Sun表示:“經典模擬是理解和設計量子硬件的一個基本方面,通常是驗證這些量子系統的唯一手段。”
另一方面,經典計算機可以運行量子算法來代替實際的量子計算機。正是這種能力讓研究分子動力學、蛋白質折疊和新興的量子機器學習領域的研究人員特別感興趣,所有這些都受益于量子處理。
經典模擬并不是真正量子物品的完美替代品,但它們經常制作合適的傳真。世界上只有這么多量子計算機,而經典模擬更容易訪問。經典模擬還可以控制困擾真實量子處理器的噪音,并經常破壞量子運行。紐約州厄普頓布魯克黑文國家實驗室的計算機科學和機器學習研究員Shinjae Yoo表示,經典模擬可能比真正的量子模擬慢,但研究人員仍然可以節省時間。
因此,捕獲是一個大小問題。由于量子系統中的一個量子位與該系統中的其他量子位糾纏在一起,因此精確模擬該系統的需求呈指數級增長。根據經驗,每增加一個量子位,模擬所需的經典內存量就會增加一倍。從單個GPU移動到整個八個GPU節點需要增加三個量子位。
許多研究人員仍然夢想著在這個指數斜率上盡可能地向上推進。Yoo說:“如果我們正在進行分子動力學模擬,我們希望有更大數量的原子和更大規模的模擬,以獲得更真實的模擬。”
GPU可以加速量子模擬
GPU是關鍵的立足點。Yoo說,用GPU換CPU可以將量子系統的模擬速度提高一個數量級。這種加速可能并不令人驚訝,但由于GPU之間發送信息的瓶頸,很少有模擬能夠充分利用這一優勢。因此,大多數模擬都停留在一個多GPU節點甚至該節點內的單個GPU的范圍內。
一些幕后的進展使緩解這些瓶頸成為可能。英偉達的cuQuantum軟件開發套件使研究人員更容易在多個GPU上運行量子模擬。GPU以前需要通過CPU進行通信,這造成了額外的瓶頸——像Nvidia的NCCL這樣的集體通信框架允許用戶直接在節點之間進行內存到內存的復制等操作。
cuQuantum與加拿大初創公司Xanadu的PennyLane等量子計算工具包配對。作為量子機器學習社區的堅定支持者,PennyLane讓研究人員在量子計算機上使用PyTorch等技術。雖然PennyLane是為在真正的量子硬件上使用而設計的,但PennyLanne的開發人員特別添加了在多個GPU節點上運行的功能。
從理論上講,這些進步可以讓經典計算機模擬大約36個量子位。在實踐中,這種規模的模擬需要太多的節點小時才能實現。如今更現實的金本位是20s。盡管如此,這比幾年前研究人員所能模擬的還要多出10個量子位。
也就是說,Yoo在Perlmutter超級計算機上工作,這臺超級計算機是由數千個Nvidia A100 GPU構建的,旨在培養和運行人工智能模型的能力,即使在中國,這些模型的銷售也受到美國政府出口管制的限制。西方相當多的其他超級計算機使用A100作為支柱。
經典硬件在qbit仿真中的作用
經典硬件的規模能否繼續增長?挑戰是巨大的。從擁有160G GPU內存的英偉達DGX到擁有320GB GPU內存的DGX,只不過是一個量子位的跳躍。Jinzhao Sun認為,試圖模擬100多個量子位的經典模擬很可能會失敗。
真正的量子硬件,至少在表面上,已經遠遠超過了這些量子位的數量。例如,IBM已經穩步將其通用量子處理器中的量子位數量增加到數百個,并雄心勃勃地計劃將這些數量增加到數千個。
這并不意味著模擬在千量子位的未來不會發揮作用。經典計算機可以在模擬大型系統的各個部分中發揮重要作用——驗證它們的硬件或測試有朝一日可能以全尺寸運行的算法。事實證明,使用29個量子位可以做很多事情。
審核編輯:彭菁
-
仿真
+關注
關注
50文章
4043瀏覽量
133416 -
硬件
+關注
關注
11文章
3252瀏覽量
66114 -
工具包
+關注
關注
0文章
46瀏覽量
9524 -
量子系統
+關注
關注
0文章
21瀏覽量
2609
原文標題:研究人員如何使用Nvidia的GPU模擬Qubits
文章出處:【微信號:IEEE_China,微信公眾號:IEEE電氣電子工程師】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論