精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

使用CUDA-Q實現量子聚類算法

NVIDIA英偉達企業解決方案 ? 來源:NVIDIA英偉達企業解決方案 ? 2024-11-20 10:14 ? 次閱讀

量子計算機能夠利用疊加、糾纏和干涉等量子特性,從數據中歸納出知識點并獲得洞察。這些量子機器學習(QML)技術最終將在量子加速的超級計算機上運行,這種超級計算機結合了 CPUGPU 和 QPU 的處理能力,能夠解決一些世界上最復雜的難題。

許多 QML 算法都假定經典數據可以通過使用所謂的量子隨機存取存儲器(QRAM)進行疊加來實現高效加載,由此提供理論上的加速。由于缺乏實現 QRAM 的有效方法,早期的量子計算機將很有可能只擅長計算,而非數據密集型任務。

實際上,在近期和中期的硬件端上有效運行的 QML 算法必須側重于計算密集型啟發式方法,以便于在沒有 QRAM 的情況下分析數據。

本文將重點介紹愛丁堡大學信息學院量子軟件實驗室副教授 Petros Wallden 博士及其團隊的最新研究成果。Petros 是量子信息學領域的專家,研究范圍涵蓋量子算法、量子密碼學、量子信息學基礎等方面。

Petros 的團隊使用 NVIDIA CUDA-Q(其前身為 CUDA Quantum)平臺開發和加速新 QML 方法的模擬,顯著減少了研究大型數據集所需的量子比特數。

麻省理工學院(MIT)物理學家 Aram Harrow 的研究利用了核心集的概念,為 QML 應用提供了一種新穎的方法,無需 QRAM 就能為其構建現實可行的預言機(oracle)。Petros 的團隊對這一研究進行了擴展。

什么是核心集?

核心集(coreset)是通過提取完整數據集并將其優化映射到較小的加權數據集而形成的(圖 1)。然后,就可以對核心集進行分析,在無需直接處理完整數據集的情況下,近似表示完整數據集的特征。

d5386bfc-a016-11ef-93f3-92fbcf53809c.png

圖 1.用大小為 10 的核心集表示 1000 個點的數據集

核心集是在聚類應用之前采用對數據進行預處理的經典降維方法所產生的結果。通過采用核心集,數據密集型 QML 任務就可以用數量級較少的量子比特來近似表示,并使其成為更加接近實際的近期量子計算應用。

標準的經典核心集構建技術通常先從數據集和目標誤差開始,然后確定核心集的最佳大小,以滿足誤差要求。由于實驗限制,Petros 的團隊根據可用量子比特的數量來選擇核心集的大小,然后在量子計算后評估了這一選擇產生的誤差。

使用核心集進行聚類的量子方法

在將輸入數據縮小到可控大小的核心集后,Petros 的團隊得以探索三種量子聚類算法。

聚類(Clustering)是一種無監督學習方法,該技術描述了一系列以有意義的方式對相似數據點進行分組的方法。這些分組或集群可用于在現實世界的應用中作出明智的決策,例如確定腫瘤是惡性還是良性。

Petros 的團隊使用 CUDA-Q 實現了以下聚類技術:

分裂聚類

在該方法中,核心集數據點從一個集群開始,依次進行雙分區,直到每個數據點都在自己的集群中。該方法可以在第 K 次迭代時停止進程,以便查看數據是如何被劃分到 K 個集群中(圖 2)。

三均值聚類

根據每個數據點與 K 個不斷演化的質量中心(質心)的關系,將數據點劃分到 K 個集群(本例中為 3 個)。當三個集群會聚并且不再隨新的迭代而變化時,過程結束。

高斯混合模型(GMM)聚類

潛在核心點位置的分布被表示為 K 個高斯分布的混合。根據每個核心點最有可能來自哪個高斯分布,將數據分類到 K 個集。

每種聚類技術都會輸出一組核心集,以及原始數據集中的每個點到這些核心集之一的映射。其結果是初始大型數據集的近似聚類和降維。

d56bb9e4-a016-11ef-93f3-92fbcf53809c.png

圖 2.N=25 核心集 QML 分裂聚類模擬結果

通過使用變分量子算法(VQA)框架,每種技術都能以使用 QPU 的方式表達。Petros 和其團隊通過推導出一個加權量子比特哈密頓量(受最大切割問題的啟發),為上述每種聚類方法各自的成本函數進行了編碼,從而實現了這一目標。有了這樣一個哈密頓量,VQA 迭代過程就能反復調用真實或模擬的 QPU,從而高效計算每個聚類例程所需的成本最小化。

使用 CUDA-Q 克服可擴展性挑戰

為了探究這些 QML 聚類方法的有效性,就需要對每種算法的性能表現進行模擬。

NVIDIA CUDA-Q 模擬套件可對每種聚類方法進行全面模擬,可處理的最大問題規模為 25 個量子比特。CUDA-Q 通過實現對 GPU 硬件的便捷訪問,加快了這些模擬的速度。其還提供開箱即用的原語,例如用于將基于哈密頓量的優化過程參數化的硬件高效 ansatz 內核,以及可輕松適應聚類算法成本函數的自旋哈密頓量等。

事實上,只有通過 CUDA-Q 提供的 GPU 加速,才能實現 Petros 團隊在其論文《在小型量子計算機上的大數據應用》中提出的模擬規模。

最初的實驗只在 CPU 硬件上模擬了 10 個量子比特,但由于內存限制,無法進行 25 個量子比特規模的實驗。通過 CUDA-Q,最初的 10 個量子比特的模擬代碼實現了即時兼容性,因此當 Petros 的團隊需要將 CPU 硬件換成 NVIDIA DGX H100 GPU 系統時,無需修改即可運行。

d59b795e-a016-11ef-93f3-92fbcf53809c.png

圖 3.CUDA-Q mgpu 后端通過池化多個 GPU 的內存執行大型狀態向量模擬

這種代碼可擴展性是一個巨大的優勢。由于可以使用 NVIDIA mgpu 后端池化多個 GPU 的內存(圖 3),Petros 和其團隊后來在同樣無需大幅修改原始模擬代碼的情況下,通過改變后端目標進一步擴大了模擬規模。

這項研究的主要開發者 Boniface Yogendran 表示:“有了 CUDA-Q,我們就不必擔心量子比特可擴展性方面的限制,從研究開始的第一天起就已經為實現高性能計算做足了準備。”

由于 CUDA-Q 本身也支持 QPU,Yogendran 的代碼可以將這項工作擴展到模擬以外,為所有主要 QPU 模態上的部署提供支持。

CUDA-Q 模擬的價值

由于能夠輕松模擬所有三種聚類算法,Petros 與其團隊得以將每種算法與用于尋找全局最優解的蠻力方法(用于尋找全局最優解)和一種名為勞埃德算法(Lloyd’s algorithm)的經典啟發式方法進行比較。結果表明,量子算法在 GMM(K=2)方面表現最佳,而分裂聚類方法則與勞埃德算法不相上下。

基于這項工作的成功,Petros 的團隊計劃繼續與 NVIDIA 合作,利用 CUDA-Q 繼續開發和擴展新的量子加速超級計算應用。

探索 CUDA-Q

CUDA-Q 使 Petros 和他的團隊能夠便捷地開發出新穎的 QML 實現方法,并利用加速計算對其進行模擬。通過使用 CUDA-Q,可使代碼具有可移植性,以便進一步進行大規模模擬或在物理 QPU 上部署。

了解有關 CUDA-Q 量子的更多信息或馬上開始使用,請參見分裂聚類 Jupyter 筆記本,其中探討了本文中描述的核心集賦能的分裂聚類方法。該教程展示了如何使用 GPU 便捷擴展代碼并運行 34 個量子比特的實例。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4601

    瀏覽量

    92671
  • 機器學習
    +關注

    關注

    66

    文章

    8382

    瀏覽量

    132438
  • 量子計算機
    +關注

    關注

    4

    文章

    528

    瀏覽量

    25373

原文標題:通過 CUDA-Q 實現量子聚類算法的資源縮減

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    FCM算法以及改進模糊算法用于醫學圖像分割的matlab源程序

    FCM算法以及改進模糊算法用于醫學圖像分割的matlab源程序
    發表于 05-11 23:54

    K均值算法的MATLAB怎么實現

    什么是K-均值法?K均值算法的MATLAB怎么實現
    發表于 06-10 10:01

    算法研究

    算法研究:對近年來算法的研究現狀與新進展進行歸納總結.一方面對近年來提出的較有代表性的
    發表于 10-31 08:57 ?18次下載

    近似骨架導向的歸約算法

    該文針對問題上缺乏骨架研究成果的現狀,分析了問題的近似骨架特征,設計并實現了近似骨架導向的歸約
    發表于 02-10 11:48 ?5次下載

    算法融合算法研究

    算法融合算法研究首先對
    發表于 08-10 15:08 ?33次下載
    <b class='flag-5'>聚</b><b class='flag-5'>類</b><b class='flag-5'>算法</b>及<b class='flag-5'>聚</b><b class='flag-5'>類</b>融合<b class='flag-5'>算法</b>研究

    云存儲中大數據優化粒子群聚算法(基于模糊C均值

    對云存儲系統中的大數據進行優化設計,降低存儲開銷,提高數據管理和調度能力,傳統方法中對云存儲大數據方法采用量子進化方法,當
    發表于 10-28 12:46 ?1次下載
    云存儲中大數據優化粒子群聚<b class='flag-5'>類</b><b class='flag-5'>算法</b>(基于模糊C均值<b class='flag-5'>聚</b><b class='flag-5'>類</b>)

    基于網格的快速搜尋密度峰值的算法優化研究

    CFSFDP是基于密度的新型算法,可非球形數據集,具有
    發表于 11-21 15:08 ?15次下載

    多尺度量子諧振子算法的相空間概率算法

    針對大型集群難以進行任務調度和資源分配的問題,提出一種基于多尺度量子諧振子算法的相空間概率算法( PSPCA-MQHOA)。首先,將集群
    發表于 11-29 14:16 ?0次下載

    K均值算法的MATLAB實現

    K-means算法是最簡單的一種算法算法的目的是使各個樣本與所在均值的誤差平方和達到最小
    發表于 12-01 14:07 ?2.1w次閱讀
    K均值<b class='flag-5'>聚</b><b class='flag-5'>類</b><b class='flag-5'>算法</b>的MATLAB<b class='flag-5'>實現</b>

    基于Spark的動態算法研究

    D-Stream作出并行化改進,用通用的大數據處理框架Spark設計了一個基于分布式架構運行的動態數據算法PDStream。實驗結果表明,該算法具有更高的效率和良好的擴展性,能夠
    發表于 12-04 09:22 ?0次下載
    基于Spark的動態<b class='flag-5'>聚</b><b class='flag-5'>類</b><b class='flag-5'>算法</b>研究

    中點密度函數的模糊算法

    針對傳統模糊C一均值( FCM)算法初始中心不確定,且需要人為預先設定聚類別數,從而導
    發表于 12-26 15:54 ?0次下載

    基于密度DBSCAN的算法

    本文開始介紹了算法概念,其次闡述了算法的分類,最后詳細介紹了
    的頭像 發表于 04-26 10:56 ?2.2w次閱讀
    基于密度DBSCAN的<b class='flag-5'>聚</b><b class='flag-5'>類</b><b class='flag-5'>算法</b>

    NVIDIA 通過 CUDA-Q 平臺為全球各地的量子計算中心提供加速

    —— NVIDIA 于今日宣布將通過開源的 NVIDIA CUDA-Q? 量子計算平臺,助力全球各地的國家級超算中心加快量子計算的研究發展。 ? 德國、日本和波蘭的超算中心將使用該平臺來賦能他們由 NVIDIA
    發表于 05-13 15:21 ?184次閱讀
    NVIDIA 通過 <b class='flag-5'>CUDA-Q</b> 平臺為全球各地的<b class='flag-5'>量子</b>計算中心提供加速

    英偉達CUDA-Q平臺推動全球量子計算研究

    英偉達今日公布了其重要戰略決策,即采用開源的CUDA-Q平臺,旨在推動德國、日本和波蘭等國家超運中心在量子計算領域的創新研究。CUDA-Q作為英偉達推出的一款開源平臺,不僅與QPU無關,還實現
    的頭像 發表于 05-14 11:45 ?623次閱讀

    NVIDIA與谷歌量子AI部門達成合作

    NVIDIA CUDA-Q 平臺使谷歌量子 AI 研究人員能夠為其量子計算機創建大規模的數字模型,以解決設計中面臨的各種挑戰
    的頭像 發表于 11-20 09:39 ?154次閱讀