三井物產株式會社子公司借助 NVIDIA AI 平臺實現數據集的安全共享并使用在這些數據集上建立的強大模型加速藥物研發。
三井物產株式會社(Mitsui & Co)成立于 77 年前。公司通過使用生成式 AI、機密計算等新技術構建業務和生態系統來保持活力。
這家總部位于東京、擁有 16 個部門的企業集團進行了許多方面的數字化轉型,包括自動駕駛卡車服務、地理空間分析平臺等。三井物產甚至還與一家處于量子計算前沿的合作伙伴開展合作。
在醫療領域,一種新藥的上市可能需要花費十多億美元且歷時十年之久。于是,三井物產成立了一家新的子公司 Xeureka,旨在加快醫療領域的研發速度。
三井物產數字化轉型部門項目經理 Katsuya Ito 表示:“我們使用 AI 和機密計算等新數字技術創建業務。我們的大部分工作都是與科技公司合作完成的,在這個項目中的合作伙伴是 NVIDIA 和 Fortanix(一家位于舊金山的安全軟件公司)。”
獲取大數據
Xeureka 成立僅三年,但已經完成了一項概念驗證,解決了藥物研發的最大問題之一——獲取足夠的數據。
為了加快藥物研發速度,需要有強大的 AI 模型,而建立模型所需的數據集規模超過了大多數制藥公司手頭上的數據集。由于數據通常包含患者的私人信息以及制藥公司專有的化學配方,因此不久前,公司之間共享數據還是一件不可想象的事情。
機密計算在 GPU 或 CPU 的一個受保護的部分中處理數據。這個部分就像一個黑匣子,里面記錄著企業最重要的機密。
為確保自己的數據始終處于保密狀態,銀行、政府機構甚至廣告主都在使用這項技術。多家全球數一數二的大公司還組成了一個聯盟支持該技術。
隱私概念驗證
為了驗證機密計算是否能讓客戶安全地共享數據,Xeureka 創建了兩家假想公司,每家公司都有上千種候選藥物。先將兩家公司的數據集分別用于訓練預測化學品毒性水平的 AI 模型,然后將這些數據合并,訓練出一個類似但更大的 AI 模型。
Xeureka 在NVIDIA GPU上使用 Fortanix 的安全管理軟件進行了測試。Fortanix 是首批支持機密計算的初創公司之一。
NVIDIA GPU 支持可信執行環境,可通過基于硬件的引擎在不影響性能的情況下,確保并驗證機密工作負載在 GPU 上使用時受到保護。Fortanix 軟件可管理數據共享、加密密鑰和整個工作流。
準確率最高提升 74%
所得到的結果十分驚人。由于使用了組合數據集,大模型的預測準確率提高了 65-74%。
Ito 表示,使用一家公司的數據創建的模型具有不穩定性和偏差問題,而大模型則不存在這些問題。
Xeureka 首席技術官 Hiroki Makiguchi 在 Fortanix 的一份新聞稿中表示:“NVIDIA 和 Fortanix 的機密計算從根本上緩解了隱私和安全問題,同時還提高了模型的準確性,對整個行業來說是一次雙贏。”
AI 超級計算生態系統
如今 Xeureka 正與 GPU 加速 AI 超級計算機 Tokyo-1 背后的社區合作,探索如何將這項技術廣泛應用于藥物研發。Tokyo-1 于今年 2 月發布,旨在提高日本和其他國家制藥公司的效率。
最初的項目可能包括合作預測蛋白質結構、篩選配體-堿基對、使用可信服務加速分子動力學仿真等。Tokyo-1 用戶可通過NVIDIA BioNeMo藥物研發微服務和框架,充分利用化學、蛋白質、DNA 和 RNA 數據格式的大語言模型。
這是三井物產整個戰略發展計劃的一環。該計劃將通過開發醫療軟件和服務,推動日本價值 1000 億美元制藥業的發展。日本是繼美國和中國之后的世界第三大制藥國。
Xeureka 提供的服務將包括使用 AI 快速篩選數十億種候選藥物、預測有用分子與蛋白質的結合方式、仿真詳細的化學行為等。
-
NVIDIA
+關注
關注
14文章
4949瀏覽量
102825 -
醫療
+關注
關注
8文章
1802瀏覽量
58668 -
AI
+關注
關注
87文章
30239瀏覽量
268474
原文標題:科研機構借助 NVIDIA AI 平臺確保醫療數據安全
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論