由 NVIDIA 等企業賦能的一家初創公司推出了基于 NVIDIA GPU 模型的新型蛋白質研究方案。
基于提示的代碼生成技術讓生成式 AI 徹底革新了軟件開發領域,接下來蛋白質設計領域也將迎來變革。
EvolutionaryScale 于 6 月 25 日發布了第三代 ESM 模型 ESM3,該模型可同時對蛋白質的序列、結構和功能進行推理,為蛋白質研發工程師提供了一個可編程的平臺。
這家初創公司源自 Meta 公司的基礎 AI 研究(FAIR)部門,最近獲得了由 Lux Capital、Nat Friedman 和 Daniel Gross 領投以及 NVIDIA 和亞馬遜參投的融資。
EvolutionaryScale 處于可編程生物學的最前沿,可以幫助研究人員設計蛋白質,從而幫助找到癌細胞的靶點、尋找有害塑料的替代品、推動環境保護等等。
通過 ESM3 模型的規模化開發,EvolutionaryScale 開拓了可編程生物學的前沿,讓 ESM3 成為有史以來算力最高的生物基礎模型。980 億參數的 ESM3 模型比其前身 ESM2 多使用了大約 25 倍的浮點運算和 60 倍的數據。
EvolutionaryScale 整理了一個包含 20 多億個蛋白質序列的數據庫用于訓練 AI 模型,它提供的技術可以為藥物開發、疾病根除以及藥物研發人員服務。
通過 ESM3 加速計算機生物學研究
借助大量訓練數據,EvolutionaryScale 希望通過 ESM3 加速蛋白質研發。
該模型采用了從生物體和生物群落中采樣的近 28 億個蛋白質序列進行訓練,使科學家能夠提示該模型識別和驗證新的蛋白質,并不斷提升精度。
與之前的版本相比,ESM3 帶來了重大更新。這是一個原生的生成式模型,也是一個 “all to all” 模型,意味著結構和功能注解可以作為輸入信息,而不僅僅是輸出信息。
該模型公開上線后,科學家們就可以對其進行微調,基于自己的專有數據構建專用模型。ESM3 通過大量數據進行大規模生成式訓練,加強了蛋白質設計能力,為計算機生物研究提供了一臺時光機。
通過 NVIDIA BioNeMo
推動下一個重大突破
ESM3 為生物學家和蛋白質設計師提供了增強的生成式 AI,幫助他們更好地設計和理解蛋白質。通過簡單的提示,它可以根據提供的蛋白質骨架生成新的蛋白質,根據反饋自我改進蛋白質設計,以及根據用戶指定的功能設計蛋白質。這些功能能夠以任意組合串聯使用,以提供思維鏈蛋白質設計,就好像用戶在給一位“研究人員”發信息一樣,而這位“研究人員”已經記住了人類已知的每一個蛋白質序列的復雜三維含義,并且已經流利地掌握了這種語言,使用戶能夠來回迭代。
EvolutionaryScale 聯合創始人兼工程副總裁 Tom Sercu 表示:“在我們的內部測試中,ESM3 能夠創造性地響應各種復雜提示,這給我們留下了深刻的印象。它曾解決了一個極其困難的蛋白質設計問題,創造出一種新型的綠色熒光蛋白。我們希望 ESM3 幫助科學家加快工作進展,開辟新的可能性——期待著看到它為未來的生命科學研究做出重要貢獻。”
EvolutionaryScale 已于 6 月 25 日開放 API 接口進行封閉測試,提供小型 ESM3 開放版本的代碼和權重,供非商業用途使用。這個版本即將在NVIDIA BioNeMo上發布,后者是一個用于藥物發現的生成式 AI 平臺。完整的 ESM3 系列模型將很快以NVIDIA NIM微服務的形式提供給指定客戶,該服務在與 NVIDIA 合作下進行了運行時優化,并由 NVIDIA AI Enterprise 軟件許可證支持,可在 ai.nvidia.com 上進行測試。
訓練這些模型所需的算力呈指數級增長。ESM3 使用 Andromeda 集群進行訓練,該集群配備了NVIDIA Quantum-2 InfiniBand網絡。
ESM3 模型將在指定合作伙伴的平臺上提供,包括 Amazon Bedrock、Amazon Sagemaker、AWS HealthOMICs 和 NVIDIA BioNeMo。
-
NVIDIA
+關注
關注
14文章
4949瀏覽量
102825 -
gpu
+關注
關注
28文章
4703瀏覽量
128723 -
AI
+關注
關注
87文章
30239瀏覽量
268473 -
模型
+關注
關注
1文章
3178瀏覽量
48729
原文標題:NVIDIA 為用于蛋白質設計的生成式 AI 模型 ESM3 提供支持
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論