馬里蘭大學(xué)的研究人員使用人工智能系統(tǒng)根據(jù)生物分子(溶菌酶分子)的不斷運(yùn)動(dòng)來(lái)創(chuàng)建抽象語(yǔ)言。這種語(yǔ)言描述了蛋白質(zhì)分子的多種形狀,以及如何以及何時(shí)從一種形狀轉(zhuǎn)變?yōu)榱硪环N形狀,這是了解疾病和開(kāi)發(fā)治療方法的關(guān)鍵信息。
蛋白質(zhì)分子的功能通常取決于其形狀和結(jié)構(gòu),因此了解控制形狀和結(jié)構(gòu)的科學(xué)可以打開(kāi)一扇門,以了解從蛋白質(zhì)的工作原理到疾病原因以及設(shè)計(jì)靶向藥物療法的最佳方法的所有方面。這是機(jī)器學(xué)習(xí)算法首次以這種方式應(yīng)用于生物分子動(dòng)力學(xué),該方法的成功提供了見(jiàn)識(shí),也可以幫助推進(jìn)人工智能(AI)。關(guān)于這項(xiàng)工作的研究論文于2020年10月9日發(fā)表在《自然通訊》雜志上。
該論文的資深作者,馬里蘭大學(xué)化學(xué)與生物化學(xué)系副教授Pratyush Tiwary表示:“在這里,我們展示了當(dāng)編寫(xiě)電子郵件時(shí),用于完成句子的人工智能架構(gòu)可以用來(lái)揭示生命分子所講的語(yǔ)言。我們證明了這些分子的運(yùn)動(dòng)可以被映射成一種抽象的語(yǔ)言,并且人工智能技術(shù)可以用來(lái)從所產(chǎn)生的抽象詞中產(chǎn)生生物學(xué)上真實(shí)的故事。”
生物分子不斷運(yùn)動(dòng),在周圍環(huán)境中變化。它們的形狀取決于如何折疊和扭曲。它們可能會(huì)以給定的形狀保持幾秒鐘或幾天的時(shí)間,然后突然彈開(kāi)并重新折疊成其他形狀或結(jié)構(gòu)。從一種形狀到另一種形狀的過(guò)渡非常類似于逐步展開(kāi)的纏結(jié)線圈的拉伸。當(dāng)線圈的不同部分釋放和展開(kāi)時(shí),分子呈現(xiàn)不同的中間構(gòu)象。
但是從一種形式到另一種形式的轉(zhuǎn)變發(fā)生在皮秒(萬(wàn)億分之一秒)或更短的時(shí)間內(nèi),這使得諸如高功率顯微鏡和光譜學(xué)之類的實(shí)驗(yàn)方法難以準(zhǔn)確地捕獲展開(kāi)的過(guò)程,哪些參數(shù)影響展開(kāi)以及什么不同的形狀是可能的。這些問(wèn)題的答案構(gòu)成了Tiwary的新方法可以揭示的生物學(xué)故事。
Tiwary和他的團(tuán)隊(duì)利用牛頓的運(yùn)動(dòng)定律(可以預(yù)測(cè)分子內(nèi)原子的運(yùn)動(dòng))與強(qiáng)大的超級(jí)計(jì)算機(jī)(包括馬里蘭大學(xué)的Deepthought2)來(lái)開(kāi)發(fā)統(tǒng)計(jì)物理模型,以模擬單個(gè)分子的形狀、運(yùn)動(dòng)和軌跡。
然后,他們將這些模型輸入到機(jī)器學(xué)習(xí)算法中,就像Gmail會(huì)在鍵入內(nèi)容時(shí)自動(dòng)完成句子一樣。該算法將模擬作為一種語(yǔ)言進(jìn)行處理,在這種語(yǔ)言中,每個(gè)分子運(yùn)動(dòng)都形成一個(gè)字母,該字母可以與其他運(yùn)動(dòng)串在一起形成單詞和句子。通過(guò)學(xué)習(xí)確定哪些形狀和運(yùn)動(dòng)相互遵循而哪些不遵循的語(yǔ)法和語(yǔ)法規(guī)則,該算法可以預(yù)測(cè)蛋白質(zhì)在改變形狀時(shí)的糾纏方式以及沿途采取的多種形式。
為了證明他們的方法有效,研究小組將其應(yīng)用于一種名為核糖開(kāi)關(guān)的小生物分子,該分子先前已使用光譜法進(jìn)行了分析。結(jié)果揭示了核糖開(kāi)關(guān)在拉伸過(guò)程中可能采取的各種形式,與光譜學(xué)研究的結(jié)果相吻合。
Tiwary說(shuō):“我希望,這種藥物最重要的用途之一就是開(kāi)發(fā)針對(duì)性強(qiáng)的藥物。希望有強(qiáng)大的藥物結(jié)合力,但只結(jié)合希望結(jié)合的東西。如果我們能夠了解給定目標(biāo)生物分子可以采取的不同形式,那么我們可以實(shí)現(xiàn)這一目標(biāo),因?yàn)槲覀兛梢灾圃焖幬镏荒茉谶m當(dāng)?shù)臅r(shí)間綁定到這些特定形式中的一種,并且只要我們?cè)敢饩涂梢越壎ā!?/p>
這項(xiàng)研究中同樣重要的部分是有關(guān)Tiwary及其團(tuán)隊(duì)使用的語(yǔ)言處理系統(tǒng)的知識(shí),通常被稱為遞歸神經(jīng)網(wǎng)絡(luò),在此特定情況下為長(zhǎng)短期記憶網(wǎng)絡(luò)。研究人員分析了網(wǎng)絡(luò)的基本數(shù)學(xué)原理,因?yàn)樵摼W(wǎng)絡(luò)學(xué)習(xí)了分子運(yùn)動(dòng)的語(yǔ)言。他們發(fā)現(xiàn)網(wǎng)絡(luò)使用的邏輯類似于統(tǒng)計(jì)物理學(xué)中的一個(gè)重要概念,稱為路徑熵。了解這一點(diǎn)為將來(lái)改善遞歸神經(jīng)網(wǎng)絡(luò)提供了機(jī)會(huì)。
Tiwary說(shuō):“很自然地要問(wèn)是否存在使人工智能工具成功的主要物理原理。實(shí)際上,我們發(fā)現(xiàn)這是因?yàn)槿斯ぶ悄苷趯W(xué)習(xí)路徑熵。它提供了更多功能,我們可以進(jìn)行調(diào)整,以更好地實(shí)現(xiàn)生物學(xué)上的人工智能,甚至可以改善人工智能本身。只要了解諸如人工智能之類的復(fù)雜系統(tǒng),它就不再像黑盒一樣,并提供了更有效、更可靠地使用它的新工具。”
責(zé)編AJX
-
人工智能
+關(guān)注
關(guān)注
1791文章
46896瀏覽量
237672 -
智慧醫(yī)療
+關(guān)注
關(guān)注
9文章
1060瀏覽量
46446
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論