在過去的幾年中,化學研究只專注于使用從個人經驗和文獻中獲得的先前研究成果的進行試驗的方法。盡管在文獻中一直有很多反應和化學途徑可供科學家使用,但在一系列反應/一系列反應中可能會發生許多不可預測的自發場景。這是化學研發需要時間和耐心才能產生結果的原因之一。
在過去的十年左右的時間里,計算化學領域一直在增長。盡管早在那之前,計算方法的使用還是很有限的,但是近年來,它已經成為優化和預測化學研究的非常強大的工具。現在,使用計算方法,化學家可以預測反應的工作方式,最佳參數、要使用的試劑和反應條件,甚至可以使用計算方法來預測他們計劃制造的材料/分子的結構和性質。
因此,計算方法可以在整個概念、開發和分析過程中為化學家提供幫助。那么,為什么近年來使用量增加了?首先,化學家對計算化學有了更多的了解,并意識到它可以帶來的好處。第二,更多科學家現在更容易獲得支持這些模擬所需的計算能力。第三,機器學習算法的進步以及它們在計算化學過程中的集成,使得可以獲得更準確的結果-實驗進行時,成功的可能性更高。
將機器學習應用于化學過程
像許多實施機器學習的領域一樣,它在計算化學領域的用途是從文獻中獲取所有已知數據,進行推斷和分析,并預測最可能的結果。對于化學領域,這通常意味著從不同的反應中獲取數據,例如試劑的類型、化學物質的濃度、工藝條件以及可以生產的產品。
所有這些數據都是有價值的,因為它們都是可以決定結果的因素,使反應物成為理想的輸入集,而產物則成為輸出。這些數據的使用可以被輸入到機器學習算法中,并且可以用來做三件事。首先是通過使用現有數據,可以推斷出化學結構形成的最可能原因(從反應/過程的角度來看),并且可以被工業界用來預測執行其所需功能的新分子。
第二種方法更多地與流程本身有關。有時,研究人員會想到一個產品,但不知道其過程。可以從以前的反應中獲取數據并進行分析,這使算法能夠預測哪些條件和試劑將負責分子中不同化學基團的形成。這使算法可以創建反應路徑,該算法顯示了逐步構建分子的最可能途徑。
第三種方法是完整的分子設計方法,該方法以一個想法開始,但沒有定義的產物或反應途徑。這采用了其他兩點的原則。盡管如此,除了一個變量(產物或反應)外,兩者在技術上都是未知的,因此算法需要外推產物和反應條件,以產生可能的結果/途徑。這是一項較難執行的任務,但受到了很多關注。
機器學習預測分子
計算化學的另一個主要方面是對材料/分子本身,它們的基本內在特性以及它們在某些情況/環境下的行為進行預測。與工業中通常采用的工藝優化相比,這是計算化學的更基本、更長時間的使用,并且在學術界研究新材料和分子時通常更常用(因為這是時間、金錢和有效產品規模的體現)。應當指出的是,這些努力不僅限于化學領域,因為在生物和工程領域也使用了類似的計算方法。
即使需要關注的因素較少(即僅關注分子,而不是過程和分子),但在此領域中使用計算化學也很重要,因為它有助于從根本上實現結果。通常是在創建工業流程之前發生的階段-機器學習也確實幫助提升了這一領域。
模擬分子的結構及其如何執行并非易事。多年來,一直受到需要計算的變量數量與可用計算能力的限制(許多研究人員共享一臺超級計算機來執行上述計算)。機器學習在這方面確實有所幫助,因為與以前相比,計算原子的各種數量、鍵能、能量和反應勢壘、量子特性、磁和激發分子態以及分子間和分子內相互作用都非常容易。
從一組變量和已知數據點推斷和預測最佳解決方案是機器學習最擅長的事情,這意味著使用機器學習算法可以更輕松地優化必須計算的大量數據。上述許多變量對分子/分子系統的結構和性質都有重要影響,因此推論出比往年更準確的分子和性質。它甚至可以使更復雜的原子(例如元素周期表中的d和f塊元素)的計算精度更高,而在過去的幾年中這是不可能的。
總結
即使有幾種不同的計算程序可用于創建這些分子模擬,但是機器學習也可以應用于所有這些模擬中。機器學習不僅有助于優化和改善工業水平上的化學和藥物發現過程,而且在推論已知和未知分子的分子結構和特性,了解分子在某些情況下的行為以及反應最有可能產生的結果等基礎性方面也發揮了關鍵作用。
總體而言,機器學習已經對計算化學產生了巨大影響,并且隨著越來越多的化學家在嘗試實驗程序之前首先轉向計算/模擬,機器學習將在未來幾年中發揮更大的作用。
責任編輯:PSY
-
人工智能
+關注
關注
1791文章
46859瀏覽量
237577 -
機器學習
+關注
關注
66文章
8377瀏覽量
132409 -
大數據
+關注
關注
64文章
8863瀏覽量
137299
發布評論請先 登錄
相關推薦
評論