自 1950 年代發(fā)現(xiàn) DNA 以來,生物學家一直試圖將遺傳密碼的長度與一系列細胞部分和過程聯(lián)系起來——例如,為現(xiàn)在著名的 mRNA 疫苗提供動力的特定抗體的 mRNA 轉(zhuǎn)錄。盡管自發(fā)現(xiàn) DNA 以來在測序和理解基因組方面取得了進展,但仍然存在一個重要的缺失環(huán)節(jié)。生物學家缺乏一種僅使用其 DNA 或 RNA 源代碼來準確有效地預測未知蛋白質(zhì) 3D 形狀的方法。在生物學中,結(jié)構(gòu)決定功能。蛋白質(zhì)在細胞中的作用取決于它的形狀。具有中空中間的圓柱形是良好的膜受體,而 U 形成酶在其峽灣狀的空腔中催化化學反應(yīng)。
但 70 多年來,科學家們一直堅持使用緩慢的方法,這些方法會使計算機緊張,并在很大程度上依靠自己的猜測來梳理蛋白質(zhì)的結(jié)構(gòu)。盡管知道構(gòu)成每種蛋白質(zhì)的組成部分的每種氨基酸的 DNA 代碼段是什么,但生物學家仍缺乏可重復的、可推廣的公式來解決這個所謂的“蛋白質(zhì)折疊問題”。他們需要系統(tǒng)地了解任何一串氨基酸,一旦連接起來,將如何折疊成 3 維持形狀,以解開浩瀚的蛋白質(zhì)世界。
資料來源:DeepMind
2020 年,谷歌的 AI 團隊 DeepMind 宣布其算法AlphaFold已經(jīng)解決了蛋白質(zhì)折疊問題。起初,大多數(shù)人都對這一驚人的突破感到興奮,科學家們隨時準備測試一種新工具,也讓一些人感到有趣。畢竟,這不是幾年前AlphaGo在中國戰(zhàn)略游戲圍棋中擊敗世界冠軍的同一家公司嗎?掌握一個比國際象棋更復雜的游戲,雖然難度很大,但與蛋白質(zhì)折疊的問題相比,感覺微不足道。但是 AlphaFold 通過一年一度的競賽證明了它的科學勇氣,在該競賽中,生物學家團隊僅根據(jù)蛋白質(zhì)的遺傳密碼猜測蛋白質(zhì)的結(jié)構(gòu)。該算法遠遠超過了它的人類競爭對手,發(fā)布了預測最終形狀的分數(shù)在一埃內(nèi),單個原子的寬度。不久之后,AlphaFold 通過正確預測SARS-CoV-2“刺突”蛋白的形狀,通過了第一次真實世界的測試,該蛋白是疫苗靶向的病毒明顯的膜受體。
來源:自然
AlphaFold 的成功很快就變得不可忽視,科學家們開始在他們的實驗室中試用該算法。到 2021 年,《科學》雜志將 AlphaFold 的開源版本加冕為“年度最佳方法”。生物化學家和《科學》雜志的主編 H. Holden Thorp在 一篇社論中寫道:“就科學成就和未來研究的支持而言,蛋白質(zhì)折疊方面的突破是有史以來最偉大的突破之一?!?如今,AlphaFold 的預測非常準確,以至于蛋白質(zhì)折疊問題被認為已解決經(jīng)過 70 多年的探索。雖然蛋白質(zhì)折疊問題可能是迄今為止人工智能在科學領(lǐng)域最引人注目的成就,但人工智能正在許多科學領(lǐng)域悄然發(fā)現(xiàn)。