在线不卡日本ⅴ一区v二区_精品一区二区中文字幕_天堂v在线视频_亚洲五月天婷婷中文网站

<menu id="lky3g"></menu>

<pre id="lky3g"><tt id="lky3g"></tt></pre>

<span id="0rizk"><pre id="0rizk"></pre></span>

<object id="0rizk"></object>

從AlphaGo到AlphaFold，什么是AI工具的最佳用法？

用戶投稿 ? 2022年7月30日 15:17 ? 社會

圖片來源@視覺中國

文 | 觀察未來科技

兩年前，2020年12月，Science雜志評選了該年度十個重大科學(xué)突破，除了在特殊大背景下的mRNA疫苗，還有一項就是蛋白質(zhì)結(jié)構(gòu)預(yù)測的人工智能——AlphaFold。AlphaFold是由谷歌公司深度學(xué)習(xí)方面的核心團(tuán)隊DeepMind所開發(fā)，該團(tuán)隊一直致力于用人工智能和神經(jīng)網(wǎng)絡(luò)技術(shù)解決不同場景下的學(xué)習(xí)問題——大名鼎鼎的AlphaGo就出自DeepMind麾下。

在圍棋博弈算法AlphaGo大獲成功后，DeepMind又轉(zhuǎn)向了基于氨基酸序列的蛋白質(zhì)結(jié)構(gòu)預(yù)測，提出了名為AlphaFold的深度學(xué)習(xí)算法，并在國際蛋白質(zhì)結(jié)構(gòu)預(yù)測比賽CASP13中取得了優(yōu)異的成績。AlphaFold的橫空問世在幾年的時間里徹底改變了生物學(xué)，不過，目前，科學(xué)家們似乎仍在尋找AlphaFold這類人工智能工具的最佳用法。

撥開制藥迷霧

制藥業(yè)是危險與迷人并存的行業(yè)。傳統(tǒng)上，如果某家制藥公司想要開發(fā)一種新藥，只能為了找到潛在的候選藥物而去搜索龐大的醫(yī)學(xué)資料庫。但顯然，這種方法存在巨大的不確定性，需要科學(xué)家們付出多年的努力，而且即使找到了候選藥物也只是一個起點。一旦確定了候選藥物，接下來，科學(xué)家們就要對它們進(jìn)行分析、合成，整個過程可能又需要好幾年。

最后，研究人員還要對發(fā)現(xiàn)的藥物進(jìn)行臨床試驗，一開始是在動物身上進(jìn)行，然后是在一小群人身上，最后是在一大群人身上。簡而言之，藥品的開發(fā)是一場耗時又耗錢的漫長“戰(zhàn)爭”。除此之外，這場戰(zhàn)爭中的“陣亡者”數(shù)量也很大——根據(jù)《自然》數(shù)據(jù)，一款新藥的研發(fā)成本大約是26億美元，耗時約10年，而成功率則不到十分之一。

盡管面臨重重阻礙，但計算機(jī)科學(xué)家出身的生物物理學(xué)家亞歷克斯·扎沃龍科夫（Alex Zhavoronkov）卻創(chuàng)造性地提出了一條可能的捷徑。2012年前后，扎沃龍科夫開始注意到，人工智能在圖像、語音和文本識別方面變得越來越擅長了。在他看來，這三個任務(wù)都有一個關(guān)鍵的共同點，那就是在每一種情況下都需要龐大的數(shù)據(jù)庫，從而用于訓(xùn)練人工智能。

類似的數(shù)據(jù)庫也出現(xiàn)在了藥理學(xué)中。因此，在2014年，扎沃龍科夫開始考慮是否可以利用這些數(shù)據(jù)庫和人工智能技術(shù)來加快藥物開發(fā)的過程。

為了把這些想法變成現(xiàn)實，扎沃龍科夫在馬里蘭州巴爾的摩市的約翰霍普金斯大學(xué)一個名為Insilico Medicine的機(jī)構(gòu)，開始了研究。Insilico Medicine的“藥物發(fā)現(xiàn)引擎”的起點就是對數(shù)百萬的數(shù)據(jù)樣本進(jìn)行篩選，以確定特定疾病的生物學(xué)特征，然后再利用這個引擎確定最有希望的治療靶點，并運用生成性對抗網(wǎng)絡(luò)去生成完全適合這些靶點的分子。

3年后，扎沃龍科夫獲得了成功，扎沃龍科夫開發(fā)出的系統(tǒng)，發(fā)現(xiàn)了潛在藥物靶點的爆炸性增長和一個更有效的測試過程，讓一場以往持續(xù)時間長達(dá)10年或“持久戰(zhàn)”變成了一個月內(nèi)就可以結(jié)束的“小沖突”。在2018年年底，Insilico Medicine在不到46天的時間里就得到了一系列新分子，而且他們的成果不僅包括最初的發(fā)現(xiàn)，還包括藥物的合成和計算機(jī)模擬的驗證實驗。

新藥發(fā)明的過程還包括了一個關(guān)鍵的步驟，即識別新藥靶點，也就是藥物在體內(nèi)的結(jié)合位置，這是藥物研發(fā)過程的另一個關(guān)鍵部分。

實際上，從1980年到2006年，盡管每年的投資高達(dá)300多億美元，但是平均而言研究人員每年仍然只能找到5種新藥。其中關(guān)鍵的問題就在于復(fù)雜性。大多數(shù)潛在藥物的靶點都是蛋白質(zhì)，而蛋白質(zhì)的結(jié)構(gòu)，即2D氨基酸序列折疊成3D蛋白質(zhì)的方式?jīng)Q定了它的功能。

一個只有100個氨基酸的蛋白質(zhì)，已經(jīng)是一個非常小的蛋白質(zhì)了，但就是這么小的蛋白質(zhì)，可以產(chǎn)生的可能形狀的種類依然是一個天文數(shù)字，大約是一個1后面跟著300個0。這也正是蛋白質(zhì)折疊一直被認(rèn)為是一個即使大型超級計算機(jī)也無法解決的難題的原因。

從1994年開始，為了監(jiān)測這種超越超級計算機(jī)能力的蛋白質(zhì)折疊過程，科學(xué)界每年都會舉辦一次蛋白質(zhì)結(jié)構(gòu)預(yù)測關(guān)鍵評估（CASP）大賽。直到2018年幾乎沒有人取得過成功。但是，DeepMind的開發(fā)者們利用神經(jīng)網(wǎng)絡(luò)化解了這個難題。他們開發(fā)出了一種人工智能，可以通過挖掘大量的數(shù)據(jù)集來確定蛋白質(zhì)堿基對與它們的化學(xué)鍵的角之間的可能距離——這是蛋白質(zhì)折疊的基礎(chǔ)。他們把這個人工智能命名為AlphaFold。

典型的量變，巨大的質(zhì)變

2018年，AlphaFold首次參加了CASP大賽，并摘得頭魁。在2018年的比賽中，AlphaFold需要與其他參賽的人工智能比賽，解決43個蛋白質(zhì)折疊的問題。最終，AlphaFold答對了25個，而獲得第二名的人工智能只勉強答對了3個。AlphaFold的誕生，成為了蛋白質(zhì)結(jié)構(gòu)解析領(lǐng)域里程碑，也徹底改變了成千上萬生物學(xué)家的研究。

2020年，DeepMind發(fā)布了AlphaFold軟件的第二個版本。相較于第二個版本，2018年的更早版本并不夠好，不能取代使用實驗方法解析的結(jié)構(gòu)，而AlphaFold2的預(yù)測結(jié)果平均而言已與實驗結(jié)果相差無幾。當(dāng)時，AlphaFold2再一次在CASP大賽上一舉奪魁。CASP大賽每兩年舉辦一次，呈現(xiàn)了生物學(xué)界在一項艱巨挑戰(zhàn)上的最新進(jìn)展。

2020年的這項挑戰(zhàn)是如何僅憑蛋白質(zhì)的氨基酸序列確定其3D結(jié)構(gòu)。計算機(jī)軟件給出的結(jié)構(gòu)會拿來與經(jīng)過X射線晶體學(xué)或冷凍電鏡（cryo-EM）這類實驗方法確認(rèn)的結(jié)果進(jìn)行對比。X射線晶體學(xué)和冷凍電鏡分別通過X射線和電子束照射蛋白質(zhì)的方式來對蛋白質(zhì)的結(jié)構(gòu)進(jìn)行成像。

AlphaFold的預(yù)測用被稱為“427組”，多個預(yù)測達(dá)到了驚人的準(zhǔn)確性，讓它們脫穎而出。當(dāng)然，AlphaFold的預(yù)測水平有高有低，但將近三分之二的預(yù)測結(jié)果都與實驗結(jié)果在質(zhì)量上不相上下。AlphaFold的預(yù)測甚至幫助確定了Lupas實驗室多年來一直想要破解的一種細(xì)菌蛋白的結(jié)構(gòu)。

一年后，2021年7月15日，AlphaFold2的論文發(fā)表，同時公開的還有免費的開源代碼等信息，讓業(yè)內(nèi)的研究人員們可以打造屬于自己的版本。一周后，DeepMind宣布已經(jīng)用AlphaFold預(yù)測了人體內(nèi)近乎所有蛋白質(zhì)的結(jié)構(gòu)，以及20個其他被大量研究的生物體的完整“蛋白質(zhì)組”，其中包括小鼠和大腸桿菌，累計共有36.5萬個結(jié)構(gòu)。

DeepMind還將這些信息上傳到了由EMBL歐洲生物信息學(xué)研究所（EMBL–EBI）維護(hù)的數(shù)據(jù)庫。在那之后，這個數(shù)據(jù)庫已經(jīng)收錄了近100萬個結(jié)構(gòu)。根據(jù)DeepMind的統(tǒng)計，目前已有超40萬人使用過EMBL-EBI的AlphaFold數(shù)據(jù)庫。此外，還有一些AlphaFold的“超級用戶”：這些研究人員在自己服務(wù)器上安裝了AlphaFold，或是打造了AlphaFold的云版本，用來預(yù)測不在EMBL-EBI數(shù)據(jù)庫中的結(jié)構(gòu)，或是探索AlphaFold的新用途。

今年，DeepMind還計劃發(fā)布總計1億多個結(jié)構(gòu)預(yù)測——相當(dāng)于所有已知蛋白的近一半，是蛋白質(zhì)數(shù)據(jù)銀行（PDB）結(jié)構(gòu)數(shù)據(jù)庫中經(jīng)過實驗解析的蛋白數(shù)量的幾百倍之多。

要知道，過去半個多世紀(jì)，人類一共解析了五萬多個人源蛋白質(zhì)的結(jié)構(gòu)，人類蛋白質(zhì)組里大約17%的氨基酸已有結(jié)構(gòu)信息；而AlphaFold的預(yù)測結(jié)構(gòu)將這一數(shù)字從17%大幅提高到58%；因為無固定結(jié)構(gòu)的氨基酸比例很大，58%的結(jié)構(gòu)預(yù)測幾乎已經(jīng)接近極限。這是一個典型的量變引起巨大的質(zhì)變，而這一量變是在短短一年之內(nèi)發(fā)生的。

AlphaFold的最佳用法

除了在制藥領(lǐng)域發(fā)揮作用，AlphaFold還被應(yīng)用到了更多領(lǐng)域。

一方面，AlphaFold的結(jié)構(gòu)解析能力極大解放了生物學(xué)家們的研究：有研究團(tuán)隊還在搜索另一個包含從海洋和廢水中提取的DNA序列的數(shù)據(jù)庫，試圖發(fā)現(xiàn)新的食塑酶。通過讓AlphaFold快速預(yù)測數(shù)千個蛋白的結(jié)構(gòu)，該團(tuán)隊希望能更好地理解酶是如何通過演化擁有分解塑料的能力，并能進(jìn)一步優(yōu)化它們。

哈佛大學(xué)演化生物學(xué)家Sergey Ovchinnikov認(rèn)為，這種將任何蛋白編碼基因序列轉(zhuǎn)化為可靠結(jié)構(gòu)的能力，對于演化研究來說非常有用。研究人員通過比較基因序列來確定不同物種的生物體與它們基因之間的親緣關(guān)系。而對于親緣關(guān)系較遠(yuǎn)的基因來說，這種比較可能無法發(fā)現(xiàn)演化近親，因為這些序列已經(jīng)變了很多。但通過比較變化速度比基因序列更慢的蛋白質(zhì)結(jié)構(gòu)，研究人員或許能揭示之前沒注意到的古代關(guān)系。

另一方面，AlphaFold還是個絕佳的實驗工具，AlphaFold能提供一個初步預(yù)測，之后再由實驗驗證或優(yōu)化。比如，來自X射線晶體學(xué)的原始數(shù)據(jù)以衍射X射線的圖樣呈現(xiàn)。一般來說，科學(xué)家需要對蛋白質(zhì)結(jié)構(gòu)有個初步猜測，才能解釋這些圖樣。而AlphaFold的預(yù)測讓大部分X射線圖樣不再需要這些方法。

另外，AlphaFold不僅改變了科學(xué)家測定蛋白質(zhì)結(jié)構(gòu)的方式。一些研究人員還在利用這些工具打造全新的蛋白質(zhì)。華盛頓大學(xué)生物化學(xué)家、蛋白質(zhì)設(shè)計和結(jié)構(gòu)預(yù)測領(lǐng)域帶頭人David Baker表示，深度學(xué)習(xí)徹底改變了他們團(tuán)隊設(shè)計蛋白質(zhì)的方式。Baker的團(tuán)隊讓AlphaFold和另一個AI工具RoseTTAFold來設(shè)計新的蛋白。他們改寫了人工智能的代碼，讓軟件在得到隨機(jī)氨基酸序列的情況下，對它們進(jìn)行優(yōu)化，直到合成出能被這些神經(jīng)網(wǎng)絡(luò)識別為蛋白的東西。

2021年12月，Baker的研究團(tuán)隊報告了他們在細(xì)菌中表達(dá)了129種這些幻想蛋白，發(fā)現(xiàn)其中約1/5的蛋白會折疊成類似他們預(yù)測的結(jié)構(gòu)。而這是這種網(wǎng)絡(luò)能用來設(shè)計蛋白質(zhì)的首個證明。

基于此，今年7月21日，來自華盛頓大學(xué)等機(jī)構(gòu)的科學(xué)家們在Science雜志上發(fā)布了一款新的AI軟件，該軟件能夠為自然界中尚不存在的蛋白質(zhì)繪制結(jié)構(gòu)。更重要的是，科學(xué)家們已經(jīng)利用這一軟件創(chuàng)造出潛在用于工業(yè)反應(yīng)、癌癥治療、甚至用于預(yù)防呼吸道合胞病毒（RSV）感染的候選疫苗的原始化合物。

雖然AlphaFold的出現(xiàn)推動了巨大進(jìn)展，但科學(xué)家認(rèn)為有必要說明它的局限性：一些研究人員嘗試將AlphaFold應(yīng)用于會破壞蛋白天然結(jié)構(gòu)的各類突變，包括與早期乳腺癌有關(guān)的一個突變，這些嘗試證實了AlphaFold還無法預(yù)測新的突變對蛋白質(zhì)的影響，因為沒有演化上相關(guān)的序列可以用來研究。

并且，AlphaFold無法很好地處理會在不同構(gòu)象中呈現(xiàn)不同結(jié)構(gòu)的蛋白。這些預(yù)測是針對單獨的結(jié)構(gòu)，而許多蛋白質(zhì)其實會與配體一起發(fā)揮功能，如DNA和RNA、脂肪分子、鐵等礦物質(zhì)。

目前，AlphaFold掀起的革命會走向何方依然無法預(yù)見，但每一天，AlphaFold都顯示出推動的巨大力量。EMBL-EBI的計算生物學(xué)家Janet Thornton認(rèn)為AlphaFold帶來的最大轉(zhuǎn)變之一，可能是讓生物學(xué)家更愿意接受計算機(jī)和理論的研究方法。換言之，真正的變革是人們思維方式的變化，這其實就是AI工具的最佳用法。AlphaFold所彰顯的意義，是科技的力量。

試想一下，在未來，如果把人工智能AlphaFold與生成式對抗網(wǎng)絡(luò)Insilico結(jié)合起來，再加上量子計算領(lǐng)域可預(yù)期的突破，我們就將真正走出制藥的迷霧，連同生物領(lǐng)域的百年來的困惑，而走向一條未來生物學(xué)的坦途。（本文首發(fā)鈦媒體APP）

鄭重聲明：本文內(nèi)容及圖片均整理自互聯(lián)網(wǎng)，不代表本站立場，版權(quán)歸原作者所有，如有侵權(quán)請聯(lián)系管理員(admin#wlmqw.com)刪除。

人工智能團(tuán)隊射線工具序列氨基酸研究人員結(jié)構(gòu)藥物蛋白蛋白質(zhì)

物業(yè)公司身上的互聯(lián)網(wǎng)基因

上一篇 2022年7月30日 15:17

美國會眾議院通過“芯片和科學(xué)法案”下一步將交由拜登簽字

下一篇 2022年7月30日 15:17

園屬于什么結(jié)構(gòu)(園的結(jié)構(gòu)和部首)
園 yuán：全包圍結(jié)構(gòu)，平穩(wěn)端正中稍帶左收右展。外部“口” 體態(tài)端莊，稍抗肩，稍帶左輕右重。左豎起筆稍抖，豎身勿重，稍左斜，垂露收筆；第二筆橫折壓著左豎起筆，橫畫稍抗肩，不要重…
2022年11月24日
0
《我在島嶼讀書》：文壇大家是最會講故事的人
當(dāng)余華、蘇童、西川這些文壇大家相聚在一起，會碰撞出怎樣的火花？外景紀(jì)實類讀書節(jié)目《我在島嶼讀書》給出了答案。上周節(jié)目首播之后，觀眾一邊從中汲取文學(xué)養(yǎng)分，一邊又驚嘆于作家們接地氣的…
2022年11月24日
0
微軟合并Azure Virtual Desktop和Windows365服務(wù)
微軟宣布合并 Azure Virtual Desktop 和 Windows 365 服務(wù)，合并之后交由 21 年老將斯科特?曼徹斯特（Scott Manchester）負(fù)責(zé)。我…
2022年11月23日
0
分享2大類微信引流軟件(不花錢的微信引流軟件都有哪些)
不花錢的微信引流軟件之前介紹了不少節(jié)省社群運營精力、提高社群運營效率的方法，今天主要給大家推薦一些簡單好用的工具。大家首先要掌握尋找工具的方法，因為工具可能因為平臺封禁等原因不能…
2022年11月22日
0
新冠口服藥上架疑云待解“烏龍”開售的阿茲夫定到底治什么？
新冠口服藥上架疑云待解“烏龍”開售的阿茲夫定到底治什么？新冠口服藥上架疑云待解來也匆匆、去也匆匆的新冠口服藥零售事件引發(fā)關(guān)注近1天后，等來了公司的公開回應(yīng)。 11月19日晚間，…
2022年11月21日
0
高德地圖無網(wǎng)絡(luò)可以導(dǎo)航嗎高德地圖怎么離線導(dǎo)航
高德地圖是現(xiàn)在大家比較常用的一個導(dǎo)航軟件，很多朋友在使用中都存在著一個疑惑，那就是在沒有網(wǎng)絡(luò)的時候該怎么導(dǎo)航呢？現(xiàn)在就讓小編帶大家來看一下吧。 1.首先打開進(jìn)入高德地圖頁面，然后點…
2022年11月21日
0
馬斯克凌晨一點半曬“代碼審查”現(xiàn)場，編排他的段子比瘋狂星期四還多
夢晨 Pine 發(fā)自凹非寺量子位 | 公眾號 QbitAI 每一個真正會寫代碼的人，請在下午2點到總部10層報到。每一個真正會寫代碼的人，請在下午2點到總部10層報到。馬斯…
2022年11月21日
0
提倡小規(guī)模旅游團(tuán)隊(嚴(yán)格控制旅游團(tuán)隊規(guī)模)
團(tuán)隊旅游應(yīng)控制組團(tuán)規(guī)模，提倡小規(guī)模旅游團(tuán)隊強化數(shù)據(jù)分析，科學(xué)安排團(tuán)隊旅游線路和出游時間，分時段分批次分區(qū)域開展旅游活動，避免游客聚集對于游客，指南明確應(yīng)加強行前排查，旅行社要做好游…
2022年11月19日
0
沒團(tuán)隊就做這幾種(一個人適合做哪一領(lǐng)域短視頻)
自媒體短視頻什么領(lǐng)域比較火呢？又有哪些領(lǐng)域收益高？現(xiàn)在自媒體短視頻越來越火了，很多新手想要入門，但是又不知道做什么領(lǐng)域。經(jīng)過小編多方面觀察和統(tǒng)計，發(fā)現(xiàn)了5個比較容易上熱門的視頻領(lǐng)域…
2022年11月19日
0
淘寶運營團(tuán)隊怎么找(網(wǎng)店運營與推廣)
很多商家認(rèn)為網(wǎng)店代運營就是將網(wǎng)店外包出去因此在找服務(wù)商的時候不知道從何下手，也不知道怎么配合代運營公司其實網(wǎng)店代運營除了有運營外包之外，還可以根據(jù)自己的實際情況進(jìn)行選擇其他合作…
2022年11月18日
0

聯(lián)系我們

聯(lián)系郵箱：admin#wlmqw.com
工作時間：周一至周五，10:30-18:30，節(jié)假日休息

<span id="qklgc"><var id="qklgc"></var></span>