在线不卡日本ⅴ一区v二区_精品一区二区中文字幕_天堂v在线视频_亚洲五月天婷婷中文网站

  • <menu id="lky3g"></menu>
  • <style id="lky3g"></style>
    <pre id="lky3g"><tt id="lky3g"></tt></pre>

    從AlphaGo到AlphaFold,什么是AI工具的最佳用法?

    從AlphaGo到AlphaFold,什么是AI工具的最佳用法?

    圖片來源@視覺中國

    文 | 觀察未來科技

    兩年前,2020年12月,Science雜志評選了該年度十個重大科學突破,除了在特殊大背景下的mRNA疫苗,還有一項就是蛋白質結構預測的人工智能——AlphaFold。AlphaFold是由谷歌公司深度學習方面的核心團隊DeepMind所開發(fā),該團隊一直致力于用人工智能和神經網絡技術解決不同場景下的學習問題——大名鼎鼎的AlphaGo就出自DeepMind麾下。

    在圍棋博弈算法AlphaGo大獲成功后,DeepMind又轉向了基于氨基酸序列蛋白質結構預測,提出了名為AlphaFold的深度學習算法,并在國際蛋白質結構預測比賽CASP13中取得了優(yōu)異的成績。AlphaFold的橫空問世在幾年的時間里徹底改變了生物學,不過,目前,科學家們似乎仍在尋找AlphaFold這類人工智能工具的最佳用法。

    撥開制藥迷霧

    制藥業(yè)是危險與迷人并存的行業(yè)。傳統上,如果某家制藥公司想要開發(fā)一種新藥,只能為了找到潛在的候選藥物而去搜索龐大的醫(yī)學資料庫。但顯然,這種方法存在巨大的不確定性,需要科學家們付出多年的努力,而且即使找到了候選藥物也只是一個起點。一旦確定了候選藥物,接下來,科學家們就要對它們進行分析、合成,整個過程可能又需要好幾年。

    最后,研究人員還要對發(fā)現的藥物進行臨床試驗,一開始是在動物身上進行,然后是在一小群人身上,最后是在一大群人身上。簡而言之,藥品的開發(fā)是一場耗時又耗錢的漫長“戰(zhàn)爭”。除此之外,這場戰(zhàn)爭中的“陣亡者”數量也很大——根據《自然》數據,一款新藥的研發(fā)成本大約是26億美元,耗時約10年,而成功率則不到十分之一。

    盡管面臨重重阻礙,但計算機科學家出身的生物物理學家亞歷克斯·扎沃龍科夫(Alex Zhavoronkov)卻創(chuàng)造性地提出了一條可能的捷徑。2012年前后,扎沃龍科夫開始注意到,人工智能在圖像、語音和文本識別方面變得越來越擅長了。在他看來,這三個任務都有一個關鍵的共同點,那就是在每一種情況下都需要龐大的數據庫,從而用于訓練人工智能。

    類似的數據庫也出現在了藥理學中。因此,在2014年,扎沃龍科夫開始考慮是否可以利用這些數據庫和人工智能技術來加快藥物開發(fā)的過程。

    為了把這些想法變成現實,扎沃龍科夫在馬里蘭州巴爾的摩市的約翰霍普金斯大學一個名為Insilico Medicine的機構,開始了研究。Insilico Medicine的“藥物發(fā)現引擎”的起點就是對數百萬的數據樣本進行篩選,以確定特定疾病的生物學特征,然后再利用這個引擎確定最有希望的治療靶點,并運用生成性對抗網絡去生成完全適合這些靶點的分子。

    3年后,扎沃龍科夫獲得了成功,扎沃龍科夫開發(fā)出的系統,發(fā)現了潛在藥物靶點的爆炸性增長和一個更有效的測試過程,讓一場以往持續(xù)時間長達10年或“持久戰(zhàn)”變成了一個月內就可以結束的“小沖突”。在2018年年底,Insilico Medicine在不到46天的時間里就得到了一系列新分子,而且他們的成果不僅包括最初的發(fā)現,還包括藥物的合成和計算機模擬的驗證實驗。

    新藥發(fā)明的過程還包括了一個關鍵的步驟,即識別新藥靶點,也就是藥物在體內的結合位置,這是藥物研發(fā)過程的另一個關鍵部分。

    實際上,從1980年到2006年,盡管每年的投資高達300多億美元,但是平均而言研究人員每年仍然只能找到5種新藥。其中關鍵的問題就在于復雜性。大多數潛在藥物的靶點都是蛋白質,而蛋白質的結構,即2D氨基酸序列折疊成3D蛋白質的方式決定了它的功能。

    一個只有100個氨基酸的蛋白質,已經是一個非常小的蛋白質了,但就是這么小的蛋白質,可以產生的可能形狀的種類依然是一個天文數字,大約是一個1后面跟著300個0。這也正是蛋白質折疊一直被認為是一個即使大型超級計算機也無法解決的難題的原因。

    從1994年開始,為了監(jiān)測這種超越超級計算機能力的蛋白質折疊過程,科學界每年都會舉辦一次蛋白質結構預測關鍵評估(CASP)大賽。直到2018年幾乎沒有人取得過成功。但是,DeepMind的開發(fā)者們利用神經網絡化解了這個難題。他們開發(fā)出了一種人工智能,可以通過挖掘大量的數據集來確定蛋白質堿基對與它們的化學鍵的角之間的可能距離——這是蛋白質折疊的基礎。他們把這個人工智能命名為AlphaFold。

    典型的量變,巨大的質變

    2018年,AlphaFold首次參加了CASP大賽,并摘得頭魁。在2018年的比賽中,AlphaFold需要與其他參賽的人工智能比賽,解決43個蛋白質折疊的問題。最終,AlphaFold答對了25個,而獲得第二名的人工智能只勉強答對了3個。AlphaFold的誕生,成為了蛋白質結構解析領域里程碑,也徹底改變了成千上萬生物學家的研究。

    2020年,DeepMind發(fā)布了AlphaFold軟件的第二個版本。相較于第二個版本,2018年的更早版本并不夠好,不能取代使用實驗方法解析的結構,而AlphaFold2的預測結果平均而言已與實驗結果相差無幾。當時,AlphaFold2再一次在CASP大賽上一舉奪魁。CASP大賽每兩年舉辦一次,呈現了生物學界在一項艱巨挑戰(zhàn)上的最新進展。

    2020年的這項挑戰(zhàn)是如何僅憑蛋白質的氨基酸序列確定其3D結構。計算機軟件給出的結構會拿來與經過X射線晶體學或冷凍電鏡(cryo-EM)這類實驗方法確認的結果進行對比。X射線晶體學和冷凍電鏡分別通過X射線和電子束照射蛋白質的方式來對蛋白質的結構進行成像。

    AlphaFold的預測用被稱為“427組”,多個預測達到了驚人的準確性,讓它們脫穎而出。當然,AlphaFold的預測水平有高有低,但將近三分之二的預測結果都與實驗結果在質量上不相上下。AlphaFold的預測甚至幫助確定了Lupas實驗室多年來一直想要破解的一種細菌蛋白的結構。

    一年后,2021年7月15日,AlphaFold2的論文發(fā)表,同時公開的還有免費的開源代碼等信息,讓業(yè)內的研究人員們可以打造屬于自己的版本。一周后,DeepMind宣布已經用AlphaFold預測了人體內近乎所有蛋白質的結構,以及20個其他被大量研究的生物體的完整“蛋白質組”,其中包括小鼠和大腸桿菌,累計共有36.5萬個結構。

    DeepMind還將這些信息上傳到了由EMBL歐洲生物信息學研究所(EMBL–EBI)維護的數據庫。在那之后,這個數據庫已經收錄了近100萬個結構。根據DeepMind的統計,目前已有超40萬人使用過EMBL-EBI的AlphaFold數據庫。此外,還有一些AlphaFold的“超級用戶”:這些研究人員在自己服務器上安裝了AlphaFold,或是打造了AlphaFold的云版本,用來預測不在EMBL-EBI數據庫中的結構,或是探索AlphaFold的新用途。

    今年,DeepMind還計劃發(fā)布總計1億多個結構預測——相當于所有已知蛋白的近一半,是蛋白質數據銀行(PDB)結構數據庫中經過實驗解析的蛋白數量的幾百倍之多。

    要知道,過去半個多世紀,人類一共解析了五萬多個人源蛋白質的結構,人類蛋白質組里大約17%的氨基酸已有結構信息;而AlphaFold的預測結構將這一數字從17%大幅提高到58%;因為無固定結構的氨基酸比例很大,58%的結構預測幾乎已經接近極限。這是一個典型的量變引起巨大的質變,而這一量變是在短短一年之內發(fā)生的。

    AlphaFold的最佳用法

    除了在制藥領域發(fā)揮作用,AlphaFold還被應用到了更多領域。

    一方面,AlphaFold的結構解析能力極大解放了生物學家們的研究:有研究團隊還在搜索另一個包含從海洋和廢水中提取的DNA序列的數據庫,試圖發(fā)現新的食塑酶。通過讓AlphaFold快速預測數千個蛋白的結構,該團隊希望能更好地理解酶是如何通過演化擁有分解塑料的能力,并能進一步優(yōu)化它們。

    哈佛大學演化生物學家Sergey Ovchinnikov認為,這種將任何蛋白編碼基因序列轉化為可靠結構的能力,對于演化研究來說非常有用。研究人員通過比較基因序列來確定不同物種的生物體與它們基因之間的親緣關系。而對于親緣關系較遠的基因來說,這種比較可能無法發(fā)現演化近親,因為這些序列已經變了很多。但通過比較變化速度比基因序列更慢的蛋白質結構,研究人員或許能揭示之前沒注意到的古代關系。

    另一方面,AlphaFold還是個絕佳的實驗工具,AlphaFold能提供一個初步預測,之后再由實驗驗證或優(yōu)化。比如,來自X射線晶體學的原始數據以衍射X射線的圖樣呈現。一般來說,科學家需要對蛋白質結構有個初步猜測,才能解釋這些圖樣。而AlphaFold的預測讓大部分X射線圖樣不再需要這些方法。

    另外,AlphaFold不僅改變了科學家測定蛋白質結構的方式。一些研究人員還在利用這些工具打造全新的蛋白質。華盛頓大學生物化學家、蛋白質設計和結構預測領域帶頭人David Baker表示,深度學習徹底改變了他們團隊設計蛋白質的方式。Baker的團隊讓AlphaFold和另一個AI工具RoseTTAFold來設計新的蛋白。他們改寫了人工智能的代碼,讓軟件在得到隨機氨基酸序列的情況下,對它們進行優(yōu)化,直到合成出能被這些神經網絡識別為蛋白的東西。

    2021年12月,Baker的研究團隊報告了他們在細菌中表達了129種這些幻想蛋白,發(fā)現其中約1/5的蛋白會折疊成類似他們預測的結構。而這是這種網絡能用來設計蛋白質的首個證明。

    基于此,今年7月21日,來自華盛頓大學等機構的科學家們在Science雜志上發(fā)布了一款新的AI軟件,該軟件能夠為自然界中尚不存在的蛋白質繪制結構。更重要的是,科學家們已經利用這一軟件創(chuàng)造出潛在用于工業(yè)反應、癌癥治療、甚至用于預防呼吸道合胞病毒(RSV)感染的候選疫苗的原始化合物。

    雖然AlphaFold的出現推動了巨大進展,但科學家認為有必要說明它的局限性:一些研究人員嘗試將AlphaFold應用于會破壞蛋白天然結構的各類突變,包括與早期乳腺癌有關的一個突變,這些嘗試證實了AlphaFold還無法預測新的突變對蛋白質的影響,因為沒有演化上相關的序列可以用來研究。

    并且,AlphaFold無法很好地處理會在不同構象中呈現不同結構的蛋白。這些預測是針對單獨的結構,而許多蛋白質其實會與配體一起發(fā)揮功能,如DNA和RNA、脂肪分子、鐵等礦物質。

    目前,AlphaFold掀起的革命會走向何方依然無法預見,但每一天,AlphaFold都顯示出推動的巨大力量。EMBL-EBI的計算生物學家Janet Thornton認為AlphaFold帶來的最大轉變之一,可能是讓生物學家更愿意接受計算機和理論的研究方法。換言之,真正的變革是人們思維方式的變化,這其實就是AI工具的最佳用法。AlphaFold所彰顯的意義,是科技的力量。

    試想一下,在未來,如果把人工智能AlphaFold與生成式對抗網絡Insilico結合起來,再加上量子計算領域可預期的突破,我們就將真正走出制藥的迷霧,連同生物領域的百年來的困惑,而走向一條未來生物學的坦途。(本文首發(fā)鈦媒體APP)

    鄭重聲明:本文內容及圖片均整理自互聯網,不代表本站立場,版權歸原作者所有,如有侵權請聯系管理員(admin#wlmqw.com)刪除。
    用戶投稿
    上一篇 2022年7月30日 15:17
    下一篇 2022年7月30日 15:17

    相關推薦

    • 園屬于什么結構(園的結構和部首)

      園 yuán:全包圍結構,平穩(wěn)端正中稍帶左收右展。 外部“口” 體態(tài)端莊,稍抗肩,稍帶左輕右重。左豎起筆稍抖,豎身勿重,稍左斜,垂露收筆;第二筆橫折壓著左豎起筆,橫畫稍抗肩,不要重…

      2022年11月24日
    • 《我在島嶼讀書》:文壇大家是最會講故事的人

      當余華、蘇童、西川這些文壇大家相聚在一起,會碰撞出怎樣的火花?外景紀實類讀書節(jié)目《我在島嶼讀書》給出了答案。 上周節(jié)目首播之后,觀眾一邊從中汲取文學養(yǎng)分,一邊又驚嘆于作家們接地氣的…

      2022年11月24日
    • 微軟合并Azure Virtual Desktop和Windows365服務

      微軟宣布合并 Azure Virtual Desktop 和 Windows 365 服務,合并之后交由 21 年老將斯科特?曼徹斯特(Scott Manchester)負責。 我…

      2022年11月23日
    • 分享2大類微信引流軟件(不花錢的微信引流軟件都有哪些)

      不花錢的微信引流軟件之前介紹了不少節(jié)省社群運營精力、提高社群運營效率的方法,今天主要給大家推薦一些簡單好用的工具。 大家首先要掌握尋找工具的方法,因為工具可能因為平臺封禁等原因不能…

      2022年11月22日
    • 新冠口服藥上架疑云待解“烏龍”開售的阿茲夫定到底治什么?

      新冠口服藥上架疑云待解“烏龍”開售的阿茲夫定到底治什么? 新冠口服藥上架疑云待解 來也匆匆、去也匆匆的新冠口服藥零售事件引發(fā)關注近1天后,等來了公司的公開回應。 11月19日晚間,…

      2022年11月21日
    • 高德地圖無網絡可以導航嗎 高德地圖怎么離線導航

      高德地圖是現在大家比較常用的一個導航軟件,很多朋友在使用中都存在著一個疑惑,那就是在沒有網絡的時候該怎么導航呢?現在就讓小編帶大家來看一下吧。 1.首先打開進入高德地圖頁面,然后點…

      2022年11月21日
    • 馬斯克凌晨一點半曬“代碼審查”現場,編排他的段子比瘋狂星期四還多

      夢晨 Pine 發(fā)自 凹非寺 量子位 | 公眾號 QbitAI 每一個真正會寫代碼的人,請在下午2點到總部10層報到。 每一個真正會寫代碼的人,請在下午2點到總部10層報到。 馬斯…

      2022年11月21日
    • 提倡小規(guī)模旅游團隊(嚴格控制旅游團隊規(guī)模)

      團隊旅游應控制組團規(guī)模,提倡小規(guī)模旅游團隊強化數據分析,科學安排團隊旅游線路和出游時間,分時段分批次分區(qū)域開展旅游活動,避免游客聚集對于游客,指南明確應加強行前排查,旅行社要做好游…

      2022年11月19日
    • 沒團隊就做這幾種(一個人適合做哪一領域短視頻)

      自媒體短視頻什么領域比較火呢?又有哪些領域收益高?現在自媒體短視頻越來越火了,很多新手想要入門,但是又不知道做什么領域。經過小編多方面觀察和統計,發(fā)現了5個比較容易上熱門的視頻領域…

      2022年11月19日
    • 淘寶運營團隊怎么找(網店運營與推廣)

      很多商家認為網店代運營就是將網店外包出去 因此在找服務商的時候不知道從何下手,也不知道怎么配合代運營公司 其實網店代運營除了有運營外包之外,還可以根據自己的實際情況進行選擇其他合作…

      2022年11月18日

    聯系我們

    聯系郵箱:admin#wlmqw.com
    工作時間:周一至周五,10:30-18:30,節(jié)假日休息