一年前,人工智能(AI)公司DeepMind等依靠其推出的AI系統(tǒng)AlphaFold預(yù)測并公布了約35萬種蛋白質(zhì)的結(jié)構(gòu)。這讓許多科學(xué)家大吃一驚,該進展入選《科學(xué)》2021年度十大科學(xué)突破。
一年后,AlphaFold完成又一次飛躍。據(jù)《科學(xué)》報道,7月28日,DeepMind公布了從細菌到人類的幾乎所有已知(2億多個)蛋白質(zhì)的可能結(jié)構(gòu),并將其納入相關(guān)數(shù)據(jù)庫,研究人員可免費搜索蛋白質(zhì)結(jié)構(gòu)。
【資料圖】
這是人工智能領(lǐng)域的一個驚人成就,也是藥物開發(fā)和迭代研究的潛在寶庫。
“我們發(fā)布了整個蛋白質(zhì)宇宙的結(jié)構(gòu)。”DeepMind聯(lián)合創(chuàng)始人、首席執(zhí)行官Demis Hassabis在新聞發(fā)布會上說。
AlphaFold功能強大,它解決了從蛋白質(zhì)氨基酸序列中準確推導(dǎo)蛋白質(zhì)三維結(jié)構(gòu)的長期挑戰(zhàn)——蛋白質(zhì)折疊問題。大多數(shù)藥物都是利用蛋白質(zhì)結(jié)構(gòu)信息設(shè)計的,準確描繪結(jié)構(gòu)圖譜往往是發(fā)現(xiàn)蛋白質(zhì)如何工作的第一步。
通過與歐洲生物信息學(xué)研究所(EMBL-EBI)合作,AlphaFold數(shù)據(jù)庫也于一年前啟動,其中納入的35萬個蛋白質(zhì)預(yù)測結(jié)構(gòu)涵蓋了人類、小鼠和其他19種被廣泛研究的生物體產(chǎn)生的幾乎每種蛋白質(zhì)。
AlphaFold新預(yù)測的蛋白質(zhì)結(jié)構(gòu)也已發(fā)布到現(xiàn)有數(shù)據(jù)庫中。Hassabis說,該數(shù)據(jù)庫“為結(jié)構(gòu)生物學(xué)家提供了強大的新工具,在這里,可以像在谷歌通過關(guān)鍵詞搜索信息一樣輕松地查找蛋白質(zhì)三維結(jié)構(gòu)”。
據(jù)EMBL-EBI估計,在現(xiàn)有的超2.14億個預(yù)測的蛋白質(zhì)結(jié)構(gòu)中,大約35%是高度準確的,這意味著它們與實驗確定的結(jié)構(gòu)質(zhì)量一樣高;有45%的結(jié)構(gòu)足以在許多應(yīng)用程序中使用。
DeepMind表示,自去年發(fā)布部分蛋白質(zhì)結(jié)構(gòu)以來,已有超過50萬名研究人員使用了該數(shù)據(jù)庫。
Hassabis預(yù)見了一個“數(shù)字生物學(xué)新時代”,在這個時代里,藥物開發(fā)人員可以從利用AI預(yù)測醫(yī)學(xué)上很重要的蛋白質(zhì)結(jié)構(gòu),轉(zhuǎn)向使用AI設(shè)計影響這些蛋白質(zhì)的小分子,從而治療疾病。
其他人正在通過結(jié)構(gòu)預(yù)測開發(fā)候選疫苗,探索如核孔復(fù)合體如何把分子送入細胞核或者生命最初進化時蛋白質(zhì)如何進化等基本生物學(xué)問題。
在Hassabis看來,公布蛋白質(zhì)結(jié)構(gòu)只是一個起點,還有許多生物學(xué)和化學(xué)方面的工作有待探索。
標簽: