21個(gè)物種的“阿爾法折疊2”結(jié)構(gòu)模型中特征結(jié)構(gòu)元素的空間。圖片來(lái)源:《自然·結(jié)構(gòu)與分子生物學(xué)》
科技日?qǐng)?bào)實(shí)習(xí)記者 張佳欣
據(jù)最近發(fā)表在《自然·結(jié)構(gòu)與分子生物學(xué)》上的論文,包括西班牙何塞·卡雷拉斯白血病研究所癌癥免疫遺傳學(xué)小組負(fù)責(zé)人愛(ài)德華·波爾塔博士在內(nèi)的一個(gè)團(tuán)隊(duì),比較了現(xiàn)有可用的新結(jié)構(gòu)得出結(jié)論:“阿爾法折疊2”為任何給定物種貢獻(xiàn)了額外25%的高質(zhì)量蛋白質(zhì)結(jié)構(gòu)。
“阿爾法折疊2”是深度思維公司開(kāi)發(fā)的一種神經(jīng)網(wǎng)絡(luò),專門用于根據(jù)蛋白質(zhì)的氨基酸序列精確解析蛋白質(zhì)的3D結(jié)構(gòu)。
“阿爾法折疊2”數(shù)據(jù)庫(kù)已經(jīng)發(fā)布了21種模式生物的典型蛋白質(zhì)亞型的預(yù)測(cè),幾乎涵蓋了365198個(gè)蛋白質(zhì)中的每一個(gè)殘基。這大約是蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)(PDB)中實(shí)驗(yàn)結(jié)構(gòu)數(shù)量的兩倍,獨(dú)特蛋白質(zhì)數(shù)量的六倍。
許多蛋白質(zhì)在癌癥等疾病中發(fā)揮的關(guān)鍵作用已為人所知,但科學(xué)家缺乏對(duì)它們?cè)诜肿铀缴系墓δ艿纳钊肓私?。這些結(jié)構(gòu)信息將幫助科學(xué)家更好地了解這些蛋白質(zhì),了解它們可能在細(xì)胞內(nèi)與哪些其他分子相互作用,并設(shè)計(jì)能夠在它們改變時(shí)干擾其功能的新藥。
“阿爾法折疊2”的功能也有局限性。團(tuán)隊(duì)發(fā)現(xiàn),該算法在試圖重建蛋白質(zhì)復(fù)合體時(shí)存在問(wèn)題。大多數(shù)蛋白質(zhì)與其他蛋白質(zhì)一起完成生物功能,因此極其需要預(yù)測(cè)不同蛋白質(zhì)是如何粘在一起的。另一個(gè)局限性是它無(wú)法顯示突變蛋白質(zhì)的結(jié)構(gòu),突變通常會(huì)導(dǎo)致蛋白質(zhì)功能異常,是癌癥等許多疾病的原因。
盡管如此,團(tuán)隊(duì)認(rèn)識(shí)到“阿爾法折疊2”將在未來(lái)幾年極大地影響基礎(chǔ)和生物醫(yī)學(xué)研究。這不僅歸功于它的直接貢獻(xiàn),即數(shù)千個(gè)新的可靠的3D蛋白質(zhì)模型,而且還因?yàn)樗_(kāi)啟了一個(gè)基于人工智能的計(jì)算工具的新時(shí)代,能夠產(chǎn)生沒(méi)有人能預(yù)料的結(jié)果。
事實(shí)上,這個(gè)時(shí)代已經(jīng)開(kāi)始了。最近,“臉書”母公司Meta的一個(gè)團(tuán)隊(duì)使用了其自然語(yǔ)言預(yù)測(cè)器的修改版本來(lái)“自動(dòng)補(bǔ)全”蛋白質(zhì)。這款名為ESMFold的人工智能工具似乎沒(méi)有谷歌的同類工具那么準(zhǔn)確,但速度要快60倍,并可以克服一些已知的“阿爾法折疊2”的局限性,例如處理突變的序列。
正如論文作者所言,“‘阿爾法折疊2’和即將到來(lái)的工具的應(yīng)用將對(duì)生命科學(xué)產(chǎn)生革命性的影響”。