科技日?qǐng)?bào)記者 張夢(mèng)然
在今年諾貝爾化學(xué)獎(jiǎng)表彰計(jì)算蛋白質(zhì)設(shè)計(jì)領(lǐng)域的重大進(jìn)展后,美國(guó)能源部阿貢國(guó)家實(shí)驗(yàn)室團(tuán)隊(duì)宣布開(kāi)發(fā)出一種名為MProt-DPO的創(chuàng)新計(jì)算框架,該框架利用人工智能(AI)和世界頂尖的超級(jí)計(jì)算機(jī),推動(dòng)蛋白質(zhì)設(shè)計(jì)取得新突破。這一成就標(biāo)志著向AI自主科學(xué)發(fā)現(xiàn)邁出了重要一步。
MProt-DPO框架的關(guān)鍵在于其能將傳統(tǒng)的蛋白質(zhì)序列數(shù)據(jù)與實(shí)驗(yàn)結(jié)果、分子模擬及基于文本的敘述相結(jié)合。這一特性有望大幅加速蛋白質(zhì)發(fā)現(xiàn),特別是在疫苗開(kāi)發(fā)和環(huán)保酶設(shè)計(jì)等領(lǐng)域。
蛋白質(zhì)設(shè)計(jì)的核心挑戰(zhàn)之一是從氨基酸序列預(yù)測(cè)蛋白質(zhì)的三維結(jié)構(gòu)及其功能。由于蛋白質(zhì)的氨基酸組成極其復(fù)雜,即使是微小變化也會(huì)導(dǎo)致成千上萬(wàn)種不同的可能性。因此,傳統(tǒng)實(shí)驗(yàn)方法難以高效完成。鑒于此,團(tuán)隊(duì)結(jié)合了大型語(yǔ)言模型(LLM)和超級(jí)計(jì)算機(jī)的強(qiáng)大算力。
團(tuán)隊(duì)利用了包括阿貢國(guó)家實(shí)驗(yàn)室的“極光”在內(nèi)的多個(gè)頂級(jí)超級(jí)計(jì)算機(jī)。這些超算不僅支持模型訓(xùn)練和微調(diào),還能夠執(zhí)行大規(guī)模的分子模擬,驗(yàn)證所設(shè)計(jì)蛋白質(zhì)的穩(wěn)定性和催化活性。MProt-DPO框架已經(jīng)在多個(gè)平臺(tái)上實(shí)現(xiàn)了超過(guò)1 exaflop(百億億次浮點(diǎn)運(yùn)算)的持續(xù)計(jì)算,其中在“極光”上的峰值算力達(dá)到了5.57 exaflop。
MProt-DPO框架的算法使得AI模型可以從結(jié)果中學(xué)習(xí),不斷改進(jìn)設(shè)計(jì)。這種方法類(lèi)似于人類(lèi)專(zhuān)家根據(jù)實(shí)驗(yàn)結(jié)果調(diào)整研究方向的過(guò)程,但速度更快,處理的數(shù)據(jù)量更大。
團(tuán)隊(duì)已在兩項(xiàng)蛋白質(zhì)設(shè)計(jì)任務(wù)上測(cè)試了MProt-DPO框架,分別是優(yōu)化酵母蛋白HIS7的突變性能和提高蘋(píng)果酸脫氫酶的催化效率。結(jié)果顯示,AI設(shè)計(jì)的蛋白質(zhì)表現(xiàn)良好,達(dá)到了預(yù)期效果。
團(tuán)隊(duì)稱(chēng),新框架不僅能夠從海量“候選者”中篩出有潛力的蛋白質(zhì),還能探索自然界中尚未存在的蛋白質(zhì)。這促進(jìn)了生物技術(shù)和醫(yī)藥領(lǐng)域的創(chuàng)新與發(fā)展,對(duì)于應(yīng)對(duì)全球健康和環(huán)境問(wèn)題具有重要意義。