人工智能+超算，創(chuàng)新計(jì)算框架在蛋白質(zhì)設(shè)計(jì)方面獲突破

2024-11-13 01:35:00 來(lái)源: 科技日?qǐng)?bào) 點(diǎn)擊數(shù)：

科技日?qǐng)?bào)記者張夢(mèng)然

在今年諾貝爾化學(xué)獎(jiǎng)表彰計(jì)算蛋白質(zhì)設(shè)計(jì)領(lǐng)域的重大進(jìn)展后，美國(guó)能源部阿貢國(guó)家實(shí)驗(yàn)室團(tuán)隊(duì)宣布開(kāi)發(fā)出一種名為MProt-DPO的創(chuàng)新計(jì)算框架，該框架利用人工智能（AI）和世界頂尖的超級(jí)計(jì)算機(jī)，推動(dòng)蛋白質(zhì)設(shè)計(jì)取得新突破。這一成就標(biāo)志著向AI自主科學(xué)發(fā)現(xiàn)邁出了重要一步。

MProt-DPO框架的關(guān)鍵在于其能將傳統(tǒng)的蛋白質(zhì)序列數(shù)據(jù)與實(shí)驗(yàn)結(jié)果、分子模擬及基于文本的敘述相結(jié)合。這一特性有望大幅加速蛋白質(zhì)發(fā)現(xiàn)，特別是在疫苗開(kāi)發(fā)和環(huán)保酶設(shè)計(jì)等領(lǐng)域。

蛋白質(zhì)設(shè)計(jì)的核心挑戰(zhàn)之一是從氨基酸序列預(yù)測(cè)蛋白質(zhì)的三維結(jié)構(gòu)及其功能。由于蛋白質(zhì)的氨基酸組成極其復(fù)雜，即使是微小變化也會(huì)導(dǎo)致成千上萬(wàn)種不同的可能性。因此，傳統(tǒng)實(shí)驗(yàn)方法難以高效完成。鑒于此，團(tuán)隊(duì)結(jié)合了大型語(yǔ)言模型（LLM）和超級(jí)計(jì)算機(jī)的強(qiáng)大算力。

團(tuán)隊(duì)利用了包括阿貢國(guó)家實(shí)驗(yàn)室的“極光”在內(nèi)的多個(gè)頂級(jí)超級(jí)計(jì)算機(jī)。這些超算不僅支持模型訓(xùn)練和微調(diào)，還能夠執(zhí)行大規(guī)模的分子模擬，驗(yàn)證所設(shè)計(jì)蛋白質(zhì)的穩(wěn)定性和催化活性。MProt-DPO框架已經(jīng)在多個(gè)平臺(tái)上實(shí)現(xiàn)了超過(guò)1 exaflop（百億億次浮點(diǎn)運(yùn)算）的持續(xù)計(jì)算，其中在“極光”上的峰值算力達(dá)到了5.57 exaflop。

MProt-DPO框架的算法使得AI模型可以從結(jié)果中學(xué)習(xí)，不斷改進(jìn)設(shè)計(jì)。這種方法類(lèi)似于人類(lèi)專(zhuān)家根據(jù)實(shí)驗(yàn)結(jié)果調(diào)整研究方向的過(guò)程，但速度更快，處理的數(shù)據(jù)量更大。

團(tuán)隊(duì)已在兩項(xiàng)蛋白質(zhì)設(shè)計(jì)任務(wù)上測(cè)試了MProt-DPO框架，分別是優(yōu)化酵母蛋白HIS7的突變性能和提高蘋(píng)果酸脫氫酶的催化效率。結(jié)果顯示，AI設(shè)計(jì)的蛋白質(zhì)表現(xiàn)良好，達(dá)到了預(yù)期效果。

團(tuán)隊(duì)稱(chēng)，新框架不僅能夠從海量“候選者”中篩出有潛力的蛋白質(zhì)，還能探索自然界中尚未存在的蛋白質(zhì)。這促進(jìn)了生物技術(shù)和醫(yī)藥領(lǐng)域的創(chuàng)新與發(fā)展，對(duì)于應(yīng)對(duì)全球健康和環(huán)境問(wèn)題具有重要意義。

責(zé)任編輯：常麗君

熱點(diǎn)