作為生物體的基本組成部分,蛋白質(zhì)廣泛存在于人們生產(chǎn)生活中。3月22日,上海交通大學特聘教授洪亮團隊發(fā)布了蛋白質(zhì)設計大模型Venus,其核心能力是讓蛋白質(zhì)實現(xiàn)功能的“定向進化”。該模型設計的多款產(chǎn)品已進入產(chǎn)業(yè)應用。
洪亮表示,自然界中參與構成蛋白質(zhì)的氨基酸有20種,一個蛋白質(zhì)分子一般由幾十個乃至數(shù)百個氨基酸組成,而蛋白質(zhì)的功能則包含熱穩(wěn)定性、活性、親和力等。
洪亮團隊發(fā)布蛋白質(zhì)設計大模型Venus(受訪者供圖)
據(jù)介紹,與以往靠經(jīng)驗和高通量實驗的傳統(tǒng)方法相比,大模型Venus能完成蛋白質(zhì)從序列到功能的預測,實現(xiàn)了從“大海撈針”到精準設計。如果想要強化目標蛋白質(zhì)的某個功能,只需要提供該蛋白質(zhì)的序列信息,Venus就可以快速給出一批蛋白質(zhì)序列改造方案,隨后結合實驗驗證得到最優(yōu)改造方案。
“數(shù)據(jù)是大模型的基礎,我們建立了包含數(shù)十億條蛋白質(zhì)序列的數(shù)據(jù)集,覆蓋從常規(guī)地表生物到極端環(huán)境微生物的蛋白質(zhì)序列信息,其中數(shù)億條蛋白質(zhì)序列具有功能標簽。”洪亮說。
洪亮表示,基于海量功能未知的蛋白質(zhì)數(shù)據(jù)集,精準發(fā)掘滿足苛刻應用需求的、具備超常規(guī)功能的蛋白質(zhì),是Venus的另一核心功能,有望開發(fā)這些蛋白質(zhì)在生物技術、醫(yī)藥研發(fā)和工業(yè)生產(chǎn)中的應用潛力。
“蛋白質(zhì)設計大模型的突破,不僅開辟了蛋白質(zhì)從序列到功能的科學研究新方向,還打通了人工智能與生物交叉的工程化應用之路?!鄙虾=煌ù髮W自然科學研究院院長金石說。
據(jù)介紹,Venus設計的多款蛋白質(zhì)已進入產(chǎn)業(yè)化階段,例如活性高、穩(wěn)定性強、產(chǎn)物純的PET降解酶,用于超敏檢測診斷的高活性堿性磷酸酶等。(記者董雪)