首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|低空經(jīng)濟|智能汽車|特約記者
手機|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計算|芯片|報告|智慧城市|移動互聯(lián)網(wǎng)|會展
首頁 >> 移動互聯(lián)網(wǎng) >> 正文

我國“生物醫(yī)藥+AI”如何借鑒DeepSeek模式,實現(xiàn)從模仿到超越?

2025年4月17日 17:32  CCTIME飛象網(wǎng)  

在全球AI競技場上,美國憑借先發(fā)優(yōu)勢,在AI行業(yè)長期占據(jù)領(lǐng)先地位。然而,近期DeepSeek推出的低成本且高性能的開源模型R1,在通用AGI領(lǐng)域挑戰(zhàn)了現(xiàn)有技術(shù)范式。面對這一創(chuàng)新,Meta迅速展開研究,OpenAI等AI巨頭也被迫加快迭代步伐以跟進。DeepSeek的突破不僅顯示了美國在AI領(lǐng)域的長期主導(dǎo)地位并非不可撼動,也改變了全球?qū)χ袊髽I(yè)的刻板印象——中國企業(yè)正從技術(shù)的模仿者,躍升為前沿創(chuàng)新的引領(lǐng)者。

要實現(xiàn)在全球AI競賽中的領(lǐng)先地位,必須注重通用AGI與垂直AI的協(xié)同發(fā)展。作為AI的基石,通用AGI具備強大的認知和適應(yīng)能力,能夠處理廣泛的復(fù)雜任務(wù),是實現(xiàn)智能社會的核心支撐;而垂直AI則專注于與特定行業(yè)的深度融合,依托豐富的領(lǐng)域數(shù)據(jù)和專業(yè)知識,強調(diào)應(yīng)用落地,具有更強的短期商業(yè)化潛力,是各行各業(yè)獲得增量的關(guān)鍵動力。

以AI制藥為例,中國科學(xué)院院士陳凱先在公開場合表示,AI為制藥行業(yè)帶來的潛在價值可達1.2萬億美元。他指出,國外研究顯示,人工智能技術(shù)的應(yīng)用可以將藥物設(shè)計時間縮短70%,并將藥物設(shè)計成功率提升10倍。

從全球市場格局來看,美國在AI制藥領(lǐng)域處于領(lǐng)先地位。據(jù)貝哲斯咨詢報告,2024年,美國在全球 AI制藥市場的占比高達54.4%,而英國和歐盟各占約12%。與之相比,以中國為主的亞太地區(qū),仍處于起步階段。

顯然,我國醫(yī)藥行業(yè)尚未迎來屬于自己的“DeepSeek”時刻,關(guān)鍵原因之一在于尚未實現(xiàn)底層技術(shù)的突破。例如,DeepMind的AlphaFold就屬于“卡脖子”的核心技術(shù)。

蛋白質(zhì)結(jié)構(gòu)預(yù)測工具AlphaFold是AI在生命科學(xué)應(yīng)用領(lǐng)域的標(biāo)桿,極大推動了全球生物醫(yī)學(xué)研究的進展。通過深度學(xué)習(xí)算法,AlphaFold能夠根據(jù)蛋白質(zhì)的氨基酸序列預(yù)測其三維結(jié)構(gòu),解決了長期困擾生物學(xué)家的難題,并為藥物研發(fā)提供了重要基礎(chǔ)。它使研究人員能更準確地理解藥物靶點的結(jié)構(gòu),從而設(shè)計出更有效的藥物分子。

目前,AlphaFold3已開源,可用于非商業(yè)用途的研究。對此,復(fù)旦大學(xué)復(fù)雜體系多尺度研究院院長馬劍鵬曾評論說,“有些人說AlphaFold開源了,我們國家不用搞了,這是大錯特錯。首先,他們所謂的開源只是表層結(jié)構(gòu)開源了,底層技術(shù)沒有開源。第二,你把它拿來你只能做他們的東西,你沒有辦法提高,就像航空發(fā)動機你買來可以,你能往前在進一步嗎?不可能。”

當(dāng)前,我國仍處于探索和模仿AlphaFold的階段,在構(gòu)建蛋白質(zhì)靜態(tài)結(jié)構(gòu)數(shù)據(jù)庫方面,部分研究方法借鑒了AlphaFold的思路,并幾乎完全聚焦于研發(fā)更優(yōu)的算法以實現(xiàn)超越。盡管投入了大量科學(xué)研究資源,實際效果并不理想。

那么,如何復(fù)刻DeepSeek模式,實現(xiàn)“從模仿到超越”呢?

回顧DeepSeek的技術(shù)路徑,他們沒有簡單地追隨傳統(tǒng)大模型的技術(shù)路線,而是通過一系列創(chuàng)新設(shè)計,實現(xiàn)了顯著的性能提升和成本優(yōu)化。例如,DeepSeek的R1采用了混合專家架構(gòu)(MoE),取代了傳統(tǒng)Transformer架構(gòu)中的前饋網(wǎng)絡(luò)(FFN)層。這一架構(gòu)設(shè)計不僅保持了模型的高性能,還顯著降低了計算量和顯存占用。

再從客觀角度分析AlphaFold的優(yōu)劣勢。盡管AlphaFold在蛋白質(zhì)靜態(tài)結(jié)構(gòu)預(yù)測方面表現(xiàn)出色,但也存在一些先天的局限性。其訓(xùn)練數(shù)據(jù)主要來源于實驗數(shù)據(jù),擅長靜態(tài)蛋白質(zhì)結(jié)構(gòu)的預(yù)測,但在蛋白質(zhì)動態(tài)構(gòu)象變化建模上存在明顯短板,難以精準模擬蛋白質(zhì)折疊路徑、構(gòu)象轉(zhuǎn)換以及相互作用機制,尤其是在靶蛋白與分子對接時,AlphaFold的預(yù)測結(jié)果可能存在較大偏差。此外,AlphaFold的訓(xùn)練數(shù)據(jù)高度依賴靜態(tài)蛋白質(zhì)結(jié)構(gòu)庫,而這些數(shù)據(jù)的增長速度較慢,現(xiàn)有的氨基酸序列和蛋白質(zhì)三維結(jié)構(gòu)數(shù)據(jù)量有限,且許多數(shù)據(jù)已經(jīng)得到充分利用,無法為新的預(yù)測任務(wù)提供更多支持。

因此,借鑒DeepSeek的成功經(jīng)驗,同時規(guī)避AlphaFold的局限,我們可以制定以下三步策略,以實現(xiàn)從“模仿”到“超越”的突破:

技術(shù)路徑:選擇構(gòu)建蛋白質(zhì)動態(tài)結(jié)構(gòu)數(shù)據(jù)庫

蛋白質(zhì)在生物體內(nèi)并非靜態(tài)存在,其功能和行為與動態(tài)變化密切相關(guān)。許多生物過程依賴于蛋白質(zhì)的動態(tài)變化,而這些變化對于藥物設(shè)計和分子對接至關(guān)重要。因此,我們可以跳出由AlphaFold主導(dǎo)的靜態(tài)結(jié)構(gòu)預(yù)測框架,轉(zhuǎn)而探索動態(tài)結(jié)構(gòu)預(yù)測,以推動技術(shù)的跨越式進展。

構(gòu)建動態(tài)蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫是實現(xiàn)技術(shù)跨越的核心步驟。傳統(tǒng)的蛋白質(zhì)靜態(tài)結(jié)構(gòu)數(shù)據(jù)庫僅包含蛋白質(zhì)在特定條件下的單一結(jié)構(gòu),而動態(tài)結(jié)構(gòu)數(shù)據(jù)庫則能夠記錄蛋白質(zhì)在不同狀態(tài)下的構(gòu)象變化、能量狀態(tài)及其與其他分子的相互作用。這種轉(zhuǎn)變不僅能更全面地反映蛋白質(zhì)的生物學(xué)功能,還能為藥物發(fā)現(xiàn)和分子設(shè)計提供更有價值的數(shù)據(jù)支持。

分子動力學(xué)模擬是構(gòu)建此類動態(tài)數(shù)據(jù)庫的關(guān)鍵工具。通過模擬原子間的相互作用力,分子動力學(xué)模擬能夠在納秒到微秒的時間尺度上追蹤蛋白質(zhì)的運動軌跡,從而捕捉其構(gòu)象變化。為了確保模擬結(jié)果的準確性,還需結(jié)合實驗技術(shù)(如核磁共振、冷凍電子顯微鏡)進行驗證。例如,核磁共振可以提供溶液中蛋白質(zhì)的結(jié)構(gòu)信息,而冷凍電子顯微鏡則適用于觀察較大蛋白質(zhì)復(fù)合物的結(jié)構(gòu)細節(jié)。

例如,復(fù)旦大學(xué)研究團隊創(chuàng)建的Dynamic PDB數(shù)據(jù)集,通過模擬捕捉了約12,600個蛋白質(zhì)的構(gòu)象變化,并提供了包括原子速度、力、勢能和動能等物理屬性的全面信息,為研究提供了寶貴的數(shù)據(jù)支持。該數(shù)據(jù)集提供了精細的時間采樣間隔(1皮秒),能夠捕捉更詳細的蛋白質(zhì)動態(tài)路徑,有助于研究者更全面地理解蛋白質(zhì)的重要構(gòu)象變化。

數(shù)據(jù)積累:打造規(guī);、高質(zhì)量的蛋白質(zhì)動態(tài)結(jié)構(gòu)數(shù)據(jù)庫

AlphaFold之所以能在蛋白質(zhì)靜態(tài)結(jié)構(gòu)預(yù)測領(lǐng)域取得顯著進展,主要得益于超過20萬套蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)和上億條蛋白質(zhì)序列的支持。這些豐富的數(shù)據(jù)資源為人工智能模型的訓(xùn)練和優(yōu)化奠定了堅實的基礎(chǔ)。然而,如果我們的動態(tài)結(jié)構(gòu)數(shù)據(jù)庫在規(guī)模和多樣性上有所欠缺,則難以全面捕捉蛋白質(zhì)復(fù)雜的動態(tài)變化。因此,構(gòu)建一個規(guī)模至少與AlphaFold相當(dāng),甚至更大的蛋白質(zhì)動態(tài)結(jié)構(gòu)數(shù)據(jù)庫是實現(xiàn)進一步突破的關(guān)鍵。

構(gòu)建大規(guī)模、高質(zhì)量、多維度的動態(tài)結(jié)構(gòu)數(shù)據(jù)庫的核心在于實現(xiàn)動態(tài)數(shù)據(jù)的多維度采集和持續(xù)積累。分子動力學(xué)模擬可以提供關(guān)于蛋白質(zhì)動態(tài)行為的原子級別信息,是理解蛋白質(zhì)動態(tài)的重要工具。同時,為了更全面地捕捉蛋白質(zhì)在其復(fù)雜生物環(huán)境中的動態(tài)變化,我們需要整合多種互補的實驗方法。其中,高通量蛋白質(zhì)組學(xué)技術(shù),例如數(shù)據(jù)非依賴型采集(DIA)質(zhì)譜分析,能夠快速且準確地鑒定并定量細胞和組織中的數(shù)千種蛋白質(zhì),為構(gòu)建大規(guī)模動態(tài)結(jié)構(gòu)數(shù)據(jù)庫提供海量且高質(zhì)量的實驗數(shù)據(jù),并逐步實現(xiàn)深度覆蓋。 此外,通過構(gòu)建和分析動態(tài)蛋白質(zhì)網(wǎng)絡(luò),可以深入探索蛋白質(zhì)在不同生物過程中的調(diào)控機制。這些網(wǎng)絡(luò)揭示了蛋白質(zhì)間相互作用的時間和空間動態(tài)變化,為進一步研究提供了重要線索。

同時,確保數(shù)據(jù)質(zhì)量至關(guān)重要,這需要嚴格進行實驗驗證、數(shù)據(jù)標(biāo)準化和整合,以保證數(shù)據(jù)的準確性、一致性和可用性。只有這樣,才能為AI模型的訓(xùn)練和優(yōu)化提供更全面、更可靠的數(shù)據(jù)基礎(chǔ),從而推動蛋白質(zhì)結(jié)構(gòu)預(yù)測領(lǐng)域的創(chuàng)新和發(fā)展。

研發(fā)范式:“計算+實驗”,加速AI在蛋白質(zhì)結(jié)構(gòu)預(yù)測中的應(yīng)用

在完成動態(tài)數(shù)據(jù)積累后,為了更準確地預(yù)測蛋白質(zhì)的動態(tài)結(jié)構(gòu)和功能,我們可以借助“計算+實驗”的新型研發(fā)范式,加速人工智能在蛋白質(zhì)結(jié)構(gòu)預(yù)測領(lǐng)域的應(yīng)用。

“計算+實驗”方法利用計算機科學(xué)、數(shù)學(xué)模型和算法預(yù)測和分析實驗結(jié)果,從而在實驗設(shè)計、數(shù)據(jù)分析和結(jié)果驗證中提供支持。這種方法尤其適用于復(fù)雜系統(tǒng)的分析與優(yōu)化,特別是在生命科學(xué)和藥物研發(fā)領(lǐng)域。通過AI進行初步預(yù)測、分子動力學(xué)模擬驗證與優(yōu)化,并借助實驗技術(shù)進行進一步驗證,形成了一個持續(xù)的反饋閉環(huán),不斷改進模型并提高預(yù)測精度。

具體而言,AI可以用于對蛋白質(zhì)結(jié)構(gòu)進行初步預(yù)測,而分子動力學(xué)模擬則用于驗證和優(yōu)化這些預(yù)測結(jié)果。通過這種方式,模擬結(jié)果不僅能夠反饋至AI模型改進其算法,還能通過實驗技術(shù)(如冷凍電子顯微鏡、核磁共振等)進行驗證,將實驗數(shù)據(jù)納入訓(xùn)練數(shù)據(jù)集,從而增強AI模型的泛化能力。

美國人工智能制藥公司Relay Therapeutics的案例驗證了這一方法的有效性。Relay利用第二代安騰超級計算機進行長時間的分子動力學(xué)模擬,將傳統(tǒng)的靜態(tài)結(jié)構(gòu)基礎(chǔ)藥物設(shè)計升級為動態(tài)運動基礎(chǔ)的藥物設(shè)計,從而觀察到生物學(xué)相關(guān)的蛋白質(zhì)運動,并結(jié)合冷凍電子顯微鏡和 X 射線晶體學(xué)等實驗技術(shù)驗證和優(yōu)化模擬結(jié)果。通過對FGFR2激酶的詳細分析,他們發(fā)現(xiàn)了此前未知的口袋結(jié)構(gòu),深入理解了靶點蛋白的運動及其與功能之間的關(guān)系。最終,Relay在18個月內(nèi)以低于1億美元的成本成功研發(fā)出治療膽管癌的新藥RLY-4008,突破了傳統(tǒng)藥物研發(fā)中的“10億美元、10年周期”的行業(yè)瓶頸。

可見,在超算安騰的支持下,基于“計算+實驗”研發(fā)范式,分子動力學(xué)模擬所提供的動態(tài)數(shù)據(jù)精度已接近實驗精度,為推動蛋白質(zhì)結(jié)構(gòu)預(yù)測和藥物研發(fā)開辟了新的可能性。

當(dāng)下,中國式創(chuàng)新模式已經(jīng)被海外科技圈認可。Uber優(yōu)步的創(chuàng)始人特拉維斯Travis Kalanick最近在參加All In播客節(jié)目時,談到了他對中國式創(chuàng)新的理解,當(dāng)時Uber在中國推出的任何新功能都能被滴滴等對手以“史詩般的強度”來復(fù)制,但隨著時間推移,滴滴在本地化服務(wù)、支付整合等方面進行了創(chuàng)新,最終在某些方面超越了Uber,成為行業(yè)的領(lǐng)導(dǎo)者。展望未來,我們有理由相信,在不久的將來,各行各業(yè)將會涌現(xiàn)出更多具有中國特色的創(chuàng)新模式。

編 輯:T01
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載,請必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題,請在相關(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內(nèi)容核實”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
推薦新聞              
 
人物
高通徐晧:利用6G和AI重塑移動連接的未來
精彩視頻
專家談|中國信通院果敢:生成式AI發(fā)展為人工智能終端注入創(chuàng)新動力
全球6G大會|高通展示三大6G原型系統(tǒng) 更好服務(wù)智能時代
6G技術(shù)新突破!6G全息超表面寬帶移動通信系統(tǒng)樣機發(fā)布
全球6G大會 | 中國通信標(biāo)準化協(xié)會聞庫:5G垂直應(yīng)用痛點值得挖掘,設(shè)計6G時要加以考慮
精彩專題
通信產(chǎn)業(yè)2024年業(yè)績盤點
3·15權(quán)益日 | 共筑滿意消費 守護信息通信安全防線
聚焦2025全國兩會
2025年世界移動通信大會
關(guān)于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像