中國科學院自動化所研究員王金橋:多模態(tài)大模型邁入主動交互新時代丨2025移動通信高質量發(fā)展論壇
11月21日,以“非凡‘十四五’ 聚力啟新程”為主題的2025移動通信高質量發(fā)展論壇在湖北武漢舉辦。中國科學院自動化研究所副總工程師、武漢人工智能研究院院長王金橋在論壇上作題為《多模態(tài)大模型:邁入主動交互新時代》的主旨發(fā)言。
王金橋表示,多模態(tài)大模型已成為AI產(chǎn)業(yè)應用的主要方向。從感知理解到生成創(chuàng)造,大模型技術成為通用智能技術的主流探索方向。當前,大模型在“大算力、大數(shù)據(jù)、大參數(shù)”的驅動下持續(xù)升級。然而,僅靠增大參數(shù)量帶來的性能提升已日漸平緩。因此,發(fā)展重點正從規(guī)模擴張轉向智能體、合成數(shù)據(jù)和推理計算等新方向。這種計算范式的轉變,也導致了模型在推理和“思考”過程中的算力需求顯著增加。
王金橋介紹,人工智能的發(fā)展路徑是從生成式AI到AI智能體,再到物理交互的AI。在生成式AI階段,數(shù)據(jù)決定智能模型的高度;在AI智能體階段,記憶決定Agentic的應用規(guī)模;在物理AI階段,環(huán)境決定模型自演進。
對于中美兩國在人工智能上的差距,王金橋表示,中美兩國之間的差距快速縮小,在LMSYS聊天機器人競技場中,2024年1月,美國頂級模型的表現(xiàn)比最佳中國模型高出9.26%;而到2025年2月,這一差距縮小至僅為1.7%。我國人工智能創(chuàng)新水平已經(jīng)進入世界第一梯隊,2020年,全球AI期刊論文中引用中國論文的比例達到20.7%,首次超過美國的19.8%。
王金橋表示,目前的差距主要體現(xiàn)在硬件、數(shù)據(jù)、技術和人才上。在硬件上,高端AI算力資源不足,同時也缺乏足夠的資金來支撐智算集群的高昂訓練與運營成本;在數(shù)據(jù)上,中文高質量數(shù)據(jù)資源小于英文,差距達到20-30倍,需要高質量數(shù)據(jù)清洗;在技術上,通用基礎大模型開發(fā)是一個系統(tǒng)工程,需具備分布式訓練、模型優(yōu)化等技術經(jīng)驗與工程化能力;在人員上,把know-how數(shù)據(jù)轉化成Q&A的能力,需要大量的工程師。
2024年圖靈獎得主、“強化學習之父”理查德·薩頓說過:“2024年人類數(shù)據(jù)正在迅速逼近極限,智能體將越來越多地通過與世界的交互來進行學習,潛力將遠超以往!
對此,王金橋表示,新一代人工智能研究體系已經(jīng)形成。AI基礎研究范式正從傳統(tǒng)數(shù)據(jù)智能向大數(shù)據(jù)智能、跨媒體智能、群體智能、混合增強智能、自主智能等人工智能五大形態(tài)轉變。新一代人工智能基礎研究框架推動人工智能基礎理論創(chuàng)新,知識引導、視覺知識、群智涌現(xiàn)、混合增強智能等多學科交叉發(fā)展。
王金橋介紹了紫東太初多模態(tài)大模型的發(fā)展和應用情況。紫東太初多模態(tài)大模型4.0現(xiàn)已具備多模態(tài)理解、文本數(shù)學、邏輯思維、視覺問答、GUI智能體、工具調(diào)用六大能力,對標GPT-4.1-nano、GPT-4o等先進模型。在服務科學研究上,紫東太初多模態(tài)大模型打造了面向科研全流程的科學智能平臺,可自主規(guī)劃及調(diào)用超過300個科學計算工具,實現(xiàn)工具的協(xié)同編排和便捷調(diào)用,可自動識別科研任務、智能編排并調(diào)度最優(yōu)工具鏈,提升科研流程效率,支持用戶靈活接入自有智能體與工具,快速搭建專屬科研應用。在服務千行百業(yè)上,基于多模態(tài)大模型構建的長江流域模擬器,可以實現(xiàn)對長江流域綠色發(fā)展水平的評估,并對水生態(tài)、防洪、航運、供水等進行實時監(jiān)測預警。
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權所有,未經(jīng)允許禁止轉載、摘編及鏡像,違者必究。對于經(jīng)過授權可以轉載,請必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責。
3.如因作品內(nèi)容、版權和其它問題,請在相關作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內(nèi)容核實”、“商務聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
彩云之南,向新而行:解鎖數(shù)智云南新場景、新活力
)“十四五”期間,云南持續(xù)加大數(shù)字化基礎設施投入,積極推動行業(yè)數(shù)智化、低碳化轉型,取得了豐碩成果。[詳細]
折痕有望消滅,但折疊屏手機又添新課題?
近期,關于折疊屏手機的消息一波接一波,先是三星的三折疊機型現(xiàn)身,后是流出關于蘋果闊折疊機型的消息,不過關于折疊屏手機的技術難題,似乎還是存在。[詳細]
從規(guī)模破局到質效突圍:5G工廠邁入量質齊升新賽道
2025年作為“十四五”時期5G工廠“百千萬”行動收官之年,我國5G工廠建設已從起步探索邁入規(guī)模應用新階段,1260個5G工廠納入官方名錄,累計帶動投資591.3億元,覆蓋41個工業(yè)大類、近90個行業(yè)..[詳細]
信息光子技術產(chǎn)業(yè)正加速發(fā)展,并進入重要戰(zhàn)略機遇期
當前,信息光子技術產(chǎn)業(yè)正加速發(fā)展,并進入重要戰(zhàn)略機遇期。近日,中國信通院發(fā)的《信息光子技術發(fā)展與應用研究報告(2025 年)》(以下簡稱《報告》)指出,一方面,需求側與人工智能、先進計..[詳細]
中國信通院正式發(fā)布2026深度觀察十大趨勢
12月13日,2026中國信通院深度觀察報告會主報告會在北京舉辦。本次報告會主題為 “面向“十五五”,人工智能浪潮下的新質生產(chǎn)力發(fā)展”。工業(yè)和信息化部黨組成員、副部長張云明出席報告會并致..[詳細]













