首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|芯片|物聯(lián)網(wǎng)|量子|低空經(jīng)濟|智能汽車|特約記者
手機|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計算|大數(shù)據(jù)|報告|智慧城市|移動互聯(lián)網(wǎng)|會展
首頁 >> 頭條資訊 >> 正文

中國“霸榜”全球開源大模型:光環(huán)下的隱憂與挑戰(zhàn)

2025年8月7日 07:28  證券時報  

證券時報記者 周春媚

過去兩周多的時間里,阿里通義千問陸續(xù)開源了六款模型。在這應接不暇的開源狂歡中,某AI公司的技術研發(fā)人員董銘(化名)卻感到有些心力交瘁——他默默關掉了一個剛部署幾天的測試集群,因為隨著新模型的開源,應用程序接口又變了,而這已經(jīng)是他近期第四次重寫模型調用腳本。

最近,此前有些沉寂的中國大模型又重新熱鬧起來,無論是互聯(lián)網(wǎng)大廠還是初創(chuàng)公司,都緊鑼密鼓地發(fā)布了新模型,頗有2023年“百模大戰(zhàn)”的味道。但不同的是,這一次的大模型浪潮以開源為核心,近期更新模型的公司都選擇了開源的路徑。與此同時,據(jù)全球知名AI開源社區(qū)Hugging Face近日公布的榜單,排名前十的開源大模型中,中國占據(jù)了九席。

中國的開源大模型正以“集群式”的崛起,重塑全球AI版圖。但這在加強中國技術影響力、加快AI應用和普及的同時,也存在著隱憂。一方面,開源模型頻繁迭代,但本質依然是基于主流Transformer架構的微調,能力差距并未拉開,有陷入“微調內(nèi)卷”與同質化困境的傾向。另一方面,對于開發(fā)者來說,開源模型的爆發(fā)雖然提供了各式各樣的工具,但也帶來了反復調試、兼容成本高等挑戰(zhàn)。

中國大模型“橫掃”開源榜單

作為AI大模型大戰(zhàn)的兩個不同方向,開源與閉源孰優(yōu)孰劣歷來存在爭議。開源是指開放源代碼,允許用戶修改、使用、分發(fā),閉源則是指源代碼不公開,用戶僅能通過接口調用功能。

今年以前,我國大模型雖也“百花齊放”,但開源與閉源呈現(xiàn)勢均力敵的狀態(tài),直到DeepSeek火爆出圈,國產(chǎn)大模型才走到了一個分水嶺。業(yè)界普遍認為,DeepSeek的成功是開源的勝利,讓所有人直觀感受到了開源的影響力。于是,更多的中國公司選擇效仿DeepSeek,轉向開源路線,并將工作重點重新轉向模型的優(yōu)化與更新迭代中來。

今年7月底,國產(chǎn)大模型再次迎來了一輪開源“井噴潮”:7月22日起,阿里以“日更”的節(jié)奏,連續(xù)發(fā)布4款開源模型;7月27日,騰訊開源了混元3D世界模型1.0;7月28日,智譜發(fā)布了專為智能體應用打造的開源模型GLM-4.5;7月31日,AI大模型“六小虎”之一的階躍星辰正式開源新一代基礎大模型Step-3……

與此同時,Hugging Face在7月31日公布的榜單顯示,排名前十的開源大模型中,中國占據(jù)了九席。其中,智譜的GLM-4.5排名第一,阿里的通義千問系列大模型更是獨霸5個席位,同時上榜的還有騰訊混元大模型、月之暗面的Kimi K2大模型等。自年初至今,DeepSeek和阿里被外界稱為“開源雙子星”,Kimi K2發(fā)布后被《自然》雜志稱為“又一個DeepSeek時刻”……中國開源大模型迎來了集體爆發(fā)的時刻。

“這一現(xiàn)象標志著中國AI從‘技術追趕’邁向‘生態(tài)主導’,核心驅動力源于‘數(shù)據(jù)—算力—場景’構筑的強勁閉環(huán)優(yōu)勢。”天使投資人、資深人工智能專家郭濤在接受證券時報記者采訪時表示,我國開源大模型強勢崛起,一方面,是由于我國大模型廠商依托海量優(yōu)質中文語料,深度挖掘垂直應用場景,構建起了特色鮮明的差異化訓練數(shù)據(jù)集;另一方面,以華為昇騰為代表的國產(chǎn)化算力底座日趨成熟,為大規(guī)模分布式訓練奠定堅實基礎,疊加開源社區(qū)的飛輪效應,頭部企業(yè)開放代碼匯聚眾智,從而形成了良性循環(huán)的正向反饋。

先發(fā)者與后發(fā)者的路徑分化

8月2日,國際知名大模型評測平臺Chatbot Arena更新了最新一期榜單,阿里旗下最新開源的千問3超越了Grok4、Claude4等閉源模型,位列總榜全球第三,僅次于谷歌與OpenAI旗下的閉源大模型。

與此同時,作為開源模型領域的先驅,Meta創(chuàng)始人扎克伯格在一封公開信中表示,Meta會“謹慎選擇開源內(nèi)容”,這被視為Meta轉向閉源的一個信號。這意味著,在中國大力擁抱開源模型的同時,閉源模型成為了美國科技公司的主流選擇,發(fā)展路徑已出現(xiàn)明顯分化。

“AI的先發(fā)者必然傾向于閉源,因為先發(fā)者要鞏固自己的優(yōu)勢,保持獨特性,比如OpenAI就是從開源逐漸走向閉源;而后發(fā)者必然傾向于開源,因為只有開源,才能打破閉源者構建的生態(tài)。”工信部信息通信經(jīng)濟專家委員會委員盤和林在接受證券時報記者采訪時表示,作為后發(fā)者,我國發(fā)展AI最佳路徑就是開源,只有開源模式可以不斷優(yōu)化,吸引全世界開發(fā)者幫助研發(fā)算法來適配應用場景,從而獲得廣闊的應用生態(tài)支持。

一名人工智能資深專家告訴記者,美國的AI產(chǎn)業(yè)由資本驅動,有較強的資本回報預期,其盈利訴求導致AI大模型企業(yè)往往先追求技術領先,形成一定壟斷后再創(chuàng)造巨額利潤,使其傾向于選擇閉源路線。但對于中國大模型廠商而言,唯有憑借開源的技術透明性,才能迅速在全球范圍內(nèi)獲得信任,建立自己的開發(fā)者生態(tài)。“開源是一種產(chǎn)業(yè)優(yōu)先的路徑,通過開源降低使用門檻,讓大模型加速成為與實體經(jīng)濟融合的基礎設施!痹撊斯ぶ悄苜Y深專家表示。

但開源并不等于放棄盈利,事實上,目前不同的模型廠商都有各自的盈利探索。比如,智譜以開源吸引更多的開發(fā)者,同時也向企業(yè)和政府客戶提供付費的定制化解決方案;阿里則是通過打造強大的開源模型,吸引開發(fā)者使用其云計算等基礎設施,通過云服務獲取收益。

“開源模式如利刃破局,打破技術壟斷壁壘,讓中小企業(yè)能以低成本調用前沿模型,加速AI在智能制造質檢、金融風控等領域的落地!惫鶟f,當閉源模型采取API(應用程序接口)收費模式時,中國開源模型通過微調定制服務、云平臺分成等路徑實現(xiàn)盈利,推動了AI技術的普及和應用。

光環(huán)之下的隱憂與挑戰(zhàn)

開源模型越來越“卷”,這是今年以來從業(yè)者的普遍感受。各個廠商迭代模型的速度越來越快、版本越來越多,一個模型“登頂”之后很快又會被新的模型超越,看似是在參數(shù)性能、評測分數(shù)上“你追我趕”,實則是缺乏顛覆式創(chuàng)新之下的“微調內(nèi)卷”與同質化困境。

“開源也好,閉源也好,所有領先模型都是基于谷歌發(fā)明的Transformer,在這個基礎架構上再創(chuàng)新,如此而已!遍_源中國董事長馬越表示。前述人工智能資深專家表示,國產(chǎn)模型在開源榜上領先,體現(xiàn)的是國內(nèi)廠商在算法工程化、推理性能、成本優(yōu)化等方面的實力,大多數(shù)模型進步是依賴工程調優(yōu),而不是像Transformer那樣的訓練框架及算法創(chuàng)新。

硅谷基準風投公司合伙人Bill Gurley曾評價,中國開源模型之間可以互相改進,產(chǎn)生的組合效應非常強大,推出新模型變得更容易。但技術壁壘上的不足,導致新模型雖然愈發(fā)頻繁地推出,但能力差距并未拉開。對于開發(fā)者而言,開源工具雖多,卻面臨密鑰管理割裂、版本迭代失控等問題。

“通義、DeepSeek、GLM,每個模型都有各自的控制臺和密鑰。而且模型更新頻繁,接口經(jīng)常變化,給集成工作帶來不少困擾。”董銘表示,為了快速驗證新模型,開發(fā)者往往不得不反復部署臨時集群,當模型更新節(jié)奏超過開發(fā)速度,開源狂歡某種程度也成為了“甜蜜的負擔”。

在郭濤看來,模型高速迭代催生技術突破的同時也暗含著隱憂,不僅會帶來兼容性危機,版本更迭過頻導致下游應用適配成本激增,同時也可能存在創(chuàng)新空心化傾向,多數(shù)工作停留在參數(shù)調優(yōu),缺乏底層架構突破。對此,需推動統(tǒng)一API接口標準,激勵開展原創(chuàng)性基礎研究,規(guī)避低水平重復建設。

盤和林認為,靠“微調內(nèi)卷”實現(xiàn)進步是AI基礎算法突破乏力導致的,要真正引領AI范式,基礎模型算法創(chuàng)新和算力芯片突破是繞不過去的兩大門檻。“未來,需要建立中國AI的基礎算法知識分享圈子,通過圈子內(nèi)的相互啟發(fā),來推動中國AI算法思想的創(chuàng)新!北P和林表示。

編 輯:魏德齡
飛象網(wǎng)版權及免責聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權所有,未經(jīng)允許禁止轉載、摘編及鏡像,違者必究。對于經(jīng)過授權可以轉載,請必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責。
3.如因作品內(nèi)容、版權和其它問題,請在相關作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內(nèi)容核實”、“商務聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
推薦新聞              
 
人物
中國電信柯瑞文:星辰智惠 共治共享
精彩視頻
華為史振鈺:智能體從辦公走向生產(chǎn),AI成為生產(chǎn)力
俄羅斯工程院外籍院士孫立寧:構建具身智能的免疫系統(tǒng),從安全服務到人機共生的新范式
廣汽副總經(jīng)理閤先慶:安全是智能網(wǎng)聯(lián)汽車的基石
IDC中國副總裁鐘振山:未來的市場趨勢是從單一智能體產(chǎn)品逐步轉向智能體集群
精彩專題
2025世界人工智能大會暨人工智能全球治理高級別會議
2025中國聯(lián)通合作伙伴大會
2025 MWC 上海
2025工業(yè)互聯(lián)網(wǎng)大會
關于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務業(yè)務經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經(jīng)書面許可,禁止轉載、摘編、復制、鏡像