必讀視頻專題飛象趣談光通信人工智能低空經(jīng)濟(jì)5G手機(jī)智能汽車智慧城市會(huì)展特約記者

當(dāng)算力告別“野蠻生長(zhǎng)”:多芯混戰(zhàn)下睿思智聯(lián)的破局之道

2025年12月1日 13:40CCTIME飛象網(wǎng)

一、洞察:當(dāng)算力告別“野蠻生長(zhǎng)”

近期,華為正式開源 AI 容器技術(shù) Flex:ai。

而就在一年前,英偉達(dá)以 7 億美元收購 Run:ai,大舉進(jìn)軍算力精細(xì)化管理領(lǐng)域。

當(dāng)全球算力的兩大巨頭 - 英偉達(dá)與華為,不約而同地開始在“算力切分”與“統(tǒng)一調(diào)度”上重金押注,一個(gè)積極且明確的 AI 行業(yè)分水嶺已經(jīng)出現(xiàn):

單純靠“囤卡”堆性能的草莽階段已經(jīng)過去。

當(dāng)下的競(jìng)爭(zhēng),不再是“誰有更多卡”,而是誰能把每張卡“用得更細(xì)”、“調(diào)得更準(zhǔn)”和“管得更清”。

但對(duì)中國(guó)的企業(yè)而言,現(xiàn)實(shí)遠(yuǎn)比技術(shù)藍(lán)圖復(fù)雜。

真實(shí)的智算中心,是一場(chǎng)“多芯混戰(zhàn)”

走進(jìn)一家頭部券商、大型央企或國(guó)家級(jí)超算中心,更為常見的是:

存量主力:依然是大量尚未淘汰、承載核心業(yè)務(wù)的 NVIDIA P100/T4/V100/A800;

國(guó)產(chǎn)新貴:近年來大規(guī)模部署的 華為昇騰 910B2/B3/B4;

百花齊放:更新的機(jī)架上,寒武紀(jì)、海光 DCU、昆侖芯、天數(shù)智芯等更多國(guó)產(chǎn)卡正在快速上線。

這種 “多代際、多廠商、多架構(gòu)”并存的極度異構(gòu)環(huán)境,才是中國(guó) AI 基礎(chǔ)設(shè)施的真實(shí)底色。

Flex:ai 的開放,是縱向生態(tài)的必然

Flex:ai 宣稱兼容 NVIDIA GPU,這無疑是積極信號(hào),它試圖通過軟件層的兼容,降低客戶從 CUDA 生態(tài)遷移到昇騰生態(tài)的門檻。

但從產(chǎn)業(yè)規(guī)律看,任何由硬件廠商主導(dǎo)的調(diào)度平臺(tái),其重心天然向自家芯片傾斜。這并非缺陷,而是生態(tài)定位的必然結(jié)果:廠商平臺(tái)的核心使命,是最大化自有硬件的護(hù)城河。

而那些非巨頭系的國(guó)產(chǎn)芯片(如 寒武紀(jì)、天數(shù)、沐曦、燧原、摩爾線程等),在巨頭生態(tài)中往往只能獲得“有限”的支持。

然而,在眾多算力廠商共存的當(dāng)下,企業(yè)真正需要的,不是一個(gè)又一個(gè)“生態(tài)內(nèi)的優(yōu)化器”,而是一個(gè)不造芯片、不站隊(duì)、只做算力管理的第三方平臺(tái):

它不關(guān)心底層是昇騰還是 NVIDIA,只關(guān)心資源是否被高效利用;

它不綁定任何廠商的驅(qū)動(dòng)棧,而是通過抽象層讓異構(gòu)硬件協(xié)同工作;

它的核心 KPI 不是“賣了多少卡”,而是“企業(yè)的算力 ROI 提升了多少”。

這不僅是技術(shù)選擇,更是供應(yīng)鏈安全與運(yùn)營(yíng)效率的戰(zhàn)略平衡。當(dāng)硬件還在“戰(zhàn)國(guó)七雄”時(shí)代,軟件必須先行統(tǒng)一。

二、K8s是底座,調(diào)度器是“大腦”

Flex:ai 的發(fā)布,再次印證了 Kubernetes(K8s)作為 AI 基礎(chǔ)設(shè)施底座 的不可動(dòng)搖地位。

但這并不意味著原生 K8s 就能直接勝任 AI 算力管理。恰恰相反,原生 K8s 與 AI 負(fù)載之間存在天然“錯(cuò)配”:它生來為通用計(jì)算設(shè)計(jì),而非為昂貴、稀缺、高吞吐的 GPU/NPU 優(yōu)化。

這種“錯(cuò)配”,導(dǎo)致原生 K8s 在管理 AI 算力時(shí)存在兩大核心瓶頸。

瓶頸一:K8s 的“整卡魔咒”

在標(biāo)準(zhǔn) K8s 調(diào)度邏輯中,GPU 被視為“擴(kuò)展資源”,只能按整卡分配。這意味著:

一個(gè)僅需 2GB 顯存的 Jupyter Notebook 調(diào)試任務(wù),會(huì)獨(dú)占一張 80GB 的 A800;

一張昇騰 910B 無法同時(shí)服務(wù)多個(gè)小模型推理請(qǐng)求;

一旦任務(wù)啟動(dòng),整張卡就被鎖定,即使實(shí)際利用率不足 10%。

這種“一刀切”機(jī)制,是當(dāng)前智算中心 分配率高(>90%)但是使用率低(<30%) 的根本原因。

瓶頸二:調(diào)度器“不懂 AI”

原生 K8s 調(diào)度器只關(guān)心“節(jié)點(diǎn)是否有空閑資源”,而 AI 任務(wù)對(duì)調(diào)度的要求遠(yuǎn)不止于此。一個(gè)真正“AI 原生”的調(diào)度器,必須具備:

拓?fù)涓兄豪斫?NVLink/HCCS/XPULink 等互聯(lián)拓?fù),讓多卡通信效率翻倍?/P>

優(yōu)先級(jí)感知:保障在線推理、實(shí)時(shí) Agent 的 SLA,讓離線訓(xùn)練自動(dòng)讓路;

資源感知:對(duì)低利用率資源進(jìn)行超分復(fù)用,壓榨閑置算力;

業(yè)務(wù)感知:將企業(yè)的組織架構(gòu)、配額管理融入調(diào)度邏輯。

這些能力,原生 K8s 均無法提供,無法滿足 AI 算力“像管理水電一樣管理算力”的需求。

三、HAMi:異構(gòu)調(diào)度的“中立”插件

在 Flex:ai 與 Run:ai 背后,另一條技術(shù)路徑早已在開源社區(qū)悄然生長(zhǎng):HAMi(Heterogeneous AI Computing Virtualization Middleware)。

HAMi 起源于 2019 年第四范式的內(nèi)部 GPU 虛擬化項(xiàng)目(k8s-vgpu-scheduler),2024 年正式捐贈(zèng)給云原生計(jì)算基金會(huì)(CNCF),進(jìn)入 Sandbox 孵化階段。HAMi 自創(chuàng)建之初,目標(biāo)就非常明確:在 Kubernetes 之上,構(gòu)建一個(gè)不隸屬于任何硬件廠商的異構(gòu)設(shè)備管理中間件。

當(dāng)智算中心同時(shí)運(yùn)行 NVIDIA、昇騰、寒武紀(jì)、海光、昆侖芯等十余種芯片,企業(yè)面臨一個(gè)現(xiàn)實(shí)困境:“硬件越多元,調(diào)度越分裂”。

自研調(diào)度系統(tǒng)成本高、周期長(zhǎng);采用某家大廠方案,又可能犧牲其他廠商硬件的調(diào)度潛力。

HAMi 給出了第三個(gè)選擇:

開源中立:Apache 2.0 協(xié)議,由社區(qū)驅(qū)動(dòng),不為任何硬件廠商站臺(tái);

廣泛兼容:目前已覆蓋 NVIDIA、昇騰、寒武紀(jì)、海光、昆侖芯、天數(shù)智芯、沐曦、摩爾線程等主流芯片。

四、睿思智聯(lián):從開源社區(qū)到企業(yè)級(jí) AI 應(yīng)用平臺(tái)

HAMi 證明了“中立調(diào)度”的技術(shù)可行性,但企業(yè)真正需要的,遠(yuǎn)不止于“能切分、能調(diào)度”。在 AI 應(yīng)用日益復(fù)雜的今天,從大模型推理、RAG 系統(tǒng),到 Autonomous Agent 編排,企業(yè)亟需一個(gè) "讓AI應(yīng)用平穩(wěn)運(yùn)行的底座”。

作為 HAMi 的核心貢獻(xiàn)者之一,睿思智聯(lián)基于社區(qū)實(shí)踐,已經(jīng)打造了Rise 企業(yè)級(jí)平臺(tái):Rise VAST(底層虛擬化引擎)、Rise CAMP(中層算力調(diào)度平臺(tái))和 Rise ModelX(上層模型服務(wù)平臺(tái)):

Rise VAST

底層算力虛擬化引擎,讓異構(gòu) GPU/NPU實(shí)現(xiàn)任意比例切分、動(dòng)態(tài)調(diào)度與故障自愈,將集群利用率從 30–50% 提升至 80% 以上,真正釋放國(guó)產(chǎn)硬件潛力。

Rise CAMP

中層算力管理與運(yùn)營(yíng)平臺(tái),統(tǒng)一調(diào)度多廠商算力,提供智能策略、分鐘級(jí)計(jì)量計(jì)費(fèi)與全鏈路可觀測(cè)性,讓企業(yè)像管理云資源一樣管理 AI 算力。

Rise ModelX

上層大模型服務(wù)平臺(tái),構(gòu)建于 CAMP 之上,支持多推理引擎自動(dòng)適配、Agent 運(yùn)行時(shí)支撐與 Token 級(jí)計(jì)費(fèi),讓大模型從“一次性產(chǎn)出”變?yōu)榭捎?jì)量、可服務(wù)、可運(yùn)營(yíng)的企業(yè)資產(chǎn)。

中立,是企業(yè)級(jí)平臺(tái)的基石

這一切能力得以成立的前提,是睿思智聯(lián) 堅(jiān)定的廠商中立立場(chǎng):

不綁定單一大廠生態(tài),而是協(xié)同合作;

目標(biāo)是“客戶算力利用率提升了多少”、“AI 應(yīng)用交付是否穩(wěn)定”等業(yè)務(wù)價(jià)值的提升。

在硬件碎片化不可逆的今天,這種中立性,已從技術(shù)選擇升維為企業(yè) AI 基礎(chǔ)設(shè)施的戰(zhàn)略必需品。

睿思智聯(lián)的定位從創(chuàng)立之初就很清晰,這一選擇不是技術(shù)路線的權(quán)宜之計(jì),而是對(duì)行業(yè)本質(zhì)的深刻洞察:

開放協(xié)作:我們持續(xù)與各大芯片廠商深度合作,共同完善異構(gòu)調(diào)度標(biāo)準(zhǔn),確保底層技術(shù)的開放性與兼容性,并積極回饋給開源社區(qū);

精細(xì)運(yùn)營(yíng):將社區(qū)最佳實(shí)踐轉(zhuǎn)化為企業(yè)級(jí)產(chǎn)品,通過分鐘級(jí)計(jì)量計(jì)費(fèi)、多維度成本分?jǐn)、自?dòng)化資源回收,幫助企業(yè)建立算力使用運(yùn)營(yíng)體系;

業(yè)務(wù)賦能:我們的成功標(biāo)準(zhǔn)與客戶業(yè)務(wù)成果直接掛鉤,客戶成功團(tuán)隊(duì)的KPI與客戶算力利用率提升、AI應(yīng)用交付效率、業(yè)務(wù)創(chuàng)新速度緊密關(guān)聯(lián),確保技術(shù)投入轉(zhuǎn)化為真實(shí)業(yè)務(wù)價(jià)值。

價(jià)值不是口號(hào),而是可量化的業(yè)務(wù)成果。在AI投入持續(xù)增長(zhǎng)的今天,企業(yè)需要的不僅是技術(shù)工具,更是能帶來明確投資回報(bào)的合作伙伴。睿思智聯(lián)致力于成為這樣的伙伴:

“讓算力真正驅(qū)動(dòng)業(yè)務(wù)創(chuàng)新,而非成為成本負(fù)擔(dān)“。

五、結(jié)語:協(xié)同是多芯時(shí)代的最優(yōu)解

當(dāng) Flex:ai 與 Run:ai 相繼登場(chǎng),行業(yè)共識(shí)已然清晰:AI 算力的下半場(chǎng),屬于精細(xì)化調(diào)度與高效運(yùn)營(yíng)。

但在中國(guó)“多芯混戰(zhàn)”的現(xiàn)實(shí)下,單靠某一家廠商的調(diào)度方案,難以真正釋放異構(gòu)算力的全部潛力。無論是 NVIDIA、昇騰,還是寒武紀(jì)、海光、昆侖芯,每一塊國(guó)產(chǎn)芯片都值得被平等調(diào)度、被精細(xì)使用、被高效協(xié)同。

這需要一個(gè) “開放、中立、可擴(kuò)展”的 AI 算力協(xié)同平臺(tái)“,它不替代任何硬件,而是讓所有硬件更好地協(xié)同工作;它不綁定任何生態(tài),而是為所有生態(tài)提供統(tǒng)一接口。

睿思智聯(lián)始終相信:開源是實(shí)現(xiàn)協(xié)同的最佳路徑。我們呼吁更多芯片廠商、軟件伙伴擁抱開源技術(shù),共同完善異構(gòu)調(diào)度標(biāo)準(zhǔn),讓國(guó)產(chǎn)芯片在統(tǒng)一平臺(tái)上發(fā)揮更大價(jià)值。

未來,睿思智聯(lián)將繼續(xù)深耕 Rise 企業(yè)級(jí)平臺(tái),同時(shí)堅(jiān)定回饋 HAMi 社區(qū),推動(dòng)“開源為基、商業(yè)為用”的雙輪驅(qū)動(dòng)模式。睿思智聯(lián)的目標(biāo)不是成為又一個(gè)調(diào)度插件,而是構(gòu)建一個(gè)真正中立、自主可控、可擴(kuò)展、可運(yùn)營(yíng)的 AI 算力協(xié)同底座 - 讓每一份算力投入都能轉(zhuǎn)化為業(yè)務(wù)創(chuàng)新,讓AI應(yīng)用穩(wěn)定運(yùn)行而不過度消耗資源,讓技術(shù)團(tuán)隊(duì)專注創(chuàng)造而非運(yùn)維救火。

編 輯:T01
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對(duì)于經(jīng)過授權(quán)可以轉(zhuǎn)載,請(qǐng)必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題,請(qǐng)?jiān)谙嚓P(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時(shí)間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。
推薦閱讀

精彩視頻

精彩專題

關(guān)于我們廣告報(bào)價(jià)聯(lián)系我們隱私聲明本站地圖

CCTIME飛象網(wǎng) CopyRight © 2007-2025 By CCTIME.COM

京ICP備08004280號(hào)-1 電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證080234號(hào) 京公網(wǎng)安備110105000771號(hào)

公司名稱: 北京飛象互動(dòng)文化傳媒有限公司

未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像