以大模型為代表的新一代人工智能技術正加速推進新型工業(yè)化的變革進程。2024年1月,國務院常務會議研究部署推動人工智能賦能新型工業(yè)化有關工作,強調以人工智能和制造業(yè)深度融合為主線,以智能制造為主攻方向,以場景應用為牽引,加快重點行業(yè)智能升級,大力發(fā)展智能產品,高水平賦能工業(yè)制造體系。4月,工信部提出從供給側、需求側、基礎側協同發(fā)力,加快培育面向工業(yè)領域的大模型?梢,工業(yè)大模型已經成為人工智能深度賦能新型工業(yè)化的重點方向;不僅能推動生產制造高效化發(fā)展、大幅縮短生產周期,而且能效降低生產制造的成本消耗,推進工業(yè)綠色化、集約化發(fā)展。
本文總結分析了我國工業(yè)大模型發(fā)展現狀,及現階段工業(yè)大模型發(fā)展過程中存在的幾個明顯反差,并提出發(fā)展趨勢展望。
01 我國工業(yè)大模型發(fā)展現狀
當前,我國大模型已進入發(fā)展加速期,在自然語言處理、機器視覺和多模態(tài)等各技術分支上均與國際技術發(fā)展趨勢同步發(fā)展。在產學研各方共同推動下,我國已建立起涵蓋理論方法和軟硬件技術的體系化研發(fā)能力,涌現出一批具有行業(yè)影響力的大模型應用,形成了緊跟世界前沿的各種大模型技術。目前,我國10億參數規(guī)模以上的大模型數量已超100個1。行業(yè)大模型深度賦能電子信息、金融、傳媒、文旅、醫(yī)療、交通、政務等領域。同時,大模型開始向能源、汽車、鋼鐵等工業(yè)領域挺進,在設計、研發(fā)、管理等環(huán)節(jié)嶄露頭角。
現階段,國內布局工業(yè)大模型的主體可分為四類:AI廠商、工業(yè)技術服務商、創(chuàng)新成長型企業(yè)、科研機構/科技巨頭。AI廠商主要基于通用基礎大模型賦能工業(yè)領域,主打“大而全”;創(chuàng)新成長型企業(yè)則發(fā)揮自身在細分領域的經驗沉淀打造垂直行業(yè)大模型,主打“專而精”;工業(yè)技術服務商則選擇在既有產品中融入AI能力;科研機構/科技巨頭則在國內領先的通用大模型基礎上向工業(yè)領域滲透。據統(tǒng)計,工業(yè)領域已有99個工業(yè)大模型應用案例2。
與國外知名大模型相比,2023年下半年國內工業(yè)大模型能力提升明顯。在工業(yè)知識問答、文檔生成等領域,國內大模型已取得領先,數據分析、代碼理解等領域能力接近;但在工程建模領域,國內大模型與國際存在一定差距3。具體參見圖1。
圖1:國內外大模型能力對比
資料來源:中國工業(yè)互聯網研究院《人工智能大模型工業(yè)應用準確性測評》,2024.3
02 我國工業(yè)大模型發(fā)展過程中的四個反差現象
反差1:AI專利具備數量優(yōu)勢,而制造業(yè)AI普及率低
我國在人工智能專利數量方面占據主導地位,但頂級人工智能模型相對較少,且制造企業(yè)AI普及率相對較低。根據2024斯坦福AI指數報告,2022年,全球人工智能專利來源中,中國占61.1%,大幅超過美國的20.9%,歐盟和英國僅占2.03%;但 2023 年,全球頂級人工智能模型中,61 個來自美國,歐盟21個,中國15個。另據凱捷(Capgemini)統(tǒng)計數據顯示,日本和美國制造企業(yè)的AI應用率分別達到了30%和28%;相較于這些發(fā)達國家,中國制造企業(yè) AI普及率尚不足11%。
其主要原因在于,目前國內外推出的主流大模型仍為公共數據集訓練出的基礎大模型,知識面夠廣但不夠專,在工業(yè)各垂直領域的性能表現并不突出。根據中國工業(yè)互聯網研究院2024年3月發(fā)布的《人工智能大模型工業(yè)應用準確性測評》報告,國內外主流大模型的工業(yè)應用準確性平均得分低于60分,處于明顯領先位置的GPT-4、“文心一言”等大模型總體評分也僅在70分上下,可見基礎大模型在賦能新型工業(yè)化方面還有巨大的發(fā)展?jié)摿洼^大的提升空間。
反差2:通用大模型數量多,而工業(yè)垂直領域落地少
與通用大模型相比,垂直行業(yè)大模型能夠更直接地深入特定行業(yè)與業(yè)務場景,更精準地滿足行業(yè)特定的需求,可以彌補通用大模型無法最優(yōu)化適配到垂直行業(yè)中的不足。而對于垂直行業(yè)而言,大模型是一種全新的生產力,賦能行業(yè)全流程的同時,可以改變行業(yè)的業(yè)務模式及商業(yè)模式,驅動行業(yè)實現數據化轉型。因而,垂直行業(yè)應用將成為大模型產業(yè)落地的關鍵賽道。據不完全統(tǒng)計,截至2023年7月底,國內行業(yè)大模型已完成招標項目超過60個,探索賦能不同行業(yè)場景的落地方式與應用價值,已成為大模型商業(yè)化落地的重要方向。
但從大模型落地行業(yè)領域來看,面向工業(yè)垂直領域的專用模型較少,大模型在工業(yè)垂直場景的應用尚不成熟。截至2023年7月,國內130家研發(fā)大模型的公司中,通用大模型為78家,占比60%。另外,行業(yè)大模型在金融、傳媒、文旅、政務、交通等領域的落地應用速度較快,其中約15%的大模型都是金融垂直大模型。
這主要是因為,AI大模型應用于垂直行業(yè)存在以下問題,限制了實際應用效果和行業(yè)場景的拓展:一是缺乏行業(yè)專有知識。不同行業(yè)都有大量區(qū)別于其他行業(yè)的知識、數據與流程,大模型需要掌握這些know-how語料才能支撐行業(yè)專屬應用。而通用AI大模型為廣泛應用場景提供了解決方案,但其缺乏特定行業(yè)的專有知識。二是難以精確控制輸出內容。通用AI大模型基于通用數據生成的內容往往過于普遍化,無法滿足垂直行業(yè)的具體需求。在某些情況下,輸出內容可能會偏離問題的實質,給用戶帶來困惑。三是模型泛化能力不足。人工智能大模型在訓練數據上表現出色,但在未見過的數據上可能泛化能力不足,過度擬合是常見問題,這對大模型在不同行業(yè)落地應用帶來一定門檻。
反差3:工業(yè)大模型覆蓋環(huán)節(jié)多,而核心生產應用少
全球范圍來看可用于工業(yè)領域的大模型超過30個4,形成語言大模型、專用大模型、多模態(tài)大模型和視覺大模型四類核心模型,通過三種方式賦能工業(yè)企業(yè):基于通用底座直接賦能行業(yè)、基于通用底座進行場景化適配調優(yōu)或形成外掛插件工具、面向工業(yè)或具體任務針對性開發(fā)。
工業(yè)大模型率先落地的場景基本集中在企業(yè)的研發(fā)/設計、設備、管理等環(huán)節(jié),以此提升人機交互性能及業(yè)務系統(tǒng)之間的互通效率,但暫未觸及工業(yè)領域核心“生產”環(huán)節(jié)。如大語言模型主要應用于工業(yè)問答交互、內容生成,以提升任務處理效率為主;專業(yè)任務大模型圍繞研發(fā)形成輔助設計、藥物研發(fā)兩個重點方向,進一步增強研發(fā)模式的創(chuàng)新能力;多模態(tài)大模型與視覺大模型則在裝備智能化和視覺識別領域應用進行初步嘗試。
究其原因,工業(yè)大模型在核心生產環(huán)節(jié)的應用受到三個方面的因素制約:一是工業(yè)領域本身門類眾多,各細分行業(yè)高度碎片化和差異化,大模型難以規(guī)模復制和推廣,客觀上提高了其成本和落地門檻。二是工業(yè)生產環(huán)境經常涉及復雜的工藝流程、高精度的操作控制以及嚴苛的安全標準。任何模型預測或決策的失誤都可能導致生產事故、質量問題或經濟損失,因而對可靠性有更嚴格的要求。三是工業(yè)生產對實時性的要求非常高,很多場景需要模型能夠在毫秒級甚至微秒級的時間內做出響應;而且,由于計算資源的限制,模型的大小和計算復雜度也需要得到合理控制。這就需要在保證模型性能的同時,盡可能地降低計算復雜度,以實現高效的實時推理。
因而從工業(yè)企業(yè)的角度,會選擇從外圍環(huán)節(jié)引入大模型,而對核心生產環(huán)節(jié)的應用則相對慎重。以化工行業(yè)為例,據百度智能云相關資料,大模型主要應用于企業(yè)管理、產品質檢領域。企業(yè)管理領域利用大模型把行業(yè)里安全生產、管理等各類標準,通過大模型知識固化,形成共性的服務平臺;產品質檢領域則主要是在生產過程中需要多輪質檢來保障產品質量,以此降低成本,提升生產效率。
反差4:對工業(yè)數據質量要求高,而現有數據不完整、不連通
海量、多源、動態(tài)更新的數據是訓練模型和進行數據挖掘的必要條件,尤其人工智能大模型的訓練需要海量工業(yè)數據/語料庫,而且對數據規(guī)模、質量等的要求很高,因為錯誤或不一致的數據可能導致模型訓練不穩(wěn)定或性能下降。如預訓練階段,語言大模型需要40TB的中文文本語料;視覺大模型需要100W+工業(yè)圖像;多模態(tài)大模型的效果則與數據量強相關,通常需要億級以上規(guī)模的數據。不僅如此,大模型訓練對數據的配比要求也較高,工業(yè)數據在所有數據的占比需要達到約10-15%。
而我國在工業(yè)大模型的應用推廣中,面臨三個突出問題:一是工業(yè)企業(yè)數字化程度參差不齊,各場景、環(huán)節(jié)數據結構不統(tǒng)一,導致工業(yè)數據質量參差不齊,缺乏高質量的工業(yè)語料數據為大模型的微調訓練提供支撐。二是工業(yè)生產過程中的各個環(huán)節(jié)相互交織,數據之間的關聯性和復雜性也較高。數據的來源、采集方式、時間戳等都會影響數據的準確性和完整性。這種數據結構的多樣與質量的參差不齊給工業(yè)大模型的訓練和應用帶來了挑戰(zhàn)。三是工業(yè)企業(yè)間數據壁壘嚴重,限制了數據的共享和流通。尤其在核心制造環(huán)節(jié),工業(yè)數據通常包含企業(yè)的核心機密和商業(yè)秘密,如工藝參數、配方、客戶信息等,因而對數據隱私與數據安全異常敏感。此外,數據共建共享、數據產權界定等機制不完善,導致數據規(guī)模和質量無法有效支撐模型訓練,一定程度上限制了工業(yè)大模型的應用進程。
03 工業(yè)大模型發(fā)展展望
大模型向B端尤其是工業(yè)領域應用已成為行業(yè)共識。大模型已呈現出以基礎大模型為技術底座,工業(yè)應用為切入點的發(fā)展趨勢。
大模型成本的降低將加速其在工業(yè)領域的應用。業(yè)界在積極探索各類模型壓縮技術,在保證模型精度的同時,可以有效減少模型的參數量、計算復雜度和存儲需求,從而降低訓練和推理成本。近期BAT和科大訊飛等大模型廠商紛紛宣布主力模型免費,表明大模型成本已經斷崖式下降,這無疑將加快大模型在工業(yè)領域的滲透速度,并最終提高AI在工業(yè)尤其是制造業(yè)的普及率。據市場研究機構Market Research Future預計,從2022至2032年工業(yè)AI市場規(guī)模將以46%的年均復合增長率高速成長。
定制化大模型將成為更多行業(yè)的選擇。隨著各行各業(yè)對于大模型的深入理解,大模型將更傾向于滿足特定行業(yè)需求,為企業(yè)提供更為精準的解決方案,就像是為每個行業(yè)打造了一套專屬的“大腦”。
從落地應用模式來看,工業(yè)大模型的應用模式將是“基礎大模型+工業(yè)APP”,基于少量工業(yè)基礎大模型快速構建大量工業(yè)APP滿足碎片化應用需求。從而既能依托基礎大模型的結構和知識,又能融合工業(yè)細分行業(yè)的數據和專家經驗,加快形成垂直化、場景化、專業(yè)化的應用模型,推動各類工業(yè)場景的智能化升級。
工業(yè)企業(yè)對工業(yè)數據的管理將會提上一個新臺階。伴隨大模型在各行業(yè)外圍場景落地并逐步向核心生產環(huán)節(jié)滲透,工業(yè)企業(yè)對數據的認識和理解會更加深入。包括如何合理收集、清洗和管理數據,如何確保數據的質量和全面性,如何保障數據的隱私和安全等。而基于各行各業(yè)的探索,相關的機制和制度保障也會愈加完善。
注釋
1.國家數據局局長劉烈宏2024年3月25日在中國發(fā)展高層論壇公布的數據。
2.騰訊研究院《工業(yè)大模型應用報告》,2024.3。
3.中國工業(yè)互聯網研究院《人工智能大模型工業(yè)應用準確性測評》,2024.3。
4.工業(yè)互聯網產業(yè)聯盟&信通院:工業(yè)大模型技術應用與發(fā)展報告1.0,2023.12。
本文作者
柴雪芳
戰(zhàn)略發(fā)展研究所
一級分析師
碩士,高級經濟師,就職于中國電信研究院,長期從事信息通信行業(yè)市場研究、客戶研究,近年來專注于產品運營管理、數字化轉型等領域。