近日,有報道稱人工智能領域新星Anthropic正在進行一筆高達20億美元的融資談判,該輪融資由Lightspeed Venture Partners(光速創(chuàng)投)領投。
自2021年成立以來,Anthropic已從Menlo Park Ventures等VC以及亞馬遜、谷歌和 Salesforce等科技巨頭獲得超過113億美元的資金。最新一輪融資完成后,Anthropic估值將達到600億美元,較一年前的180億美元估值翻了三倍多。600億美元的估值意味著Anthropic將躋身美國估值最高的五大創(chuàng)業(yè)公司,僅次于SpaceX、OpenAI、Stripe和Databricks。
最近,海內外模型廠商相繼開啟了新一輪融資。上個月,馬斯克的大模型平臺xAI完成了60億美元的C輪融資,市場估值超過400億美元。國內模型廠商方面,2024年12月11日,面壁智能宣布完成新一輪數億元融資;12月17日,智譜AI獲得新一輪30億元融資;12月23日,階躍星辰完成了數億美元的B輪融資。
火熱背后,傳出異動。李開復創(chuàng)立的零一萬物被曝要將團隊整體打包賣給阿里,雖然李開復連夜在朋友圈辟謠否認出售,但零一萬物明顯減少了對基礎大模型的押注。多位投資人、業(yè)內高管向時代周報記者透露,“AI六小龍”普遍已不在預訓練方面傾斜更多精力。
Anthropic的市場期待已高于OpenAI?
Anthropic由一對在美國舊金山的意大利裔美籍兄妹創(chuàng)立,兩人都是OpenAI的早期員工。公司成立兩個月后,A輪融資就籌集了1.24億美元;一年后拿下5.8億美元的B輪融資,團隊隨之擴展到40多人。
Anthropic的大語言模型Claude,被認為是OpenAI ChatGPT的最大競爭對手。Claude主要被應用在B端銷售、營銷和客戶服務等領域。據了解,Anthropic目前的年化收入約為8.75億美元,主要來自B端客戶,按照600億美元估值計算,Anthropic估值/收入比約68.6倍;OpenAI的最新估值為1570億美元,預計2024年收入為37億美元,估值/收入比約為42.4倍,這意味著市場對Anthropic寄予了高度期待。
與背靠微軟的OpenAI相比,Anthropic背后的支持者并不遜色,這些公司都希望全力爭奪未來十年內市場收入超過1萬億美元的AI份額。
作為Anthropic的重要支持者,亞馬遜在去年11月追加了40億美元投資,成為Anthropic的最大投資者。同時,Anthropic也承諾使用亞馬遜云科技的自研芯片Trainium和 Inferentia來訓練和部署其人工智能模型;谷歌此前也表示向Anthropic投資20億美元,并已確認持有該公司10%的股份,同時兩家公司之間簽訂了一份大型云計算合同。
Anthropic在去年加大了研發(fā)力度,技術和產品迭代加速。去年9月,Anthropic推出了Claude Enterprise,這是自其聊天機器人Claude問世以來最大的產品更新,專為希望將人工智能技術集成到業(yè)務中的企業(yè)設計。早些時候,Anthropic還推出了更強大的AI模型Claude 3.5 Sonnet。
2024年10月,Anthropic宣布其AI智能體能夠像人類一樣使用計算機完成復雜任務。據介紹,Anthropic的“計算機使用能力”新功能使其能夠與計算機界面交互,解讀計算機屏幕上的信息、選擇按鈕、輸入文本、導航網站并通過任何軟件和實時互聯網瀏覽執(zhí)行任務,這為實現更智能化的工作流程奠定了基礎。
國內獨角獸“讓路”大廠
Anthropic和OpenAI的大參數模型對外發(fā)布速度已經放緩。
Anthropic Claude系列模型從大到小,分為Opus、Sonnet和Haiku 3個版本。Claude 3發(fā)布了全部 3個版本,而 Claude 3.5 目前只對外發(fā)布了Sonnet和Haiku。同樣地,GPT-5(或GPT-4.5)也遲遲未出現在大眾眼前。
據了解,Opus模型和GPT-5均在內部取得了良好的測試效果,但因效果無法與成本匹配都被內部當作“教師模型”使用,即在內部扮演者提升小模型性能的角色。
對大參數模型,國外創(chuàng)企尚在堅持,國內獨角獸已“讓路”大廠。
1月6日晚,有消息稱零一萬物將把預訓練團隊和算力資源打包出售給阿里云。隨后,第一財經也報道,“阿里云正在洽談收購零一萬物的預訓練團隊,已談好報價。”彼時,阿里云未對該消息作出回應。
零一萬物CEO李開復很快在朋友圈辟謠稱,“不知為什么會有這樣的謠言散播,不過散的快,撤的也快!绷阋蝗f物公眾號在凌晨發(fā)布官方回應,否認“阿里收購零一萬物”。后據界面新聞和智能涌現報道,相比于“零一萬物出售預訓練團隊”的說法,更接近事實的是,零一萬物的確在進行預訓練團隊及Infra團隊的調整,部分人員以跳槽形式加入阿里旗下公司。其中預訓練算法團隊獲得通義團隊offer,Infra團隊則獲得阿⾥云offer。
1月7日,李開復回應表示,只有大廠能夠“燒”超大模型,零一萬物內部愿意繼續(xù)訓練超大參數模型的成員,加入了零一萬物和阿里云成立的“產業(yè)大模型聯合實驗室”。
去年5月,在零一萬物發(fā)布千億參數模型Yi-Large時,李開復還宣布公司已經啟動下一代萬億參數Yi-XLarge MoE模型訓練。當時,智譜、MiniMax、百川、月之暗面、零一萬物、階躍星辰在內的“AI六小龍”也在全力追逐AGI。
困擾李開復的“預訓練”是什么?所謂“預訓練(pre-train)”,指對大模型的基礎教育,即賦予模型海量而通用的知識,來決定模型性能,這是模型廠商最核心的技術壁壘。而狂堆參數的Scaling Law,目前是預訓練的主流路徑,同時也意味著高昂且持續(xù)的算力和數據投入。
馬斯克曾估算,GPT-5的訓練可能需要3萬-5萬張H100,僅芯片成本就超過7億美元(約50億元),對于尚未規(guī);膭(chuàng)業(yè)公司而言,繼續(xù)堆參數訓練模型,要跨越高企的資金門檻。
而大模型發(fā)展至當下階段,邊際效應顯現。在接受晚點采訪時,李開復提到,去年9、10月時,公司看到Scaling Law明顯進入 diminishing return(收益遞減)。不是說用更多算力和數據做不出進步,而是進步不符合投資回報,“從一張卡加到10張卡時,可以達到9.5張卡的價值,但從10萬張卡加到100萬張卡,也許只能達到 30萬張卡的價值”。
事實上,去年10月有報道稱,“AI六小龍”中已經有兩家公司逐步放棄預訓練模型,縮減了預訓練算法團隊人數,業(yè)務重心轉向AI應用。而目前,放棄預訓練的公司數量還在攀升。
“當下的技術路徑很容易同質化和到達瓶頸,再多投入也可能無法建立有效壁壘!币晃粯I(yè)內高管告訴時代周報記者,“去年大部分人不是這樣預期的。彼時大家認為,領先的大模型會步步領先,AGI會很快到來。如果該預期能實現,那的確應該在訓練上死砸(資金)。至于資金實力強如Open AI和Anthropic的這類企業(yè)想實現‘暴力美學’,更多要看下一代技術框架能在什么時間誕生”。
從一級市場資金流向來看,側重落地的細分領域AIGC投融資情況相對樂觀。IT桔子的數據顯示,2024年國內人工智能行業(yè)投資事件466個,投資金額634億元,相比2023年分別減少27%、9%;細分領域AIGC方面,國內AIGC投資事件117個,同比減少26個,投資金額370億元,增加164.82億元,平均每個投資事件投資金額增加了一倍。
“從資金消耗程度來看,訓練模型比開發(fā)推廣應用要大!鄙鲜龈吖芟驎r代周報記者解釋稱,投流獲客和推理算力是應用層兩大成本,不過,這兩項成本支出的高與低,企業(yè)在策略推進上有較大的自主權和靈活性。