必讀視頻專題飛象趣談光通信人工智能低空經(jīng)濟5G手機智能汽車智慧城市會展特約記者

報道:OpenAI整合團隊擬一季度發(fā)布新語音模型,為發(fā)布AI個人無屏設備鋪路

2026年1月4日 09:01華爾街見聞

OpenAI正優(yōu)化其音頻人工智能模型,為計劃中的語音驅動型個人設備做準備。

1月1日,據(jù)The Information報道,OpenAI過去兩個月內(nèi)整合工程、產(chǎn)品和研究力量,集中攻克音頻交互的技術瓶頸,目標打造一款可通過自然語音指令操作的消費級設備。

公司內(nèi)部研究人員認為,當前ChatGPT的語音模型在準確性和響應速度上均落后于文本模型,且兩者使用的底層架構并不相同。

據(jù)報道,新語音模型將具備更自然的情感表達能力和實時對話功能,包括處理對話打斷的能力,這是現(xiàn)有模型無法實現(xiàn)的關鍵特性,計劃2026年第一季度發(fā)布。

報道援引知情人士稱,OpenAI還計劃推出一系列無屏設備,包括智能眼鏡和智能音箱,將設備定位為用戶的“協(xié)作伴侶”而非單純的應用入口。

不過在推出支持語音指令的消費級AI硬件產(chǎn)品前,OpenAI需要先改變用戶的使用習慣。

團隊整合聚焦無屏交互方式

據(jù)報道,OpenAI當前的語音模型與文本模型分屬不同架構,導致用戶通過語音與ChatGPT對話時,獲得的回答質量和速度均遜于文本模型。

為解決這一問題,OpenAI在過去兩個月內(nèi)完成了關鍵團隊整合。

在組織層面,今夏從Character.AI加入的語音研究員Kundan Kumar擔任音頻AI項目核心負責人。

產(chǎn)品研究主管Ben Newhouse正在重構音頻AI基礎設施,多模態(tài)ChatGPT產(chǎn)品經(jīng)理Jackie Shannon也參與其中。

報道援引知情人士稱,新音頻模型架構能夠生成更精準深入的回應,支持與用戶實時對話,并更好地處理對話打斷等復雜場景。

在硬件形態(tài)上,OpenAI與谷歌、亞馬遜、Meta 和蘋果的判斷相似:現(xiàn)有主流設備并不適合未來AI交互。

OpenAI 團隊希望用戶通過“說話”而非“看屏幕”與設備互動,認為語音才是最貼近人類交流本能的方式。

此外,與OpenAI合作硬件開發(fā)的前蘋果設計主管喬尼·艾夫強調,無屏幕設計不僅更自然,還有助于避免用戶沉迷。他在5月采訪中表示:

用戶習慣培養(yǎng)成關鍵挑戰(zhàn)

OpenAI面臨的主要障礙在于用戶行為。

據(jù)報道,多數(shù)ChatGPT用戶尚未養(yǎng)成語音交互習慣,原因包括音頻模型質量不足或用戶未意識到該功能存在。

要推出以音頻為核心的AI設備,公司需先培養(yǎng)用戶通過語音與AI產(chǎn)品互動的習慣。

此前報道顯示,OpenAI已在2025年初斥資近65億美元收購喬尼·艾夫聯(lián)合創(chuàng)辦的io,并同步推進供應鏈、工業(yè)設計與模型研發(fā)等多條工作線。首款設備預計至少還需一年時間才能面世。

這一時間表意味著OpenAI需要在產(chǎn)品發(fā)布前,通過改進現(xiàn)有ChatGPT語音功能來積累用戶基礎,并驗證音頻交互在日常場景中的實用性。

編 輯:章芳
飛象網(wǎng)版權及免責聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權所有,未經(jīng)允許禁止轉載、摘編及鏡像,違者必究。對于經(jīng)過授權可以轉載,請必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責。
3.如因作品內(nèi)容、版權和其它問題,請在相關作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內(nèi)容核實”、“商務聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
推薦閱讀
  • 謀篇2026:推進算力、網(wǎng)絡、安全與空天一體化協(xié)同發(fā)展

    2026年既是一個技術演進之年,也是產(chǎn)業(yè)生態(tài)重構之年。在這一年,產(chǎn)業(yè)將在AI算力、5G-A、空天地網(wǎng)絡與數(shù)據(jù)治理四大方向持續(xù)發(fā)力,并主導“十五五”乃至更長遠的數(shù)字未來。2025年12月25-26日,..[詳細]

  • 盤點2025 | 人工智能:破局前行、以智啟新,同赴人機共生新未來

    這一年里既延續(xù)著近年來的高速增長態(tài)勢,也迎來從野蠻生長向規(guī)范提質的深刻轉型。政策的持續(xù)加碼與技術的突破性進展,推動產(chǎn)業(yè)邁入規(guī);涞氐年P鍵階段,應用場景從少數(shù)領域向千行百業(yè)全面..[詳細]

  • 盤點2025|算力行業(yè):量質齊升的進階之路

    在數(shù)字經(jīng)濟加速滲透全球經(jīng)濟社會各領域的今天,算力已成為繼電力、水資源之后的關鍵生產(chǎn)要素,是支撐數(shù)字中國建設、推動高質量發(fā)展的核心基礎設施。算力的規(guī)模與質量直接決定了數(shù)字經(jīng)濟的發(fā)..[詳細]

  • “萬級”電池手機來襲 充電寶“很受傷”

    當市場還在熱議充電寶強制性認證改革帶來的行業(yè)洗牌時,手機廠商的技術突破已悄然改寫游戲規(guī)則。12月26日,榮耀正式推出搭載10000mAh超大容量電池的WIN系列機型,這也是行業(yè)內(nèi)首款實現(xiàn)量產(chǎn)的..[詳細]

  • 2025年度中國信息通信產(chǎn)業(yè)大事記

    歲末回眸,2025 年的中國信息通信業(yè)在時代浪潮中書寫下了濃墨重彩的篇章。作為 “十四五” 收官與 “十五五”起航的關鍵節(jié)點,中國通信人以創(chuàng)新為筆、政策為引,在技術突破與產(chǎn)業(yè)融合的賽道..[詳細]

精彩視頻

精彩專題

關于我們廣告報價聯(lián)系我們隱私聲明本站地圖

CCTIME飛象網(wǎng) CopyRight © 2007-2025 By CCTIME.COM

京ICP備08004280號-1 電信與信息服務業(yè)務經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號

公司名稱: 北京飛象互動文化傳媒有限公司

未經(jīng)書面許可,禁止轉載、摘編、復制、鏡像