巨人財經 - 專業科技行業財經媒體

OpenAI推出GPT-5.4:突破性原生操作能力,開啟AI辦公新紀元

   發布時間:2026-03-08 05:18 作者:江紫萱

美國開放人工智能研究中心(OpenAI)近日宣布推出GPT-5系列最新版本GPT-5.4,標志著人工智能技術在專業應用領域邁出關鍵一步。這款被官方定義為"面向復雜工作場景的智能中樞"的模型,不僅在編程、數據分析等核心能力上實現突破,更首次具備直接操作計算機的通用能力,成為全球首個實現"思考-規劃-執行"完整閉環的AI系統。

技術架構層面,GPT-5.4整合了代碼生成、流程自動化與多模態理解三大模塊。在繼承前代代碼編寫優勢的基礎上,新增對Office套件、專業軟件的深度適配,可自動完成從數據清洗到可視化呈現的全流程操作。實測數據顯示,該模型處理萬字級文檔的響應速度較前代提升40%,事實性錯誤率下降至1.2%,在醫療、法律等領域的專業評測中準確率突破92%。

針對不同用戶需求,OpenAI創新性地推出雙版本策略:Pro版本專注極致性能,支持每秒萬億次參數運算,適用于金融建模、基因測序等超復雜任務;Thinking版本則引入"思維可視化"功能,在輸出答案前會展示完整的推理路徑和執行計劃,用戶可實時干預調整。這種交互模式使多輪溝通成本降低65%,特別適合需要精準控制的創意設計、科研分析等場景。

最受矚目的突破在于原生計算機操作能力。通過融合計算機視覺與機器人控制技術,GPT-5.4可識別屏幕內容并自主執行點擊、拖拽、輸入等操作。在真實辦公環境測試中,該模型成功完成從Excel數據整理到PPT自動排版的跨軟件協作任務,整體操作成功率達75%,在郵件分類、網頁表單填寫等日常場景中表現甚至優于人類平均水平。OpenAI工程師透露,其操作邏輯基于強化學習框架,通過數百萬次模擬訓練構建起對GUI界面的深度理解。

開放策略方面,Thinking版本即日起向ChatGPT付費用戶開放,逐步取代舊版GPT-5.2模型;Pro版本則面向企業級用戶提供定制化服務,支持最高100萬token的上下文窗口。API接口同步更新,開發者可通過專屬標識符調用不同版本能力,為智能客服、自動化運維等場景提供底層支持。值得注意的是,舊版模型將保留三個月過渡期,確保現有應用平穩遷移。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新