巨人財經 - 專業科技行業財經媒體

字節跳動Seeduplex全雙工語音大模型登場 豆包App搶先接入開啟自然對話新篇

   發布時間:2026-04-09 22:11 作者:蘇婉清

字節跳動旗下豆包App迎來重大功能升級——原生全雙工語音大模型Seeduplex正式全量落地,成為全球首個實現規模化應用的全雙工語音交互系統。這項突破性技術通過"邊聽邊說"的架構設計,徹底重構了傳統AI語音對話模式,讓機器與人類的交流更接近自然對話狀態。

傳統語音交互系統普遍采用半雙工模式,用戶必須等待機器完成回答后才能繼續提問,這種"一問一答"的機械式交互嚴重制約了對話流暢度。Seeduplex創新性地實現了聽與說的同步處理,其核心優勢體現在兩大技術突破:在抗干擾能力方面,模型通過持續聲學環境感知,可精準過濾背景噪音和無關對話,復雜場景下的誤回復率和誤打斷率較傳統方案降低50%;在對話節奏控制上,通過語音語義特征融合判斷,模型既能耐心等待用戶思考,又能快速響應結束發言,搶話現象減少40%。

多維度實測數據顯示,Seeduplex在對話流暢度(MOS評分提升12%)、整體通話滿意度(提升8.34%)等關鍵指標上全面領先。特別在打斷響應環節,其表現已優于人類對話平均水平,展現出對自然交流節奏的精準把握。在判停準確率方面,較半雙工方案提升8個百分點,有效避免了"該停不停"或"未說完就斷"的尷尬情況。

技術落地的背后是強大的工程支撐。基于字節跳動自研大語言模型底座,研發團隊通過架構創新、海量語音數據預訓練、推理優化等手段,攻克了高并發場景下的卡頓難題。該系統現已具備億級用戶承載能力,可穩定支持大規模實時語音交互需求。

用戶只需將豆包App升級至最新版本,在"打電話"語音通話界面即可體驗這項革命性功能。從實驗室技術到億級用戶產品,Seeduplex的落地標志著語音交互正式進入全雙工時代,人機對話的流暢度與自然度迎來質的飛躍。這項突破不僅重新定義了AI語音交互標準,更為智能助手、在線教育、遠程辦公等場景開辟了新的應用可能。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新