巨人財經 - 專業科技行業財經媒體

亞馬遜云科技re:Invent 2025:以創新為筆,繪就Agentic AI時代新藍圖

   發布時間:2025-12-09 18:19 作者:陳麗

在科技行業的激烈競爭中,亞馬遜云科技于近期舉辦的re:Invent全球大會上,憑借一系列創新成果,有力回應了外界對其創新步伐的質疑,展現出在AI時代持續領跑的強大實力。

在業務規模與穩定性方面,亞馬遜云科技交出了令人矚目的成績單。其年度經常性收入(ARR)高達1320億美元,占據全球37.5%的市場份額,成為全球數字經濟當之無愧的“公共底座”。每天處理超過2億次請求,存儲對象量突破500萬億個,這些數據充分彰顯了其在超大規模考驗下的穩定與可靠。對于尋求將關鍵業務AI化的企業而言,這種“基礎設施級”的保障至關重要。在Agent時代,AI應用將從實驗走向7x24小時不間斷的核心生產流程,唯有歷經如此大規模考驗的穩定性,才能成為企業業務發展的生命線。全球超過10萬家企業選擇亞馬遜云科技的AI平臺Amazon Bedrock,正是這種信任從傳統云時代向AI時代自然延伸的有力證明。

亞馬遜云科技對客戶復雜需求的深刻理解與尊重,體現在其開放的生態構建策略上。它沒有強迫客戶在自研模型與外界明星模型間做出單一選擇,而是通過Amazon Bedrock平臺,集成了來自17家廠商的數十款模型,涵蓋亞馬遜Nova、谷歌Gemini、OpenAI GPT以及中國DeepSeek、阿里千問、Kimi等。這種包容開放的姿態,向企業傳遞了一個明確信號:平臺的價值在于確保客戶的成功,而非推銷特定產品。企業無需押注于單一技術路線,可以自由組合、靈活演進,這種領導者胸襟為生態的繁榮發展奠定了堅實基礎。

此次大會上,亞馬遜云科技將核心主線明確指向All for Agentic AI。首席執行官Matt Garman在演講中反復提及“Agent”,將其定位為下一代應用的基本單元。他指出,AI Agent正引領AI發展邁向關鍵拐點,未來每家公司、每一個領域都將運行數十億個Agent。為支撐這一愿景,Matt Garman將企業落地AI的挑戰系統解構為四大支柱:AI基礎設施、模型生態、數據基座與開發者工具。這一完整的價值實現框架表明,亞馬遜云科技提供的不是孤立的技術,而是支撐Agent發展的全方位系統。

早在Agent概念尚未廣泛普及之時,亞馬遜云科技便已前瞻性地開始編織支撐其落地的四大支柱,在Agentic AI戰場率先構筑起系統競爭力。它所定義的Agent,并非簡單的聊天機器人式輔助,而是具備自主規劃、調用工具、跨會話記憶能力的下一代應用基本單元。這意味著云計算的經典三層架構將被“Agent + Token”取代,所有底層資源最終服務于Agent的7×24小時運轉。

為實現這一目標,亞馬遜云科技構建了一套層級分明、務實落地的完整能力棧。在底層,是承載Agent運行的AI基礎設施和模型生態;中間層,全新升級的Amazon Bedrock AgentCore作為關鍵性“構建工具”脫穎而出。這個被下載超過200萬次的SDK,致力于解決企業構建可信Agent的核心痛點——可控、可靠、可評估。它通過自然語言策略(AgentCore Policy)為Agent設置安全護欄,通過13個維度的自動化評估(AgentCore evaluations)持續監控表現,還創新性地賦予Agent“情景記憶”(Episodic Memory),使其能跨會話記憶上下文,像人類一樣持續學習。這些能力直擊企業“不敢讓AI自主行動”的顧慮,將Agent從實驗室玩具轉變為可托付關鍵任務的生產力。

面向垂直場景,亞馬遜云科技推出了開箱即用的Frontier Agents,展現了其戰略雄心。這些已經過內部大規模驗證的數字員工,能直接重塑軟件生命周期。例如,Kiro autonomous agent能夠理解宏觀目標,自主規劃、編碼、測試。一個原需30人18個月完成的重構項目,在Kiro輔助下,僅需6人76天即可完成。其標志性的“小幽靈”Logo,寓意著亞馬遜云科技產品從冰冷資源立方體向有溫度、懂協作伙伴的演進。Amazon Security Agent則將安全前置到設計與開發階段,自動審查代碼漏洞,將昂貴的滲透測試變為按需服務,多媒體巨頭Adobe借此確保全球營銷活動符合版權與品牌規范。Amazon DevOps Agent作為虛擬運維專家,能關聯復雜系統日志與數據,快速定位根因,推動系統自愈,實現運維向“系統自治”的轉變。這些Agent的發布,體現了亞馬遜云科技對Agent價值的深刻理解:釋放真正生產力,在于讓AI接管完整、跨工具、跨流程的復雜工作流,而非僅完成單一指令。

在算力支撐方面,亞馬遜云科技推出的自研芯片Trainium3成為驅動Agent帝國的關鍵引擎。當數以十億計的Agent7x24小時不間斷推理、規劃、執行,Token消耗呈天文數字增長,成本成為Agent規模化落地的首要障礙。Trainium3的戰略意義在于通過降低AI普及門檻,牢牢把握算力成本控制權。基于3nm先進制程,每兆瓦電力產生的Token數量是上一代的5倍,訓練成本最多可降低50%。這意味著運行同樣Agent工作負載,企業算力賬單可能減半甚至更低,對Agent大規模部署至關重要。其價值不僅體現在單顆芯片性能,更在于系統級工程。集成到Amazon Trainium3 UltraServer服務器中,單臺最多集成144顆芯片,總算力高達362 PFlops。通過定制的NeuronSwitch高速互聯技術,芯片間延遲壓至10微秒以下,構建出堪比“超級計算機”的緊密算力單元,專門優化Agent應用所需的長上下文、多模態推理及復雜工作流調度。這場成本革命對亞馬遜云科技具有雙重戰略意義:對內鞏固全棧AI競爭壁壘,自研芯片與自研模型(如Amazon Nova)深度協同,實現從硅到模型的端到端效率優化;對外提供極致性價比,讓客戶享受更低成本算力,同時與英偉達GPU共存策略兼顧尖端客戶需求與成本底線。

生成式AI的巨大變革,使云基礎設施站在重要十字路口。亞馬遜云科技實用計算高級副總裁Peter DeSantis認為,生成式AI對云基礎設施的挑戰集中在四個層面。首先是成本與效率的極限博弈,訓練大模型需數百億美元數據中心投資,運行推理成本更為驚人,迫使云提供商在架構設計各環節創新。其次是彈性邊界重新定義,推理工作負載行為模式與傳統計算不同,簡單推理請求包含預處理、解碼、后處理三階段,各階段對系統壓力類型各異。第三是AI應用對延遲敏感度更高,實時交互、視頻生成等場景要求毫秒級響應,而模型規模擴大和復雜度提升使低延遲處理海量請求成為難題。最后是安全與隱私要求更高,AI處理企業核心數據和個人隱私信息時,安全需貫穿數據生命周期每個環節,在共享云環境中確保模型權重和客戶數據絕對安全成為新技術門檻。

亞馬遜云科技圍繞底層硬件創新給出應對答案。自研芯片從消除虛擬化性能抖動的Amazon Nitro System起步,演進至為核心工作負載量身定制的Graviton處理器。新發布的Amazon Graviton5處理器將L2緩存翻倍,性能提升30%,基于其的M9G實例使Airbnb性能提升25%、SAP事務處理速度提升60%,蘋果等企業實測Swift應用遷移后性能升40%、成本降30%。面對AI推理負載,設計Mantle推理引擎,承認請求異質性,通過Bedrock服務層允許客戶根據實時、標準、后臺等不同緊迫性分配請求,實現資源智能調度。通過Journal持久化事務日志,使長時間推理任務故障或中斷后能從精確斷點恢復,結合動態調度策略讓模型微調等后臺任務與實時流量波谷錯峰運行,極大提升集群整體利用率與經濟效益。為釋放硬件潛力,同步升級Neuron開發者套件,NIKKI語言讓開發者進行底層內核優化,Neuron Explorer提供可視化性能分析與自動化調優建議。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新