華爾街的分析師們還是有些“功底”的。在 2025 亞馬遜云科技 re:Invent 開幕前,奧本海默重申對亞馬遜的“跑贏大盤”評級,并強調亞馬遜云科技藏有“黃金機會”;摩根大通判斷亞馬遜云科技的需求趨勢依然健康,并預計 2026 年將迎來加速增長。
這些判斷的一個重要背景就是,一年一度的“云計算春晚”又來了。當亞馬遜云科技再次拿到行業敘事的“麥克”,云計算的演進主線被定義得更加具體——這一次,亞馬遜云科技 CEO Matt Garman 在 Keynote 上的所有發布,幾乎都是圍繞 Agentic AI 的落地展開。縱觀整個 2025 所有來自云計算巨頭的發布會,如此堅決的聚焦與定調十分罕見。
Matt Garman 認為要落地 Agentic AI,并“實現完整 AI 能力”,需要四大關鍵支柱:AI Infra、模型生態、數據基座以及開發者工具。
圍繞這四個方向,亞馬遜云科技帶來一系列重量級新品與功能增強。包括 Amazon Trainium3 UltraServers 和最新 AI 芯片 Amazon Trainium4,第二代自研大模型 Amazon Nova 2 系列,承載“開放訓練模型”(Open Training)概念的數據基座 Amazon Nova Forge,以及在開發者工具層面 Amazon Bedrock AgentCore 的系列更新,All For Agentic AI。
實際上,亞馬遜云科技自身就是 Agentic AI 的頭部玩家——三個 Frontier Agent 作為重頭戲被陸續發布,包括能自主處理復雜編碼任務、深度集成開發流程的 Kiro Autonomous Agent,主動掃描漏洞、將滲透測試轉為按需服務的 Amazon Security Agent,以及能夠自動診斷并預防故障、先于工程師響應的 Amazon DevOps Agent。
不過即便是 Matt Garman,在準備演講內容時也會“糾結”:兩個半小時看似很長,但對這家云計算和 AI 巨頭來說,還是太短了,畢竟,它們每年有太多新產品、新發布。所以這次,在 Agentic AI 成為主基調的 2025 亞馬遜云科技 re:Invent 上,Matt Garman 將傳統計算、存儲、數據庫這些核心云服務,壓縮到了最后的十分鐘快閃發布中,并一口氣帶來了 25 個更新。算下來,每項更新的發布時間只有 24 秒。
總的來說,這場 Keynote 依舊保持了 re:Invent 重頭戲應有的水準,但對行業而言,當云計算一哥在一場持續 2 個多小時、總計 20246 個詞匯的演講中,提到了 199 次 Agent 時,其對 Agentic AI 的重視已不用更多言明。而在一年前,Agent 一詞僅僅出現了 45 次。這也傳遞出一個重要信號:時代真的變了。
1構建 Agent 必備的 AI Infra,仍在快速迭代
Agentic AI 落地首先要回答的問題就是,如何構建 AI Infra。在 2025 亞馬遜云科技 re:Invent 開幕前,整個市場都在屏息以待其自研 AI 芯片Amazon Trainium 的最新進展。其中的一大重要原因就是,Amazon Trainium 不僅是一顆芯片,也是亞馬遜云科技構建 AI Infra 護城河最重要的“勝負手”。
亞馬遜 CEO Andy Jassy 在上個月的財報電話會議上透露,Amazon Trainium 系列芯片目前已發展成為一個價值數十億美元的核心業務,季度環比增長 150%。Matt Garman 在本次 Keynote 中亦強調,Amazon Trainium2 是亞馬遜云科技迄今部署速度最快的 AI 芯片,銷售速度幾乎和產能齊平。
消息面上,10 月底,亞馬遜云科技建造的 Project Rainier 核心數據中心已全面投入運行,這一超級集群配備近 50 萬顆 Amazon Trainium2 芯片,目前正為 Anthropic 訓練 Claude 大模型。到今年年底,該集群的 Amazon Trainium2 芯片數量預計翻番至 100 萬顆。
可以說,以 Amazon Trainium 系列芯片為中心的算力底座,早已成為亞馬遜云科技 AI 戰略的核心。而圍繞著 Amazon Trainium 系列芯片的迭代更新,也被早早寫到了日歷本中——去年,亞馬遜云科技就宣布正在開發下一代芯片 Amazon Trainium3,目標是讓 AI 負載更高效、更快速且更具成本優勢。
在 2025 亞馬遜云科技 re:Invent 上,亞馬遜云科技宣 AmazonTrainium3 UltraServers 正式全面可用。據悉,Amazon Trainium3 專為密集型和專家級并行工作負載而設計,支持高級數據類型(MXFP8 和 MXFP4),并優化了內存與計算資源的平衡,以應對實時、多模態和推理任務。每顆 AmazonTrainium3 芯片提供 2.52 千萬億次浮點運算(PFLOPs)的計算能力,內存容量比 AmazonTrainium2 提升 1.5 倍,帶寬提升 1.7 倍,達到 144 GB HBM3e 內存和 4.9 TB/s 內存帶寬。