在云計算與人工智能領域,一場變革正悄然興起。亞馬遜云科技在備受矚目的AWS re:Invent大會上,圍繞AI Agent這一前沿熱點,發布了一系列創新服務與產品,為行業發展注入了新的活力,也為眾多企業探索AI應用帶來了全新思路。
AI Agent在標準化和短周期任務中已展現出強大的應用能力,而未來在長周期、復雜化任務領域也潛力無限,有望重塑眾多行業的業務模式、流程和組織架構。亞馬遜云科技CEO Matt Garman在大會上喊出“為什么不?”的口號,描繪出未來數十億AI Agent協同工作的壯觀場景,引發了現場觀眾的熱烈歡呼。作為云計算領域的頂級盛會,AWS re:Invent大會一直是前沿技術應用與探索的風向標,此次對AI Agent的深入探討與布局,無疑為行業發展指明了方向。
在AI基礎設施方面,亞馬遜云科技推出了AWS AI Factory這一重要服務。它旨在將專用的全棧AI基礎設施直接部署到客戶現有的數據中心內。該服務整合了NIVIDIA GPU、AWS Trainium芯片、高速低延遲網絡以及Amazon Bedrock和Amazon SageMaker等核心AI服務。與過去的Outposts等機架設備不同,AWS AI Factory是一個完整的全棧技術方案,涵蓋從芯片、基礎設施到AI模型、AI平臺的系列產品。用戶可利用自身設施、電力和網絡連接,由亞馬遜云科技負責部署、運維和生命周期管理,如同擁有私有AWS Region。這一服務意義重大,對于那些看重安全與合規性,又渴望快速部署和應用AI的行業用戶來說,提供了切實可行的大規模人工智能部署路徑。它屏蔽了AI基礎設施的復雜性,大幅縮短了部署周期,降低了運維管理難度,幫助用戶借助亞馬遜云科技的豐富經驗實現AI在本地的高效部署與應用。
AI芯片是當前市場的熱門話題,亞馬遜云科技在這一領域也是重要參與者。其Trainium芯片經過多年打磨迭代,實力不斷增強。此次大會上正式發布的Amazon EC2 Trn3 UltraServer,采用3nm Trainium3 AI芯片,單個UltraServer最多可擴展多達144個Trainium3芯片。與Trainium2相比,它可提供高達4.4倍計算性能、4倍能源效率和近4倍內存帶寬。在開源權重模型GPT - OSS等系列測試中,Trn3 UltraServer在推理響應速度、單芯片吞吐以及訓練與成本等方面均取得了業界領先的成績。該服務器專門為AI、混合專家模型和大規模強化學習等工作負載設計,針對訓練和企業在生產環境中的推理負載進行了優化。亞馬遜云科技還預覽了Trainium 4芯片,其計算能力將比Trainium 3提升八倍,內存帶寬也將大幅增加。除了自家芯片,亞馬遜云科技還推出全新P6e - GB300 UltraServers,采用GB300 NVL72平臺,GB300是NVIDIA目前最先進的AI芯片,主要針對生產環境中的萬億參數AI推理和高級推理模型。
去年大會上發布的多模態基礎大模型Nova系列,經過一年迭代創新,今年迎來了下一代Nova 2 Lite、Nova 2 Pro和Nova 2 Omni等系列模型。基準測試表明,Nova 2系列模型能力可與Claude 3.5、GPT - 4.5和Gemini Flash 2.5等模型媲美。對于行業用戶而言,構建新模型成本高昂,基于大模型結合自身數據訓練出更符合業務環境的模型是強烈需求。但企業在訓練或微調模型時面臨瓶頸,吸納專有數據越多,模型越容易“忘記”原始訓練數據,影響實際生產環境應用。為此,亞馬遜云科技推出了開創性的服務AWS Nova Forge,允許企業用戶基于Nova系列模型訓練和構建自己的AI模型。該服務提供對Nova模型預訓練、中期訓練和后期訓練階段檢查點的獨家訪問權限,用戶可在訓練早期階段注入專有數據,與精心挑選的數據集協同訓練,實現最佳訓練效果并確保模型不退化。AWS Nova Forge還具備多項強大功能和安全措施工具,助力企業以更低成本和更安全的方式創建與訓練模型。
如果說Nova Forge聚焦解決企業訓練和微調大模型的底層挑戰,那么Amazon Bedrock AgentCore則致力于讓Agent在生產環境中更好地發揮作用。AI Agent的運行和協作涉及眾多基礎模型和框架,以及各種協議和應用數據,在生產環境中應用需解決眾多底層問題。Amazon Bedrock AgentCore作為Agent平臺,旨在幫助企業用戶大規模、安全地構建、部署和運行高性能代理。利用該平臺,企業用戶可實現Agent跨工具和數據執行操作,支持廣泛的基礎模型和框架,并確保安全性和可靠性。此次大會上,Amazon Bedrock AgentCore功能進一步增強,推出了Amazon Bedrock AgentCore Policy和evaluations兩項新功能。Agent安全性挑戰巨大,尤其是在身份策略、安全操作、數據訪問等方面。Amazon Bedrock AgentCore Policy通過Agent運行的實時、確定性控制措施,確保組織未經授權的操作,為Agent設定清晰邊界,有效遏制未經授權的數據訪問、不當交互和系統級錯誤等。AgentCore evaluations則幫助企業了解Agent的行為和結果,簡化了確保Agent質量所需的復雜流程和基礎設施,開發人員還可使用自身偏好的大型語言模型和提示詞編寫自定義評估器。亞馬遜云科技還推出了Kiro、DevOps Agent、Security Agent、Quick等一系列Agent。
此次大會上,亞馬遜云科技一口氣發布了25項核心服務更新,涵蓋芯片、大模型到Agent平臺、工具等多個領域。在年收入達到1320億美元之際,其技術產品創新能力依然強勁。隨著AI Agent與場景的深度融合,亞馬遜云科技憑借全棧AI創新,有望推動用戶全面擁抱Agent的變革時代,為企業數智化轉型升級提供有力支持。















