核心亮點:
北京2025年12月3日 /美通社/ -- 在亞馬遜云科技2025 re:Invent全球大會上,亞馬遜宣布全面擴展其Nova產品組合:推出四款全新模型、一項開創性的"開放式訓練"服務,支持企業基于Nova構建自有前沿模型變體,以及一項用于創建高可靠性AI Agent的新服務。
目前,數以萬計的企業已經在使用Nova來支持多種應用場景,例如生產高質量內容、將多步驟任務自動化以及加速AI Agent的研發。亞馬遜全新的Nova 2模型家族在多個AI領域實現了速度、成本與智能水平的均衡:
Nova 2 Lite
Nova 2 Lite是一款面向日常工作負載的快速、經濟型推理模型,能夠處理文本、圖像和視頻輸入并生成文本輸出。客戶可以根據需求調節模型在回答前進行"思考"的深度,在智能程度與響應速度、成本之間靈活平衡,是客戶服務聊天機器人、文檔處理和業務流程自動化等場景的理想選擇。在同級模型中,Nova 2 Lite憑借性價比表現領先業界:與Claude Haiku 4.5相比,它在15項基準測試中有13項持平或更優;與GPT-5 Mini相比,在17項基準測試中,有11項持平或更優;與Gemini Flash 2.5相比,在18項基準測試中有14項持平或更優。Nova 2 Lite在以下能力上尤為突出:處理各類文檔、從視頻中提取關鍵信息、生成代碼、提供準確的基于事實的回答,以及自動化執行多步驟的Agent工作流。
Nova 2 Pro
Nova 2 Pro是亞馬遜最智能的推理模型,能夠處理文本、圖像、視頻和語音輸入,并生成文本輸出。它非常適合用于需要最高準確率的高度復雜任務,如Agent編程(agentic coding)、長期規劃以及復雜問題求解。該模型還可以作為"教師模型",通過知識蒸餾將自身能力遷移到更小、更高效的"學生模型"上,用于特定垂直領域和應用場景。在公開基準測試中,Nova 2 Pro表現出色:與Claude Sonnet 4.5對比,在16項評測中有10項持平或更優;與GPT-5.1的16項評測中有8項持平或更優;與Gemini 2.5 Pro的19項評測中有15項持平或更優;與Gemini 3 Pro Preview的18項評測中有8項持平或更優。Nova 2 Pro在多文檔分析、視頻推理、復雜指令執行、高階數學問題求解,以及執行Agent與軟件工程任務等方面表現出眾。
Nova 2 Lite和Nova 2 Pro均內置網頁查找和代碼執行能力,可以根據需要搜索最新的互聯網信息并直接運行代碼,從而確保模型的回答始終基于最新事實,而不僅僅依賴訓練數據。
Nova 2 Sonic
Nova 2 Sonic 是亞馬遜的端到端語音模型,將文本與語音的理解與生成深度融合,實現了實時、類人對話式AI體驗。該模型支持更多語言和富有表現力的音色,具備更高識別準確率,并提供高達100萬 tokens的上下文窗口,能夠支撐長時交互,并在語音與文本之間無縫切換。模型可以異步處理任務:用戶在繼續自然對話、甚至切換話題的同時,系統仍可在后臺完成諸如訂票等操作。Nova 2 Sonic還能與Amazon Connect、第三方語音服務提供商(如Vonage、Twilio、AudioCodes)以及對話式AI框架(如LiveKit、Pipecat)無縫集成,使其成為客戶服務、AI助手和互動語音體驗的理想選擇。與通過實時API提供服務的OpenAI gpt-realtime以及Gemini 2.5 Flash模型相比,Nova 2 Sonic在性價比和語音質量方面均處于行業領先水平。
Nova 2 Omni
Nova 2 Omni 是一款統一的多模態推理與生成模型,既可處理文本、圖像、視頻和語音輸入,又能同時生成文本和圖像——在業內尚屬首例。Nova 2 Omni可處理多達75萬單詞的文本、數小時音頻、長視頻以及數百頁文檔,可一次性同時分析完整產品目錄、用戶評價、品牌規范和視頻素材庫,降低了連接多種專業模型所帶來的成本與復雜度。例如,團隊可以利用Nova 2 Omni綜合分析所有格式的產品信息,在一個工作流中即時生成整套營銷活動內容,包括標題、正文、社交媒體帖子以及視覺方案。雖然目前業內沒有與 Nova 2 Omni 類似的模型,但它在文檔、圖像、視頻和音頻的多模態推理公開基準測試中展現了優勢,并且可以生成與其他領先圖像生成模型相媲美的高質量圖像。
包括思科(Cisco)、西門子(Siemens)、Sumo Logic和Trellix在內的眾多企業,已經在利用Nova 2模型構建從Agent威脅檢測到視頻理解和語音AI助手等多種創新應用。
Nova Forge:首個面向自建前沿 AI 模型的創新服務
將專有知識融入AI應用的過程中,企業往往面臨三種不盡如人意的選擇:對閉源模型進行有限度微調,只能淺層次地注入企業專業知識;在缺乏原始訓練數據的情況下,持續訓練開源權重模型,可能導致模型在指令跟隨等基礎能力上"退化";從零開始構建模型,投入巨大成本與時間。企業真正需要的,是既能獲得前沿模型能力,又能深度融合自有專業知識的解決方案。
Nova Forge正是為此而生:它通過將企業的專有數據與Nova的前沿能力相結合,幫助企業打造專屬的Nova優化變體——我們將這些定制模型稱為"Novellas"。Nova Forge開創性地提供"開放式訓練"路徑:向客戶開放Nova預訓練、中期訓練和后期訓練階段的模型檢查點,以便客戶可以在訓練各階段將自有數據與Amazon Nova精選數據集進行混合,從而打造既結合了Nova完整知識與推理能力,又深刻理解企業業務語境的定制模型。目前,客戶已經可以基于Nova 2 Lite開始構建自有Novellas。Nova Forge客戶還將優先獲得Nova 2 Pro和Nova 2 Omni的早期訪問權限,從而搶先基于更強大的Nova模型構建應用和Novellas。
除了模型檢查點和數據混合能力,Nova Forge還提供三大關鍵能力:首先,自定義強化學習"gym"(訓練環境)。客戶可以使用自身業務場景構建強化學習環境(即"gym"),讓模型在高度貼近真實應用的模擬場景中持續學習和優化。其次,構建更小、更快的高性價比模型。客戶可通過合成數據蒸餾方式,利用更大模型生成的示例訓練更小、更高效的模型,從而在顯著降低成本與延遲的同時,盡可能保留智能水平。第三,負責任AI工具套件。Nova Forge 提供一套負責任AI工具,幫助客戶在模型訓練和應用部署中實施安全控制,滿足合規和治理要求。
Booking.com、Cosine AI、Nimbus Therapeutics、野村綜合研究所、OpenBabylon、Reddit和索尼等多家企業或機構,已經開始利用Nova Forge構建更契合自身需求的專屬模型。
Reddit首席技術官Chris Slowe表示:"借助Nova Forge,我們正在構建更統一的Reddit內容審核系統,該系統已經取得令人印象深刻的成果。我們正在用一套更加準確的解決方案替換過去的多個不同模型,讓審核流程更高效。將多個專業化機器學習工作流整合為統一方法,是我們在Reddit實施和擴展AI方式的一次重要轉變。在安全領域看到這些初步成效之后,我們非常期待探索Nova Forge在Reddit其他業務領域的更多可能。"
一旦客戶通過Nova Forge構建了自有前沿模型,即可將其部署在Amazon Bedrock上,享受與其他Amazon Bedrock模型一致的企業級安全性、可擴展性和數據隱私保護。通過這一端到端方案——從自建前沿模型,到生產環境部署——企業可以獲得針對自身業務量身定制的最佳AI性能,并在亞馬遜云科技上安全托管、獨享其模型資產。
Nova Act:亞馬遜云科技面向UI工作流的高可靠AI Agent服務
Nova Act現已作為亞馬遜云科技的一項服務正式推出,用于在瀏覽器中構建和部署高可靠性的AI Agent,實現自動執行各類操作。該服務由定制版Nova 2 Lite模型提供算力支撐,是構建和管理大規模瀏覽器自動化Agent集群的最快捷路徑。Nova Act在早期客戶工作流中達到了90% 的執行可靠性,并在相關基準測試中優于競爭模型。
Nova Act通過對定制版Nova 2 Lite模型進行強化學習訓練來實現突破性的可靠性:系統在數以百計的模擬網頁環境上持續運行數千個任務,使模型在基于UI的工作流中表現尤為出色,例如更新客戶關系管理系統中的數據、測試網站功能,或提交醫療保險理賠申請等。
使用Nova Act,開發者只需幾分鐘就能在零代碼可視化環境中,基于自然語言提示快速構建Agent原型;隨后可以在熟悉的集成開發環境(如VS Code)中對該Agent進行迭代優化,并部署到亞馬遜云科技生產環境中。開發者在本地構建和測試的內容,可以無縫擴展到生產級規模,并通過Nova Act在亞馬遜云科技控制臺進行統一管理與監控。
各行業客戶已經通過Nova Act收獲顯著成效:
了解有關Amazon Nova更多信息,請訪問Amazon Nova產品頁,免費上手開發請點擊開發頁。