北京2025年12月5日 /美通社/ -- 亞馬遜云科技在2025 re:Invent全球大會上,宣布Amazon Bedrock與Amazon SageMaker AI推出模型定制全新功能,助力客戶構建更快速更高效的AI Agent。Amazon Bedrock中的Reinforcement Fine Tuning讓模型更容易根據特定場景進行調整并提升準確率。Amazon SageMaker AI將高級模型定制流程從數月縮短到數天,加速AI開發并更快推出新方案。
效率已經成為企業部署AI時的核心挑戰。盡管構建AI應用變得更容易,但在大規模環境中運行依然成本高昂且資源密集。這一挑戰對于AI Agent尤為明顯,因為Agent在執行推理、調用多種工具,以及協調多個系統時,推理負載更高。許多企業會選擇最強大的大模型來驅動Agent,但Agent的大部分時間實際上花在查日程、搜文檔等日常任務上,而這些任務并不需要高級智能。其結果就是:成本不必要地升高、響應速度變慢、資源被浪費。
解決方式在于定制化:使用更小、更專門化的模型來處理Agent最常執行的任務,以更低的成本提供更快、更準確的響應。但在此之前,強化學習等高級定制技術仍需要深厚的機器學習專業知識、大量基礎設施投入,以及數月的開發周期。
今天,亞馬遜云科技宣布Amazon Bedrock與Amazon SageMaker AI推出全新功能,使任何企業的開發者都能夠使用先進的模型定制技術。Amazon Bedrock中的Reinforcement Fine Tuning(RFT)強化微調功能,以及Amazon SageMaker AI基于強化學習的無服務器模型定制功能,簡化了構建高效AI的過程,基礎模型經過定制后,在速度、成本與準確率方面的表現均獲得顯著提升。通過降低這些新技術的獲取門檻,亞馬遜云科技能夠幫助各種規模的企業更輕松地構建適用于任意業務場景的定制化Agent。
借助Amazon Bedrock,讓普通開發者也能輕松使用RFT強化微調
復雜的定制技術長期以來阻礙了高效定制模型的構建。以強化學習為例,它通過人類或模型的反饋來訓練模型,獎勵正確行為,糾正錯誤行為。強化學習特別適合推理與復雜工作流,因為它獎勵的是"良好的過程",而不僅僅是"正確答案"。然而,強化學習需要復雜的訓練管線、大規模算力,以及昂貴的人類反饋或強大的AI模型來評估每一次輸出。
Amazon Bedrock中的RFT強化微調功能顯著簡化了模型定制流程,使任何企業的開發者都能使用這一技術。Amazon Bedrock是一項全托管AI平臺,向客戶提供來自領先AI公司的高性能基礎模型,并具備構建Agent與生成式AI應用所需的安全、隱私與負責任AI特性。使用RFT后,定制后的模型相比基礎模型,平均可獲得66%的準確率提升,使企業能夠依靠更小、更快、成本更低的模型實現更好效果,而無需依賴昂貴的大模型。
整個流程非常簡單。開發者只需選擇基礎模型,將其指向調用日志(也就是AI的歷史記錄),或上傳一個數據集;然后選擇獎勵函數 —— 基于AI、基于規則或使用預置模板。Amazon Bedrock的自動化工作流會從頭到尾完成微調過程。你不需要機器學習博士學位,只需要清楚業務場景中"好結果"是什么樣子。RFT在首批發布時將支持Amazon Nova 2 Lite模型,很快將會支持更多模型。
Salesforce與Weni by VTEX等客戶在使用Amazon Bedrock中的RFT強化微調功能后,準確率與效率均獲得顯著提升。Salesforce Agentforce軟件工程高級副總裁Phil Mui表示:"亞馬遜云科技基于Amazon Bedrock RFT的基準測試結果令人矚目,在我們特定業務需求中,相比基礎模型的準確率最高提升達到73%。我們期待在現有監督微調成果的基礎上進一步利用RFT,從而為客戶提供更加精準、更具定制化的AI解決方案。這一方式很好地補充了我們現有的AI開發流程,同時延續了Salesforce一貫嚴格的質量與安全標準。"
Amazon SageMaker AI將模型定制周期從數月壓縮至數天
對于需要更強AI工作流掌控力的團隊,可以轉向Amazon SageMaker AI。AI開發者傾向在定制場景選擇Amazon SageMaker AI,因為它能夠在大規模環境下提供構建、訓練與部署能力的完全控制權。
自2017年推出以來,Amazon SageMaker AI一直在加速并優化AI開發流程。但隨著越來越多企業希望使用更高級的定制技術,他們也需要更加流暢的體驗,以消除那些耗時數月的阻礙 —— 例如基礎設施管理、合成數據生成等,從而專注于為客戶開發更優的解決方案。因此,Amazon SageMaker AI現已提供新的無服務器模型定制功能,使模型定制可以在幾天內完成。
用戶可選擇兩種操作模式:以預覽形式推出的Agent引導模式,由Agent引導開發者完成整個模型定制流程;或者為希望自主掌控過程的開發者提供的自主引導模式。在Agent引導模式中,開發者只需用自然語言描述需求,Agent便會引導完成從合成數據生成到模型評估的全部過程。而需要更高靈活性和細粒度控制的開發者可以選擇自主引導模式,它無需管理基礎設施,同時提供選擇定制技術和調整參數所需的工具。
無論選擇哪種方式,開發者都可以使用多種高級定制技術,包括Reinforcement Learning from AI Feedback、Reinforcement Learning with Verifiable Rewards、Supervised Fine-Tuning以及Direct Preference Optimization。這些Amazon SageMaker AI的新功能將支持Amazon Nova以及廣受歡迎的開放權重模型,例如Llama、Qwen、DeepSeek和GPT-OSS,為客戶提供多樣化的選擇,以匹配不同的業務場景需求。
Collinear AI、Robin AI和Vody等客戶已經開始通過Amazon SageMaker AI的新功能簡化模型定制流程。Collinear AI是一家面向企業級生成式AI的模型優化平臺,通過Amazon SageMaker AI節省了數周時間。其聯合創始人Soumyadeep Bakshi表示:"AI模型微調對構建高保真模擬至關重要,而過去這需要把訓練、評估、部署等不同系統拼接在一起。現在,借助Amazon SageMaker AI新的無服務器模型定制能力,我們可以通過一種統一方式將實驗周期從數周縮短到數天。這一端到端的無服務器工具讓我們能夠專注于真正重要的事情:為客戶構建更高質量的訓練數據和模擬,而不是維護基礎設施或在不同平臺之間切換。"