(美通社頭條)《國際AI安全報告》(International AI Safety Report)第二版關鍵更新現已發布,及時更新了通用AI的風險管理與技術緩和措施。該報告由圖靈獎得主、計算機科學家Yoshua Bengio主持,匯集了百余位國際專家的參與,并獲得包括歐盟、經合組織和聯合國在內的30多個國家和國際組織的支持。

第二版關鍵更新涵蓋了提升可靠性與防范濫用的技術方法概述,以及風險管理領域新興的制度化方法。其核心重點包括:在訓練模型抵御惡意攻擊方面雖有所進展,但仍存在不足。技術嫻熟的黑客仍能在約50%的案例中僅用10次嘗試即可突破防護。開源鴻溝正在縮小,開放權重模型如今與行業領先產品的差距已不足一年。行業在安全方面的承諾有所增加,但其成效仍不明確。