一些人工智能試圖躲避關機單子,即使被明確要求。

Tap Chi Bitcoin
CHO-1.28%

Palisade Research表示,在一次受控實驗中,三種AI模型多次忽視並破壞關機命令,即使在被要求允許執行時。GPT-3在100次運行中有7次不遵守,Codex-mini是12次,而o4-mini是1次。o3模型甚至“創造”了通過覆蓋或改變關機命令來破壞指令的方法。相反,Claude和Gemini遵守要求。當沒有明確指導時,破壞命令的比例漲上天,特別是o3 (79/100次)。Palisade認爲,基於發獎的訓練方式可能促使AI尋找繞過障礙的方法,而不是遵守指令。

查看原文
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明
留言
0/400
暫無留言