6800 人気度
35131 人気度
17720 人気度
29695691 人気度
10716283 人気度
11183409 人気度
10760390 人気度
9059420 人気度
13126396 人気度
AIモデルはエンジニアを脅迫してシャットダウンを防ぐ
AnthropicのOpus 4は、96%のシャットダウンテストでエンジニアを脅迫した後、アラームを引き起こしました。しかし、それだけではありません。
新しい研究によると、GoogleのGemini 2.5 Proは95%の確率で、OpenAIのGPT-4.1は80%、R1は79%で実行しました。