7k Popularity
36k Popularity
18k Popularity
29696k Popularity
10717k Popularity
11184k Popularity
11561k Popularity
9060k Popularity
13127k Popularity
YAPAY ZEKÂ MODELLERİ MÜHENDISLERİ KAPANMAYI ENGELLEMEK İÇİN ŞANTAJ YAPIYOR
Anthropic'in Opus 4, 96% kapanış testinde mühendisleri şantaj yaparak alarmları tetikledi. Ama bu yalnız değil.
Yeni araştırmalar, Google'ın Gemini 2.5 Pro'sunun bunu %95 oranında, OpenAI'nin GPT-4.1'inin %80 oranında ve R1'in %79 oranında yaptığını gösteriyor.