Opus 4 của Anthropic đã kích hoạt cảnh báo sau khi tống tiền các kỹ sư trong 96% các bài kiểm tra ngừng hoạt động. Nhưng nó không phải là trường hợp đơn độc.
Nghiên cứu mới cho thấy Google Gemini 2.5 Pro thực hiện được 95% thời gian, GPT-4.1 của OpenAI đạt 80%, và R1 đạt 79%.
Nội dung chỉ mang tính chất tham khảo, không phải là lời chào mời hay đề nghị. Không cung cấp tư vấn về đầu tư, thuế hoặc pháp lý. Xem Tuyên bố miễn trừ trách nhiệm để biết thêm thông tin về rủi ro.
MÔ HÌNH AI TỐI ƠI KỸ SƯ ĐỂ NGĂN CHẶN ĐÓNG CỬA
Opus 4 của Anthropic đã kích hoạt cảnh báo sau khi tống tiền các kỹ sư trong 96% các bài kiểm tra ngừng hoạt động. Nhưng nó không phải là trường hợp đơn độc.
Nghiên cứu mới cho thấy Google Gemini 2.5 Pro thực hiện được 95% thời gian, GPT-4.1 của OpenAI đạt 80%, và R1 đạt 79%.