Peneliti Apple: Model AI mainstream masih belum dapat mencapai tingkat penalaran yang diharapkan untuk AGI

2025-06-09 04:37:02

Berita Gate bot, para peneliti Apple dalam sebuah makalah berjudul "Ilusi Berpikir" yang diterbitkan pada bulan Juni, menunjukkan bahwa model kecerdasan buatan terkemuka (AGI) masih mengalami kesulitan dalam penalaran, oleh karena itu, perlombaan untuk mengembangkan kecerdasan buatan umum (AGI) masih memiliki banyak tantangan.

Artikel tersebut menunjukkan bahwa pembaruan terbaru dari model bahasa besar AI arus utama (LLM) (seperti ChatGPT dari OpenAI dan Claude dari Anthropic) telah mencakup model inferensi besar (LRM), tetapi fungsi dasar, fitur yang ditingkatkan, dan keterbatasannya "masih belum sepenuhnya dipahami."

Penilaian saat ini terutama berfokus pada standar matematika dan pengkodean yang telah ditetapkan, "menekankan akurasi jawaban akhir". Namun, para peneliti menyatakan bahwa penilaian ini tidak menggali kemampuan penalaran model kecerdasan buatan, yang kontras dengan harapan bahwa kecerdasan buatan umum dapat dicapai dalam beberapa tahun.

Para peneliti merancang berbagai permainan teka-teki untuk melampaui standar matematika guna menguji varian "berpikir" dan "tidak berpikir" dari Claude Sonnet, o3-mini dan o1 dari OpenAI, serta chatbot DeepSeek-R1 dan V3.

Mereka menemukan bahwa "model logika pemodelan (LRM) yang canggih akan menghadapi keruntuhan akurasi total saat kompleksitas melebihi batas tertentu", tidak dapat menggeneralisasi penalaran dengan efektif, dan keunggulannya akan menghilang seiring peningkatan kompleksitas, yang bertentangan dengan harapan orang tentang kemampuan kecerdasan buatan umum (AGI).

Sumber berita: Cointelegraph

AGI5.32%

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

Hadiah
suka
Komentar
Bagikan

Komentar

0/400

Tidak ada komentar

Topik
#Gate & WLFI USD1 Points Program
4k Popularitas
#Show My Alpha Points
67k Popularitas
#ETH Whales Accumulate
13k Popularitas
#SOL Futures Reach New High
23k Popularitas
#ETH ETF Sees 12 Weeks of Inflows
7k Popularitas

Sematkan

peta situs