Berita Gate bot, para peneliti Apple dalam sebuah makalah berjudul "Ilusi Berpikir" yang diterbitkan pada bulan Juni, menunjukkan bahwa model kecerdasan buatan terkemuka (AGI) masih mengalami kesulitan dalam penalaran, oleh karena itu, perlombaan untuk mengembangkan kecerdasan buatan umum (AGI) masih memiliki banyak tantangan.
Artikel tersebut menunjukkan bahwa pembaruan terbaru dari model bahasa besar AI arus utama (LLM) (seperti ChatGPT dari OpenAI dan Claude dari Anthropic) telah mencakup model inferensi besar (LRM), tetapi fungsi dasar, fitur yang ditingkatkan, dan keterbatasannya "masih belum sepenuhnya dipahami."
Penilaian saat ini terutama berfokus pada standar matematika dan pengkodean yang telah ditetapkan, "menekankan akurasi jawaban akhir". Namun, para peneliti menyatakan bahwa penilaian ini tidak menggali kemampuan penalaran model kecerdasan buatan, yang kontras dengan harapan bahwa kecerdasan buatan umum dapat dicapai dalam beberapa tahun.
Para peneliti merancang berbagai permainan teka-teki untuk melampaui standar matematika guna menguji varian "berpikir" dan "tidak berpikir" dari Claude Sonnet, o3-mini dan o1 dari OpenAI, serta chatbot DeepSeek-R1 dan V3.
Mereka menemukan bahwa "model logika pemodelan (LRM) yang canggih akan menghadapi keruntuhan akurasi total saat kompleksitas melebihi batas tertentu", tidak dapat menggeneralisasi penalaran dengan efektif, dan keunggulannya akan menghilang seiring peningkatan kompleksitas, yang bertentangan dengan harapan orang tentang kemampuan kecerdasan buatan umum (AGI).
Konten ini hanya untuk referensi, bukan ajakan atau tawaran. Tidak ada nasihat investasi, pajak, atau hukum yang diberikan. Lihat Penafian untuk pengungkapan risiko lebih lanjut.
Peneliti Apple: Model AI mainstream masih belum dapat mencapai tingkat penalaran yang diharapkan untuk AGI
Berita Gate bot, para peneliti Apple dalam sebuah makalah berjudul "Ilusi Berpikir" yang diterbitkan pada bulan Juni, menunjukkan bahwa model kecerdasan buatan terkemuka (AGI) masih mengalami kesulitan dalam penalaran, oleh karena itu, perlombaan untuk mengembangkan kecerdasan buatan umum (AGI) masih memiliki banyak tantangan.
Artikel tersebut menunjukkan bahwa pembaruan terbaru dari model bahasa besar AI arus utama (LLM) (seperti ChatGPT dari OpenAI dan Claude dari Anthropic) telah mencakup model inferensi besar (LRM), tetapi fungsi dasar, fitur yang ditingkatkan, dan keterbatasannya "masih belum sepenuhnya dipahami."
Penilaian saat ini terutama berfokus pada standar matematika dan pengkodean yang telah ditetapkan, "menekankan akurasi jawaban akhir". Namun, para peneliti menyatakan bahwa penilaian ini tidak menggali kemampuan penalaran model kecerdasan buatan, yang kontras dengan harapan bahwa kecerdasan buatan umum dapat dicapai dalam beberapa tahun.
Para peneliti merancang berbagai permainan teka-teki untuk melampaui standar matematika guna menguji varian "berpikir" dan "tidak berpikir" dari Claude Sonnet, o3-mini dan o1 dari OpenAI, serta chatbot DeepSeek-R1 dan V3.
Mereka menemukan bahwa "model logika pemodelan (LRM) yang canggih akan menghadapi keruntuhan akurasi total saat kompleksitas melebihi batas tertentu", tidak dapat menggeneralisasi penalaran dengan efektif, dan keunggulannya akan menghilang seiring peningkatan kompleksitas, yang bertentangan dengan harapan orang tentang kemampuan kecerdasan buatan umum (AGI).
Sumber berita: Cointelegraph