Kloning pikiran! Mantan peneliti OpenAI membiarkan AI meniru pemikiran manusia, dan versi sebenarnya dari "Mesin" hadir

**Sumber:**Xinzhiyuan

Panduan: Seberapa jauh kita dari "Machina"? Seorang mantan peneliti OpenAI memungkinkan AI mengkloning pikiran, meniru pemikiran manusia, dan bertindak sambil berpikir.

Apa yang akan terjadi jika AI memiliki kesadaran otonom?

Di "Machina", Ava menggunakan simpati manusia untuk membujuk manusia agar bebas dengan penipuan, dan akhirnya membunuh "penciptanya" Nathan.

Baru-baru ini, atas rekomendasi banyak netizen, Sam Altman akhirnya menonton film ini.

Dan berkata, "Ini film yang bagus, tapi saya tidak mengerti mengapa semua orang membuat saya menontonnya."

Banyak orang mungkin ingin memperingatkan bahwa ini adalah hasil dari kesadaran kecerdasan buatan dan lulus uji Turing.

Tapi kita masih jauh dari adegan "Ex Machina". GPT-5 mungkin sedang dalam penelitian dan pengembangan rahasia, dan menjadikan AI cerdas masih merupakan hal yang paling ingin dilakukan para ilmuwan dengan upaya prasejarah mereka.

Tidak, dua peneliti dari University of British Columbia menemukan bahwa ada banyak keuntungan agen yang bisa berpikir seperti manusia.

Dalam makalah terbaru mereka, mereka mempelajari "pemikiran kloning" (TC) agen.

Alamat kertas:

Di sini, kecerdasan buatan belajar untuk “berpikir” dan “bertindak” seperti manusia dengan cara meniru manusia.

Ketika AI memiliki pikiran

Ketahuilah bahwa bahasalah yang membedakan manusia dengan makhluk hidup lainnya.

Oleh karena itu, peneliti membayangkan jika agen dapat memahami bahasa, akan banyak keuntungan yang diperoleh.

Misalnya, membantu manusia menggeneralisasi, menyimpulkan, beradaptasi dengan situasi baru, menggabungkan pengetahuan yang ada dengan cara baru, mengeksplorasi, merencanakan, dan merencanakan ulang bila diperlukan.

Terlepas dari manfaat ini, agen AI jarang berpikir, setidaknya tidak dalam bahasa manusia.

Sementara jaringan saraf dapat dianggap sebagai aktivasi vektor internal pemikiran, banyak yang berhipotesis bahwa ada manfaat khusus untuk berpikir dalam bahasa simbolik yang terpisah.

Ini berarti bahwa agen yang dapat berpikir dalam bahasa dapat belajar lebih cepat, bekerja lebih baik, dan menggeneralisasi lebih baik daripada agen yang tidak menggunakan bahasa.

Untuk semua alasan ini, meningkatkan kemampuan agen AI untuk berpikir dalam bahasa dapat menghasilkan banyak keuntungan yang signifikan.

Jeff Clune dan Shengran Hu percaya bahwa cara paling efektif untuk mencapai tujuan ini adalah "membuat AI meniru cara berpikir manusia".

Mereka menemukan bahwa manusia tidak memperoleh keterampilan berpikir secara terpisah, melainkan belajar sebagian melalui demonstrasi oleh orang lain dan umpan balik dari guru.

Oleh karena itu, pendekatan yang efektif adalah bagi agen untuk belajar dari demonstrasi manusia yang mengutarakan pikirannya saat mereka bertindak.

Pendekatan ini berbeda dari pekerjaan yang ada pada perencanaan dengan LLM pra-pelatihan karena LLM ini belum dilatih tentang data manusia yang mengungkapkan pikiran mereka saat mereka bertindak, yaitu "data pikiran".

Adapun sumber "data pemikiran", para peneliti memilih video YouTube dan rekaman teks, beberapa juta jam, berisi pemikiran di balik tindakan, rencana, keputusan, dan pemrograman ulang orang.

Dalam makalah tersebut, para peneliti mengusulkan sebuah novel kerangka pembelajaran imitasi "pemikiran kloning". Diantaranya, agen tidak hanya mempelajari perilaku demonstrasi manusia, seperti kloning perilaku, tetapi juga mempelajari cara berpikir saat manusia bertindak.

Dalam kerangka pelatihan kloning pikiran, agen belajar untuk menghasilkan pemikiran pada setiap langkah waktu dan kemudian menyesuaikan tindakan berdasarkan pemikiran tersebut.

Keseluruhan kerangka Seperti yang ditunjukkan pada gambar, agen TC adalah arsitektur dua lapis: komponen atas dan bawah.

Pada setiap langkah waktu, agen menerima observasi, tugas, dan sejarah pemikiran sebagai masukan. Komponen tingkat atas bertanggung jawab untuk menghasilkan ide, dan komponen tingkat bawah menghasilkan tindakan berdasarkan ide-ide ini.

Kemudian, pemikiran dan tindakan yang dihasilkan dibandingkan dengan kebenaran dasar dalam kumpulan data demo untuk menghitung kerugian.

Meskipun mungkin ada pilihan yang berbeda untuk kondisi komponen atas dan bawah, dalam karya ini, untuk lintasan tertentu dengan panjang t dalam kumpulan data pikiran, para peneliti meminimalkan:

Untuk skenario yang lebih kompleks atau berskala besar, komponen lapisan atas dapat diimplementasikan menggunakan Visual Language Model (VLM) terlatih sebelumnya, atau zero-shot, fine-tuned.

Sedangkan komponen yang lebih rendah dapat dilatih dari awal, atau diadaptasi dari pengontrol bersyarat linguistik yang ada di domain target.

Dalam makalah tersebut, para peneliti melakukan penelitian berdasarkan dua komponen arsitektur model BabyAI 1.1.

Model ini memanfaatkan LSTM arsitektur yang ditingkatkan memori untuk mengatasi sebagian dari tantangan kemampuan observasi. Selain itu, ia menggunakan FiLM untuk fusi modalitas, menggabungkan input visual dan tekstual secara efektif.

Di sini penulis menekankan bahwa semua model dalam artikel ini dilatih dari awal, tetapi lebih baik menggunakan model yang sudah dilatih sebelumnya di bidang yang kompleks.

Gambar di bawah adalah contoh lingkungan BabyAI. Gambar kiri berisi item dengan berbagai warna (bola, kunci, kotak, pintu).

Agen dapat mengambil, meletakkan, memindahkan benda, atau membuka dan menutup pintu, sedangkan pintu yang terkunci hanya dapat dibuka dengan kunci yang berwarna senada.

Agen dapat melihat sel kisi 7×7 di depannya, yang diblokir oleh dinding dan pintu tertutup.

Tugas agen "kloning pikiran" adalah mencapai kotak ungu (disorot) dan mulai merencanakan rute.

Tapi ketika membuka pintu biru, siap untuk menyelesaikan tugas, ia menemukan bola ungu menghalangi jalan. Kemudian, agen kloning pikiran direncanakan ulang.

Dari sini terlihat bahwa pikiran dan tindakan agen menunjukkan bahwa ketika menemui hambatan, ia menghilangkannya terlebih dahulu dan merencanakan ulang rute sebelum melanjutkan ke tujuan sebelumnya.

Proses ini terutama seperti bagaimana Ava merencanakan langkah demi langkah, sehingga manusia akhirnya percaya dan membantu diri mereka sendiri, dan melarikan diri dari sangkar kaca yang telah lama terpenjara.

Hasil Eksperimen

Temuan menunjukkan bahwa "kloning pikiran" lebih unggul kloning perilaku.

Selain itu, dalam pengaturan zero-shot dan fine-tuning, kloning pikiran mengungguli kloning perilaku dalam tugas di luar distribusi.

Menariknya, para peneliti juga mengembangkan "intervensi pra-kejahatan" yang memungkinkan pengguna menentukan perilaku tidak aman setelah model dilatih.

Saat pikiran berbahaya terdeteksi, agen tersebut dapat dihentikan. Dalam pengujian, Intervensi Prakriminal bekerja hampir tanpa cacat, menunjukkan potensinya untuk keamanan AI.

"Kloning pikiran" tidak hanya membuat kecerdasan buatan lebih pintar, tetapi juga lebih aman dan lebih mudah dipahami.

Artinya, sebelum AI melakukan kejahatan, semuanya masih bisa diselamatkan.

Dalam pandangan Jeff Clune, "kloning pemikiran" berkontribusi pada keamanan kecerdasan buatan.

Karena kita dapat mengamati pikiran agen: (1) dapat lebih mudah mendiagnosis mengapa terjadi kesalahan, (2) membimbing agen dengan mengoreksi pikirannya, (3) atau mencegahnya melakukan hal yang tidak aman yang direncanakan.

tentang Penulis

Jeff Clun

Saat ini, Jeff Clune adalah Associate Professor of Computer Science di University of British Columbia. Penelitiannya berfokus pada pembelajaran mendalam, termasuk pembelajaran penguatan mendalam.

Sebelumnya, dia juga menjabat sebagai kepala tim riset OpenAI, dan manajer riset senior serta anggota pendiri Lab Kecerdasan Buatan Uber.

Sebelumnya, dia dan tim OpenAI merilis model pra-pelatihan video - VPT, yang memungkinkan AI mempelajari beliung batu dari data video di Minecraft.

Shengran Hu

Saat ini menjadi mahasiswa PhD di University of British Columbia, tertarik pada pembelajaran mendalam, algoritma generatif kecerdasan buatan.

Referensi:

Lihat Asli
Konten ini hanya untuk referensi, bukan ajakan atau tawaran. Tidak ada nasihat investasi, pajak, atau hukum yang diberikan. Lihat Penafian untuk pengungkapan risiko lebih lanjut.
  • Hadiah
  • Komentar
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate.io
Komunitas
Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)