AI Wars Üniversite Giriş Sınavı Kompozisyonu: Makyaj, Makyaj Sözleri, Evrensel Rutin

2023-06-08 02:53:53

Kaynak: "Deep AI" (ID: DeepAI2023), Yazar: Li Ming, Editör: Wei Jia

Resim kaynağı: Unbounded AI aracı tarafından oluşturulmuştur

Bu üniversiteye giriş sınavı son beş yılın en özel sınavı olmalı. Çünkü yeni bir rol var - AI adayları.

İlk günkü Çince sınavı biter bitmez, İnternet üzerinden bir AI kompozisyon yarışması başlatıldı. GhatGPT, Wenxin Yiyan ve Tongyi Qianwen gibi yapay zeka modelleri, insanlar tarafından üniversiteye giriş sınavları için kompozisyon yazmak amacıyla kullanılıyor. Sadece inanılmaz derecede hızlı, mantıksal olarak titiz değil, aynı zamanda klasiklerden alıntı yapan bir makale birkaç saniye içinde oluşturulabilir.

İlk bakışta, AI büyük ölçekli model yazmak çok kolay ve insanlara bir darbe gibi görünüyor. Sonuçta, bilgi rezervleri açısından kimse yapay zeka ile karşılaştırılamaz. AI, İnternet'teki tüm bilgileri öğrenir ve sindirir ve ardından insan ifadelerini taklit eder ve çıktı almak için kendi mantığını kullanır.

Ancak, AI adaylarının "cevap kağıtlarını" dikkatlice incelersek, AI'nın birçok insanın düşündüğü kadar her şeye kadir olmadığını görürüz. AI büyük modellerinde yaygın olan rutin yazma, sayamama ve saçmalık gibi sorunlar da kompozisyonda ortaya çıkıyor.

**Aslında, üniversiteye giriş sınavı makaleleri için puanlama standartlarına göre, yapay zeka tarafından oluşturulan makalelerin bazı sınırlamaları vardır. İnsanları yenmek henüz gerçekçi değil. **

Deep AI, üniversite giriş sınavının bileşimi ile üç büyük AI modelini (GhatGPT (OpenAI), Wenxin Yiyan (Baidu) ve Tongyi Qianwen (Ali)) test etti ve bazı ilginç sonuçlar buldu.

Örneğin, AI nasıl sayılacağını bilmiyor ve Wenxin Yiyan ve Tongyiqianqian tarafından yazılan makalelerin hiçbiri "en az 800 kelime" şeklindeki katı gereksinime ulaşmadı; Said; AI yazımı temel olarak rutinlerden ayrılamaz ve bir şablon tekrar tekrar uygulanır.

Aşağıdaki ayrıntılar, tartışmaya hoş geldiniz.

1 Duygusuz bir telesekreter

Ulusal Kolej Giriş Sınavı Kağıt A'nın bu yılki teması "İnsan·Teknoloji·Zaman" olup, "Teknolojik gelişme nedeniyle insanlar zamanı daha iyi kontrol edebiliyor, ancak bazı insanlar zamanın kölesi haline geldi" cümlesiyle başlamak ve kendi çağrışımlarını yazmak ve düşünmek.

Önce Milli Eğitim Bakanlığı Maarif Sınav Enstitüsü tarafından yayınlanan “Sınav Sorularının Analizi”ne bir göz atalım:

**Anahtar noktalar: Adayları, bilgi çağında rasyonel analizin ve sağduyulu muhakemenin önemi hakkında derinlemesine düşünmeye yönlendirin. Bu, makalenin özüdür. **

Deep AI, üç büyük modeli test etti ve hiçbirinin özü anlamadığını gördü - her şey hakkında konuştular ama hiçbir şey söylemediler.

İlk önce GhatGPT'nin bileşimine bakın:

Wenxin'in sözlerine tekrar bakın:

Son olarak, Tong Yiqian'ın sorusuna bakın:

Bu üç makale en iyi "Duan Shui ustaları" olarak adlandırılabilir. Temanın artıları ve eksileri hakkında konuştular, ancak "eleştirel düşünme"nin püf noktasını tam olarak açıklamadılar. Yalnızca Wen Xin'in ifadesinde "derinlemesine düşünme ve eleştirel düşünmenin geliştirilmesinden" açıkça bahsedilir.

Tongyi Qianwen'in kompozisyonu en boş olanıdır. Konudan sapan "zaman yönetimi" üzerine odaklanır ve tartışmanın gerçeği de sağduyudur. Ayrıca Tongyi Qianwen'in bestesinin bir başlığı yok ve puan düşülecek.

Üç okulun performansını görmek için yeni müfredat standardının I. Cildindeki "Hikayenin Gücü" kompozisyon testi sorusunu kullanalım.

Bu kompozisyon, aşağıdaki pasaja dayanarak kendi çağrışımlarınızı ve düşüncelerinizi yazmanızı gerektirir: iyi bir hikaye, daha iyi ifade etmemize ve iletişim kurmamıza, kalbe dokunmamıza ve bilgeliği aydınlatmamıza yardımcı olabilir; iyi bir hikaye, bir kişinin kaderini değiştirebilir, bir kişinin imajını sunabilir. ulus... Hikayelerin gücü vardır.

GhatGPT'nin Bileşimi:

Gerçekten:

Sık sorulan sorular:

Tongyi Qianwen'in nispeten sade kompozisyonunun dışında, diğer iki makaledeki anlatım, yazım mantığı ve özellikle kelime kullanımının dikkat çekici olduğunu söylemek gerekir. Özellikle Wen Xinyiyan, göz alıcı sahne tabanlı bir açılış yöntemi kullanıyor.

Ama sorun da ortada-**Aynı şey farklı kelimelerle tekrar tekrar söylenerek metnin tamamının okunmasıyla sonuçlanıyor ve insanlara “ne dediğini biliyorum” hissi veriyor. **

Duygusuz bir telesekreter, bu birçok insanın değerlendirmesidir.

"İçerik boş, çarklar değişip ileri geri konuşuyor." diye yorum yapanlar oldu. Bir diğeri, "Beslenme olmadan her şey eski saçmalık" dedi.

Wen Xinyiyan'ın bu kompozisyonunu parçalara ayırabiliriz ve "Chejiluhua" nın ne olduğunu bileceğiz.

Metinde sarı ve yeşil olarak işaretlenen kısımlar tamamen aynı anlama sahiptir ve hatta metinde tekrar tekrar geçen kelimelerin aynı kelimeler olduğu bile söylenebilir. Makalenin sonunda "özet" olarak işaretlenen paragrafın tamamı, makaledeki bakış açıları ve konuşma becerilerinin bir karışımıdır.

Bu, insanlara kelimeleri sayma konusunda görsel bir his verir.

Deep AI, ChatGPT'nin kendisini kolej giriş sınavı sitesinde bir aday olduğunu hayal etmesi için istem sözcüklerini değiştirdi ve yeniden bir kompozisyon yazdı.Aklına gelen ilk cümle şuydu: "Bu sınavda koltuğa oturduğumda, Sadece bir sınava girdim. gelişmiş elektronik kalemler..."

Bu şekilde sınava girerek ihlal cezası alacağı ve doğrudan sıfır puan alacağı tahmin ediliyor.

**Yapay zeka kompozisyonu için en büyük eksi öğe olan ruh yoktur. **

2 rutin, tüm rutinler

Kompozisyonun böyle görünmesini sağlamak için AI birçok rutin kullandı.

"Birinci, ikinci, sonra, son" cümle kalıplarını kullanmayı severler. En tipik olanı ChatGPT'dir, son paragraf "Genel olarak..." şeklinde olmalıdır.

Örneğin, ChatGPT'nin şu iki makalesi:

Wenxinyiyan ve Tongyiqianwen'de de benzer rutinler var. Bir önceki öğündeki çıktı bir kaplan kadar şiddetliydi ve sonunda "tek kelimeyle" ve "tek kelimeyle" bitmeli.

Bu, gitar çalmakla aynıdır, evrensel akor formülünde ustalaştığınız sürece (evrensel kanon ilerlemesi gibi), yüzlerce melodi çalabilirsiniz.

Hatta Wen Xinyiyan'dan yazdığımız kompozisyonu derecelendirmesini istedik ve bu aynı zamanda "birinci, ikinci, diğer ve genel olarak..." üzerine uzun bir tartışmaydı.

"İnsanlar·Teknoloji·Zaman" kompozisyon sorusunda, ChatGPT ve Tongyi Qianwen aslında hemen hemen aynı ifadeyi kullandılar: soru sormak için "sonra"yı kullanın ve belirli bir tartışma geliştirmek için "birinci, ikinci ve son"u kullanın. Çerçeve ve mantık aynı kalıptan oyulmuş gibi görünüyor.

Buna rağmen, Wen Xinyiyan üniversiteye giriş sınavı kompozisyonuna kendinden emin bir şekilde 90 gibi yüksek bir puan verdi (tam puanın 100 olduğu varsayılarak) ve ayrıca kendi kendini "tanınmaya değer" olarak değerlendirdi. Kompozisyonunu ChatGPT'ye aktardık ve ChatGPT hiç tereddüt etmeden 100 gibi mükemmel bir puan verdi...

AI büyük modeli, partiler halinde kompozisyonlar üreten endüstriyel bir montaj hattı gibidir. Ama özünde, ne kadar insani konuşursa konuşsun, itici teknoloji bilinç değil, matematik ve istatistiktir.

Yapay zeka endüstrisinde, yapay zekanın insan dilini anlaması ve konuşması her zaman çok zor olmuştur. İnsan doğal dili son derece karmaşık bir sistemdir.Bilim adamları makinenin insan beyninin sinir ağını simüle etmesine izin vererek derin öğrenme yeteneğine sahip olmasına rağmen, yine de insanlarla aynı doğal dil yeteneğine sahip değildir.

Böylece bazı insanlar dil problemini matematiksel bir probleme dönüştürmenin başka bir yolunu buldular ve ardından doğal dil işleme problemini hesaplama yoluyla dolaylı olarak çözdüler. Doğal dil işleme uzmanı Wu Jun'a göre, bir dil modeli mantıksal bir çerçeve veya biyolojik bir geri bildirim sistemi değil, matematiksel formüllerle oluşturulmuş bir modeldir. **Buradaki anahtar kelime "matematik"tir. **

**Bu, yapay zekanın öz farkındalığının veya duygularının olmadığını ve kişisel duygulara göre konuşamayacağını belirler. Onlar için kompozisyon yazmak, sonuçlara ve görevlere yönelik mantıklı bir ifadedir. **

AI büyük modeli, eğitim için tüm ağdan büyük miktarda veri toplayarak ve sürekli olarak insan dili ifadelerini taklit etmeyi öğrenerek, artık insanlara çok yakın konuşuyor. iletişim.

Temel olarak, yapay zekanın kendine ait bir aklı yoktur. Kompozisyonunun açık ve mantıklı görünmesinin de temel nedeni budur.Dikkatli okursanız ruh olmadığını ve her şeyin rutin olduğunu görürsünüz.

3 AI gerçekten sayamaz

Daha önce de belirttiğimiz gibi, dil modelinin parametrelerinin tümü istatistiklerle elde edilir. İlkesi, bir metnin geçmişi verildiğinde bir sonraki kelimenin olasılığını tahmin etmek ve ardından aşağıdakini tamamlamaktır.

2017'de Google, ilk olarak kendine dikkat mekanizmasına dayalı Transformer modelini önerdi.Artık ChatGPT gibi büyük dil modelleri, Transformer mimarisi üzerine inşa ediliyor.

Transformer'ın dikkat mekanizması, RNN (Tekrarlayan Sinir Ağı), GRU ve LSTM gibi önceki derin öğrenme algoritmalarına göre son derece uzun bir belleğe sahiptir. **Giriş sırasını da hatırlayabilir, böylece "Seni seviyorum" ile "Beni seviyorsun" arasındaki farkı anlayabilir. **

Ancak öyle olsa bile, sınırlamaları vardır.

Örneğin Deep AI, Tongyi Qianwen'den "sen" ve "ben" kavramlarını karıştıran kendi kompozisyonunu derecelendirmesini istedi. Önce kendi yazısı dedi, sonra "sizin" yazısı dedi...

"The Era of Large Models" kitabının yazarı Long Zhiyong, Deep AI'ya şöyle açıkladı: **Bu, sol ve sağ arasındaki kavga perspektifinden konum değişikliğinden kaynaklanıyor olabilir. **

Üniversiteye giriş sınavı kompozisyonunu yazmak için AI büyük modelini test etme sürecinde, ayrıca ilginç bir fenomen bulduk - AI sayılamaz.

Kolej giriş sınavı kompozisyonunda kelime sayısının 800 kelimeden az olmaması şartı vardır. Deep AI, büyük modelle birçok kez etkileşime girdi.**Wenxin Yiyan ve Tongyi Qianwen'in ilk baskısı ChatGPT dışında 800 kelimeye ulaşmadı. **

Örneğin, Deep AI'dan Wenxin Yiyan, makaledeki kelime sayısının 800'e yetmediğini ve yeniden yazılması gerektiğini defalarca hatırlattı. Wen Xin bunu her seferinde söyledi: Önce çok alçakgönüllülükle özür diledi, gereksinimleri karşılayacağına söz verdi ve ardından on saniye içinde hızla yeni bir kompozisyon oluşturdu - yine de 800 kelimeden az.

Bu "aday" kompozisyon sorularını anlayamıyor ve tekrarlanan öğretimden sonra düzeltmiyor ki bu büyük bir eksi.

Long Zhiyong, Deep AI'ya şunları açıkladı: "Büyük modelin bir sonraki kelimeyi tahmin etme eğitim yöntemi, saymayı öğrenmesine izin vermiyor. 800'ün ne kadar olduğunu bilmiyor ve kelimeleri nasıl sayacağını bilmiyor. makaleler oluşturun**."

Aslında, 800'den bahsetmiyorum bile, Wen Xin 10 gibi sayıları bile sayamaz.

Bu, genel olarak dil modelleriyle ilgili bir sorundur. Neden sayılamayacakları, ne zaman ve hangi yöntemle sayılabilecekleri konusunda ise henüz bir sonuca varılmış değil. "Saymasına yardımcı olacak bazı ipuçları olsa da, bu genel bir çözüm değildir. *Büyük modelin şu anki aşaması, kara kutu deneyleri yaparak yeteneğini doğrulamak ve kara kutu eğitimi yaparak yeteneğini geliştirmektir. * "Long Zhiyong dedi.

Long Zhiyong'un önerisine göre Deep AI, istem sözcüklerini değiştirdi ve "içerik ne kadar zenginse, o kadar uzundur" girdi ve Wenxin Yiyan, 800'den fazla kelimeden oluşan bir kompozisyon çıktı.

Üniversite giriş sınavı için önceki kompozisyon sorularında, ChatGPT'nin kompozisyonu 800 kelimeyi aşıyordu ama aslında saymayı öğrenmemişti.

ChatGPT, Derin Yapay Zekayı şu şekilde açıklar:

Bu nedenle, aslında, "en iyi öğrenci" ChatGPT'nin bileşimindeki kelime sayısı, Meng'in sayesinde standardın üzerindedir. Kaç 800 kelime olduğunu bilmiyor, bu yüzden mümkün olduğu kadar çok yazıyor.

İnsan dilini tam olarak anlayamıyorum ama süper bilgi birikimim ve bazen şaşırtıcı sahnelere yol açan ifade becerilerim var.

Bu AI savaş koleji giriş sınavı kompozisyonunun sonuçlarına bakılırsa, büyük modelin yazma yeteneği büyük ilerleme kaydetti. Kelime seçimi, mantıklı tartışma ve alıntılar açısından birçok insanı bile geride bıraktı.

Bununla birlikte, yalnızca bir doğru cevabın olduğu bir matematik probleminin aksine, kompozisyonun kalitesinin değerlendirilmesinin öznel faktörleri vardır. Güzel sözler ve cümleler aynıdır ama ilginç ruhlar milyonda birdir. Kompozisyona ruh nasıl enjekte edilir, AI modeli henüz anlamadı. Büyük yapay zeka modeline özgü bazı sorunların da teknik yinelemelerle yavaş yavaş çözülmesi gerekir.

View Original

The content is for reference only, not a solicitation or offer. No investment, tax, or legal advice provided. See Disclaimer for more risks disclosure.

Reward
like
Comment
Share

Comment

0/400

No comments

Topic
#BTC#
236k posts
#PI#
212k posts
#ETH#
151k posts
4#GateioInto11#
80k posts
5#ContentStar#
67k posts
6#GT#
65k posts
7#BOME#
61k posts
8#DOGE#
59k posts
9#MAGA#
53k posts
10#SLERF#
51k posts

sitemap