Композиція вступного іспиту до коледжу AI Wars: Make Up, Make Up Words, Universal Routine

Джерело: «Deep AI» (ID: DeepAI2023), автор: Лі Мін, редактор: Вей Цзя

Джерело зображення: створено інструментом Unbounded AI

Цей вступний іспит до коледжу має стати найособливішим за останні п’ять років. Тому що з’явилася нова роль – кандидати на ШІ.

Як тільки закінчився іспит з китайської мови в перший день, в Інтернеті розпочався конкурс композицій зі штучного інтелекту. Такі моделі ШІ, як GhatGPT, Wenxin Yiyan і Tongyi Qianwen, використовуються людьми для написання есе для вступних іспитів до коледжу. Статтю можна створити за кілька секунд, що не тільки надзвичайно швидко, логічно чітко, але й цитує класику.

На перший погляд, створення великомасштабної моделі штучного інтелекту надто легко, і здається, що це завдає удару по людині. Адже за запасами знань ніхто не зрівняється з ШІ. ШІ вивчає та перетравлює всю інформацію в Інтернеті, а потім імітує вирази людей і використовує власну логіку для виведення.

Проте, якщо ми уважно проаналізуємо «бланки відповідей» кандидатів на ШІ, то виявимо, що ШІ не такий всемогутній, як багато хто уявляє. У композиції також з’являються такі проблеми, як рутинне письмо, невміння рахувати та нісенітниці, які є звичайними у великих моделях ШІ.

**Насправді, відповідно до стандартів підрахунку балів для есе вступних іспитів до коледжу, есе, створені ШІ, мають деякі обмеження. Перемогти людей поки що не реально. **

Deep AI протестував три великі моделі штучного інтелекту — GhatGPT (OpenAI), Wenxin Yiyan (Baidu) і Tongyi Qianwen (Ali) — зі складом вступних іспитів до коледжу та дійшов цікавих висновків.

Наприклад, штучний інтелект не вміє рахувати, і жодне з есе, написаних Веньсінь Їянь і Туньїцяньцянь, не досягає жорсткої вимоги «не менше 800 слів»; Саїд; ШІ письмо в основному невіддільне від рутини, а шаблон є застосовується неодноразово.

Нижче наведено деталі, які можна обговорити.

1 беземоційний автовідповідач

Тема цьогорічного вступного іспиту Національного коледжу A — «Люди·Технології·Час». Вона повинна починатися з речення «Люди краще контролюють час завдяки технологічному розвитку, але деякі люди стали слугами часу» та пишуть власні асоціації.та міркування.

Давайте спочатку поглянемо на «Аналіз тестових питань», виданий Інститутом педагогічної експертизи Міністерства освіти:

**Ключові моменти: скеровуйте кандидатів до глибоких роздумів про важливість раціонального аналізу та виваженого судження в епоху інформації. Це суть статті. **

Глибокий штучний інтелект протестував три великі моделі та виявив, що жодна з них не зрозуміла суті — вони говорили про все, але нічого не говорили.

Перший погляд на склад GhatGPT:

Подивіться на слова Веньсіня ще раз:

Нарешті, подивіться на запитання Тун Іцяня:

Ці три есе можна назвати найкращими «майстрами Дуань-шуй». У них говорилося про плюси та мінуси теми, але вони не повністю пояснювали суть «критичного мислення». Лише у заяві Вень Сінь прямо згадується «розвиток глибокого та критичного мислення».

Композиція Tongyi Qianwen найбільш порожня. Він зосереджений на «тайм-менеджменті», який відхиляється від теми, і правда дискусії також є здоровим глуздом. Крім того, композиція Tongyi Qianwen не має назви, а бали зніматимуться.

Давайте скористаємося тестовим запитанням композиції «Сила історії» в тому I нового стандарту навчальної програми, щоб побачити ефективність трьох шкіл.

Цей твір вимагає від вас написати власні асоціації та думки на основі наступного уривка: гарна історія може допомогти нам краще виражати та спілкуватися, зворушити серце та просвітити мудрість; гарна історія може змінити долю людини, може представити образ нація... Історії мають силу.

Склад GhatGPT:

Дослівно:

Поширені запитання:

Треба сказати, що, окрім відносно простої композиції Туньї Цяньвеня, вираз, логіка написання та особливо використання слів у двох інших статтях чудові. Зокрема, Вень Сіньянь використовує сценічний метод відкриття, який привертає увагу.

Але проблема також очевидна - **Те саме повторюється знову і знову різними словами, в результаті чого читається повний текст, викликаючи у людей відчуття «Я знаю, що ти сказав». **

Беземоційний автовідповідач, так оцінюють багато людей.

«Контент порожній, а колеса міняються і говорять туди-сюди», — прокоментували деякі люди. Інший сказав: «Це все стара дурниця без харчування».

Ми могли б також розібрати цю композицію Вен Сіньяня, і ми дізнаємося, що таке "Чеджілухуа".

Частини, виділені в тексті жовтим і зеленим, мають абсолютно однакове значення, і можна навіть сказати, що це ті самі слова, які неодноразово зустрічаються в тексті. Наприкінці статті весь абзац із позначкою «коротко» є сумішшю точок зору та мовленнєвих навичок статті.

Це дає людям візуальне відчуття підрахунку слів.

Глибокий штучний інтелект змінив слова підказки, щоб ChatGPT уявив, що він є кандидатом на сайт вступних іспитів до коледжу, і знову написав твір. Першим реченням, яке з’явилося, було: «Коли я сидів на місці цього іспиту, я тримав тільки передові електронні ручки..."

Складання тесту таким чином передбачає, що він буде засуджений за порушення і отримає нуль балів безпосередньо.

**Немає душі, що є найбільшим мінусом композиції ШІ. **

2 підпрограми, усі підпрограми

Щоб композиція виглядала саме так, AI використовував багато процедур.

Вони люблять використовувати шаблони речень «перший, другий, потім останній». Найбільш типовим є ChatGPT, останній абзац має бути «Загалом...»

Наприклад, ці два есе ChatGPT:

Існують подібні розпорядки в Wenxinyiyan і Tongyiqianwen. Вихід у попередній трапезі був лютий, як тигр, і обов'язково закінчується «одним словом» і «одним словом» наприкінці.

Це те саме, що грати на гітарі, якщо ви оволодієте універсальною формулою акордів (наприклад, універсальною каноновою прогресією), ви можете грати сотні мелодій.

Навіть ми попросили Вень Сіньяня оцінити композицію, яку ми написали, і це також було довге обговорення «перше, друге, інше та взагалі...».

У композиційному питанні «Люди · Технології · Час» ChatGPT і Tongyi Qianwen фактично використали майже той самий вираз: використовуйте «потім», щоб поставити запитання, і використовуйте «перший, другий і останній», щоб розвинути конкретну дискусію. Структура та логіка, здається, вирізані з однієї форми.

Не дивлячись на це, Вень Сіньянь впевнено поставила своїй композиції вступного іспиту до коледжу високий бал 90 (за умови, що повний бал становить 100), а також самооцінила себе як «гідну визнання». Ми надіслали його композицію ChatGPT, і ChatGPT без вагань поставив йому ідеальну оцінку 100...

Велика модель штучного інтелекту схожа на промислову складальну лінію, що виробляє композиції партіями. Але по суті, як би по-людськи це не говорило, рушійною технологією є математика і статистика, а не свідомість.

В індустрії штучного інтелекту ШІ завжди було дуже важко розуміти людську мову та розмовляти нею. Природна мова людини є надзвичайно складною системою. Вчені дозволили машині моделювати нейронну мережу людського мозку, роблячи її здатною до глибокого навчання, але вона все ще не має таких же здібностей до природної мови, як люди.

Тож деякі люди знайшли інший спосіб перетворити мовну проблему на математичну, а потім опосередковано вирішити проблему обробки природної мови за допомогою обчислень. За словами Ву Цзюня, експерта з обробки природної мови, мовна модель — це не логічна структура чи система біологічного зворотного зв’язку, а модель, побудована за допомогою математичних формул. **Ключове слово тут «математика». **

**Це означає, що штучний інтелект не має самосвідомості чи емоцій і не може говорити відповідно до особистих почуттів. Для них написання твору – це логічний вислів, орієнтований на результат і завдання. **

Збираючи величезні обсяги даних з усієї мережі для навчання та постійно навчаючись імітувати вирази людської мови, велика модель AI тепер розмовляє дуже близько до людей. Хоча вона все ще не розуміє значення слів, це не впливає спілкування.

По суті, ШІ не має власного розуму. Це також фундаментальна причина, чому його композиція виглядає чітко і логічно, якщо ви уважно прочитаєте його, ви побачите, що немає душі, і це все рутина.

3 AI дійсно не вміє рахувати

Як ми зазначали раніше, всі параметри мовної моделі отримані за допомогою статистики. Його принцип полягає в тому, щоб передбачити ймовірність наступного слова з огляду на історію тексту, а потім завершити наступне.

У 2017 році Google вперше запропонував модель Transformer, засновану на механізмі самоуважності. Тепер великі мовні моделі, такі як ChatGPT, побудовані на архітектурі Transformer.

Механізм уваги Transformer має надзвичайно довгу пам’ять, ніж попередні алгоритми глибокого навчання, такі як RNN (рекурентна нейронна мережа), GRU та LSTM. **Він також може запам’ятовувати порядок введення, щоб розуміти різницю між словами «Я люблю тебе» і «Ти любиш мене». **

Але навіть у цьому випадку він має обмеження.

Наприклад, Deep AI попросив Tongyi Qianwen оцінити власну композицію, яка плутала поняття «ти» та «я». Спочатку він сказав, що це його власна стаття, а потім сказав, що це "ваша" стаття...

Лонг Чжиюн, автор книги «Ера великих моделей», пояснив Deep AI: **Це може бути пов’язано зі зміною позиції з точки зору боротьби між лівими і правими. **

У процесі тестування великої моделі штучного інтелекту для написання композиції вступних іспитів до коледжу ми також виявили цікаве явище – штучний інтелект не може рахувати.

Існує вимога до складу вступного іспиту до коледжу, щоб кількість слів була не менше 800 слів. Deep AI багато разів взаємодіяв із великою моделлю.**За винятком ChatGPT, перше видання Wenxin Yiyan і Tongyi Qianwen не досягло 800 слів. **

Наприклад, Wenxin Yiyan, Deep AI неодноразово нагадував, що в статті не вистачає 800 слів, і її потрібно переписати. Вень Сінь говорив це кожного разу: спочатку він дуже смиренно вибачився, пообіцяв виконати вимоги, а потім швидко створив нову композицію за десять секунд — усе ще менше ніж 800 слів.

Цей «кандидат» не може розібратися у складанні питань, і не виправляє його після повторного викладання, що є великим мінусом.

Лонг Чжиюн пояснив Deep AI: «Метод навчання великої моделі передбачити наступне слово не дозволяє їй навчитися рахувати. Вона не знає, скільки це 800, і вона не знає, як рахувати слова, щоб створювати статті**."

Насправді, не кажучи вже про 800, Вень Сінь навіть не вміє рахувати такі числа, як 10.

Це проблема мовних моделей загалом. Чому їх не можна порахувати, коли і яким способом можна порахувати, висновку поки немає. «Хоча є кілька порад, які допоможуть підрахувати, це не є загальним рішенням. *Поточний етап великої моделі полягає в тому, щоб перевірити її здатність, проводячи експерименти з чорним ящиком, і покращувати його здатність, виконуючи навчання з чорним ящиком. * "Сказав Лонг Чжіюн.

За пропозицією Лонга Чжиюна Deep AI змінив слова підказки та ввів «чим багатший вміст, тим він довший», а Веньсінь Іян виводить композицію з понад 800 слів.

У попередніх композиційних питаннях для вступного іспиту до коледжу композиція ChatGPT перевищувала 800 слів, але насправді вона не навчилася рахувати.

ChatGPT пояснює Deep AI так:

Тому фактично кількість слів у композиції «найкращого студента» ChatGPT відповідає стандарту, який належить Менгу. Він не знає, скільки це 800 слів, тому просто пише якомога більше.

Я не можу повністю розуміти людську мову, але у мене є надзвичайно великий запас знань і навичок експресії, що іноді призводить до приголомшливих сцен.

Судячи з результатів цієї композиції вступного іспиту до військового коледжу штучного інтелекту, навички письма великої моделі досягли значного прогресу. За добором слів, логічним обговоренням і цитуваннями він навіть перевершив багатьох.

Проте сама оцінка якості твору має суб’єктивні чинники, на відміну від математичної задачі, де є лише одна правильна відповідь. Красиві слова та речення однакові, але цікавих душ одна на мільйон. Як внести душу в композицію, AI-модель поки не зрозуміла. Деякі проблеми, властиві великій моделі ШІ, також потрібно вирішувати повільно за допомогою технічних ітерацій.

Переглянути оригінал
Контент має виключно довідковий характер і не є запрошенням до участі або пропозицією. Інвестиційні, податкові чи юридичні консультації не надаються. Перегляньте Відмову від відповідальності , щоб дізнатися більше про ризики.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити