مع اعتماد منتجات نماذج اللغة الكبيرة (LLM) مثل ChatGPT من OpenAI على نطاق واسع، تقوم الشركات والأفراد من جميع أنحاء العالم باستخدام LLM تقريبًا كل يوم. مثل الأدوات الأخرى، تتمتع LLM بمزايا وعيوب خاصة بها.
مؤخراً، أصدرت معهد ماساتشوستس للتكنولوجيا (MIT) تقريراً بحثياً يمتد على 206 صفحات، يستكشف تكلفة الإدراك لاستخدام LLM (مثل ChatGPT) في سياقات التعليم لكتابة المقالات، كاشفاً عن تأثير استخدام LLM على الدماغ والقدرات الإدراكية. تشير الدراسات إلى أن الاعتماد المفرط على روبوتات الدردشة الذكية مثل ChatGPT من OpenAI قد يؤدي إلى انخفاض القدرات الإدراكية.
قسم فريق البحث المشاركين إلى ثلاث مجموعات: مجموعة LLM، مجموعة محرك البحث، ومجموعة تعتمد فقط على الدماغ. استخدم هؤلاء المشاركون أدوات محددة (بينما لم تستخدم مجموعة الدماغ أي أدوات) لكتابة مقالات في وقت محدد على مدار 4 أشهر، وكان موضوع المقالات مختلفًا في كل تجربة. قام الفريق بترتيب 3 جولات من التجارب بنفس التوزيع لكل مشارك. في الجولة الرابعة من التجربة، طلب الفريق من المشاركين في مجموعة LLM عدم استخدام أي أدوات (سميت هذه المجموعة مجموعة LLM إلى الدماغ)، في حين استخدم المشاركون في مجموعة الدماغ LLM (المجموعة من الدماغ إلى LLM). تم تجنيد 54 مشاركًا للمشاركة في الجولات الثلاث الأولى، حيث أكمل 18 منهم الجولة الرابعة.
استخدم فريق البحث تخطيط كهربائية الدماغ (EEG) لتسجيل النشاط الكهربائي للدماغ لدى المشاركين، لتقييم استثماراتهم المعرفية وعبء المعرفة، ولتعمق فهم النشاط العصبي خلال مهمة كتابة المقال. أجرى الفريق تحليل معالجة اللغة الطبيعية (NLP) وأجرى مقابلات مع كل مشارك بعد انتهاء كل تجربة. ساعد الفريق معلمين بشريين ومقيم AI (وكيل AI مصمم خصيصًا) في عملية التقييم.
في تحليل معالجة اللغة الطبيعية (NLP)، يظهر المشاركون الذين يستخدمون الدماغ فقط اختلافًا كبيرًا في طريقة كتابة المقالات حول معظم المواضيع. بالمقابل، تميل المقالات التي كتبها مجموعة LLM إلى التماثل إحصائيًا في كل موضوع، حيث يكون الانحراف واضحًا أقل مقارنةً بالمجموعات الأخرى. قد تتأثر مجموعة محركات البحث على الأقل إلى حد ما بترويج محركات البحث وتحسين المحتوى.
تستخدم مجموعة LLM أكبر عدد من الكيانات المسماة المحددة (NER) مثل الأشخاص والأسماء والأماكن والسنوات والتعريفات؛ بينما تستخدم مجموعة محركات البحث عددًا من NER أقل بنسبة نصف على الأقل مقارنة بمجموعة LLM؛ وتستخدم المجموعة التي تعتمد فقط على الدماغ عدد NER أقل بنسبة 60% من مجموعة LLM.
يواجه الأفراد المشاركون في مجموعة LLM ومحركات البحث ضغطًا إضافيًا بسبب محدودية الوقت (20 دقيقة) ، وبالتالي يميلون أكثر إلى التركيز على نتائج المخرجات للأدوات التي يستخدمونها. يركز معظمهم على إعادة استخدام محتوى مخرجات الأدوات ، مما يجعلهم مشغولين باستمرار في النسخ واللصق بدلاً من دمج أفكارهم الأصلية وتحرير هذه المحتويات من منظورهم وتجاربهم الخاصة.
فيما يتعلق بنمط الاتصال العصبي، استخدم الباحثون طريقة دالة النقل الديناميكية الاتجاهية (dDTF) لقياس الحمل المعرفي للمشاركين. يمكن أن تكشف dDTF عن التغيرات النظامية والخصوصية الترددية للتماسك الشبكي، ولها أهمية كبيرة في الوظائف التنفيذية ومعالجة المعاني وتنظيم الانتباه.
تشير تحليلات تخطيط الدماغ إلى وجود اختلافات ملحوظة في أنماط الاتصال العصبي بين مجموعة LLM ومجموعة محركات البحث ومجموعة الاعتماد على الدماغ فقط، مما يعكس استراتيجيات معرفية مختلفة. تنخفض درجة الاتصال في الدماغ بشكل منهجي مع زيادة الدعم الخارجي: حيث تظهر مجموعة الاعتماد على الدماغ فقط أقوى وأوسع شبكة، بينما تظهر مجموعة محركات البحث مستوى متوسط من المشاركة، وتكون الترابط العام في مجموعة LLM هو الأضعف.
في الجولة الرابعة من التجربة، أظهر المشاركون الذين يعتمدون فقط على الدماغ اتصالات عصبية أضعف، ودرجة مشاركة منخفضة لشبكات α و β؛ بينما أظهر المشاركون الذين انتقلوا من الاعتماد فقط على الدماغ إلى LLM قدرة أعلى على استرجاع الذاكرة، وأعادوا تنشيط مجموعة واسعة من العقد القذالية والجبهية.
في المقابلة، كانت مجموعة LLM لديها شعور انتماء منخفض لمقالاتها. بينما كانت مجموعة محركات البحث تمتلك شعور انتماء قوي، لكنه كان أقل من مجموعة تعتمد فقط على العقل. كما أن مجموعة LLM كانت متأخرة في القدرة على الاستشهاد بالمقالات التي كتبتها قبل بضع دقائق، حيث أكثر من 83% من مستخدمي ChatGPT غير قادرين على الاستشهاد بالمقالات التي كتبها منذ بضع دقائق.
تشير هذه الدراسة التي لم تخضع بعد لمراجعة الأقران إلى أنه خلال فترة الدراسة التي استمرت 4 أشهر، كانت أداء المشاركين في مجموعة LLM أقل من مجموعة التحكم التي تستخدم الدماغ فقط على المستويات العصبية واللغوية والنقاط. مع بدء ظهور تأثير التعليم لـ LLM على الجماهير، قد يؤثر استخدام الذكاء الاصطناعي LLM سلبًا على تحسين مهارات التعلم، خاصة بالنسبة للمستخدمين الشباب.
أفاد الباحثون أنه قبل أن يتم الاعتراف بـ LLM على أنه مفيد للبشر، يجب إجراء "أبحاث طولية" لفهم التأثيرات طويلة المدى لروبوتات المحادثة الذكية على الدماغ البشري.
عند سؤال ChatGPT عن رأيه في هذه الدراسة، كانت إجابته: "لم تقل هذه الدراسة إن ChatGPT ضار بطبيعته - على العكس من ذلك، فإنها تحذر الناس من الاعتماد عليه بشكل مفرط دون تفكير أو جهد."
المقالات ذات الصلة: a16z: من وكلاء الذكاء الاصطناعي، DePIN إلى المدفوعات الصغيرة، 11 اتجاهًا رئيسيًا لتكامل التشفير والذكاء الاصطناعي.
شاهد النسخة الأصلية
المحتوى هو للمرجعية فقط، وليس دعوة أو عرضًا. لا يتم تقديم أي مشورة استثمارية أو ضريبية أو قانونية. للمزيد من الإفصاحات حول المخاطر، يُرجى الاطلاع على إخلاء المسؤولية.
تقرير MIT: الاعتماد المفرط على بوتات الدردشة AI سيؤدي إلى اسقاط القدرة على التفكير
المؤلف: MIT(麻省理工学院)مقتطف
ترجمة: فيليكس، PANews
مع اعتماد منتجات نماذج اللغة الكبيرة (LLM) مثل ChatGPT من OpenAI على نطاق واسع، تقوم الشركات والأفراد من جميع أنحاء العالم باستخدام LLM تقريبًا كل يوم. مثل الأدوات الأخرى، تتمتع LLM بمزايا وعيوب خاصة بها.
مؤخراً، أصدرت معهد ماساتشوستس للتكنولوجيا (MIT) تقريراً بحثياً يمتد على 206 صفحات، يستكشف تكلفة الإدراك لاستخدام LLM (مثل ChatGPT) في سياقات التعليم لكتابة المقالات، كاشفاً عن تأثير استخدام LLM على الدماغ والقدرات الإدراكية. تشير الدراسات إلى أن الاعتماد المفرط على روبوتات الدردشة الذكية مثل ChatGPT من OpenAI قد يؤدي إلى انخفاض القدرات الإدراكية.
قسم فريق البحث المشاركين إلى ثلاث مجموعات: مجموعة LLM، مجموعة محرك البحث، ومجموعة تعتمد فقط على الدماغ. استخدم هؤلاء المشاركون أدوات محددة (بينما لم تستخدم مجموعة الدماغ أي أدوات) لكتابة مقالات في وقت محدد على مدار 4 أشهر، وكان موضوع المقالات مختلفًا في كل تجربة. قام الفريق بترتيب 3 جولات من التجارب بنفس التوزيع لكل مشارك. في الجولة الرابعة من التجربة، طلب الفريق من المشاركين في مجموعة LLM عدم استخدام أي أدوات (سميت هذه المجموعة مجموعة LLM إلى الدماغ)، في حين استخدم المشاركون في مجموعة الدماغ LLM (المجموعة من الدماغ إلى LLM). تم تجنيد 54 مشاركًا للمشاركة في الجولات الثلاث الأولى، حيث أكمل 18 منهم الجولة الرابعة.
استخدم فريق البحث تخطيط كهربائية الدماغ (EEG) لتسجيل النشاط الكهربائي للدماغ لدى المشاركين، لتقييم استثماراتهم المعرفية وعبء المعرفة، ولتعمق فهم النشاط العصبي خلال مهمة كتابة المقال. أجرى الفريق تحليل معالجة اللغة الطبيعية (NLP) وأجرى مقابلات مع كل مشارك بعد انتهاء كل تجربة. ساعد الفريق معلمين بشريين ومقيم AI (وكيل AI مصمم خصيصًا) في عملية التقييم.
في تحليل معالجة اللغة الطبيعية (NLP)، يظهر المشاركون الذين يستخدمون الدماغ فقط اختلافًا كبيرًا في طريقة كتابة المقالات حول معظم المواضيع. بالمقابل، تميل المقالات التي كتبها مجموعة LLM إلى التماثل إحصائيًا في كل موضوع، حيث يكون الانحراف واضحًا أقل مقارنةً بالمجموعات الأخرى. قد تتأثر مجموعة محركات البحث على الأقل إلى حد ما بترويج محركات البحث وتحسين المحتوى.
تستخدم مجموعة LLM أكبر عدد من الكيانات المسماة المحددة (NER) مثل الأشخاص والأسماء والأماكن والسنوات والتعريفات؛ بينما تستخدم مجموعة محركات البحث عددًا من NER أقل بنسبة نصف على الأقل مقارنة بمجموعة LLM؛ وتستخدم المجموعة التي تعتمد فقط على الدماغ عدد NER أقل بنسبة 60% من مجموعة LLM.
يواجه الأفراد المشاركون في مجموعة LLM ومحركات البحث ضغطًا إضافيًا بسبب محدودية الوقت (20 دقيقة) ، وبالتالي يميلون أكثر إلى التركيز على نتائج المخرجات للأدوات التي يستخدمونها. يركز معظمهم على إعادة استخدام محتوى مخرجات الأدوات ، مما يجعلهم مشغولين باستمرار في النسخ واللصق بدلاً من دمج أفكارهم الأصلية وتحرير هذه المحتويات من منظورهم وتجاربهم الخاصة.
فيما يتعلق بنمط الاتصال العصبي، استخدم الباحثون طريقة دالة النقل الديناميكية الاتجاهية (dDTF) لقياس الحمل المعرفي للمشاركين. يمكن أن تكشف dDTF عن التغيرات النظامية والخصوصية الترددية للتماسك الشبكي، ولها أهمية كبيرة في الوظائف التنفيذية ومعالجة المعاني وتنظيم الانتباه.
تشير تحليلات تخطيط الدماغ إلى وجود اختلافات ملحوظة في أنماط الاتصال العصبي بين مجموعة LLM ومجموعة محركات البحث ومجموعة الاعتماد على الدماغ فقط، مما يعكس استراتيجيات معرفية مختلفة. تنخفض درجة الاتصال في الدماغ بشكل منهجي مع زيادة الدعم الخارجي: حيث تظهر مجموعة الاعتماد على الدماغ فقط أقوى وأوسع شبكة، بينما تظهر مجموعة محركات البحث مستوى متوسط من المشاركة، وتكون الترابط العام في مجموعة LLM هو الأضعف.
! تقرير مختبر معهد ماساتشوستس للتكنولوجيا: الاعتماد المفرط على روبوتات الدردشة الذكاء الاصطناعي يقلل من القدرة على التفكير
في الجولة الرابعة من التجربة، أظهر المشاركون الذين يعتمدون فقط على الدماغ اتصالات عصبية أضعف، ودرجة مشاركة منخفضة لشبكات α و β؛ بينما أظهر المشاركون الذين انتقلوا من الاعتماد فقط على الدماغ إلى LLM قدرة أعلى على استرجاع الذاكرة، وأعادوا تنشيط مجموعة واسعة من العقد القذالية والجبهية.
في المقابلة، كانت مجموعة LLM لديها شعور انتماء منخفض لمقالاتها. بينما كانت مجموعة محركات البحث تمتلك شعور انتماء قوي، لكنه كان أقل من مجموعة تعتمد فقط على العقل. كما أن مجموعة LLM كانت متأخرة في القدرة على الاستشهاد بالمقالات التي كتبتها قبل بضع دقائق، حيث أكثر من 83% من مستخدمي ChatGPT غير قادرين على الاستشهاد بالمقالات التي كتبها منذ بضع دقائق.
تشير هذه الدراسة التي لم تخضع بعد لمراجعة الأقران إلى أنه خلال فترة الدراسة التي استمرت 4 أشهر، كانت أداء المشاركين في مجموعة LLM أقل من مجموعة التحكم التي تستخدم الدماغ فقط على المستويات العصبية واللغوية والنقاط. مع بدء ظهور تأثير التعليم لـ LLM على الجماهير، قد يؤثر استخدام الذكاء الاصطناعي LLM سلبًا على تحسين مهارات التعلم، خاصة بالنسبة للمستخدمين الشباب.
أفاد الباحثون أنه قبل أن يتم الاعتراف بـ LLM على أنه مفيد للبشر، يجب إجراء "أبحاث طولية" لفهم التأثيرات طويلة المدى لروبوتات المحادثة الذكية على الدماغ البشري.
عند سؤال ChatGPT عن رأيه في هذه الدراسة، كانت إجابته: "لم تقل هذه الدراسة إن ChatGPT ضار بطبيعته - على العكس من ذلك، فإنها تحذر الناس من الاعتماد عليه بشكل مفرط دون تفكير أو جهد."
المقالات ذات الصلة: a16z: من وكلاء الذكاء الاصطناعي، DePIN إلى المدفوعات الصغيرة، 11 اتجاهًا رئيسيًا لتكامل التشفير والذكاء الاصطناعي.