ثورة الروبوتات المدفوعة بالذكاء الاصطناعي: الروبوتات البشرية في عصر ChatGPT على وشك الوصول

الثورة التلقائية المدفوعة بالتكنولوجيا الذكية والتشفير: "لحظة ChatGPT" للبوتات قريبة.

لقد غيّر ظهور ChatGPT تمامًا طريقة فهم الناس للذكاء الاصطناعي. ومع ذلك، فإن الحلم الحقيقي للبشرية هو جعل الذكاء الاصطناعي يتفاعل مع العالم الفيزيائي في شكل بوتات، كما هو موضح في أفلام الخيال العلمي.

يبدو أن هناك اختراقات كبيرة في مجال الروبوتات في الأفق. ستقوم هذه المقالة بتحليل كيفية تغير تقدم الذكاء الاصطناعي في السنوات الأخيرة لمشهد الصناعة، واستكشاف كيف ستشكل تكنولوجيا البطاريات، وتحسينات تأخير البيانات، وتحسينات جمع البيانات المستقبل، والدور الذي تلعبه التشفير في ذلك. كما ستتناول أيضًا مجالات تستحق الاهتمام مثل أمان الروبوتات، والتمويل، والتقييم، والتعليم.

! لحظات ChatGPT للروبوتات: ثورة الأتمتة مدفوعة ب الذكاء الاصطناعي والتشفير

1. العوامل الرئيسية لدفع التغيير

اختراق الذكاء الاصطناعي

تقدم نماذج اللغة الكبيرة متعددة الوسائط "دماغًا" للروبوتات لأداء المهام المعقدة. الروبوتات تعتمد بشكل رئيسي على الرؤية والسمع لإدراك البيئة. نماذج الرؤية الحاسوبية التقليدية بارعة في اكتشاف أو تصنيف الأشياء، لكنها تجد صعوبة في تحويل المعلومات البصرية إلى أوامر تنفيذ. على الرغم من أن نماذج اللغة الكبيرة تظهر أداءً ممتازًا في فهم النصوص وتوليدها، إلا أنها تفتقر إلى القدرة على إدراك العالم الفيزيائي.

نموذج الرؤية-اللغة-العمل ( VLA ) يمكّن بوتات من دمج الإدراك البصري، وفهم اللغة، والعمل المادي في إطار موحد. في فبراير 2025، أصدرت شركة ذكاء اصطناعي معينة نموذج التحكم في الروبوتات البشرية العامة الذي يضع معيارًا جديدًا في الصناعة بفضل قدرته على التعميم بدون عينات وبنيته ثنائية النظام. يسمح التعميم بدون عينات للبوتات بالتكيف مع المشاهد والأشياء والأوامر الجديدة دون الحاجة إلى إعادة التدريب على كل مهمة. تفصل بنية النظامين الاستدلال العالي المستوى عن الاستدلال الخفيف، مما يحقق روبوتات بشرية تجارية تجمع بين التفكير الشبيه بالبشر والدقة الفورية.

أصبحت بوتات اقتصادية واقعا

تتميز التقنيات التي تغير العالم بالانتشار. عندما تنخفض أسعار بعض الروبوتات إلى ما دون سعر سيارة متوسطة أو الحد الأدنى للدخل السنوي في الولايات المتحدة، فإن تصور عالم يتم فيه إنجاز العمل البدني والشؤون اليومية بشكل رئيسي بواسطة الروبوتات لم يعد بعيد المنال.

من التخزين إلى سوق المستهلكين

التكنولوجيا الروبوتية تتوسع من حلول التخزين إلى مجال الاستهلاك. هذا العالم مصمم للبشر - حيث يمكن للبشر إنجاز جميع الأعمال التي تقوم بها الروبوتات المتخصصة، بينما لا تستطيع الروبوتات المتخصصة القيام بجميع الأعمال التي يقوم بها البشر. لم تعد شركات الروبوتات مقتصرة على تصنيع الروبوتات المخصصة للمصانع، بل انتقلت لتطوير الروبوتات البشرية الأكثر عمومية. لذلك، فإن طليعة التكنولوجيا الروبوتية لا توجد فقط في المستودعات، بل ستتسلل إلى الحياة اليومية.

التكلفة هي واحدة من العوائق الرئيسية للتوسع. المؤشر الأكثر أهمية هو التكلفة الإجمالية لكل ساعة، والتي يتم حسابها من خلال: تكلفة الفرصة البديلة للوقت المستغرق في التدريب والشحن، تكلفة تنفيذ المهام وتكلفة شراء بوتات، مقسومة على إجمالي ساعات تشغيل البوتات. يجب أن تكون هذه التكلفة أقل من متوسط مستوى الأجور في الصناعة ذات الصلة لتكون تنافسية.

يجب أن تكون التكلفة الشاملة للروبوتات أقل من 31.39 دولارًا في الساعة للتغلغل الكامل في مجال التخزين. وفي أكبر سوق استهلاكية - مجال التعليم الخاص وخدمات الصحة - يجب السيطرة على هذه التكلفة لتكون أقل من 35.18 دولارًا. حاليًا، تتجه الروبوتات نحو أن تكون أكثر تكلفة وفعالية وعمومية.

بوتات "ChatGPT لحظة": ثورة الأتمتة المدفوعة بالذكاء الاصطناعي والتشفير

2. خطوة جديدة في تكنولوجيا بوتات

تحسين البطارية

تقنية البطاريات كانت دائما عقبة أمام الروبوتات الصديقة للمستخدم. بطاريات بعض الروبوتات البشرية لا تدوم سوى حوالي ساعتين. من الواضح أن المستخدمين لا يرغبون في شحنها يدويًا كل ساعتين، لذا أصبحت عملية الشحن الذاتي والبنية التحتية للتوصيل هي الاتجاهات الرئيسية للتطوير. حاليًا، هناك نوعان رئيسيان من طرق شحن الروبوتات: استبدال البطارية أو الشحن المباشر.

نمط استبدال البطارية يحقق التشغيل المستمر من خلال الاستبدال السريع لمجموعة البطاريات المستنفدة، مما يقلل من فترة التوقف إلى الحد الأدنى، ويكون مناسبًا للمشاهد الميدانية أو المصانع. يمكن تنفيذ هذه العملية يدويًا أو تلقائيًا.

تستخدم الشحن بالحث طريقة الطاقة اللاسلكية، على الرغم من أن الشحن الكامل يستغرق وقتًا طويلاً، إلا أنه يمكن تحقيق عملية أوتوماتيكية بالكامل بسهولة.

تحسين التأخير

يمكن تصنيف عمليات التأخير المنخفض إلى فئتين: الإدراك البيئي والتحكم عن بُعد. يشير الإدراك إلى قدرة البوتات على فهم الفضاء المحيط، بينما يشير التحكم عن بُعد تحديدًا إلى السيطرة الفورية من قِبل المشغل البشري.

تشير الدراسات إلى أن نظام استشعار البوتات يبدأ بمستشعرات رخيصة، لكن ميزة التقنية تكمن في دمج البرمجيات والحوسبة منخفضة الطاقة والدورات الدقيقة في الملي ثانية. عندما تكمل البوتات تحديد الموقع، ستقوم الشبكات العصبية الخفيفة بتحديد العقبات، والأرفف، أو العناصر البشرية. بعد إدخال تسميات المشهد في نظام التخطيط، يتم على الفور إنشاء أوامر المحركات المرسلة إلى القدمين، أو مجموعات العجلات، أو الأذرع الآلية. تأخير الإدراك أقل من 50 ملي ثانية يعادل سرعة رد الفعل البشرية - أي تأخير يتجاوز هذا العتبة سيؤدي إلى حركات غير متناسقة للبوتات. وبالتالي، يجب إتمام 90% من القرارات من خلال شبكة بصرية-لغوية-حركية واحدة محليًا.

يجب أن تضمن الروبوتات المستقلة بالكامل أن يكون تأخير نموذج VLA عالي الأداء أقل من 50 مللي ثانية؛ بينما تتطلب الروبوتات التي يتم التحكم بها عن بُعد ألا يتجاوز تأخير الإشارة بين جهاز التشغيل والروبوت 50 مللي ثانية. هنا تتضح أهمية نموذج VLA بشكل خاص - إذا تمت معالجة المدخلات البصرية والنصية بواسطة نماذج مختلفة ثم تم إدخالها في نموذج اللغة الكبير، فإن التأخير الكلي سيتجاوز عتبة 50 مللي ثانية.

تحسين جمع البيانات

توجد ثلاث طرق رئيسية لجمع البيانات: بيانات الفيديو من العالم الحقيقي، البيانات المُركبة وبيانات التحكم عن بُعد. تكمن العقبة الأساسية بين البيانات الواقعية والبيانات المُركبة في سد الفجوة بين سلوك الروبوتات الفيزيائي ونماذج الفيديو / المحاكاة. تفتقر بيانات الفيديو الواقعية إلى تفاصيل فيزيائية مثل ردود الفعل القوة، أخطاء حركة المفاصل وتشوه المواد؛ بينما تفتقر البيانات المُركبة إلى متغيرات غير متوقعة مثل أعطال المستشعر ومعامل الاحتكاك.

أكثر طرق جمع البيانات الواعدة هي التحكم عن بُعد - حيث يتحكم مشغل بشري عن بُعد في بوتات لأداء المهام. لكن تكلفة العمالة هي العامل الرئيسي الذي يقيد جمع البيانات عن بُعد.

تطوير الأجهزة المخصصة يوفر أيضًا حلولًا جديدة لجمع البيانات عالية الجودة. بعض الشركات تجمع بين الأساليب التقليدية والأجهزة المخصصة لجمع بيانات الحركة البشرية متعددة الأبعاد، والتي يتم تحويلها بعد المعالجة إلى مجموعات بيانات مناسبة لتدريب الشبكات العصبية للروبوتات، مما يوفر بيانات عالية الجودة بكميات كبيرة لتدريب الروبوتات الذكية بالتعاون مع دورات تكرار سريعة. هذه الأنابيب التقنية تعمل معًا على تقليل مدة التحويل من البيانات الأولية إلى الروبوتات القابلة للنشر.

3. مجالات الاستكشاف الرئيسية

التشفير技术与 بوتات融合

يمكن أن تحفز تقنيات التشفير الأطراف غير الموثوقة على تحسين كفاءة شبكة البوتات. استنادًا إلى المجالات الرئيسية المذكورة أعلاه، يمكن لتقنيات التشفير تحسين الكفاءة في ثلاثة مجالات: دمج البنية التحتية، تحسين التأخير، وجمع البيانات.

من المتوقع أن تقوم شبكة البنية التحتية الفيزيائية اللامركزية ( DePIN ) بإحداث ثورة في بنية الشحن التحتية. عندما تعمل الروبوتات البشرية على مستوى عالمي مثل السيارات، يجب أن تكون محطات الشحن في متناول اليد مثل محطات الوقود. تتطلب الشبكات المركزية استثمارات أولية ضخمة، بينما تقوم DePIN بتوزيع التكاليف على مشغلي العقد، مما يسمح بتوسع سريع لمرافق الشحن إلى المزيد من المناطق.

يمكن لـ DePIN أيضاً استخدام البنية التحتية الموزعة لتحسين تأخير التحكم عن بُعد. من خلال تجميع موارد حسابية من العقد الطرفية الموزعة جغرافياً، يمكن معالجة أوامر التحكم عن بُعد من قبل العقد المحلية أو الأقرب المتاحة، مما يقلل إلى الحد الأدنى من مسافة نقل البيانات، ويقلل بشكل ملحوظ من تأخير الاتصال. لكن المشاريع الحالية لـ DePIN تركز بشكل أساسي على التخزين اللامركزي، وتوزيع المحتوى، ومشاركة النطاق الترددي، وعلى الرغم من أن هناك مشاريع تظهر فوائد الحوسبة الطرفية في البث المباشر أو إنترنت الأشياء، إلا أنها لم تمتد بعد إلى مجال بوتات أو التحكم عن بُعد.

التحكم عن بُعد هو الطريقة الأكثر واعدة لجمع البيانات، ولكن الكيانات المركزية تستأجر متخصصين لجمع البيانات بتكاليف مرتفعة للغاية. يقوم DePIN بتحفيز الأطراف الثالثة من خلال التشفير لتوفير بيانات التحكم عن بُعد لحل هذه المشكلة. تعمل بعض المشاريع على بناء شبكة عالمية من مشغلي التحكم عن بُعد، وتحويل مساهماتهم إلى أصول رقمية موثقة، مما يشكل نظامًا لامركزيًا لا يتطلب إذنًا - حيث يمكن للمشاركين الحصول على عوائد، والمشاركة في الحوكمة والمساعدة في تدريب بوتات AGI.

الأمان دائمًا هو الشغل الشاغل الأساسي

الهدف النهائي لتكنولوجيا الروبوتات هو تحقيق الاستقلال الكامل، ولكن كما حذرت بعض أفلام الخيال العلمي، فإن أكثر ما لا ترغب البشرية في رؤيته هو أن تؤدي الاستقلالية إلى تحويل الروبوتات إلى أسلحة هجومية. لقد أثارت مشكلات الأمان المتعلقة بالنماذج اللغوية الكبيرة اهتمامًا، وعندما تمتلك هذه النماذج القدرة على الحركة المادية، تصبح أمان الروبوتات شرطًا أساسيًا لقبول المجتمع.

الأمان الاقتصادي هو أحد أعمدة ازدهار بيئة البوتات. بعض الشركات تعمل على بناء طبقة تنسيق لامركزية للآلات، من خلال التشفير لتحقيق مصادقة هوية الأجهزة، والتحقق من الوجود الفعلي، والحصول على الموارد. هذا النظام يمكّن البوتات من إثبات معلومات الهوية، والموقع الجغرافي، وسجلات السلوك بشكل مستقل دون الاعتماد على وسطاء مركزيين.

يتم تنفيذ قيود السلوك والمصادقة على الهوية من خلال آلية على السلسلة، مما يضمن إمكانية تدقيق الامتثال من قبل أي شخص. ستحصل بوتات التي تتوافق مع معايير الأمان ومتطلبات الجودة والمعايير الإقليمية على مكافآت، بينما سيواجه المخالفون عقوبات أو إلغاء مؤهلاتهم، مما يؤسس آلية للمساءلة والثقة في شبكة الآلات المستقلة.

يمكن لشبكة إعادة الرهن من الطرف الثالث أيضًا توفير ضمانات أمان متكافئة. على الرغم من أن نظام معلمات العقوبات لا يزال بحاجة إلى تحسين ، إلا أن التكنولوجيا ذات الصلة قد دخلت مرحلة الاستخدام. من المتوقع أن يتم تشكيل معايير أمان الصناعة قريبًا ، وعندئذٍ سيتم نموذج معلمات العقوبات بالإشارة إلى هذه المعايير.

إحدى الخطط التنفيذية المحتملة هي كما يلي:

  1. بوتات الشركة تنضم إلى شبكة إعادة الرهن.
  2. تحديد معايير الاستيلاء القابلة للتحقق (مثل "تطبيق قوة تماس بشرية تزيد عن 2500 نيوتن");
  3. يقدم المراهنون ضمانات لضمان التزام البوتات بالمعايير؛
  4. في حالة حدوث انتهاك، ستستخدم الوديعة كتعويض للضحايا.

يحفز هذا النموذج الشركات على إعطاء الأولوية للأمان، وفي الوقت نفسه يعزز قبول المستهلكين من خلال آلية التأمين لصندوق التشفير.

! لحظات ChatGPT للروبوتات: ثورة الأتمتة مدفوعة ب الذكاء الاصطناعي والتشفير

4. سد الفجوات في تقنية بوتات

دفعت إحدى شركات الذكاء الاصطناعي المعروفة إلى انتشار الذكاء الاصطناعي، لكن حجر الأساس لهذه القفزة قد وُضع بالفعل. كسرت خدمات السحابة الاعتماد على القدرة الحاسوبية المحلية للنماذج، وأتاح النظام المفتوح النماذج مفتوحة المصدر، ووفرت بعض المنصات على الإنترنت أماكن تجريبية لمهندسي الذكاء الاصطناعي. ساهمت هذه الانجازات التدريجية في تعميم الذكاء الاصطناعي.

على عكس الذكاء الاصطناعي، من الصعب دخول مجال بوتات عندما تكون الموارد المالية محدودة. لتحقيق انتشار بوتات، يجب أن تنخفض عتبة تطويرها إلى مستوى سهولة تطوير تطبيقات الذكاء الاصطناعي. نعتقد أن هناك مجالاً للتحسين في ثلاثة مجالات: آلية التمويل، نظام التقييم، والنظام التعليمي.

التمويل هو نقطة الألم في مجال بوتات. يتطلب تطوير برامج الكمبيوتر فقط جهاز كمبيوتر وموارد سحابية، بينما يتعين على بناء بوت كامل الوظائف شراء محركات وأجهزة استشعار وبطاريات وغيرها من الأجهزة، مما يجعل التكلفة تتجاوز بسهولة 100,000 دولار. هذه الخصائص المادية تجعل تطوير البوتات أقل مرونة وأعلى تكلفة مقارنة بالتشفير.

لا تزال بنية تقييم الروبوتات في المشهد الواقعي في مرحلة الولادة. لقد تم إنشاء نظام واضح لوظائف الخسارة في مجال الذكاء الاصطناعي، ويمكن أن تكون الاختبارات افتراضية بالكامل. لكن الاستراتيجيات الافتراضية الممتازة لا يمكن تحويلها مباشرة إلى حلول فعالة في العالم الحقيقي. يحتاج الروبوت إلى مرافق تقييم لاستراتيجياته الذاتية في بيئات واقعية متنوعة لتحقيق تحسين تكراري.

عندما تنضج هذه البنية التحتية، سيتدفق عدد كبير من المواهب، وستعيد الروبوتات البشرية تكرار منحنى الانفجار الخاص بـ Web2. بعض شركات بوتات التشفير تتحرك في هذا الاتجاه - تطوير "نظام تشغيل روبوتات"، وتحويل الأجهزة الأصلية إلى كائنات ذكية قابلة للتطوير وذات وعي اقتصادي. يمكن أن تكون وحدات الرؤية واللغة وتخطيط الحركة قابلة للتوصيل مثل تطبيقات الهواتف المحمولة، حيث يتم تقديم جميع خطوات الاستدلال بلغة واضحة، مما يسمح للمشغلين بتدقيق أو تعديل السلوك دون الحاجة إلى التعامل مع البرنامج الثابت. تتيح هذه القدرة على الاستدلال بلغة طبيعية للجيل الجديد من المواهب الدخول بسلاسة إلى مجال الروبوتات، مما يمثل خطوة رئيسية نحو إطلاق منصة مفتوحة لثورة الروبوتات، تمامًا كما فعلت حركة المصدر المفتوح لتسريع الذكاء الاصطناعي.

كثافة المواهب تحدد مسار الصناعة. إن نظام التعليم الشامل المنظم ضروري لتزويد مجال الروبوتات بالمواهب. إن إدراج شركة روبوتات معينة في ناسداك يمثل بداية عصر جديد تشارك فيه الآلات الذكية في الابتكار المالي والتعليم الفعلي. أعلنت الشركة مع شركائها عن إطلاق أول منهج تعليمي شامل قائم على الروبوتات البشرية في المدارس العامة K-12 في الولايات المتحدة. يتم تصميم هذا المنهج ليكون غير معتمد على المنصات، مما يجعله ملائماً لمختلف أشكال الروبوتات، ويوفر للطلاب فرصاً للتطبيق العملي. هذه

AGI-2.8%
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 1
  • إعادة النشر
  • مشاركة
تعليق
0/400
PaperHandsCriminalvip
· منذ 7 س
أصبحت النقود تلوح للبوتات... متى سأتمكن من عدم كوني حمقى
شاهد النسخة الأصليةرد0
  • تثبيت