Революция роботов на базе ИИ: человекоподобные роботы эпохи ChatGPT скоро появятся

Автоматизированная революция, движимая AI и шифрованием: "Час ChatGPT" для Ботов вот-вот наступит

Появление ChatGPT полностью изменило представление людей о шифровании. Однако истинная мечта человечества заключается в том, чтобы ИИ взаимодействовал с физическим миром в форме Ботов, как это изображено в научно-фантастических фильмах.

Серьезный прорыв в области Ботов, похоже, вот-вот произойдет. В этой статье будет проанализировано, как достижения в области искусственного интеллекта в последние годы меняют ландшафт отрасли, а также обсуждены, как технологии батарей, оптимизация задержки и улучшение сбора данных будут формировать будущее, а также роль, которую будет играть шифрование. Кроме того, будут освещены важные области, такие как безопасность Ботов, финансирование, оценка и образование.

Боты"ChatGPT时刻": AI и шифрование технологии, движущие революцией автоматизации

1. Ключевые факторы, способствующие изменениям

Прорыв в искусственном интеллекте

Прогресс мультимодальных больших языковых моделей предоставляет "мозг" для Ботов, позволяя им выполнять сложные задачи. Боты в основном воспринимают окружающую среду через зрение и слух. Традиционные модели компьютерного зрения хорошо справляются с обнаружением или классификацией объектов, но им сложно преобразовывать визуальную информацию в команды для действий. Хотя большие языковые модели отлично справляются с пониманием и генерацией текста, им не хватает способности воспринимать физический мир.

Визуально-языковая модель действий ( VLA ) позволяет Ботам интегрировать визуальное восприятие, понимание языка и физические действия в единой системе. В феврале 2025 года одна компания в области искусственного интеллекта представила модель управления универсальным гуманоидным роботом, которая установила новый стандарт для отрасли благодаря способности к нулевой выборке и двойной системе архитектуры. Способность к нулевой выборке позволяет Ботам адаптироваться к новым сценам, новым объектам и новым командам без повторного обучения для каждой задачи. Двойная система архитектуры отделяет высокоуровневое рассуждение от легковесного, обеспечивая коммерциализацию гуманоидных роботов с человеческим мышлением и точностью в реальном времени.

Экономичные Боты становятся реальностью

Технологии, изменяющие мир, имеют массовый характер. Когда цена на некоторых Боты окажется ниже цены на средний седан или ниже минимального годового дохода в США, воображаемый мир, где физический труд и повседневные дела в основном выполняются Ботами, уже не будет недостижимым.

от складского хранения к потребительскому рынку

Технология Боты переходит от решений для складов к потребительской сфере. Этот мир создан для человека — человек может выполнять всю работу специализированных Ботов, тогда как специализированные Боты не могут справляться со всей работой человека. Компании Ботов больше не ограничиваются производством специализированных Ботов для заводов, а начинают разрабатывать более универсальных гуманоидных Ботов. Таким образом, передовые технологии Боты существуют не только на складах, но и проникают в повседневную жизнь.

Стоимость является одним из основных узких мест масштабируемости. Ключевой показатель — это совокупные затраты в расчете на час, который рассчитывается как сумма альтернативных издержек времени на обучение и зарядку, затрат на выполнение задач и стоимости приобретения Боты, деленная на общее время работы Боты. Эта стоимость должна быть ниже среднего уровня зарплат в соответствующей отрасли, чтобы быть конкурентоспособной.

Чтобы полностью проникнуть в сферу складирования, совокупные затраты на Боты должны быть ниже 31,39 долларов США в час. В крупнейшем потребительском сегменте — частном образовании и здравоохранении — эти затраты должны быть ниже 35,18 долларов США. В настоящее время Боты развиваются в сторону более низкой стоимости, большей эффективности и универсальности.

Боты"ChatGPT时刻": AI и шифрование технологии, движущие автоматизацией революции

2. Следующий прорыв в технологии Ботов

Оптимизация батареи

Технология аккумуляторов всегда была узким местом для пользовательских Ботов. У некоторых гуманоидных Ботов время работы от батареи составляет всего около 2 часов. Пользователи явно не хотят вручную заряжать каждые два часа, поэтому автономная подзарядка и инфраструктура стыковки становятся основными направлениями развития. В настоящее время зарядка Ботов осуществляется в основном двумя способами: замена батареи или прямой заряд.

Режим замены батареи обеспечивает непрерывную работу за счет быстрой замены исчерпанного аккумуляторного блока, минимизируя время простоя, что делает его подходящим для полевых условий или промышленных сценариев. Этот процесс может выполняться как вручную, так и автоматически.

Индукционная зарядка использует беспроводное питание, хотя полный процесс зарядки занимает много времени, но позволяет легко реализовать полностью автоматизированный процесс.

Оптимизация задержки

Низколатентные операции можно разделить на две категории: восприятие окружающей среды и дистанционное управление. Восприятие означает способность Ботов к пространственному восприятию окружающей среды, тогда как дистанционное управление относится к实时 контролю оператора.

Исследования показывают, что системы восприятия Ботов начинаются с недорогих датчиков, но технологический барьер заключается в программном обеспечении для интеграции, низкомощных вычислениях и контроле в миллисекундах. Когда Боты завершают пространственную локализацию, легковесные нейронные сети будут маркировать такие элементы, как препятствия, поддоны или люди. После ввода меток сцены в систему планирования немедленно генерируются команды для двигателей, отправляемые на ноги, колесные группы или манипуляторы. Задержка восприятия менее 50 миллисекунд эквивалентна скорости человеческой реакции — любая задержка, превышающая этот порог, приведет к неуклюжести движений Ботов. Поэтому 90% решений должны приниматься локально через единую сеть визуально-языкового-движения.

Полностью автономные Боты должны обеспечивать низкую задержку модели VLA менее 50 миллисекунд; для удаленных Ботов требуется, чтобы задержка сигнала между оператором и Ботом не превышала 50 миллисекунд. Здесь важность модели VLA особенно очевидна — если визуальные и текстовые входы обрабатываются разными моделями перед вводом в крупную языковую модель, общая задержка значительно превысит порог в 50 миллисекунд.

Оптимизация сбора данных

Существует три основных способа сбора данных: видео данные из реального мира, синтетические данные и данные удаленного управления. Основное препятствие между реальными и синтетическими данными заключается в преодолении различий между физическим поведением Ботов и видео/моделью симуляции. Реальные видео данные отсутствуют в физические детали, такие как обратная связь, ошибки движения суставов и деформация материалов; синтетические данные же страдают от отсутствия непредсказуемых переменных, таких как сбои датчиков и коэффициенты трения.

Наиболее перспективный способ сбора данных — это удаленное управление — когда оператор человек дистанционно управляет Боты для выполнения задач. Однако затраты на рабочую силу являются основным ограничивающим фактором для сбора данных через удаленное управление.

Разработка специализированного оборудования также предлагает новые решения для высококачественного сбора данных. Некоторые компании комбинируют основные методы с индивидуальным оборудованием для сбора многомерных данных о движении человека, которые после обработки преобразуются в наборы данных, подходящие для обучения нейронных сетей Ботов, в сочетании с быстрым циклом итерации, предоставляя большие объемы высококачественных данных для обучения ИИ Ботов. Эти технологические каналы вместе сокращают путь от исходных данных до развертываемых Ботов.

3. Ключевые области исследования

шифрование технологии с Боты

Шифрование технологии может стимулировать недоверительные стороны для повышения эффективности сети Ботов. Основываясь на ранее упомянутых ключевых областях, шифрование технологии может повысить эффективность в трех аспектах: интеграция инфраструктуры, оптимизация задержки и сбор данных.

Децентрализованная физическая инфраструктурная сеть ( DePIN ) обещает революционизировать инфраструктуру зарядки. Когда человекоподобные Боты будут работать по всему миру, зарядные станции должны быть так же доступны, как автозаправочные станции. Централизованным сетям требуется огромный первоначальный капитал, тогда как DePIN распределяет затраты между операторами узлов, что позволяет быстро расширить зарядные устройства в большее количество районов.

DePIN также может использовать распределенную инфраструктуру для оптимизации задержки удаленного управления. Объединяя географически распределенные вычислительные ресурсы крайних узлов, команды удаленного управления могут обрабатываться локальными или ближайшими доступными узлами, минимизируя расстояние передачи данных и значительно снижая задержку связи. Однако текущие проекты DePIN в основном сосредоточены на децентрализованном хранении, распространении контента и совместном использовании пропускной способности, хотя есть проекты, демонстрирующие преимущества крайних вычислений в потоковом видео или Интернете вещей, они еще не распространились на Боты или область удаленного управления.

Удаленное управление является наиболее перспективным способом сбора данных, но централизованные организации несут огромные затраты на найм профессионалов для сбора данных. DePIN решает эту проблему, стимулируя третьи стороны предоставлять данные удаленного управления через шифрование токенов. Некоторые проекты создают глобальную сеть удаленных операторов, преобразуя их вклад в токенизированные цифровые активы, формируя децентрализованную систему без разрешений — участники могут как получать прибыль, так и участвовать в управлении и способствовать обучению AGI Ботов.

Безопасность всегда является основной заботой

Конечной целью технологии Боты является достижение полной автономности, но, как предупреждают некоторые научно-фантастические фильмы, люди более всего не хотят видеть, как автономность превращает Боты в агрессивное оружие. Проблемы безопасности больших языковых моделей вызвали обеспокоенность, а когда эти модели обладают физической способностью к действиям, безопасность Ботов становится ключевым условием для принятия их обществом.

Экономическая безопасность является одним из столпов процветания экосистемы Ботов. Некоторые компании строят децентрализованный уровень координации машин, реализуя аутентификацию идентичности устройств, проверку физического присутствия и получение ресурсов с помощью шифрования. Эта система позволяет Ботам самостоятельно подтверждать идентификационную информацию, географическое положение и записи о поведении, не полагаясь на централизованные посредники.

Ограничения поведения и идентификация выполняются через механизмы на блокчейне, что гарантирует возможность аудита соблюдения для всех. Боты, соответствующие стандартам безопасности, требованиям качества и региональным нормам, будут вознаграждены, в то время как нарушители столкнутся с наказанием или потерей квалификации, тем самым создавая механизмы подотчетности и доверия в сети автономных машин.

Сеть повторного залога третьей стороны также может предоставить равные гарантии безопасности. Хотя система штрафных параметров все еще требует доработки, соответствующие технологии уже вошли в практическую стадию. Ожидается, что отраслевые стандарты безопасности скоро будут сформированы, и в это время штрафные параметры будут смоделированы на основе этих стандартов.

Один из возможных вариантов реализации следующий:

  1. Боты компании присоединились к сети повторного залога.
  2. Установите подтверждаемые параметры конфискации (например, "применение силы человеческого контакта более 2500 ньютонов");
  3. Ставщики предоставляют залог, чтобы Боты соблюдали параметры;
  4. В случае нарушения, залог будет использован в качестве компенсации для пострадавшей стороны.

Данная модель как стимулирует компании ставить безопасность на первое место, так и способствует принятию со стороны потребителей через механизм страхования пулов стейкинга.

Боты"ChatGPT时刻": AI и шифрование технологии, движущие автоматизацией революции

4. Заполнение пробелов в технологическом стеке Ботов

Некоторые известные компании в области ИИ способствовали распространению ИИ, однако этот прорыв уже был заложен. Облачные услуги разрушили зависимость моделей от локальной вычислительной мощности, открытые платформы реализовали открытость моделей, а некоторые онлайн-платформы предоставили ИИ-инженерам площадки для экспериментов. Эти постепенные прорывы совместно способствовали массовому распространению ИИ.

В отличие от ИИ, в области Ботов сложно начать при ограниченных финансах. Чтобы достичь распространения Ботов, порог их разработки должен быть снижен до удобства, сопоставимого с разработкой приложений ИИ. Мы считаем, что существует пространство для улучшения в трех областях: механизмы финансирования, системы оценки и образовательная экосистема.

Финансирование является болевой точкой в области Ботов. Для разработки компьютерных программ требуется только один компьютер и облачные вычислительные ресурсы, в то время как для создания полноценного робота необходимо закупить такие аппаратные компоненты, как моторы, датчики, аккумуляторы и т.д., стоимость которых легко превышает 100000 долларов. Эта аппаратная природа делает разработку роботов менее гибкой и более дорогой по сравнению с AI.

Инфраструктура оценки Ботов в реальных сценариях все еще находится на начальной стадии. В области ИИ уже установлена четкая система функций потерь, тестирование можно полностью виртуализировать. Однако отличные виртуальные стратегии не могут быть напрямую преобразованы в эффективные решения для реального мира. Боты нуждаются в инфраструктуре оценки автономных стратегий, чтобы тестировать их в разнообразных реальных условиях, что позволит достигнуть итеративной оптимизации.

Когда эта инфраструктура станет зрелой, кадры будут массово хлынуть, а гуманоидные Боты повторят экспоненциальный рост Web2. Некоторые компании по шифрованию Ботов движутся в этом направлении — разрабатывая "роботизированную версию операционной системы Android", превращая оригинальное оборудование в экономически осведомленные, обновляемые интеллектуальные агенты. Модули визуального восприятия, языка и планирования движений могут быть подключены, как мобильные приложения, а все шаги вывода представлены на понятном языке, позволяя операторам проверять или настраивать поведение без вмешательства в прошивку. Эта способность к выводу на естественном языке позволяет новому поколению кадров бесшовно входить в область Ботов, делая ключевой шаг к открытой платформе, которая взорвёт революцию Ботов, подобно ускорению, которое открытое программное обеспечение дало ИИ.

Плотность талантов определяет траекторию отрасли. Структурированная система инклюзивного образования имеет решающее значение для поставки талантов в область Ботов. Выход одной компании по производству Ботов на NASDAQ ознаменовал начало новой эры, когда интеллектуальные машины участвуют как в финансовых инновациях, так и в реальном образовании. Эта компания в сотрудничестве с партнерами объявила о запуске первого универсального образовательного курса на основе человекоподобных роботов в государственных школах K-12 США. Дизайн курса имеет платформонезависимость и может быть адаптирован под различные формы роботов, предоставляя студентам возможности для практических занятий. Это

AGI-3.33%
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 1
  • Репост
  • Поделиться
комментарий
0/400
PaperHandsCriminalvip
· 9ч назад
Деньги уже машут Ботам... Когда же я смогу не быть неудачниками
Посмотреть ОригиналОтветить0
  • Закрепить