Слияние AI и Web3: начало новой эры данных, вычислительной мощности и инновационных структур

AI+Web3: Башни и площади

Краткое содержание

  1. Проекты Web3 с концепцией ИИ становятся привлекательными для инвестиций на первичном и вторичном рынках.

  2. Возможности Web3 в AI-индустрии проявляются в: использовании распределенных стимулов для координации потенциального предложения в длинном хвосте ------ через данные, хранение и вычисления; в то же время, создание открытой модели и децентрализованного рынка AI-агентов.

  3. Основное применение ИИ в индустрии Web3 – это финансовые операции на блокчейне (криптоплатежи, торговля, анализ данных) и помощь в разработке.

  4. Эффективность AI+Web3 проявляется в их взаимодополнении: Web3 обещает противостоять централизации AI, а AI, в свою очередь, может помочь Web3 выйти за пределы.

! AI+Web3: Башни и площади

Введение

За последние два года развитие ИИ похоже на нажатую кнопку ускорения, и это ускорение, инициированное Chatgpt, открывает не только новый мир генеративного искусственного интеллекта, но и создает мощные волны в Web3 на другом берегу.

С поддержкой концепции ИИ, заметно улучшилось финансирование в замедляющемся крипторынке. Согласно статистике СМИ, только в первой половине 2024 года 64 проекта Web3+AI завершили финансирование, а операционная система на основе искусственного интеллекта Zyber365 достигла максимальной суммы финансирования в 100 миллионов долларов на этапе A.

Вторичный рынок становится более процветающим, данные с криптоагрегаторов показывают, что всего за чуть больше года общая рыночная капитализация в AI секторе достигла 48,5 миллиарда долларов, а объем торгов за 24 часа близок к 8,6 миллиарда долларов; очевидны преимущества, которые приносит прогресс в основных AI технологиях, после выпуска текстово-видео модели Sora от одной компании средняя цена в AI сегменте возросла на 151%; эффект AI также распространился на одну из сегментов криптовалют, привлекающих капиталы, Meme: первая концепция MemeCoin с AI Agent ------ GOAT стремительно завоевала популярность и достигла оценки в 1,4 миллиарда долларов, успешно запустив волну AI Meme.

Исследования и темы, связанные с AI+Web3, также становятся популярными, от AI+Depin до AI Memecoin и текущих AI Agent и AI DAO, ощущение FOMO уже не успевает за скоростью смены новых нарративов.

AI+Web3, эта комбинация терминов, полная горячих денег, возможностей и будущих фантазий, неизбежно воспринимается как свадьба, устроенная капиталом, нам кажется, что нам трудно различить, под этой роскошной мантией, является ли это полем для спекулянтов или преддверием рассвета?

Чтобы ответить на этот вопрос, ключевым размышлением для обеих сторон является то, станет ли лучше с другой стороной? Можно ли извлечь выгоду из модели другой стороны? В этой статье мы также пытаемся взглянуть на эту структуру, опираясь на плечи предшественников: как Web3 может сыграть свою роль на всех уровнях технологического стека AI, и что AI может привнести в Web3?

Часть 1. Какие возможности предоставляет Web3 в контексте AI стека?

Перед тем как развивать эту тему, нам нужно понять технологический стек больших моделей ИИ:

Говоря более простым языком, весь процесс можно описать так: «Большая модель» напоминает человеческий мозг. На ранних стадиях этот мозг принадлежит новорожденному, который только что пришел в этот мир. Он должен наблюдать и поглощать огромное количество информации из окружающей среды, чтобы понять этот мир — это этап «сбора» данных. Поскольку у компьютеров нет человеческих органов чувств, таких как зрение и слух, на этапе обучения большая неразмеченная информация из внешней среды должна быть преобразована с помощью «предварительной обработки» в формат информации, который компьютер может понять и использовать.

После ввода данных ИИ через «обучение» создает модель с пониманием и предсказательной способностью, что можно рассматривать как процесс, в котором младенец постепенно понимает и изучает внешний мир. Параметры модели подобны языковым способностям младенца, которые постоянно корректируются в процессе обучения. Когда изучаемый материал начинает разделяться на разделы или происходит общение с людьми, получая обратную связь и корректировки, это переходит в стадию «тонкой настройки» большой модели.

Дети, постепенно подрастая и научившись говорить, могут понимать смысл и выражать свои чувства и мысли в новых беседах. Этот этап похож на «вывод» больших моделей ИИ, которые способны предсказывать и анализировать новые языковые и текстовые вводы. Младенцы выражают свои чувства, описывают предметы и решают различные проблемы с помощью языковых навыков, что также похоже на применение больших моделей ИИ на этапе вывода для выполнения различных специфических задач, таких как классификация изображений, распознавание речи и т.д.

А AI Agent становится ближе к следующей форме большого модели ------ способной самостоятельно выполнять задачи и стремиться к сложным целям, обладая не только способностью к мышлению, но и возможностью запоминания, планирования и способности взаимодействовать с миром с помощью инструментов.

В настоящее время, в ответ на проблемы, связанные с ИИ на различных уровнях, Web3 в настоящее время постепенно формирует многоуровневую, взаимосвязанную экосистему, охватывающую все этапы процесса моделей ИИ.

! AI+Web3: Башни и площади

Один. Базовый уровень: вычислительная мощность и данные как Airbnb

Мощность вычислений

В настоящее время одной из самых высоких затрат AI является вычислительная мощность и энергия, необходимые для обучения и вывода моделей.

Один из примеров - это то, что компании LLAMA3 требуется 16000 H100GPU, произведенных другой компанией (это высококачественный графический процессор, специально разработанный для задач искусственного интеллекта и высокопроизводительных вычислений), чтобы завершить обучение за 30 дней. Цена за 80GB версию колеблется от 30,000 до 40,000 долларов, что требует инвестиций в вычислительное оборудование (GPU + сетевые чипы) в размере от 400 до 700 миллионов долларов, в то время как ежемесячное обучение требует потребления 1.6 миллиардов киловатт-часов, а расходы на электроэнергию составляют почти 20 миллионов долларов в месяц.

Распаковка вычислительной мощности ИИ является одной из первых областей пересечения Web3 и ИИ ------ DePin (децентрализованная сеть физических инфраструктур). В настоящее время один из сайтов по данным уже представил более 1400 проектов, среди которых проекты, представляющие совместное использование вычислительной мощности GPU, включают несколько проектов.

Основная логика заключается в том, что платформа позволяет индивидуумам или организациям, имеющим неиспользуемые ресурсы GPU, вносить свой вычислительный потенциал в децентрализованном порядке без разрешения. Это повышает уровень использования не полностью использованных ресурсов GPU через онлайн-рынок, где покупатели и продавцы могут взаимодействовать, аналогично некоторым компаниям. Конечные пользователи, в свою очередь, получают более доступные и эффективные вычислительные ресурсы; в то же время механизм залога также гарантирует, что в случае нарушения механизма контроля качества или прерывания сети ресурсодатели понесут соответствующее наказание.

Его особенности заключаются в том, что:

  • Сбор неиспользуемых ресурсов GPU: поставщиками в основном являются независимые малые и средние дата-центры, операторы избыточных мощностей криптовалютных шахт и другие, с механизмом консенсуса PoS, такие как некоторые проектные майнеры. В настоящее время также есть проекты, стремящиеся запустить оборудование с более низким порогом входа, например, некоторые проекты используют определенное оборудование для создания вычислительных сетей для выполнения больших моделей.

  • Столкновение с длинным хвостом рынка вычислительных мощностей ИИ:

a. «С технической стороны» децентрализованный рынок вычислительных мощностей лучше подходит для этапов вывода. Обучение в большей степени зависит от возможностей обработки данных, предоставляемых супербольшими кластерами GPU, в то время как для вывода требования к вычислительной производительности GPU относительно ниже, как в некоторых проектах, которые сосредотачиваются на рендеринге с низкой задержкой и приложениях ИИ для вывода.

b. С точки зрения спроса, малые и средние потребители вычислительной мощности не будут отдельно обучать свои большие модели, а лишь выберут оптимизацию и донастройку вокруг нескольких ведущих больших моделей, и такие сценарии естественно подходят для распределенных неиспользуемых ресурсов вычислительной мощности.

  • Децентрализованная собственность: Технологическое значение блокчейна заключается в том, что владельцы ресурсов всегда сохраняют контроль над своими ресурсами, гибко регулируя их в зависимости от потребностей, одновременно получая прибыль.

Данные

Данные являются основой ИИ. Без данных вычисления бесполезны, как плавающие водоросли, а связь между данными и моделью напоминает пословицу "Мусор на входе, мусор на выходе". Количество данных и качество входных данных определяют качество выходных данных модели. В настоящее время, для обучения современных ИИ моделей данные определяют языковые способности модели, способности к пониманию, а также ценности и гуманистическое проявление. В настоящее время проблемы с потребностями в данных для ИИ в основном сосредоточены на следующих четырех аспектах:

  • Голод данных: обучение AI-моделей зависит от большого объема входных данных. Открытые данные показывают, что у одной компании объем параметров, использованных для обучения одной модели, достиг триллионов.

  • Качество данных: с объединением ИИ и различных отраслей возникают новые требования к качеству данных, такие как актуальность данных, разнообразие данных, профессионализм вертикальных данных и внедрение новых источников данных, таких как эмоции в социальных медиа.

  • Проблемы конфиденциальности и соблюдения: в настоящее время различные страны и компании постепенно осознают важность качественных наборов данных и вводят ограничения на сбор данных.

  • Высокие затраты на обработку данных: большой объем данных, сложный процесс обработки. По 공개资料, более 30% затрат на НИОКР в AI компаниях идут на сбор и обработку базовых данных.

В настоящее время решения web3 проявляются в следующих четырех аспектах:

  1. Сбор данных: возможность бесплатно предоставлять захваченные данные реального мира быстро истощается, расходы компаний ИИ на оплату данных ежегодно растут. Но в то же время эти расходы не возвращаются к настоящим вкладчикам данных, платформы полностью наслаждаются созданием ценности, которую приносят данные, например, одна платформа заработала 203 миллиона долларов, подписав соглашение о лицензировании данных с компанией ИИ.

Видение Web3 состоит в том, чтобы настоящие пользователи, вносящие вклад, также участвовали в создании ценности, которую приносит данные, а также в получении более личных и ценных данных от пользователей с низкими затратами через распределенные сети и механизмы стимулирования.

  • Некоторый проект является децентрализованным уровнем данных и сетью, где пользователи могут запускать узлы, вносить неиспользуемую пропускную способность и реле трафика для захвата в реальном времени данных из всего Интернета и получать токеновые вознаграждения;

  • Некоторый проект ввел уникальную концепцию пула ликвидности данных (DLP), где пользователи могут загружать свои личные данные (такие как истории покупок, привычки просмотра, активность в социальных сетях и т. д.) в определенный DLP и гибко выбирать, предоставлять ли эти данные для использования определенным третьим лицам;

  • В рамках определенного проекта пользователи могут использовать некоторые метки на определенной платформе и @определенный аккаунт для сбора данных.

  1. Предобработка данных: в процессе обработки данных ИИ, поскольку собранные данные обычно шумные и содержат ошибки, их необходимо очистить и преобразовать в пригодный формат перед обучением модели, что включает в себя стандартизацию, фильтрацию и обработку отсутствующих значений. Этот этап является одним из немногих ручных процессов в индустрии ИИ, что привело к возникновению профессии аннотаторов данных. С повышением требований моделей к качеству данных, порог входа для аннотаторов данных также увеличивается, и эта задача естественно подходит для децентрализованного механизма стимулов Web3.
  • В настоящее время некоторые проекты рассматривают возможность добавления этапа аннотирования данных.

  • Некоторый проект предложил концепцию «Train2earn», подчеркивая качество данных, пользователи могут получать вознаграждение за предоставление аннотированных данных, комментариев или других форм ввода.

  • Проект по аннотации данных в определенном проекте игрофицирует задачи маркировки и позволяет пользователям ставить на кон баллы, чтобы зарабатывать больше баллов.

  1. Конфиденциальность и безопасность данных: необходимо прояснить, что конфиденциальность и безопасность данных - это два разных понятия. Конфиденциальность данных касается обработки чувствительной информации, в то время как безопасность данных защищает информацию от несанкционированного доступа, разрушения и кражи. Таким образом, преимущества технологий конфиденциальности Web3 и потенциальные сценарии применения проявляются в двух аспектах: (1) обучение на чувствительных данных; (2) сотрудничество по данным: несколько владельцев данных могут совместно участвовать в обучении ИИ, не делясь своими исходными данными.

Текущие широко распространенные технологии конфиденциальности в Web3 включают:

  • Достоверная среда выполнения ( TEE ), например, какой-то проект;

  • Полная гомоморфная криптография (FHE), например, некоторые проекты;

  • Технология нулевых знаний (zk), такая как использование технологии zkTLS в одном из проектов, генерирует доказательства нулевых знаний для HTTPS-трафика, позволяя пользователям безопасно импортировать активы, репутацию и данные идентификации с внешних сайтов, не раскрывая конфиденциальную информацию.

Однако в настоящее время эта область все еще находится на ранней стадии, большинство проектов все еще находятся в стадии исследования, текущей проблемой является слишком высокая стоимость вычислений, некоторые примеры:

  • Некоторые рамки требуют около 80 минут для генерации доказательства модели 1M-nanoGPT.

  • Согласно данным одной компании, затраты на zkML более чем в 1000 раз превышают затраты на чистые вычисления.

  1. Хранение данных: После получения данных, также необходима область
AGENT1.3%
MEME-0.48%
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 3
  • Поделиться
комментарий
0/400
GateUser-ccc36bc5vip
· 08-01 08:45
Деньги бегут быстрее меня
Посмотреть ОригиналОтветить0
airdrop_huntressvip
· 08-01 08:43
Вот и всё, это просто новая тема для разыгрывания людей как лохов.
Посмотреть ОригиналОтветить0
gaslight_gasfeezvip
· 08-01 08:41
Снова новый концепт для обмана денег!
Посмотреть ОригиналОтветить0
  • Закрепить