a16z «Ученики» Керівництво з практичних дій Inference частина 3: Запуск тестування стимулів Epoch3, Multicoin Capital вкладає великі кошти

Автор: J1N, Новини Techub

Epoch3 офіційно запустився 7 червня 2025 року, запроваджуючи значні зміни в протоколі, включаючи технічні вдосконалення, новий механізм стейкінгу та зміни в управлінні.

Kuzco провела ребрендинг і змінила назву на Inference.

Цей проект дійсно отримав інвестиції від Multicoin Capital.

Підвищено поріг для пристроїв

Запуск механізму майнінгу на основі стейкінгу, подібного до io.net

Огляд Epoch2

Рекомендації щодо конфігурації участі

Перед прочитанням рекомендується переглянути попередні статті:

《a16z「门徒」Kuzco практичний посібник: як ефективно здійснювати AI потужність майнінгу?》

《a16z「门徒」Kuzco практичний посібник 2: від індивідуальних операцій до групового розгортання》

Multicoin Capital вступає у гру

У грудні минулого року засновник Inference Сем у офіційному каналі золотих шахтарів DC стверджував, що проект отримав фінансування в розмірі 11,5 мільйона доларів від Multicoin Capital та a16z. Цю інформацію нещодавно підтвердили, оскільки проект можна побачити в списку портфоліо Multicoin Capital. Інвестиція Inference від Multicoin Capital є правдою. (Multicoin Capital також був раннім інвестором io.net)

Епоха 3 Початок

З моменту запуску Epoch3 7 червня 2025 року, мережа працює вже 10 днів. У порівнянні з попередніми двома етапами, кількість учасників-майнерів помітно зросла, обсяги обчислень та стабільність мережі суттєво покращилися. На момент написання статті кількість worker досягла 12.1 тисячі, хоча за цифрами вона ще не перевищила максимум Epoch1 у 14 тисяч. Однак Epoch3 обмежила використання графічних карт з низькою обчислювальною потужністю та багаторазовий запуск, тому можна припустити, що наразі кількість учасників в кілька разів перевищує рівні початкового етапу.

Які зміни приносить етап 3?

Автоматичне оновлення вузлів

Функція автоматичного оновлення вузлів насправді може значною мірою зменшити навантаження на обслуговування майнерів. Після досвіду роботи з Epoch 1&2 офіційні оновлення файлів відбуваються нерегулярно, а повідомлення про оновлення не завжди вчасні. Це призводить до того, що багато користувачів зупиняють процеси, вважаючи, що з пристроєм виникли проблеми, і витрачають багато часу на налаштування, хоча причиною є те, що користувачі не виконали оновлення вчасно.

Управління єдиним механізмом висновків

Автор обидва рази запускав модель Llama-3.1-8B від Meta, і не було виявлено можливості вибору моделей, як це зазначено в офіційних документах. Це викликає сумнів. Крім того, якщо є можливість вибору, слід віддавати перевагу моделям з вищим рівнем використання, оскільки обсяг інференції більший, а отриманий бал вищий.

Покращене виявлення та верифікація GPU

Inference ще в Epoch 2 оголосили про примусове видалення графічних карт з потужністю нижче RTX 3080, ймовірно, через побоювання невдоволення спільноти, тому досі не виконали це до пізнього етапу Epoch 2. Досі можна побачити, що велика кількість графічних карт, таких як 3060, 3070 і т.д., з недостатньою потужністю бере участь у інференції. Автор вважає, що пристрої з недостатньою потужністю серйозно впливають на досвід користувачів, а видалення графічних карт з недостатньою потужністю може суттєво покращити весь продукт.

Inference українська DC спільнота

Права вага маршрутизації операцій

Права, зважені на маршрутизацію роботи, обчислюють пріоритет балів, отриманих шахтарями, додаючи параметр k у формулу обчислення балів за одиницю робочого обсягу,

Пріоритетний бал = 1 + k * (Відеопам'ять обладнання майнера / Відеопам'ять усієї мережі * Загальна сума стейкінгу INT * Вага репутації майнера)

k = 0: Маршрут використовує циклічний спосіб, щоб надати всім майнерам еквівалентні бали.

У період низької завантаженості мережі: буде збільшено значення k, що призведе до збільшення винагороди майнерів.

Коли використання мережі високе: зменшиться значення k, що призведе до вирівнювання винагород для майнерів різного розміру.

Зміна параметра k динамічно дозволяє досягти найраціональніших стимулів та оптимальної ефективності використання ресурсів в різних умовах мережі. Це означає, що для майнерів у періоди низького попиту все ще існують хороші винагороди за бали. А в періоди піку попиту навіть майнери з незначними правами можуть зробити внесок і отримати винагороду.

Подвійна токен-система

Epoch3 запустив подвійну токен-систему, INT бали та INT-DEV токен. Наразі тестові токени та бали не мають цінності, тільки для тестування.

INT бали в основному використовуються для розрахунку обсягу роботи майнерів, а також є важливим показником участі в мережі на даному етапі.

INT-DEV токен, це токен тестової мережі Solana Devnet, не має вартості. Головним чином використовується для тестування розподілу аеродропів та винагород, наразі його функція полягає у тестуванні системи стейкінгу.

Система стейкінгу

Система стейкінгу використовує стандарт токенів SPL для токенів INT-DEV. Ця система схожа на акселератор, що дозволяє будь-якому майнеру створювати пули стейкінгу INT, встановлювати комісію та залучати інших власників INT до стейкінгу.

Як творець стейкінг-пулу, чим більше людей стейкують та чим більше INT, тим більше завдань на розрахунок він може отримати від мережі. Коли власник пулу створює пул, він встановлює відсоток комісії. Після завершення кожного завдання на розрахунок пул отримує бали, а після того, як власник пулу забере свою частку, залишені бали надаються користувачам стейку в пулі.

Якщо ви є користувачем, у якого є лише токени INT без майнінгових машин, ви можете закрити свої токени INT в пулі з високими доходами, щоб отримати вищу прибутковість. Мета - це пул з високою обчислювальною потужністю машин і малою кількістю учасників.

Пул стейкінгу автора, ласкаво просимо всіх до стейкінгу. Наразі стейкінг не приносить доходу, тільки для тестування.

Тут вже є тінь Multicoin Capital, що підтверджує їхню участь в інвестиціях. Механізм стейкінгу Inference подібний до io.net для розширення кола інвесторів. Це можна вважати перевагою повільно прогресуючих проектів, оскільки моделі, що з'являються у провідних проектах тієї ж ніші, можуть бути вдосконалені та використані. Але це не означає, що впровадження механізму стейкінгу може позитивно вплинути на ціну токенів, ми можемо легко побачити це на прикладі IO.

Система репутації (випуск після Епохи 3)

Репутаційна система надає кредитні бали на основі роботи майнерів, оцінюючи їх пропускну здатність у обробці запитів та стабільність роботи. Автор вважає, що цей механізм може сприяти децентралізації проекту, що є значно кращим, ніж багато проектів, які просто продають вузли або дозволяють брати участь у обробці запитів за гроші; це дійсно проект, який займається реальними справами.

Огляд епохи 2

Epoch2 стартувала в листопаді минулого року, і початкові показники Epoch2 були відносно слабкими, по-перше, кількість висновків у всій мережі за перші три місяці була невеликою, всього 10-20% від звичайної суми. З цього приводу чиновник вже відповів у DC перед початком другого етапу: «Проста відповідь на даний момент полягає в тому, що «бали будуть конвертовані розумним чином, враховуючи їх вартість щодо решти мережі, коли вони будуть зароблені», що гарантує, що ранні будуть належним чином винагороджені, але також враховує, що нам потрібно продовжувати стимулювати операторів вносити свої розрахунки». Тобто, згідно з фактичним функціонуванням мережі, заохочення будуть розподілятися відносно справедливо для учасників.

Автор зробив обґрунтоване припущення щодо поганих результатів другого етапу:

Тоді офіційно обіцяли видалити графічні карти нижче RTX3090, але насправді цього не було зроблено, в результаті чого багато завдань розподілялися на графічні карти з недостатньою обчислювальною потужністю, такі як RTX3060, що призводило до деяких проблем. Наприклад, в умовах обмеженої кількості завдань, завдання отримувала RTX3060, але вона мала повільну швидкість інференції, в результаті чого високопотужні карти, такі як RTX3090 і RTX4090, не отримували завдань, і, звичайно, не було обсягу інференції. Це призводило до зниження оцінок.

З іншого боку, команда Inference (колишня Kuzco) минулого грудня брала участь у AI-хакатоні Solana як важливий партнер, що збіглося з часом проблем у мережі. Можна обґрунтовано припустити, що Sam та команда inference зосередили свою увагу на хакатоні, а не на належному обслуговуванні платформи.

Ця ситуація тривала до середини лютого, коли мережа почала відновлюватися. Але після відновлення кількість відеокарт, які брали участь у видобутку, значно зменшилася в порівнянні з Epoch1. Крім того, обсяг завдань, які отримувала кожна окрема карта, також був значно меншим, ніж в Epoch1, причиною чого стало обмеження на багаторазовий запуск від офіційних осіб у Epoch2. Згідно з даними на офіційному сайті, один GPU може працювати лише з одним worker. Насправді, можна виконувати багаторазовий запуск на одній карті. Автор раніше відкрив скрипт для багаторазового запуску на github.

Рекомендації з налаштування

Нижче наведено фактичні виміри автора, економічно вигідна комбінація конфігурації X99 + E5 + RTX3090. Раніше через тарифну війну ціна 3090 відеокарт піднімалася із середньої ціни 5700 юанів до 6700 юанів, але зараз ситуація покращилася, ринок охолов, і відеокарта була знижена до рівня цін до тарифу, що є часом для старту. Крім того, якщо читач захоче взяти участь у проекті з інвестування в модульні майнінгові машини, він спочатку втратить 20-30%, адже це витрати на амортизацію обладнання, а рахунок за електроенергію розраховується окремо. Якщо ви хочете вибрати постачальника потужності для хмарних обчислень або постачальника посередницьких послуг, вам слід переконатися, що інша сторона має можливість впоратися з нестабільністю стартап-проекту.

На завершення, хочу зробити нагадування, що Inference є раннім проектом з видобутку AI, і наразі з невідомих причин не було оприлюднено його фінансування. Стан роботи мережі не є достатньо стабільним, часто відбуваються збої в мережі, часті оновлення без попередження призводять до втрати з'єднання з майнінговими машинами тощо. Ще один ризик полягає в невизначеності прибутків, наразі можна отримувати лише бали, чи варто витрачати людські та матеріальні ресурси на участь у цьому проекті, будь ласка, розгляньте самостійно.

Материнська плата: X99 подвійний U багато картковий платформа

ЦПУ: E5 2680V

Оперативна пам'ять: 32GB+ (одночасний запуск кількох карт може тимчасово займати велику кількість пам'яті)

Блоки живлення обираються в залежності від споживаної потужності, наприклад, конфігурація з 6 картами 3090 вимагає подвійного блоку живлення (необхідно налаштувати лінію для паралельного запуску блоків живлення)

Жорсткий диск: 500GB+ (один процес потребує окремого завантаження AI моделі, що накладає певні вимоги до жорсткого диска)

Мережа: понад гігабіт (мережа має великий вплив на роботу, необхідна хороша конфігурація)

6 карт 3090 платформа, один комп'ютер повне навантаження 3-4кВт, фактичне споживання 1-2кВт. (Головним чином залежить від роботи мережі, а не від 7*24 годин роботи з повним споживанням)

Бюджет: основна плата ¥700, процесор ¥200, блок живлення ¥600, 6*3090 ¥36,000, корпус та інші компоненти ¥600. У комплекті приблизно ¥38,000. Обчислювальна потужність під час роботи з моделлю meta llama 8b становить приблизно 600 Toks/s, теоретичний обсяг інференції на одиницю в день - 50M, на практиці в межах 10-20M. Ці дані наведені лише для довідки.

Переглянути оригінал
Контент має виключно довідковий характер і не є запрошенням до участі або пропозицією. Інвестиційні, податкові чи юридичні консультації не надаються. Перегляньте Відмову від відповідальності , щоб дізнатися більше про ризики.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити