Hướng dẫn thực hành Inference của a16z "Môn đồ" phần 3: Khởi động thử nghiệm khuyến khích Epoch3, Multicoin Capital đầu tư mạnh tay.

2025-06-17 04:52:29

Tác giả: J1N, Techub News

Epoch3 đã chính thức ra mắt vào ngày 7 tháng 6 năm 2025, giới thiệu những thay đổi quan trọng trong giao thức bao gồm cải tiến kỹ thuật, cơ chế staking mới và các biến đổi trong hoạt động.

Kuzco đã tiến hành nâng cấp thương hiệu, đổi tên thành Inference.

Thông tin dự án này được Multicoin Capital đầu tư là chính xác.

Cửa ngõ thiết bị được nâng cao

Ra mắt cơ chế khai thác staking tương tự như io.net

Tổng kết Epoch2

Khuyến nghị cấu hình tham gia

Trước khi đọc, nên xem lại các bài viết trước đây:

《a16z「Môn đồ」Hướng dẫn thực hành Kuzco: Làm thế nào để khai thác AI hiệu quả?》

《a16z「Môn đồ」Hướng dẫn thực hành Kuzco phần 2: Từ tác chiến đơn lẻ đến triển khai tập trung》

Multicoin Capital vào cuộc thực sự

Vào tháng 12 năm ngoái, người sáng lập Inference, Sam, đã tuyên bố trong kênh thợ mỏ vàng chính thức của DC rằng dự án đã nhận được 11,5 triệu USD tài trợ từ Multicoin Capital và a16z. Tin tức này gần đây đã được xác nhận, có thể thấy dự án được liệt kê trong danh sách danh mục đầu tư của Multicoin Capital. Việc Inference nhận được đầu tư từ Multicoin Capital là sự thật. (Multicoin Capital cũng là nhà đầu tư sớm của io.net)

Epoch 3 Giai đoạn đầu

Kể từ khi ra mắt Epoch3 vào ngày 7 tháng 6 năm 2025, mạng đã chạy được 10 ngày và so với hai giai đoạn trước, số lượng thợ đào tham gia đã tăng lên đáng kể, số lượng suy luận và ổn định mạng đã tăng lên đáng kể. Tại thời điểm viết bài, số lượng công nhân đã đạt 12.100, không vượt qua mức cao nhất của Epoch1 là 14.000 chiếc. Tuy nhiên, Epoch3 hạn chế các card đồ họa có tỷ lệ băm thấp và nhiều lần mở, và có thể suy luận rằng số lượng người tham gia cao hơn nhiều lần so với những ngày đầu.

Epoch 3 mang đến những thay đổi gì?

Cập nhật nút tự động

Chức năng cập nhật nút tự động có thể giảm nhẹ đáng kể gánh nặng vận hành và bảo trì cho thợ mỏ. Trong trải nghiệm vận hành Epoch 1&2, chính thức thường xuyên không định kỳ cập nhật tài liệu và thông báo cập nhật cũng không kịp thời. Điều này dẫn đến nhiều người dùng gặp phải tình trạng tiến trình dừng lại, tưởng rằng thiết bị gặp sự cố, tốn rất nhiều thời gian để xử lý, thực tế nguyên nhân là do người dùng không kịp thời cập nhật.

Quản lý động cơ suy luận thống nhất

Tác giả đã chạy hai lần với mô hình Llama-3.1-8B của Meta, không thấy xuất hiện các mô hình có thể chọn như trong tài liệu chính thức. Điều này đáng nghi ngờ. Ngoài ra, nếu có thể chọn, ưu tiên sử dụng các mô hình có tỷ lệ sử dụng cao hơn, vì khối lượng suy diễn lớn hơn, điểm số nhận được sẽ cao hơn.

Phát hiện và xác thực GPU nâng cao

Inference đã thông báo ngay từ Epoch 2 rằng họ sẽ buộc loại bỏ các card đồ họa có sức mạnh tính toán dưới RTX 3080, có lẽ vì lo lắng về sự không hài lòng của cộng đồng, vì vậy nó đã không được triển khai cho đến cuối Epoch 2. Vẫn có thể thấy rằng có một số lượng lớn card đồ họa không đủ sức mạnh tính toán như 3060 và 3070 để tham gia suy luận. Tác giả cho rằng các thiết bị không đủ sức mạnh tính toán sẽ ảnh hưởng nghiêm trọng đến trải nghiệm của người dùng, và việc loại bỏ các card đồ họa không đủ sức mạnh tính toán có thể mang lại sự cải thiện về chất lượng cho toàn bộ sản phẩm.

Inference cộng đồng DC 中文

Định tuyến tác vụ dựa trên quyền lợi

Cách định tuyến công việc có trọng số quyền lợi tính toán độ ưu tiên của điểm số mà thợ mỏ nhận được, trong công thức tính điểm cho mỗi đơn vị khối lượng công việc, thêm tham số k.

Điểm ưu tiên = 1 + k *（ Bộ nhớ thiết bị khai thác / Bộ nhớ toàn mạng * Tổng số INT đã được stake của toàn mạng * Trọng số danh tiếng của thợ mỏ）

k = 0 thì: Router sử dụng phương thức vòng lặp để cung cấp điểm tương đương cho tất cả các thợ mỏ.

Khi tỷ lệ sử dụng mạng thấp: sẽ tăng giá trị k, điều này sẽ tăng phần thưởng cho thợ mỏ.

Khi tỷ lệ sử dụng mạng cao: sẽ giảm giá trị k, làm cho phần thưởng mà các thợ mỏ có quy mô khác nhau nhận được trở nên cân bằng.

Bằng cách điều chỉnh tham số k một cách linh hoạt, đạt được sự khuyến khích hợp lý nhất và tỷ lệ sử dụng tài nguyên tốt nhất trong các điều kiện vận hành khác nhau của mạng. Điều này có nghĩa là đối với thợ mỏ, ngay cả trong thời kỳ nhu cầu thấp, vẫn có phần thưởng điểm tốt. Trong khi đó, trong thời kỳ nhu cầu cao, ngay cả những thợ mỏ có quyền lợi rất ít cũng có thể đóng góp và nhận được phần thưởng.

Hệ thống hai mã thông báo

Epoch3 ra mắt hệ thống hai token, điểm INT và token INT-DEV. Hiện tại, token và điểm thử nghiệm không có giá trị, chỉ được sử dụng cho mục đích thử nghiệm.

Điểm INT chủ yếu được sử dụng để tính toán khối lượng công việc của thợ mỏ, đồng thời cũng là chỉ số quan trọng để đánh giá mức độ tham gia của mạng lưới ở giai đoạn hiện tại.

INT-DEV token là token của mạng thử nghiệm Solana Devnet, không có giá trị. Chủ yếu được sử dụng để thử nghiệm airdrop và phân phối phần thưởng, hiện tại có chức năng là hệ thống thử nghiệm staking.

Hệ thống staking

Hệ thống staking sử dụng tiêu chuẩn token SPL của mã thông báo INT-DEV. Hệ thống này tương tự như một bộ tăng tốc, cho phép bất kỳ thợ mỏ nào tạo ra một bể staking INT, thiết lập tỷ lệ hoa hồng, thu hút các chủ sở hữu INT khác tham gia staking.

Là người tạo ra hồ chứa staking, càng nhiều người staking và INT, họ sẽ nhận được nhiều nhiệm vụ suy diễn hơn từ mạng lưới. Chủ hồ chứa sẽ thiết lập một tỷ lệ hoa hồng khi tạo hồ. Sau mỗi nhiệm vụ suy diễn được hoàn thành, sẽ có điểm thưởng cho hồ chứa staking, sau khi chủ hồ rút đi, số điểm còn lại sẽ được phân phối cho người dùng staking trong hồ.

Là người dùng chỉ có token INT mà không có máy đào, bạn có thể đặt cược INT của mình vào các bể có tỷ lệ phân chia lợi nhuận cao để nhận được lợi nhuận cao hơn. Mục tiêu là các bể có sức mạnh tính toán cao và số lượng người đặt cược ít.

Bể staking của tác giả, chào mừng mọi người tham gia staking. Hiện tại staking không có lợi nhuận, chỉ dùng để thử nghiệm.

Ở đây đã có bóng dáng của Multicoin Capital hướng dẫn, cũng như xác nhận rằng họ đã tham gia đầu tư. Cơ chế staking của Inference tương tự như cách của io.net để mở rộng nhóm nhà đầu tư. Điều này được coi là lợi thế của những dự án tiến độ chậm, mô hình của các dự án hàng đầu trong cùng lĩnh vực có thể được cải thiện và sử dụng. Nhưng điều này không có nghĩa là việc đưa vào cơ chế staking có thể mang lại ảnh hưởng tích cực đến giá token, chúng ta chỉ cần nhìn vào hiệu suất của IO là rõ ràng.

Hệ thống danh tiếng (ra mắt vào cuối Epoch 3)

Hệ thống uy tín được thiết lập dựa trên tình hình hoạt động của thợ mỏ để cấp giá trị tín nhiệm, đánh giá khả năng xử lý suy diễn của thợ mỏ cũng như tính ổn định trong vận hành. Tôi cho rằng cơ chế này có thể thúc đẩy tính phi tập trung của dự án, điều này mạnh mẽ hơn nhiều so với nhiều dự án chỉ bán nút hoặc cho tiền để tham gia suy diễn, thực sự là một dự án có mục đích.

Tổng kết Kỷ nguyên 2

Epoch2 bắt đầu vào tháng 11 năm ngoái, và hiệu suất ban đầu của Epoch2 tương đối kém, trước hết, lượng suy luận trên toàn mạng trong ba tháng đầu tiên là nhỏ, chỉ bằng 10-20% so với số lượng thông thường. Về vấn đề này, quan chức này đã trả lời ở DC trước khi bắt đầu giai đoạn thứ hai, "câu trả lời đơn giản vào lúc này là "điểm sẽ được chuyển đổi một cách hợp lý, có tính đến giá trị của chúng so với phần còn lại của mạng khi chúng kiếm được", điều này đảm bảo rằng những điểm đầu tiên được thưởng đúng cách, nhưng cũng tính đến việc chúng tôi cần tiếp tục khuyến khích các nhà khai thác đóng góp tính toán của họ". Tức là, theo hoạt động thực tế của mạng lưới, các ưu đãi sẽ được phân phối tương đối công bằng cho những người tham gia.

Tác giả đưa ra suy luận hợp lý về hiệu suất kém của giai đoạn thứ hai:

Khi đó, chính thức cam kết loại bỏ các card đồ họa dưới RTX3090, nhưng thực tế là chính thức không làm như vậy, dẫn đến nhiều nhiệm vụ được phân bổ cho các card đồ họa có sức mạnh tính toán không đủ như RTX3060, điều này sẽ gây ra một số vấn đề, chẳng hạn như trong trường hợp khối lượng nhiệm vụ hạn chế, nhiệm vụ được nhận bởi RTX3060, nhưng RTX3060 có tốc độ suy luận chậm, cuối cùng khiến cho các card có sức mạnh tính toán cao như RTX3090, RTX4090 không nhận được nhiệm vụ, tự nhiên sẽ không có khối lượng suy luận. Điều này dẫn đến sự giảm điểm.

Mặt khác, đội ngũ Inference (trước đây là Kuzco) đã tham gia vào hackathon AI của Solana vào tháng 12 năm ngoái với tư cách là đối tác quan trọng, trùng hợp với thời điểm mạng gặp sự cố. Có thể suy đoán rằng Sam và đội ngũ Inference đã tập trung vào hackathon, mà không duy trì tốt nền tảng.

Tình trạng này kéo dài đến giữa tháng 2, mạng lưới mới bắt đầu phục hồi bình thường. Nhưng sau khi phục hồi, số lượng card đồ họa tham gia khai thác không bằng Epoch1. Hơn nữa, lượng nhiệm vụ mà mỗi card nhận được cũng ít hơn nhiều so với Epoch1, lý do là chính thức đã hạn chế việc chạy nhiều phiên bản trong Epoch2. Theo quy định trên trang web chính thức, một GPU chỉ được phép chạy một worker. Trên thực tế thì có thể chạy nhiều phiên bản trên một card. Tác giả trước đây đã mở mã nguồn script chạy nhiều phiên bản trên github.

Cấu hình gợi ý

Dưới đây là sự kết hợp cấu hình có hiệu suất chi phí cao mà tác giả đã thử nghiệm, đó là X99 + E5 + RTX3090. Trước đây, do cuộc chiến thuế quan, giá card đồ họa 3090 đã tăng từ mức trung bình 5700 nhân dân tệ lên 6700 nhân dân tệ, nhưng hiện tại tình hình đã cải thiện, thị trường đã hạ nhiệt, giá card đồ họa đã giảm về mức giá trước thuế quan, đây là thời điểm để mua vào. Hơn nữa, nếu độc giả muốn tham gia đầu tư vào các thành phần máy đào, trước tiên sẽ thua lỗ 20-30% vì đây là chi phí khấu hao thiết bị, tiền điện tính riêng. Nếu muốn chọn nhà cung cấp điện toán đám mây hoặc nhà cung cấp dịch vụ trung gian, nên đảm bảo rằng bên đối tác có khả năng đối phó với sự không ổn định của các dự án khởi nghiệp.

Cuối cùng, xin nhắc nhở rằng Inference là một dự án khai thác AI ở giai đoạn đầu, và hiện tại chưa công bố thông tin về việc huy động vốn do lý do không rõ ràng. Tình trạng hoạt động của mạng không đủ ổn định, thường xuyên xảy ra tình trạng mạng bị sập, và việc cập nhật thường xuyên mà không có thông báo dẫn đến việc máy khai thác bị mất kết nối. Một rủi ro khác là lợi nhuận chưa được biết, hiện tại chỉ có thể nhận điểm tích lũy, liệu có đáng để bỏ công sức tham gia vào dự án này không, xin mọi người tự cân nhắc.

Bo mạch chủ: Nền tảng cắm trực tiếp đa thẻ U kép X99

CPU：E5 2680V

Bộ nhớ: 32GB+ (Khởi động nhiều thẻ cùng lúc sẽ tạm thời chiếm nhiều bộ nhớ)

Nguồn điện được xác định dựa trên công suất tiêu thụ, ví dụ như cấu hình 6 card 3090 với hai nguồn điện (cần phải cấu hình dây khởi động nguồn song song).

Ổ cứng: 500GB+ (mỗi quy trình cần tải xuống một mô hình AI riêng, có yêu cầu nhất định về ổ cứng)

Mạng: Trên một gigabit (Mạng có ảnh hưởng rất lớn đến công việc, cần cấu hình tương đối tốt)

6 thẻ 3090, máy đơn tải đầy 3-4kw, tiêu thụ thực tế 1-2kw. (Chủ yếu phụ thuộc vào tình trạng hoạt động của mạng, không phải là hoạt động hết công suất 7*24 giờ.)

Ngân sách: 700 yên cho phiên bản chính, 200 yên cho CPU, 600 yên cho nguồn điện, 36.000 yên cho 6 \ * 3090, 600 yên cho khung và các cấu hình khác. Một bộ có giá khoảng 38.000 yên. Khi chạy mô hình meta lạc đà không bướu 8b, sức mạnh tính toán là khoảng 600 Toks / s và khối lượng suy luận lý thuyết hàng ngày của một máy là 50M và lượng đo được là khoảng 10-20M. Dữ liệu này chỉ mang tính chất tham khảo.

A2.4%

Xem bản gốc

Nội dung chỉ mang tính chất tham khảo, không phải là lời chào mời hay đề nghị. Không cung cấp tư vấn về đầu tư, thuế hoặc pháp lý. Xem Tuyên bố miễn trừ trách nhiệm để biết thêm thông tin về rủi ro.

Phần thưởng
Thích
Bình luận
Chia sẻ

Bình luận

0/400

Không có bình luận

Chủ đề
#PI#
305k Trạng thái
#BTC#
270k Trạng thái
#ETH#
178k Trạng thái
4#GateioInto11#
83k Trạng thái
5#GT#
70k Trạng thái
6#ContentStar#
69k Trạng thái
7#DOGE#
64k Trạng thái
8#BOME#
62k Trạng thái
9#MAGA#
53k Trạng thái
10#SLERF#
51k Trạng thái

Ghim

sơ đồ trang web