Vào ngày 27 tháng 11, Zhao Changpeng đã đăng bài trên X cho biết, các nhiệm vụ như gán nhãn dữ liệu AI rất phù hợp để thực hiện thông qua blockchain, có thể tận dụng lực lượng lao động giá rẻ toàn cầu và thanh toán ngay lập tức bằng tiền điện tử, phá vỡ giới hạn địa lý.
Ghi nhãn dữ liệu là việc gán nhãn cho dữ liệu gốc (như văn bản, hình ảnh, âm thanh, v.v.) bằng cách thủ công hoặc tự động, để nó có thông tin cấu trúc cụ thể. Dữ liệu đã được ghi nhãn được sử dụng để đào tạo các mô hình học máy hoặc trí tuệ nhân tạo, ví dụ như việc ghi nhãn cảm xúc cho văn bản (tích cực, tiêu cực, trung lập) là một dạng ghi nhãn dữ liệu. Việc sử dụng blockchain cho ghi nhãn dữ liệu trí tuệ nhân tạo đặc biệt phù hợp với những tình huống ghi nhãn dữ liệu cần có tính minh bạch cao, độ tin cậy và hợp tác phân tán. Điều này không chỉ nâng cao hiệu quả và chất lượng ghi nhãn dữ liệu mà còn tạo ra những khả năng mới cho hợp tác toàn cầu và giao dịch dữ liệu.
Hiện tại, trong lĩnh vực này có những dự án chất lượng nào? Triển vọng phát triển của lĩnh vực này ra sao?
Vai trò của blockchain trong việc gán nhãn dữ liệu AI
Công nghệ blockchain là một công nghệ sổ cái phân tán phi tập trung, có các đặc điểm như tính minh bạch, tính không thể sửa đổi và tính khả năng truy xuất. Những đặc điểm này có thể giải quyết các vấn đề sau trong các phương pháp truyền thống về việc đánh dấu dữ liệu:
Tính xác thực của dữ liệu và chống giả mạo: Mỗi bản ghi được đánh dấu đều được ghi vào blockchain, không thể bị thay đổi tùy ý, đảm bảo độ tin cậy của việc đánh dấu.
Tính minh bạch trong phân bổ nhiệm vụ: Blockchain có thể ghi lại quá trình phân phát, thực hiện và kiểm tra nhiệm vụ, ngăn chặn việc phân bổ nhiệm vụ không công bằng hoặc kết quả bị chỉnh sửa.
Cơ chế khuyến khích: Sử dụng công nghệ hợp đồng thông minh của blockchain, các nhân viên gán nhãn dữ liệu có thể tự động nhận được tiền điện tử hoặc các phần thưởng khác khi hoàn thành nhiệm vụ.
Dữ liệu nguồn gốc: Thông tin về nguồn gốc, người gán nhãn và người kiểm tra của mỗi nhãn có thể được theo dõi.
Ứng dụng
Gán nhãn phân tán: Sử dụng blockchain để phân bổ nhiệm vụ gán nhãn dữ liệu cho các nhân viên gán nhãn trên toàn cầu, hiệu quả xử lý dữ liệu cao hơn.
Kiểm tra chất lượng: Kết quả đánh dấu nhiều người được so sánh và kiểm tra thông qua công nghệ blockchain, đảm bảo độ chính xác của việc đánh dấu.
Giao dịch dữ liệu được gán nhãn: Dữ liệu đã được gán nhãn có thể được giao dịch trên blockchain, cả bên mua và bên bán đều không cần lo lắng về tính toàn vẹn hoặc tính xác thực của dữ liệu.
Bảo vệ quyền riêng tư: Sử dụng blockchain để lưu trữ dữ liệu được gán nhãn một cách mã hóa, đảm bảo an toàn cho dữ liệu riêng tư.
Dự án liên quan
OORT DataHub: Cung cấp dịch vụ chú thích dữ liệu phi tập trung dựa trên blockchain sử dụng thuật toán Proof of Honest để kiểm soát chất lượng. Nền tảng của nó phân phối các nhiệm vụ, xem xét chất lượng dữ liệu và thanh toán thông qua các hợp đồng thông minh, thu hút người chú thích toàn cầu, đồng thời đảm bảo tính minh bạch và bảo vệ quyền riêng tư của dữ liệu chú thích.
Mô hình kinh tế của token dự án như sau:
Phần thưởng cộng đồng*: Bằng cách tham gia vào việc gán nhãn và phân tích dữ liệu, người dùng có thể nhận được phần thưởng bằng token $OORT. Ngoài ra, còn có thể nhận được NFT độc đáo liên quan đến đóng góp, những NFT này cung cấp quyền lợi bổ sung, chẳng hạn như phần thưởng nâng cao tỷ lệ lợi nhuận hàng năm (APY), giảm giá thiết bị và quyền biểu quyết DAO.*
Đặt cọc nhiệm vụ*: Người tham gia cần đặt cọc ít nhất 210 $OORT token để thể hiện cam kết đối với nhiệm vụ, sau khi hoàn thành nhiệm vụ sẽ hoàn trả token và phát thưởng.
Chia sẻ doanh thu bán hàng*: Một số chủ sở hữu NFT còn có thể nhận cổ tức từ doanh thu bán dữ liệu trong tương lai, nâng cao lợi nhuận dài hạn.
**PublicAI:**Dự án AI trên chuỗi Solana, nhằm kết nối bên có nhu cầu dữ liệu và các nhà đánh dấu toàn cầu, thông qua cơ chế khuyến khích bằng mã thông báo tiền điện tử để thưởng cho những người tham gia, đồng thời sử dụng công nghệ blockchain để ghi lại chi tiết quá trình đánh dấu, đảm bảo an toàn và quyền riêng tư dữ liệu.
Mô hình kinh tế của token dự án như sau:
***Phần thưởng cộng đồng:10% token Public sẽ được sử dụng cho phần thưởng airdrop cho người dùng trong giai đoạn đầu tương tác, cụ thể cóba phương pháp để nhận airdrop,****trở thành AI Builder: thu thập nội dung internet chất lượng cao;*trở thành AI Validator: xác minh nội dung đã thu thập; trở thành AI Developer: sử dụng bộ dữ liệu đã xác minh để đào tạo đại lý AI.
Phân bổ token***:****Dự án đã hoàn thành vòng gọi vốn hạt giống trị giá 2 triệu USD vào tháng 1 năm 2024, các nhà đầu tư bao gồm IOBC Capital, Foresight Ventures, Solana Foundation, Everstate Capital và nhiều giáo sư nổi tiếng trong lĩnh vực trí tuệ nhân tạo, hiện tại chi tiết phân bổ token PublicAI vẫn chưa được xác định.
Những thách thức phải đối mặt
Hiện tại, có vài yếu tố kìm hãm sự phát triển của lĩnh vực này: thứ nhất là việc gán nhãn dữ liệu AI cần nhiều tài nguyên tính toán và lưu trữ; thứ hai là hiệu suất của dự án bị giới hạn bởi khả năng mở rộng của blockchain; thứ ba là tiêu chuẩn hóa công nghệ và quy định vẫn chưa hoàn thiện.
Thứ hai trong số này có lẽ là thách thức lớn nhất vào lúc này. Điều này là do việc ghi nhãn dữ liệu AI và đào tạo mô hình thường yêu cầu nhiều tài nguyên tính toán và các nút trong mạng blockchain có sức mạnh tính toán hạn chế. Trên tiền đề đảm bảo tính phi tập trung của blockchain, làm thế nào để tích hợp và sử dụng hiệu quả tài nguyên điện toán phân tán đáp ứng nhu cầu tính toán của các dự án ghi nhãn dữ liệu AI là bài toán cấp bách cần giải quyết. Có thông tin cho rằng Greenfield, một công ty con của Binance, đang cung cấp hỗ trợ lưu trữ cho đường đua này và hy vọng sẽ có nhiều tài nguyên lưu trữ và tính toán hơn để thực hành trong lĩnh vực này.
Nội dung chỉ mang tính chất tham khảo, không phải là lời chào mời hay đề nghị. Không cung cấp tư vấn về đầu tư, thuế hoặc pháp lý. Xem Tuyên bố miễn trừ trách nhiệm để biết thêm thông tin về rủi ro.
Đường đua dữ liệu AI của Zhao Changpeng advocate hiện đang phát triển như thế nào?
Rachel, Kinh tế Vàng
Vào ngày 27 tháng 11, Zhao Changpeng đã đăng bài trên X cho biết, các nhiệm vụ như gán nhãn dữ liệu AI rất phù hợp để thực hiện thông qua blockchain, có thể tận dụng lực lượng lao động giá rẻ toàn cầu và thanh toán ngay lập tức bằng tiền điện tử, phá vỡ giới hạn địa lý.
Ghi nhãn dữ liệu là việc gán nhãn cho dữ liệu gốc (như văn bản, hình ảnh, âm thanh, v.v.) bằng cách thủ công hoặc tự động, để nó có thông tin cấu trúc cụ thể. Dữ liệu đã được ghi nhãn được sử dụng để đào tạo các mô hình học máy hoặc trí tuệ nhân tạo, ví dụ như việc ghi nhãn cảm xúc cho văn bản (tích cực, tiêu cực, trung lập) là một dạng ghi nhãn dữ liệu. Việc sử dụng blockchain cho ghi nhãn dữ liệu trí tuệ nhân tạo đặc biệt phù hợp với những tình huống ghi nhãn dữ liệu cần có tính minh bạch cao, độ tin cậy và hợp tác phân tán. Điều này không chỉ nâng cao hiệu quả và chất lượng ghi nhãn dữ liệu mà còn tạo ra những khả năng mới cho hợp tác toàn cầu và giao dịch dữ liệu.
Hiện tại, trong lĩnh vực này có những dự án chất lượng nào? Triển vọng phát triển của lĩnh vực này ra sao?
Vai trò của blockchain trong việc gán nhãn dữ liệu AI
Công nghệ blockchain là một công nghệ sổ cái phân tán phi tập trung, có các đặc điểm như tính minh bạch, tính không thể sửa đổi và tính khả năng truy xuất. Những đặc điểm này có thể giải quyết các vấn đề sau trong các phương pháp truyền thống về việc đánh dấu dữ liệu:
Ứng dụng
Dự án liên quan
OORT DataHub: Cung cấp dịch vụ chú thích dữ liệu phi tập trung dựa trên blockchain sử dụng thuật toán Proof of Honest để kiểm soát chất lượng. Nền tảng của nó phân phối các nhiệm vụ, xem xét chất lượng dữ liệu và thanh toán thông qua các hợp đồng thông minh, thu hút người chú thích toàn cầu, đồng thời đảm bảo tính minh bạch và bảo vệ quyền riêng tư của dữ liệu chú thích.
Mô hình kinh tế của token dự án như sau:
Phần thưởng cộng đồng*: Bằng cách tham gia vào việc gán nhãn và phân tích dữ liệu, người dùng có thể nhận được phần thưởng bằng token $OORT. Ngoài ra, còn có thể nhận được NFT độc đáo liên quan đến đóng góp, những NFT này cung cấp quyền lợi bổ sung, chẳng hạn như phần thưởng nâng cao tỷ lệ lợi nhuận hàng năm (APY), giảm giá thiết bị và quyền biểu quyết DAO.*
Đặt cọc nhiệm vụ*: Người tham gia cần đặt cọc ít nhất 210 $OORT token để thể hiện cam kết đối với nhiệm vụ, sau khi hoàn thành nhiệm vụ sẽ hoàn trả token và phát thưởng.
Chia sẻ doanh thu bán hàng*: Một số chủ sở hữu NFT còn có thể nhận cổ tức từ doanh thu bán dữ liệu trong tương lai, nâng cao lợi nhuận dài hạn.
Mô hình kinh tế của token dự án như sau:
***Phần thưởng cộng đồng:10% token Public sẽ được sử dụng cho phần thưởng airdrop cho người dùng trong giai đoạn đầu tương tác, cụ thể cóba phương pháp để nhận airdrop,****trở thành AI Builder: thu thập nội dung internet chất lượng cao;*trở thành AI Validator: xác minh nội dung đã thu thập; trở thành AI Developer: sử dụng bộ dữ liệu đã xác minh để đào tạo đại lý AI.
Phân bổ token***:****Dự án đã hoàn thành vòng gọi vốn hạt giống trị giá 2 triệu USD vào tháng 1 năm 2024, các nhà đầu tư bao gồm IOBC Capital, Foresight Ventures, Solana Foundation, Everstate Capital và nhiều giáo sư nổi tiếng trong lĩnh vực trí tuệ nhân tạo, hiện tại chi tiết phân bổ token PublicAI vẫn chưa được xác định.
Những thách thức phải đối mặt
Hiện tại, có vài yếu tố kìm hãm sự phát triển của lĩnh vực này: thứ nhất là việc gán nhãn dữ liệu AI cần nhiều tài nguyên tính toán và lưu trữ; thứ hai là hiệu suất của dự án bị giới hạn bởi khả năng mở rộng của blockchain; thứ ba là tiêu chuẩn hóa công nghệ và quy định vẫn chưa hoàn thiện.
Thứ hai trong số này có lẽ là thách thức lớn nhất vào lúc này. Điều này là do việc ghi nhãn dữ liệu AI và đào tạo mô hình thường yêu cầu nhiều tài nguyên tính toán và các nút trong mạng blockchain có sức mạnh tính toán hạn chế. Trên tiền đề đảm bảo tính phi tập trung của blockchain, làm thế nào để tích hợp và sử dụng hiệu quả tài nguyên điện toán phân tán đáp ứng nhu cầu tính toán của các dự án ghi nhãn dữ liệu AI là bài toán cấp bách cần giải quyết. Có thông tin cho rằng Greenfield, một công ty con của Binance, đang cung cấp hỗ trợ lưu trữ cho đường đua này và hy vọng sẽ có nhiều tài nguyên lưu trữ và tính toán hơn để thực hành trong lĩnh vực này.