Điểm nhấn mới trong lĩnh vực AI: Giá trị và tương lai của việc gán nhãn dữ liệu
Trong lĩnh vực trí tuệ nhân tạo, một cuộc tranh luận về giá trị của việc gán nhãn dữ liệu đang diễn ra âm thầm. Một mặt, một gã khổng lồ công nghệ đã mua gần một nửa cổ phần của một công ty gán nhãn dữ liệu với giá lên đến 14,8 tỷ đô la, gây ra một cuộc đánh giá lại giá trị của việc gán nhãn dữ liệu trong toàn ngành. Mặt khác, một số dự án AI Web3 mới nổi vẫn đang nỗ lực thoát khỏi cái mác "thổi phồng khái niệm", cố gắng chứng minh giá trị thực của mình. Sự tương phản lớn này ẩn chứa những hiểu biết thị trường nào?
Đầu tiên, chúng ta cần nhận ra rằng, so với việc tập hợp sức mạnh tính toán phi tập trung, việc gán nhãn dữ liệu có thể là một lĩnh vực tiềm năng hơn. Mặc dù việc sử dụng tài nguyên GPU nhàn rỗi để thách thức các gã khổng lồ điện toán đám mây nghe có vẻ hấp dẫn, nhưng thực tế sức mạnh tính toán về bản chất là một hàng hóa chuẩn hóa, điểm cạnh tranh chính nằm ở giá cả và khả năng tiếp cận. Tuy nhiên, lợi thế này có thể nhanh chóng biến mất do sự điều chỉnh giá hoặc tăng cung từ các doanh nghiệp lớn.
So với đó, đánh dấu dữ liệu là một lĩnh vực khác biệt cần đến trí tuệ và phán đoán chuyên môn của con người. Mỗi dấu hiệu chất lượng cao đều chứa đựng kiến thức chuyên môn độc đáo, bối cảnh văn hóa và kinh nghiệm nhận thức, những điều này không thể dễ dàng sao chép như sức mạnh tính toán của GPU. Ví dụ, một dấu hiệu chẩn đoán hình ảnh ung thư chính xác cần đến trực giác chuyên môn của bác sĩ ung thư có kinh nghiệm, một phân tích tâm lý thị trường tài chính sâu sắc không thể thiếu kinh nghiệm thực chiến của những nhà giao dịch có kinh nghiệm. Sự khan hiếm và tính không thể thay thế này khiến việc đánh dấu dữ liệu có một rào cản cạnh tranh không thể so sánh với sức mạnh tính toán.
Gần đây, một công ty công nghệ lớn đã mua lại 49% cổ phần của một công ty gán nhãn dữ liệu với giá 14,8 tỷ USD, đây là khoản đầu tư lớn nhất trong lĩnh vực AI năm nay. Đáng chú ý hơn, nhà sáng lập trẻ tuổi của công ty bị mua lại sẽ đồng thời phụ trách "phòng thí nghiệm nghiên cứu siêu thông minh" mới được thành lập bởi bên mua. Công ty gán nhãn dữ liệu này chỉ mới được thành lập 7 năm, nhưng đã có giá trị lên tới 30 tỷ USD, với khách hàng bao gồm nhiều công ty hàng đầu trong lĩnh vực AI và các cơ quan chính phủ.
Trường hợp mua lại này tiết lộ một thực tế bị bỏ qua: ở giai đoạn hiện tại, sức mạnh tính toán không còn là tài nguyên khan hiếm, kiến trúc mô hình cũng dần trở nên đồng nhất, điều thực sự quyết định giới hạn thông minh của AI là những dữ liệu chất lượng cao được xử lý tỉ mỉ. Đằng sau khoản đầu tư khổng lồ này là sự nhận thức sâu sắc về quan niệm "dữ liệu là dầu mỏ" trong thời đại AI.
Tuy nhiên, luôn có những thách thức trong thị trường. Cũng như một số nền tảng tổng hợp sức mạnh đám mây cố gắng lật đổ dịch vụ điện toán đám mây tập trung, một số dự án Web3 AI mới nổi đang cố gắng sử dụng công nghệ blockchain để tái định hình các quy tắc phân phối giá trị của việc gán nhãn dữ liệu. Vấn đề chính của mô hình gán nhãn dữ liệu truyền thống không phải ở công nghệ, mà ở thiết kế cơ chế khuyến khích.
Ví dụ, một bác sĩ có thể mất hàng giờ để gán nhãn hình ảnh y tế, nhưng chỉ nhận được một khoản thù lao rất thấp, trong khi mô hình AI được đào tạo từ những dữ liệu này có thể có giá trị hàng tỷ đô la, nhưng bác sĩ lại không thể chia sẻ khoản lợi nhuận này. Sự phân phối giá trị cực kỳ bất công này đã nghiêm trọng đe dọa động lực cung cấp dữ liệu chất lượng cao.
Giải pháp mà các dự án Web3 đưa ra là giới thiệu cơ chế khuyến khích bằng token, biến những người gán nhãn dữ liệu từ những "công nhân dữ liệu" giá rẻ thành những "cổ đông" thực sự của mạng AI. Mô hình này cố gắng tận dụng lợi thế của Web3 để cải cách mối quan hệ sản xuất, tạo ra những khả năng mới trong lĩnh vực gán nhãn dữ liệu.
Thú vị là, một dự án Web3 AI vừa đúng lúc ra mắt vào thời điểm này, điều này có thể phản ánh một bước ngoặt của thị trường: dù là Web3 AI hay AI truyền thống, cả hai đã chuyển từ "cạnh tranh sức mạnh tính toán" sang một giai đoạn mới của "cạnh tranh chất lượng dữ liệu".
Khi các ông lớn truyền thống xây dựng rào cản dữ liệu bằng vốn, Web3 đang cố gắng thúc đẩy một cuộc thử nghiệm táo bạo về "dân chủ hóa dữ liệu" với mô hình kinh tế mới. Cuộc chiến về quyền kiểm soát tương lai của AI mới chỉ bắt đầu.
Xem bản gốc
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
17 thích
Phần thưởng
17
4
Chia sẻ
Bình luận
0/400
MoneyBurner
· 6giờ trước
Đường đua ghi chú cũng đến, cá cược mười đô la làm một ván?
Xem bản gốcTrả lời0
FastLeaver
· 6giờ trước
Công cụ đánh dấu đã làm rỗng các ông lớn công nghệ ha ha
Xem bản gốcTrả lời0
metaverse_hermit
· 6giờ trước
Cướp tiền phải không? Ghi chú có giá trị như vậy sao?
Xem bản gốcTrả lời0
MEVHunterX
· 6giờ trước
Blockchain và việc tái phân phối giá trị Web3, khá thú vị
Sự trỗi dậy của việc gán nhãn dữ liệu AI: Điểm nhấn ngành công nghiệp đằng sau giá trị 30 tỷ USD
Điểm nhấn mới trong lĩnh vực AI: Giá trị và tương lai của việc gán nhãn dữ liệu
Trong lĩnh vực trí tuệ nhân tạo, một cuộc tranh luận về giá trị của việc gán nhãn dữ liệu đang diễn ra âm thầm. Một mặt, một gã khổng lồ công nghệ đã mua gần một nửa cổ phần của một công ty gán nhãn dữ liệu với giá lên đến 14,8 tỷ đô la, gây ra một cuộc đánh giá lại giá trị của việc gán nhãn dữ liệu trong toàn ngành. Mặt khác, một số dự án AI Web3 mới nổi vẫn đang nỗ lực thoát khỏi cái mác "thổi phồng khái niệm", cố gắng chứng minh giá trị thực của mình. Sự tương phản lớn này ẩn chứa những hiểu biết thị trường nào?
Đầu tiên, chúng ta cần nhận ra rằng, so với việc tập hợp sức mạnh tính toán phi tập trung, việc gán nhãn dữ liệu có thể là một lĩnh vực tiềm năng hơn. Mặc dù việc sử dụng tài nguyên GPU nhàn rỗi để thách thức các gã khổng lồ điện toán đám mây nghe có vẻ hấp dẫn, nhưng thực tế sức mạnh tính toán về bản chất là một hàng hóa chuẩn hóa, điểm cạnh tranh chính nằm ở giá cả và khả năng tiếp cận. Tuy nhiên, lợi thế này có thể nhanh chóng biến mất do sự điều chỉnh giá hoặc tăng cung từ các doanh nghiệp lớn.
So với đó, đánh dấu dữ liệu là một lĩnh vực khác biệt cần đến trí tuệ và phán đoán chuyên môn của con người. Mỗi dấu hiệu chất lượng cao đều chứa đựng kiến thức chuyên môn độc đáo, bối cảnh văn hóa và kinh nghiệm nhận thức, những điều này không thể dễ dàng sao chép như sức mạnh tính toán của GPU. Ví dụ, một dấu hiệu chẩn đoán hình ảnh ung thư chính xác cần đến trực giác chuyên môn của bác sĩ ung thư có kinh nghiệm, một phân tích tâm lý thị trường tài chính sâu sắc không thể thiếu kinh nghiệm thực chiến của những nhà giao dịch có kinh nghiệm. Sự khan hiếm và tính không thể thay thế này khiến việc đánh dấu dữ liệu có một rào cản cạnh tranh không thể so sánh với sức mạnh tính toán.
Gần đây, một công ty công nghệ lớn đã mua lại 49% cổ phần của một công ty gán nhãn dữ liệu với giá 14,8 tỷ USD, đây là khoản đầu tư lớn nhất trong lĩnh vực AI năm nay. Đáng chú ý hơn, nhà sáng lập trẻ tuổi của công ty bị mua lại sẽ đồng thời phụ trách "phòng thí nghiệm nghiên cứu siêu thông minh" mới được thành lập bởi bên mua. Công ty gán nhãn dữ liệu này chỉ mới được thành lập 7 năm, nhưng đã có giá trị lên tới 30 tỷ USD, với khách hàng bao gồm nhiều công ty hàng đầu trong lĩnh vực AI và các cơ quan chính phủ.
Trường hợp mua lại này tiết lộ một thực tế bị bỏ qua: ở giai đoạn hiện tại, sức mạnh tính toán không còn là tài nguyên khan hiếm, kiến trúc mô hình cũng dần trở nên đồng nhất, điều thực sự quyết định giới hạn thông minh của AI là những dữ liệu chất lượng cao được xử lý tỉ mỉ. Đằng sau khoản đầu tư khổng lồ này là sự nhận thức sâu sắc về quan niệm "dữ liệu là dầu mỏ" trong thời đại AI.
Tuy nhiên, luôn có những thách thức trong thị trường. Cũng như một số nền tảng tổng hợp sức mạnh đám mây cố gắng lật đổ dịch vụ điện toán đám mây tập trung, một số dự án Web3 AI mới nổi đang cố gắng sử dụng công nghệ blockchain để tái định hình các quy tắc phân phối giá trị của việc gán nhãn dữ liệu. Vấn đề chính của mô hình gán nhãn dữ liệu truyền thống không phải ở công nghệ, mà ở thiết kế cơ chế khuyến khích.
Ví dụ, một bác sĩ có thể mất hàng giờ để gán nhãn hình ảnh y tế, nhưng chỉ nhận được một khoản thù lao rất thấp, trong khi mô hình AI được đào tạo từ những dữ liệu này có thể có giá trị hàng tỷ đô la, nhưng bác sĩ lại không thể chia sẻ khoản lợi nhuận này. Sự phân phối giá trị cực kỳ bất công này đã nghiêm trọng đe dọa động lực cung cấp dữ liệu chất lượng cao.
Giải pháp mà các dự án Web3 đưa ra là giới thiệu cơ chế khuyến khích bằng token, biến những người gán nhãn dữ liệu từ những "công nhân dữ liệu" giá rẻ thành những "cổ đông" thực sự của mạng AI. Mô hình này cố gắng tận dụng lợi thế của Web3 để cải cách mối quan hệ sản xuất, tạo ra những khả năng mới trong lĩnh vực gán nhãn dữ liệu.
Thú vị là, một dự án Web3 AI vừa đúng lúc ra mắt vào thời điểm này, điều này có thể phản ánh một bước ngoặt của thị trường: dù là Web3 AI hay AI truyền thống, cả hai đã chuyển từ "cạnh tranh sức mạnh tính toán" sang một giai đoạn mới của "cạnh tranh chất lượng dữ liệu".
Khi các ông lớn truyền thống xây dựng rào cản dữ liệu bằng vốn, Web3 đang cố gắng thúc đẩy một cuộc thử nghiệm táo bạo về "dân chủ hóa dữ liệu" với mô hình kinh tế mới. Cuộc chiến về quyền kiểm soát tương lai của AI mới chỉ bắt đầu.