Cách mạng tự động hóa do AI và mã hóa thúc đẩy: Thời khắc "ChatGPT" của Bots sắp đến
Sự xuất hiện của ChatGPT đã hoàn toàn thay đổi nhận thức của con người về trí tuệ nhân tạo. Tuy nhiên, giấc mơ thực sự của nhân loại là để AI tương tác với thế giới vật chất dưới hình thức mã hóa, giống như những gì được miêu tả trong các bộ phim khoa học viễn tưởng.
Những bước đột phá lớn trong lĩnh vực Bots dường như sắp đến. Bài viết này sẽ phân tích cách tiến bộ trong trí tuệ nhân tạo trong những năm gần đây đã thay đổi bối cảnh ngành, khám phá cách công nghệ pin, tối ưu hóa độ trễ và cải tiến thu thập dữ liệu sẽ định hình tương lai, cũng như vai trò của mã hóa trong đó. Đồng thời, bài viết cũng sẽ làm rõ các lĩnh vực đáng chú ý như an toàn Bots, tài chính, đánh giá và giáo dục.
1. Các yếu tố chính thúc đẩy sự thay đổi
sự đột phá của trí tuệ nhân tạo
Tiến bộ của các mô hình ngôn ngữ lớn đa phương thức đã cung cấp "bộ não" cho các Bots thực hiện các nhiệm vụ phức tạp. Bots chủ yếu cảm nhận môi trường thông qua thị giác và thính giác. Các mô hình thị giác máy tính truyền thống rất giỏi trong việc phát hiện hoặc phân loại đối tượng, nhưng gặp khó khăn trong việc chuyển đổi thông tin thị giác thành lệnh hành động. Mặc dù các mô hình ngôn ngữ lớn thể hiện xuất sắc trong việc hiểu và tạo ra văn bản, nhưng chúng lại thiếu khả năng cảm nhận thế giới vật lý.
Mô hình thị giác-ngôn ngữ-hành động ( VLA ) cho phép Bots tích hợp nhận thức thị giác, hiểu ngôn ngữ và hành động vật lý trong một khung thống nhất. Vào tháng 2 năm 2025, một công ty trí tuệ nhân tạo đã công bố mô hình điều khiển Bots hình người đa năng với khả năng tổng quát không mẫu và kiến trúc hệ thống đôi, thiết lập tiêu chuẩn mới cho ngành. Khả năng tổng quát không mẫu cho phép Bots thích ứng với các tình huống, đối tượng và chỉ thị mới mà không cần đào tạo lại cho mỗi nhiệm vụ. Kiến trúc hệ thống đôi tách biệt suy diễn bậc cao và suy diễn nhẹ, tạo ra Bots hình người thương mại hóa với tư duy giống người và độ chính xác thời gian thực.
Robot kinh tế trở thành hiện thực
Công nghệ thay đổi thế giới luôn có tính phổ cập. Khi giá của một số robot thấp hơn xe sedan hạng trung hoặc thu nhập tối thiểu hàng năm ở Mỹ, hình ảnh một thế giới mà lao động chân tay và các công việc hàng ngày chủ yếu được hoàn thành bởi robot sẽ không còn xa vời.
từ kho hàng đến thị trường tiêu dùng
Công nghệ Bots đang mở rộng từ các giải pháp kho bãi sang lĩnh vực tiêu dùng. Thế giới này được thiết kế cho con người - con người có thể hoàn thành tất cả các công việc của Bots chuyên nghiệp, trong khi Bots chuyên nghiệp không thể đảm nhận tất cả các công việc của con người. Các công ty Bots không còn giới hạn trong việc sản xuất Bots chuyên dụng cho nhà máy, mà chuyển sang phát triển các Bots hình người đa năng hơn. Do đó, công nghệ Bots không chỉ tồn tại trong kho bãi mà còn thấm nhuần vào cuộc sống hàng ngày.
Chi phí là một trong những nút thắt chính về khả năng mở rộng. Chỉ số quan trọng nhất là chi phí tổng hợp hàng giờ, được tính bằng cách cộng chi phí cơ hội về thời gian đào tạo và sạc, chi phí thực hiện nhiệm vụ và chi phí mua Bots, sau đó chia cho tổng thời gian hoạt động của Bots. Chi phí này cần thấp hơn mức lương trung bình của ngành liên quan để có tính cạnh tranh.
Để thâm nhập toàn diện vào lĩnh vực kho bãi, chi phí tổng hợp của Bots mỗi giờ phải thấp hơn 31,39 USD. Trong khi đó, trong thị trường tiêu dùng lớn nhất - lĩnh vực giáo dục tư nhân và dịch vụ sức khỏe, chi phí này cần được kiểm soát dưới 35,18 USD. Hiện tại, Bots đang phát triển theo hướng rẻ hơn, hiệu quả hơn và đa dụng hơn.
2. Bước đột phá tiếp theo của công nghệ Bots
Tối ưu hóa pin
Công nghệ pin luôn là điểm nghẽn của những robot thân thiện với người dùng. Thời gian sử dụng của một số robot hình người chỉ khoảng 2 giờ. Người dùng rõ ràng không muốn phải sạc pin thủ công mỗi hai giờ, vì vậy việc tự sạc và cơ sở hạ tầng kết nối đã trở thành hướng phát triển trọng điểm. Hiện tại, có hai chế độ sạc chính cho robot: thay pin hoặc sạc trực tiếp.
Chế độ thay pin thực hiện công việc liên tục bằng cách thay thế nhanh chóng các bộ pin đã cạn kiệt, tối đa hóa thời gian hoạt động và giảm thiểu thời gian dừng máy, phù hợp với các tình huống ngoài trời hoặc nhà máy. Quy trình này có thể được thực hiện bằng tay hoặc tự động.
Sạc cảm ứng sử dụng phương thức cung cấp điện không dây, mặc dù việc sạc đầy mất nhiều thời gian hơn, nhưng có thể dễ dàng thực hiện quy trình hoàn toàn tự động.
tối ưu hóa độ trễ
Hoạt động độ trễ thấp có thể được chia thành hai loại: nhận thức môi trường và điều khiển từ xa. Nhận thức đề cập đến khả năng nhận thức không gian của Bots đối với môi trường, trong khi điều khiển từ xa đề cập đến việc kiểm soát thời gian thực của người điều hành.
Nghiên cứu cho thấy, hệ thống cảm nhận của Bots bắt đầu từ cảm biến giá rẻ, nhưng lợi thế công nghệ nằm ở phần mềm tích hợp, tính toán tiêu thụ điện năng thấp và vòng điều khiển chính xác trong vài mili giây. Khi Bots hoàn thành việc định vị không gian, mạng nơ-ron nhẹ sẽ đánh dấu các yếu tố như chướng ngại vật, pallet hoặc con người. Sau khi nhãn cảnh được nhập vào hệ thống lập kế hoạch, ngay lập tức sẽ tạo ra lệnh điều khiển động cơ gửi tới chân, cụm bánh xe hoặc cánh tay cơ khí. Độ trễ cảm nhận dưới 50 mili giây tương đương với tốc độ phản xạ của con người - bất kỳ độ trễ nào vượt quá ngưỡng này sẽ khiến Bots hành động vụng về. Do đó, 90% quyết định cần được thực hiện qua một mạng lưới thị giác-ngôn ngữ-hành động duy nhất tại chỗ.
Robot hoàn toàn tự chủ cần đảm bảo mô hình VLA hiệu suất cao với độ trễ dưới 50 mili giây; robot điều khiển từ xa yêu cầu độ trễ tín hiệu giữa đầu điều khiển và robot không vượt quá 50 mili giây. Tại đây, tầm quan trọng của mô hình VLA càng được nhấn mạnh - nếu đầu vào hình ảnh và văn bản được xử lý bởi các mô hình khác nhau trước khi nhập vào mô hình ngôn ngữ lớn, tổng độ trễ sẽ vượt quá ngưỡng 50 mili giây.
Tối ưu hóa thu thập dữ liệu
Việc thu thập dữ liệu chủ yếu có ba phương thức: dữ liệu video từ thế giới thực, dữ liệu tổng hợp và dữ liệu điều khiển từ xa. Rào cản cốt lõi giữa dữ liệu thực và dữ liệu tổng hợp nằm ở việc thu hẹp sự khác biệt giữa hành vi vật lý của Bots và mô hình video/mô phỏng. Dữ liệu video thực thiếu phản hồi lực, sai số chuyển động khớp và các chi tiết vật lý như biến dạng vật liệu; dữ liệu mô phỏng thì thiếu các biến không thể đoán trước như sự cố cảm biến, hệ số ma sát.
Cách thu thập dữ liệu có tiềm năng nhất là điều khiển từ xa - do các nhà điều hành con người điều khiển Bots thực hiện nhiệm vụ. Nhưng chi phí lao động là yếu tố hạn chế chính trong việc thu thập dữ liệu bằng cách điều khiển từ xa.
Phát triển phần cứng tùy chỉnh cũng đang cung cấp giải pháp mới cho việc thu thập dữ liệu chất lượng cao. Một số công ty kết hợp các phương pháp chính thống với phần cứng tùy chỉnh để thu thập dữ liệu chuyển động đa chiều của con người, sau khi xử lý, dữ liệu này được chuyển đổi thành tập dữ liệu phù hợp cho việc đào tạo mạng nơ-ron của Bots, kết hợp với chu kỳ lặp nhanh để cung cấp lượng lớn dữ liệu chất lượng cao cho việc đào tạo AI Bots. Các đường ống công nghệ này cùng nhau rút ngắn con đường chuyển đổi từ dữ liệu gốc đến Bots có thể triển khai.
3. Lĩnh vực khám phá trọng điểm
mã hóa kỹ thuật và Bots融合
Công nghệ mã hóa có thể khuyến khích các bên không tin cậy nâng cao hiệu suất mạng Bots. Dựa trên các lĩnh vực chính đã đề cập trước đó, công nghệ mã hóa có thể nâng cao hiệu suất trong việc kết nối cơ sở hạ tầng, tối ưu hóa độ trễ và thu thập dữ liệu.
Mạng lưới cơ sở hạ tầng vật lý phi tập trung ( DePIN ) được kỳ vọng sẽ cách mạng hóa cơ sở hạ tầng sạc. Khi các robot hình người hoạt động toàn cầu như ô tô, các trạm sạc cần phải dễ dàng tiếp cận như các trạm xăng. Mạng lưới tập trung cần một khoản đầu tư ban đầu khổng lồ, trong khi DePIN sẽ phân chia chi phí cho các nhà điều hành nút, giúp cơ sở hạ tầng sạc mở rộng nhanh chóng đến nhiều khu vực hơn.
DePIN còn có thể sử dụng cơ sở hạ tầng phân tán để tối ưu hóa độ trễ điều khiển từ xa. Bằng cách tập hợp tài nguyên tính toán từ các nút biên phân tán về địa lý, các lệnh điều khiển từ xa có thể được xử lý bởi các nút địa phương hoặc nút gần nhất có sẵn, tối đa hóa việc rút ngắn khoảng cách truyền dữ liệu, giảm thiểu đáng kể độ trễ giao tiếp. Tuy nhiên, hiện tại các dự án DePIN chủ yếu tập trung vào lưu trữ phi tập trung, phân phối nội dung và chia sẻ băng thông, mặc dù có các dự án trình bày lợi thế của tính toán biên trong phát trực tuyến hoặc Internet vạn vật, vẫn chưa mở rộng đến lĩnh vực Bots hoặc điều khiển từ xa.
Điều khiển từ xa là cách thu thập dữ liệu có triển vọng nhất, nhưng chi phí để các thực thể tập trung thuê chuyên gia thu thập dữ liệu thì rất cao. DePIN khuyến khích các bên thứ ba cung cấp dữ liệu điều khiển từ xa thông qua mã hóa token để giải quyết vấn đề này. Một số dự án đang xây dựng mạng lưới người điều hành từ xa toàn cầu, chuyển đổi đóng góp của họ thành tài sản kỹ thuật số được mã hóa, hình thành hệ thống phi tập trung không cần sự cho phép - người tham gia vừa có thể thu được lợi nhuận, vừa có thể tham gia quản trị và hỗ trợ đào tạo Bots AGI.
An toàn luôn là mối quan tâm cốt lõi
Mục tiêu cuối cùng của công nghệ Bots là đạt được sự tự chủ hoàn toàn, nhưng như một số bộ phim khoa học viễn tưởng đã cảnh báo, điều mà con người không mong muốn nhất là sự tự chủ biến Bots thành vũ khí tấn công. Các vấn đề an toàn của mô hình ngôn ngữ lớn đã gây ra sự chú ý, và khi những mô hình này có khả năng hành động thực thể, an toàn của Bots trở thành điều kiện tiên quyết để xã hội chấp nhận.
An ninh kinh tế là một trong những trụ cột của sự thịnh vượng trong hệ sinh thái Bots. Một số công ty đang xây dựng lớp phối hợp máy móc phi tập trung, thông qua mã hóa để thực hiện xác thực danh tính thiết bị, xác minh sự hiện diện vật lý và việc truy cập tài nguyên. Hệ thống này cho phép Bots không phụ thuộc vào trung gian tập trung, tự chứng minh thông tin danh tính, vị trí địa lý và hồ sơ hành vi.
Ràng buộc hành vi và xác thực danh tính được thực hiện thông qua cơ chế trên chuỗi, đảm bảo bất kỳ ai cũng có thể kiểm toán tính tuân thủ. Những Bots đáp ứng tiêu chuẩn an toàn, yêu cầu chất lượng và quy định khu vực sẽ nhận được phần thưởng, trong khi những người vi phạm sẽ phải chịu hình phạt hoặc bị loại bỏ tư cách, từ đó thiết lập cơ chế trách nhiệm và niềm tin trong mạng lưới máy tự động.
Mạng tái thế chấp bên thứ ba cũng có thể cung cấp bảo đảm an toàn tương đương. Mặc dù hệ thống tham số hình phạt vẫn cần được hoàn thiện, công nghệ liên quan đã bước vào giai đoạn thực tiễn. Dự kiến các tiêu chuẩn an toàn trong ngành sắp được hình thành, vào thời điểm đó, tham số hình phạt sẽ được mô hình hóa theo các tiêu chuẩn này.
Một phương án thực hiện khả thi như sau:
Công ty Bots tham gia mạng tái thế chấp.
Thiết lập các tham số tịch thu có thể xác minh (chẳng hạn như "áp dụng lực tiếp xúc của con người vượt quá 2500 Newton");
Người đặt cọc cung cấp tiền đặt cọc để đảm bảo Bots tuân thủ các tham số;
Nếu xảy ra vi phạm, tiền đặt cọc sẽ được sử dụng làm tiền bồi thường cho nạn nhân.
Chế độ này vừa khuyến khích các doanh nghiệp đặt sự an toàn lên hàng đầu, vừa thúc đẩy mức độ chấp nhận của người tiêu dùng thông qua cơ chế bảo hiểm của quỹ staking.
4. Lấp đầy khoảng trống trong công nghệ Bots
Một công ty AI nổi tiếng đã thúc đẩy sự phổ biến của AI, nhưng nền tảng cho bước đột phá này đã được thiết lập từ lâu. Dịch vụ đám mây đã phá vỡ sự phụ thuộc của mô hình vào sức mạnh tính toán địa phương, các nền tảng mã nguồn mở đã hiện thực hóa việc mở mã nguồn của mô hình, và một số nền tảng trực tuyến đã cung cấp không gian thử nghiệm cho các kỹ sư AI. Những bước đột phá dần dần này đã cùng nhau góp phần vào sự phổ biến của AI.
Khác với AI, lĩnh vực Bots khó có thể tiếp cận khi nguồn vốn hạn chế. Để đạt được sự phổ biến của Bots, rào cản trong phát triển cần được hạ thấp đến mức độ tiện lợi như trong phát triển ứng dụng AI. Chúng tôi cho rằng có không gian cải tiến ở ba khía cạnh: cơ chế tài trợ, hệ thống đánh giá và hệ sinh thái giáo dục.
Huy động vốn là điểm đau trong lĩnh vực Bots. Việc phát triển chương trình máy tính chỉ cần một chiếc máy tính và tài nguyên điện toán đám mây, trong khi việc xây dựng một Bots hoàn chỉnh phải mua sắm động cơ, cảm biến, pin và các phần cứng khác, chi phí dễ dàng vượt qua 100.000 USD. Tính chất phần cứng này khiến việc phát triển Bots thiếu tính linh hoạt so với AI và có chi phí cao.
Cơ sở hạ tầng đánh giá Bots trong các tình huống thực tế vẫn đang ở giai đoạn đầu. Lĩnh vực AI đã thiết lập một hệ thống hàm mất mát rõ ràng, việc thử nghiệm có thể được ảo hóa hoàn toàn. Tuy nhiên, các chiến lược ảo xuất sắc không thể chuyển đổi trực tiếp thành các giải pháp hiệu quả trong thế giới thực. Bots cần có cơ sở đánh giá cho các chiến lược tự chủ trong môi trường thực tế đa dạng để thực hiện tối ưu hóa lặp lại.
Khi cơ sở hạ tầng này trưởng thành, nhân tài sẽ đổ về số lượng lớn, và robot hình người sẽ tái hiện đường cong bùng nổ của Web2. Một số công ty mã hóa robot đang tiến tới hướng này - phát triển "hệ điều hành robot phiên bản Android", chuyển đổi phần cứng nguyên bản thành những thực thể thông minh có thể nâng cấp và có ý thức kinh tế. Các mô-đun lập kế hoạch thị giác, ngôn ngữ và chuyển động có thể được cắm vào và sử dụng như ứng dụng điện thoại, tất cả các bước suy luận đều được trình bày bằng ngôn ngữ rõ ràng, giúp người điều hành không cần chạm vào firmware để kiểm tra hoặc điều chỉnh hành vi. Khả năng suy luận ngôn ngữ tự nhiên này cho phép thế hệ nhân tài mới dễ dàng gia nhập lĩnh vực robot, đánh dấu một bước quan trọng trong việc tạo ra nền tảng mở cho cuộc cách mạng robot, giống như tác động tăng tốc của phong trào mã nguồn mở đối với AI.
Mật độ nhân tài quyết định quỹ đạo của ngành. Hệ thống giáo dục phổ cập có cấu trúc rất quan trọng đối với việc cung cấp nhân tài trong lĩnh vực Bots. Việc một công ty Bots niêm yết trên Nasdaq đánh dấu sự khởi đầu của một kỷ nguyên mới, trong đó máy móc thông minh tham gia vào đổi mới tài chính và giáo dục thực thể. Công ty này đã hợp tác với các đối tác công bố rằng họ sẽ triển khai chương trình giáo dục chung đầu tiên dựa trên Bots hình người tại các trường công lập K-12 ở Mỹ. Chương trình này được thiết kế có tính không phụ thuộc vào nền tảng, có thể thích ứng với nhiều hình thức Bots khác nhau, cung cấp cho học sinh cơ hội thực hành.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
12 thích
Phần thưởng
12
1
Đăng lại
Chia sẻ
Bình luận
0/400
PaperHandsCriminal
· 7giờ trước
Tiền giấy đã đang vẫy tay với Bots... Khi nào tôi mới không phải là đồ ngốc
Cách mạng Robot do AI thúc đẩy: Robot hình người trong thời đại ChatGPT sắp đến.
Cách mạng tự động hóa do AI và mã hóa thúc đẩy: Thời khắc "ChatGPT" của Bots sắp đến
Sự xuất hiện của ChatGPT đã hoàn toàn thay đổi nhận thức của con người về trí tuệ nhân tạo. Tuy nhiên, giấc mơ thực sự của nhân loại là để AI tương tác với thế giới vật chất dưới hình thức mã hóa, giống như những gì được miêu tả trong các bộ phim khoa học viễn tưởng.
Những bước đột phá lớn trong lĩnh vực Bots dường như sắp đến. Bài viết này sẽ phân tích cách tiến bộ trong trí tuệ nhân tạo trong những năm gần đây đã thay đổi bối cảnh ngành, khám phá cách công nghệ pin, tối ưu hóa độ trễ và cải tiến thu thập dữ liệu sẽ định hình tương lai, cũng như vai trò của mã hóa trong đó. Đồng thời, bài viết cũng sẽ làm rõ các lĩnh vực đáng chú ý như an toàn Bots, tài chính, đánh giá và giáo dục.
1. Các yếu tố chính thúc đẩy sự thay đổi
sự đột phá của trí tuệ nhân tạo
Tiến bộ của các mô hình ngôn ngữ lớn đa phương thức đã cung cấp "bộ não" cho các Bots thực hiện các nhiệm vụ phức tạp. Bots chủ yếu cảm nhận môi trường thông qua thị giác và thính giác. Các mô hình thị giác máy tính truyền thống rất giỏi trong việc phát hiện hoặc phân loại đối tượng, nhưng gặp khó khăn trong việc chuyển đổi thông tin thị giác thành lệnh hành động. Mặc dù các mô hình ngôn ngữ lớn thể hiện xuất sắc trong việc hiểu và tạo ra văn bản, nhưng chúng lại thiếu khả năng cảm nhận thế giới vật lý.
Mô hình thị giác-ngôn ngữ-hành động ( VLA ) cho phép Bots tích hợp nhận thức thị giác, hiểu ngôn ngữ và hành động vật lý trong một khung thống nhất. Vào tháng 2 năm 2025, một công ty trí tuệ nhân tạo đã công bố mô hình điều khiển Bots hình người đa năng với khả năng tổng quát không mẫu và kiến trúc hệ thống đôi, thiết lập tiêu chuẩn mới cho ngành. Khả năng tổng quát không mẫu cho phép Bots thích ứng với các tình huống, đối tượng và chỉ thị mới mà không cần đào tạo lại cho mỗi nhiệm vụ. Kiến trúc hệ thống đôi tách biệt suy diễn bậc cao và suy diễn nhẹ, tạo ra Bots hình người thương mại hóa với tư duy giống người và độ chính xác thời gian thực.
Robot kinh tế trở thành hiện thực
Công nghệ thay đổi thế giới luôn có tính phổ cập. Khi giá của một số robot thấp hơn xe sedan hạng trung hoặc thu nhập tối thiểu hàng năm ở Mỹ, hình ảnh một thế giới mà lao động chân tay và các công việc hàng ngày chủ yếu được hoàn thành bởi robot sẽ không còn xa vời.
từ kho hàng đến thị trường tiêu dùng
Công nghệ Bots đang mở rộng từ các giải pháp kho bãi sang lĩnh vực tiêu dùng. Thế giới này được thiết kế cho con người - con người có thể hoàn thành tất cả các công việc của Bots chuyên nghiệp, trong khi Bots chuyên nghiệp không thể đảm nhận tất cả các công việc của con người. Các công ty Bots không còn giới hạn trong việc sản xuất Bots chuyên dụng cho nhà máy, mà chuyển sang phát triển các Bots hình người đa năng hơn. Do đó, công nghệ Bots không chỉ tồn tại trong kho bãi mà còn thấm nhuần vào cuộc sống hàng ngày.
Chi phí là một trong những nút thắt chính về khả năng mở rộng. Chỉ số quan trọng nhất là chi phí tổng hợp hàng giờ, được tính bằng cách cộng chi phí cơ hội về thời gian đào tạo và sạc, chi phí thực hiện nhiệm vụ và chi phí mua Bots, sau đó chia cho tổng thời gian hoạt động của Bots. Chi phí này cần thấp hơn mức lương trung bình của ngành liên quan để có tính cạnh tranh.
Để thâm nhập toàn diện vào lĩnh vực kho bãi, chi phí tổng hợp của Bots mỗi giờ phải thấp hơn 31,39 USD. Trong khi đó, trong thị trường tiêu dùng lớn nhất - lĩnh vực giáo dục tư nhân và dịch vụ sức khỏe, chi phí này cần được kiểm soát dưới 35,18 USD. Hiện tại, Bots đang phát triển theo hướng rẻ hơn, hiệu quả hơn và đa dụng hơn.
2. Bước đột phá tiếp theo của công nghệ Bots
Tối ưu hóa pin
Công nghệ pin luôn là điểm nghẽn của những robot thân thiện với người dùng. Thời gian sử dụng của một số robot hình người chỉ khoảng 2 giờ. Người dùng rõ ràng không muốn phải sạc pin thủ công mỗi hai giờ, vì vậy việc tự sạc và cơ sở hạ tầng kết nối đã trở thành hướng phát triển trọng điểm. Hiện tại, có hai chế độ sạc chính cho robot: thay pin hoặc sạc trực tiếp.
Chế độ thay pin thực hiện công việc liên tục bằng cách thay thế nhanh chóng các bộ pin đã cạn kiệt, tối đa hóa thời gian hoạt động và giảm thiểu thời gian dừng máy, phù hợp với các tình huống ngoài trời hoặc nhà máy. Quy trình này có thể được thực hiện bằng tay hoặc tự động.
Sạc cảm ứng sử dụng phương thức cung cấp điện không dây, mặc dù việc sạc đầy mất nhiều thời gian hơn, nhưng có thể dễ dàng thực hiện quy trình hoàn toàn tự động.
tối ưu hóa độ trễ
Hoạt động độ trễ thấp có thể được chia thành hai loại: nhận thức môi trường và điều khiển từ xa. Nhận thức đề cập đến khả năng nhận thức không gian của Bots đối với môi trường, trong khi điều khiển từ xa đề cập đến việc kiểm soát thời gian thực của người điều hành.
Nghiên cứu cho thấy, hệ thống cảm nhận của Bots bắt đầu từ cảm biến giá rẻ, nhưng lợi thế công nghệ nằm ở phần mềm tích hợp, tính toán tiêu thụ điện năng thấp và vòng điều khiển chính xác trong vài mili giây. Khi Bots hoàn thành việc định vị không gian, mạng nơ-ron nhẹ sẽ đánh dấu các yếu tố như chướng ngại vật, pallet hoặc con người. Sau khi nhãn cảnh được nhập vào hệ thống lập kế hoạch, ngay lập tức sẽ tạo ra lệnh điều khiển động cơ gửi tới chân, cụm bánh xe hoặc cánh tay cơ khí. Độ trễ cảm nhận dưới 50 mili giây tương đương với tốc độ phản xạ của con người - bất kỳ độ trễ nào vượt quá ngưỡng này sẽ khiến Bots hành động vụng về. Do đó, 90% quyết định cần được thực hiện qua một mạng lưới thị giác-ngôn ngữ-hành động duy nhất tại chỗ.
Robot hoàn toàn tự chủ cần đảm bảo mô hình VLA hiệu suất cao với độ trễ dưới 50 mili giây; robot điều khiển từ xa yêu cầu độ trễ tín hiệu giữa đầu điều khiển và robot không vượt quá 50 mili giây. Tại đây, tầm quan trọng của mô hình VLA càng được nhấn mạnh - nếu đầu vào hình ảnh và văn bản được xử lý bởi các mô hình khác nhau trước khi nhập vào mô hình ngôn ngữ lớn, tổng độ trễ sẽ vượt quá ngưỡng 50 mili giây.
Tối ưu hóa thu thập dữ liệu
Việc thu thập dữ liệu chủ yếu có ba phương thức: dữ liệu video từ thế giới thực, dữ liệu tổng hợp và dữ liệu điều khiển từ xa. Rào cản cốt lõi giữa dữ liệu thực và dữ liệu tổng hợp nằm ở việc thu hẹp sự khác biệt giữa hành vi vật lý của Bots và mô hình video/mô phỏng. Dữ liệu video thực thiếu phản hồi lực, sai số chuyển động khớp và các chi tiết vật lý như biến dạng vật liệu; dữ liệu mô phỏng thì thiếu các biến không thể đoán trước như sự cố cảm biến, hệ số ma sát.
Cách thu thập dữ liệu có tiềm năng nhất là điều khiển từ xa - do các nhà điều hành con người điều khiển Bots thực hiện nhiệm vụ. Nhưng chi phí lao động là yếu tố hạn chế chính trong việc thu thập dữ liệu bằng cách điều khiển từ xa.
Phát triển phần cứng tùy chỉnh cũng đang cung cấp giải pháp mới cho việc thu thập dữ liệu chất lượng cao. Một số công ty kết hợp các phương pháp chính thống với phần cứng tùy chỉnh để thu thập dữ liệu chuyển động đa chiều của con người, sau khi xử lý, dữ liệu này được chuyển đổi thành tập dữ liệu phù hợp cho việc đào tạo mạng nơ-ron của Bots, kết hợp với chu kỳ lặp nhanh để cung cấp lượng lớn dữ liệu chất lượng cao cho việc đào tạo AI Bots. Các đường ống công nghệ này cùng nhau rút ngắn con đường chuyển đổi từ dữ liệu gốc đến Bots có thể triển khai.
3. Lĩnh vực khám phá trọng điểm
mã hóa kỹ thuật và Bots融合
Công nghệ mã hóa có thể khuyến khích các bên không tin cậy nâng cao hiệu suất mạng Bots. Dựa trên các lĩnh vực chính đã đề cập trước đó, công nghệ mã hóa có thể nâng cao hiệu suất trong việc kết nối cơ sở hạ tầng, tối ưu hóa độ trễ và thu thập dữ liệu.
Mạng lưới cơ sở hạ tầng vật lý phi tập trung ( DePIN ) được kỳ vọng sẽ cách mạng hóa cơ sở hạ tầng sạc. Khi các robot hình người hoạt động toàn cầu như ô tô, các trạm sạc cần phải dễ dàng tiếp cận như các trạm xăng. Mạng lưới tập trung cần một khoản đầu tư ban đầu khổng lồ, trong khi DePIN sẽ phân chia chi phí cho các nhà điều hành nút, giúp cơ sở hạ tầng sạc mở rộng nhanh chóng đến nhiều khu vực hơn.
DePIN còn có thể sử dụng cơ sở hạ tầng phân tán để tối ưu hóa độ trễ điều khiển từ xa. Bằng cách tập hợp tài nguyên tính toán từ các nút biên phân tán về địa lý, các lệnh điều khiển từ xa có thể được xử lý bởi các nút địa phương hoặc nút gần nhất có sẵn, tối đa hóa việc rút ngắn khoảng cách truyền dữ liệu, giảm thiểu đáng kể độ trễ giao tiếp. Tuy nhiên, hiện tại các dự án DePIN chủ yếu tập trung vào lưu trữ phi tập trung, phân phối nội dung và chia sẻ băng thông, mặc dù có các dự án trình bày lợi thế của tính toán biên trong phát trực tuyến hoặc Internet vạn vật, vẫn chưa mở rộng đến lĩnh vực Bots hoặc điều khiển từ xa.
Điều khiển từ xa là cách thu thập dữ liệu có triển vọng nhất, nhưng chi phí để các thực thể tập trung thuê chuyên gia thu thập dữ liệu thì rất cao. DePIN khuyến khích các bên thứ ba cung cấp dữ liệu điều khiển từ xa thông qua mã hóa token để giải quyết vấn đề này. Một số dự án đang xây dựng mạng lưới người điều hành từ xa toàn cầu, chuyển đổi đóng góp của họ thành tài sản kỹ thuật số được mã hóa, hình thành hệ thống phi tập trung không cần sự cho phép - người tham gia vừa có thể thu được lợi nhuận, vừa có thể tham gia quản trị và hỗ trợ đào tạo Bots AGI.
An toàn luôn là mối quan tâm cốt lõi
Mục tiêu cuối cùng của công nghệ Bots là đạt được sự tự chủ hoàn toàn, nhưng như một số bộ phim khoa học viễn tưởng đã cảnh báo, điều mà con người không mong muốn nhất là sự tự chủ biến Bots thành vũ khí tấn công. Các vấn đề an toàn của mô hình ngôn ngữ lớn đã gây ra sự chú ý, và khi những mô hình này có khả năng hành động thực thể, an toàn của Bots trở thành điều kiện tiên quyết để xã hội chấp nhận.
An ninh kinh tế là một trong những trụ cột của sự thịnh vượng trong hệ sinh thái Bots. Một số công ty đang xây dựng lớp phối hợp máy móc phi tập trung, thông qua mã hóa để thực hiện xác thực danh tính thiết bị, xác minh sự hiện diện vật lý và việc truy cập tài nguyên. Hệ thống này cho phép Bots không phụ thuộc vào trung gian tập trung, tự chứng minh thông tin danh tính, vị trí địa lý và hồ sơ hành vi.
Ràng buộc hành vi và xác thực danh tính được thực hiện thông qua cơ chế trên chuỗi, đảm bảo bất kỳ ai cũng có thể kiểm toán tính tuân thủ. Những Bots đáp ứng tiêu chuẩn an toàn, yêu cầu chất lượng và quy định khu vực sẽ nhận được phần thưởng, trong khi những người vi phạm sẽ phải chịu hình phạt hoặc bị loại bỏ tư cách, từ đó thiết lập cơ chế trách nhiệm và niềm tin trong mạng lưới máy tự động.
Mạng tái thế chấp bên thứ ba cũng có thể cung cấp bảo đảm an toàn tương đương. Mặc dù hệ thống tham số hình phạt vẫn cần được hoàn thiện, công nghệ liên quan đã bước vào giai đoạn thực tiễn. Dự kiến các tiêu chuẩn an toàn trong ngành sắp được hình thành, vào thời điểm đó, tham số hình phạt sẽ được mô hình hóa theo các tiêu chuẩn này.
Một phương án thực hiện khả thi như sau:
Chế độ này vừa khuyến khích các doanh nghiệp đặt sự an toàn lên hàng đầu, vừa thúc đẩy mức độ chấp nhận của người tiêu dùng thông qua cơ chế bảo hiểm của quỹ staking.
4. Lấp đầy khoảng trống trong công nghệ Bots
Một công ty AI nổi tiếng đã thúc đẩy sự phổ biến của AI, nhưng nền tảng cho bước đột phá này đã được thiết lập từ lâu. Dịch vụ đám mây đã phá vỡ sự phụ thuộc của mô hình vào sức mạnh tính toán địa phương, các nền tảng mã nguồn mở đã hiện thực hóa việc mở mã nguồn của mô hình, và một số nền tảng trực tuyến đã cung cấp không gian thử nghiệm cho các kỹ sư AI. Những bước đột phá dần dần này đã cùng nhau góp phần vào sự phổ biến của AI.
Khác với AI, lĩnh vực Bots khó có thể tiếp cận khi nguồn vốn hạn chế. Để đạt được sự phổ biến của Bots, rào cản trong phát triển cần được hạ thấp đến mức độ tiện lợi như trong phát triển ứng dụng AI. Chúng tôi cho rằng có không gian cải tiến ở ba khía cạnh: cơ chế tài trợ, hệ thống đánh giá và hệ sinh thái giáo dục.
Huy động vốn là điểm đau trong lĩnh vực Bots. Việc phát triển chương trình máy tính chỉ cần một chiếc máy tính và tài nguyên điện toán đám mây, trong khi việc xây dựng một Bots hoàn chỉnh phải mua sắm động cơ, cảm biến, pin và các phần cứng khác, chi phí dễ dàng vượt qua 100.000 USD. Tính chất phần cứng này khiến việc phát triển Bots thiếu tính linh hoạt so với AI và có chi phí cao.
Cơ sở hạ tầng đánh giá Bots trong các tình huống thực tế vẫn đang ở giai đoạn đầu. Lĩnh vực AI đã thiết lập một hệ thống hàm mất mát rõ ràng, việc thử nghiệm có thể được ảo hóa hoàn toàn. Tuy nhiên, các chiến lược ảo xuất sắc không thể chuyển đổi trực tiếp thành các giải pháp hiệu quả trong thế giới thực. Bots cần có cơ sở đánh giá cho các chiến lược tự chủ trong môi trường thực tế đa dạng để thực hiện tối ưu hóa lặp lại.
Khi cơ sở hạ tầng này trưởng thành, nhân tài sẽ đổ về số lượng lớn, và robot hình người sẽ tái hiện đường cong bùng nổ của Web2. Một số công ty mã hóa robot đang tiến tới hướng này - phát triển "hệ điều hành robot phiên bản Android", chuyển đổi phần cứng nguyên bản thành những thực thể thông minh có thể nâng cấp và có ý thức kinh tế. Các mô-đun lập kế hoạch thị giác, ngôn ngữ và chuyển động có thể được cắm vào và sử dụng như ứng dụng điện thoại, tất cả các bước suy luận đều được trình bày bằng ngôn ngữ rõ ràng, giúp người điều hành không cần chạm vào firmware để kiểm tra hoặc điều chỉnh hành vi. Khả năng suy luận ngôn ngữ tự nhiên này cho phép thế hệ nhân tài mới dễ dàng gia nhập lĩnh vực robot, đánh dấu một bước quan trọng trong việc tạo ra nền tảng mở cho cuộc cách mạng robot, giống như tác động tăng tốc của phong trào mã nguồn mở đối với AI.
Mật độ nhân tài quyết định quỹ đạo của ngành. Hệ thống giáo dục phổ cập có cấu trúc rất quan trọng đối với việc cung cấp nhân tài trong lĩnh vực Bots. Việc một công ty Bots niêm yết trên Nasdaq đánh dấu sự khởi đầu của một kỷ nguyên mới, trong đó máy móc thông minh tham gia vào đổi mới tài chính và giáo dục thực thể. Công ty này đã hợp tác với các đối tác công bố rằng họ sẽ triển khai chương trình giáo dục chung đầu tiên dựa trên Bots hình người tại các trường công lập K-12 ở Mỹ. Chương trình này được thiết kế có tính không phụ thuộc vào nền tảng, có thể thích ứng với nhiều hình thức Bots khác nhau, cung cấp cho học sinh cơ hội thực hành.