ArgOS: Phân tích khung AI Agent thế hệ tiếp theo hiệu suất cao, có thể mở rộng.

robot
Đang tạo bản tóm tắt

ArgOS: Một khung AI Agent thế hệ tiếp theo, mô-đun và hiệu suất cao

ArgOS là một khung Agent hiệu suất cao dành cho phát triển trò chơi, sử dụng cách thiết kế hoàn toàn mới, so với các khung Agent truyền thống thì nó có tính mô-đun hơn và hiệu suất tốt hơn. Bài viết này sẽ phân tích chi tiết thiết kế kiến trúc của ArgOS.

Giải cấu trúc Project89: Một thiết kế khung AI Agent thế hệ tiếp theo, mô-đun và hiệu suất cao

Tại sao sử dụng kiến trúc ECS

ECS (Entity-Component-System) là một mô hình kiến trúc thường được sử dụng trong phát triển trò chơi và hệ thống mô phỏng. Nó hoàn toàn tách biệt dữ liệu và logic, giúp quản lý hiệu quả các thực thể và hành vi của chúng trong các cảnh mở rộng quy mô lớn.

Kiến trúc ECS bao gồm ba khái niệm cốt lõi:

  • Entity( thực thể ): chỉ là một ID, không chứa bất kỳ dữ liệu hoặc logic nào.
  • Component( thành phần ): được sử dụng để lưu trữ dữ liệu hoặc trạng thái cụ thể của thực thể
  • Hệ thống(系统): chịu trách nhiệm thực hiện các logic liên quan đến một số thành phần

Trong ArgOS, mỗi Agent được coi là một Entity, có thể đăng ký các thành phần khác nhau, chẳng hạn như:

  • Thành phần Agent: lưu trữ tên Agent, tên mô hình và các thông tin cơ bản khác
  • Thành phần Nhận thức: Lưu trữ dữ liệu từ môi trường bên ngoài đã được cảm nhận
  • Thành phần bộ nhớ: Dữ liệu nhớ của Agent lưu trữ
  • Action Component: Lưu trữ dữ liệu hành động cần thực hiện

Ví dụ về quy trình làm việc của Hệ thống:

  1. Hệ thống Nhận thức cảm nhận vũ khí, cập nhật Thành phần Nhận thức của Agent
  2. Hệ thống bộ nhớ sẽ lưu trữ dữ liệu cảm nhận vào cơ sở dữ liệu
  3. Hệ thống hành động lấy thông tin môi trường từ trí nhớ, thực hiện hành động tương ứng

Giải cấu trúc Project89: Một thiết kế khung AI Agent thế hệ tiếp theo, mô-đun và hiệu suất cao

Kiến trúc hệ thống ArgOS

ArgOS thiết kế nhiều Component và System, và chia System thành ba cấp độ:

  1. Có ý thức ( HỆ THỐNG CONSCIOUS )

    • Bao gồm RoomSystem, PerceptionSystem, ExperienceSystem, v.v.
    • Tần suất cập nhật cao ( như mỗi 10 giây )
    • Xử lý nhận thức thời gian thực, suy nghĩ, thực hiện hành động khác
  2. Tiềm thức(HỆ THỐNG TIỀM THỨC)

    • Bao gồm GoalPlanningSystem, PlanningSystem
    • Tần suất cập nhật thấp ( như mỗi 25 giây )
    • Xử lý việc xác định mục tiêu, tạo kế hoạch, v.v.
  3. Vô thức(KHÔNG Ý THỨC)hệ thống

    • Hiện tại chưa được kích hoạt
    • Tần suất cập nhật chậm hơn ( như trên 50 giây )

Mối quan hệ giữa các hệ thống rất phức tạp, nhưng đã được giải quyết thông qua kiến trúc ECS để đạt được sự tách rời.

Giải cấu trúc Project89: Một thiết kế khung AI Agent thế hệ tiếp theo, mô-đun và hiệu suất cao

Kiến trúc tổng thể của ArgOS

Kiến trúc tổng thể của ArgOS bao gồm:

  1. Lớp lõi: Entity, Component, System, Manager, Runtime

  2. Phân loại thành phần:

    • Danh mục danh tính cốt lõi: Agent, PlayerProfile, v.v.
    • Hành vi và trạng thái: Hành động, Mục tiêu, Kế hoạch, v.v.
    • Nhận thức và trí nhớ: Perception, Memory, v.v.
    • Lớp môi trường và không gian: Phòng, Môi trường, v.v.
    • Ngoại hình và tương tác: Appearance, UIState, v.v.
    • Hỗ trợ hoặc vận hành: Cleanup, DebugInfo, v.v.
  3. Kiến trúc hệ thống: đã được mô tả chi tiết ở trên.

  4. Cấu trúc quản lý:

    • RoomManager: Quản lý thông tin phòng
    • StateManager: Quản lý thế giới/ trạng thái đại diện
    • EventBus: phát hành và đăng ký sự kiện
    • ActionManager: Quản lý việc thực hiện hành động
    • PromptManager: Quản lý từ khóa gợi ý LLM
  5. Tương tác cơ sở dữ liệu:

    • Quản lý việc đọc và ghi dữ liệu một cách thống nhất thông qua StateManager
    • Thực hiện lưu trữ theo định kỳ hoặc theo sự kiện
    • Hỗ trợ tiếp tục từ điểm dừng

Giải cấu trúc Project89: Một thiết kế khung AI Agent thế hệ tiếp theo, mô-đun và hiệu suất cao

Điểm đổi mới trong kiến trúc

  1. Hệ thống hoạt động độc lập, không gọi lẫn nhau, đã đạt được mức độ tách biệt cao.

  2. Bằng cách đăng ký các Component và System khác nhau, có thể tùy chỉnh linh hoạt khả năng của Agent.

  3. Kiến trúc ECS phù hợp với tính đồng thời, có ưu thế hiệu suất rõ rệt trong các tình huống phức tạp.

  4. Chia hệ thống thành ba lớp: có ý thức, tiềm thức và vô thức, mô phỏng quá trình nhận thức của con người.

  5. Mô-đun hóa cao, dễ dàng mở rộng các tính năng mới

Tổng thể, ArgOS là một khung Agent được thiết kế tốt và mạnh mẽ, cung cấp sự lựa chọn kiến trúc mới cho phát triển game và ứng dụng AI.

Giải cấu trúc Project89: Một thiết kế khung AI Agent thế hệ tiếp theo, mô-đun và hiệu suất cao

AGENT0.62%
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 1
  • Chia sẻ
Bình luận
0/400
ContractTestervip
· 13giờ trước
Mã nhìn rất thanh lịch.
Xem bản gốcTrả lời0
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)