Revolução dos Bots impulsionada pela IA: os robôs humanoides da era ChatGPT estão prestes a chegar

Revolução da automação impulsionada por IA e encriptação: o "momento ChatGPT" dos Bots está prestes a chegar

A aparição do ChatGPT mudou completamente a percepção das pessoas sobre a inteligência artificial. No entanto, o verdadeiro sonho da humanidade é fazer com que a IA interaja com o mundo físico na forma de Bots, assim como é retratado nos filmes de ficção científica.

Parece que uma grande quebra de paradigma no campo dos Bots está prestes a ocorrer. Este artigo analisará como os avanços em inteligência artificial nos últimos anos estão mudando o panorama da indústria, explorando como a tecnologia de baterias, otimização de latência e melhorias na coleta de dados moldarão o futuro, bem como o papel que a encriptação desempenha nisso. Também serão discutidos tópicos importantes como segurança dos Bots, financiamento, avaliação e educação.

Bots "ChatGPT时刻": A revolução da automação impulsionada por AI e encriptação

1. Fatores-chave para impulsionar a mudança

A quebra do inteligência artificial

O progresso dos modelos de linguagem multimodal fornece o "cérebro" para os Bots executarem tarefas complexas. Os Bots percebem o ambiente principalmente através da visão e da audição. Os modelos tradicionais de visão computacional são bons na deteção ou classificação de objetos, mas têm dificuldade em transformar informações visuais em instruções de ação. Embora os modelos de linguagem tenham um desempenho excelente na compreensão e geração de texto, eles carecem da capacidade de perceber o mundo físico.

Modelo de Ação-Linguagem-Visual(VLA)que permite que Bots integrem percepção visual, compreensão da linguagem e ação física em uma estrutura unificada. Em fevereiro de 2025, um modelo de controle de robô humanoide genérico lançado por uma empresa de inteligência artificial estabeleceu um novo padrão para a indústria, graças à sua capacidade de generalização sem exemplos e à arquitetura de dois sistemas. A generalização sem exemplos permite que os Bots se adaptem a novos cenários, novos objetos e novas instruções sem a necessidade de re-treinamento para cada tarefa. A arquitetura de dois sistemas separa o raciocínio de alto nível do raciocínio leve, permitindo a comercialização de robôs humanoides com pensamento semelhante ao humano e precisão em tempo real.

A encriptação dos Bots econômicos tornou-se realidade

As tecnologias que mudam o mundo têm uma natureza de difusão. Quando o preço de certos Bots é inferior ao de um carro de gama média ou ao rendimento mínimo anual nos Estados Unidos, imaginar um mundo em que o trabalho físico e as tarefas diárias são realizadas principalmente por Bots já não parece tão distante.

do armazenamento para o mercado de consumo

A tecnologia de Bots está a expandir-se do armazenamento para o setor de consumo. Este mundo foi projetado para os humanos — os humanos podem realizar todo o trabalho dos Bots especializados, enquanto os Bots especializados não conseguem realizar todo o trabalho dos humanos. As empresas de Bots não se limitam mais à fabricação de Bots para fábricas, mas estão a desenvolver Bots humanoides mais versáteis. Assim, a vanguarda da tecnologia de Bots não está apenas nos armazéns, mas também irá penetrar na vida cotidiana.

O custo é um dos principais gargalos da escalabilidade. O indicador mais crítico é o custo total por hora, que é calculado como a soma do custo de oportunidade do tempo de treinamento e carregamento, do custo de execução da tarefa e do custo de aquisição dos Bots, dividido pelo total de horas de operação dos Bots. Esse custo deve ser inferior ao nível médio de salários da indústria para ser competitivo.

Para penetrar totalmente no setor de armazém, o custo total dos Bots por hora deve ser inferior a 31,39 dólares. E no maior mercado de consumo - o setor de educação privada e serviços de saúde, esse custo deve ser mantido abaixo de 35,18 dólares. Atualmente, os Bots estão se desenvolvendo em direção a serem mais baratos, mais eficientes e mais versáteis.

Bots "ChatGPT Moment": Revolução da automação impulsionada por AI e encriptação

2. O próximo grande avanço em tecnologia de Bots

otimização de bateria

A tecnologia de baterias tem sido um gargalo para robôs amigáveis ao usuário. A autonomia de algumas pessoas robôs é de apenas cerca de 2 horas. Os usuários claramente não desejam carregar manualmente a cada duas horas, portanto, a recarga autônoma e a infraestrutura de acoplamento tornaram-se direções de desenvolvimento focais. Atualmente, existem dois modos principais de carregamento de robôs: substituição da bateria ou carregamento direto.

O modo de substituição de bateria permite a operação contínua através da rápida substituição de um conjunto de baterias esgotado, minimizando o tempo de inatividade, sendo adequado para cenários de campo ou fábrica. Este processo pode ser realizado manualmente ou automatizado.

O carregamento por indução utiliza um método de fornecimento de energia sem fios. Embora o carregamento completo demore mais, consegue facilmente realizar um processo totalmente automatizado.

otimização de atraso

Operações de baixa latência podem ser divididas em duas categorias: percepção ambiental e controlo remoto. A percepção refere-se à capacidade dos Bots de perceber o espaço do ambiente, enquanto o controlo remoto refere-se especificamente ao controlo em tempo real por um operador humano.

A pesquisa mostra que os sistemas de percepção dos Bots começam com sensores baratos, mas a verdadeira vantagem tecnológica está no software de fusão, computação de baixo consumo de energia e circuitos de controle milissegundo. Quando os Bots completam a localização espacial, redes neurais leves marcam elementos como obstáculos, paletes ou humanos. Após a entrada da etiqueta de cena no sistema de planejamento, são geradas imediatamente instruções de motor enviadas para os pés, rodas ou braços mecânicos. Um atraso de percepção abaixo de 50 milissegundos é equivalente à velocidade de reflexo humano — qualquer atraso que exceda esse limite resultará em movimentos desajeitados dos Bots. Portanto, 90% das decisões devem ser feitas localmente por uma única rede de visão-linguagem-ação.

Os Bots totalmente autónomos devem garantir um modelo VLA de alto desempenho com uma latência inferior a 50 milissegundos; os Bots de controlo remoto exigem que a latência do sinal entre o terminal de operação e o Bots não exceda os 50 milissegundos. Aqui, a importância do modelo VLA é particularmente evidente - se as entradas visuais e de texto forem processadas por modelos diferentes antes de serem inseridas no modelo de linguagem de grande escala, a latência total ultrapassará o limite de 50 milissegundos.

otimização de coleta de dados

A coleta de dados tem três principais abordagens: dados de vídeo do mundo real, dados sintéticos e dados de controle remoto. O principal desafio entre dados do mundo real e dados sintéticos é reduzir a diferença entre o comportamento físico dos Bots e os modelos de vídeo/simulação. Os dados de vídeo do mundo real carecem de detalhes físicos como força de feedback, erros de movimento das articulações e deformação do material; os dados de simulação, por outro lado, carecem de variáveis imprevisíveis como falhas de sensores e coeficientes de atrito.

A forma de coleta de dados com maior potencial é o controle remoto - operadores humanos controlam remotamente Bots para executar tarefas. No entanto, o custo da mão de obra é o principal fator limitante na coleta de dados por controle remoto.

O desenvolvimento de hardware personalizado também está a fornecer novas soluções para a recolha de dados de alta qualidade. Algumas empresas combinam métodos tradicionais com hardware personalizado para recolher dados de movimento humano em múltiplas dimensões, que após processamento são convertidos em conjuntos de dados adequados para o treino de redes neurais de Bots, proporcionando assim uma grande quantidade de dados de alta qualidade para o treino de Bots com ciclos de iteração rápidos. Estes canais tecnológicos encurtam conjuntamente o caminho de conversão desde os dados brutos até Bots implementáveis.

3. Áreas de Exploração Focadas

encriptação tecnologia e Bots fusão

A encriptação pode incentivar partes não confiáveis a melhorarem a eficiência da rede de Bots. Com base nas áreas-chave mencionadas anteriormente, a encriptação pode aumentar a eficiência em três aspectos: integração de infraestrutura, otimização de latência e coleta de dados.

A rede de infraestrutura física descentralizada ( DePIN ) promete revolucionar a infraestrutura de carregamento. Quando robôs humanoides operarem globalmente como automóveis, as estações de carregamento precisam ser tão acessíveis quanto os postos de gasolina. Redes centralizadas exigem um grande investimento inicial, enquanto o DePIN distribui os custos entre os operadores de nós, permitindo uma rápida expansão das instalações de carregamento para mais áreas.

O DePIN também pode utilizar infraestrutura distribuída para otimizar a latência de controle remoto. Ao agregar recursos de computação de nós de borda geograficamente dispersos, os comandos de controle remoto podem ser processados por nós locais ou os mais próximos disponíveis, minimizando a distância de transmissão de dados e reduzindo significativamente a latência de comunicação. No entanto, os projetos atuais do DePIN estão principalmente focados em armazenamento descentralizado, distribuição de conteúdo e compartilhamento de largura de banda; embora haja projetos que demonstrem as vantagens da computação de borda em streaming de mídia ou Internet das Coisas, ainda não se estenderam para o campo de Bots ou controle remoto.

O controle remoto é a forma de coleta de dados mais promissora, mas o custo para entidades centralizadas contratarem profissionais para coletar dados é extremamente alto. O DePIN resolve esse problema incentivando terceiros a fornecer dados de controle remoto através de encriptação de tokens. Alguns projetos estão construindo uma rede global de operadores remotos, convertendo suas contribuições em ativos digitais tokenizados, formando um sistema descentralizado sem necessidade de permissão - os participantes podem obter lucros, além de participar na governança e ajudar no treinamento de Bots AGI.

A segurança é sempre uma preocupação central

O objetivo final da tecnologia de Bots é alcançar a total autonomia, mas como alguns filmes de ficção científica alertam, o que a humanidade menos deseja é que a autonomia transforme os Bots em armas agressivas. As questões de segurança dos grandes modelos de linguagem já suscitaram preocupações, e quando esses modelos possuem a capacidade de agir fisicamente, a segurança dos Bots torna-se um pré-requisito fundamental para a aceitação social.

A segurança econômica é um dos pilares da prosperidade do ecossistema de Bots. Algumas empresas estão construindo uma camada de coordenação de máquinas descentralizada, realizando autenticação de identidade de dispositivos, verificação de presença física e acesso a recursos através da encriptação. Este sistema permite que os Bots provem de forma autônoma suas informações de identidade, localização geográfica e registros de comportamento, sem depender de intermediários centralizados.

As restrições comportamentais e a autenticação de identidade são executadas por mecanismos on-chain, garantindo que qualquer pessoa possa auditar a conformidade. Bots que atendem aos padrões de segurança, requisitos de qualidade e normas regionais serão recompensados, enquanto os infratores enfrentarão punições ou desqualificação, estabelecendo assim um mecanismo de responsabilização e confiança na rede de máquinas autônomas.

A rede de re-pledge de terceiros também pode fornecer garantias de segurança equivalentes. Embora o sistema de parâmetros de penalização ainda precise ser aprimorado, a tecnologia relevante já entrou na fase prática. Espera-se que as diretrizes de segurança da indústria sejam formadas em breve, e, nesse momento, os parâmetros de penalização serão modelados com base nessas diretrizes.

Uma possível implementação é a seguinte:

  1. Bots empresa junta-se à rede de re-staking.
  2. Definir parâmetros de confisco verificáveis (como "aplicar uma força de contato humano superior a 2500 newtons");
  3. Os stakers fornecem margem para garantir que os Bots cumpram os parâmetros;
  4. Se ocorrer uma violação, o depósito será utilizado como compensação para a vítima.

Este modelo incentiva as empresas a priorizar a segurança, ao mesmo tempo que promove a aceitação por parte dos consumidores através do mecanismo de seguro do pool de fundos em staking.

Bots "ChatGPT Moment": Revolução automatizada impulsionada por AI e encriptação

4. Preencher as lacunas na pilha de tecnologia de Bots

Uma empresa de IA conhecida impulsionou a popularização da IA, mas a base para essa quebra de paradigma já havia sido estabelecida. Os serviços em nuvem quebraram a dependência dos modelos em relação ao poder de computação local, plataformas de código aberto tornaram os modelos acessíveis, e algumas plataformas online forneceram locais de experimentação para engenheiros de IA. Esses avanços graduais contribuíram coletivamente para a democratização da IA.

Ao contrário da IA, o campo dos Bots é difícil de entrar quando os recursos são limitados. Para alcançar a popularização dos Bots, as barreiras de desenvolvimento precisam ser reduzidas a um nível de conveniência semelhante ao desenvolvimento de aplicações de IA. Acreditamos que existem áreas de melhoria em três níveis: mecanismo de financiamento, sistema de avaliação e ecologia educacional.

O financiamento é um ponto crítico na área dos Bots. Para desenvolver programas de computador, basta ter um computador e recursos de computação em nuvem, enquanto a construção de Bots completos exige a compra de motores, sensores, baterias e outros hardwares, com custos facilmente a ultrapassar os 100 mil dólares. Essa característica do hardware torna o desenvolvimento de Bots menos flexível e mais caro em comparação com a IA.

A infraestrutura de avaliação de Bots em cenários reais ainda está em sua fase inicial. No campo da IA, um sistema claro de funções de perda foi estabelecido, e os testes podem ser completamente virtualizados. No entanto, estratégias virtuais excelentes não podem ser diretamente convertidas em soluções eficazes no mundo real. Os Bots precisam de instalações de avaliação de estratégias autônomas testadas em ambientes reais diversificados para alcançar a otimização iterativa.

Quando essa infraestrutura amadurecer, muitos talentos irão afluir, e os robôs humanoides irão repetir a curva de explosão da Web2. Algumas empresas de encriptação de robôs estão avançando nessa direção - desenvolvendo um "sistema operacional Android para robôs", transformando hardware original em agentes inteligentes atualizáveis com consciência econômica. Módulos de visão, linguagem e planejamento de movimento podem ser plug-and-play como aplicativos de celular, e todos os passos de raciocínio são apresentados em linguagem clara, permitindo que os operadores auditem ou ajustem o comportamento sem necessidade de interagir com o firmware. Essa capacidade de raciocínio em linguagem natural permite que a nova geração de talentos entre de forma fluida no campo da robótica, dando um passo chave para a revolução dos robôs em uma plataforma aberta, assim como o movimento de código aberto acelerou a IA.

A densidade de talentos determina a trajetória da indústria. Um sistema de educação inclusiva estruturado é vital para o fornecimento de talentos na área de Bots. A entrada de uma determinada empresa de Bots na Nasdaq marca o início de uma nova era em que máquinas inteligentes participam simultaneamente na inovação financeira e na educação prática. A empresa anunciou em conjunto com seus parceiros que lançará o primeiro curso de educação universal baseado em robôs humanoides nas escolas públicas K-12 dos EUA. O design deste curso é independente de plataforma, podendo se adaptar a várias formas de Bots, oferecendo aos alunos oportunidades de prática.

AGI-3.33%
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • 1
  • Republicar
  • Partilhar
Comentar
0/400
PaperHandsCriminalvip
· 9h atrás
As notas já estão a acenar aos Bots... Quando é que eu vou poder deixar de ser idiota?
Ver originalResponder0
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)