Por que a mentalidade do jogador acaba perdendo tudo? As leis de sobrevivência em sistemas não iterativos.

Autor: Snow Goose, DataCafe

Imagina que começas com 1000 yuan e participas num jogo de desafio de virar moedas, onde podes escolher jogar indefinidamente:

Lançar uma moeda a cada rodada,

Lançado de frente, a riqueza aumenta 80%.

Virando ao contrário, a riqueza diminui 50%.

Parece um jogo em que se ganha sempre!

Mas a realidade é...

Se 100.000 jogadores participassem deste jogo e jogassem 100 rodadas cada, você descobriria que: a riqueza média deles realmente cresce exponencialmente, mas a grande maioria das pessoas termina com uma riqueza inferior a 72 euros, e muitos até vão à falência!

Por que a riqueza média está aumentando, mas a maioria das pessoas está ficando cada vez mais pobre?

Este é um típico truque de não iteratividade. Acreditar que mais uma rodada pode mudar o resultado é precisamente porque confundimos a média do grupo com o destino individual.

Armadilhas não iterativas: média a longo prazo ≠ seu destino real

O que é a traversabilidade?

O conceito de Ergodicidade surgiu pela primeira vez na física estatística e teve um profundo impacto em áreas como teoria das probabilidades, finanças, ciências do comportamento e aprendizagem automática. A questão central que ele tenta responder é: o valor médio a longo prazo é aplicável ao indivíduo? Quando tomamos decisões, devemos acreditar na 'média a longo prazo' ou na realidade da 'experiência pessoal repetida'?

No século XIX, o físico Ludwig Boltzmann, ao estudar o movimento das moléculas de gás, propôs a hipótese de ergodicidade: se observarmos uma molécula de gás por tempo suficiente, ela percorrerá todos os estados possíveis.

Imagine um recipiente fechado de gás, onde existem inúmeras moléculas de gás, cada uma passando por diferentes trajetórias de velocidade durante as colisões. A trajetória de longo prazo de uma única molécula é a mesma que a distribuição estatística de todo o gás, o que significa que podemos usar o estado de todas as moléculas em um determinado momento para inferir a trajetória de longo prazo de uma única molécula.

Esta é a famosa hipótese de ergodicidade de Boltzmann.

Em matemática, a propriedade de percorribilidade significa:

O lado esquerdo é a média temporal: descreve o resultado médio obtido por um indivíduo após passar várias vezes pelo mesmo processo durante um período de tempo suficientemente longo;

O lado direito é a média do grupo: descreve a expectativa estatística dos resultados obtidos ao observar inumeráveis indivíduos em um determinado momento. Em outras palavras: quando o sistema satisfaz as condições de ergodicidade, o desempenho de um único indivíduo acabará por convergir para a "média a longo prazo" do grupo.

Se o mundo fosse um espaço de estados acessíveis, a riqueza de cada pessoa acabaria por se aproximar do nível médio de riqueza da sociedade. Em um mundo acessível, todos poderiam experimentar todos os possíveis estados econômicos (rico, pobre, bem-sucedido, fracassado), e o destino individual sempre convergiria para a "média de longo prazo" do grupo.

Mas a vida real é muitas vezes não explorável: os recursos dos indivíduos são limitados e muitas vezes eles são eliminados devido a um fracasso antes de terem a oportunidade de experimentar todos os caminhos possíveis.

Nós costumamos ouvir declarações orientadoras como estas:

"A média de rendimento anual em certa indústria ultrapassa um milhão."

"Alguém alcançou a liberdade financeira aos 30 anos, e levou apenas dois anos a empreender."

"Um determinado fundo de índice tem um retorno anualizado alto a longo prazo, desde que continue a investir, ficará rico."

……

Estatísticas que parecem razoáveis parecem nos dizer uma verdade certa. Parece que, desde que se aja, o retorno médio a longo prazo se aplicará ao indivíduo. Mas esses casos pertencem a um processo não recorrente de dependência de trajetória + não replicável. Os imitadores não podem passar pela mesma história, rede de relacionamentos, nós de sorte, e nem mesmo sabem quantos fracassados estão escondidos.

Os dados dizem-te o valor médio a longo prazo do grupo, mas a realidade está cheia de "falências abruptas" a curto prazo.

Este é precisamente a armadilha mais oculta da não traversabilidade - a média das estatísticas de grandes dados ≠ o verdadeiro destino do indivíduo.

Um colapso pode ser irreparável para um indivíduo, uma falha pode fazer com que alguém saia completamente de cena, sem possibilidade de retornar ao "estado médio". Cada um de nós só pode viver uma vez o seu caminho de vida, não podendo, como em um cassino, usufruir da média de longo prazo do grupo, esperando que as probabilidades se igualem entre inúmeros apostadores.

Por que o destino a longo prazo dos indivíduos é geralmente pior do que a "média"?

Em sistemas não exploratórios, o desempenho a longo prazo dos indivíduos tende a ser inferior à média do grupo. Isso não é acidental, mas sim uma característica estrutural sistêmica. A média brilhante muitas vezes é puxada para cima por um número muito pequeno de histórias de sucesso empresarial, enriquecimento através de investimentos e recuperações surpreendentes, enquanto mais pessoas falharam e nunca entraram nas estatísticas.

Os sistemas reais são, na maioria dos casos, do tipo multiplicativo e apresentam características de dependência de trajetória — como o juro composto nos investimentos, o declínio da saúde e a deterioração da reputação. As características típicas desses sistemas são: limitações na ascensão e descida sem fundo.

Uma falência pode arruinar uma vida;

Uma única decisão errada pode mudar completamente o destino;

Uma única falta de crédito pode destruir completamente a confiança;

E a riqueza que se pode ganhar, o desempenho que se pode aumentar e as vantagens que se podem estabelecer são sempre limitados.

É por isso que, matematicamente, a taxa de crescimento a longo prazo de um processo multiplicativo não é igual ao "rendimento médio", mas está mais próxima de:

Em comparação, a média do grupo geralmente é calculada usando a média aritmética,

E como a função logarítmica é uma função estritamente côncava, com base na desigualdade de Jensen, temos:

Assim, a taxa de crescimento a longo prazo do sistema multiplicativo (ou seja, a média geométrica) é sempre menor que a média aritmética. Quanto maior a volatilidade, mais evidente se torna essa diferença. A média aritmética diz-lhe ‘como seria se tivesse sempre sorte’, enquanto a média geométrica lhe diz ‘quanto sobra depois de passar pelas tempestades do mundo real.’

Isso significa que o desempenho de um indivíduo a longo prazo está sempre muito abaixo da "média do grupo", não é má sorte, mas sim uma questão estrutural.

Como tomar decisões ótimas? A linha de ouro da fórmula de Kelly

Então, em decisões de vida, o que podemos fazer para evitar o destino de zerar em um jogo de longo prazo? Como podemos não falir e ainda conseguir um juro composto a longo prazo?

A resposta é: nunca faça All in, aprenda a apostar com a fórmula de Kelly!

A fórmula de Kelly (Kelly Criterion) é uma estratégia de aposta ótima usada em jogos repetidos, com o objetivo de maximizar o retorno a longo prazo enquanto evita a falência a curto prazo. Foi inicialmente proposta por John L. Kelly Jr. em 1956 no Bell Labs, e a sua intenção original era resolver a questão de "como alocar a potência do sinal em canais ruidosos" para maximizar a eficiência da transmissão de informações.

Mais tarde, essa teoria rapidamente ultrapassou fronteiras.

O matemático americano e gênio dos investimentos Edward Thorp descobriu que a fórmula de Kelly pode otimizar o caminho de crescimento da riqueza. Ele levou o método de Kelly para os cassinos e, em "Beat the Dealer", derrotou sistematicamente o dealer do blackjack pela primeira vez, depois levou para Wall Street, onde continuou a "colher" em "Beat the Market".

Este princípio é essencialmente equivalente à maximização do retorno logarítmico esperado (log-utility), equilibrando assim a dinâmica entre crescimento e risco. Ajuda você a encontrar um ponto de equilíbrio ótimo entre "viver muito tempo" e "ganhar o suficiente."

Fórmula de Kelly:

Neste caso, a probabilidade de sucesso é p, a probabilidade de falha é q = 1-p; o multiplicador de lucros em caso de sucesso (excluindo o capital) é b, e a proporção de perda em caso de falha é a (geralmente 1, se a perda for o montante total apostado).

Voltando ao jogo de lançar a moeda mencionado no início, você pode optar por apostar uma certa proporção do seu capital e continuar jogando, mas quanto deve apostar a cada vez de forma mais razoável?

Ou seja, a fórmula de Kelly sugere que você deve investir 37,5% do capital total a cada vez. Apostar demais, mesmo com vantagem, pode levar a uma liquidação direta após algumas perdas consecutivas; apostar de menos, por outro lado, pode fazer você perder o crescimento que deveria ser seu.

O significado da fórmula de Kelly é: encontrar aquele ponto que pode ganhar o máximo a longo prazo e ao mesmo tempo conseguir sobreviver.

Adicionando um ponto, a fórmula de Kelly é muito sensível às odds de vitória, mas na realidade esses parâmetros costumam ser incertos ou dinâmicos, portanto muitos praticantes conservadores optam por metade do valor sugerido por Kelly (chamado de estratégia de meio Kelly) em troca de um caminho de rendimento mais suave.

Experimento simulado: em um jogo de aposta com 100 mil pessoas jogando moedas, quantas conseguirão "sobreviver"?

Para compreender de forma mais intuitiva o impacto de diferentes estratégias de apostas no destino individual, simulei 100.000 jogadores participando de um jogo de lançamento de moeda, totalizando 200 rodadas, com cada um jogando de forma independente.

As regras do jogo continuam as mesmas: capital de 1000, ganha-se 80% com cara para cima e perde-se 50% com coroa para baixo. Os jogadores podem escolher uma proporção fixa de aposta: por exemplo, apostar tudo (100%), apostar 65%, 37,5%, ...

Resultado... quase todos os jogadores que apostaram 100% foram eliminados!

A riqueza final apresenta uma "distribuição de lei de potência", embora haja um número muito pequeno de pessoas que ficam ricas, a grande maioria dos jogadores acaba falindo.

Comparámos a distribuição de riqueza dos jogadores com estas 4 estratégias de aposta diferentes; quanto mais à direita estiver a distribuição de ativos, maior será a riqueza dos jogadores.

a. 100% de aposta: quase todos falem à bancarrota

A distribuição final de ativos sob a estratégia de aposta total tem um grande pico de pobreza à esquerda + uma estrutura de cauda de riqueza extrema à direita: a maioria das pessoas vai à falência, enquanto uma minoria ganha todo o dinheiro, essa é a verdadeira representação da assimetria de jogo + viés do sobrevivente.

b. Aposta de 65%: continua a haver uma polarização, ainda há muitas pessoas a falir.

c. 37,5% Aposta (Fórmula de Kelly): Crescimento estável da riqueza

Sob a estratégia de apostas de Kelly, a distribuição de ativos desloca-se claramente para a direita, com a maioria das pessoas a ver um crescimento dos ativos e uma distribuição concentrada, sendo este o modelo de acumulação de riqueza otimizado.

d. 10% de aposta: quase ninguém quebra, mas o retorno é muito baixo

Não há picos de distribuição de falência semelhantes a uma aposta total, mas a riqueza geral está concentrada na faixa de baixo patrimônio. Em contraste, a estratégia de 37,5% puxará claramente uma cauda longa à direita, alcançando a multiplicação de ativos.

A aposta de Kelly é a única estratégia que equilibra "não falir na maioria das situações" e "apreciação considerável", sendo a estratégia de sobrevivência a longo prazo mais otimizada matematicamente. Essa é a essência da fórmula de Kelly: não é para te fazer ganhar mais, mas para garantir que você consiga viver tempo suficiente.

A filosofia de vida na fórmula de Kelly

A fórmula de Kelly nos diz que o segredo do sucesso a longo prazo é aprender a controlar a proporção de "apostas". A vida não é uma competição para ver quem consegue dar um golpe crítico uma vez, mas sim para ver quem consegue continuar a jogar.

Na carreira, não se trata de sair impulsivamente, nem de ficar preso à zona de conforto; trata-se de planejar continuamente, melhorar as habilidades, ter coragem para mudar de direção e deixar uma opção em aberto.

No investimento, não se trata de apostar tudo para ficar rico, mas sim de controlar a posição com base nas odds, mantendo as fichas.

Em um relacionamento, não se deve colocar todas as emoções e valores em uma única pessoa, mas sim investir enquanto se mantém a própria identidade;

No crescimento e na autodisciplina, não se deve contar com uma explosão única para obter mudanças, mas sim otimizar a estrutura da vida de forma estável e em um estilo de juros compostos.

A vida é como um longo jogo, o seu objetivo não é ganhar uma vez, mas garantir que você possa continuar a jogar. Enquanto não sair do jogo, coisas boas certamente acontecerão.

Ver original
O conteúdo é apenas para referência, não uma solicitação ou oferta. Nenhum aconselhamento fiscal, de investimento ou jurídico é fornecido. Consulte a isenção de responsabilidade para obter mais informações sobre riscos.
  • Recompensa
  • Comentário
  • Compartilhar
Comentário
0/400
Sem comentários
  • Marcar
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)