O dilema do prisioneiro e a crítica ao reducionismo

Tive um professor de filosofia que, em suas aulas, reiterava sempre que não compreendia os alunos que diziam detestar química. “O que eles querem dizer com isso, que detestam seus próprios corpos? Que detestam a roupa que vestem, a cadeira em que sentam, o mundo em que vivem?”. O que o professor estava fazendo era chamar nossa atenção para a importância do discurso: não gostar de estudar química é uma coisa; dizer que “detesta a química” é dizer que detesta os hádrons e os léptons, os bósons e os férmions — ou seja, o mundo inteiro. É importante tomar cuidado com o discurso, pois num piscar de olhos estamos fazendo um elogio à ignorância, quando dizemos coisas como “detesto química”. Bem melhor seria dizer que a química enquanto ciência é importante, que respeita quem a estuda, mas que “não é minha praia”. É bem mais bonito e elegante; além disso, se nós fomos obrigados a estudar disciplinas com as quais não nos identificamos, é culpa de nossos professores e pedagogos, e não da disciplina em si… Eu, por exemplo, respeito bastante o trabalho dos engenheiros; adoro assistir programas como “megaconstruções”, “o segredo das coisas” ou “obras incríveis”, no National Geographic e no Discovery. Contudo, jamais poderia ser engenheiro ou físico, pois não tenho quase nenhuma habilidade matemática… Já se vão quase vinte anos que fiz cálculo I, e para mim, hoje em dia, integral é um leite que não foi desnatado. Assim sendo, admiro quem utiliza desenvoltamente a matemática, pois “não é minha praia”.

Essa minha falta de habilidade matemática me impede, certamente, de compreender mais a fundo uma série de complexas teorias evolutivas, oriundas de diferentes ramos do saber, incluindo a própria matemática (pura e aplicada). Se eu possuísse um melhor conhecimento matemático poderia ler obras como “Game theory and animal behavior”, de Dugatkin e Reeve, ou “Evolution and the theory of games”, de Maynard Smith, livros que tenho mas em cuja leitura ainda não me aventurei. Como se percebe claramente pelo título, ambas utilizam a teoria dos jogos para a compreensão do processo evolutivo, sobretudo para a evolução do comportamento.

O que é essa teoria dos jogos? De forma bastante resumida, trata-se de um ramo das ciências que tenta descrever matematicamente como as opções individuais, tendo em vista as opções dos outros participantes numa situação de escolhas estratégicas, determinam o sucesso ou o fracasso do participante. A publicação clássica, que praticamente inaugurou esse ramo da matemática, é “Theory of games and economic behavior”, de John von Neumann e Oskar Morgenstern. Inicialmente restrita à área da economia, a teoria dos jogos passou a ser largamente usada na biologia evolutiva a partir da década de 60 (segundo o Wikipédia, oito economistas ganharam o prêmio Nobel com trabalhos relacionados à teoria dos jogos, sendo o mais famoso John Nash, o personagem do filme “Uma mente brilhante”. Não conferi o número, por isso cito o Wikipédia como fonte dessa informação). Para demonstrar a importância da teoria dos jogos na biologia evolutiva, quero falar brevemente sobre o famoso dilema do prisioneiro, pois, além de ser um problema clássico e adequado para o meu argumento final, tem uma matemática “relativamente” simples (ou seja, ao alcance das habilidades deste que vos escreve…).

O dilema do prisioneiro é um dos casos mais estudados pela teoria dos jogos

O dilema do prisioneiro, em sua forma clássica, foi originalmente criado por Albert Tucker em 1950, a partir de elaborações prévias de Merrill Flood e Melvin Dresher, da RAND corporation. Sua descrição clássica é a seguinte:

Dois suspeitos, A e B, são presos pela polícia. A polícia não tem provas suficientes para condená-los, mas, mantendo os prisioneiros separados, oferece a ambos o mesmo acordo: se um dos prisioneiros, confessando, testemunhar contra o outro e esse outro permanecer em silêncio, o que delatou sai livre enquanto o cúmplice silencioso cumpre 10 anos de sentença. Se ambos ficarem em silêncio, a polícia só pode condená-los a 6 meses de cadeia cada um. Se ambos traírem o comparsa, cada um passará 5 anos na cadeia. Cada prisioneiro faz a sua decisão sem saber que decisão o outro vai tomar, e nenhum tem certeza da decisão do outro.

Uma forma visual de percebermos melhor a situação dos dois prisioneiros é colocar suas perdas numa matriz de 2×2, o que nos daria o seguinte (chamaremos “cooperar” de não delatar o companheiro; “trair” de delatar):

Prisioneiro B coopera
Prisioneiro B trai
Prisioneiro A coopera
A: cumpre 6 meses
B: cumpre 6 meses
A: cumpre 10 anos
B: sai livre
Prisioneiro A trai A: sai livre
B: cumpre 10 anos
A: cumpre 5 anos
B: cumpre 5 anos

Perceba que a melhor opção individual é trair sempre, ou seja, delatar o companheiro. Explicando detalhadamente: você não sabe o que seu companheiro dirá, se irá delatá-lo ou se irá silenciar. Porém, se seu companheiro silenciar, sua melhor jogada é delatá-lo: você sairá livre da prisão; se, por outro lado, seu companheiro delatá-lo, a melhor jogada é delatá-lo também, pois assim você cumprirá cinco anos, e não dez.

Contudo, apesar de a melhor estratégia individual ser “trair sempre”, isso não é verdadeiro quando se pensa “populacionalmente”, pois o dilema do prisioneiro é um jogo de soma não-zero (um jogo de soma zero, como o jogo de damas, War ou banco imobiliário, é aquele em que as perdas de um participante são exatamente os ganhos de outro). Quando os dois prisioneiros traem, a soma das penas é de 10 anos; quando um trai e o outro coopera, a soma das penas é de 10 anos; porém, quando ambos cooperam, a soma das penas é de um ano. Para percebermos isso mais adequadamente, façamos uma matriz de ganhos: nessa matriz, representa-se a quantidade de pontos ganha por cada jogada.

Cooperar
Trair
Cooperar 3, 3 0, 5
Trair 5, 0 1, 1

Como na matriz anterior, a melhor jogada é sempre trair, independentemente da opção de seu oponente. Contudo, se somarmos os pontos nessa matriz, veremos que a melhor opção populacional é que ambos cooperem (ou seja, quando ambos cooperam, temos a célula da matriz com o maior número de pontos).

O que temos aqui é um aparente paradoxo. Por um lado, a melhor opção individual é trair. Contudo, levando-se em conta “ambos” os prisioneiros, a melhor opção é que ambos cooperem (em termos matemáticos e econômicos, diz-se que “ambos traírem” é o equilíbrio de Nash, e “ambos cooperarem” é o ótimo de Pareto). A relação que faremos com o comportamento animal (o ser humano incluso…) é que, em certas situações, trair leva a maiores ganhos individuais, enquanto cooperar leva a um maior ganho geral, mesmo que o ganho individual seja menor. Assim, como podemos usar a teoria dos jogos para analisar a evolução dos comportamentos altruístas e egoístas entre (certos) animais?

Uma resposta possível pode ser encontrada no interessante livro de Robert Axelrod, chamado “The evolution of cooperation”, de 1984. Axelrod preparou um torneio com o dilema do prisioneiro: nesse torneio, cada jogador joga o dilema do prisioneiro com outro participante N vezes, sendo que, antes da próxima jogada, ambos ficam sabendo do resultado da jogada anterior, ou seja, das decisões que seus oponentes tomaram; cada participante joga contra todos os outros participantes. Axelrod pediu para que diversos pesquisadores escrevessem algoritmos para participar do campeonato. Curiosamente, descobriu-se que, em diversos encontros com diferentes estratégias, os programas mais agressivos (ou seja, mais egoístas) tendiam a ser piores em longo prazo.

Ao fim do torneio, a estratégia vencedora foi um simples programa com quatro linhas código em FORTRAN, escrito por Anatol Rapoport. O algoritmo, chamado de “Tit for tat”, consistia no seguinte:

  • Se não provocado, sempre cooperar.
  • Se provocado, retaliar imediatamente (ou seja, trair)
  • Se a provocação cessa, perdoar imediatamente (ou seja, cooperar).

O algoritmo de Rapoport, então, sempre iniciava a partida cooperando, e continuaria cooperando enquanto o oponente cooperasse. Contudo, se o oponente traísse, o algoritmo trairia na jogada seguinte. Por outro lado, se o oponente cooperasse, o algoritmo passaria imediatamente a cooperar, e continuaria a cooperar enquanto o oponente cooperasse. Em termos comportamentais, poderíamos dizer que o programa “Tit for tat” era gentil (ou seja, sempre iniciaria seu movimento com uma cooperação, o que chamamos de algoritmo otimista), retaliativo (segundo Axelrod, a estratégia vencedora não poderia ser um otimista cego; deveria retaliar), clemente (estar disposto a cooperar logo após a cooperação do oponente) e desapegado (ou seja, contentar-se em ter os mesmos pontos do oponente).

Quem entende de matemática (a matemática aqui é simples, basta ver a matriz de ganhos) irá perceber que um programa agressivo, ou seja, que trai sempre, nunca irá perder uma partida, e que o programa “Tit for tat” nunca irá ganhar uma partida. Porém, o concurso não consistia de apenas uma partida de N movimentos, e sim de uma infinidade de partidas onde todos os algoritmos jogavam contra todos os algoritmos. É nessa situação que “Tit for tat” torna-se o campeão em pontos acumulados (uma curiosidade: num torneio posterior, com diversos outros algoritmos, a estratégia “Tit for tat” continuou campeã).

Eis, portanto, o momento de apresentar minha opinião. É muito comum ouvirmos que não há comportamentos genuinamente altruístas, e que todo e qualquer altruísmo é o resultado secundário de um comportamento egoísta. Bem, se você considera que só há altruísmo verdadeiro quando um comportamento necessariamente faz seu executor sempre se estrepar (o nome é feio, mas significa “ferir-se com estrepe”, ou seja, com espinho) e não obter jamais benefício algum, então tenho que concordar com você, não há altruísmo entre os animais. Contudo, não é isso que entendemos por altruísmo. Quando os prisioneiros cooperam, eles estão reduzindo a pena somada de ambos, e isso é altruísmo. Minha crítica aqui é em relação ao reducionismo genético-evolutivo, que estabelece não poder jamais o altruísmo surgir evolutivamente (tenho que ser cuidadoso e evitar o nome de Richard Dawkins, pois a maioria dos meus colegas — leitores desse blog — são fãs dele. Eu também sou, mas não tenho que aceitar a granel tudo que ele escreve…). Penso que isso é possível, que numa dada população animais com um comportamento gentil e clemente, porém retaliativo, teriam suas freqüências aumentadas em relação a companheiros com um comportamento mais agressivamente egoísta, pois esse comportamento altruísta seria selecionado (tendo em vista a totalidade das relações). O altruísmo é uma propriedade emergente. Portanto, penso que é perfeitamente possível explicarmos do ponto de vista genético e evolutivo a prevalência e a supremacia de comportamentos altruístas em diversas espécies, e em diversas situações particulares. Vale a pena ainda lembrar que, numa população em que a maioria dos componentes é altruísta, o altruísmo seria uma estratégia evolutivamente estável (ESS), dificultando bastante o surgimento de estratégias egoístas. Esse, contudo, é um assunto para outro artigo…

9 comentários sobre “O dilema do prisioneiro e a crítica ao reducionismo

    • Professor,
      obrigado pelo comentário.
      Maynard smith é um escritor que admiro faz muito tempo, desde que li o “origins of life”. tenho que aproveitar o “evolution and the theory of games” pra estudar mais matemática…
      abraço.

  1. Gerardo,
    Muito obrigado pelo esforço desprendido por causa do assunto.Gostei muito do post, como fui me apaixonar pelo conhecimento somente esse ano (logo no terceiro ano do ensino médio) não tinha muita informação sobre esse assunto que encontrei enquanto pesquisava sobre a teoria da Rainha Vermelha e tive o entendimento de uma criança sobre o assunto, agradeço de novo pois sou fã de sua maneira de produzir idéias, vou agora voltar a ler um pouco sobre o assunto com a certeza de que entenderei mais.
    Abraços!

  2. Parabéns pelo belo texto, que prima pela clareza e desdobra-se numa sequência lógica perfeita para explicar o assunto principal.

    Nossos alunos precisam de explanações assim!

Deixar mensagem para Diego Cancelar resposta