O Dilema dos Prisioneiros e os Equilíbrios Ineficientes
Home  I  Índice   I  Livros  I  Links   I  Download   I  Quem Sou   I  Fórum Log

 
O Dilema dos Prisioneiros e os Equilíbrios Ineficientes
 
O que é o Dilema dos Prisioneiros     
 
O Dilema dos Prisioneiros é um jogo muito famoso que representa bem o dilema entre cooperar e trair [NOTA 1]. Resumidamente, a estória é a seguinte. Dois suspeitos, A e B, são presos pela polícia. A polícia não tem provas suficientes para os condenar, então separa os prisioneiros em salas diferentes e oferece a ambos o mesmo acordo:

1. Se um dos prisioneiros confessar (trair o outro) e o outro permanecer em silêncio, o que confessou sai livre enquanto o cúmplice silencioso cumpre 10 anos.
2. Se ambos ficarem em silêncio (colaborarem um com ou outro), a polícia só pode condená-los a 1 ano cada um.
3. Se ambos confessarem (traírem o comparsa), cada um leva 5 anos de cadeia.

Cada prisioneiro faz a decisão sem saber a escolha do outro - eles não podem conversar. Como o prisioneiro vai reagir? Existe algum decisão racional a tomar? Qual seria a sua decisão?

Usando uma matriz como recurso visual

Uma forma esquemática para mostrar uma interação humana, ou seja, um jogo, é através de uma "matriz de resultados" [NOTA 2]. Embora o enunciado do problema seja simples e intuitivo para entender de forma verbal, a representação gráfica oferece uma grande ajuda para visualizar o cenário de forma completa e entender as opções e implicações para cada jogador.



Nesta figura você visualiza as duas opções de cada prisioneiro e o resultado de cada combinação de ação. Para cada célula, os valores vermelhos a direita referem-se ao Prisioneiro A; os azuis a esquerda referem-se ao Prisioneiro B. Estão descritos quantos anos cada prisioneiro ficará na cadeia. Neste cenário, quando menor o valor da pena, melhor para o prisioneiro.

Os prisioneiros não podem combinar a decisão (estão em salas isoladas e sem comunicação) e devem escolher simultaneamente. Cada jogador quer ficar preso o menor tempo possível, ou seja, maximizar seu resultado individual. Qual a melhor decisão? Considerando os incentivos deste jogo (os valores das penas para cada combinação de decisões na matriz), existe uma única decisão racional a tomar: trair. A explicação é a seguinte:

Imagine que você é o prisioneiro A. Assim, você raciocina nas duas hipóteses:
- Suponha que o Prisioneiro B escolha Colaborar. Então, se você escolher Colaborar, leva 1 ano de prisão. Se escolher Trair, sai livre. Neste caso, Trair é a melhor opção.
- Suponha que o Prisioneiro B escolha Trair. Então, se você escolher Colaborar, leva 10 anos de prisão. Se escolher Trair, fica com 5 anos. Neste caso, Trair é a melhor opção.

Perceba que Trair é a melhor opção em ambos os casos. Em outras palavras, Trair é a melhor opção independente da decisão do Prisoneiro B.

Agora, imagine o que o Prisoneiro B está pensando: se ele é racional como você, provavelmente a mesma coisa.
- Ele supõe que você vai escolher Colaborar. Então, se ele escolher Colaborar, leva 1 ano de prisão. Se escolher Trair, sai livre. Neste caso, Trair é a melhor opção.
- Ele supõe que você vai escolher Trair. Então, se ele escolher Colaborar, leva 10 anos de prisão. Se escolher Trair, fica com 5 anos de prisão. Neste caso, Trair é a melhor opção.

De novo, perceba que Trair é a melhor opção em ambos os casos.

O dilema: a escolha individual não é o melhor para ambos


Em Teoria dos Jogos, chamamos que Trair é a Estratégia Dominante, ou seja, aquela que apresenta o melhor resultado independente da decisão do outro jogador. Quando em um certo jogo, devido o esquema de incentivos (a matriz de resultados) você não precisa se preocupar com a decisão alheia porque existe uma opção melhor independente do seu competidor, então você deve escolher a estratégia dominante.

Neste exemplo dos prisioneiros, como ambos vão escolher Trair devido a estratégia dominante, cada um é preso por 5 anos. Assim, dizemos que Trair-Trair é a solução de equilíbrio, equilibrio do jogo ou Equilibrio de Nash. O Equilibrio de Nash [NOTA 3] é a solução (combinação de decisões) em que nenhum jogador pode melhorar seu resultado com uma ação unilateral. Ou seja, dado que Trair-Trair é a solução de equilíbrio (o resultado racional do jogo), se o Prisioneiro A mudar unilateralmente para Colaborar ele sai perdendo (15 anos), o mesmo ocorrendo para o Prisioneiro B.

O grande problema no Dilema dos Prisioneiros é que o equilíbrio (Trair-Trair) não é o melhor resultado pois existe um outro possivel e melhor: se ambos escolherem Colaborar (ficar em silêncio) cada um ficaria com apenas um ano de prisão. Assim, o Dilema dos Prisioneiros é uma abstração de situações comuns onde a escolha do melhor individual conduz à traição mútua, enquanto que a colaboração proporcionaria melhores resultados. Por isso dizemos que o Dilema dos Prisioneiros resulta em um "equilíbrio ineficiente" pois o esquema de incentivos e racionalidade induz a um resultado pior.

Você poderia imaginar que este equilíbrio só ocorre porque as pessoas não podem conversar e combinar as ações, e que se pudessem fazer um acordo prévio, tudo se resolveria. Isso não é necessariamente verdade. Você quer colaborar (ficar em silêncio), mas quem garante que o seu parceiro fará o mesmo? O quanto você confia no outro jogador?

Você é o prisioneiro e sua vida está em jogo. Você combina antes que vai colaborar e quer cumprir sua palavra. Seu comparsa sabe isso. Então, o que garante que, no último instante, ele não vai te trair, justamente sabendo que você vai colaborar? Para ele é simples, ele sai livre e você pega 15 anos de prisão... Daí é tarde. Provalvelmente, o seu comparsa pensará da mesma forma a seu respeito. Por isso, o Dilema dos Prisioneiros se torna, na verdade, num Dilema da Confiança. Como resolver esse dilema? Você verá nos próximos artigos.
 
 
O Dilema dos Prisioneiros na vida real - Guerra de Preços     
 
[OBS: para melhor aproveitar este artigo, sugiro primeiro ler o O que é o Dilema dos Prisioneiros como introdução]

O maravilhoso mundo do Dilema dos Prisioneiros abre as portas para muitas analogias com a vida real. Este "jogo-modelo" é uma das metáforas mais poderosas na ciência do comportamento humano pois inúmeras interações sociais e econômicas tem a mesma estrutura de incentivos (a matriz de resultados). O conflito típico dos jogos da categoria "Dilema dos Prisioneiros" é que cada jogador escolhe sua estratégia dominante e o resultado é pior ao grupo como um todo; é o conflito entre o interesse individual e coletivo.

O exemplo do Posto de Gasolina e a Guerra de Preços

Imagine uma cidade com apenas dois postos de gasolina. Você é dono de um deles, chamado GASOIL, que fica lado a lado do seu concorrente, o posto CARGAS. Devido a proximidade, quando uma pessoa precisa abastecer o carro, ela vai até eles, visualiza o preço de ambos e escolhe pelo menor. Embora existam outros motivos que diferenciam os postos, como a cordialidade e velocidade dos frentistas, o preço é o fator mais relevante.

Assim, se o assunto é preço, alguns centavos a menos podem induzir parte dos clientes a preferir o posto com menor valor. Por exemplo, se seu concorrente abaixar o preço em 5%, ele ganha cerca de 30% dos seus clientes. Este aumento de volume de clientes compensa o preço reduzido, melhorando a rentabilidade, enquanto você perde faturamento. Por isso, você pensa: que tal abaixar o preço do litro de $3 para $2,90? Isso fará com que habituais clientes do CARGAS (concorrente) passem a abastecer no GASOIL (o seu posto).

A vida empresarial seria mais fácil se as decisões foram isoladas. Entretanto, como o seu concorrente vai reagir? Ao notar que você abaixou o preço e ele perdeu clientes, ele também vai abaixar o preço para $2,90. Como resultado, os dois postos terão preço igual ($2,90 no lugar de $3,) e o mesmo volume de cliente como antes, mas ambas empresas perdem faturamento e lucro. Essa é a essência de uma guerra de preços que prejudica o negócio dos dois postos.

Suponha que vocês tomam a decisão simultaneamente. Se hoje é domingo, vocês vão decidir qual o preço inicial na segunda-feira. Durante o dia não é possível alterar o preço, apenas de um dia para outro. Vocês não se conversam e não sabem qual preço o concorrente vai adotar. Você fica sabendo apenas no dia seguinte e qualquer arrependimento será tarde demais (ao menos durante um dia inteiro, até você tomar alguma atitude para o dia seguinte).

Considerando essa dinâmica de mercado com clientes sensíveis ao preço, ambos tem incentivos para abaixar o preço e ganhar mais momentaneamente. Entretanto, se os dois fizerem, ambos saem perdendo. Assim, preventivamente, você conversa com o dono do CARGAS e combinam de não abaixar os preços. Ele concorda, mas você vai dormir com a dúvida: será que posso confiar nele? Se ele abaixar o preço a noite, você perderá toda a clientela do dia seguinte. Você está num dilema - o Dilema da Confiança, ou melhor dizendo, é um jogo semelhante ao Dilema dos Prisioneiros.

Matriz de Resultados possui a mesma armadilha dos Prisioneiros

Embora seja intuitivo, podemos representar a matriz de resultados do posto de gasolina abaixo. Em cada célula (combinação de escolhas), o valor da esquerda refere-se os ganhos do Gasoil, e o valor a direita são os ganhos da Cargas. O valor em si é meramente ilustrativo, mas a proporção entre eles é que é relevante para a decisão.

CARGAS
Manter
Reduzir
GASOIL
Manter
50 , 50
30 , 60
60 , 30
40 , 40
Reduzir


Se ambos colaborarem, os dois ganham $50 por dia. Se um deles abaixar o preço, recebe $60 enquanto o que mantem reduz para com $30. Já se ambos reduzirem o preço, o resultado para cada um será $40, pois significa abaixar o preço sem aumentar volume de clientes. Como visto na metodologia de análise no Dilema do Prisioneiro, (40,40) é o ponto de equilíbrio (reduzir-reduzir) pois abaixar o preço é a estratégia dominante de cada um, resultando em pior valor se tivessem mantido o preço.

Eles caíram na armadilha e muitos chamam essas situações de Dilema Social - o interesse individual e análise estritamente matemática e racional induz a resultados piores do que outras opções olhando o coletivo. Como mencionado, é difícil sair dessa armadilha - quem vai arriscar a colaborar (manter o preço) se há chance do outro trair (reduzir o preço) e ganhar sozinho?

O próximo exemplo refere-se ao dilema da propaganda visual na cidade de São Paulo e a solução da lei Cidade Limpa.

 
 
Recapitulação     
 
 
 

[1] O Dilema dos Prisioneiros foi inventado em 1950 por Merrill Flood e Melvin Dresher, e foi adaptado e divulgado por A.W.Tucker.
[2] Em inglês, o termo usado é "payoff matrix". Em português existem algumas variantes: matriz de resultados, matriz de recompensas e matriz de pagamentos.
[3] O nome Equilibrio de Nash é devido seu inventor, John Nash, ganhador do prêmio Nobel em 1994 e que foi retratado no filme Uma Mente Brilhante, em 2001.


Comentários: [Deixe seu comentário] [Ocultar comentários]
  Clique aqui para ler os comentários feitos sobre este post


Deixe seu comentário sobre este artigo
  • (atenção com maiúsculas e minúsculas)
  • Should be Empty:
 
 
 
 
 
Follow teoriadosjogos on Twitter
 
Deixe seu comentario
 
Explore no site:

Artigos
Livros
Links
Download
Quem sou eu
Forum de Discussão
 
 
 


Direitos Reservados Fernando Barrichelo