
Portuguese: 
Olá, eu sou William Spaniel.
Vamos aprender Teoria dos Jogos!
O tópico de hoje é o Dilema dos Prisioneiros e o conceito de solução por dominância estrita.
Eu explico isso na seção 1.1 do meu livro. Você pode aprender mais sobre isso
clicando na descrição deste vídeo.
De qualquer forma,
eis a situação:
dois suspeitos são presos
a polícia acredita que eles estavam tentando roubar uma loja, mas os policiais só têm
evidência suficiente  para provar que os suspeitos estavam invadindo.
Assim, para responsabilizar os prisioneiros pelo crime maior, a polícia precisará
que um dos criminosos denuncie o outro
e a forma como a polícia extrairá a confissão é colocando os suspeitos
no dilema dos prisioneiros
que podemos descrever assim:
cada um dos suspeitos será colocado individualmente em uma sala
de interrogação e a ele será apresentada a seguinte oferta:
se nenhum deles confessar o roubo
o policial só poderá punir os suspeitos pela invasão, e a
punição para isso é um mês na cadeia para cada um.
Mas se um confessar e o outro não
o policial será leniente com o que denunciou o outro, agradecendo a ele pela confissão,
e punirá severamente aquele que não confessou. Serão 12 meses na prisão para o
que ficou calado. E aquele que denunciou o outro jogador

English: 
Hi, I'm William Spaniel. Let's learn some game
theory.
Today's topic is the prisoners dilemma and
the strict dominance solution concept.
I cover this in lesson 1.1 of my textbook can learn more about that
by clicking on the video description
in any case
here's the situation
two suspects are arrested
the police think that they're trying to rob
a store but the cops only have the
evidence to prove that the suspects were
trespassing
thus, to charge that the contacts with the
greater crime the police are going to need
one of the criminals rat out the other
and the way the police are going out was
that a confession is by throwing them
into the prisoners dilemma
which looks like this
each of the convicts is going to be
privately sequestered in interrogation
room and offered the following deal
if no one confesses to the robbery
the police are only to be able to charge
the prisoners with trespassing, and the
punishment for that is one month in jail
a piece
but if one confesses in the other one
doesn't
the police will be lenient on the rat
thanking him for his confession
and severely punish the quiet one that's
gonna be twelve months in jail for the
one who kept quiet and the one who ratted
out the other guy

Portuguese: 
poderá sair livremente - não passará nenhum tempo na cadeia.
Finalmente, se ambos confessarem, o policial poderá punir ambos pelo crime de roubo
e isso resultará em uma sentença muito maior do que
pelo crime de invasão. E, nesse caso, serão 8 meses de cadeia para cada um
em vez de um mês, da punição por invasão.
A questão é a seguinte:
Suponha que os ladrões só desejem minimizar o número de meses que passarão na cadeia.
Estamos fazendo uma hipótese aqui.
Estamos supondo que os criminosos se importam apenas com eles mesmos, por enquanto.
Se esse é o caso, eles deveriam confessar o crime ao policial?
Foram muitas informações nos últimos dois slides, mas podemos resumir tudo
nessa pequena matriz de recompensas e isso é o que chamamos
Dilema dos Prisioneiros
Temos dois jogadores: Jogador 1, Jogador 2.
Cada um deles tem duas estratégias: eles podem ou confessar ou ficar quieto
e a partir dessas estratégias você pode obter diferentes resultados. Se ambos
ficam quietos, então ambos passam 1 mês na cadeia - ambos recebem -1
ali
Se um confessa e o outro fica quieto, o que confessa - neste caso, o Jogador 2
não fica nenhum tempo na cadeia e o Jogador 1 recebe 12 meses, que é -12

English: 
is going to be able to walk free--he'll
spend no time in jail whatsoever
finally if both confess then the police can
actually punish them for robbery
and then that's going to result in a
much greater jail sentence than
trespassing and this time, it's going to be eight
months in jail apiece
instead of one had the only been able to charge them with trespassing
so the question looks like this
supposed to be used only one minimize
the number of months they spend in jail. we're making an
assumption here
we're supposing the criminals only
care about themselves for the moment. if
that's the case should they confess to
the police?
now we saw a lot of information in the
last two slides but we can condense it
into just this little payoff matrix
right here and this is what we call a prisoner's
dilemma
so we have two players: player one, player two
each of them has to strategies: they can either confess or keep quiet
and based off those strategies you
end up at different outcomes so if both
keep quiet then they both spend one month in
jail, so they both eagles get negative one right
there
if one confesses and the other one keeps quiet
the one one who confesses, in this case player
two, gets no time in jail and player one
gets twelve months in jail so that's a

Portuguese: 
E o inverso ocorre aqui.
E, finalmente, se ambos confessam, ambos terminam aqui, quando cada um passa 8 meses na cadeia.
E, claro, se você ficar confuso a respeito dos payoffs, note que eles foram
coloridos de tal forma que o Jogador 1 é
azul e o Jogador 2 é vermelho
Além disso, em teoria dos jogos, temos a seguinte convenção: o Jogador 1 é homem e
o Jogador 2 é mulher.
A razão para isso é podermos usar pronomes como "ele" e "ela" para diferenciar
entre os jogadores sem
criar confusões extras.
Posto isso, vamos resolver este jogo
e a forma como faremos isso é notando como 
o Jogador 1e o Jogador 2 deveriam
responder
baseado no que a outra pessoa fará. 
Então, vejamos isso por um instante da seguinte forma.
Apenas destacamos o payoff do Jogador 1 aqui.
Suponha que o Jogador 1 soubesse que o Jogador 2 ficaria quieto. Ele simplesmente previu isso.
Ele viu o futuro e soube que o Jogador 2 ficaria quieto.
O que ele deve fazer?
Bom, se olharmos para os payoffs neste quadro,
veremos que ele estará melhor
confessando do que ficando quieto,
porque ele ficará zero meses na cadeia se confessar
e um mês se ficar quieto. 
Como 0 é maior do que -1, ele deve

English: 
negative twelfth and it's the reverse situation
over here
and finally both if confess then you end up
over where they both spend eight months in jail
and of course if you get confused about
the payoffs, then just notice that these are
color coordinated where player one is
blue and player two is red
now also in game theory we have the following
convention: we make player one a man and
player two a woman
the reason we do is so we can use
pronouns like he and she to differentiate
between the players without
creating any extra confusion
so that aside, let's actually solve this game
and the way we're gonna do that is by noting
how player one and player two should
respond
based off what the other player is going to do
so let's look at this for a second like this
this is just highlighting player one's payoffs here
supposed player one knew that player two
is going to keep quiet he can just
predict this. he saw into the future he
knew that players two was going to keep
quiet. What should he do?
well if we look at the payoffs on the screen here,
we see that he's better off
confessing than he is keeping quiet because
he spends no time in jail if he confesses
and one month in jail if he keeps quiet.
So 0 is greater than -1, he should

English: 
confess if player two keeps quiet.
now suppose player one knew that player two
was going to confess
think about what he should do here.
Well, if he keeps quiet he will twelve months
in jail; if he confesses, he will spent eight
months in jail
so in response to player two confessing
player one is also better off confessing
if you string these two pieces of information together
whether player two keeps quiet or confesses,
player one is always
better off confessing
confessing always leads to a better outcome.
We say that player one's
confess strategy strictly dominates
his
keep quiet strategy and so in general
strategy x dominates strategy y
if generates greater payoff than y
regardless what the other players do
so in this case this is confess strictly
dominating
keep quiet
so keep quite as strictly dominated
now, rational players never play strictly
dominant strategies like keeping quiet
the reason for that is why would you want to
keep quiet when you could confess and
do better and so in general why would
you want to play y would you play x
instead?

Portuguese: 
confessar se o Jogador 2 ficar quieto.
Agora, suponha que o Jogador 1 soubesse que o Jogador 2 confessaria.
Pense no que ele deveria fazer aqui.
Bem, se ele ficar quieto, passará 12 meses na cadeia; 
se ele confessar, passará 8
meses na cadeia.
Então, em resposta ao Jogador 2 confessando, o Jogador 1 também fica melhor se confessar.
Se você combinar essas duas peças de informação
se o Jogador 2 ficar quieto ou confessar, 
o Jogador 1 sempre estará
melhor confessando.
Confessar sempre leva a um melhor resultado.
 Dizemos que, para o Jogador 1,
a estratégia "confessar" domina estritamente
sua
estratégia de "ficar quieto".
 Generalizando, a estratégia x domina a estratégia y
se x gera um payoff maior do que y independentemente do que os outros jogadores façam.
Neste caso, "confessar" domina estritamente
"ficar quieto".
"Ficar quieto" é estritamente dominada.
Agora, jogadores racionais nunca jogam estratégias estritamente dominadas como "ficar quieto".
A razão para isso é "por que você ficaria quieto quando poderia confessar e
se sair melhor?". Genericamente, "por que você jogaria y se pudesse jogar x
no lugar?"

Portuguese: 
Então, no futuro, no decorrer destes vídeos, nós vamos garantir
que
estes jogadores nunca jogarão estratégias estritamente dominadas, porque simplesmente
não faz sentido para eles fazerem isso.
Então, para terminar de resolver o dilema dos prisioneiros dos jogadores, sabemos que
o Jogador 1 irá confessar.
Assim, só falta entender o que o Jogador 2 fará aqui.
Imagine que o Jogador 2 soubesse 
que o Jogador 1 ficaria quieto.
Podemos ver que ela está exatamente na mesma situação que o Jogador 1. Se o Jogador 1
fica quieto, ela também fica melhor confessando,
 pois 0 é maior do que -1
mas, por outro lado, se o Jogador 1 for confessar e o Jogador 2 pudesse
ver isso antecipadamente, novamente, o Jogador 2 também desejaria confessar
pois -8 é melhor do que -12. 
Começamos com os quatro resultados
distintos possíveis aqui, 
mas sabemos que há apenas um resultado razoável
que é ambos os jogadores confessarem.
Quando você mostra isso para pessoas que não conhecem teoria dos jogos, elas perguntarão
"Mas isso não faz sentido. Por que eles fizeram isso
quando esse resultado, em que ambos ficam, quietos é melhor para ambos?"
E é verdade que esse é um resultado melhor para ambos os jogadores coletivamente, correto?
Porque -1

English: 
and so in the future as we go through
these videos we are going to make sure
that
these players are never going to be playing strictly
dominated strategies--it just doesn't
make sense for them to ever do that
and so to finish solving the players'
prisoner's dilemma here we know that
player one is going to confess
so all that's left is to figure out what
players two is going to do here.
So imagine that player two knew that player
one is going to keep quiet
we can see that she's in the exact same
boat as player one is. If player one keeps
quiet she's also better off confessing
because 0 is greater than -1
but on the other hand if player one is
going to confess and player two could
see that in advance again players two
would also want to confess because
-8 is better than -12.
And so you end up starting out with four
different outcomes possible here but we
know that there's only one sensible
outcome
and that is for both the players to confess
now when you first show this to people
who are new to game theory, they will ask you "okay, that
doesn't make sense. Why they did this
outcome right here
when this outcome when they both keep
quiet is mutually better for them?"
And it's true this is a better outcome
for both the players collectively, right?
Because -1

Portuguese: 
e -1 é melhor individualmente e coletivamente do que confessar
e cada um ficar 8 meses na cadeia.
Mas a explicação para este resultado não ser razoável é que cada um deles pode
individualmente se sair melhor ao mudar para confessar
e assim não há solução estável neste caso, 
porque eles sempre podem melhorar
ao mudar suas estratégias para confessar.
Mesmo que eles tenham concordado em fazer isso [ficar quieto] um tempo antes de serem
levados para a sala de interrogação
esse tipo de acordo não resiste ao teste do tempo porque
tão logo eles estejam na sala e precisem decidir entre confessar ou ficar quieto
é do interesse individual deles
confessar e não ficar quieto
E é por isso que dizemos que o único resultado razoável é quando ambos os
jogadores confessam.
Isso foi, em poucas palavras, o dilema dos prisioneiros e a dominância estrita.
No próximo vídeo, começaremos a falar como podemos
usar a ideia de dominância estrita
para obter soluções para jogos ainda mais complicados. Nos vemos lá!

English: 
and -1 is better individually
and collectively than confessing
and then you get eight
months in jail apeace
but the reason that this outcome isn't
sensible is because each of them can
individually do better by switching off
to confess
and so there isn't as stable sort of
solution here because they can always do
better by flipping their strategies and
going to confess
even if they agree to do is in the in
the time before they actually went
to the interrogation rooms
those sorts of agreements don't actually
withstand the test of time because as
soon as they get into the room and
actually had to confess or keep quiet
it's in their individual interest
to confess and not keep quiet
so that's why we think that this is the
only outcome that's sensible when both of
the players confess
so that is the prisoner's dilemma
and strict dominance in a nutshell
and in the next video we will start talking
about how we can
use the strict dominance idea
to get to even more complicated games'
solutions. Join me then.
