E Demis, qual seus pensamentos a respeito?
Bem, meus pensamentos a respeito é que,
se pensarmos no que
inteligência artificial é,
para mim é a ciência de
criar maquinas inteligentes.
E, bem, acho que falando de um modo
geral, há duas formas de fazer isto:
A primeira é você mesmo
trabalhar na solução do sistema,
como os criadores do sistema, 
os programadores.
Trabalhar como explicitamente você
representa aquilo na forma de código.
E depois fazer a maquina automaticamente, e
de certo sem pensar, executar aquele código.
E, bem, você pode fazer coisas muito
impressionantes com coisas deste tipo.
A segunda forma de criar
inteligência artificial é
ao invés pré-programar o sistema com uma
solução para o problema, diretamente,
você ao invés faz algo mais importante, que
é inserir a habilidade de aprender sozinha
diretamente do dados brutos
ou das experiências brutas,
e descobrir por si mesma qual
é a solução para o problema.
E eu acho que, sabe, a história da
I.A até o momento tem sido sobre
o primeiro, e isto produziu 
resultados impressionantes.
Creio que um divisor de águas
para o campo de I.A foi quando,
como você disse anteriormente,
o Deep Blue, o computador da IBM,
derrotou Garry Kasparov 
no xadrez em 1997.
Eu acho que aquilo foi um grande
momento tanto para a I.A
quanto para os humanos como espécie.
Aqui estava uma máquina que podia,
embora através da força bruta,
vencer um campeão
mundial no que
nós consideramos um esporte
altamente intelectual.
Então, acho que foi um momento incrível,
mas na verdade eu estava mais
impressionado com o humano,
porque o Garry Kasparov não apenas
podia jogar contra esta bruta máquina
do tamanho de um quarto que basicamente
podia ser tão bom quanto ele no xadrez,
mas ele também pode falar,
ele também pode dirigir carros,
todas essas outras coisas, amarrar
 os cadarço dos sapatos dele, sabe..
E esta máquina, a coisa engraçado em
relação a ela, o porquê de, em minha opinião
inteligência restrita, ou
inteligência artificial "fraca",
como a chamamos de vez em quando,
não é inteligência artificial verdadeira.
Você pode ver, porque o Deep Blue
é o campeão mundial de xadrez,
mas ainda sim, ele não conseguiria jogar
qualquer jogo muito mais simples,
tal como o jogo da velha, por exemplo,
nem mesmo melhor que uma criança.
– Então, se pensar no que isto significa...
– Muito menos conseguir amarrar os sapatos...
– Certamente.
– O que permanece outro domínio.
Certamente, um muito difícil onde
o conjunto de habilidades é até maior.
Mas, isto é impossível de acontecer
no ramo de inteligência humana.
Qualquer mestre no xadrez, mesmo que
ele não conhecesse o jogo da velha,
você poderia trivialmente
ensinar aquela pessoa
em alguns poucos minutos a
como ser perfeita em tal jogo.
E ainda sim, no caso do Deep Blue você teria
que reprogramar completamente do zero,
e todo aquele conhecimento que ela
tinha sobre o xadrez seria inútil
para até mesmo um jogo muito mais 
simples, no mesmo tipo de domínio,
tal como o jogo da velha.
Então, o que nós realmente
estamos interessados no Deep Mind
é apenas a inteligência artificial
"forte", o tipo que aprende sozinha.
Então, o que nós trabalhamos na Deep Mind
são algoritmos de aprendizado de uso geral,
a ideia de que eles aprendem por si só a
como dominar um ramo de tarefas
diretamente de experiências sensórias,
e recebimentos de dados brutos.
e há um segundo uso geral lá,
que é esta ideia que
um único sistema,
ou apenas um conjunto de
algoritmos de aprendizado
pode potencialmente dominar um espectro 
muito amplo de tarefas, fora do planejado,
sem nenhuma reprogramação.
Agora, qualquer que seja a evidência
que temos que isto é impossível,
o fato é há 7 bilhões dessas andando 
coisas entre nossos cotovelos,
com uma mente humana,
que fazem justamente isto.
Com o mesmo equipamento, nós
podemos fazer este quase infinito
número de tarefas e possibilidades.
Então, esta é realmente a promessa
deste segundo tipo de I.A,
a habilidade de poder destrancar o
verdadeiro poder da inteligência.
Então, eu tenho alguns vídeos aqui para mostrar
pra vocês nossos algoritmos trabalhando.
Agora, em parte devido ao
meu passado em jogos,
mas também pelo fato de que acontece
que jogos, de que mundos virtuais,
são ambientes perfeitos
para testar a inteligência
destes tipos de algoritmos
de inteligência.
Então, nós acreditamos em 
algoritmos de inteligência
que começam com sensores
de dados brutos,
este tipo de I.A é chamado
de "Body Cognition",
a ideia de que sistemas de pensamento reais
precisam estar inseridos numa realidade sensorial,
da mesma forma que,
é claro, os humanos estão.
Agora, geralmente quando você começa
a trabalhar em "Body Cognition",
você começa com robôs,
mas robôs são um total pesadelo
da perspectiva do hardware.
Então, você na maioria das vezes acaba se 
preocupando apenas com os vários motores,
e como eles funcionam, e como eles
quebram e coisas do tipo, e eles são caros...
e você acaba nunca realmente trabalhando
na questão interessante de inteligência.
Então, nós decidimos pular esta etapa
e ir diretamente para mundos virtuais.
E aqui, com as diferenças primordial, que
nós apenas fornecemos a máquina com
um sentido bruto de recebimento de dados que, digamos, um humano iria ter ao olhar para a tela.
Então, nós começamos, é claro,
não usando jogos atuais,
nós começamos com
jogos mais simples,
começamos com jogos clássicos
do Atari dos anos 80,
estes jogos icônicos, que alguns
 de vocês estarão familiarizados.
E então nós estamos progredindo quase 
que pela história dos jogos no geral,
indo em direção a jogos cada
vez mais e mais complexos,
nós estamos meio que nos anos 90 agora.
Mas eu vou lhes mostrar
agora nossos algoritmos
basicamente se tornando
mestre em jogos de Atari.
Então, a primeira coisa que eu vou lhes
mostrar é o clássico "Space Invaders",
provavelmente o jogo mais
icônico do Atari de todos.
Eu vou mostrar duas partes deste curto clipe.
Então, no começo está a primeira vez que
a máquina viu esta corrente de dados,
portanto, a forma como ela irá jogar este
jogo é pelo único "retorno" que recebe,
que são os pixels na tela ,
então 30 mil números por frame,
é tudo que ela recebe,
esta corrente de números.
Ela está ligada a um controle, então
ela sabe que tem 18 possíveis ações,
mas não sabe o que estas ações fazem,
então há 9 posições do controle
mais os 5 botões na parte de cima.
Então, não sabe o que estas ações fazem,
ela tem que descobrir isto por
si mesma por noções primitivas,
e nós só damos o objetivo de
maximizar o placar, e é isto.
Não há outra informação no sistema, ela
tem que descobrir todo o resto sozinha.
Então, eu só vou colocar
este vídeo para rodar.
Então, esta primeiro parte é antes do treino,
portanto esta é literalmente, a
primeira vez que esta máquina
viu esta corrente de dados,
esta fluxo de pixels,
então ela não faz ideia de que está
controlando o foguete no rodapé da tela,
não tem ideia de como ganhar pontos,
não tem ideia de como perde vidas,
e você vai perceber que ela perde
3 vidas quase que imediatamente,
então ela está jogado de
forma aleatória no momento,
Entretanto depois de uma noite treinando
em uma única GPU nos nossos servidores,
ela está simplesmente jogando melhor.
Você volta de manhã, e agora está melhor
do qualquer humano conseguiria jogar:
toda bala acerta alguma coisa,
ele não é mais morto
pelos invasores do espaço,
ele descobriu que a nave mãe passando na
parte de cima da tela vale mais pontos,
ele dispara estes inacreditáveis tiros
precisos para conseguir estes pontos.
E como o Bem estava dizendo, é construído como um modelo tão apurado deste mundo que ele está,
que se você observar o
ultimo invasor do espaço
ele começa a se mover mais
rapidamente conforme há menos deles,
observe a última bala, ele meio 
previamente dispara onde acha
que o invasor do espaço vai
estar em alguns segundos.
Então, é um modelo perfeito desta
altamente complexa corrente de dados.
Agora, é claro que isto são apenas jogos,
mais isto poderia ser qualquer coisa,
isto poderia ser qualquer coisa, isto
poderia dados de mudanças climáticas,
pode ser dados econômicos, dados
do mercado do mercado de ações,
qualquer coisa que tem modelos
de sequencial de dados,
que é a maioria das coisas hoje em dia.
Eu só vou lhes mostrar um último vídeo,
que é um dos meus favoritos,
que é o jogo "BreakeOut"".
Bem, neste jogo você controla
este bastão no rodapé da tela
e você está tentando quebrar através
destas barreiras nas cores do arco-íris,
e aqui é após, literalmente,
13 minutos de treino real,
está no seu 100º jogo,
e você pode observar que
ele é bem ruim no jogo,
mais você pode notar que ele está
começando a perceber a ideia de que
ele deveria mover a
barra em direção a bola ,
então ele perde uma vida
quando a bola passa.
Isto é apos 1 hora, 200º jogos.
Então, você pode notar que
está quantitativamente melhor,
mas ainda não
está brilhante.
Agora 2 horas depois, neste momento ele
praticamente já se tornou mestre no jogo,
ele quase sempre consegue
mandar a bola de volta,
mesmo quando a bola está
voltando em ângulo muito rápido,
então está melhor que a maioria
dos humanos conseguiria jogar.
Mas então nós pensamos,
isto é muito bom,
mas o que aconteceria se
o deixássemos jogando mais,
então nós apenas deixamos ela jogando
o jogo por mais algumas horas,
e então para a nossas surpresa, ela
bolou com está estratégia aperfeiçoada
que é cavar um túnel pelos lados,
mandar a bola por trás,
nesta inacreditável
super apurada forma .
E na verdade, o engraçado a respeito
disto é que os projetistas do sistema,
estes caras brilhantes
na Deep Mind,
eles... na verdade não são
muito bons em jogar os jogos ,
e eles não pensaram aquela
estratégia eles mesmos,
então, eles de fato aprenderam algo com
o próprio programa que eles criaram,
que é uma coisa bem
interessante para se pensar.
Algo que vai ter utilidade para eles
posteriormente na vida também.
Claro, exatamente, é claro.
Isto é uma coisa
interessante para se pensar,
e comportamento
emergente deste tipo
é exatamente o tipo de coisa que você nunca
poderia receber de um sistema no
qual você planejou todas as regras...
Não, você nunca pode receber mais
retorno dele do que você colocou.
Que de certo modo receber mais
retorno do que você colocou
é a definição de
inteligência real.
Sim, e eu acho que esta é a coisa
interessante a respeito de I.A,
este tipo de algoritmo de aprendizado,
esta é promessa dele.
Pense naquele jogo de uma
maneira análoga ao mundo físico,
se você é um projetista de
motores automobilísticos,
ou de motoros de foguetes ou até,
como a gente estava falando,
ser um astronauta como o 
Elon Musk, alguém deste tipo.
Alguém como Elon Musk sabe cada
componente nos seus foguetes,
e aquele foguete pode ter uma pane,
tomará que não, mas pode ter um bug,
mas ele não vai produzir
comportamento algum que,
ou atingir alguma tarrafa, para
qual ele não foi pré-projetado.
E eu acho que eu não consigo,
talvez alguém da plateia consiga,
pensar em outras tecnologias que tem
isto nela, que o projeto do sistema,
potencialmente o sistema possui
algum tipo de capacidade emergente
que pode ir além do que você projetou.
