
Spanish: 
Google DeepMind Deep Q-learning
El algoritmo va a jugar al Breakout de Atari
Lo más importante es saber que
el agente recibe lo que se ve en la pantalla y le fue indicado que maximice el puntaje que aparece
¡No hay conocimientos previos!
Esto significa que el algoritmo no conoce el concepto de pelota o que hacen los controles
Empezando - 10 minutos de entrenamiento
El algoritmo intenta pegarle a la pelota
pero es muy torpe para lograrlo
Después de 120 minutos de entrenamiento
¡Juega como un experto!

French: 
L'algorithme va jouer à Atari breakout
La plus importante chose à savoir est l'agent ne connait que ses entrées sensorielles (ce qu'il voit sur l'écran) et on lui demande de maximiser son score à l'écran
Aucune connaissance du domaine n'est impliquée! Cela signifie que l'algorithme ne connait pas le concept de balle et ne sait pas ce que ses commandes font exactement.
Début du jeu : 10 min d'entrainement.
L'algorithme essaie de renvoyer la balle, mais il est encore trop maladroit pour y arriver.
Après 120 minutes d'entrainement
Il joue comme un expert!

Spanish: 
Después de 240 minutos de entrenamiento
Acá es donde toda la magia ocurre:
Se da cuenta que haciendo un tunel a través de la pared es la técnica mas eficaz de ganar el juego

French: 
Après 2h d'entrainement
C'est la où la magie survient : il réalise que creuser un tunnel à travers le mur est la technique la plus efficace pour battre le jeu
