Bonjour à tous! Aujourd'hui est une émission
un petit peu particulière puisque nous
allons parler d'abord jeu de société
avec Squadro mais nous allons aussi
parler intelligence artificielle et
jouer une partie complète contre cette
fameuse intelligence artificielle par la
suite. C'est parti!
Nous allons donc commencer par une
explication du jeu Squadro. Dans
Squadro chaque joueur possède cinq pions.
Un joueur possède les cinq pions clairs
l'autre joueur possède
les cinq pions foncés. À mon tour de
jeu je dois choisir un des cinq pions et
l'avancer d'un nombre de cases qui
correspond au nombre de points indiqués
sur la ligne de départ.
donc dans ce cas-ci par exemple je
devrais avancer ce pion de trois cases.
si un pion atteint la ligne opposée
il interrompt son trajet et se retourne.
à partir de ce moment là sa vitesse de
déplacement va devenir celle indiquée
par la ligne opposée.
il va effectuer son chemin toujours en
ligne droite jusqu'à la ligne de départ
et c'est gagné pour un pion. le but du
jeu c'est de faire un aller-retour à 4
parmi les cinq pions. donc le joueur qui
y parvient en premier gagne la
partie. en cas de croisement
dans ce cas-ci
par exemple, les pions
se prennent comme aux dames, donc
on passe par dessus et le pion par
dessus lequel on est passé retourne sur
sa ligne de départ. s'il était en cours
de retour alors il
retourne sur son étape intermédiaire. ça
vous donne tous les détails du jeu
Squadro et donc maintenant on va pouvoir
passer à l'explication de l'intelligence
artificielle. Et pour présenter cette
intelligence artificielle je suis venu
en compagnie de mon fils Cyril. alors
pour commencer Cyril, est-ce que tu
peux te présenter en quelques mots?
alors j'ai 22 ans je suis un étudiant en
ingénierie et je me suis spécialisé en
intelligence artificielle.
tu as donc réalisé un projet personnel
sur base de développements récents en
intelligence artificielle.
oui, en 2015 google deepmind publiait ses
résultats sur AlphaGo une intelligence
artificielle capable pour la première
fois de battre un joueur professionnel
au jeu de go. en effet, on a tous entendu
parler de cette fameuse rencontre en
2017
entre AlphaGo et le champion
du monde de l'époque, qui était chinois
qui s'appelait Ke Jie, qui a joué trois
parties contre alpha go, qui a abandonné
la troisième partie, qui a perdu les deux
premières, et puis abandonnée à la
troisième partie, et pris sa retraite
quelques semaines plus tard. Oui fin 2017
 google deepmind a publié une nouvelle
version de son programme qui s'appelle
maintenant alphazero et qui est justement
capable de jouer au jeu de go à partir
de zéro sans aucune connaissance humaine.
Et ça, c'est la différence fondamentale
avec le deep blue des années 90
développé par ibm qui jouait aux échecs
à l'époque, qui était un programme à qui
on avait appris à bien jouer aux échecs.
l'approche d'alphazero ici est de
développer une intelligence qui soit
capable d'apprendre par elle-même à
jouer au go, en l'occurrence. ce qui
nous amène donc à ton fameux projet
squadro. oui en fait google deepmind a
publié le résultat de ses recherches.
je les ai reprises j'ai réimplémenté alphazero et je l'ai appliqué au jeu
squadro. et si nous tournons cette vidéo
c'est parce que tu va nous présenter ton
alpha squadro pour la première fois en
public et nous allons jouer une partie
complète contre lui oui allons-y. donc
c'est parti pour une partie de squadro
donc le principe c'est que Cyril
est venu avec son ordinateur
on ne va pas jouer sur l'ordinateur on
va jouer sur le vrai plateau de jeu
quand on fera un coup cyril va l'encoder
dans l'ordinateur et il fera la réponse
de l'ordinateur il appliquera sur le
plateau de jeu ici en bois qui est le
vrai squadro. c'est donc parti qui c'est
qui commence? les jaunes
peuvent commencer.
bon alors on commence. est-ce que
tu me permet de commencer par un coup
que j'aime beaucoup
nous allons jouer celui ci donc j'ai
déplacé le pion ici d'une case
puisqu'il y à un point qui est marqué
ici
vous pourriez vous dire que il est déjà
prenable mais en même temps ça me permet
de prendre le contrôle
ici et si je suis pris je peut de toute
façon de reprendre c'est un coup de
jeune beau coup pour démarrer la partie
est donc allé le jour
donc on va conserver notre avantage ici
les deux pions ici sont souvent joué en
début de partie on va entamer la course
du 1
ça me donne l'occasion d'expliquer que
les pions qui se déplace dans une case à
la fois sont les plus délicats dont le
jeu puisque quand ils se font capturer
on perd beaucoup plus de tours que un
pion qui se déplacent de trois cases
bien évidemment départ agressif pour
alpha squadrons qui décide de démarrer
sa course ici en me remettant en place
ce que je pourrais soit répondre en
reprenant ma position pour pouvoir de
nouveau contrôlé son pion qui se dépasse
2 1
en même temps je suis menacé avec celui
la menace est pas super dangereusement
de tout 66 me reprends j'aurais quand
même le contrôle sur lui après donc je
vais votre plan de contrôle ici voilà on
voit donc bien l'application du principe
des dames dont qu'il a fait il a fait
une deux trois ans passant par dessus
dont il se retourne il est déjà prêt à
entamer leur tour celui-là est pris
remarquez que sont à maintenant est sous
la menace de mon 1 tout comme son 1 là
est sous la menace du 1er mai c'est
réciproque
je pourrais donc conserver sa menace et
me déplacer autrement donc jeu pour
entamer la cause du 3 ici par exemple
ouais menace immédiate aussi
on voit que la nouvelle mouture de ton
cerveau artificiers le est une mouture
qui est beaucoup plus agressif qu'avant
puisque vous en doutez peut-être mais
c'est l'objet de pas mal de
développement de la paire de serre il
est donc on a joué pas mal de parties
contre les diverses itération de cette
intelligence artificielle et l'on voit
clairement qu'elle a pris ses marques
elle est là des débuts de jeu qui soit
extrêmement agressif donc on pourrait
partir d'ici faire comme lui amener un
premier 3 dans la ligne d'en face
la symétrie est là un donc un 3 devient
1 à 1 devient 1,3 et le 2 reste deux ans
ferait on pourrait déjà entamé le
parcours ici on n'a pas beaucoup de
protection je pouvais entamons le chemin
ici autre action ici le client mais si
c'est vrai que j'ai de la place aux
lampions mexique voilà
allons-y alors ce serait bien de
conserver le contrôle ici conserver le
contrôle à conserver le contrôle
moi je reçois ce temps là soit celui-là
on y va alors on essaye allons-y et oui
là c'est le modèle agressif 1 clairement
j'ai pas d'intérêt à me presser à
essayer de sauver celui là qui n'est qui
n'a fait qu'un seul déplacement
je pense que ce serait beaucoup plus
rentable de deux d'essayer de partir
sous le pont ici
eh bien il a décidé de rentrer son de la
trouvais que rentrée sont deux c'était
vital
alors on va avancer celui ci celui là au
moins il est tranquille alors tout
gentil to prepare ils avancent donc lui
j'ai peut-être intérêt à partir sur lui
donc je pense que je vais entamer ma
course ici un grand fou mais en fait
effectivement qu'ils s'exposent à ma
prise mais en fait je pense qu'il a
remarqué que notre progression de 1
était fort rapide je pourrais créer dans
menace là ce qui va le faire avancer
mais ce qui n'est pas dérangeant il va
pas forcément c'est donc créons la
menace ici alors alors là il est
vraiment parti pour entrer en fait il y
en a moins a décidé si j'avance ici au
cas où il me prend je reprends le
contrôle ici ce qui finalement ne met
quand même un peu dans l'embarras
si on fait du donnant donnant on entre
tous les deux un pion de j'ai encore le
temps de me décider après nous je vais
avancer et c'est dans des cas comme ça
que on découvre à travers les parties
qu'on a fait contre l'intelligence
artificielle toute ma richesse
stratégique qui a dance quadro vous
voyez ici toute cette cascade de prises
qui sont en cours pour l'instant deux
prises potentielles et de menace c'est
donc un jeu de contrôle de positions
finalement un peu comme aux échecs
évidemment d'une manière un peu
simplifié mais on est aussi dans un jeu
où le principal n'est pas la course mais
le la contrôler le contrôle en fait
d'eux des positions sur le plateau sa
pièce un terrain avant six mois
j'ai plus un terreau avancée pour
l'instant de toute façon
il confirme rejean du scotch avance mais
j'aime autant avancer en fait pour
pouvoir profiter de sa volonté de
rentrer pour m'échapper ici et bien
voilà notre grande surprise on dirait
qu'il a renoncé à faire ressortir ce
pion là puisqu'il offre de nouveau le
contrôle sur celui là par contre
évidemment il est parti en course pour
un autre pion un super entraînement tu
peux faire un doublé exact donc on va
faire ça très bien vu il a juste un
terrain provoqués tant qu'on se
débrouille dans cette partie non ou
alors il ya quelque chose que nous
appelons encore dit c'est que cyril voit
la probabilité de victoire que le
programme estime avoir mais pour
l'instant on ne dit pas c'est 1,3 à
décider quand tu nous dire à son niveau
de confiance en la victoire
je pouvais avancées ici pour créer la
menace sur lui donc lui n'avance pas en
même temps on n'a pas grand chose
appelée le train tu donc ont le plus
intérêt à venir ici a ici nous devons
faire un choix
et forcément le choix sera simple je ne
vais pas le prouve
donc c'est très bien joué très bien joué
donc j'explique un nom si je le prends
il retourne là et quand il retourne là
il prend aussitôt deux pions et dans les
deux pions il y en a un que je ne
voudrais surtout pas perdre c'est celui
là qui a fait beaucoup de trajets
jusqu'ici en fait finalement je ne suis
pas pressé j'ai peut-être plus intérêt à
avancer celui là où la placer à personne
donc je vais
rentrée celui là donc là ils rentrent
sains qui en toute logique donc premier
pion rentrée pour elle face quadro ce
qu'il veut pas encore vraiment dire non
on peut quand même dire qu'on est dans
le coeur de l'action ça n'est pas quand
on est à 2 2 qu'on est dans le coeur de
l'action là on est déjà proche de la fin
ici je pense qu on est vraiment au
milieu de l'action tui pourrait bouger
soit sage paul à celui là où celui là
effectivement peut-être plus d'être
servile à londres exact on va démarrer
laventure d'un pont se déplaçant d'une
cale il est maintenant sûre rapide 80%
game ah oui ça fait partie des choses
qui sont très désagréables à ondres
quand on joue contre une intelligence
artificielle
on a l'impression qu'on est toujours à
50 50 mais en fait pas du tout où je me
demande s'il vaut pas mieux démarrer sur
le 2e ici pour créer la menace sur le
quai ce qui veut dire en fait ce 80% là
ça veut dire que quand il explore le
futur il trouve que tout dans 80 % des
futurs qu'ils explorent il gagne la
partie
oui on va se trouver les 20 % dans
lequel on gagne on va vous être un
client d'humiliation en cours exact il
faut que je fasse avancer d un futur
nonchalance ici je ne sais pas
mais je m'y attendais je m'y attendais
parce que évidemment si je le prends il
vient jouer au bowling ici en fait allé
je pense que je vais le l'empêcher de
prendre
ils nous prouvent sans surprise avec une
grosse menace a effectivement tu sais
moi ce que j'aimerais bien faire ça
avance et celui l'enjeu pour un parce
que c'est une me pro je revois les
organes de contrôle de celui là même
retour donc je fais ça et celle là que
je fais une action inattendu est que je
reviens dans la fenêtre de victoire
potentielle couronne fauconnerie titre
prend ou ce qui est bien et pas bien
sachant qu il accepte les chevreuse
voilà donc nous avons une menace
partager ici j'aime assuré et il a juste
une main assure toi ici et là seulement
il faut avancer le jeu jouit lui ici
tranquille ici ici ici il ya ce jury
remettra donc du coup je vais progresser
là où ça peut être intéressant
ils rentrent sont deux ça lui fait donc
deux pions de rentrée optiquement ça
donne l'impression d'une grande avance
maintenant aux pratiques sur le plateau
pas nécessairement donc fatalement je
vais avancer ici je pense comme il faut
s'y attendre donc si je le prends il me
reprend et ça n'est jamais finalement
que qu'un crédin comme on dit je vais y
aller sur mon instinct initiale je vais
progresser celui là ok il est si rapide
90 % gagnent à à 90% ont donc pour les
français qui nous regarde et je pense
que je vais entamer la phase heures
celui là voilà donc en fait c'est
peut-être je vais bien jouer paris
finalement
10h03 il s'est retourné ici donc il crée
la menace sur celui là tu vois c'est ici
si j'avance ici
est ce que je le comprends à prendre et
donc des coupes ouais ça peut-être fait
ça donc je pense que je vais entamer la
course ici il ya donc une chose à
remarquer c'est qu'à partir du moment où
l'adversaire a rentré deux pions il a
finalement moins de possibilités de
déplacement que nous en avons plus et ça
crée une certaine d'une certaine manière
à un équilibre de contrôle entre les
deux joueurs
quand je l'avais prédit et se prend me
prends donc j'avance ici et une capacité
de contrôle incroyable en fait tu as
peut-être plus intérêts
reims et sedan comme celui là on fait
quoi oui quel est donc ce coup là il dit
proposant le change il me propose un
échange
oui donc en fait si je le prends
évidemment il me prendre le tout c'est
qu'il faut qu'je continuer à surveiller
a lancé deux pions mais de toute façon
là tu es obligé de rentrer celui là
sinon t'as perdu
donc ici tu es obligé obligé de le
prendre
donc ça c'est au 10 février puisqu'il
m'a fait perdre tout un parcours
ça ne coûte rien de rentrer celui là de
toute façon celui là il rentre dans le
jeu donc il vaut mieux qu'ils restent en
contrôle celui là c'est quand j'ai le
temps
donc j'ai un mouton rentrée 6030
réception on sait 1 1 donc autant
l'épuiser le plus possible donc autant
garder la menace via celui là allons-y
et la réponse est démarrage du retour
donc j'ai peut-être plutôt intéresser
ici me ne pas faire la temporisation ici
je vais avancer ici c'est logique ils
progressent de nouveau je dois choisir
je pourrais conserver cette menace là
sur lui conserver cette menace l'absolu
je vais faire ça je rentre
premier pion rentrée ça n'est pas rien
c'est une fameuse course donc on voit
que le jus de contrôle est énorme en
fait un dock même sur la femme la partie
on est quand même encore dans une
rivalité de contrôle et là il rentre
comme on avait dit en effet la patience
aussi et donc c'est un mois a décidé
effectivement si je m'engage ici tout
simplement dangereuse ressources pour
celles plus logique à faire je vais
forcément pas faire les deux autres
sacrifices
je vais vous montrer ici on va rentrer
et je vais rentrer depuis on rentre et
il avance il allait faire le choix de
sacrifices qu'il faisait donc là
forcément bien joué en vain on joue dans
un jeu tout à fait fermée maintenant moi
par contre je pourrais me lancer sur le
sacrifice des si tu avances seul et la
pluie sacrifiés est donc là peut être
que tu peux jouer la course entre ses
deux pions et récupérer le contrôle avec
lui sur les années on essayait de toute
façon là c'était trois coups perdus à
trois coups de toute façon donc il faut
tenter notre chance pas évidemment ce
qu'on te l'avais prévu allez on va
financer pour le sacrifice humain c'est
notre seule option poumon avait dit je
suppose qu'ils ne va pas me le laisser
passer
il me laisse passer
en fait on a vraiment des foulées sur ce
coup là c'est pas du tout le sacrifice
qu'on avait des chaînes donc je leur
prends pas le choix
ceci dit s'il nous propos qu'il nous
fait perdre au détour de nouveau mais du
moment sans vouloir avancer être on a
reprise de contrôle
c'est bien ce qui fait évidemment c'est
le 3 qui leur prix c'est celui là qui a
un trait est clair donc c'est le pain
qu'on doit avancer dans toute logique
pour faire de la course
on est obligés de la course on voit qui
sait ce qu'il fait là
donc là on oublie un de vos sources nous
n'avons pas soit celle là je n'ai pas le
choix je le prends ne va pas oui donc on
est quand même à trois coups ou même à
quatre coups dans le 3 il termine et
voilà elle fasse quadro à gagner donc il
nous restait une deux trois quatre noms
il a vraiment gagné à 4 coups d'avancé
et bien bravo cyril a donc ton al-fath
quadro là il a vraiment atteint un
niveau très élevé le sur la dernière
itération ils nous battent et de un tour
et sur toutes les générations
antérieures on arrive à survivre à
gagner en fait on arrivait à gagner
contre lui donc il ya eu clairement une
progression dans son intelligence
donc vous voyez là c'est ça qui est la
beauté de ce genre d'algorithmes ça
n'est pas un algorithme sur lequel on a
écrit une manière intelligente de jouer
à squadrons mais c'est vraiment un
algorithme qui a appris à jouer
intelligemment à ce quadra c'est
vraiment ça là la beauté de la prochaine
phase 0
d'ailleurs on mettra tous les liens en
dessous de la vidéo pour vous expliquer
vous vous donnez en fait des références
sur des vidéos de vulgarisation sur elf
à 0 et aussi sur tout le travail que
serena accompli et rédiger un blog
vraiment très détaillé sur le travail
qu'il accomplit pour réaliser cette alfa
soit d'euros
évidemment je vous mettrai aussi le lien
sur la fiche de squadrons sur le site
jeu de nîmes
j'espère que vous avez apprécié ce
principe de vidéos j'espère aussi
qu'après le confinement donnera
l'occasion de refaire plus de vidéo à
plusieurs personnes en tout cas merci
sert il merci à toi et à la prochaine
fois au revoir
