
Italian: 
Cari Amici Studiosi, benvenuti a
'Pubblicazioni in Due Minuti' con Károly Zsolnai-Fehér.
Oggi parleremo di un nuovo tentativo di insegnare un po' di buon senso ad algoritmi di apprendimento.
Se ricordate, in un episodio precedente abbiamo parlato di un eccellente lavoro di Andrej Karpathy
che aveva costruito un algoritmo che vedeva un' immagine in input e descriveva con un intera frase di
senso compiuto, cosa rappresentava.
A proposito, è diventato recentemente direttore di IA alla Tesla.
Prima di ciò ha lavorato ad OpenAI poco dopo essersi laureato con un dottorato.
Questa è una carriera scolastica se ne ho mai vista una!
Leggere di questo precedente lavoro è stato uno di quei momenti in cui mi sono davvero dovuto tenere
alle mie carte per non cadere dalla sedia, ma ovviamente, come dovrebbe accadere in ogni
nuovo avanzamento, i casi di fallimento vennero discussi approfonditamente.
Una delle motivazioni di questo nuovo lavoro è che potremmo migliorare i risultati creando

English: 
Dear Fellow Scholars, this is Two Minute Papers
with Károly Zsolnai-Fehér.
Today, we are going to talk about a new endeavor
to teach some more common sense to learning
algorithms.
If you remember, in an earlier episode, we
talked about an excellent work by Andrej Karpathy,
who built an algorithm that looked at an input
image, and described, in a full, well-formed
sentence what is depicted there.
By the way, he recently became director of
AI at Tesla.
Before that, he worked at OpenAI, freshly
after graduating with a PhD.
Now that is a scholarly career if I've ever
seen one!
Reading about this earlier work was one of
those moments when I really had to hold on
to my papers not to fall out of the chair,
but of course, as it should be with every
new breakthrough, the failure cases were thoroughly
discussed.
One of the the motivations for this new work
is that we could improve the results by creating

Italian: 
un database di video che contenga una marea di eventi che accadono comunemente che sarebbe utile capire.
Questi eventi includono, muovere e raccogliere o tenere, punzecchiare, lanciare, versare o
connettere cose diverse e molto altro.
L'obiettivo è che questi algoritmi neurali ottengano un mare di dati di addestramento su ciò, e siano
in grado di distinguere quando un umano sta mostrando loro qualcosa, o solo muovendo cose
in giro.
I database video già esistenti dono incredibilmente carenti di questo tipo di informazioni e
in questo nuovo, recentemente pubblicato, dataset possiamo imparare su 100.000 video etichettati per accelerare
la ricerca in questa direzione.
Amo quanto sono interconnessi questi lavori e quanto le ricerche successive lavorano per colmare
le debolezze delle tecniche precedenti.
Alcuni risultati iniziali sono anche riportati per rompere il ghiaccio
e sembrano abbastanza buoni se guardi ai risultati qui, ma siccome questo non era l'obiettivo
dell'articolo, non dovremmo aspettarci performance sovraumane.

English: 
a video database that contains a ton of commonly
occurring events that would be useful to learn.
These events include, moving and picking up,
or holding, poking, throwing, pouring, or
plugging in different things, and much more.
The goal is that these neural algorithms would
get tons of training data for these, and would
be able to distinguish whether a human is
showing them something, or just moving things
about.
The already existing video databases are surprisingly
sparse in this sort of information, and in
this new, freshly published dataset, we can
learn on a 100.000 labeled videos to accelerate
research in this direction.
I love how many these works are intertwined
and how followup research works try to address
the weaknesses of previous techniques.
Some initial results with learning on this
dataset are also reported to kick things off,
and they seem quite good if you look at the
results here, but since this was not the focus
of the paper, we shouldn't expect superhuman
performance.

English: 
However, as almost all papers in research
are stepping stones, two more followup papers
down the line, this will be an entirely different
discussion.
I'd love to report back to you on the progress
later.
Super excited for that.
Thanks for watching and for your generous
support, and I'll see you next time.

Italian: 
Tuttavia, come quasi ogni pubblicazione di ricerca, sono scalini, altre due ricerche
e il discorso sarà completamente diverso.
Sarà mio piacere farvi avere notizie sui progressi, in futuro.
Sono super eccitato al riguardo.
Grazie per la visione e per il generoso supporto, ci vediamo al prossimo video!
