
Chinese: 
譯者: Sailin Lu
審譯者: angie chen
容我為各位呈現一些照片
(影片)女孩：嗯，這是一隻貓，坐在床上。
這男孩在拍撫一隻象。
這些人要去搭飛機。
好大的飛機。
主講人：這是由一位三歲的小孩
所描述她看到的一系列照片
雖然對於這世界她還有更多要學習的地方，
但是她已經是其中一項重要技能的專家--
為所見之聞賦予意義。
科技在我們的社會已進展到前所未有的程度：
我們把人送上月球、發明可以與人交談的電話，

Portuguese: 
Tradutor: Juliana Rodrigues
Revisora: Margarida Ferreira
Vou mostrar-vos uma coisa.
(Vídeo) Menina: Isto é um gato
sentado numa cama.
O rapaz está a fazer festas ao elefante.
Isso são pessoas a ir para um avião.
É um grande avião.
Fei-Fei Li: Esta é uma criança de 3 anos
a descrever o que vê num 
conjunto de fotografias.
Ela poderá ter ainda muito
para aprender neste mundo,
mas já é especialista
numa tarefa muito importante:
dar sentido ao que vê.
A nossa sociedade
está mais avançada do que nunca.
Enviamos pessoas para a lua,
fazemos telefones que falam connosco

Italian: 
Traduttore: Silvia Littarru
Revisore: Kevin Álvarez
Lasciate che vi mostri qualcosa.
Ok, è un gatto seduto sul letto.
Il ragazzo sta accarezzando l'elefante.
Sono persone 
che salgono su un aereo.
È un grande aereo.
È una bambina di tre anni
che descrive ciò 
che vede nelle foto.
Anche se ha ancora tanto da imparare,
è già un'esperta in
un compito importante:
capire ciò che vede.
La tecnologia nella nostra 
società è più sviluppata che mai.
Mandiamo persone sulla Luna,
creiamo cellulari che ci parlano

Ukrainian: 
Перекладач: Tetiana Katsimon
Утверджено: Khrystyna Romashko
Дозвольте вам дещо показати.
(Відео) Дівчинка: Так, це кіт,
який сидить на ліжку.
Хлопчик гладить слона.
Ті люди сідають в літак.
Літак дуже великий.
Фей-Фей Лі: Це трирічна дитина,
яка описує те,
що бачить на фотографіях.
Ще багато чого їй треба 
вивчити про цей світ,
проте вже зараз їй під силу
одне дуже важливе завдання:
вона розуміє, що вона бачить.
Наше суспільство найбільш технологічно
розвинене, ніж будь-коли.
Ми відправляємо людей на місяць,
ми створюємо телефони, які говорять,

Arabic: 
المترجم: Ibrahim Alsaafin
المدقّق: Tamer Mekhimar
دعوني أريكم شيئًا
(فيديو) طفلة: حسنًا، هذه قطة
تجلس في السرير
الولد يداعب الفيل
هؤلاء أناس سيسافرون
على متن الطائرة
تلك طائرة كبيرة
فاي-فاي لِي: هذه طفلة
عمرها ثلاثة أعوام
تصف ما تراه في
مجموعة من الصور
ربما لا يزال أمامها الكثير
لتتعلمه عن هذا العالم
لكنها بالفعل خبيرة في
مهمة ضرورية جدًا
أن تعي وتعقل ما تراه
مجتمعنا متقدمٌ تكنولوجيًا
بشكل لم يسبق له مثيل
نُرسل أناسًا إلى القمر
أونجعل هواتفنا تتحدث إلينا

French: 
Traducteur: eric vautier
Relecteur: Rania Nakhli
Je vais vous montrer quelque chose.
(Enfant) C'est un chat assis sur un lit.
Le garçon caresse l'éléphant.
Des gens montent dans un avion.
C'est un gros avion.
(Fei-Fei Li) C'est une enfant de 3 ans
qui décrit ce qu'elle voit sur des photos.
Elle a peut-être encore
beaucoup à apprendre,
mais elle est déjà experte 
dans un domaine très important :
comprendre ce qu'elle voit.
Notre société est technologiquement 
plus avancée que jamais.
On envoie des gens sur la Lune, 
on fait des téléphones qui nous parlent,

Russian: 
Переводчик: Olga Babeeva
Редактор: Katya Roberts
Позвольте вам кое-что показать.
(Видео) Девочка: Кот сидит на кровати.
Мальчик гладит слона.
Люди садятся в самолёт.
Это большой самолёт.
Фей-Фей Ли: Трёхлетняя девочка
описывает то, что она видит 
на фотографиях.
Ей предстоит ещё много
узнать об этом мире,
но она уже довольно искусно
справляется с очень важной задачей:
она осознаёт то, что видит.
Наше общество технологически развито 
больше, чем когда-либо.
Мы отправляем людей на Луну,
создаём телефоны, которые говорят с нами,

Romanian: 
Traducător: Ovidiu Panaite
Corector: Diana Livezeanu
Să vă arăt ceva.
OK. Aia e o pisică stând în pat.
Băiatul mângâie elefantul.
Aceștia sunt oameni 
care intră într-un avion.
E un avion mare.
Acesta e o fetiţă de 3 ani
care descrie ce vede în nişte poze.
Poate că mai are multe de învățat 
despre lumea asta,
dar e expertă într-o sarcină 
foarte importantă:
să înțeleagă ceea ce vede.
Societatea noastră 
e mai avansată tehnologic ca niciodată.
Trimitem oameni pe lună, 
facem telefoane care ne vorbesc

Persian: 
Translator: Amin Rasoulof
Reviewer: Leila Ataei
اجازه دهید چیزی را به شما نشان دهم.
(ویدیو)دختر: بسیار خوب،
آن گربه روی یک تخت خواب نشسته است.
این پسر در حال نوازش فیل است.
آنها مردمی هستند 
در حال سوار شدن به هواپیما.
این یک هواپیمای بزرگ است.
فی-فی-لی: این یک کودک سه ساله است
که آنچه که در مجموعه ای
از عکسها می‎بیند را توصیف می‎کند.
ممکن است او هنوز چیزهای زیادی
برای یادگیری درباره این جهان داشته باشد.
اما او در یک کار خیلی
مهم دیگه تخصص دارد:
درک کردن آنچه که می‎بیند.
جامعه ما از لحاظ فناوری
از هر زمان دیگر پیشرفته‎تر است.
ما آدمها را به ماه می‎فرستیم،
تلفنهایی ساختیم که با ما صحبت می‎کنند

iw: 
מתרגם: hila scherba
מבקר: Ido Dekkers
בואו אני אראה לכם משהו.
(וידאו) ילדה: "אוקיי, זה חתול
שיושב על מיטה.
הילד מלטף את הפיל.
אלה אנשים שעולים על מטוס.
זה מטוס גדול."
זו ילדה בת שלוש שנים
מתארת מה היא רואה בסדרת תמונות.
אולי יש לה עוד הרבה ללמוד על העולם,
אבל היא כבר מומחית
במשימה אחת מאוד חשובה:
להבין מה היא רואה.
החברה שלנו היא יותר 
מתקדמת טכנולוגית מאי פעם.
אנחנו שולחים אנשים לירח,
אנחנו מייצרים טלפונים שמדברים אלינו

English: 
Let me show you something.
(Video) Girl: Okay, that's a cat
sitting in a bed.
The boy is petting the elephant.
Those are people
that are going on an airplane.
That's a big airplane.
Fei-Fei Li: This is
a three-year-old child
describing what she sees
in a series of photos.
She might still have a lot
to learn about this world,
but she's already an expert
at one very important task:
to make sense of what she sees.
Our society is more
technologically advanced than ever.
We send people to the moon,
we make phones that talk to us

Modern Greek (1453-): 
Μετάφραση: Christos Christodoulopoulos
Επιμέλεια: Mary Keramida
Θέλω να σας δείξω κάτι.
(Βίντεο) Κορίτσι: 
ΟΚ, μια γάτα που κάθεται στο κρεβάτι.
Το αγόρι χαϊδεύει τον ελέφαντα.
Οι άνθρωποι ανεβαίνουν στο αεροπλάνο.
Είναι ένα μεγάλο αεροπλάνο.
Φέι Φέι Λι:
Αυτό είναι ένα τρίχρονο κορίτσι
που περιγράφει τι βλέπει σε μια σειρά 
από φωτογραφίες.
Μπορεί να έχει να μάθει 
πολλά ακόμα για τον κόσμο,
αλλά είναι ήδη ειδική 
σε μια πολύ σημαντική εργασία:
να καταλαβαίνει τι βλέπει.
Η κοινωνία μας τεχνολογικά
είναι πιο προηγμένη από ποτέ.
Στέλνουμε ανθρώπους στο φεγγάρι,
έχουμε τηλέφωνα που μας μιλάνε

Dutch: 
Vertaald door: Dick Stada
Nagekeken door: Rik Delaet
Ik laat je wat zien.
(Video) Meisje: Oké, dat is een poes
die in bed zit.
De jongen verzorgt de olifant.
Dat zijn mensen
die met het vliegtuig gaan.
Dat is een groot vliegtuig.
Fei-Fei Li: Dit is een kind van drie
dat beschrijft wat het ziet
op een serie foto's.
Het moet nog veel leren over de wereld,
maar het is nu al een expert
in iets heel belangrijks:
iets zinnigs maken van wat het ziet.
Onze maatschappij is technologisch
verder dan ooit.
We sturen mensen naar de maan,
maken telefoons die tegen ons praten,

Thai: 
ฉันขอแสดงอะไรบางอย่าง
(วิดีโอ) เด็กหญิง: เอาล่ะ นี่คือแมวนั่งอยู่บนเตียง
เด็กชายกำลังลูบคลำช้าง
นั่นคือคนที่กำลังเดินทางในเครื่องบิน
นั่นคือเครื่องบินขนาดใหญ่
Fei-Fei Li: นี่เป็นเด็กอายุสามขวบ
กำลังอธิบายสิ่งที่เธอเห็นในชุดรูปภาพ
เธออาจจะมีสิ่งของจำนวนมากที่จะ
เรียนรู้เกี่ยวกับโลกนี้
แต่เธอก็เป็นผู้เชี่ยวชาญในงานที่สำคัญมาก
ที่จะทำความเข้าใจกับสิ่งที่เธอเห็น
สังคมของเราก้าวหน้ามากขึ้นกว่าเดิม
เราส่งคนไปยังดวงจันทร์ เราทำโทรศัพท์
ที่พูดคุยกับเรา

Turkish: 
Çeviri: Ömer Elveren
Gözden geçirme: Ramazan Şen
Müsadenizle size bazı şeyler göstermek
istiyorum.
(Video) Kız: Tamam, burada yatağın üzerinde
oturan bir kedi var.
Çocuk fili okşuyor.
Buradaki insanlar uçağa gidiyorlar.
Bu büyük bir uçak.
Fei-Fei Li: Üç yaşında
küçük bir kız çocuğu
fotoğraflarda ne gördüğünü
anlatıyor.
Henüz, dünya hakkında öğrenmesi
gereken çok şey var
fakat çok önemli bir alanda
uzman olmuş bile:
gördüklerini anlamlandırma.
Toplumumuz teknolojik olarak her
zamankinden daha fazla ilerlemiş durumda.
İnsanları aya gönderiyoruz, bizimle
konuşabilen ya da radyo kanallarını

Danish: 
Translator: Aviaja Josenius
Reviewer: Anders Finn Jørgensen
Lad mig vise jer noget.
(Video) Pige: Ok, det er en kat der
sidder i en seng.
Drengen klapper elefanten.
Det er folk, der går ind i en flymaskine.
Det er en stor flymaskine.
Fei-Fei Li: Det her er et treårigt barn
der beskriver hvad hun ser i en
række billeder.
Hun har endnu masser at lære om verden
men hun er allerede ekspert i en
meget vigtig ting:
at få mening ud af det hun ser.
Vort samfund er mere teknologisk
avanceret end nogensinde.
Vi sender folk til månen, vi laver
telefoner der taler til os

Czech: 
Překladatel: Jana Medonosová
Korektor: Kateřina Jabůrková
Něco vám ukážu.
(Video) Holčička: Dobře, to je kočka
sedící na posteli.
Kluk si hladí slona.
To jsou lidi, co nastupují do letadla.
Je to velké letadlo.
Fei-Fei Li: Toto je tříleté dítě
popisující, co vidí na sérii fotek.
Ještě se má hodně co učit o světě,
ale už teď je expert na jednu velmi
důležitou věc:
dávat smysl tomu, co vidí.
Naše společnost je více technologicky
vyvinutá než kdy předtím.
Posíláme lidi na měsíc,
vyrábíme telefony, co na nás mluví,

Japanese: 
翻訳: Yasushi Aoki
校正: Tadashi Koyama
まずこのビデオを
ご覧ください
(女の子の声) ネコがベッドに座ってる
男の子が象をなでてる
飛行機へ行く人たち
大きな飛行機よ
(講演者) これは３歳児が
見た写真を
説明しているところです
彼女にはこの世界で学ぶことが 
まだまだあるかもしれませんが
ひとつの重要な作業については
すでにエキスパートです
見たものを理解する
ということです
私たちの社会は技術的に
かつてなく進歩しています
月へと人を送り込み 
人に話しかける電話を作り

Vietnamese: 
Translator: Tran Le
Reviewer: Tan Doan Nhut
Để tôi cho bạn xem cái này.
(Video) Bé gái: 
Okay, đó là một con mèo ngồi trên giường
Đứa trẻ đang vuốt ve con voi
Những người này đang chuẩn bị lên máy bay.
Đó là một cái máy bay lớn.
Fei Fei Li: Đây là một bé gái ba tuổi
đang miêu tả những gì
mà em nhìn thấy trong loạt hình.
Em vẫn còn nhiều điều
để khám phá về thế giới này,
nhưng em hoàn toàn đã trở thành chuyên gia
trong một nhiệm vụ rất quan trọng:
hiểu được những thứ mà em thấy.
Xã hội của chúng ta đã trở nên tiến bộ
về mặt công nghệ hơn bao giờ hết.
Chúng ta gửi con người lên mặt trăng,
chúng ta chế tạo ra điện thoại

Spanish: 
Traductor: Cuicani Ríos
Revisor: Sebastian Betti
Les mostraré algo.
(Video) Niña: Eso es un gato 
sentado en una cama.
El niño está acariciando al elefante.
Esas son personas que van en un avión.
Ese es un avión grande.
Fei-Fei Li: Así describe una niña
de 3 años lo que ve
en una serie de fotos.
Tal vez le falta mucho 
por aprender sobre este mundo,
pero ya es experta
en algo importante:
entender lo que ve.
Tecnológicamente, nuestra sociedad
está más avanzada que nunca.
Enviamos personas a la luna,
nuestros teléfonos nos hablan

Korean: 
번역: Juhyeon Kim
검토: Jihyeon J. Kim
이걸 보시죠.
(영상) 소녀: "고양이가 
침대에 앉아 있습니다."
"소년이 코끼리를 쓰다듬고 있습니다."
"사람들이 비행기에 타고 있습니다."
"큰 비행기입니다."
이건 세 살짜리 아이가
사진을 보고 설명하는 것입니다.
그녀는 아직 이 세상에 대해
배울 것이 많지만,
한 가지 일에서만큼은
이미 전문가 수준입니다.
본 것을 이해하는 일이죠.
우리 사회는 그 어느 때보다 
기술적으로 진보하고 있습니다.
우리는 달에 사람을 보내고,
말을 하는 전화를 만들거나

Albanian: 
Translator: Alba Xhani
Reviewer: Helena Bedalli
Më lejoni t'ju tregoj dicka.
(Video) Vajza: Kjo është një 
mace e ulur në krevat.
Djali po përkëdhel elefantin.
Janë njerëz që po shkojnë drejt 
një aeroplani.
Eshtë një aeroplan i madh.
Fei-Fei Li: Ky është një fëmijë 
tre-vjeçar
duke përshkruar atë që sheh
në një seri fotosh.
Ajo mund të ketë ende shumë 
për të mësuar rreth botës,
por ajo është tashmë mjeshtre
në një detyrë shumë të rëndësishme:
të kuptojë se çfarë po sheh.
Shoqëria jonë është më shumë se kurrë e 
avancuar teknologjikisht.
Ne dërgojmë njerëz në hënë, 
i bëjmë telefonat të komunikojnë me ne

Polish: 
Tłumaczenie: Beata Wasylkiewicz-Jagoda
Korekta: Rysia Wand
Pokażę wam coś.
(Wideo) Dziewczynka: To jest kot 
siedzący na łóżku.
Chłopiec głaszcze słonia.
To są ludzie idący do samolotu.
Samolot jest duży.
Fei-Fei Li: Tak trzyletnie dziecko
opisuje, co widzi na zdjęciach.
Wielu rzeczy musi się jeszcze nauczyć,
ale w jednej dziedzinie 
jest już ekspertem:
rozumie, co widzi.
Technicznie nasze społeczeństwo jest 
zaawansowane bardziej niż kiedykolwiek.
Wysyłamy ludzi na Księżyc, 
tworzymy telefony, które rozmawiają z nami

Portuguese: 
Tradutor: Fernando Gonçalves
Revisor: Maricene Crus
Deixem-me lhes mostrar algo.
(Vídeo) Garota: Certo, isso é um gato
sentado sobre a cama.
O garoto está acariciando o elefante.
Aquelas são pessoas 
que estão entrando num avião.
É um avião grande!
Fei-Fei Li: Esta é uma criança
de três anos de idade
descrevendo o que vê numa série de fotos.
Ela ainda tem muito
o que aprender sobre este mundo,
mas já é uma especialista
numa importante tarefa:
dar sentido ao que vê.
Nossa sociedade está mais 
tecnologicamente avançada do que nunca.
Mandamos pessoas para a Lua,
fazemos telefones que falam conosco

Croatian: 
Prevoditelj: Senzos Osijek
Recezent: Mislav Ante Omazić - EFZG
Dopustite da vam pokažem nešto
[Video] Djevojka: Dobro, to je mačka 
koja sjedi na krevetu.
Dječak mazi slona.
Ovo su ljudi
koji idu u avion.
To je veliki avion.
Fei-Fei Li: Ovo je 
trogodišnje dijete
koje opisuje što vidi
na ovim slikama.
Iako ima još dosta toga 
što mora naučiti o svijetu
već je ekspert 
u nečemu važnom:
razumije što vidi.
Naše društvo je tehnološki
naprednije no ikada.
Šaljemo ljude na mjesec,
izrađujemo telefone koji pričaju s nama

Chinese: 
翻译人员: Twisted Meadows
校对人员: Min WANG
我先来给你们看点东西。
（视频）女孩：
好吧，这是只猫，坐在床上。
一个男孩摸着一头大象。
那些人正准备登机。
那是架大飞机。
李飞飞：
这是一个三岁的小孩
在讲述她从一系列照片里看到的东西。
对这个世界，
她也许还有很多要学的东西，
但在一个重要的任务上，
她已经是专家了：
去理解她所看到的东西。
我们的社会已经在科技上
取得了前所未有的进步。
我们把人送上月球，
我们制造出可以与我们对话的手机，

Hungarian: 
Fordító: Zsuzsa Vida
Lektor: Csaba Lóki
Engedjék meg, hogy mutassak 
önöknek valamit.
(Videó) Kislány: Oké, az egy macska, 
amely egy ágyon ül.
A fiú cirógatja az elefántot.
Azok az emberek mennek 
egy repülőgéphez.
Az egy nagy repülőgép.
Fei-Fei Li: Ez egy hároméves gyermek
leírása arról, amit egy sor fotón lát.
Lehet, hogy sokat kell 
még tanulnia a világról,
de már szakértője 
egy nagyon fontos feladatnak:
annak, hogy megértse, amit lát.
Társadalmunk technológiailag 
fejlettebb, mint valaha.
Embereket küldünk a Holdra,
telefonokat készítünk, melyek beszélnek,

Chinese: 
或者订制一个音乐电台，
播放的全是我们喜欢的音乐。
然而，哪怕是我们最先进的机器和电脑
也会在这个问题上犯难。
所以今天我在这里，
向大家做个进度汇报：
关于我们在计算机
视觉方面最新的研究进展。
这是计算机科学领域最前沿的、
具有革命性潜力的科技。
是的，我们现在已经有了
具备自动驾驶功能的原型车，
但是如果没有敏锐的视觉，
它们就不能真正区分出
地上摆着的是一个压扁的纸袋，
可以被轻易压过，
还是一块相同体积的石头，
应该避开。
我们已经造出了超高清的相机，
但我们仍然无法把
这些画面传递给盲人。
我们的无人机可以飞跃广阔的土地，
却没有足够的视觉技术
去帮我们追踪热带雨林的变化。

Portuguese: 
ou personalizamos estações de rádio
para tocar só as músicas de que gostamos.
No entanto, nossas máquinas
mais avançadas e computadores
ainda lutam para realizar esta tarefa.
Então, estou aqui hoje
para dar um relatório do progresso
sobre os últimos avanços
em nossa pesquisa em visão computacional,
uma das tecnologias mais inovadoras
e potencialmente revolucionárias
na ciência da computação.
Sim, temos protótipos de carros
que podem dirigir sozinhos,
mas sem uma visão inteligente,
não conseguem notar a diferença
entre um saco de papel amassado
na estrada, que pode ser atropelado,
e uma pedra daquele tamanho,
que deve ser evitada.
Fizemos câmeras incríveis de megapixel,
mas não demos visão aos cegos.
Os "drones" podem voar 
sobre a terra firme,
mas não têm a tecnologia
de visão suficiente
para nos ajudar a rastrear
as mudanças das florestas tropicais.

Czech: 
nebo si můžeme upravit radio, aby
hrálo jenom hudbu, kterou chceme.
Přesto naše nejvyvinutější stroje
a počítače
tenhle úkol nezvládají.
Já jsem tu dnes, abych vám dala hlášení
o vývoji
posledních pokroků v našem výzkumu
počítačového zraku,
jedné z nejhraničnějších a
potencionálně revolučních
technologiích v počítačové vědě.
Ano, navrhli jsme auta,
která sama řídí,
ale bez chytrého zraku,
nerozeznají
zmuchlaný papírový sáček na silnici,
který se může přejet,
od kamenu stejné velikosti,
který by bylo lepší objet.
Vytvořili jsme úžasné megapixelové foťáky,
ale neumíme slepým vrátit zrak.
Drony mohou létat po rozsáhlé krajině,
ale nemají dostatečnou 
vizuální technologie,
aby nám pomohly mapovat změny
v deštných pralesech.

Albanian: 
apo i përshtasim stacionet e radios
të luajnë muzikën që na pëlqen.
Prapë, makinat dhe kompjuterët tanë 
më të avancuar
e kanë të vështirë këtë punë.
Jam sot këtu t'ju jap 
një raport të ecurisë
mbi zhvillimet më të fundit
në kërkimet tona në vizionin kompjuterik,
një nga teknologjitë më të reja
dhe potencialisht revolucionare
në shkencat kompjuterike.
Po, kemi krijuar prototipe të makinave
që vetë-drejtohen
por pa një vizion inteligjent,
ato nuk mund ta gjejnë ndryshimin
midis një qese letre të zhubrosur
në rrugë, mbi të cilën mund të kalosh,
dhe një guri po të të njejtave përmasa,
i cili duhet shmangur.
Ne kemi krijuar kamera 
me rezolucion të lartë,
por nuk i kemi dhënë shikim të verbërve.
Avionët e telekomanduar fluturojnë gjatë
dhe mbi hapsira masive toke,
por teknologjia vizive
nuk është e mjaftueshme
për të monitoruar ndryshimet
e pyjeve tropikale.

Hungarian: 
vagy rádióállomásokat állítunk be a
saját zenei ízlésünknek megfelelően.
Mégis a legfejlettebb gépeink és 
számítógépeink
csak küszködnek ezzel a feladattal.
Azért vagyok ma itt, 
hogy jelentést adjak önöknek
a számítógépes képfelismerés
legújabb kutatási eredményeiről,
a számítástechnika egyik
valószínűleg legforradalmibb
technológiai területéről.
Igen, vannak olyan prototípus autóink, 
amelyek képesek önmagukat vezetni,
de tökéletes látás nélkül, nem tudnak 
igazán megkülönböztetni
egy összegyűrt papírtasakot 
az úton, amelyen áthajthatunk,
egy ugyanolyan méretű kődarabtól, 
amelyet el kellene kerülni.
Mesés megapixeles kameráink vannak,
de nem segítünk látni a vakoknak.
A drónok képesek hatalmas 
területeket berepülni,
de nincs megfelelő látási 
technológiájuk ahhoz,
hogy segítsenek nyomon követni 
az esőerdők változásait.

Thai: 
หรือปรับแต่งสถานีวิทยุที่สามารถเล่น
เฉพาะเพลงที่เราชอบเท่านั้น
แต่เครื่องที่ทันสมัยที่สุดและคอมพิวเตอร์
ของเรา
ยังคงต่อสู้กับงานนี้
วันนี้ ฉันมาที่นี่เพื่อรายงานความคืบหน้า
เกี่ยวกับความก้าวหน้าล่าสุดในการวิจัย
ของเรา คอมพิวเตอร์ที่มองเห็น
หนึ่งในแนวพรมแดนและการปฏิวัติส่วนใหญ่
เทคโนโลยีในวิทยาการคอมพิวเตอร์
ใช่ เรามีรถยนต์ต้นแบบที่สามารถขับขี่
ด้วยตัวเอง
แต่ไม่มีวิสัยทัศน์ที่ฉลาด พวกนั้น
ไม่สามารถบอกความแตกต่าง
ระหว่างถุงกระดาษยู่ยี่บนถนนซึ่ง
สามารถเรียกวิ่งทับได้
กับหินในขนาดที่ควรหลีกเลี่ยง
เราได้ทำกล้องล้านพิกเซลที่ยอดเยี่ยม
แต่เราไม่ได้ให้การมองเห็นแก่คนตาบอด
โดรนสามารถบินผ่านพื้นดินขนาดใหญ่
แต่ไม่ได้มีเทคโนโลยีการมองเห็นเพียงพอ
เพื่อช่วยในการติดตามการเปลี่ยนแปลง
ของป่าฝน

Spanish: 
o personalizan radios para reproducir
solo la música que nos gusta.
Sin embargo, nuestras máquinas
y computadoras más avanzadas
aún tienen problemas en ese aspecto.
Hoy estoy aquí
para darles un reporte
de nuestros últimos avances
en visión artificial,
una de las tecnologías potencialmente
más revolucionarias
en la ciencia de la computación.
Es cierto, hemos inventado autos
que conducen solos,
pero sin una visión inteligente,
realmente no pueden distinguir
entre una bolsa arrugada de papel
en el camino, que puede uno pisar,
y una roca del mismo tamaño,
que debemos evitar.
Hemos creado fabulosas cámaras
de muchos megapíxeles,
pero aún no podemos devolverle
la vista a un ciego.
Los drones pueden volar sobre 
grandes superficies de tierra,
pero no tienen tecnología
de visión suficiente
para ayudarnos a monitorear los 
cambios en los bosques tropicales.

Korean: 
좋아하는 곡만 방송하는
맞춤형 라디오를 만듭니다.
그러나 첨단 기계와 컴퓨터로도
애를 먹는 일이 있습니다.
저는 오늘 컴퓨터 비전 연구의
최신 동향에 대해 말하고자 합니다
컴퓨터 과학에서 가장 
선도적이고 혁명적인 기술이죠.
스스로 운전하는 자동차
시험판을 만들더라도
똑똑한 인식 능력이 없다면
도로 위에 있는 것이
밟아도 될 종이 봉투인지
피해야 할 돌덩이인지
구분할 수 없습니다.
수백만 화소의 엄청난
카메라를 만들더라도
시각장애인의 눈이 되지는 못합니다.
무인기가 광활한 땅을 날 수 있어도
컴퓨터 비전 기술이 없으면
열대 우림의 변화를 추적하지 못합니다.

Turkish: 
sadece sevdiğimiz müzikleri çalması
için düzenleyebilen telefonlar yapıyoruz.
En gelişmiş makinelerimiz 
ve bilgisayarlarımız
hâlâ bu özelliği elde etmeye çalışıyorlar.
Bugün, bilgisayar görme yetisi üzerine
yapılan ileri düzeydeki
araştırmalarımızın işleyişi hakkında size
bilgi vermek için buradayım.
Bilgisayar biliminde, en önde ve devrim niteliğinde
olan teknolojik gelişmelerden biri.
Evet, kendini sürebilen araçların
prototiplerine sahibiz,
fakat akıllı görme yetisine sahip olmadan,
üzerinden geçilebilecek buruşmuş bir
kağıt torba ile sakınılması gereken aynı
boyuttaki bir kaya
arasındaki farkı söyleyebilmeleri
mümkün değil.
Mükemmel çözünürlükte kameralar
yapmamıza rağmen,
görebilmelerini sağlayamamıştık.
İnsansız hava araçları koca bir araziyi
uçabilirler,
ama yağmur ormanlarındaki değişimleri
izlememize yardımcı olabilecek
düzeyde yeterli bir görüş kabiliyetine 
sahip değiller.

Romanian: 
sau personalizăm posturi de radio 
care pun doar muzica preferată.
Totuşi, cele mai avansate 
mașinării și computere
încă se chinuie cu această sarcină.
Sunt azi aici să vă fac un raport despre progresul
recunoașterii computerizate a imaginilor,
o cercetare revoluţionară de vârf
din tehnologia şi ştiinţa calculatoarelor.
Avem prototipuri de mașini 
care conduc singure,
dar fără vedere inteligentă nu deosebesc
o pungă de hârtie mototolită pe stradă,
peste care poate trece,
și o piatră de aceaşi dimensiune, 
care ar trebui evitată.
Am făcut camere megapixel fabuloase,
dar n-am redat vederea orbilor.
Dronele pot zbura peste suprafeţe întinse,
dar n-au destulă tehnologie vizuală
ca să ne ajute să urmărim
schimbările pădurii tropicale.

Modern Greek (1453-): 
ή ρυθμίζουμε ραδιοφωνικούς σταθμούς
να παίζουν μόνο τη μουσική που μας αρέσει.
Κι όμως, οι πιο προηγμένες μηχανές
και υπολογιστές μας
δυσκολεύονται ακόμα σε αυτή την εργασία.
Έτσι λοιπόν, είμαι εδώ σήμερα
για να σας δώσω μια αναφορά προόδου
σχετικά με τις πρόσφατες εξελίξεις
στον τομέα της μηχανικής όρασης,
μια από τις πιο σημαντικές
και πιθανότατα επαναστατικές
τεχνολογίες της πληροφορικής.
Ναι, έχουμε πρωτότυπα αυτοκίνητα
που οδηγούν αυτόνομα,
αλλά χωρίς «έξυπνη» όραση
δεν μπορούν να καταλάβουν τη διαφορά
μεταξύ μιας τσαλακωμένης σακούλας
στο δρόμο, που μπορούν να «πατήσουν»,
και μιας πέτρας με το ίδιο μέγεθος,
που πρέπει να αποφύγουν.
Έχουμε εκπληκτικές κάμερες
με ανάλυση μεγαπίξελ,
αλλά δεν έχουμε δώσει όραση στους τυφλούς.
Τηλεκατευθυνόμενα αεροσκάφη μπορούν
να πετάξουν πάνω από τεράστια εδάφη
αλλά δεν έχουν αρκετή τεχνολογία όρασης
για να μας βοηθήσουν να παρακολουθήσουμε
τις αλλαγές στα τροπικά δάση.

Ukrainian: 
ми налаштовуємо радіостанції так,
щоб вони грали лише нашу улюблену музику.
Проте наші найбільш передові 
механізми і комп'ютери
все ще не можуть впоратися 
з цим завданням.
Сьогодні я тут, щоб розповісти вам
про найостанніші досягнення
у наших дослідженнях
комп'ютерного розпізнавання об'єктів,
однієї з найбільш передових
і потенційно революційних
технологій в комп'ютерній науці.
Так, ми розробили прототипи машин,
які можуть самостійно рухатися,
але без розумного розпізнавання, 
для них не буде різниці
між зім'ятим пакетом на дорозі, 
по якому можна проїхати,
і камінням такого розміру,
що його краще об'їхати.
Ми створили неймовірні
мегапіксельні фотокамери,
але ми не навчили сліпих бачити.
Безпілотні літаки можуть літати
на величезні відстані, але не мають
достатніх
розпізнавальних технологій,
щоб допомогти нам прослідкувати
за змінами в тропічних лісах.

French: 
on a des stations de radio
qui ne passent que ce qu'on aime.
Pourtant, les machines et les ordinateurs
les plus avancés
ont toujours du mal à faire ça.
Alors aujourd'hui je vais vous expliquer 
où nous en sommes,
nos dernières recherches
sur la vision par ordinateur,
l'une des technologies les plus novatrices
et potentiellement révolutionnaires
en informatique.
Oui, nous avons des prototypes de voitures
qui conduisent toutes seules,
mais sans la vision intelligente, 
elles ne font pas la différence
entre un sac de papier roulé en boule,
que l'on peut écraser,
et une pierre qu'il faut éviter.
Nous fabriquons des appareils photo 
à mégapixels incroyables,
mais nous n'avons pas donné
la vue aux aveugles.
Les drones peuvent parcourir 
de grandes distances
mais la technologie 
n'est pas assez avancée
pour suivre l'évolution 
des forêts tropicales.

Polish: 
i potrafimy sprawić, żeby stacja radiowa, 
grała tylko naszą ulubioną muzykę.
A jednak nawet najbardziej 
zaawansowane komputery
ciągle nie mogą sobie poradzić 
z tym zadaniem.
Dzisiaj chciałabym opowiedzieć
o ostatnich osiągnięciach w dziedzinie 
widzenia komputerowego,
jednej z najbardziej pionierskich 
i potencjalnie rewolucyjnych
technologii w informatyce.
Istnieje już prototyp samochodu,
który jeździ sam,
ale bez umiejętności rozpoznawania obrazu
nie umie odróżnić
zmiętej papierowej torby,
po której można przejechać,
od podobnej wielkości kamienia,
który trzeba ominąć.
Istnieją aparaty fotograficzne 
o bardzo dużej rozdzielczości,
ale nadal nie wiadomo, 
jak przywrócić wzrok niewidomym.
Drony mogą latać na dużych przestrzeniach,
ale nadal nie istnieje technologia,
która pomogłaby śledzić zmiany 
w lasach deszczowych.

Persian: 
یا ایستگاههای رادیویی سفارشی طراحی کردیم
که می توانند فقط موسیقی را که دوست داریم پخش کنند.
با این حال
پیشرفته ترین ماشینها و رایانه‎های ما
هنوز هم در این کار (درک تصاویر)
مشکل دارند.
بنابراین امروز من اینجا هستم 
که یک گزارش پیشرفت به شما بدهم
در مورد آخرین پیشرفت
در تحقیق ما بر روی بینایی رایانه‎ای،
یکی از پیشرفته‎ترین و
بصورت بالقوه انقلابی‎ترین
فن آوریها در علوم رایانه‎ای.
بله، ما نمونه اولیه ماشینهایی را داریم
که خودشان می‎توانند رانندگی کنند،
اما بدون دید هوشمند (smart vision)
نمی توانند فرق بگذارند
بین پاکت کاغذی مچاله در جاده
که میشه از روش با ماشین رد شد.
و یک سنگ همان اندازه که 
نباید از روش رد شد
ما دوربینهای (با وضوح) مگاپیکسل
عالی ساخته ایم،
اما به نابیناها بینایی نداده‎ایم.
هواپیماهای بدون سرنشین
که برفراز زمینهای وسیع پرواز کنند،
ولی فناوری بینایی کافی برای کمک به ما
در رهگیری تغییرات جنگلهای بارانی
نداریم.

Vietnamese: 
hoăc điều chỉnh những đài phát thanh 
chỉ chơi loại nhạc chúng ta yêu thích.
Nhưng mà, những thiết bị 
và máy vi tính tối tân nhất
vẫn còn đang xoay xở trong nhiệm vụ này
Vì thế mà tôi ở đây
để báo cáo với bạn về quá trình
của cải tiến mới nhất trong thí nghiệm
đối với thị giác máy tính
một trong những công nghệ dẫn đầu
và có tiềm năng cách mạng
trong khoa học máy tính.
Vâng, chúng ta đã có nguyên mẫu
những chiếc xe lái tự động,
nhưng lại thiếu đi thị giác thông minh,
chúng không phân biệt được sự khác nhau
giữa một cái túi giấy rách trên đường,
cái có thể cán qua,
và một tảng đá với cùng kích thước,
mà nên tránh sang một bên.
Chúng ta đã tạo nên những máy ảnh đắt đỏ
hàng triệu điểm ảnh
nhưng chúng ta chưa đưa ánh sáng
đến cho người mù.
máy bay không người lái
có thể bay qua vùng đất rộng lớn,
nhưng không có đủ thị giác công nghệ
để giúp chúng ta theo dõi
sự thay đổi của những rừng mưa nhiệt đới.

English: 
or customize radio stations
that can play only music we like.
Yet, our most advanced
machines and computers
still struggle at this task.
So I'm here today
to give you a progress report
on the latest advances
in our research in computer vision,
one of the most frontier
and potentially revolutionary
technologies in computer science.
Yes, we have prototyped cars
that can drive by themselves,
but without smart vision,
they cannot really tell the difference
between a crumpled paper bag
on the road, which can be run over,
and a rock that size,
which should be avoided.
We have made fabulous megapixel cameras,
but we have not delivered
sight to the blind.
Drones can fly over massive land,
but don't have enough vision technology
to help us to track
the changes of the rainforests.

iw: 
או מתאימים אישית תחנות רדיו
שינגנו רק מוסיקה שאנחנו אוהבים.
ועדיין, המכונות והמחשבים
המתקדמים ביותר שלנו
עדיין מתקשים במשימה הזו.
אז אני פה היום כדי לתת לכם דו"ח התקדמות
על ההתפתחויות האחרונות במחקר שלנו
על ראיית מחשב,
אחד מהטכנולוגיות החלוציות והמהפכניות ביותר
במדעי המחשב.
נכון, יש לנו אבטיפוס של מכוניות
שיכולות לנסוע בעצמן,
אבל בלי ראייה חכמה,
הן לא יכולות באמת להבדיל
בין שקית נייר מקופלת על הכביש, 
שאפשר לנסוע עליה,
ואבן בגודל הזה,
שצריך להימנע ממנה.
ייצרנו מצלמות מגהפיקסל מדהימות,
אבל לא הצלחנו להביא ראייה לעיוורים.
מזל"טים יכולים לטוס מעל שטח עצום,
אבל חסרי טכנולוגיית ראייה מספקת
בשביל לעזור לנו לעקוב
אחרי השינויים ביערות הגשם.

Portuguese: 
ou personalizamos estações de rádio
que apenas tocam música de que gostamos.
No entanto, as nossas máquinas
e computadores mais avançados
ainda têm dificuldade
em realizar esta tarefa.
Por isso estou aqui hoje,
para vos dar um relato
sobre os últimos avanços do nosso trabalho
em visão computacional,
uma das tecnologias mais inovadoras
e potencialmente mais revolucionárias
da ciência informática.
É verdade que já temos protótipos
de carros que conduzem sozinhos,
mas sem visão inteligente,
eles não conseguem distinguir
entre um saco de papel amarrotado,
que o carro pode atropelar,
e uma pedra do mesmo tamanho, 
que deve ser evitada.
Criámos fabulosas câmaras de megapixéis,
mas não conseguimos devolver
a visão a pessoas cegas.
Os drones conseguem voar 
sobre uma área extensa de terra,
mas não têm a tecnologia
de visualização
necessária para detetar
alterações nas florestas tropicais

Chinese: 
或是客製一個電台，只播放個人喜歡的音樂。
然而這台無比聰明的機器和電腦
仍然無法發展這項技能，
因此今天我來到這裡向各位報告
我們在電腦視覺的最新研究進展，
這是現階段在資訊業領域中，
最先進、最具潛力的革命性技術。
是的，目前我們已經有自動駕駛的原型車，
但若不具備視覺辨識技術，
它將無法分辨同樣出現在馬路中，
一團它其實輾過也無妨的破紙袋，
以及一個大到它必須閃避的石塊，
兩者有何不同。
我們製造出畫素極高的相機，
但我們卻無法賦予盲人視覺；
無人機可以翻山越嶺，
卻沒有足夠的視覺技術可以
讓我們追蹤雨林的變化；

Croatian: 
i prilagođene radio stanice
koje puštaju samo glazbu koju volimo.
Ipak, naši najnapredniji
uređaj i računala
imaju poteškoća s ovim zadatkom.
Ovdje sam danas
kako bi vas izvijestila
o najnovijim dostignućima
u istraživanju računalnog vida,
jednoj od glavnih
i potencijalno revolucionarnih
tehnologija računarstva.
Imamo prototipe auta
koji se sami voze,
ali bez pametnog vida,
ne mogu zapravo vidjeti razliku
između zgužvane papirnate vrećice
na putu, koju mogu pregaziti,
i kamena te veličine
koji treba izbjeći.
imamo odlične megapikselne kamere,
ali nismo dali
vid slijepima.
Dronovi mogu letjeti vrlo daleko
ali nemaju dovoljno tehnologije vida
da nam pomognu pratiti
promjene u kišnim šumama

Arabic: 
أو نخصص محطات إذاعية تستطيع أن
تعزف الموسيقى التي نحبها فقط
لكن، آلاتنا وأجهزة الكمبيوتر
الأكثر تطورًا
لا تزال تشق طريقها جاهدةً
لتنفيذ هذه المهمة
لذلك جئت اليوم
لأعطيكم تقريرًا مرحليًا
عن آخر التطورات في أبحاثنا
في مجال الإبصار الحاسوبي،
وهو أحد التقنيات الرائدة
بل وربما الثورية
في مجال علوم الحاسوب
نعم، لقد صنعنا نماذج لسيارات
تستطيع أن تقود نفسها بنفسها
لكن بدون إبصار ذكي
لن تستطيع تلك السيارات أن تميز الفرق بدقة
بين كيس ورقي متكوّم على الطريق
بحيث يمكنها أن تمر فوقه
وبين صخرة بنفس الحجم
ينبغي عليها تجاوزها
لقد صنعنا كاميرات رائعة
تقاس دقتها بالميجا بكسل
لكننا لم نمنح الأعمى بصرًا
تستطيع الطائرات بدون طيار
أن تحلق فوق مساحات شاسعة
لكنها لا تملك تقنية إبصار كافية
لتعيننا على تتبع التغيرات
في الغابات المطيرة

Italian: 
o personalizziamo le stazioni radio
per ascoltare la musica che ci piace.
Eppure, i computer
e i dispositivi più avanzati
non sono ancora in grado
di svolgere questo compito.
Oggi vi mostrerò
un rapporto di avanzamento
sui progressi della nostra
ricerca sulla visione artificiale,
una delle tecnologie informatiche
più rivoluzionarie.
Sì, abbiamo prototipi 
di auto che si guidano da sole,
ma senza la smart vision,
non riescono a distinguere fra
un sacchetto spiegazzato sulla 
strada che può essere investito
e una pietra che sarebbe da evitare.
Abbiamo creato favolose
fotocamere con megapixel,
ma non abbiamo
ancora ridato la vista ai ciechi.
I droni volano su
grandi parti di terra,
ma la loro tecnologia visiva non basta
a monitorare 
le variazioni delle foreste pluviali.

Dutch: 
of stellen radiozenders samen, die alleen
muziek uitzenden die we mooi vinden.
Toch worstelen onze geavanceerde machines
en computers met deze taak.
Ik ben hier vandaag om je
de voortgang te laten zien
van de recentste ontwikkelingen
in ons onderzoek naar computervisie,
een van de meest grensverleggende
en mogelijk revolutionaire technologieën
in de computerwetenschap.
Ja, we hebben prototypes van auto's
die zelf kunnen rijden,
maar zonder slim zicht,
zien ze het verschil niet
tussen een verfrommelde papieren zak
op de weg, waar je overheen kan rijden,
en een evengrote kei,
waar je omheen moet rijden.
We hebben geweldige
megapixelcamera's gemaakt,
maar we kunnen blinden
nog niet laten zien.
Drones kunnen grote afstanden vliegen,
maar hun visie-technologie schiet tekort
om veranderingen te helpen opsporen
in het regenwoud.

Danish: 
eller tilpasser radio stationer der kan
spille musik som kun vi kan lide.
Alligevel har de mest avancerede
maskiner og computere
stadig problemer med dette.
Jeg er her idag for at give jer
en statusrapport
på de nyeste fremskridt i 
forskningen af computer vision
en af de mest banebrydende og
muligvis revolutionære
teknologier i computer videnskab.
Ja, vi har prototyper af biler,
der er selvkørende
men uden intelligent vision kan de
ikke se forskel
mellem en krøllet pose på vejen,
der kan køres over
og en sten af samme størrelse,
der skal undgås.
Vi har lavet fabelagtige megapixel 
kameraer
men vi har ikke givet blinde syn.
Droner kan flyve over store landområder
men vi har ikke nok vision teknologi
til at følge forandringerne i regnskoven.

Russian: 
и настраиваем радиостанции, чтобы слушать
только такую музыку, которая нам нравится.
Но эта задача всё ещё не под силу
нашим самым продвинутым
механизмам и компьютерам.
Сегодня я выступлю перед вами
с докладом
о наших последних достижениях
в области машинного зрения,
одной из самых передовых
и потенциально революционных
технологий в области компьютерных наук.
Да, мы создали прототипы
беспилотных автомобилей,
но без компьютерного зрения
они не смогут отличить
на дороге бумажный пакет, 
по которому можно проехать,
от камня похожего размера,
который стоит объехать.
Мы создали замечательные 
мегапиксельные камеры,
но не смогли вернуть зрение слепым.
Беспилотные аппараты могут преодолевать
огромные расстояния,
но не обладают достаточной
технологией зрения,
чтобы помочь нам отслеживать
динамику вырубки тропических лесов.

Japanese: 
自分の好きな曲だけがかかるように
ラジオをカスタマイズしています
しかしながら最先端の
コンピュータでも
まだこの作業には
手こずっているんです
私は今日コンピュータビジョンの
最新動向について
お伝えするために来ました
これはコンピュータサイエンスの中でも
先端にあって
画期的なものになる
可能性のある技術です
自分で運転する車の
プロトタイプが作られていますが
知的な視覚処理能力がなかったら
踏みつぶしても問題のない
道路上の丸めた紙袋と
避けて通るべき同じ大きさの石とを
見分けることもできません
すごいメガピクセルの
カメラが作られていますが
盲目の人に視力を与えることは
できていません
無人機を広大な土地の上に
飛ばすことはできても
熱帯雨林の変化を
追跡できるだけの
画像技術はまだありません

Albanian: 
Kamerat e sigurisë janë kudo,
por nuk na lajmërojnë kur një fëmijë
është duke u mbytur në pishinë.
Fotot dhe videot po bëhen një pjesë
e pandashme e jetës globale.
Ata po gjenerohen me një ritëm aq të 
shpejtë, sa është e pamundur që
një individ, apo një grup individësh 
t'i shohë të gjitha,
dhe unë bashkë me ju po kontribojmë
për këtë qëllim në TED.
Megjithatë, programet tona më të avancuara
e kanë të vështirë ta kuptojnë
dhe menaxhojnë këtë sasi kaq të madhe
informacioni.
Pra, me fjalë të tjera, 
bashkarisht si shoqëri,
ne jemi disi të verbër,
pasi makinat tona më inteligjente
janë akoma të verbra.
"Pse është kaq e vështirë?" 
do të pyesnit ju.
Kamerat mund të kapin foto si kjo këtu
duke i shndërruar dritat në 
një matricë numrash
të njohura si piksela,
por këto janë thjesht numra pa jetë.

Thai: 
กล้องรักษาความปลอดภัยมีอยู่ทั่วไป
แต่กล้องไม่แจ้งเตือนเราเมื่อเด็กกำลัง
จมน้ำในสระว่ายน้ำ
ภาพถ่ายและวิดีโอกลายเป็นส่วนสำคัญ
ของชีวิตในโลก
กล้องถูกสร้างขึ้นด้วยความเร็วที่ไกล
เกินกว่าสิ่งที่มนุษย์
หรือทีมงานของมนุษย์สามารถหวังว่าจะเห็น
และคุณและฉันมีส่วนร่วมในกรณีนี้ที่ TED นี้
แต่ซอฟต์แวร์ขั้นสูงที่สุดของเรา
ยังคงต้องดิ้นรนเพื่อให้เข้าใจ
และจัดการกับเนื้อหาขนาดใหญ่นี้
ดังนั้นในคำอื่นๆ เรียกรวมกันว่าเป็นสังคม
เราเป็นคนตาบอดมาก
เพราะเครื่องที่ชาญฉลาดของเรา
ยังคงตาบอด
"ทำไมถึงยากมาก" คุณอาจถาม
กล้องสามารถถ่ายรูปได้เช่นนี้
โดยการแปลงแสงเป็นแถวสองมิติ
ของตัวเลข
เรียกว่าพิกเซล
แต่สิ่งเหล่านี้เป็นเพียงตัวเลขที่ตาย

Dutch: 
Er zijn overal veiligheidscamera's,
maar die waarschuwen ons niet
als een kind verdrinkt in een zwembad.
Foto's en filmpjes zijn deel
van ons leven geworden.
Ze verschijnen sneller dan welk mens,
of welk team mensen ooit kan bekijken,
en jullie en ik dragen daaraan bij
op deze TED.
Onze meest geavanceerde software 
heeft nog steeds moeite met het begrijpen
van deze enorme hoeveelheid gegevens.
Met andere woorden,
we zijn met z'n allen heel erg blind,
omdat onze slimste machines
ook nog blind zijn.
Je zal je afvragen
waarom het zo moeilijk is.
Camera's kunnen dit soort foto's nemen
door licht om te zetten
naar een 2-dimensionale serie getallen,
bekend als pixels.
Maar dit zijn slechts levenloze getallen.

Korean: 
감시 카메라가 도처에 있어도
수영장에서 물에 빠진 아이를 보고
우리에게 경고해 주지는 않습니다.
사진과 비디오는 지구 생활의
불가결한 부분이 되고 있습니다.
어떤 개인이나 단체가 
다 볼 수 없을 분량의
영상이 만들어지고 있습니다.
여기 TED도 일조하고 있지요.
그러나 가장 진보한 
소프트웨어도 아직까지는
이 방대한 영상을 이해하고 
관리하는데 애를 먹고 있습니다.
달리 말하자면 사회 전체적으로
우리는 장님과 같습니다.
우리의 가장 똑똑한 기계가
아직까지 장님이니까요.
"그게 왜 어렵지?" 하고
물으실 수 있어요.
카메라는 이런 사진을 찍을 수 있고
빛을 숫자의 2차원 배열인
픽셀로 변환할 수 있지만,
이는 그저 죽은 숫자일 뿐입니다.

Ukrainian: 
Ми скрізь маємо камери 
відеоспостереження,
але вони не попереджають нас, 
коли дитина тоне в басейні.
Фото та відео стали
невід'ємними частинами глобального життя.
Вони накопичуються з такою швидкістю,
що людина або група людей
не можуть навіть сподіватися на те,
щоб переглянути їх усі,
і ми з вами робимо свій внесок
у це на TED сьогодні.
Проте наші найпередовіші програми
все ще намагаються навчитися
керувати цією численною
базою даних.
Іншими словами,
ми всі як суспільство
залишаємося достатньо сліпими,
оскільки наші найрозумніші машини
все ще сліпі.
Ви можете запитати:
"Чому це так важко?"
Камери роблять знімки,
такі як ось цей,
шляхом перетворення світла 
на двовимірну сукупність цифр,
відомих як пікселі,
але це лише мертві цифри.

Chinese: 
監視器滿佈在各個角落，
卻無法在看到一個孩子將溺斃在泳池之際，
對我們發出警訊。
靜態及動態影像已逐漸與全世界的生活密不可分，
它們發展的步伐已經遠遠超越人類
及其群體所相信的，
在座各位以及我自己
都是TED這個活動裡頭的推手。
然而，目前最先進的軟體卻仍在其中苦苦掙扎，
無法理解與應用這龐大的資料體。
換而言之，在這整個社會裡，
大家都有如盲人在運作，
因為連我們最聰明的機器都還看不見。
或許有人會問：這到底有什麼困難？
任何相機都可以產生像這樣的照片，
它是藉由將有色光轉換成2D的數字陣列，
也就是大家熟知的像素。
但這些數字是死的，

iw: 
מצלמות אבטחה נמצאות בכל מקום,
אבל הן לא מתריעות כשילד טובע בבריכה.
תמונות וסרטונים הופכים לחלק בלתי נפרד
מהחיים הגלובליים.
הם נוצרים בקצב שהוא מעל לכל מה שכל אדם,
או קבוצות של אנשים,
יכולים לקוות לצפות בהם,
ואתם ואני תורמים לזה בשיחת TED הזו.
אבל התוכנה המתקדמת ביותר שלנו עדיין 
מתמודדת בלהבין
ולנהל את התוכן העצום הזה.
אז במילים אחרות, במשותף כחברה,
אנחנו מאוד עיוורים,
כי המכונות החכמות ביותר שלנו 
עדיין עיוורות.
אתם יכולים לשאול -
"למה זה כל כך קשה?"
מצלמות יכולות לקחת תמונות כמו זו,
על ידי המרת אורות לשטח דו מימדי של מספרים,
הידועים כפיקסלים,
אבל אלו רק מספרים חסרי חיים.

French: 
Il y a des caméras de sécurité partout,
mais elles ne savent pas nous alerter
quand un enfant se noie dans une piscine.
La photo et la vidéo 
font partie de notre vie.
Elles sont générées tellement vite
qu'aucun humain
ou groupe d'humains ne peut tout voir,
Vous et moi, nous y contribuons, 
avec cette conférence TED.
Pourtant nos programmes les plus avancés
ont du mal à comprendre
et à gérer cet énorme contenu.
En d'autres termes, nous, la société,
sommes vraiment aveugles,
parce que nos plus intelligentes 
machines sont encore aveugles.
« Pourquoi est-ce si difficile ? »,
pourriez-vous demander.
Un appareil peut prendre une photo 
comme celle-ci,
il convertit la lumière 
en tableaux bidimensionnels
que l'on nomme pixels,
mais ce ne sont que des nombres sans vie.

Vietnamese: 
Máy quay an ninh ở khắp mọi nơi,
nhưng không thể báo động cho chúng ta
khi một đứa trẻ đang bị chìm trong hồ bơi.
Hình ảnh và những thước phim trở thành
một phần thiết yếu của đời sống toàn cầu.
Chúng đang được điều khiển với tốc độ
vượt lên trên bất kỳ con người nào,
hay nhóm người, có thể hy vọng thấy được,
và bạn và tôi đang cống hiến
cho điều đó ở TED này.
Nhưng phần mềm tân tiến vẫn đang
phải khó khăn xoay trở trong việc hiểu
và quản lý nội dung khổng lồ này.
Vì vậy nói cách khác,
tụ chung lại như là một xã hội,
chúng ta giống như bị mù,
bởi vì chiếc máy thông minh nhất
của chúng ta vẫn bị mù
"Tại sao lại khó đến vậy" bạn sẽ hỏi.
Máy ảnh có thể chụp được những bức thế này
bằng cách chuyển đổi ánh sáng
thành dãy 2 chiều những con số,
được biết đến như điểm ảnh,
nhưng chúng giống như những con số chết.

Romanian: 
Camerele de securitate sunt peste tot,
dar nu ne alertează 
când un copil se îneacă într-o piscină.
Fotografiile și videoclipurile 
devin o parte integrală a vieții globale.
Sunt generate cu o viteză mult peste
ce speră să vadă un om sau un grup,
iar noi contribuim cu acest TED.
Cele mai avansate programe se străduiesc
să le înțeleagă și să le administreze.
Altfel spus, colectiv, ca societate,
suntem orbi,
pentru că cele mai inteligente dispozitive
sunt încă oarbe.
„De ce e atât de greu?” ați putea întreba.
Camerele pot face poze ca aceasta
convertind lumini în șiruri
de numere bidimensionale – pixeli.
Dar sunt doar numere fără viață.
Nu au un înțeles în sine.

Chinese: 
安全摄像头到处都是，
但当有孩子在泳池里溺水时
它们无法向我们报警。
照片和视频，已经成为
全人类生活里不可缺少的部分。
它们以极快的速度被创造出来，
以至于没有任何人，或者团体，
能够完全浏览这些内容，
而你我正参与其中的这场TED，
也为之添砖加瓦。
直到现在，我们最先进的
软件也依然为之犯难：
该怎么理解和处理
这些数量庞大的内容？
所以换句话说，
在作为集体的这个社会里，
我们依然非常茫然，因为我们最智能的机器
依然有视觉上的缺陷。
”为什么这么困难？“你也许会问。
照相机可以像这样获得照片：
它把采集到的光线转换成
二维数字矩阵来存储
——也就是“像素”，
但这些仍然是死板的数字。

Hungarian: 
Biztonsági kamerák vannak mindenhol,
de nem figyelmeztetnek minket, amikor 
egy gyerek beleesik az úszómedencébe.
A fotók és videók szerves részévé 
váltak az életnek.
Olyan ütemben keletkeznek, ami 
messze túl van azon, amit az ember
vagy embercsoportok remélhetnének látni.
Önök és én ezen a TED-en most 
közreműködhetünk ebben.
Még a legfejlettebb
szoftvereink is csak küzdenek
ennek a hatalmas tartalomnak 
a megértésével és kezelésével.
Más szavakkal, 
együttesen, egy közösségként
szinte teljesen vakok vagyunk,
mert a legokosabb gépeink még vakok.
"Miért olyan nehéz ez?" - kérdezhetik.
A kamerák képesek ilyen képeket készíteni,
a fényeket kétdimenziós 
számsorokba konvertálják,
az úgynevezett pixelekbe,
de ezek csak élettelen számok.

Danish: 
Sikkerhedskameraer er allevegne
men de advarer os ikke, når et barn
drukner i en svømmepøl.
Foto og video er blevet en integreret
del af det globale liv.
De bliver fremstillet hurtigere end 
noget menneske
eller hold af folk kan nå at se
og du og jeg bidrager til det
ved denne TED.
Vor mest avancerede software
kæmper stadig med at forstå
og administrere dette enorme indhold.
Med andre ord er vi kollektivt som samfund
stadig meget blinde,
for vor klogeste maskiner er
stadig blinde.
"Hvorfor er det så svært?" spørger
du måske.
Kameraer tager billeder som dette
ved at konvertere lys til en
to-dimensionel række af tal
kendt som pixler
men de er kun livløse tal.

Turkish: 
Güvenlik kameraları her yerde,
fakat bir çocuk havuzda boğuluyorken 
bizi uyaramıyorlar.
Fotoğraf ve videolar gündelik hayatın
bir parçası haline geliyorlar.
Herhangi bir insan veya bazı 
grupların görme umuduyla
hızlı bir şekilde çoğalıyorlar,
buradaki TED konuşmaları ile
sizler ve ben de buna katkı sağlıyoruz.
En iyi yazılımımız hala bu devasa içeriği
anlamaya ve yönetmeye çabalıyor.
Başka bir anlamda,
toplumun tamamı olarak
büyük bir görme kaybına sahibiz
çünkü en iyi makinelerimiz hala
göremiyorlar.
"Neden bu kadar zor ki bu?"
diye soracaksınız.
Kameralar burada da olduğu gibi
fotoğraf çekebilirler,
ışığın iki boyutlu sayı dizilerine
çevrilmiş hali ile,
ki bunlara pikseller diyoruz.
Fakat burada sadece ölü sayılar
bulunmakta.

Portuguese: 
As câmeras de segurança
estão em toda parte,
mas não nos alertam quando uma criança
está se afogando numa piscina.
Fotos e vídeos estão se tornando
partes integrais da vida global.
Estão sendo gerados a um ritmo
muito além do que qualquer humano,
-- ou grupos de seres humanos --
poderia esperar ver.
E vocês e eu estamos contribuindo 
para isto nesta palestra TED.
No entanto, nosso software mais avançado
ainda tem dificuldade para compreender
e administrar este conteúdo enorme.
Então, em outras palavras,
coletivamente como sociedade,
somos muito cegos,
porque nossas máquinas
mais inteligentes ainda são cegas.
"Por que isto é tão difícil?",
vocês podem perguntar.
As câmeras podem tirar fotos como esta,
convertendo luzes numa matriz
bidimensional de números
conhecida como pixels,
mas estes são apenas números sem vida,

Arabic: 
كاميرات المراقبة أصبحت في كل مكان
لكنها لا تنبهنا عندما يوشك
طفل على الغرق في بركة سباحة
الصور والفيديوهات أصبحت
جزءًا متكاملا مع الحياة على مستوى العالم
لقد أصبحت تتدفق بوتيرة أسرع
بكثير مما كان أي إنسان
أو مجموعة من البشر يأمل في رؤيته
وأنا وأنت نساهم في ذلك
في مؤتمر TED هذا
لكن ما تزال أكثر برامجنا تطورًا
تواجه مشكلة في استيعاب
وإدارة هذا المحتوى الهائل
لذلك، وبكلمات أخرى
نحن كمجتمع، بصورة جمعية
فاقدون للبصر بشدة
لأن أذكى آلاتنا لا تزال عمياء
يمكنك أن تسأل
"لِمَ ذلك من الصعوبة بمكان؟"
تستطيع الكاميرات أن تلتقط صورًا كهذه
عن طريق تحويل الضوء إلى
مصفوفة أرقام ثنائية البعد
تعرف باسم البكسل
لكنها مجرد أرقام خالية من الحياة

Czech: 
Kamerové systémy jsou všude,
ale neupozorní nás, když se dítě
topí v bazénu.
Fotky a videa se stávají nezbytnou
součástí života.
Jsou vytvářeny rychlostí, která je
mnohem vyšší
než jsme si dokázali představit,
a já zde na TEDu k tomu přispívám.
Přesto všechno naše nejdokonalejší
programy stále zápasí s porozuměním
a ovládáním tohoto ohromného obsahu.
Jiný slovy, dohromady jako společnost
jsme prakticky slepí,
protože naše nejchytřejší stroje
jsou slepé.
"Proč je to tak těžké?" ptáte se.
Foťáky mohou vyfotit obrázek jako tento
převedením světel do dvoudimenzionální
soustavy
známé jako pixely,
ale to jsou jenom neživá čísla.

English: 
Security cameras are everywhere,
but they do not alert us when a child
is drowning in a swimming pool.
Photos and videos are becoming
an integral part of global life.
They're being generated at a pace
that's far beyond what any human,
or teams of humans, could hope to view,
and you and I are contributing
to that at this TED.
Yet our most advanced software
is still struggling at understanding
and managing this enormous content.
So in other words,
collectively as a society,
we're very much blind,
because our smartest 
machines are still blind.
"Why is this so hard?" you may ask.
Cameras can take pictures like this one
by converting lights into
a two-dimensional array of numbers
known as pixels,
but these are just lifeless numbers.

Russian: 
Повсюду находятся
камеры видеонаблюдения,
но они не могут предупредить нас 
о тонущем в бассейне ребёнке.
Фотографии и видеоролики становятся 
неотъемлемой частью нашей жизни.
Они накапливаются с такой скоростью,
что их все невозможно просмотреть
ни одному человеку, ни группе людей.
Мы, участники TED, тоже этому
поспособствовали.
Нашему самому продвинутому программному 
обеспечению не под силу воспринимать
этот огромный массив данных
и управлять им.
Иначе говоря, коллективно
наше общество слепо,
потому что наши самые умные машины
всё ещё не умеют видеть.
«Почему же это так сложно?» —
спросите вы.
Фотокамеры могут делать 
вот такие фотографии,
преобразовывая свет
в двухмерную числовую последовательность,
известную как «пиксели».
Но это просто числа.

Persian: 
دوربین های امنیتی همه جا هست،
ولی وقتی یک کودک در استخر 
در حال غرق شدن است به ما هشدار نمیدهند.
تصاویر و ویدیوها در حال تبدیل شدن به
جز مهمی از زندگی جهانی هستند.
تصاویر با سرعتی فراتر از آنچه هر انسان
یا گروهی از انسانها،
بتواند امیدوار به دیدن آنها باشد
تولید می‎شوند،
و من و شما در این TED 
یعنی تولید تصاویر مشارکت می‎کنیم.
با این وجود پیشرفته‎ترین
نرم افزارها همچنان
در فهم و مدیریت این حجم عظیم مشکل دارند.
به عبارت دیگر در مجموع
به عنوان جامعه
ما کاملا کور هستیم،
چون باهوشترین 
ماشینهای ما هنوز نابینا هستند.
شاید بپرسید "چرا انقدر سخته؟"
دوربین‎ها می‎توانند تصاویری
مثل این را بگیرند:
با تبدیل نور به 
آرایه دو بعدی اعداد
به نام "پیکسل"
ولی اینها فقط اعداد بی روح هستند،

Spanish: 
Hay cámaras de seguridad en todas partes,
pero no nos alertan cuando un niño
se está ahogando en una piscina.
Las fotos y los videos se están volviendo
parte integral de la vida global.
Se generan a un ritmo mucho mayor
de lo que cualquier humano,
o equipo de humanos, podría ver,
y Uds. y yo contribuimos 
a eso en este TED.
Aun así, nuestro software más avanzado
tiene problemas para entender
y gestionar este enorme contenido.
En otras palabras, colectivamente
como una sociedad,
somos muy ciegos,
porque nuestras máquinas
más inteligentes aún son ciegas.
Se preguntarán:
"¿Por qué es tan difícil?"
Las cámaras pueden tomar fotos como esta
convirtiendo luz en matrices 
numéricas bidimensionales
conocidas como pixeles,
pero estos son solo números vacíos.

Japanese: 
監視カメラが至る所に
設置されていますが
プールで溺れている子がいても
警告してはくれません
写真やビデオは世界において
生活に不可欠な一部をなしています
どんな個人であれ チームであれ
見切れないほどのペースで
映像が量産されています
そして私たちも ここTEDで
それに貢献しています
しかし最も進んだ
ソフトウェアでさえ
この膨大な映像を理解し管理するのに
手こずっています
言ってみれば
私たちの社会は
集合的に盲目であり
それは最も知的な機械が
いまだ盲目だからです
なぜそんなに難しいのかと
思うかもしれません
カメラはこのような写真を撮って
光をピクセルと呼ばれる
数字の２次元配列へと
変換しますが
これは死んだ数字の列に
過ぎません
数字自体に意味はありません

Modern Greek (1453-): 
Κάμερες ασφαλείας είναι παντού,
αλλά δεν μας προειδοποιούν
όταν ένα παιδί πνίγεται στην πισίνα.
Φωτογραφίες και βίντεο γίνονται ολοένα
πιο σημαντικό κομμάτι της παγκόσμιας ζωής.
Δημιουργούνται με τέτοιο ρυθμό
που είναι πέρα απ' ότι ένας άνθρωπος
ή μια ομάδα ανθρώπων μπορούν να δουν,
και εσείς και εγώ συνεισφέρουμε σε αυτό,
εδώ στο TED.
Κι όμως, το πιο προηγμένο λογισμικό μας
δυσκολεύεται ακόμα να καταλάβει
και να διαχειριστεί αυτές τις τεράστιες
ποσότητες περιεχομένου.
Με άλλα λόγια, συλλογικά σαν κοινωνία,
είμαστε βασικά τυφλοί,
γιατί οι πιο «έξυπνες» μηχανές μας
είναι ακόμα τυφλές.
«Γιατί είναι τόσο δύσκολο;»
μπορεί να ρωτήσετε.
Οι κάμερες μπορούν να τραβήξουν 
φωτογραφίες όπως αυτή
μετατρέποντας το φως
σε δισδιάστατους πίνακες αριθμών
που λέγονται πίξελ,
αλλά αυτοί είναι άψυχοι αριθμοί.

Croatian: 
Sigurnosne kamere su svugdje,
ali ne upozoravaju nas kada se
dijete utaplja u bazenu.
Slike i videi postaju
integralni dio globalnog života.
Stvaraju se brzinom koja je 
daleko veća od od one koji bi čovjek
ili timovi ljudi željeli vidjeti,
a vi i ja pridonosimo tome
ovdje na TED-u.
Ipak naš najnapredniji softver
se i dalje muči oko razumjevanja
i upravljanja tog ogromnog sadržaja.
Drugim riječima, 
zajedno kao društvo,
poprilično smo slijepi,
jer su naši najpametniji
uređaji i dalje slijepi.
"Zašto je to tako teško?",
možda se pitate.
Kamere mogu fotografirati slike poput ove
pretvarajući svjetlost u
dvodimenzionalne redove brojeva
poznate kao pikseli,
ali to su samo beživotni brojevi.
Ne nose smisao u sebi.

Italian: 
Ci sono telecamere 
a circuito chiuso ovunque,
che però non ci avvertono quando
un bambino sta affogando in una piscina.
Video e foto stanno diventando 
parte integrante della vita globale.
Sono generati a un ritmo
più veloce di quello che ogni uomo
o gruppi di uomini spera di poter avere,
e vi contribuiamo in questo TED.
Eppure il nostro software più
avanzato non riesce ancora a capire
e amministrare quest'enorme contenuto.
In altri termini collettivamente
siamo una società di ciechi
perché le nostre macchine più 
intelligenti sono ancora cieche.
Vi chiederete perché sia così difficile.
Le fotocamere scattano foto come questa,
trasformando le luci in 
una matrice bidimensionale di numeri,
i pixels,
però sono solo numeri senza vita.

Polish: 
Kamery przemysłowe są wszędzie,
ale nie potrafią nas ostrzec, 
jeśli dziecko topi się w basenie.
Zdjęcia i filmy video stały się 
integralną częścią naszego życia.
Ilość materiału, który powstaje, 
przekracza możliwości odbiorcze
pojedynczego człowieka, 
a nawet grupy ludzi.
Podczas TED dokładamy 
do tego swoją cegiełkę.
Najbardziej zaawansowane oprogramowanie 
nadal nie umie sobie poradzić
ze zrozumieniem i zarządzaniem
tak ogromną ilością danych.
Innymi słowy jako społeczeństwo
jesteśmy niewidomi,
bo nasze najmądrzejsze maszyny
wciąż nie widzą.
"Co w tym trudnego?" moglibyście zapytać.
Aparaty potrafią zrobić zdjęcie,
przekształcając światło 
w dwuwymiarowy szereg liczb,
czyli w piksele.
Ale są to tylko liczby.

Portuguese: 
Temos câmaras de segurança
por todo o lado,
mas elas não nos alertam quando uma
criança se está a afogar numa piscina.
As fotografias e os vídeos
estão a tornar-se
parte integrante da vida em todo o mundo.
São gerados a um ritmo muito mais rápido
do que qualquer ser humano,
ou equipas de seres humanos
poderiam esperar ver.
Nós estamos neste momento a contribuir
para este fenómeno, com este evento TED.
No entanto, até o software mais avançado
tem ainda dificuldades em compreender
e gerir uma quantidade
de dados tão grande.
Por outras palavras, enquanto sociedade,
nós somos bastante cegos,
porque as nossas máquinas
mais inteligentes ainda são cegas.
"Porque é isto tão difícil?"
poderão perguntar.
As câmaras fotográficas 
tiram fotografias como esta,
convertendo luzes 
numa tabela com números,
conhecidos como pixéis,
mas são apenas números sem vida.

French: 
Par eux-mêmes, ils ne signifient rien.
Tout comme entendre 
n'est pas la même chose qu'écouter,
prendre une photo,
ce n'est pas comme voir,
et par « voir », entendez « comprendre ».
En fait, Mère Nature a travaillé dur
540 millions d'années
pour accomplir cette tâche,
et le plus gros de cet effort a été
le développement de l'appareil 
qui produit la vision dans notre cerveau,
pas les yeux.
La vision commence avec les yeux,
mais tout se passe en fait dans le cerveau.
Depuis maintenant 15 ans, d'abord en thèse à Caltech
puis à la tête du Vision Lab à Stanford,
je travaille avec mes mentors, 
collaborateurs et étudiants
pour apprendre la vision aux ordinateurs.
Il s'agit de vision par ordinateur et
d'apprentissage machine.

Portuguese: 
não carregam significado em si mesmos.
Assim como ouvir
não é o mesmo que escutar,
tirar fotos não é o mesmo que ver,
e por ver, queremos dizer, compreender.
Na verdade, a mãe natureza levou
540 milhões de anos de trabalho pesado
para realizar esta tarefa,
e muito deste esforço
foi para desenvolver o aparelho
de processamento visual do nosso cérebro,
não os olhos em si.
Então, a visão começa com os olhos,
mas acontece de fato no cérebro.
Então, por 15 anos, começando
com o meu doutorado na Caltech
e depois liderando 
o Stanford's Vision Lab,
venho trabalhando com os meus mentores,
colaboradores e alunos
para ensinar os computadores a ver.
Nosso campo de pesquisa chama-se visão
computacional e aprendizado de máquina.

Albanian: 
Nuk mbartin ndonjë kuptim në vetvete.
Njësoj si të dëgjuarit nuk është njësoj 
si ta kuptosh atë që dëgjon,
ashtu dhe të kapësh foto nuk është
njësoj si të shohësh,
dhe me shikimin, ne nënkuptojmë 
dhe të kuptuarin e asaj që shohim.
Në fakt, Nënës Natyrë iu deshën 
540 milionë vjet
për ta bërë këtë gjë,
dhe pjesa më e madhe e mundit
shkoi për zhvillimin e aparatit të
përpunimit vizual në trurin tonë,
e jo vetëm për sytë.
Pra shikimi fillon me sytë,
por në të vërtetë zhvillohet në tru.
Kështu për 15 vjet, duke filluar me 
doktoraturën në Caltech
dhe më pas në krye të Vision Lab 
në Stanford,
kam punuar me mentorët, bashkëpunuesit
dhe studentët e mi
për t'i mësuar kompjuterat të shohin.
Fusha jonë kërkimore quhet
computer vision dhe machine learning.

Vietnamese: 
Chúng không mang bất kỳ ý nghĩa nào cả.
Giống như nghe
thì không phải là thưởng thức,
chụp ảnh không giống như nhìn thấy
và với việc nhìn thấy,
chúng tôi thực sự muốn nói là hiểu được.
Trong thực tế, mẹ thiên nhiên
phải mất 540 triệu năm cật lực
mới làm được điều này,
và hầu hết nỗ lực đó
để đi đến việc phát triển
quá trình của não bộ chúng ta,
không chỉ mỗi đôi mắt.
Vì thế mà cái nhìn bắt đầu với đôi mắt,
nhưng thật sự diễn ra trong não bộ.
Vì thế mà 15 năm qua, bắt đầu
với luận án tiến sĩ của tôi tại Caltech
và sau đó là hướng dẫn
phòng thí nghiệm Thị giác ở Stanford,
tôi đã làm việc với cố vấn,
đối tác và sinh viên
để dạy cho máy tính cách nhìn.
Lĩnh vực nghiên cứu của chúng tôi gọi là
thị giác máy tính và máy móc học hỏi.

Chinese: 
它们自身并不携带任何意义。
就像”听到“和”听“完全不同，
”拍照“和”看“也完全不同。
通过“看”，
我们实际上是“理解”了这个画面。
事实上，大自然经过了5亿4千万年的努力
才完成了这个工作，
而这努力中更多的部分
是用在进化我们的大脑内
用于视觉处理的器官，
而不是眼睛本身。
所以"视觉”从眼睛采集信息开始，
但大脑才是它真正呈现意义的地方。
所以15年来，
从我进入加州理工学院攻读Ph.D.
到后来领导
斯坦福大学的视觉实验室，
我一直在和我的导师、
合作者和学生们一起
教计算机如何去“看”。
我们的研究领域叫做
"计算机视觉与机器学习"。

Chinese: 
並沒有被賦予意義。
就好像有「聽」，不代表有「到」。
同樣地，攝取到影像不等於看見，
我們所認知的看到，應包含著了解其中的意義。
事實上，這樣的成果，
是大自然花了五億四千萬年的光陰
才得到的。
這其中的努力，
泰半是耗費在發展腦部的視覺處理這個區塊，
而不是眼睛的部分。
也就是說，視覺始於眼睛，
但真正使它有用的，卻是大腦。
十五年來，從在加州理工學院攻讀博士開始，
到領導史丹佛的視覺實驗室，
我和指導教授、同事及學生們，
試圖讓電腦擁有智能之眼，
我們研究的領域稱之為電腦視覺與機器學習，

Persian: 
هیچ معنی به خودی خود ندارند.
مثل اینکه:
شنیدن با گوش کردن یکی نیستند،
عکس گرفتن با دیدن یکی نیستند،
یا اینکه منظور از دیدن واقعا فهمیدن نیست.
در حقیقت ۵۴۰ میلیون سال وقت مادر طبیعت
صرف انجام این کار سخت شده
و بیشتر این تلاش به تکامل
ابزار پردازش دید مغزمان اختصاص داده شده
و نه به خود چشمها.
پس، دیدن با چشم آغاز میشود،
ولی در حقیقت در مغز شکل می‌گیرد.
برای ۱۵ سال با شروع از دکترا در کل‌تک
و سپس رهبری آزمایشگاه بینایی در استانفورد،
من با مربی هایم، همکارانم و شاگردانم
تلاش کرده ام
که به رایانه ها یاد بدهیم که ببینند.
اسم زمینه تحقیقاتی ما
بینایی رایانه ای و آموزش ماشین هست.

Portuguese: 
Por si só não têm significado.
Pela mesma razão que ouvir
não é o mesmo que escutar,
tirar fotografias
não é o mesmo que ver,
e por ver entenda-se compreender.
Na verdade, a Mãe Natureza precisou
de 540 milhões de anos de trabalho duro
para realizar esta tarefa.
Muito desse esforço
foi para o desenvolvimento do mecanismo
de processamento visual do cérebro,
e não para os olhos.
Portanto, a visão começa nos olhos,
mas onde realmente acontece é no cérebro.
Há já 15 anos, desde
o meu doutoramento em Caltech,
e depois como diretora
do laboratório Stanford's Vision,
tenho trabalhado com os meus mentores,
colaboradores e estudantes
para ensinar os computadores a ver.
A nossa área de investigação chama-se
visão computacional
e aprendizagem automática.

Italian: 
Non hanno alcun significato di per sé.
Proprio come udire non è come ascoltare,
scattare foto non è come vedere,
e con vedere intendiamo capire.
In effetti, ci sono voluti 540 milioni
anni di duro lavoro a Madre Natura
per completare questo compito,
e gran parte di questo sforzo
è andato allo sviluppo 
dell'elaborazione ottica del cervello,
non agli occhi.
Quindi la visione inizia con gli occhi,
ma in realtà avviene nel cervello.
Dunque da 15 anni, 
prima con il Ph.D al Caltech
e poi a capo del Vision Lab di Stanford,
lavoro con i miei 
mentori, collaboratori e studenti
per insegnare ai computer a vedere.
Il campo di ricerca si chiama visione 
artificiale e apprendimento automatico.

iw: 
הם לא נושאים איזושהי משמעות בעצמם.
כמו שלשמוע זה לא אותו דבר כמו להקשיב,
לקחת תמונות זה לא אותו דבר כמו לראות,
ובלראות, אנחנו למעשה מתכוונים ללהבין.
למעשה, זה לקח לאימא טבע
540 מיליון שנים של עבודה קשה
לעשות את המשימה הזו,
והרבה מהמאמץ הזה
הלך על פיתוח מנגנון
העיבוד החזותי של המוח שלנו,
לא העיניים עצמן.
אז ראייה מתחילה בעיניים,
אבל באמת מתרחשת במוח.
אז במשך 15 שנים האחרונות,
מהדוקטורט שלי במכון הטכנולוגי של קליפורניה
ואז הובלת מעבדת הראייה בסטנפורד,
אני עובדת עם המורים הרוחניים שלי,
משתפי פעולה וסטודנטים,
ללמד מחשבים לראות.
תחום המחקר שלנו נקרא -
ראייה ממוחשבת ולמידת מכונה.

Croatian: 
Jednako kao što slušati
ne znači isto što i čuti,
fotografirati sliku nije isto 
što i vidjeti,
a pod vidjeti
mislimo na razumijevanje.
Zapravo, prirodi je bilo potrebno
540 milijuna godina teškog posla
da to uspije,
a većina tog posla
otišla je u razvijanje uređaja
za obradu vida u našem mozgu,
ne u samim očima.
Vid započinje s očima,
ali zapravo se sve događa u mozgu.
Već 15 godina, započevši od
mog doktorata u Caltech-u
i zatim vodeći Stanfordov
laboratorij za vid,
radila sam s mentorima,
suradnicima i studentima
kako bi naučili računala da vide.
Naše polje se zove
računarni vid i strojno učenje.

Russian: 
Они не несут в себе никакого смысла.
Так же, как «слышать» — 
не то же самое, что «слушать»,
«делать» фотографии — не то же самое,
что «видеть» их,
а под «видеть», конечно же,
имеется в виду «понимать».
Природе пришлось усердно трудиться
в течение 540 миллионов лет,
чтобы решить эту задачу,
и многие из этих усилий
были направлены
на создание аппарата обработки
визуальных данных в нашем мозге,
а не глаз как таковых.
Зрение начинается с глаз,
но фактически происходит в мозге.
В течение вот уже 15 лет, начиная 
с аспирантуры в Калтехе,
а затем возглавляя стэнфордскую
лабораторию зрения,
я работаю вместе с наставниками,
коллегами и студентами,
обучая компьютеры видеть.
Сфера наших исследований — 
машинное зрение и обучение машин.

Japanese: 
単に音が耳に入ってくるのと
「聴く」のとは違うように
「写真を撮る」のと「見る」のとは
同じではありません
「見る」ということには
理解することが含まれているのです
実際この仕事を
成し遂げられるようにするために
母なる自然は 5億4千万年という
長い歳月を必要としたのです
そしてその努力の多くは
目そのものではなく
脳の視覚処理能力を発達させるために
費やされました
視覚というのは
目から始まりますが
それが本当に起きているのは
脳の中なのです
これまで15年間 
カリフォルニア工科大学の博士課程の頃から
スタンフォード大でコンピュータビジョン研究室を
率いている今に到るまで
私は指導教官や共同研究者や
学生達とともに
コンピュータに見ることを
教えようとしてきました
私たちの研究領域は
コンピュータビジョンと機械学習で

Polish: 
Nie niosą ze sobą znaczenia.
Słyszeć, to nie to samo co słuchać,
a robić zdjęcia, 
to nie to samo co widzieć.
Mówiąc o widzeniu, 
mam na myśli rozumienie.
Zrealizowanie tego zadania 
zajęło Matce Naturze
540 milionów lat ciężkiej pracy,
a większość tego wysiłku włożyła
w rozwój części mózgu odpowiedzialnej 
za przetwarzanie wizualne,
a nie w rozwój oczu.
Widzenie rozpoczyna się w oczach,
ale tak naprawdę odbywa się w mózgu.
Od 15 lat, zaczynając 
od doktoratu w Caltech,
przez prowadzenie Stanford Vision Lab,
pracowałam z moimi mentorami, 
współpracownikami i studentami
nad nauczeniem komputerów widzenia.
Pole naszych badań to widzenie 
komputerowe i systemy uczące się.

English: 
They do not carry meaning in themselves.
Just like to hear is not
the same as to listen,
to take pictures is not
the same as to see,
and by seeing,
we really mean understanding.
In fact, it took Mother Nature
540 million years of hard work
to do this task,
and much of that effort
went into developing the visual
processing apparatus of our brains,
not the eyes themselves.
So vision begins with the eyes,
but it truly takes place in the brain.
So for 15 years now, starting
from my Ph.D. at Caltech
and then leading Stanford's Vision Lab,
I've been working with my mentors,
collaborators and students
to teach computers to see.
Our research field is called
computer vision and machine learning.

Danish: 
De har ingen mening i sig selv.
Ligesom at høre ikke er det samme
som at lytte
er det at tage billeder ikke det
samme som at se
og ved at se mener vi at forstå.
Faktisk tog det Moder Natur 540 mio. års
hårdt arbejde
at løse denne opgave
og megen af den indsats
gik til at udvikle det visuelle
apparat i vor hjerner
og ikke selve øjnene.
Vision starter med øjnene
men foregår virkelig i hjernen.
I 15 år nu, fra min Ph.D. i Caltech
og bagefter da jeg førte
Stanford´s Vision Lab,
har jeg arbejdet med mine mentorer,
kolleger og elever
med at lære computere at se.
Vort forskningsfelt kaldes
computer vision og maskinlærdom.

Turkish: 
Kendi içlerinde herhangi bir anlam
taşımıyorlar.
Nasıl ki duymak ile dinlemek aynı 
anlama gelmiyorsa
fotoğraf çekmek ile görmek de
aynı şeyi ifade etmiyor.
Görmek derken ciddi manada "anlamayı"
kastediyoruz.
Aslında, bu yetiye sahip olabilmemiz
tabiat ananın 540 milyon yılını aldı.
Bu çabanın çoğu, beynin görsel
işleme bölümünün gelişimine gitti
sadece gözlerin kendisine değil.
Yani görmek gözlerde başlıyor,
ama asıl olarak beynin bir bölümünde
anlam kazanıyor.
15 sene önce, Caltech'deki doktorama
başladığımda
ve sonra Stanford Görsel Laboratuvarını
yönlendirdiğimde
mentorlerim, iş ortaklarım ve
öğrencilerimle birlikte
bilgisayarlara görmeyi öğretmek için
çalışıyorduk.
Araştırma alanımız bilgisayar görme yetisi
ve makine öğrenimi olarak anılıyordu.

Korean: 
그 자체에 의미는 없습니다.
'들리는' 것과 '듣는' 것이
똑같지 않듯이
사진을 '찍는' 것과 '보는' 것은 
똑같지 않습니다.
'본다'는 말에는
'이해한다'는 뜻이 있습니다.
사실 자연은 5억 4천만년에 걸쳐
이 작업을 했는데요.
그 노력의 대부분은
우리 뇌의 시각처리능력을 
발달시키는데 소요되었고
눈을 만드는데 소요되지 않았습니다.
시각현상은 눈에서 시작되지만
사실상 나타나는 곳은 뇌 안쪽이죠.
저는 최근 15년간 캘리포니아 
공대 박사 과정에서부터
스탠포드대 컴퓨터 
비전 연구실을 이끌기까지
지도교수, 공동연구자, 학생들과 함께
컴퓨터에게 '보는 법'을
가르쳐왔습니다.
저희 연구 분야를 컴퓨터 비전과 
기계 학습이라고 합니다.

Arabic: 
لا تحمل في ذاتها أي معنى
تمامًا كما أن السّمْع يختلف عن الإصغاء
فإن التقاط الصور يختلف عن الإبصار
فبالإبصار، فإننا في الحقيقة
نعني الفهم
في الواقع، فإن الأمر استغرق الطبيعة الأم
540 مليون سنة من العمل المُضني
لتنجز هذه المهمة
ومعظم ذلك الجهد
ذهب في سبيل تطوير جهاز معالجة
بصرية في أدمغتنا
وليس العين بحد ذاتها
إذن، تبدأ الرؤية في العين
لكنها حقيقة تحدث في الدماغ
منذ 15 عامًا وحتى الآن بدأتها منذ كنت أحضر
الدكتوراه في معهد كاليفورنيا للتكنولوجيا
وبعد ذلك عندما كنت أقود
مختبر الإبصار في ستانفورد
كنت أعمل مع أساتذتي
ومعاونيّ وتلامذتي
على تعليم الحواسيب لكي تبصر
مجال بحثنا يسمى
الإبصار الحاسوبي وتعليم الحواسيب

Czech: 
Sama o sobě nemají smysl.
Stejně jako slyšet není to samé
jako poslouchat,
fotit není to samé jako vidět,
a viděním myslíme chápaní.
Ve skutečnosti, Matce Zemi trvalo
540 milionů let tvrdé práce,
aby tohoto dosáhla
a velká část této snahy
padla na vývoj zrakové procesního 
aparátu v našem mozku,
nejen na oči samotné.
Takže zrak začíná očima,
ale odehrává se v mozku.
Již po 15 let od mého doktorátu 
na Caltechu
a vedení laboratoře 
Stanford's Vision,
pracuji se svými mentory, spolupracovníky
a studenty na tom,
abychom naučili počítače vidět.
Náš výzkum se jmenuje počítačový zrak 
a učení strojů.

Spanish: 
En sí mismos no tienen significado.
Al igual que oír no es
lo mismo que escuchar,
tomar fotografías 
no es lo mismo que ver;
y solo viendo podemos realmente entender.
De hecho, le tomó a la Madre Naturaleza
540 millones de años de arduo trabajo
lograr esta tarea,
y mucho de ese esfuerzo
consistió en desarrollar el sistema
de procesamiento visual en el cerebro,
no los ojos en sí.
La visión empieza en los ojos,
pero, en realidad, 
ocurre en nuestro cerebro.
Durante 15 años, empezando
desde mi doctorado en Caltech
y luego al frente del laboratorio
Stanford Vision Lab,
he trabajado con mis mentores,
colaboradores y estudiantes
para enseñar a las computadoras a ver.
Nuestro campo de investigación se llama
"visión artificial 
y aprendizaje automático".

Romanian: 
Cum „a auzi” nu e la fel cu „a asculta”,
„a face poze” nu e la fel cu „a vedea”,
iar prin „a vedea” ne referim la „a înţelege”.
Naturii i-au trebuit
540 mil. ani de muncă grea pentru asta,
iar mare parte din efort
a constat în dezvoltarea creierului
pentru procesarea vederii, nu a ochlor.
Vederea începe cu ochii,
dar de fapt are loc în creier.
De 15 ani, începând cu doctoratul
la Caltech,
iar apoi conducând 
Laboratorul Vizual din Stanford,
am lucrat cu mentorii, 
colaboratorii și studenții mei
să învățăm computerele să vadă.
Ne ocupăm de recunoașterea
imaginilor și învățarea automată.

Ukrainian: 
Вони самі по собі не несуть значення.
Так само, як слухати
не одне й те саме, що чути,
робити фото не одне й те саме,
що бачити,
а під баченням ми маємо на увазі
розуміння.
Насправді, матері природі
знадобилося 540 млн. років важкої роботи,
щоб впоратися з цим завданням,
і більшість з її зусиль
було спрямовано на розвиток в нашому мозку
органу з обробки візуальної інформації,
і це не лише очі.
Бачення розпочинається з очей,
але насправді відбувається в мозку.
Вже 15 років, починаючи з 
отримання докторського ступеня в Калтех
і потім, очоливши
Стенфордську лабораторію Vision Lab,
я працюю з моїми наставниками,
співробітниками і студентами,
щоб навчити комп'ютери бачити.
Наша сфера дослідження називається
комп'ютерне бачення

Thai: 
พิกเซลไม่มีความหมายในตัวเอง
เช่นเดียวกับที่ได้ยินไม่เหมือนกับการฟัง
การถ่ายภาพไม่ได้เหมือนกับการดู
และโดยการเห็น เราหมายถึง
ความเข้าใจจริงๆ
ในความเป็นจริงแล้ว ธรรมชาติต้อง
ใช้เวลา 540 ล้านปีในการทำงานหนัก
เพื่อทำภารกิจนี้
และความพยายามส่วนมาก
เข้าไปในการพัฒนาอุปกรณ์การประมวลผล
ภาพของสมองของเรา
ไม่ใช่ตาเอง
ดังนั้นการมองเห็นเริ่มต้นด้วยดวงตา
แต่เกิดขึ้นอย่างแท้จริงในสมอง
ดังนั้น เวลา 15 ปีตอนนี้ เริ่มต้นจาก
ฉันทำปริญญา Ph.D. ที่ Caltech
และจากนั้นก็บริหารห้องแล็บ
การมองเห็นของ Stanford
ฉันได้ทำงานร่วมกับพี่เลี้ยง ผู้ทำงาน
ร่วมกันและนักเรียนของฉัน
สอนคอมพิวเตอร์ให้ดู
สาขาการวิจัยของเราเรียกว่า computer 
vision และ machine learning

Modern Greek (1453-): 
Δεν έχουν νόημα από μόνοι τους.
Όπως το να αντιλαμβάνεσαι έναν ήχο
δεν είναι σαν να τον καταλαβαίνεις,
το να βγάζεις φωτογραφίες
δεν είναι το ίδιο με το να βλέπεις,
και λέγοντας «βλέπω»
εννοούμε «καταλαβαίνω».
Πράγματι, η Φύση χρειάστηκε
540 εκατομμύρια χρόνια σκληρής δουλειάς
για να καταφέρει αυτό το έργο,
και η περισσότερη προσπάθεια
αφιερώθηκε στην ανάπτυξη του οπτικού
μηχανισμού του εγκεφάλου μας
και όχι στα ίδια τα μάτια.
Η όραση λοιπόν ξεκινάει με τα μάτια,
αλλά πραγματικά λαμβάνει χώρα
στον εγκέφαλο.
Εδώ και 15 χρόνια, από το διδακτορικό μου
στο Πανεπιστήμιο της Καλιφόρνια
και ύστερα ως επικεφαλής
του κέντρου όρασης του Στάνφορντ,
δουλεύω με τους μέντορες, 
συνεργάτες και φοιτητές μου
προσπαθώντας να μάθω 
τους υπολογιστές να βλέπουν.
Το ερευνητικό μας πεδίο λέγεται
υπολογιστική όραση και μηχανική μάθηση.

Dutch: 
Ze hebben zelf geen betekenis.
Horen is niet hetzelfde als luisteren.
Foto's nemen is niet hetzelfde als zien.
En met zien
bedoelen we echt begrijpen.
Het kostte Moeder Natuur
540 miljoen jaar hard werken
om dit te doen.
Veel van die inspanning
ging zitten in het ontwikkelen
van het verwerkingsgedeelte in ons brein.
Niet de ogen zelf.
Gezichtsvermogen begint bij de ogen,
maar het gebeurt in feite
in de hersenen.
Al 15 jaar, vanaf mijn
promoveren aan Caltech,
en later, toen ik de leiding had
van het Stanford Vision Lab,
werk ik samen met mijn mentoren,
medewerkers en studenten
om computers te leren zien.
Ons onderzoeksgebied heet
computervisie en machine-leren.

Hungarian: 
Ezek nem hordoznak magukban jelentést.
Éppen úgy, ahogy nem ugyanaz 
a hallani, mint a hallgatni,
képet készíteni sem ugyanaz, mint látni,
és a látás alatt tulajdonképpen 
a megértést értjük.
Valójában, az Anyatermészet 
kemény munkát végez 540 millió éve,
ennek a feladatnak az elvégzésével,
és rengeteg fáradozásba került
az agyunk vizuális feldolgozással 
foglalkozó részének a kifejlesztése,
nem a szemek maguk.
A látás a szemekkel kezdődik,
de valójában az agyban megy végbe.
15 éve már, hogy a Caltechnél 
a Ph.D-mtől kezdve,
majd a Stanford Látóképeséggel 
foglalkozó laborját vezetve,
a mentoraimmal, munkatársaimmal 
és tanítványaimmal azon dolgozom,
hogy megtanítsam a számítógépeket látni.
Kutatási területünk a 
számítógépes látás és gépi tanulás.

Turkish: 
Yapay zeka bölümünün genel bir dalı
olarak geçiyordu.
Nihayetinde, makinelere tıpkı bizim gibi
görebilmelerini öğretmek istedik,
nesnelerin isimlendirilmesi, insanların
tanımlanması, 3B geometrileri tahmin
ilişkileri anlama, duygular, olaylar
ve şiddet.
Şu anda insanların, yerlerin ve
eşyaların bütün hikayesini
gözler önüne serip beraber dokuyalım.
Bu amaca doğru atılacak ilk adım
bilgisayara gördüğü şeyleri öğretmek,
sanal dünyanın yapı taşı bu.
Basit anlamda bu öğretme
sürecini bi hayal edin,
bilgisayara belirli bir nesnenin
ya da bir kedinin diyelim
deneme amaçlı resimlerini göstermek
gibi
ve bu resimlerden öğrenilmiş bir model
tasarlamayı.
Bu ne kadar zor olabilir ki?
Sonuç olarak, bir kedi sadece
şekillerin ve renklerin bir derlemesi

Japanese: 
これは人工知能の分野の一部です
最終的に私たちがしたいのは 
機械も人間のようにものを見られるようにすることです
物が何か言い当て 人を識別し 
３次元的な配置を推量し
関係や感情や行動や意図を
理解するということです
私たち人間は一目見ただけで
人 場所 物の織りなす物語全体を
捉えることができます
この目標に向けた第一歩は
コンピュータに視覚世界の構成要素である物を
見られるようにすることです
簡単に言うと
ネコのような特定の物の
訓練用画像を
コンピュータに与えて
それらの画像から学習する
モデルを設計するんです
簡単そうに聞こえますよね？
ネコの画像は色と形の
集まりに過ぎません

Danish: 
Det er en del af det generelle felt
af kunstig intelligens.
Vi vil lære maskiner at se ligesom os:
identificere objekter, mennesker og
udlede 3D geometrien af ting
at forstå relationer, følelser
handlinger og intentioner.
Du og jeg udleder hele historier
af folk, steder og ting
i det sekund vi kigger på dem.
Første skridt mod dette mål er at
lære computere at se objekter,
byggestenene i den visuelle verden.
Enklest sagt, kan du forestille dig
denne lærdomsproces
som at vise computere nogle
træningsbilleder
af et bestemt objekt, f.eks. katte
og designe en model der lærer
af disse træningsbilleder.
Hvor svært kan det være?
En kat er jo en samling af 
former og farver,

Vietnamese: 
Nó là một phần của lĩnh vực chung
- trí thông minh nhân tạo.
Nên một cách tối ưu nhất, chúng tôi muốn 
dạy cho máy móc thấy được như chúng ta:
kể tên đồ vật, nhận diện con người, 
những đồ vật 3D tương tự,
hiểu được những mối quan hệ, 
tình cảm, hành động và cả dự định.
Bạn và tôi cùng nhau dệt nên toàn bộ
câu chuyện về con người -nơi chốn -đồ vật.
giây phút mà chúng ta nhìn thấy chúng.
Bước đầu tiên đạt được mục tiêu này 
là dạy cho máy tính nhìn những đồ vật,
những block nhà của thế giới thị giác.
Nói một cách đơn giản nhất, 
tưởng tượng quá trình dạy học này
bằng cách chỉ cho máy tính
một vài bức ảnh rèn luyện
của những vậy cụ thể, ở đây là con mèo.
và thiết kế một hình mẫu học được
từ những bức ảnh rèn luyện này.
Khó như thế nào nhỉ?
Nói cho cùng, một con mèo là 
tổ hợp của hình dạng và màu sắc,

Russian: 
Это часть области под названием
искусственный интеллект.
Наша главная задача — научить
машины видеть, так как это можем мы:
называть объекты, узнавать людей,
использовать трёхмерную геометрию вещей,
понимать отношения, эмоции,
действия и намерения.
Мы можем создавать целые истории
о людях, местах, вещах —
стоит нам только на них взглянуть.
Первый шаг к этой цели —
научить машины видеть объекты,
стандартные элементы визуального мира.
Простыми словами, процесс обучения —
это демонстрация компьютеру некоторых
обучающих изображений
определённых объектов, например, кошек,
и разработка модели, которая обучается 
на основе данных изображений.
Насколько это может быть сложным?
Кошка — это просто
набор очертаний и цветов,

Korean: 
인공지능 일반 분야에 속하죠.
궁극적으로 우리는 기계가
인간처럼 볼 수 있게 하려고 합니다.
물체와 사람을 식별하고,
3차원 기하구조를 추측하고,
관계, 감정, 행동과 의도를
이해하게 하는 겁니다.
여러분과 저는 한번 보기만 해도
사람, 장소, 사물로
이야기를 엮어낼 수 있습니다.
이런 목표를 향한 첫걸음이
컴퓨터를 가르쳐
사물, 시각 세계의 구성요소를
보게 하는 것입니다.
간단히 말해, 이런 학습 과정을 
상상해보세요.
컴퓨터에 특정 사물의
훈련용 이미지를 보여줍니다.
고양이라고 해보죠.
그리고 그 훈련용 이미지로
학습하는 모델을 설계합니다.
간단하게 들리는데요.
얼마나 어려울 수 있을까요?
고양이는 모양과 색깔의 집합이고,

Portuguese: 
Faz parte do campo mais geral
da inteligência artificial.
Em ultima análise, queremos ensinar
as máquinas a ver, tal como nós vemos:
nomear objetos, identificar pessoas,
inferir a geometria 3D das coisas,
entender relações, emoções,
ações e intenções.
Todos imaginamos e criamos histórias
sobre pessoas, lugares e objetos
mal lhes deitamos a vista em cima.
O primeiro passo para este objetivo
é ensinar um computador a ver objetos,
os blocos de construção do mundo visual.
Na sua forma mais simples, imaginem
este processo de ensinar os computadores
como o ato de lhes mostrar 
imagens de um dado objeto
para treino, por exemplo gatos,
e conceber um modelo que aprende
a partir dessas imagens para treino.
Quão difícil será fazer isto?
Afinal de contas, um gato não é mais
que um conjunto de formas e cores,

Spanish: 
Es parte del campo de 
la inteligencia artificial.
Queremos enseñar a las máquinas
a ver tal como nosotros lo hacemos:
nombrar objetos, identificar personas,
inferir la geometría 3D de las cosas,
entender relaciones, emociones,
acciones e intenciones.
Nosotros tejemos historias completas
de la gente, los lugares y las cosas
simplemente con mirarlas.
El primer paso hacia esta meta es
enseñar a una computadora a ver objetos,
la unidad básica del mundo visual.
En términos más simples,
imaginen este proceso
mostrando a las computadoras
algunas imágenes de entrenamiento
de un objeto en particular,
digamos gatos,
y diseñar un modelo que 
aprenda de estas imágenes.
¿Qué tan difícil puede ser esto?
A fin de cuentas, un gato es solo 
un conjunto de formas y colores,

Modern Greek (1453-): 
Είναι κομμάτι του γενικότερου πεδίου
της τεχνητής νοημοσύνης.
Τελικά, θέλουμε να διδάξουμε τις μηχανές
να δουν ακριβώς όπως εμείς:
να ονομάζουν αντικείμενα, να αναγνωρίζουν
ανθρώπους και αντικείμενα στον χώρο,
να καταλαβαίνουν σχέσεις, συναισθήματα,
δράσεις και προθέσεις.
Εσείς και εγώ συνυφαίνουμε ολόκληρες
ιστορίες ανθρώπων, τόπων και πραγμάτων
τη στιγμή που τα πρωτοβλέπουμε.
Το πρώτο βήμα προς αυτό το στόχο είναι
να μάθουμε τον υπολογιστή να δει πράγματα,
τα δομικά στοιχεία του οπτικού μας κόσμου.
Στην πιο απλή της εκδοχή, φανταστείτε
την εκπαιδευτική διαδικασία ως εξής:
δείχνουμε στον υπολογιστή
μερικές εικόνες εκμάθησης
ενός συγκεκριμένου αντικειμένου,
ας πούμε γάτες,
και σχεδιάζουμε ένα μοντέλο
που μαθαίνει από αυτές τις εικόνες.
Πόσο δύσκολο μπορεί να είναι;
Στο κάτω κάτω, μια γάτα είναι απλά
μια συλλογή από σχήματα και χρώματα,

Ukrainian: 
та машинне навчання, що є складовою
частиною сфери штучного інтелекту.
Тож, в кінцевому рахунку, ми хочемо
навчити машини бачити так само, як ми:
називати об'єкти, розпізнавати людей, 
виводити 3D геометрію речей,
розуміти стосунки, емоції,
дії та наміри.
Ми з вами складаємо 
цілі історії про людей, місця та речі,
лише глянувши на них.
Перший крок до досягнення цієї мети -
навчити комп'ютер бачити об'єкти,
будівельні блоки нашого візуального світу.
Простими словами,
уявіть цей процес навчання,
як демонстрацію комп'ютерам
певних тренувальних зображень
конкретних об'єктів, скажімо, котів,
і розробку моделей, які б навчалися,
споглядаючи ці зображення.
Наскільки це може бути складно?
Адже кіт - це всього лише
сукупність форм і кольорів,

Persian: 
این بخشی از زمینه عمومی تر هوش مصنوعی هست
در نهایت میخواهیم به ماشین ها
یاد بدهیم که ببینند همانند ما:
اسم گذاشتن بر روی اشیا، تشخیص افراد
، استنباط سه بعدی از اشیا
فهم ارتباط، احساسات، اعمال و نیت ها.
من و شما وقتی نگاهمون به آدمها، مکانها
و اشیا میافتد
دربارشون قصه میسازیم.
اولین قدم در راه این هدف این هست
که به رایانه‎ها یاد بدهیم تا اشیا را ببینند؛
سنگ بنای دنیای بصری.
به ساده ترین حالت این فرایند آموزش
را مانند نشان دادن تعدادی
عکس آموزشی از یک شی خاص
مثلا گربه ها به رایانه تصور کنید.
و طراحی یک مدل (برای رایانه)
که ازدیدن این عکسها یاد می‎گیرد.
اینکار چقدر میتونه سخت باشه؟
بالاخره یک گربه مجموعه ایست
از شکل ها و رنگها،

Romanian: 
Face parte din aria generală 
a inteligenței artificiale.
În final vrem să învățăm mașinăriile 
să vadă ca noi:
să denumească obiecte,
să identifice persoane, 
să deducă geometria 3D a lucrurilor,
să înțeleagă relații, emoții, 
acțiuni și intenții.
Noi toţi țesem povești întregi 
despre oameni, locuri și lucruri
în clipa în care le vedem.
Primul pas către acest țel e 
să învățăm computerele să vadă obiectele,
pietrele de temelie ale lumii vizuale.
În cel mai simplu mod, 
imaginați-vă acest proces de învățare
ca arătându-le computerelor 
câteva imagini de antrenament
ale unui obiect, să spunem pisici
și creând un model 
care învață după aceste imagini.
Cât de greu poate fi?
Până la urmă, o pisică 
e doar o colecție de forme și culori,

Chinese: 
這是人工智慧其中一環。
我們的終極目標就是教導機器能夠像人一樣理解所見之物，
像是識別物品、辨認人臉、
推論物體的幾何形態，
進而理解其中的關聯、情緒、動作及意圖。
在座每一位和我，都可以在匆匆一瞥的瞬間，
理解到人事、地、物所交織而成的網絡，
要電腦達成這個目標的第一步，就是教導它辨別物品，
這是視覺的基石。
簡單來說，我們教導的方法就是
給電腦看一些特定物體的影像，
例如貓咪。
我們設計了一個程式讓電腦利用這些影像來學習
這有啥困難？
貓咪不就是由一些幾何圖形和顏色所組成的嘛，

iw: 
זה חלק מתחום כללי יותר 
של אינטלגנציה מלאכותית.
אז בסופו של דבר, אנחנו רוצים 
ללמד את המכונות לראות כמו שאנחנו רואים:
לנקוב בשמות של אובייקטים, לזהות אנשים,
להסיק גיאומטרית תלת מימדית של דברים,
להבין קשרים, רגשות, פעולות וכוונות.
אתם ואני רוקמים ביחד
סיפורים שלמים של אנשים, מקומות ודברים
ברגע שאנחנו מניחים עליהם את המבט שלנו.
הצעד הראשון לכיוון המטרה הזו
הוא ללמד מחשב לראות חפצים,
אבן הבניין של העולם החזותי.
במונחים הכי פשוטים, 
דמיינו את תהליך הלמידה הזה
כלהראות למחשבים 
כמה תמונות אימון של אובייקט מסוים,
בואו נאמר חתולים,
ועיצוב מודל שילמד מתמונות האימון האלו.
כמה קשה זה כבר יכול להיות?
אחרי הכל, חתול הוא פשוט 
אוסף של צורות וצבעים,

Portuguese: 
É parte do campo geral
da inteligência artificial.
Basicamente, queremos ensinar
as máquinas a ver como nós:
nomear objetos, identificar pessoas,
perceber a geometria 3D das coisas,
compreender relações, emoções,
ações e intenções.
Nós tecemos juntos histórias completas
das pessoas, lugares e coisas
no momento em que os vemos.
O primeiro passo rumo a este objetivo,
é ensinar um computador a ver objetos,
o bloco de construção do mundo visual.
De modo bem simples,
imaginem este processo de ensino
como mostrar aos computadores
algumas imagens de treinamento
de um objeto em particular, digamos gatos,
e projetar um modelo que aprenda
a partir destas imagens de treinamento.
Qual é a dificuldade disto?
Afinal de contas, um gato é apenas
uma coleção de forma e cores,

Arabic: 
وهو جزء من المجال العام
في الذكاء الصناعي
ما نريد الوصول إليه هو أن نُعَلّم
الآلات لكي تبصر مثلنا تمامًا
تُسمي الأشياء بأسمائها وتتعرف على الأشخاص
وتستدل على الأبعاد الثلاثية للأسطح
تفهم العلاقات والعواطف
والأفعال والنوايا
أنت وأنا ننسج معا قصصًا كاملة
عن الناس والأماكن والأشياء
في اللحظة التي تقع فيها أبصارنا عليهم
أول خطوة في سبيل تحقيق هذا الهدف
هي أن نلقن الحاسوب كيف يرى الأشياء
اللبِنة الأساسية للعالم المرئي
بأبسط العبارات، تخيل
هذه العملية التلقينية
كأن نُري الحواسيب بعض
الصور التدريبية
لشيء معين، لنفترض قطة
ونصمم نموذجا يمكنه أن يتعلم
من هذه الصور التدريبية
ما هو مبلغ الصعوبة في ذلك؟
ففي النهاية، ما القطة إلا
مجموعة أشكال وألوان

Thai: 
เป็นส่วนหนึ่งของสาขาวิชาปัญญาประดิษฐ์
ดังนั้น ในที่สุดเราต้องการสอนเครื่อง
ให้เห็นเช่นเดียวกับที่เราเห็น
การตั้งชื่อวัตถุ ระบุบุคคล คาดคะเน
รูปทรงเรขาคณิต 3D ของสิ่งของ
เข้าใจความสัมพันธ์ อารมณ์ การกระทำและเจตนา
คุณและฉันสานเรื่องราวทั้งหมดของ
ผู้คน สถานที่ และสิ่งต่างๆ
ขณะที่เราจ้องสายตาของเราไว้
ขั้นตอนแรกสู่เป้าหมายนี้คือ การสอน
คอมพิวเตอร์ให้ดูวัตถุ
โคงสร้างของโลกของภาพ
ในแง่ที่ง่ายที่สุด ลองจินตนาการ
กระบวนการเรียนการสอนนี้
แสดงคอมพิวเตอร์ภาพการฝึกซ้อม
บางอย่าง
ของวัตถุเฉพาะ สมมติว่าเป็นแมว
และการออกแบบรูปแบบที่เรียนรู้จาก
ภาพการฝึกซ้อมเหล่านี้
มันยากขนาดไหน
ท้ายที่สุด แมวเป็นเพียงชุดของ
รูปทรงและสี

Dutch: 
Het is onderdeel van het algemene
gebied van kunstmatige intelligentie.
Uiteindelijk willen we de machines
aanleren wat wijzelf ook doen:
voorwerpen benoemen, mensen herkennen,
ruimtelijke vormen afleiden,
het begrijpen van verhoudingen,
emoties, acties en bedoelingen.
Jullie en ik maken complete verhalen
van mensen, plaatsen en dingen,
op het moment dat we ernaar kijken.
Eerst moeten we de computer leren
voorwerpen te zien,
de bouwsteen van de visuele wereld.
Heel simpel gezegd:
stel je dit leerproces voor
als het aan de computer laten zien
van oefenplaatjes
van bepaalde voorwerpen,
bijvoorbeeld katten,
en ontwerp een model dat leert
van deze oefenplaatjes.
Hoe moeilijk is dat?
Een kat is tenslotte alleen maar
een verzameling vormen en kleuren.

Italian: 
Fa parte del campo 
generale dell'intelligenza artificiale.
Allora in sostanza, vogliamo insegnare
alle macchine a vedere proprio come noi:
indicare cose, riconoscere persone, 
dedurre la geometria 3D degli oggetti,
comprendere relazioni, 
emozioni, azioni e intenzioni.
Tessiamo intere storie
di persone, luoghi e cose
quando fissiamo lo sguardo su di loro.
Il primo passo verso questo scopo è
insegnare a un computer a vedere cose,
il mattone del mondo visivo.
In parole povere immaginate
questo processo d'insegnamento
come mostrare ai computer immagini
di un oggetto specifico, come gatti,
e creare un modello che 
impara da queste immagini.
Quanto può essere difficile?
Dopotutto, un gatto è solo
un insieme di forme e colori,

English: 
It's part of the general field
of artificial intelligence.
So ultimately, we want to teach
the machines to see just like we do:
naming objects, identifying people,
inferring 3D geometry of things,
understanding relations, emotions,
actions and intentions.
You and I weave together entire stories
of people, places and things
the moment we lay our gaze on them.
The first step towards this goal
is to teach a computer to see objects,
the building block of the visual world.
In its simplest terms,
imagine this teaching process
as showing the computers
some training images
of a particular object, let's say cats,
and designing a model that learns
from these training images.
How hard can this be?
After all, a cat is just
a collection of shapes and colors,

Croatian: 
Dio je većeg polja 
umjetne inteligencije.
Naposljetku, želimo naučiti
uređaje da vide kao što mi vidimo:
imenovanje objekata, prepoznavanje ljudi,
razumjevanje trodimenzionalnosti objekata,
razumjevanje odnosa, emocija
akcija i namjera.
Vi i ja vidimo cijele priče
ljudi, mjesta i stvari
u trenutku kada ih pogledamo.
Prvi korak do ovog cilja je
naučiti računala da vide objekte,
građevne jedinice vizualnog svijeta.
U svom najjednostavnijem obliku,
zamislite ovaj proces učenja
kao pokazivanje računalu
raznih prizora za trening
određenog objekta, recimo mačaka,
i dizajniranje modela koji uči
iz ovih prikaza za .
Koliko teško to može biti?
Nakon svega, mačka je samo
skup oblika i boja,

Albanian: 
Është pjesë e fushës së përgjithshme të 
inteligjencës artificiale.
Përfundimisht, ne duam t'i bëjmë 
kompjuterat të shohin ashtu si vetë ne:
të emërtojnë objekte, të identifikojnë 
njerëz, t'i shohin gjërat me 3 dimensione,
të kuptojnë marrdhëniet, emocionet,
veprimet dhe qëllimet.
Ne thurim së bashku histori të tëra
mbi njerëz, vende dhe sende
momentin e parë kur i hedhim një vështrim.
Hapi i parë drejt këtij qëllimi është 
t'i mësojmë kompjuterat të shohin objekte,
baza për ndërtimin e botës vizuale.
Në kushtet më të thjeshta,
imagjinojeni këtë proces
si t'i tregosh kompjuterave
disa imazhe të një objekti të caktuar
për shembull, imazhe te maceve,
dhe të ndërtosh një model që trajnohet
dhe mëson nga këto imazhe.
Sa e vështirë mund të jetë?
Në fund të fundit, një mace është thjesht
një grumbull formash dhe ngjyrash,

Polish: 
Jest to część sztucznej inteligencji.
Chcemy, żeby maszyny widziały tak, jak my,
potrafiły nazwać rzeczy, rozpoznać ludzi,
wskazać ich położenie w przestrzeni,
żeby rozumiały relacje, emocje, 
działania i intencje.
Potrafimy opowiedzieć historię 
o ludziach, miejscach czy rzeczach
w momencie, kiedy na nie spojrzymy.
Żeby osiągnąć ten cel, trzeba nauczyć 
komputer widzenia rzeczy,
klocków, z których składa się świat.
Wyobraźcie sobie ten proces uczenia
jako pokazywanie komputerom
zdjęć konkretnych obiektów, 
na przykład kotów,
i tworzenie modelu 
na podstawie tych obrazów.
Czy to takie trudne?
W końcu kot to tylko zbiór 
kształtów i kolorów.

Czech: 
Je to součástí obecného oboru
o umělé inteligenci.
Chceme naučit stroje,
aby viděly jako my:
pojmenovávat objekty, identifikovat lidi,
odvozovat 3D geometrii věcí,
pochopení vztahů, emocí, akcí a úmyslů.
Vy a já dohromady splétáme celé příběhy
lidí, míst a věcí
v okamžik, kdy je spatříme.
Prvním krokem k dosažení tohoto cíle
je naučit počítače vidět objekty,
základní kameny světa vidění.
Jednoduše řečeno, představte si tento
proces učení
jako ukazování počítačům 
tréninkové obrázky
konkrétního objektu, například koček,
a vytváření modelu, který se učí z těchto
tréninkových obrázků.
Jak těžké to může být?
Vždyť kočka je jen sbírka tvarů a barev

French: 
C'est un pan de la recherche sur 
l'intelligence artificielle.
Le but est d'enseigner aux machines
à voir comme nous :
nommer des objets, identifier des gens,
déduire des formes géométriques 3D,
comprendre les relations, les émotions,
les actions et les intentions.
Nous tissons constamment des histoires
de gens, d'endroits, de choses
dès que nous posons les yeux dessus.
Le premier pas est d'apprendre
à l'ordinateur à voir des objets,
c'est l'élément de base du monde visuel.
Pour parler simplement, imaginez
que ce processus d'apprentissage
consiste à montrer à l'ordinateur
des images d'un certain objet,
par exemple des chats,
puis concevoir un modèle 
qui puisse apprendre avec ces images.
Ça ne doit pas être bien difficile !
Après tout, un chat est un ensemble
de formes et de couleurs.

Hungarian: 
Ez a mesterséges intelligencia 
tudományának a része.
Végső soron meg akarjuk tanítani 
a gépeket úgy látni, ahogy mi látunk:
tárgyak megnevezése, emberek azonosítása,
következtetés a tárgyak 3D-s alakjára,
a kapcsolatok, érzések, 
tevékenységek és szándékok megértése.
Önök és én egész történeteket szövünk 
együtt emberekről, helyekről és dolgokról
abban a pillanatban, 
amikor rájuk pillantunk.
Az első lépés a cél felé, hogy 
megtanítjuk a számítógépeket a tárgyakat,
a képi világ építőköveit látni.
A legegyszerűbben kifejezve, képzeljék el 
ennek a tanításnak a folyamatát:
mutatunk a számítógépeknek 
néhány gyakorló képet
egy bizonyos dologról, 
mondjuk a macskákról
és tervezünk egy modellt, amely tanul 
ezekből a gyakorló képekből.
Milyen nehéz lehet ez?
Végül is, egy macska csak 
színek és formák gyűjteménye,

Chinese: 
这是AI（人工智能）领域的一个分支。
最终，我们希望能教会机器
像我们一样看见事物：
识别物品、辨别不同的人、
推断物体的立体形状、
理解事物的关联、
人的情绪、动作和意图。
像你我一样，只凝视一个画面一眼
就能理清整个故事中的人物、地点、事件。
实现这一目标的第一步是
教计算机看到“对象”（物品），
这是建造视觉世界的基石。
在这个最简单的任务里，
想象一下这个教学过程：
给计算机看一些特定物品的训练图片，
比如说猫，
并让它从这些训练图片中，
学习建立出一个模型来。
这有多难呢？
不管怎么说，一只猫只是一些
形状和颜色拼凑起来的图案罢了，

Turkish: 
ve bu ilk zamanlarda yaptığımız
nesne modellemesi.
Algoritmasını sayısal bir dille
bilgisayara öğretmemiz gerekiyordu
bu kedi yuvarak bir yüze, 
dolgun bir vücuda
iki noktada kulaklara ve uzun bir kuyruğa
sahip
her şey yolunda gibi.
Peki, ya bu kedi?
(Gülüşmeler)
Hepsi iç içe.
Bu nesne için için farklı bir şekil
ve farklı bir bakış açısı eklemeniz gerek.
Peki ya kediler gizlenirse?
Bu absürd kedilere ne demeli?
Şimdi ne demek istediğimi anladınız.
Evdeki kedi gibi basit bir şey için bile
sonsuz çeşitlilikte nesne modellemesi
yapmak mümkün
ve bu sadece bir nesne.
Yaklaşık sekiz yıl önce,
oldukça basit ama yoğun bir gözlem
fikrimi değiştirdi.
Hiç kimse bir çocuğa nasıl görebileceğini
öğretmez,
özellikle de erken yaşlarda.

iw: 
וזה מה שאנחנו עשינו בימים הראשונים
של שימוש כמודל תיאורטי באובייקטים.
היינו אומרים לאלגוריתם של המחשב
בשפה מתמטית
שהפנים של חתול הן עגולות,
גוף שמנמן,
שני אוזניים מחודדות, זנב ארוך,
וזה היה נראה בסדר גמור.
אבל מה עם החתול הזה?
(צחוק)
הוא כולו מכורבל.
עכשיו צריך להוסיף עוד צורה ונקודת מבט
למודל האובייקט.
אבל מה אם חתולים מתחבאים?
מה עם החתולים המטופשים האלו?
עכשיו אתם מתחילים להבין את הנקודה שלי.
אפילו משהו פשוט כמו חיית מחמד ביתית
יכול להציג אינסוף צורות למודל של אובייקט,
וזה רק אובייקט אחד.
אז לפני 8 שנים בערך,
הסתכלות מאוד פשוטה ומעמיקה
שינתה את המחשבה שלי.
אף אחד לא אומר לילד איך לראות,
במיוחד לא בשנים המוקדמות.

Russian: 
и именно этим мы занимались на заре
моделирования объектов.
Посредством математического алгоритма
мы сообщали компьютеру,
что у кошки круглая морда, 
пухленькое тело,
два острых уха и длинный хвост,
и этого было достаточно.
А как насчёт этого кота?
(Смех)
Он изогнут непонятно как.
Нужно добавить ещё одну форму
и точку обзора в модель.
А если кот прячется?
Как насчёт этих смешных котов?
Теперь вы меня понимаете.
Даже простой домашний питомец
может представлять бесконечное число
вариаций в модели объекта,
а это всего лишь один объект.
Где-то восемь лет назад
простое, но значительное наблюдение
изменило ход моих мыслей.
Никто не говорит ребёнку,
как надо видеть,
особенно в ранние годы жизни.

French: 
Au début de la modélisation objet,
c'est ce que nous avons fait.
On rentrait un algorithme 
en langage mathématique
pour dire que le chat a un visage rond,
un corps un peu dodu,
deux oreilles pointues et une longue queue
et tout allait bien.
Mais que fait-on pour celui-ci ?
(Rires)
Il est tout retourné.
Alors il faut ajouter d'autres formes
et points de vue au modèle objet.
Et si le chat est caché ?
Et ces drôles de chats-là ?
Vous voyez ce que je veux dire.
Quelque chose d'aussi simple
qu'un animal domestique
présente une infinité de variations
du modèle objet.
Et ça n'est qu'un seul objet.
Il y a environ 8 ans,
une réflexion toute simple mais profonde
a changé ma manière de penser.
Personne ne dit à un enfant comment voir,
surtout dans les premières années.

Portuguese: 
e foi o que fizemos nos primeiros
tempos da modelação de objetos.
Dizíamos ao algoritmo do computador,
em linguagem matemática,
que um gato tem uma face redonda,
um corpo volumoso,
duas orelhas pontiagudas,
uma cauda comprida,
e esse modelo parecia bem assim.
Mas o que acontece com este gato?
(Risos)
Está todo enrolado.
Agora vamos ter de adicionar
outra forma e perspetiva ao modelo.
E se os gatos estiverem escondidos?
E quanto a estes gatos patetas?
Agora compreendem o meu problema.
Até mesmo algo tão simples
quanto um animal doméstico
pode ter um número infinito
de variações relativamente ao modelo
e estamos a falar de um único objeto.
Então, há cerca de oito anos,
uma observação muito simples e profunda
mudou a minha forma de pensar.
Ninguém diz a uma criança como se vê,
especialmente nos primeiros anos de vida.

Japanese: 
これは初期のオブジェクト・モデリングで
私たちがやっていたことでした
数学的な言語を使って
コンピュータアルゴリズムに
ネコには 丸い顔と
ぽっちゃりした体と
２つのとがった耳と
長いしっぽがあると教え
それでうまくいきそうでした
でもこのネコはどうでしょう？
(笑)
体がすっかり反り返っています
オブジェクトモデルに新しい形と視点を
追加する必要があります
でもネコが一部隠れていたら
どうでしょう？
このおかしなネコたちはどうでしょう？
言いたいこと分かりますよね？
身近なペットのネコという
シンプルなものでさえ
オブジェクトモデルに
無数のバリエーションを定義する必要があり
しかもこれは沢山あるものの
１つに過ぎないんです
８年ほど前
とてもシンプルながら本質的なある観察が
私の考え方を変えました
子供は教えられなくても
成長の初期に
ものの見方を身に付けるということです

Portuguese: 
e foi o que fizemos nos primeiro dias
de modelagem de objetos.
Falamos ao algoritmo computacional,
numa linguagem matemática,
que um gato tem o rosto
arredondado, corpo gordinho,
duas orelhas pontudas e uma cauda longa,
e parecia tudo bem.
Mas, e este gato?
(Risos)
Ele está todo torto.
Agora é preciso adicionar outra forma
e outro ponto de vista ao objeto modelo.
Mas, e se os gatos estiverem escondidos?
E estes gatos bobos?
Agora vocês sabem do que estou falando.
Mesmo algo simples,
como um animal doméstico,
pode apresentar um número infinito
de variações ao objeto modelo,
e isto é só um objeto.
Então, há oito anos,
uma observação bem simples
e profunda mudou o meu pensamento.
Ninguém diz a uma criança como ver,
especialmente nos primeiros anos.

Vietnamese: 
và đây là cái mà chúng tôi đã làm 
ở thời kỳ đầu của việc tạo lập vật thể.
Chúng tôi nói cho máy vi tính thuật toán 
dưới dạng ngôn ngữ toán học
rằng con mèo có mặt tròn, 
một thân hình mũm mĩm,
2 tai nhọn, và một cái đuôi dài,
và cái đó nhìn có vẻ ổn.
Nhưng với con mèo này thì sao?
(Tiếng cười)
toàn là những đường cong lên.
Bây giờ bạn lại có một hình dạng 
và góc nhìn khác đến vật thể khác.
Nhưng nếu như con mèo bị ẩn đi thì sao?
Thế còn những con mèo ngố này ?
Bây giờ bạn đã hiểu ý của tôi rồi đó.
Thậm chí thứ đơn giản
như một vật nuôi trong nhà
cũng có thể mang một con số vô tận 
những thay đổi đối với một vật thể mẫu,
và nó mới chỉ là một vật thể mà thôi.
Vì vậy mà khoảng 8 năm trước,
một sự quan sát đơn giản và sâu sắc 
đã thay đổi suy nghĩ của tôi.
Không ai nói cho một đứa trẻ biết
chúng phải nhìn như thế nào,
đặc biệt là trong những năm đầu đời.

English: 
and this is what we did
in the early days of object modeling.
We'd tell the computer algorithm
in a mathematical language
that a cat has a round face,
a chubby body,
two pointy ears, and a long tail,
and that looked all fine.
But what about this cat?
(Laughter)
It's all curled up.
Now you have to add another shape
and viewpoint to the object model.
But what if cats are hidden?
What about these silly cats?
Now you get my point.
Even something as simple
as a household pet
can present an infinite number
of variations to the object model,
and that's just one object.
So about eight years ago,
a very simple and profound observation
changed my thinking.
No one tells a child how to see,
especially in the early years.

Chinese: 
比如这个就是我们
最初设计的抽象模型。
我们用数学的语言，
告诉计算机这种算法：
“猫”有着圆脸、胖身子、
两个尖尖的耳朵，还有一条长尾巴，
这（算法）看上去挺好的。
但如果遇到这样的猫呢？
（笑）
它整个蜷缩起来了。
现在你不得不加入一些别的形状和视角
来描述这个物品模型。
但如果猫是藏起来的呢？
再看看这些傻猫呢？
你现在知道了吧。
即使那些事物简单到
只是一只家养的宠物，
都可以出呈现出无限种变化的外观模型，
而这还只是“一个”对象的模型。
所以大概在8年前，
一个非常简单、有冲击力的
观察改变了我的想法。
没有人教过婴儿怎么“看”，
尤其是在他们还很小的时候。

Modern Greek (1453-): 
και αυτό ακριβώς κάναμε τα πρώτα χρόνια
της μοντελοποίησης αντικειμένων.
Λέγαμε στον αλγόριθμο του υπολογιστή,
σε μαθηματική γλώσσα,
ότι η γάτα έχει ένα στρογγυλό πρόσωπο,
ένα παχουλό σώμα,
δύο μυτερά αυτιά και μια μακριά ουρά,
και αυτό έμοιαζε μια χαρά.
Αλλά αυτή η γάτα;
(Γέλια)
Είναι κουλουριασμένη.
Τώρα πρέπει να προσθέσουμε άλλο ένα σχήμα
και άλλη μια άποψη στο μοντέλο μας.
Κι αν η γάτα κρύβεται;
Και αυτές οι χαζούλες γάτες;
Βλέπετε το πρόβλημα.
Ακόμα και κάτι τόσο απλό
όσο ένα κατοικίδιο
μπορεί να παρουσιάσει έναν άπειρο αριθμό
παραλλαγών στο μοντέλο,
και αυτό είναι μόνο ένα αντικείμενο.
Πριν από οκτώ χρόνια,
μια πολύ απλή και βαθιά παρατήρηση
άλλαξε τον τρόπο σκέψης μου.
Κανένας δεν λέει σε ένα παιδί πώς να δει,
κυριώς τα πρώτα χρόνια.

Chinese: 
這就是我們初期所做的物體模型。
我們用數學語言來告知電腦演繹方法，
貓就是有圓圓的臉、胖胖的身體，
兩個尖尖的耳朵和一條長尾巴。
看起來很好啊，
但如果貓咪長這樣呢？
(觀眾笑)
全身都捲起來了。
這下子我們又得在原來的模型
加上新的形狀和不同的視野角度。
又，如果貓咪是躲著的呢？
像這群傻貓？
這樣各位了解我的意思嗎？
即使簡單如貓這樣的家庭寵物，
也會有相對於原型以外，無數的其他形態表徵，
而這只是其中一樣。
因此八年前，
一項極其簡單和深刻的觀察，改變了我的想法，
沒有人教導孩子如何去「看」，
特別是在早期發育階段，

Ukrainian: 
і раніше саме так ми і підходили
до моделювання об'єкту.
Ми задавали комп'ютеру алгоритм
математичною мовою,
що кіт має круглу морду,
пухке тіло,
два загострених вуха
і довгого хвоста,
і цього було достатньо.
Але як щодо цього кота?
(Сміх)
Він увесь вигнутий.
Тож потрібно додати іншу форму
та іншу перспективу до моделі об'єкта.
Але що як кіт сховався?
Як щодо цих грайливих котів?
Ви мене зрозуміли.
Навіть така проста річ,
як домашня тварина
може привнести до моделі об'єкту
численну кількість варіацій,
а це ж лише один об'єкт.
Майже вісім років тому,
дуже просте і глибоке спостереження
змінило напрям моїх думок.
Ніхто не говорить дитині, як треба бачити,
особливо у перші роки.

Arabic: 
وهذا ما فعلناه في الأيام الأولى
لعملية نَمْذجة الأشياء
كنا نلقن خوارزمية الحاسوب
بلغة رياضية
أن القطة لها وجه مُدوّر
وجسم مُكْتَنِز
وأذنان مدببتان
وذيل طويل
وبدا ذلك مما لا بأس فيه
لكن ماذا عن هذه القطة؟
(ضحك)
أنها ملتفة حول نفسها
الآن عليك أن تضيف شكلًا
ومنظورًا آخرين للنموذج
لكن ماذا لو كانت القطط مخفية؟
ماذا عن هذه القطط المُضحكة؟
لقد فهمتم الآن ما أعنيه
حتى بالنسبة لشيء بسيط
كحيوان أليف
يمكن أن يقدم عددا لا نهائي
من المتغيرات للنموذج
وهذا مجرد شيء واحد فحسب
لذا منذ حوالي ثمان سنوات
ملاحظة بسيطة ومتعمقة
غيرت تفكيري
لا أحد يُعَلّم الطفل كيف يبصر
خصوصًا في السنوات الأولى

Hungarian: 
és ez az, amit a dolgok modellezésének 
első napjaiban csináltunk.
Matematikai nyelven mondtuk el
a számítógépes algoritmusnak,
hogy egy macskának 
egy kerek arca, pufók teste,
két hegyes füle és egy hosszú farka van,
és úgy tűnt, hogy minden rendben.
De mit szólnak ehhez a macskához?
(Nevetés)
Ez teljesen ki van csavarodva.
Most hozzá kell tenniük egy egész más
formát és nézőpontot a dolog modelljéhez.
De mi van, ha a macskák elbújnak?
Mit szólnak ezekhez a bolond macskákhoz?
Elmondom a véleményemet.
Még ha valami olyan egyszerű is, 
mint egy háziállat,
végtelen sok modellvariációt 
képes felvonultatni,
és ez csak egyetlen objektum.
Így kb. 8 évvel ezelőtt
egy nagyon és mély megfigyelés 
megváltoztatta a gondolkodásomat.
Senki nem mondja meg egy 
gyermeknek, hogy hogyan lásson,
különösen az első években.

Thai: 
และนี่คือสิ่งที่เราทำในวันแรกๆ 
ของการสร้างโมเดลวัตถุ
เราจะบอกอัลกอริธีมของคอมพิวเตอร์
ด้วยภาษาทางคณิตศาสตร์
ว่าแมวมีใบหน้ากลม ลำตัวอ้วน
มีสองหูแหลม และหางยาว
และดูดีทั้งหมด
แต่อะไรเกี่ยวกับแมวตัวนี้ล่ะ
(เสียงหัวเราะ)
มันขดตัว
ตอนนี้ ต้องเพิ่มรูปร่าง -
มุมมองอื่นในโมเดลวัตถุ
แต่ถ้าแมวถูกซ่อนไว้
แล้วแมวโง่เหล่านี้ล่ะ
ตอนนี้คุณเข้าใจแล้ว
แม้บางอย่างง่ายๆ เป็นแบบ
สัตว์เลี้ยงในครัวเรือน
สามารถนำเสนอรูปแบบรูปแบบ
ของวัตถุที่ไม่มีที่สิ้นสุด
และนั่นเป็นเพียงวัตถุเดียว
ดังนั้นประมาณแปดปีที่ผ่านมา
การสังเกตที่ง่ายและลึกซึ้ง
ได้เปลี่ยนความคิดของฉัน
ไม่มีใครบอกเด็กว่าจะดูอย่างไร
โดยเฉพาะอย่างยิ่งในช่วงปีแรกๆ

Korean: 
이것이 우리가 초창기 
객체 모델링으로 한 일이죠.
우리는 컴퓨터 알고리즘을
수학적 언어로 표현합니다.
고양이는 둥근 얼굴과 통통한 몸,
두 개의 뾰족한 귀,
긴 꼬리가 있다고 가르칩니다.
다 괜찮아 보였습니다.
그런데 이 고양이는 어떨까요?
(웃음)
몸을 말고 있습니다.
이제 객체 모델에 다른 모양과 
관점을 추가합니다.
그런데 만약 고양이가 숨어 있으면요?
이런 웃기는 고양이들은요?
이제 제 말을 아시겠죠.
집안의 애완동물처럼 단순한 사물조차
객체 모델에 무한한 변형이 
존재할 수 있고,
그게 한 개의 객체일 뿐이죠.
약 8년 전
단순하고도 깊은 관찰이
제 생각을 바꾸었습니다.
아이에게 보는 법을 가르칠 순 없죠.
특히 어린 시절에 말이죠.

Spanish: 
y eso fue lo que hacíamos en los inicios
de la modelización de objetos.
Decíamos al algoritmo
de la computadora
en un lenguaje matemático
que un gato tiene cara redonda,
cuerpo regordete,
dos orejas puntiagudas
y cola larga,
y así quedaba bien.
Pero ¿qué me dicen de este gato?
(Risas)
Está todo retorcido.
Se debe agregar otra figura y otra 
perspectiva al modelo del objeto.
¿Y si los gatos están escondidos?
¿Qué tal estos gatos tontos?
Ahora entienden mi idea.
Incluso algo tan simple
como una mascota
puede tener un número infinito de 
variaciones en el modelo del objeto,
y eso es solo un objeto.
Así que hace unos 8 años,
una observación simple y profunda
cambió mi perspectiva.
Nadie le dice al niño cómo ver,
menos aún en los primeros años.

Dutch: 
En dit deden we in het begintijd
van het modelleren van voorwerpen.
We moesten de computer
algoritmes leren in een wiskundige taal,
dat een kat een ronde kop heeft,
een mollig lijf,
twee puntoren en een lange staart.
En dat leek goed te gaan.
Maar deze kat dan?
(Gelach)
Die ligt helemaal opgekruld.
Nu moet je nog een vorm en gezichtspunt
toevoegen aan je model.
Maar als katten zijn verstopt?
Deze grappige katten bijvoorbeeld.
(Gelach)
Nu ga je het snappen.
Zelf iets simpels als een huisdier
kan zorgen voor ontelbaar veel
variaties van het model.
Dat is nog maar één voorwerp.
Acht jaar geleden
veranderde een simpele
en grondige observatie mijn denken.
Niemand vertelt aan een kind
hoe het moet kijken.
Zeker niet in de eerste jaren.

Italian: 
e l'abbiamo fatto nella prima 
fase di realizzazione dei modelli.
Abbiamo detto all'algoritmo 
con un linguaggio matematico
che un gatto ha una 
faccia tonda, un corpo paffuto,
due orecchie a punta e una coda lunga,
e fin qui tutto ok.
Ma che dire di questo gatto?
(Risate)
È tutto accartocciato.
Ora si deve aggiungere un'altra 
forma e punto di vista al modello.
Ma se i gatti sono nascosti?
Che dire di questi gatti sciocchi?
Ora mi capite.
Anche qualcosa di semplice 
come un animale domestico
può presentare 
un numero infinito di variazioni,
ed è un oggetto solo.
Allora otto anni fa,
un'osservazione molto semplice 
e profonda ha cambiato il mio parere.
Nessuno dice a un bambino come vedere,
soprattutto nei primi anni.

Croatian: 
i ovo je ono što smo radili
u početcima modeliranja objekta.
Napisali bi računalu algoritme
u matematičkom jeziku
da mačka ima okruglo lice,
debeljuškasto tijelo,
dva šiljata uha i dugačak rep,
i da izgleda lijepo.
ali što je s ovom mačkom?
(Smijeh)
Sva je izvijena.
Sad morate dodati drugi oblik
i pogled modelnom objektu.
Što ako su mačke skrivene?
Što je sa smiješnim mačkama?
Sad vidite što želim reći.
Čak i nešto jednostavno
poput kućnog ljubimca
može imati beskonačan broj
varijacija modelnog objekta,
i to je samo jedan objekt.
Prije osam godina,
vrlo jednostavno i duboko zapažanje
promjenilo mi je razmišljanje.
Nitko ne govori djetetu kako da vidi,
posebno u ranijim godinama.

Romanian: 
iar asta e ce am făcut 
la începutul modelării obiectelor.
Îi spuneam computerului 
într-un limbaj matematic
că o pisică are o față rotundă, 
un corp durduliu,
două urechi ascuțite și o coadă lungă
și totul arăta bine.
Dar ce spuneți de pisica asta?
(Râsete)
E ghemuită toată.
Trebuie adăugată încă o formă
și punct de vedere modelului.
Dar dacă pisicile sunt ascunse?
Dar aceste pisici prostuțe?
Acum mă înțelegeți.
Chiar ceva simplu ca un animal de casă
poate prezenta un număr infinit 
de variații ale modelului,
iar acesta e doar un obiect.
Acum aproximativ opt ani,
o observație foarte simplă și profundă 
mi-a schimbat gândirea.
Nimeni nu-i spune unui copil cum să vadă,
mai ales la început.

Persian: 
و این کاری هست که در روزهای ابتدایی
طراحی اشیا انجام می‎دادیم.
ما به الگوریتم رایانه به زبان ریاضی می‎گوییم
که یک گربه صورت گرد دارد،
بدن تپل دارد،
دو تا گوش تیز دارد و یک دم دراز
و این کافی بود.
ولی این یکی گربه چطور؟
(خنده حضار)
این یکی کاملا خم شده
حالا شما باید یک شکل و 
زاویه دید دیگه به مدل شی اضافه کنید
ولی اگه گربه‎ها قایم شده باشند چی؟
این گربه های بامزه چطور؟
جالا متوجه منظور من می‎شوید.
حتی یک چیز ساده مثل حیوان خانگی
میتونه مدلهای بینهایت 
گونه گون از مدل شی را ارائه کند،
و این تازه فقط یک شی هست.
تقریبا هشت سال پیش
یک مشاهده ساده و عمیق
طرز فکر من را تغییر داد.
کسی به یک کودک نمی‎گه چطور ببیند،
به ویژه در سالهای ابتدایی.

Albanian: 
dhe me këtë mendim ecëm në ditët e hershme
të modelimit të objekteve.
Ne do të përdornim matematikën 
për t'i treguar algoritmit kompjuterik
se një mace ka fytyrë të rrumbullakët,
një trup topolak,
dy veshë me majë, dhe një bisht të gjatë,
dhe çdo gjë dukej mirë.
Po a do të funksiononte me këtë mace?
(Të qeshura)
Është komplet e ngatërruar.
Në këtë rast duhet t'i shtojmë një formë
dhe këndvështrim tjetër modelit të objektit.
Po nëqoftëse macet janë të fshehura?
Po këto mace qesharake?
(Të qeshura)
Tani besoj se e kuptoni ku e kam fjalën.
Edhe diçka kaq e thjeshtë
sa një kafshë shtëpiake
përfaqësohet nga variacione të panumërta
për të krijuar modelin e objektit,
dhe ky është vetëm një rast.
Pra rreth tetë vjet më parë,
një vrojtim mjaft i thjeshtë dhe i thellë
ndryshoi mënyrën time të të menduarit.
Një fëmije askush nuk i mëson si të shohë,
veçanërisht në vitet e para të jetës.

Czech: 
a to je přesně to, co jsme udělali
v začátcích objektového modelování.
Naučili jsme počítače algoritmus
v matematickém jazyce,
že kočka má kulatý obličej,
zaoblené tělo,
dvě špičaté uši, a dlouhý ocas,
a všechno vypadalo dobře.
Ale co třeba tahle kočka?
(Smích)
Je celá pokřivená.
Nyní musíte tedy přidat další tvar a 
pohled danému modelu.
Ale co když jsou kočky schované?
Co tyhle pošetilé kočky?
Teď už mě chápete.
Tak jednoduchá věc jako je
domácí mazlíček
může mít nekonečné množství 
variací objektovému modelu,
a to je to jenom jeden objekt.
Takže před zhruba osmi lety,
jeden prostý, ale pronikavý prostřeh
změnil mé myšlení.
Nikdo neříká dítěti jak má vidět,
obzvláště v raném věku.

Danish: 
og dét er hvad vi gjorde i starten
af objekt modelleringen.
Vi fortalte computer algoritmen i et
matematisk sprog
at en kat har et rundt ansigt,
en fyldig krop,
to spidse ører og en lang hale
og det virkede fint.
Men hvad med denne kat?
(Latter)
Den er helt sammenfoldet.
Nu bliver du nødt til at tilføje en ny
form og udsigtspunkt til objektet.
Men hvad hvis katten er gemt?
Hvad med disse fjollede katte?
Nu ser I problemet.
Selv noget så simpelt som et husdyr
kan lave uendelige variationer
til objekt modelleringen,
og det er kun ét objekt.
For omkring otte år siden
forandrede en meget simpel og dyb
observering min tænkemåde.
Ingen fortæller et barn hvordan det ser,
særlig i de tidligste år.

Polish: 
Tak właśnie traktowaliśmy obrazy 
na początku modelowania obiektowego.
Używając języka matematyki, 
mówiliśmy algorytmowi komputerowemu,
że kot ma okrągłą głowę, puchate ciało,
szpiczaste uszy i długi ogon,
i to brzmiało całkiem dobrze.
Ale co zrobić z takim kotem?
(Śmiech)
On jest cały poskręcany.
Teraz trzeba by dodać nowy kształt 
i punkt widzenia do modelu obiektu.
A jeśli koty będą schowane?
Co zrobić z takimi kotami?
Teraz rozumiecie.
Nawet coś tak banalnego, 
jak zwierzę domowe
może dostarczyć nieskończenie wielu 
wersji modelowi obiektu,
a to nadal tylko jeden obiekt.
Osiem lat temu
proste spostrzeżenie zmieniło 
mój sposób myślenia.
Nikt nie mówi dziecku, jak ma widzieć,
szczególnie we wczesnym dzieciństwie.

Arabic: 
هم يتعلمون من خلال التجارب
والأمثلة في العالم الحقيقي
إذا أخذت في الاعتبار عيني طفل
كزوج من الكاميرات الحيوية
فإنها تلتقط صورة واحدة
كل 200 ميللي ثانية تقريبًا
وهو متوسط الوقت الذي تستغرقه حركة العين
إذن ففي الثالثة من العمر يكون الطفل
قد رأى مئات الملايين من الصور
للعالم الحقيقي
هذا يشكل كمًا كبيرًا من الأمثلة التدريبية
ولذلك فبدلا من التركيز على تحسين
الخوارزميات لوحدها
فَطِنْت لأن أعطي الخوارزميات
نفس النوع من البيانات التدريبية
التي يحصل عليها الطفل من خلال التجارب
من حيث الكمّ والنوع
طالما أننا نعرف ذلك
فقد عرفنا أننا نحتاج أن نجمع مجموعة بيانات
تحتوي على صور أكثر بكثير
مما كنا قد حصلنا عليه من قبل
ربما أكثر بآلاف المرات

Persian: 
اونها این کار را از طریق تجربیات و مثالهای
دنیای واقعی یاد می‎گیرند.
اگر چشمهای یک کودک را مثل
یک جفت دوربین بیولوژیک در نظر بگیرید،
آنها هر ۲۰۰ میلی ثانیه
یک تصویر می‎گیرند،
مدت زمان متوسطی که 
حرکت چشم صورت می‎گیرد.
پس تا سه سالگی یک کودک
صدها میلیون تصویر
از دنیای واقعی دیده
این تعداد زیادی از مثال‎های آموزشی هست.
پس بجای تمرکزصرف بر الگوریتمهای 
بهتر و بهتر
نگرش من این بود که به الگوریتمها 
ـآن دسته از داده‎های آموزشی
که به یک کودک از طریق تجربه داده می‎شود
را در همان حجم و کیفیت بدهیم.
وقتی این را فهمیدیم
متوجه شدیم که
به جمع آوری مجموعه اطلاعات نیاز داریم
که خیلی بیشتر از آنچه تاکنون داشته ایم
عکس داشته باشد،
احتمالا هزاران بار بیشتر،

English: 
They learn this through
real-world experiences and examples.
If you consider a child's eyes
as a pair of biological cameras,
they take one picture
about every 200 milliseconds,
the average time an eye movement is made.
So by age three, a child would have seen
hundreds of millions of pictures
of the real world.
That's a lot of training examples.
So instead of focusing solely
on better and better algorithms,
my insight was to give the algorithms
the kind of training data
that a child was given through experiences
in both quantity and quality.
Once we know this,
we knew we needed to collect a data set
that has far more images
than we have ever had before,
perhaps thousands of times more,

iw: 
הם לומדים דרך הנסיון 
בעולם האמיתי ודוגמאות.
אם תתייחסו לעיניים של ילד
כזוג מצלמות ביולוגיות
הן לוקחות תמונה אחת 
בערך כל 200 אלפיות השנייה,
הזמן הממוצע של תנועת עין.
אז עד גיל שלוש, ילד יראה 
מאות מיליוני תמונות
של העולם האמיתי.
זה הרבה דוגמאות אימון.
אז במקום להתרכז אך ורק על אלגוריתמים 
טובים יותר ויותר,
התובנה שלי היתה לתת לאלגוריתמים
את סוג מידע האימון
שילד מקבל דרך ניסיון
גם בכמות וגם באיכות.
ברגע שאנחנו יודעים את זה,
ידענו שאנחנו צריכים לאסוף מערכת מידע
שיש בה הרבה יותר תמונות
ממה שהיו לנו אי פעם,
אולי פי כמה אלפים יותר,

Dutch: 
Ze leren het via ervaringen en voorbeelden
uit het echte leven.
Bekijk de ogen van kinderen eens
als een paar biologische camera's.
Ze nemen elke 200 milliseconden een foto,
de gemiddelde tijd van een oogbeweging.
Als het drie is, heeft een kind
honderden miljoenen beelden gezien
van de echte wereld.
Dat zijn heel wat oefenvoorbeelden.
In plaats van je alleen te richten op
steeds betere algoritmes,
zag ik in dat je de algoritmes
de oefengegevens moest geven
dat een kind ook krijgt door ervaring.
Zowel qua kwantiteit als kwaliteit.
Toen we dat wisten,
wisten we dat we een verzameling 
gegevens moesten maken
die veel meer plaatjes bevat
dan wij ooit hebben gehad.
Misschien wel duizenden keren meer.

Thai: 
เด็กเรียนรู้ผ่านประสบการณ์
และตัวอย่างแห่งความเป็นจริง
ถ้าคุณพิจารณาดวงตาของเด็ก
เป็นกล้องชีวภาพหนึ่งคู่
กล้องถ่ายภาพทุกๆ 200 มิลลิวินาที
เวลาเฉลี่ยที่เกิดจากการเคลื่อนไหว
ของตา
ดังนั้นเมื่ออายุสามขวบ เด็กๆ 
จะได้เห็นภาพหลายร้อยภาพ
ในโลกแห่งความจริง
นี่เป็นตัวอย่างการฝึกมากมาย
ดังนั้น แทนที่จะเน้นเฉพาะ
อัลกอริธึมที่ดีและดีขึ้น
ข้อมูลเชิงลึกของฉันคือ การให้
อัลกอริทึมเป็นแบบข้อมูลการฝึกซ้อม
ว่าเด็กได้ผ่านประสบการณ์
ทั้งในด้านปริมาณและคุณภาพ
เมื่อเรารู้เรื่องนี้แล้ว
เรารู้ว่า เราจำเป็นต้องรวบรวมชุดข้อมูล
ที่มีภาพไกลเกินกว่าที่เราเคยมีมาก่อน
บางที อีกหลายพันครั้ง

Spanish: 
Ellos aprenden a través de ejemplos
y experiencias del mundo real.
Si consideramos los ojos de un niño
como un par de cámaras biológicas,
toman una foto cada 200 milisegundos,
el tiempo promedio en que el ojo
hace un movimiento.
Entonces, a los 3 años un niño ha visto
cientos de millones de fotografías
del mundo real.
Esos son muchos ejemplares
de entrenamiento.
Así que en lugar de enfocarnos
solo en mejorar los algoritmos,
mi intención fue dotar a los algoritmos
con los datos de entrenamiento
que un niño adquiere con la experiencia
tanto en cantidad como en calidad.
Al conocer esto
supimos que necesitábamos recolectar
muchas más imágenes que nunca,
tal vez miles de veces más;

French: 
Il apprend par l'expérience,
par des exemples quotidiens.
Pensez aux yeux d'un enfant
comme à deux appareils photo biologiques
qui prennent une photo 
chaque 200 millisecondes,
la durée moyenne du mouvement de l’œil.
A 3 ans, un enfant a vu 
des centaines de millions de photos
du monde réel.
Ça nous fait beaucoup d'exemples.
Alors plutôt que se concentrer
sur l'amélioration des algorithmes,
mon idée a été de former les algorithmes
avec le genre de données
qu'un enfant reçoit par l'expérience
tant en quantité qu'en qualité
Une fois que nous avons compris ça,
nous savions qu'il fallait collecter
un ensemble de données
qui contienne bien plus d'images
que jamais auparavant,
peut-être des milliers de fois plus.

Portuguese: 
Elas aprendem através das experiências
e exemplos do mundo real.
Se considerarmos os olhos de uma criança
como um par de câmeras biológicas,
eles tiram uma foto
a cada 200 milissegundos,
o tempo médio em que o movimento
do olho é feito.
Então, aos três anos, uma criança
terá visto centenas de milhões de fotos
do mundo real.
São muitos exemplos de treinamento.
Então, em vez de focar 
somente algoritmos melhores,
minha ideia foi dar-lhes
os tipos de dados de treinamento
que uma criança obtém
através das experiências,
tanto em quantidade quanto em qualidade.
Uma vez compreendendo isso,
sabíamos que precisávamos
coletar um conjunto de dados
que tivesse mais imagens
do que tínhamos antes,
talvez milhares de vezes mais,

Croatian: 
Oni to uče kroz
iskustvo i primjere iz stvarnog svijeta.
Ako smatrate dječje oči
parom bioloških kamera,
one fotografiraju
svakih 200 milisekundi,
prosječno vrijeme koliko je potrebno
za pokret oka.
Do svoje treće godine, dijete bi vidjelo
stotine milijuna slika
stvarnog svijeta.
To je puno primjera za vježbu.
Umjesto fokusiranja samo na
sve bolje i bolje algoritme,
mislila sam dati algoritmima
nekakakve podatke za vježbu
koje je dijete dobijalo kroz iskustva
i to kvantitativno i kvalitativno.
Jednom kada znamo ovo,
znali smo da moramo skupiti skup podataka
koji ima puno više prikaza 
no što smo mi imali ikad prije,
možda i tisuću puta više,

Albanian: 
Ato mësojnë përmes eksperiencave 
dhe shembujve.
Nëse i mendojmë sytë e një fëmije
si aparate fotografike biologjike,
ato kapin një foto çdo 200 millisekonda,
që është shpejtësia mesatare e 
lëvizjes së syrit.
Kështu deri në moshën tre-vjeçare, 
një fëmijë ka parë qindra miliona foto
të botës reale.
Këto janë shumë shembuj trajnues.
Pra, në vënd që të fokusohemi vetëm te
përmirësimi i algoritmave,
ideja ime ishte t'i ushqenim dhe trajnonim
algoritmat me atë tip të dhënash
që një fëmijë merr përmes eksperiences
në cilësi dhe sasi.
Me këtë ide,
e dinim se na duhej të mblidhnim 
një grup të dhënash
që përmban shumë më tepër imazhe 
seç mund të kemi patur ndonjëherë,
ndoshta njëmijë herë më shumë,

Chinese: 
他们是从真实世界的经验
和例子中学到这个的。
如果你把孩子的眼睛
都看作是生物照相机，
那他们每200毫秒就拍一张照。
——这是眼球转动一次的平均时间。
所以到3岁大的时候，一个孩子已经看过了
上亿张的真实世界照片。
这种“训练照片”的数量是非常大的。
所以，与其孤立地关注于
算法的优化、再优化，
我的关注点放在了给算法
提供像那样的训练数据
——那些，婴儿们从经验中获得的
质量和数量都极其惊人的训练照片。
一旦我们知道了这个，
我们就明白自己需要收集的数据集，
必须比我们曾有过的任何数据库都丰富
——可能要丰富数千倍。

Czech: 
Naučí se to pomocí skutečných
životních zkušeností a příkladů.
Když si představíte dětské oči
jako pár biologických foťáků,
vyfotí jeden obrázek každých 
200 milisekund,
což je průměrný čas, za který
se oko pohne.
Takže ve třetím roce dítě
vidělo stovky milionů obrázků
skutečného světa.
To je celkem hodně tréninkových příkladů.
Místo cílení na lepší algoritmy,
můj nápad byl dát algoritmům taková
tréninková data,
jaká byla dána dítěti skrze zkušenosti
jak množstevně, tak kvalitou.
Jakmile jsme toto pochopili,
věděli jsme, že potřebujeme sehnat
sadu dat,
která má v sobě mnohem více obrázků,
než jsme kdy měli,
možná i tisíckrát více,

Hungarian: 
A valós világ tapasztalatain és példáin 
keresztül tanulják ezt meg.
Ha egy gyermek szemeit
egy pár biológiai kamerának tekintjük,
ezek körülbelül 200 ezredmásod-
percenként készítenek egy képet,
ez az átlagos időtartama 
egy szemmozdulatnak.
Így hároméves korára egy gyermek 
több száz millió képet lát
a valós világról.
Az rengeteg gyakorló példa.
Így a kizárólag az egyre jobb 
algoritmusokra koncentrálás helyett,
úgy éreztem, hogy az adatok begyakorlására
alkalmas algoritmusokat kellene adnom,
ahogy egy gyermeknek, 
a tapasztalatokon keresztül
minőségben és mennyiségben egyaránt.
Amint ezt felismertük,
rögtön tudtuk, hogy gyűjtenünk 
kell egy adathalmazt,
ami sokkal több képet fog tartalmazni, 
mint amennyivel valaha is rendelkeztünk,
talán több ezerszer többet,

Japanese: 
子供は現実の世界における
経験と例を通して学ぶのです
子供の目が
生きたカメラで
200ミリ秒ごとに１枚
写真を撮っていると
考えてみましょう
これは目が動く
平均時間です
すると子供は３歳になるまでに 
何億枚という
現実世界の写真を
見ていることになります
膨大な量の訓練例です
それで気が付いたのは 
アルゴリズムの改良ばかりに集中するのではなく
子供が経験を通じて
受け取るような
量と質の訓練データを
アルゴリズムに与えてはどうか
ということでした
このことに気付いた時
私たちが持っているよりも
遙かに多くの画像データを
集めなければならないことが
明らかでした
何千倍も必要です

Vietnamese: 
Chúng học hỏi qua những trãi nghiệm 
thế giới thực và qua những ví dụ.
Nếu như bạn xem xét
đôi mắt của một đứa trẻ
như một cặp máy quay phim sinh học
chúng chụp một ảnh trong mỗi 200 mili giây
khoảng thời gian trung bình
một cử động mắt được thực hiện.
Vì vậy mà đến ba tuổi, một đứa trẻ
có thể đã nhìn hàng triệu những bức ảnh
của thế giới thực.
Đó là rất nhiều những ví dụ rèn luyện.
Nên thay vì chú trọng vào mỗi việc 
làm cho thuật toán ngày một tốt hơn
ý định của tôi là cho những thuật toán
một dạng rèn luyện dữ liệu
mà một đứa trẻ có được nhờ kinh nghiệm
về cả lượng cả chất.
Một khi chúng tôi nhận ra điều này,
chúng tôi biết mình
cần phải thu thập một cơ sở dữ liệu
có nhiều hình ảnh hơn những gì 
mà chúng tôi đã từng có trước đây,
thậm chí là gấp hàng ngàn lần nữa,

Chinese: 
他們是從真實世界的經驗中學習。
如果你把孩童的眼睛
當成生物相機的概念，
就如同每200毫秒就拍一張照片一樣，
這是眼球移動的平均時間。
年紀到了三歲時，
孩子們已經看過了真實世界中
數以百萬計的照片，
這樣的訓練範例是很大量的。
因此，我的直覺告訴我
應該以孩童的學習經驗法則，
並兼以質與量，
提供訓練的資料給電腦，
而非一昧追求更好的程式演算。
有了上述的洞見，
我們接下來必須要收集
前所未有的大量資料群，
甚至於是千倍以上的。

Russian: 
Он учится этому на реальных примерах.
Если предположить, что глаза ребёнка —
это пара биологических камер,
то они делают один снимок 
каждые 200 миллисекунд, —
среднее время движения глазного яблока.
К трём годам ребёнок уже увидит 
сотни миллионов изображений
окружающего мира.
Это очень много обучающих примеров.
И вместо того, чтобы улучшать алгоритмы,
я предложила предоставить этим алгоритмам
такую же обучающую информацию,
которую через опыт получает ребёнок,
в таком же количестве и качестве.
Как только мы это осознали,
мы поняли, что нам нужно было
собрать базу данных,
содержащую намного больше изображений,
чем когда-либо ранее,
возможно, в тысячи раз больше.

Ukrainian: 
Вони навчаються цьому через
досвід та на прикладах з реального світу.
Якщо розглядати очі дитини
як пару біологічних камер,
вони сприймають одне зображення
приблизно кожних 200 мілісекунд,
середній час для руху ока.
Тож до трирічного віку дитина побачить
сотні мільйонів зображень
реального світу.
Це дуже багато учбових прикладів.
Тож, замість того, щоб зосереджуватися
виключно на покращенні алгоритмів,
мій здогад полягає в тому, щоб дати
алгоритмам певний вид тренувальних даних,
кількісно і якісно схожих на ті, 
які дитина отримує через досвід.
Як тільки ми це зрозуміли,
нам необхідно було
зібрати сукупність даних,
яка включатиме в себе значно більше 
зображень, ніж ми мали до цього,
можливо, в тисячі разів більше.

Modern Greek (1453-): 
Μαθαίνουν μέσα από εμπειρίες και
παραδείγματα του πραγματικού κόσμου.
Αν σκεφτούμε τα μάτια του παιδιού
σαν ένα ζευγάρι από βιολογικές κάμερες,
βγάζουν περίπου μία φωτογραφία
κάθε 200 χιλιοστά του δευτερολέπτου,
που είναι ο μέσος χρόνος που χρειάζεται
για μια κίνηση του ματιού.
Έτσι, ένα παιδί τριών ετών θα έχει δει
εκατοντάδες εκατομμύρια φωτογραφίες
του πραγματικού κόσμου.
Αυτά είναι πολλά παραδείγματα εκμάθησης.
Αντί λοιπόν να εστιάζουμε μόνο σε
ολοένα και καλύτερους αλγόριθμους,
η ιδέα μου ήταν να δώσω στους αλγόριθμους
το είδος των εκπαιδευτικών δεδομένων
που ένα παιδί αποκτά μέσω εμπειρίας
τόσο σε ποσότητα όσο και σε ποιότητα.
Όταν το καταλάβαμε
ξέραμε ότι έπρεπε να συλλέξουμε
ένα σετ δεδομένων
που περιείχε πολύ περισσότερες φωτογραφίες
από όσες είχαμε προηγουμένως,
ίσως χιλιάδες φορές περισσότερες,

Danish: 
De lærer dette gennem virkelige 
erfaringer og eksempler.
Hvis man ser et barns øjne
som et par biologiske kameraer
tager de et billede ca. hver
200 millisekunder,
gennemsnitstiden for hver bevægelse
i øjnene.
Ved tre-årstiden vil et barn have set
hundrede mio. billeder
af den virkelige verden.
Det er mange træningseksempler.
Istedet for kun at fokusere på
bedre og bedre algoritmer
var min indsigt at give algoritmerne
den slags træningsdata
som et barn får gennem erfaringer
både i kvalitet og kvantitet.
Når vi ved dette,
kan vi begynde at samle et data sæt
som har langt flere billeder
end vi før har haft,
måske tusindvis af gange mere,

Italian: 
Lo imparano con 
esperienze e esempi del mondo reale.
Se considerate gli occhi di un bambino
come un paio di fotocamere biologiche,
scattano una foto ogni 200 millisecondi,
il tempo medio di 
un movimento dell'occhio.
Dunque entro i 3 anni, un bambino 
vede centinaia di migliaia di immagini
del mondo reale.
Questi sono tanti esempi d'insegnamento.
Così invece di concentrarci 
solo su algoritmi sempre migliori,
la mia idea era dare 
agli algoritmi dati d'insegnamento
come quelli che 
un bambino ottiene con le esperienze
con la stessa qualità e quantità.
Una volta capito questo,
dovevamo accumulare un set di dati
che aveva più immagini che mai,
forse migliaia di volte di più,

Turkish: 
Gerçek dünya tecrübeleri ve örnekleriyle
öğrenirler bunu.
Bir çocuğun gözlerini düşünecek olursanız
sanki bir çift biyolojik kameraymış gibi,
yaklaşık her 200 milisaniyede
bir fotoğraf çekerler,
göz hareketinden oluşmuş ortalama
bir zaman dilimi.
Yani üç yaşında bir çocuk, gerçek hayatta
yüz milyonlarca
fotoğraf görmüş olacak.
Bu oldukça fazla deneme örneği.
Sadece daha iyi algoritmalara
odaklanmak yerine,
sezilerim algoritmalara bir tür
eğitici veri vermek üzerineydi,
tıpkı bir çocuğa sayıca ve kalitece
deneyimleri yoluyla verilmiş gibi.
Bunu anlayınca,
bir tür veri havuzuna
sahip olduğumuz resimlerden daha
fazla, hatta binlerce kat daha fazla
ihtiyacımız olduğunu biliyorduk.

Polish: 
Dzieci uczą się tego przez 
doświadczanie świata.
Jeśli potraktować dziecięce oczy
jako parę biologicznych aparatów,
to robią one zdjęcie co 200 milisekund,
co jest średnim czasem ruchu oka.
Zanim skończy 3 lata, 
dziecko może zobaczyć
setki milionów obrazów realnego świata.
To bardzo dużo przykładów.
Zamiast skupiać się wyłącznie
na ulepszaniu algorytmów,
wolałam podać im dane treningowe 
podobne do tych,
które otrzymuje małe dziecko 
poznające świat,
zarówno pod względem ilościowym, 
jak i jakościowym.
Kiedy się na to zdecydowaliśmy,
wiedzieliśmy, że musimy zebrać
dużo więcej zdjęć, niż mieliśmy dotąd,
może nawet tysiące razy więcej.

Romanian: 
Învață asta prin experiențe și exemple 
din lumea reală.
Dacă considerați ochii copilului
ca o pereche de camere biologice,
acestea fac o poză 
la fiecare 200 milisecunde,
– durata medie a unei mișcări oculare.
Până la 3 ani, un copil ar fi văzut
sute de milioane de poze cu lumea reală.
Astea sunt multe exemple de antrenament.
Astfel în loc să ne axăm doar 
pe algoritmi din ce în ce mai buni,
m-am gândit să ofer algoritmilor 
tipul de date
primite de copil prin experiență,
atât cantitativ cât și calitativ.
Plecând de la asta știam că trebuie
să construim o bază de date
ce are mult mai multe imagini 
decât am avut înainte,
probabil de mii de ori mai multe,

Korean: 
아이들은 현실세계의 경험과 
사례로 보는 법을 배웁니다.
만약 아이의 눈을
생물학적 카메라 한쌍이라 치면
200밀리초마다 한 장씩 
사진을 찍는 셈이죠.
눈이 움직이는 평균 시간이에요.
아이는 세 살까지 수억장의 
현실세계 사진을 보게 됩니다.
방대한 양의 학습 사례죠.
그래서 제 생각엔 더 나은 
알고리즘에만 집중하기보다,
알고리즘에 주는 학습 데이터를
아이가 경험하는 것과 같이
만들어야 했습니다.
양적으로나 질적으로 말이죠.
이걸 알게 되자,
우리는 이전보다 훨씬 많은 
데이터를 모아야 했습니다.
거의 수천배였죠.

Portuguese: 
As crianças aprendem isso através
de experiências e exemplos da vida real.
Se considerarmos os olhos de uma criança
como duas máquinas fotográficas biológicas,
elas tiram uma fotografia a cada
200 millisegundos aproximadamente,
o tempo médio que demora
um movimento ocular.
Assim, aos três anos, uma criança
terá visto centenas de milhões de imagens
do mundo real.
São imensos exemplos para treino.
Deste modo, em vez de me focar apenas
em algoritmos cada vez melhores,
a minha ideia foi treinar os algoritmos
com o mesmo tipo de dados
que uma criança recebe
através das suas experiências,
tanto em quantidade como qualidade.
Depois de percebermos isto,
sabíamos que teríamos de reunir
um conjunto de dados
com muito mais imagens
do que alguma vez tínhamos tido,
talvez mesmo milhares de vezes mais.

Chinese: 
於是我與普林斯頓大學的李凱教授
共同於2007年開始了
我們稱之為 ImageNet 的專案。
很幸運地，我們不必在頭上綁一個相機，
然後花費數年收集影像，
而是轉而由網際網路，
這個由人類所創造出來 龐大的影像寶窟，
我們下載了數以百萬計的影像，
並且使用如Amazon Mechanical Turk 
這樣的群眾外包平台，
來協助我們處理及分類這些照片。
在高峰期，ImageNet 甚至是整個亞馬遜平台
最大的雇主之一，
我們一共聘請了來自167個國家，
約5萬個工作者，
來協助我們分類處理並標示
將近10億幅影像，
花費了這麼多的資源，
就是為了捕捉那一絲絲

Spanish: 
y junto con el profesor Kai Li
en la Universidad de Princeton,
lanzamos el proyecto ImageNet en 2007.
Por suerte, no tuvimos que ponernos
una cámara en la cabeza
y esperar muchos años.
Entramos a Internet,
el banco de imágenes más grande
creado por la humanidad.
Descargamos casi 
1000 millones de imágenes
y usamos tecnología de crowdsourcing
como la plataforma Amazon Mechanical Turk
para etiquetar estas imágenes.
En su mejor momento, ImageNet fue
uno de los empleadores más importantes
de trabajadores en 
Amazon Mechanical Turk:
Casi 50 000 trabajadores
de 167 países del mundo
nos ayudaron a limpiar,
separar y etiquetar
casi 1000 millones 
de imágenes candidatas.
Se necesitó todo ese esfuerzo
para capturar apenas una fracción
de todas las imágenes

Persian: 
و با همکاری پرفسور کای لی
در دانشگاه پرینستون
ما پروژه ImageNet را
در سال ۲۰۰۷ راه اندازی کردیم.
خوشبختانه احتیاج نداشتیم
که یک دوربین روی سرمان نصب کنیم
و سالها منتظر بمانیم.
رفتیم سراغ اینترنت
بزرگترین گنجینه عکسها
که انسانها تاکنون آفریده اند.
نزدیک به یک میلیارد عکس دانلود کردیم
و از فناوری CrowdSourcing
همانند Amazon Mechanical Turk platform
استفاده کردیم تا برای برچسب زدن این
عکسها به ما کمک کند.
در اوج خودش، ImageNet 
از بزرگترین کارفرماهای
Amazon Mechanical Turk بود
در مجموع تقریبا ۵۰٫۰۰۰ کارمند
از ۱۶۷ کشور جهان
به ما کمک کردند تا
نزدیک به یک میلیارد عکس منتخب را
اصلاح، منظم و برچسب گذاری کنند.
این میزانی بود که زحمت برد
برای ثبت کسری از تصویرگری که

Chinese: 
因此，通过与普林斯顿大学的
Kai Li教授合作，
我们在2007年发起了
ImageNet（图片网络）计划。
幸运的是，我们不必在自己脑子里
装上一台照相机，然后等它拍很多年。
我们运用了互联网，
这个由人类创造的
最大的图片宝库。
我们下载了接近10亿张图片
并利用众包技术（利用互联网分配工作、发现创意或
解决技术问题），像“亚马逊土耳其机器人”这样的平台
来帮我们标记这些图片。
在高峰期时，ImageNet是「亚马逊土耳其机器人」
这个平台上最大的雇主之一：
来自世界上167个国家的
接近5万个工作者，在一起工作
帮我们筛选、排序、标记了
接近10亿张备选照片。
这就是我们为这个计划投入的精力，

Modern Greek (1453-): 
και μαζί με τον καθηγητή Κάι Λι
στο Πανεπιστήμιο του Πρίνστον
ξεκινήσαμε το πρόγραμμα ImageNet το 2007.
Ευτυχώς, δε χρειάστηκε 
να φορέσουμε κάμερες στο κεφάλι μας
και να περιμένουμε πολλά χρόνια.
Πήγαμε στο Διαδίκτυο,
το μεγαλύτερο θησαυροφυλάκιο εικόνων
που έχουν ποτέ κατασκευάσει οι άνθρωποι.
«Κατεβάσαμε» σχεδόν
ένα δισεκατομμύριο εικόνες
και χρησιμοποιήσαμε τεχνολογίες «υπηρεσιών
πλήθους» όπως η πλατφόρμα της Άμαζον
για να μας βοηθήσουν να ονομάσουμε
αυτές τις εικόνες.
Στην αιχμή του, το ImageNet ήταν
ένας από τους μεγαλύτερους εργοδότες
της πλατφόρμας της Άμαζον:
όλοι μαζί, σχεδόν 50.000 εργαζόμενοι
από 167 χώρες από όλο τον κόσμο
μας βοήθησαν να καθαρίσουμε,
να κατατάξουμε και να ονομάσουμε
σχεδόν ένα δισεκατομμύριο 
υποψήφιες φωτογραφίες.
Τόση προσπάθεια χρειάστηκε
για να καταγράψουμε 
ένα ψήγμα των παραστάσεων

Croatian: 
i zajedno s profesorom
Kai Li na sveučilištu Princeton,
2007. lansirali smo ImageNet projekt.
Sva sreća nismo morali montirati
kamere na naše glave
i čekati godinama.
Otišli smo na Internet,
najveću riznicu slika koju je
čovječanstvo stvorilo.
skinuli smo skoro
milijardu slika i
koristili crowdsourcing tehnologiju
poput platforme Amazon Mechanical Turk
da označimo te prikaze.
Kako je raslo, ImageNet je bio jedan od
najvećih poslodavaca
radnika Amazon Mechanical Turk-a:
zajedno, skoro 50.000 radnika
iz 167 država svijeta
pomoglo nam je da očistimo, 
sortiramo i označimo
skoro milijardu korisnih prikaza.
Toliko truda je trebalo
da se uhvati dio prikaza

Portuguese: 
Juntamente com o Professor Kai Li
na Universidade de Princeton,
iniciámos o projeto ImageNet, em 2007.
Felizmente, não precisámos de montar
uma câmara na cabeça
e esperar vários anos.
Recorremos à Internet,
o maior tesouro de imagens 
que o Homem alguma vez criou.
Descarregámos cerca 
de mil milhões de imagens
e utilizámos tecnologias
de contribuição voluntária,
como a plataforma Amazon Mechanical Turk,
para nos ajudar a rotular essas imagens.
No seu auge, o ImageNet
era um dos maiores empregadores
da Amazon Mechanical Turk.
No total, quase 50 mil trabalhadores
de 167 países de todo o mundo
ajudaram-nos a limpar, ordenar e rotular
cerca de mil milhões
de imagens candidatas.
Foi quanto custou captar
uma fração de todas as imagens

Russian: 
В 2007 году я и профессор Кай Ли
из Принстонского университета
запустили проект ImageNet.
К счастью, нам не пришлось
устанавливать камеру себе на голову
и ждать много лет.
Мы использовали интернет —
кладезь изображений, самую большую
из созданных человечеством.
Мы скачали почти миллиард изображений
и для их описания применили
краудсорсинг-платформу
Amazon Mechanical Turk.
На пике активности ImageNet была одним
из самых популярных работодателей
для сотрудников Amazon Mechanical Turk:
порядка 50 000 работников
из 167 стран мира
помогли нам привести в порядок,
отсортировать и описать
почти миллиард изображений-кандидатов.
Вот сколько потребовалось усилий,
чтобы охватить лишь малую часть 
той базы изображений,

Korean: 
그래서 전 프린스턴 대학의
카이 리 교수와 함께
2007년 이미지넷 프로젝트를
시작했습니다.
다행히도 우리는
머리에 카메라를 매달고
몇년씩 기다릴 필요는 없었습니다.
인터넷이 있었거든요.
인류가 만든 최대의 사진 창고죠.
우리는 거의 10억장의 이미지를
다운로드했고
아마존 MTurk 같은
크라우드 소싱 기술을 사용해
이미지에 라벨을 붙였습니다.
가장 최고치에서는 이미지넷이
아마존 MTurk 일꾼들의 
최대 고용주였습니다.
5만명 가까운 작업자가
세계 167개국에서
약 10억장의 후보 이미지의
정리 분류 작업을 도왔습니다.
아이의 성장 초기에
이미지의 일부라도 수집하는데

Albanian: 
dhe së bashku me Profesorin
Kai Li të Universitetit Princeton,
ne nisëm projektin ImageNet në 2007.
Për fat të mirë, nuk na u desh të montonim
një aparat fotografik në kokë
dhe të prisnim për shumë vite.
Ne iu drejtuam internetit,
thesari më i madh i fotove
që njerëzit kanë krijuar ndonjëherë.
Shkarkuam rreth një bilion imazhe
dhe përdorëm crowdsourcing, teknologjinë 
e kontributit të përbashkët online
si platformën Amazon Mechanical Turk, për 
të na ndihmuar në etiketimin e imazheve.
Në majat e veta, ImageNet ishte një nga
punëdhënësit më të mëdhenj
të punonjësve të Amazon Mechanical Turk:
së bashku, gati 50,000 punonjës
nga 167 shtete nga e gjithë bota
na ndihmuan të përzgjidhnim, 
të klasifikonim dhe të etiketonim
rreth nje bilion imazhe potenciale.
Kjo ishte puna që u desh
për kapjen e çdo fraksioni të
shëmbëlltyrës

Romanian: 
iar împreună cu profesorul Kai Li 
de la Princeton University
am lansat proiectul ImageNet în 2007.
Din fericire, nu a trebuit să 
ne montăm o cameră pe cap
și să așteptăm mulți ani.
Am apelat la Internet,
cel mai mare tezaur de poze 
creat vreodată de oameni.
Am descărcat aproape un miliard de imagini
și am folosit tehnologii ca platforma 
Amazon Mechanical Turk
pentru a ne ajuta să etichetăm imaginile.
La apogeu, ImageNet a fost 
unul dintre cei mai mari angajatori
ai lucrătorilor Amazon Mechanical Turk:
în total, aproape 50.000 de lucrători
din 167 de țări din jurul lumii
ne-au ajutat să curățăm,
să triem și să etichetăm
aproape un miliard de imagini inițiale.
De atât de mult efort a fost nevoie
pentru a captura doar o fracțiune 
din imaginile

Portuguese: 
e juntamente com o professor Kai Li,
da Universidade de Princeton,
lançamos o projeto ImageNet em 2007.
Felizmente, não tínhamos que colocar
uma câmera em nossas cabeças
e esperar por vários anos.
Fomos à internet,
o maior tesouro de imagens
que os humanos já criaram.
Baixamos aproximadamente
um bilhão de imagens
e usamos tecnologia de "crowdsourcing",
como a plataforma Amazon Mechanical Turk,
para nos ajudar
a classificar essas imagens.
No seu auge, o ImageNet foi
um dos maiores empregadores
de trabalhadores
da Amazon Mechanical Turk.
Juntos, quase 50 mil trabalhadores
de 167 países do mundo,
nos ajudaram a limpar, 
separar e classificar
aproximadamente um bilhão
de candidatas a imagens.
Esse foi o tamanho do empenho
para capturar até mesmo
uma fração das imagens

Vietnamese: 
và cùng với giáo sư Kai Li 
ở đại học Princeton,
chúng tôi triển khai
dự án ImageNet vào năm 2007.
May mắn thay, chúng tôi
không cần phải gắn camera trên đâu
và đợi chờ nhiều năm nữa.
Chúng tôi lên mạng,
nguồn tài nguyên ảnh lớn nhất
mà con người đã từng tạo ra.
Chúng tôi tải xuống gần một triệu bức
và sử dụng công nghệ nguồn đám đông 
như nền tảng Amazon Mechanical Tuck
để giúp chúng tôi phân loại
những hình ảnh này.
Vào đỉnh điểm, ImageNet
là một trong số những ông chủ lớn nhất
của những nhân viên Amazon Mechanical Turk
cùng nhau, gần 50000 nhân viên
từ 167 quốc gia trên thế giới
giúp chúng tôi dọn dẹp,
sắp xếp và phân loại
gần một triệu tấm ảnh ứng viên.
Đó mới thấy phải mất rất nhiều nổ lực
để nắm bắt được
thậm chí chỉ là một mảnh hình ảnh

Turkish: 
Princeton Üniversitesinden Prof. Kai Li
ile birlikte
2007 senesinde ImageNet projesini
başlattık.
Şanslıyız ki başımızın üzerine bir
kamera alıp
yıllarca beklememize gerek kalmadı.
İnternete başvurduk.
İnsanların oluşturduğu en büyük
resim definesi.
Yaklaşık bir milyar resim indirdik
ve crowdsourcing teknolojisini kullandık.
Resimleri tanımlamada bize yardımcı olmada
Amazon Mechanical Turk platformu gibi.
ImageNet, Amazon Mechanical Turk
çalışanlarına işveren en büyük
kurumlardan biri oldu.
Dünya genelinde 167 ülkeden
neredeyse 50,000 çalışan
yaklaşık bir milyar resmi
eleyip, sınıflandırma ve tanımlamada bize
yardımcı oldu.
Bu çaba, erken gelişim dönemindeki
bir çocuğun algıladığı görüntülerin
sadece belli bir bölümünü

French: 
Avec le professeur Kai Li
de l'Université de Princeton,
nous avons donc lancé
le projet ImageNet en 2007.
Heureusement, ce n'était pas la peine
de se mettre une caméra sur la tête
et d'attendre plusieurs années.
Nous sommes allés sur Internet,
la plus grande mine de photos 
que l'humain ait jamais créée.
Nous avons téléchargé 
près d'un milliard d'images.
Des technologies de crowdsourcing
comme le Turc Mécanique d'Amazon
nous ont aidés à cataloguer les images.
A son plus haut, ImageNet a été 
l'un des plus gros employeurs
du Turc Mécanique d'Amazon :
près de 50 000 employés
dans 167 pays
nous ont aidés
à nettoyer, trier, étiqueter
presque un milliard d'images.
C'est vous dire l'effort entrepris
pour capturer une fraction des images

Czech: 
a společně s profesorem Kai Li
na Princetonské univerzitě,
jsme v roce 2007 spustili 
projekt ImageNet.
Naštěstí jsme si nemuseli namontovat
kameru na hlavu
a čekat mnoho let.
Šli jsme na internet,
největší pokladnice obrázků, 
kterou jsme jako lidé vytvořili.
Stáhli jsme téměř miliardu obrázků
a využili crowdsourcingové technologie
jako Amazon Mechanical Turk,
aby nám pomohly pojmenovat tyto obrázky.
Na svém vrcholu, ImageNet byl jedním
z největších zaměstnavatelů
pracovníků Amazon Mechanical Turk:
celkem téměř 50 tisíc pracovníků,
ze 167 zemí světa,
nám pomohlo vyčistit, utřídit a označit
téměř miliardu potencionálních obrázků.
Přesně tolik úsilí nás stálo
zachytili pouze zlomek obrázků,

Danish: 
og sammen med professor Kai Li
i Princeton University
startede vi ImageNet projektet i 2007.
Heldigvis behøvede vi ikke at sætte et
kamera på hovedet
og vente i mange år.
Vi tog på Internettet,
den største samling af billeder som
mennesket nogensinde har lavet.
Vi downloadede næsten en milliard billeder
og brugte crowdsource teknologier såsom
Amazon Mechanical Turk platformen
til at hjælpe med at sortere billederne.
På sit højeste var ImageNet en af de
største arbejdsgivere
af alle Amazon Mechanical Turk ansatte:
tilsammen hjalp næsten 50,000 ansatte
fra 167 lande rundt omkring i verden
os med at rense, sortere og rubricere
næsten en milliard kandidat-billeder.
Så megen indsats tog det
at fange selv en brøkdel
af alle de billeder

Thai: 
และร่วมกับศาสตราจารย์ Kai Li 
ที่ Princeton University
เราได้เปิดตัว ImageNet
โชคดีที่เราไม่ต้องติดกล้อง
บนศีรษะของเรา
และรอเป็นเวลาหลายปี
เราไปที่อินเทอร์เน็ต
เป็นขุมสมบัติที่ยิ่งใหญ่ที่สุด
ของภาพที่มนุษย์สร้างขึ้น
เราดาวน์โหลดภาพมาแล้ว
เกือบพันล้านภาพ
และใช้เทคโนโลยีกระจายไปยังกลุ่มเพื่อค้นหา
คำตอบ เช่นแพลตฟอร์ม Amazon Mechanical Turk
เพื่อช่วยให้เราติดป้ายกำกับรูปภาพเหล่านี้
ในตอนท้าย ImageNet เป็นหนึ่งใน
นายจ้างที่ใหญ่ที่สุด
ของแรงงาน Amazon Mechanical Turk:
ร่วมกันเกือบ 50,000 คน
จาก 167 ประเทศทั่วโลก
ช่วยให้เราสามารถทำความสะอาด 
จัดเรียงและติดฉลากได้
เกือบหนึ่งพันล้านภาพที่ใช้
นั่นเป็นความพยายามอย่างมาก
เพื่อจับภาพแม้แต่เศษเสี้ยว

Italian: 
e con il Professore Kai Li 
dell'Università di Princeton,
abbiamo lanciato 
il progetto ImageNet nel 2007.
Per fortuna non abbiamo dovuto 
montare una videocamera in testa
e aspettare tanti anni.
Siamo andati su Internet,
il più grande tesoro d'immagini 
che gli uomini abbiano mai creato.
Abbiamo scaricato 
quasi un miliardo d'immagini
e usato il crowdsourcing 
come Amazon Mechanical Turk
per aiutarci a etichettarle.
Al suo culumine ImageNet era 
uno dei maggiori datori di lavoro
di Amazon Mechanical Turk:
insieme, quasi 50.000 dipendenti
di 167 paesi in tutto il mondo
ci hanno aiutato a 
pulire, smistare e etichettare
quasi un miliardo di aspiranti immagini.
Ecco lo sforzo che c'è voluto
a catturare persino 
una frazione delle immagini

Japanese: 
それで私はプリンストン大学の
カイ・リー教授と一緒に
2007年にImageNetプロジェクトを
立ち上げました
幸い私たちは
頭にカメラを付けて
何年も歩き回る必要は
ありませんでした
人類がかつて作った
最大の画像の宝庫
インターネットに
向かったのです
私たちは10億枚近い画像を
ダウンロードし
アマゾン・メカニカル・タークのような
クラウドソーシング技術を使って
それらの画像に
ラベル付けをしました
最盛期にはImageNetは
アマゾン・メカニカル・ターク作業者の
最大の雇用者の１つに
なっていました
167カ国の
５万人近い作業者が
10億枚近い画像を
整理しラベル付けする作業に
携わりました
子供がその成長の初期に
受け取るのに
匹敵する量の画像を
用意するためには

Ukrainian: 
Разом з професором з Прінстонського 
університету Кай Лі
ми заснували проект ImageNet у 2007 році.
На щастя, нам не довелося встановлювати
камери на голови
і чекати протягом багатьох років.
Ми звернулися до Інтернету,
найбільшої колекції зображень
за всю історію людства.
Ми завантажили близько 
мільярда зображень
і за допомогою такої платформи
краудсорсингу, як Amazon Mechanical Turk,
ми дали назву кожному зображенню.
На своєму піку ImageNet була
одним з найбільших роботодавців
для працівників на
Amazon Mechanical Turk:
разом майже 50 000 працівників
з 167 країн світу
допомагали нам чистити,
сортувати та називати
майже мільярд 
зображень-кандидатів.
От скільки знадобилося зусиль,
щоб охопити хоча б частину
зображень,

Arabic: 
وبالتعاون مع البروفيسور كاي لي
من جامعة برينستون
أطلقنا في العام 2007 مشروع ImageNet
لحسن الحظ، لم يتعين علينا أن
نَنْصِب كاميرا فوق رؤوسنا
ثم ننتظر لسنوات عديدة
لقد اتجهنا للإنترنت
حيث يقبع أكبر كنز من الصور
أنتجته البشرية على الإطلاق
لقد قمنا بتحميل ما يقارب المليار صورة
واستخدمنا تقنية "التعهيد الجماعي" كتلك
التي توفرها منصة "أمازون ميكنيكال تورك" ـ
لتساعدنا في تصنيف تلك الصور
كان مشروع ImageNet في ذروته
واحدًا من أكبر المُشَغّلين
للعاملين على منصة أمازون تلك
معًا، كانوا 50,000 عامل تقريبًا
من 167 دولة حول العالم
ساعدونا في ترتيب وفرز وتصنيف
ما يقرب من مليار صورة مُرَشّحة
هذا يبين مقدار الجهد المُسْتغرق
لالتقاط مجرد جزء صغير من الصور

Polish: 
W związku z tym razem z profesorem Kai Li 
z uniwersytetu Princeton
w 2007 r. uruchomiliśmy projekt ImageNet.
Na szczęście nie musieliśmy 
montować aparatu na głowie
i czekać wiele lat.
Skorzystaliśmy z Internetu,
największej skarbnicy zdjęć, 
jaką człowiek kiedykolwiek stworzył.
Pobraliśmy blisko miliard zdjęć
i użyliśmy crowdsourcingowej platformy 
Amazon Mechanical Turk,
żeby je opisać.
W szczytowym okresie ImageNet zatrudniał
najwięcej pracowników
na Amazon Mechanical Turk:
razem prawie 50 000 osób
ze 167 krajów
pomagało nam posegregować i opisać
prawie miliard zdjęć.
Tak wiele wysiłku kosztowało
uchwycenie zaledwie ułamka zbioru obrazów,

iw: 
ויחד עם פרופסור קאי לי
מאוניברסיטת פרינסטון,
התחלנו את פרוייקט אימג'נט ב-2007.
למזלנו, לא היינו צריכים לשים 
מצלמה על ראשינו
ולחכות הרבה שנים.
ניגשנו לאינטרנט,
האוצר הגדול ביותר של תמונות 
שהאדם יצר אי פעם.
הורדנו כמעט מיליארד תמונות
והשתמשנו בפעילות של הציבור הרחב
כמו הפלטפורמת המכניקל טורק של אמזון
בשיאו, אימג'נט היה אחד המעסיקים הגדולים
של פלטפורמת טורק של אמזון:
ביחד, כמעט 50,000 עובדים
מ-167 מדינות מסביב לעולם
עזרו לנו לנקות, לסדר ולתייג
כמעט מיליארד תמונות מועמדות.
זה כמה מאמץ נדרש
כדי ללכוד שבריר מיכולת הדימוי

English: 
and together with Professor
Kai Li at Princeton University,
we launched the ImageNet project in 2007.
Luckily, we didn't have to mount
a camera on our head
and wait for many years.
We went to the Internet,
the biggest treasure trove of pictures
that humans have ever created.
We downloaded nearly a billion images
and used crowdsourcing technology
like the Amazon Mechanical Turk platform
to help us to label these images.
At its peak, ImageNet was one of
the biggest employers
of the Amazon Mechanical Turk workers:
together, almost 50,000 workers
from 167 countries around the world
helped us to clean, sort and label
nearly a billion candidate images.
That was how much effort it took
to capture even a fraction
of the imagery

Hungarian: 
és Kai Li professzorral közösen 
a Princeton Egyetemen,
2007-ben elindítottuk 
az ImageNet projektet.
Szerencsére nem kellett 
egy kamerát szerelnünk a fejünkre,
és évekig várni.
Felmentünk az Internetre,
a képek legnagyobb tárházára, 
amit az emberek valaha létrehoztak.
Majdnem egymilliárd képet töltöttünk le
és az Amazon Mechanical Turk 
crowdsourcing technológiát használva
felcímkéztük ezeket a képeket.
A csúcson az ImageNet volt
a Mechanical Turk egyik 
legnagyobb foglalkoztatója:
együttesen, majdnem 50 000 dolgozó
a világ 167 országából
segített nekünk kitisztítani, 
rendszerezni és felcímkézni
majdnem egymilliárd kijelölt képet.
Ilyen sok erőfeszítésbe került
csak egy töredékét rögzíteni 
annak a képanyagnak,

Dutch: 
Samen met professor Kai Li
aan de Princeton Universiteit,
lanceerden we in 2007
het ImageNet-project.
Gelukkig hoefden we geen camera
op ons hoofd te zetten
en jaren te wachten.
We gingen het internet op,
de grootste schat aan plaatjes
die de mens ooit heeft gemaakt.
We downloadden
meer dan een miljard plaatjes
en gebruikten crowdsourcing,
zoals met de Amazon Mechanische Turk
om ons de plaatjes te helpen kenmerken.
Op zijn hoogtepunt was ImageNet
een van de grootste werkgevers
voor de Amazon 
Mechanische Turk-werknemers:
In totaal bijna 50.000 mensen
uit 167 landen van de wereld
hielpen ons met het opschonen,
sorteren en markeren
van bijna een miljard
mogelijk bruikbare plaatjes.
Zoveel moeite kostte het
om slechts een fractie
van de beelden te verwerken

Romanian: 
pe care mintea unui copil le face 
în primii ani ai dezvoltării.
Privind în urmă, această idee 
de a folosi date mari
pentru a antrena algoritmii computerelor 
poate părea evidentă acum,
dar în 2007 nu era atât de evidentă.
Eram destul de singuri 
în această călătorie pentru multă vreme.
Câțiva colegi prietenoși m-au sfătuit 
să fac ceva mai folositor ca ocupație
și ne chinuiam constant pentru fonduri.
O dată, chiar am glumit cu studenții mei
că aș redeschide spălătoria mea 
pentru a susține ImageNet.
Până la urmă, așa mi-am finanțat 
anii de studenție.
Așa că am continuat.
În 2009 proiectul ImageNet a furnizat
o bază de date de 15 milioane de imagini
din 22.000 de clase de obiecte și lucruri
organizate după cuvinte englezești uzuale.

iw: 
שמוח של ילד מסוגל לעשות 
בשנות ההתפתחות המוקדמות.
בדיעבד, הרעיון להשתמש בביג דאטה
בשביל לאמן אלגוריתם של מחשב
נראה אולי ברור עכשיו,
אבל ב-2007, זה לא היה כזה ברור.
היינו יחסית לבד במסע הזה למשך זמן לא קצר.
כמה עמיתים ידידותיים הציעו לי לעשות משהו
שימושי יותר בשביל הקביעות שלי,
והיינו נאבקים כל הזמן על תקציבי מחקר.
פעם אחת, התבדחתי 
עם הסטודנטים שלי לתואר שני
שאני פשוט אפתח מחדש את החנות 
לניקוי יבש שלי כדי לממן את אימג'נט.
אחרי הכל, ככה מימנתי את שנות הלימודים שלי.
אז המשכנו.
ב-2009, פרוייקט אימג'נט סיפק
בסיס נתונים של 15 מיליון תמונות
לרוחב 22,000 סוגי אובייקטים ודברים
מאורגנים לפי שפה אנגלית יומיומית.

Japanese: 
それほどの労力が
必要だったのです
コンピュータアルゴリズムの訓練に
ビッグデータを使うというアイデアは
今からすると
自明なものに見えるでしょうが
2007年当時は
そうではありませんでした
かなり長い間 こんなことをやっている人は
私たち以外にいませんでした
親切な同僚が将来の職のためにもう少し有用なことを
した方がいいとアドバイスしてくれたくらいです
研究資金には
いつも困っていました
ImageNetの資金調達のために
クリーニング屋をまた開こうかしらと
学生に冗談で言ったくらいです
私が学生の頃 学費のために
やっていたことです
私たちは進み続け
2009年に
ImageNetプロジェクトは
日常的な英語を使って
2万2千のカテゴリに分類した
1500万枚の画像の
データベースを
完成させました

Italian: 
della mente infantile 
nei primi anni di sviluppo.
A cose fatte l'idea di usare Big Data
per addestrare algoritmi 
informatici forse oggi sembra ovvia,
però nel 2007 non lo era così tanto.
Per un bel po' siamo 
stati soli in questo viaggio.
Dei colleghi mi hanno consigliato di 
fare qualcosa di più utile all'incarico
e avevamo di continuo 
difficoltà con il finanziamento.
Una volta ho scherzato con i miei studenti
dicendo che avrei riaperto 
la lavanderia per finanziare ImageNet.
Alla fine in questo modo 
ho finanziato i miei anni al college.
Allora abbiamo continuato.
Nel 2009 ImageNet project ha consegnato
un database di 15 milioni d'immagini
in 22.000 categorie di oggetti e cose
organizzate in parole di uso quotidiano.

Danish: 
som et barns hjerne bearbejder
i de første leveår.
Set i bakspejlet er denne idé med at bruge
massive data
til at træne computer algoritmer
måske indlysende,
men i 2007 var det ikke så enkelt.
Vi var ret alene på denne rejse
i et godt stykke tid.
Nogle venlige kolleger gav mig det råd at
bruge arbejdstiden mere effektivt
og vi arbejdede hårdt for at skaffe
forskningsmidler.
Jeg jokede også med mine
kandidatstuderende
at jeg ville genåbne mit renseri
for at skaffe penge til ImageNet.
Det er jo hvordan jeg finansierede 
mine universitetsår.
Så vi fortsatte.
I 2009 leverede ImageNet projektet
en database på 15 millioner billeder
bestående af 22,000 klasser 
af objekter og ting
organiseret af engelske dagligdags-ord.

Croatian: 
koje djetetov um uhvati
u ranim godinama razvoja.
Na očigled, ova ideja 
korištenja mnogo podataka
da se istreniraju računalni algoritmi
se možda sada čini očiglednim,
ali 2007., nije bilo tako očigledno.
Prilično dugo bili smo 
poprilično sami na tom putu.
Neke prijateljski nastrojene kolege su
me savjetovale da radim nešto korisnije,
i cijelo vrijeme smo se borili
za financiranje istraživanja.
Jednom, sam se čak našalila sa studentima
da ću ponovno otvoriti kemijsku čistionicu
kako bih mogla financirati ImageNet.
Naposljetku, tako sam financirala
svoj studij.
Nastavili smo dalje.
2009. ImageNet je dosegao
bazu podataka od 15 milijuna prikaza
preko 22.000 klasa
objekata i stvari
organiziranih u svakodnevne 
engleske riječi.

Albanian: 
që mendja e një fëmije regjistron 
në vitet e para të zhvillimit
Në retrospektivë, ideja e përdorimit 
të "big data"
për trajnimin e algoritmave kompjuterikë
mund të duket e qartë tani,
por vite më parë, në 2007, 
nuk ishte kaq e qartë.
Ne ishim vërtet vetëm në këtë rrugëtim
për mjaft kohë.
Disa kolegë të mitë, miqësisht më 
këshilluan të bëja diçka më të vlefshme,
dhe vazhdimisht luftonim
për financimin e kërkimeve.
Njëherë madje, unë bëra shaka 
me studentët e diplomuar
se do të hapja sërish dyqanin tim të 
pastrimit kimik për të financuar ImageNet.
Në fund të fundit, ashtu arrita
të financoj dhe studimet e mia.
Pra ne vazhduam.
Në 2009-n, projekti ImageNet paraqiti
një databazë me 15 milion imazhe
të klasifikuara në 22,000 klasa
objektesh dhe gjërash
të organizuara sipas fjalëve të përdorura 
në Anglishten e përditshme.

English: 
a child's mind takes in
in the early developmental years.
In hindsight, this idea of using big data
to train computer algorithms
may seem obvious now,
but back in 2007, it was not so obvious.
We were fairly alone on this journey
for quite a while.
Some very friendly colleagues advised me
to do something more useful for my tenure,
and we were constantly struggling
for research funding.
Once, I even joked to my graduate students
that I would just reopen
my dry cleaner's shop to fund ImageNet.
After all, that's how I funded
my college years.
So we carried on.
In 2009, the ImageNet project delivered
a database of 15 million images
across 22,000 classes
of objects and things
organized by everyday English words.

Portuguese: 
que uma criança vê nos seus
primeiros anos de desenvolvimento.
Em retrospetiva, esta ideia
de usar grandes volumes de dados
para treinar algoritmos em computadores
pode hoje parecer óbvia,
mas em 2007 não era assim tão óbvia.
Estivemos sozinhos neste percurso
durante algum tempo.
Alguns colegas amáveis aconselharam-me
a fazer algo mais útil no meu mandato,
e estávamos constantemente a lutar
por financiamento para a investigação.
Uma vez até disse, a brincar,
aos meus alunos
que ia reabrir a minha loja
de limpeza a seco,
para financiar o ImageNet.
Afinal de contas,
foi assim que eu financiei
os meus estudos na universidade.
E assim continuámos o trabalho.
Em 2009, o ImageNet disponibilizou
uma base de dado
com 15 milhões de imagens
ao longo de 22 mil classes
de objetos e coisas,
organizados por palavras
inglesas de uso comum.

Chinese: 
去捕捉，一个婴儿可能在他早期发育阶段
获取的”一小部分“图像。
事后我们再来看，这个利用大数据来训练
计算机算法的思路，也许现在看起来很普通，
但回到2007年时，它就不那么寻常了。
我们在这段旅程上孤独地前行了很久。
一些很友善的同事建议我
做一些更有用的事来获得终身教职，
而且我们也不断地为项目的研究经费发愁。
有一次，我甚至对
我的研究生学生开玩笑说：
我要重新回去开我的干洗店
来赚钱资助ImageNet了。
——毕竟，我的大学时光
就是靠这个资助的。
所以我们仍然在继续着。
在2009年，ImageNet项目诞生了——
一个含有1500万张照片的数据库，
涵盖了22000种物品。
这些物品是根据日常英语单词
进行分类组织的。

Russian: 
которую создаёт мозг ребёнка
в ранние годы развития.
Оглядываясь назад, идея использования
большого архива данных
для обучения компьютеров 
сейчас может показаться очевидной,
но в 2007 году это было далеко не так.
Долгое время у нас совсем
не было единомышленников.
Некоторые дружелюбные коллеги советовали
мне заняться более полезным делом,
и нам никогда не хватало денег
на исследования.
Однажды я даже пошутила 
со своими студентами,
что я снова открою свою химчистку,
чтобы профинансировать ImageNet.
В конце концов, именно с её помощью
я оплатила обучение в университете.
И мы продолжили работать.
В 2009 году проект ImageNet собрал
базу из 15 миллионов изображений,
22 тысяч классов объектов и предметов,
упорядоченных при помощи повседневных
английских слов.

French: 
qu'un enfant stocke 
pendant ses premières années.
Aujourd'hui, cette idée 
d'utiliser ces masses de données
pour construire des algorithmes
peut paraître évidente,
mais pas en 2007.
Pendant longtemps, nous étions bien seuls.
Des collègues me conseillaient de trouver 
autre chose pour devenir titulaire,
et c'était une bataille constante
pour trouver des crédits de recherche.
Je disais en plaisantant à mes étudiants
que je pourrais reprendre ma laverie
pour financer ImageNet.
Après tout, j'avais financé mes études
grâce à elle.
Mais nous avons continué.
En 2009, le projet ImageNet avait
une base de données 
de 15 millions d'images,
22 000 classes d'objets et de choses
organisées avec des mots d'anglais 
du quotidien.

Spanish: 
que un niño asimila en sus 
primeros años de desarrollo.
Viendo en retrospectiva, 
esta idea de usar muchos datos
para entrenar algoritmos
puede parecer obvia ahora.
Sin embargo, en 2007
no era tan evidente.
Estuvimos solos en este viaje
por un buen rato.
Algunos colegas me sugerían
hacer algo más útil para mi cátedra,
y con frecuencia teníamos problemas
para conseguir financiamiento.
Incluso llegué a decir
a mis alumnos, como broma,
que tendría que reabrir mi tintorería 
para financiar ImageNet.
Después de todo, así fue como
financié mis años de universidad.
Seguimos adelante.
En 2009, el proyecto ImageNet juntó
una base de datos con 
15 millones de imágenes
de 22 000 tipos de objetos
organizados por palabra
en inglés de uso cotidiano.

Arabic: 
التي يستوعبها عقل طفل
في سنوات تطوره الأولى
في لفتة متأخرة، فإن فكرة استخدام
الـ"بيانات كبيرة" (big data)
لتدريب خوارزميات الحواسيب
قد تبدو واضحة الآن
لكنها في العام 2007، لم تكن بهذا الوضوح
لقد كنا لوحدنا تمامًا في هذه الرحلة
لوهلة من الزمن
نصحني بعض زملائي المقربين بأن أقوم
بشيء أكثر ملاءمة لمركزي
وحينها كنا نعني باستمرار
لتوفير التمويل لأبحاثنا
مرةً، مازحت طلاب الدراسات العليا
الذين كنت أشرف عليهم
بأنني مستعدة لأفتتح مصبغة الملابس
التي أمتلكها من جديد لتمويل ImageNet
على كلٍ، كانت هذه هي الطريقة التي
مولت بها نفسي خلال دراستي الجامعية
وهكذا تابعنا عملنا
في 2009، تم إنجاز مشروع ImageNet
قاعدة بيانات ذات 15 مليون صورة
ونحو 22,000 رُتبة للأشياء
مرتبة بكلمات اللغة
الإنجليزية المستعملة يوميًا

Turkish: 
elde edebilmemiz içindi.
Nihayet, bilgisayar algoritmalarını
eğitmek için
big datanın kullanılması fikri
şu anda mümkün hale geldi,
fakat 2007 senesine dönersek,
bu mümkün değildi.
Bu yolculukta uzun bir süre tam
anlamıyla kendi başımızaydık.
Samimi bazı arkadaşlarım kadrom için daha
kullanışlı şeyler yapmamı tavsiye ettiler,
ve aynı zamanda araştırma fonu oluşturmak
için durmaksızın çabalıyorduk.
Hatta, master öğrencilerime ImageNet fonu
için kuru temizleme mağazamı tekrar açma
konusunda şaka yapıyordum.
Üniversite yıllarımda bu şekilde
geçiniyordum.
Sonra devam ettik.
2009 senesinde, ImageNet projesi
her gün ingilizce kelimelerle 22,000
nesne ve eşya sınıfı ile
15 milyonluk bir resim veritabanına
ulaştı.

Czech: 
které dětská mysl přijímá
během svých počátečních vývojových let.
Při pohledu zpět, nápad používání
velkého množství dat
pro učení počítačových algoritmů
se nyní může zdát samozřejmý,
ale v roce 2007 tomu tak nebylo.
Byli jsme po docela dlouhou dobu 
na této cestě sami.
Někteří mí kolegové mi doporučovali, 
abych dělala něco užitečnějšího,
a neustále jsme sháněli finance
pro náš výzkum.
Jednou jsem dokonce vtipkovala se svými
studenty,
že si znovu otevřu svoji čistírnu, abych
zaplatila ImageNet.
Přece jen, tak jsem financovala svoje
studia na univerzitě.
Tak jsme pokračovali.
V roce 2009 projekt ImageNet vytvořil
databázi 15 milionů obrázků
napříč 22 000 tříd objektů a věcí
organizovaných podle každodenních
anglických slov.

Modern Greek (1453-): 
που προσλαμβάνει το μυαλό ενός παιδιού
στα πρώτα χρόνια της ανάπτυξης.
Εκ των υστέρων, η ιδέα της χρήσης
μαζικών δεδομένων
για την εκπαίδευση υπολογιστών
μπορεί να μοιάζει προφανής,
αλλά το 2007 δεν ήταν τόσο προφανής.
Ήμασταν μόνοι μας σε αυτό το ταξίδι
για αρκετό καιρό.
Μερικοί συνάδελφοι με συμβούλευσαν να κάνω
κάτι πιο χρήσιμο για να πάρω μονιμότητα,
και είχαμε διαρκώς 
προβλήματα χρηματοδότησης.
Μια φορά, είπα για πλάκα 
στους μεταπτυχιακούς φοιτητές μου
ότι θα άνοιγα ξανά το καθαριστήριό μου 
για να χρηματοδοτήσω το ImageNet.
Στο κάτω κάτω, 
έτσι χρηματοδότησα τις σπουδές μου.
Έτσι λοιπόν συνεχίσαμε.
Το 2009, το ΙmageNet παρέδωσε
μια βάση δεδομένων 
με 15 εκατομμύρια φωτογραφίες
που ανήκαν σε 22.000 κατηγορίες
αντικειμένων και πραγμάτων
οργανωμένες
με καθημερινές αγγλικές λέξεις.

Persian: 
ذهن یک کودک در سالهای اولیه
تکامل خود انجام می‎دهد.
پس از گذشت زمان و کسب تجربه
ایده استفاده از حجم عظیم داده‎ها
برای آموزش الگوریتم رایانه‎ها،
شاید الان بدیهی بنظر برسد،
ولی قبلا در سال ۲۰۰۷ انقدر واضح نبود.
ما توی این سفر برای مدتی کاملا تنها بودیم.
بعضی از همکاران نزدیکم به من توصیه کردند
که برای استخدام قطعی من کار مفیدتری بکنم
و مدام برای بودجه تحقیقاتی مشکل داشتیم.
یکبار با دانشجوهای تحصیلات تکمیلی‎ام
شوخی کردم که
برای تامین بودجه ImageNet
حشکشویی‎ام را دوباره باز کنم.
بهر حال این راهی بود که من 
پول تحصیل‎ام را در آورده بودم.
پس ادامه دادیم.
در سال ۲۰۰۹ پروژه ImageNet
یک پایگاه داده از ۱۵ میلیون عکس
در وسعت ۲۲٫۰۰۰ کلاس از شی ها
که با کلمات انگلیسی روزمره منظم شده بودند
تحویل داد.

Korean: 
얼마나 많은 노력이 드는가
하는 것과 같았죠.
지나고 보니, 컴퓨터 알고리즘의 훈련에
빅데이터를 사용한다는 아이디어는
이제 확실한 것 같습니다만,
2007년 당시에는 그렇지 않았습니다.
우리 혼자 이런 일을 한 게
꽤 오래 됐습니다.
친절한 동료는 종신교수가 되려면 
더 유용한 일을 하라고 조언했고,
우리는 늘 연구 자금 문제에 시달렸죠.
저는 이미지넷의 자금 조달을 위해
세탁소를 다시 열어야겠다고
대학원생들에게 농담을 했죠.
제가 대학 학비를 마련한 방법이거든요.
우리는 계속 진행했습니다.
2009년에 이미지넷 프로젝트는
객체와 사물을 2만2천개 범주로 분류한
1천5백만장 이미지의 
데이터베이스를 만들었고
일상적인 영단어로 표현했습니다.

Thai: 
จิตใจของเด็กใช้เวลาในการพัฒนา
ระยะต้นหลายปี
ในการมองย้อนกลับความคิดใน
การใช้ข้อมูลขนาดใหญ่นี้
การฝึกซ้อมอัลกอริธึมของคอมพิวเตอร์
อาจดูเหมือนชัดเจนในตอนนี้
แต่กลับไปในปี 2007 ยังไม่ชัดเจนดังนั้น
เราค่อนข้างโดดเดี่ยวในการเดินทาง
ครั้งนี้มานานแล้ว
เพื่อนร่วมงานแนะนำให้ทำสิ่ง
ที่เป็นประโยชน์มากขึ้นต่อตำแหน่ง
และเราก็พยายามดิ้นรนเพื่อหาเงินทุนวิจัย
ครั้งหนึ่งฉันก็พูดเล่นกับนักศึกษา
ระดับบัณฑิตศึกษาของฉัน
ว่าฉันเพิ่งจะเปิดร้านขายของชำของฉัน
อีกครั้งเพื่อลงทุนใน ImageNet
เพราะนั่นเป็นเหตุผลที่ฉันให้เงินทุน
แก่วิทยาลัยของฉันเป็นเวลาหลายปี
ดังนั้น เราจึงดำเนินการต่อ
ในปี 2552 โครงการ ImageNet ได้จัดส่ง
ฐานข้อมูลขนาด 15 ล้านภาพ
ผ่านชั้นเรียนและวัตถุต่างๆ 22,000 ชั้น
จัดตามคำภาษาอังกฤษในชีวิตประจำวัน

Vietnamese: 
của trí óc trẻ con
trong những năm tháng phát triển đầu đời
Trong nhận thức muộn màng,
ý tưởng sử dụng dữ liệu lớn
để hướng dẫn một thuật toán vi tính
có thể hiển nhiên vào lúc này,
nhưng trở lại năm 2007,
nó không hiển nhiên như vậy.
Chúng tôi gần như là đơn độc trên
hành trình này trong một thời gian dài.
Một vài đồng nghiệp thân thiện khuyên tôi 
làm cái gì khác có lợi hơn cho chức vụ,
và chúng tôi liên tục phải xoay xở
tìm nguồn tài trợ cho dự án.
Một lần, tôi đùa
với những học viên cao học của mình
tôi sẽ mở lại shop giặt là
để tài trợ cho ImageNet
Dù gì, thì đó là cách mà tôi trang trải 
cho những năm tháng đại học của mình.
Vì thế mà chúng tôi tiếp tục.
Năm 2009, dự án ImageNet chuyển tải
một cơ sở dữ liệu của 15 triệu tấm ảnh
trong 22000 lớp đối tượng và đồ vật
được tổ chức
theo từng từ tiếng Anh thông dụng.

Hungarian: 
amit egy gyermek agya 
a fejlődésének első éveiben befogad.
Utólag a "big data" 
használatának az ötlete
a számítógépes algoritmusok tanítására
már nyilvánvalónak tűnhet,
de 2007-ben ez nem volt olyan kézenfekvő.
Meglehetősen egyedül voltunk
ezen az úton egy jó darabig.
Néhány kedves kollégám azt tanácsolta, 
hogy hasznosabb dologgal töltsem az időmet
és állandóan harcoltunk 
a kutatási támogatásért.
Egyszer még azt is mondtam
viccesen a végzős diákjaimnak,
hogy újranyitnám a ruhatisztító boltomat, 
hogy az ImageNet-et támogassam.
Végül is, így finanszíroztam 
a főiskolai éveimet.
Tehát folytattuk.
2009-ben az ImageNet
egy 15 millió képből álló 
adatbázist adott át,
az objektumokat és dolgokat 
22 000 osztályba sorolva,
mindennapos angol 
szavak szerint elrendezve.

Portuguese: 
que a mente de uma criança capta
nos primeiros anos de desenvolvimento.
Em retrospecto, 
esta ideia de usar dados extensos
para treinar os algoritmos
computacionais pode parecer óbvia agora,
mas em 2007, não era tão óbvia assim.
Estivemos praticamente sós
nessa jornada por um bom tempo.
Alguns colegas próximos me aconselharam
a fazer algo mais útil pelo meu mandato,
e lutávamos constantemente para conseguir
financiamento para a pesquisa.
Uma vez, eu brinquei
com os meus alunos de graduação
que iria reabrir minha loja de lavagem
a seco para financiar o ImageNet.
Afinal de contas, foi assim
que financiei minha faculdade.
Então seguimos em frente.
Em 2009, o projeto ImageNet entregou
um banco de dados
de 15 milhões de imagens,
entre 22 mil classes de objetos e coisas,
organizadas pelas palavras
cotidianas em inglês.

Dutch: 
dat een kind opneemt
in zijn eerste jaren.
Achteraf gezien lijkt dit idee
om big data te gebruiken
om computeralgoritmes te trainen,
nogal logisch,
maar in 2007 was dat niet zo.
We stonden best lang alleen
op deze weg.
Een paar vriendelijke collega's
raadden me aan wat nuttigers te gaan doen,
en we hadden veel moeite
om onderzoeksgeld bij elkaar te krijgen.
Ik grapte een keer naar mijn studenten
dat ik mijn stomerij zou heropenen
om ImageNet te sponsoren.
Zo bekostigde ik immers ook mijn studie.
We gingen dus door.
In 2009 leverde het ImageNet-project
een database op
met 15 miljoen plaatjes
in 22.000 categorieën
van voorwerpen en dingen
ingedeeld met alledaagse Engelse woorden.

Chinese: 
孩童在早期心智發展的浮光掠影。
用現在眼光看來，使用大量的資料
來訓練電腦演算是明顯合理的，
然而在2007年的世界卻非如此。
有好長一段時間，
我們在這個旅途中孤獨地踽踽而行，
有些同事好心地建議我，
與其苦苦掙扎於研究經費的募集，
還不如轉而先做些比較好拿到終身聘的研究，
我還曾跟我的研究生開玩笑說
我乾脆再開一間乾洗店來資助ImageNet 好了，
畢竟那就是我用以支付大學學費的方法。
就這樣我們還是繼續往前走，
2009年起，ImageNet 已經是個擁有
涵蓋了兩萬兩千種不同類別，
多達150億幅圖像的資料庫，
並組織以英語日常生活用字為主，

Polish: 
które dziecięcy mózg przyswaja
we wczesnych latach rozwoju.
Pomysł użycia dużej ilości danych
do uczenia algorytmu komputerowego,
może wydawać się teraz oczywisty,
ale w 2007 roku taki nie był.
Przez dłuższy czas 
byliśmy w tej podróży sami.
Kilku kolegów radziło mi nawet, 
żebym zrobiła coś bardziej użytecznego
i ciągle zmagaliśmy się 
z brakiem funduszy.
Zdarzyło mi się nawet żartować 
z moimi studentami,
że otworzę znowu pralnię, 
żeby sfinansować ImageNet.
Jakby nie było, tak właśnie 
sfinansowałam swoje studia.
Kontynuowaliśmy.
W 2009 roku ImageNet miał już bazę
15 milionów zdjęć
skategoryzowanych w 22 000 klas 
obiektów i rzeczy
oznaczonych angielskimi słowami.

Ukrainian: 
які дитячий мозок сприймає
у перші роки життя.
Зараз ця ідея
щодо використання великої кількості даних
для навчання комп'ютерних алгоритмів,
може адаватися очевидною.
Але у 2007 вона не була 
настільки очевидною.
Певний час ми були абсолютно самотніми
на цьому шляху.
Деякі дружні колеги радили мені
робити щось більш корисне на моїй посаді,
і ми постійно намагалися знайти
фінансування для нашого дослідження.
Якось я навіть пожартувала
перед моїми випускниками,
що я б знову відкрила свою хімчистку,
аби фінансувати ImageNet.
Саме так я заробляла гроші,
навчаючись в коледжі.
Тож ми продовжували.
У 2009 проект ImageNet
мав базу даних у 15 мільйонів зображень
з 22 000 класів об'єктів і речей,
впорядкованих щоденними 
англійськими словами.

Ukrainian: 
Кількісно і якісно
це був безпрецедентний масштаб.
Для прикладу, у випадку з котами
ми мали більше 62 000 котів
з усіма видами зовнішності 
і в усіх позах,
а також усіх порід,
як домашніх, так і диких.
Ми були у захваті від
досягнення ImageNet,
і хотіли, щоб увесь науковий світ
мав користь з цього,
тож, за зразком TED,
ми відкрили усі дані
для усього наукового світу
безкоштовно.
(Оплески)
Наразі, маючи дані
для наповнення мозку комп'ютера,
ми готові повернутися
до алгоритмів.
Виявилося, що та велика кількість
інформації, отримана з ImageNet,
ідеально підходить для конкретного класу
навчальних алгоритмів для машин,

Italian: 
Sia in quantità sia in qualità
era una scala senza precedenti.
Per esempio, nel caso dei gatti,
abbiamo più di 62.000 gatti
di tutti i tipi di aspetto e pose
e in tutte le specie 
di gatti domestici e selvatici.
Eravamo emozionati per il 
completamento di ImageNet,
e volevamo che tutto 
il mondo di ricerca ne beneficiasse,
così come TED abbiamo 
aperto gratis tutto il set di dati
alla comunità di ricerca mondiale.
(Applausi)
Ora grazie ai dati per nutrire
il cervello del nostro computer
siamo pronti a ritornare agli algoritmi.
Infatti, la ricchezza 
d'informazioni di ImageNet
era perfetta per una particolare classe 
di algoritmi di apprendimento automatico

Turkish: 
Sayı ve kalite olarak,
emsalsiz bir ölçekti bu.
Örneğin, kedi kategorisinde,
görünüş ve poz
ile evcil ve yaban türlerinin tümüyle
62 binden fazla kedi bulunmakta.
Bunları ImageNet olarak toparladığımızdan
heyecanlıydık
ve sonra bütün dünya araştırmalarında
bunlardan faydalanılsın istedik,
bu yüzden TED fashion'da bütün veri
havuzumuzu
global araştırma topluluklarına ücretsiz
bir şekilde açtık.
(Alkış)
Artık, bilgisayarımızın beynini besleyecek
veriye sahibiz,
algoritmaların kendilerine
dönecek kadar da hazırız.
ImageNet projesinin sağladığı
bilgi zenginliği, sonunda
"evrişimli sinirsel ağ" olarak ifade
edilen makine öğrenme algoritmalarının

Portuguese: 
Tanto em quantidade como em qualidade,
tratou-se de uma escala sem precedentes.
Como exemplo disto temos,
no caso dos gatos,
mais de 62 mil gatos
de todos os tipos e em variadas poses,
assim como todas as espécies
de gatos domésticos e selvagens.
Estávamos muito entusiasmados
por termos construído o ImageNet
e queríamos que toda a pesquisa mundial
pudesse beneficiar dele,
por isso, à boa maneira do TED,
disponibilizámos toda a base de dados
para a comunidade de pesquisa
mundial, gratuitamente.
(Aplausos)
Agora que já temos os dados para alimentar
o cérebro do nosso computador,
estamos prontos para voltar
a trabalhar nos algoritmos.
Como se veio a perceber, a riqueza
de informações fornecidas pelo ImageNet
era perfeita para uma classe particular
de algoritmos de aprendizagem automática

Vietnamese: 
Về cả số lượng và chất lượng,
đây là một quy mô chưa từng có
Lấy ví dụ, trong trường hợp của mèo,
chúng tôi có hơn 62000 con mèo
đủ mọi loại hình dạng và kiểu dáng
và trong tất cả những loài mèo nhà
hay mèo hoang.
Chúng tôi hứng khởi
để cùng nhau xây dựng nên ImageNet,
và chúng tôi muốn cả thế giới
nghiên cứu được hưởng lợi từ nó,
vì vậy mà ở TED,
chúng tôi mở toàn bộ hệ thống dữ liệu
cho cộng đồng nghiên cứu quốc tế
miễn phí
(vỗ tay)
Bây giờ chúng ta đã có dữ liệu 
để nuôi sống não bộ máy tính của chúng ta,
chúng ta đã sẵn sàng quay trở lại 
với những thuật toán .
Vì hóa ra là, sự dồi dào 
của những nguồn thông tin bởi ImageNet
là một sự kết hợp hoàn hảo
cho việc học những thuật toán của máy tính

Modern Greek (1453-): 
Τόσο σε ποσότητα όσο και σε ποιότητα,
ήταν μια ανεπανάληπτη κλίμακα.
Για παράδειγμα, όσον αφορά τις γάτες,
έχουμε περισσότερες από 62.000 γάτες
με διαφορετικές εμφανίσεις και πόζες
και όλα τα είδη, κατοικίδιες και άγριες.
Ήμασταν πανευτυχείς
που ολοκληρώσαμε το ImageNet,
και θέλαμε να επωφεληθεί
όλος ο ερευνητικός κόσμος,
κι έτσι, σύμφωνα με το πνεύμα του TED,
διαθέσαμε ολόκληρη τη βάση δεδομένων
στην παγκόσμια ερευνητική κοινότητα,
δωρεάν.
(Χειροκρότημα)
Τώρα που έχουμε τα δεδομένα για να
καλλιεργήσουμε το υπολογιστικό μας μυαλό,
είμαστε έτοιμοι να ξαναγυρίσουμε
στους αλγόριθμους.
Όπως αποδείχθηκε, ο πλούτος πληροφορίας
που παρέχεται από το ImageNet
ήταν το τέλειο ταίρι για μια συγκεκριμένη
κλάση αλγόριθμων μηχανικής μάθησης

Spanish: 
En cantidad y calidad,
tuvieron una escala sin precedentes.
Por ejemplo, en el caso de los gatos,
tenemos más de 62 000 gatos
con todo tipo de apariencias y poses
y todo tipo de gatos
domésticos y salvajes.
Estábamos entusiasmados
por haber creado ImageNet
y queríamos que todo el mundo de 
la investigación se beneficiara,
así que, al estilo TED,
abrimos toda la base de datos
a la comunidad mundial de 
investigadores de forma gratuita.
(Aplausos)
Ahora que tenemos los datos para nutrir
el cerebro de nuestra computadora,
estamos listos para volver
a los algoritmos.
La abundancia de información
aportada por ImageNet
fue el complemento perfecto para 
un tipo particular de algoritmos

Thai: 
ทั้งในด้านปริมาณและคุณภาพ
นี่เป็นระดับที่ไม่เคยปรากฏมาก่อน
ตัวอย่างเช่น ในกรณีของแมว
เรามีแมวมากกว่า 62,000 ตัว
รูปลักษณ์และโพสท่าทุกชนิด
และแมวในประเทศและป่าทั่วทุกชนิด
เราตื่นเต้นที่ได้ใส่ใน ImageNet
และเราต้องการให้โลกการวิจัย
ทั้งหมดได้รับประโยชน์
ดังนั้น ในรูปแบบ TED เราจึง
เปิดชุดข้อมูลทั้งหมด
ไปยังชุมชนการวิจัยทั่วโลกแบบฟรีๆ
(เสียงปรบมือ)
ตอนนี้ เรามีข้อมูลที่จะช่วยบำรุง
สมองคอมพิวเตอร์ของเรา
เราพร้อมที่จะกลับมาที่อัลกอริทึม
ด้วยตัวเองแล้ว
เมื่อเปิดความมั่งคั่งของข้อมูล
ที่ได้จาก ImageNet
เป็นการจับคู่ที่สมบูรณ์แบบกับชั้นเรียน
ของกลไกการเรียนรู้ของเครื่อง

Albanian: 
Si në cilësi, ashtu dhe në sasi,
kjo ishte një arritje e paparë.
Si shembull, në rastin e maceve,
kemi më shumë se 62,000 mace
të të gjitha pamjeve, pozicioneve
dhe llojeve të maceve shtëpiake 
apo të egra.
Ne ishim të ngazëllyer
nga puna e bërë me ImageNet,
dhe donim që e gjithë bota kërkimore
të përfitonte nga rezultatet,
kështu në një mënyrë të ngjashme me TED,
ne ia ofruam të dhënat falas
komunitetit kërkimor në të gjithë botën.
(Duartrokitje)
Tani që i kemi të dhënat
për të ushqyer trurin e kompjuterit,
jemi gati t'i rikthehemi algoritmeve.
Rezultoi se, pasuria informative e ofruar
nga ImageNet
përkonte në mënyrë të përkryer me një
kategori të veçantë algoritmesh

Chinese: 
這樣的規模，不論是「質」或「量」
都是史無前例的。
用貓來舉個例子說明，
我們有超過六萬兩千種
不同外觀和姿勢的貓咪，
橫跨不同的種類，有家貓，也有野貓。
ImageNet 的成果讓我們非常激動，
我們希望它有助於全世界的研究，
就如同 TED 的貢獻，我們免費提供整個資料庫
給全世界的研究單位。
(觀眾鼓掌)
有了這些資料，我們可以教育我們的電腦，
下一步就是回到程式演算的部分了。
結果我們發現，ImageNet 所提供的豐富資訊
恰巧與機器學習演算的其中一門特定領域
不謀而合，

Romanian: 
Atât cantitativ, cât și calitativ,
era la o scală fără precedent.
Ca exemplu, în cazul pisicilor,
avem mai mult de 62.000 de pisici
de toate felurile și ipostazele,
din toate speciile de pisici 
domestice și sălbatice.
Eram încântați de crearea ImageNet
și am vrut ca toată lumea 
să poată beneficia,
astfel respectând tradiția TED, 
am deschis întreaga bază de date
gratis către toată comunitatea
de cercetători.
(Aplauze)
Acum că avem datele pentru a hrăni 
creierul computerelor,
suntem gata să revenim la algoritmi.
Se pare că bogăția informațiilor 
furnizate de ImageNet
se potrivea perfect cu o clasă specială 
de algoritmi de învățare automată

Croatian: 
I po kvantiteti i po kvaliteti
ovo je dosad nedostignuta skala.
Kao primjer, u slučaju mačaka,
imamo više od 62.000 mačaka
u svim oblicima i pozama,
i različitih vrsta
domaćih i divljih mačaka.
Bili smo oduševljeni 
što smo sastavili ImageNet,
i htjeli smo da cijeli znanstveni svijet
ima koristi od njega,
tako da smo po modi TED-a
otvorili cijeli skup podataka
svim istraživačkim zajednicama, besplatno.
(Pljesak)
Sad kad imamo podatke
da opskrbimo mozgove naših računala,
spremni smo vratiti se na
same algoritme.
Ispalo je kako je bogatstvo informacija 
s ImageNet-a
savršeno za određene vrste
algoritama za strojno učenje

Dutch: 
Zowel qua kwantiteit als kwaliteit,
was dit een ongekende schaal.
We hebben bijvoorbeeld
in het geval van de katten,
meer dan 62.000 katten
in allerlei posities en houdingen
en allerlei soorten wilde en huiskatten.
We waren enthousiast
toen we ImageNet in elkaar hadden gezet
en we wilden dat de hele onderzoekswereld
er plezier van had.
Dus volgens de TED-methode stelden we
gratis de hele verzameling beschikbaar
aan de wereldwijde onderzoeksgemeenschap.
(Applaus)
Nu we de gegevens hebben
om het computerbrein te voeden,
kunnen we terugkomen
op de algoritmes zelf.
Het bleek dat de overdadige informatie
die ImageNet gaf,
precies paste bij een speciaal soort
algoritme voor machineleren.

iw: 
גם בכמות וגם באיכות,
זה היה קנה מידה חסר תקדים.
כדוגמא, במקרה של חתולים,
יש לנו יותר מ-62,000 חתולים
בכל מיני מראות ותנוחות
ועל פני כל המינים של 
חתולים ביתיים ופראיים.
היינו נרגשים להרכיב את אימג'נט,
ורצינו שכל עולם המחקר ירוויח ממנו,
אז ברוח TED, פתחנו את כל 
מערכת הנתונים שלנו
לקהילת המחקר ברחבי העולם בחינם.
(מחיאות כפיים)
עכשיו כשיש לנו את הנתונים להזין 
במוח הממוחשב שלנו,
אנחנו מוכנים לחזור לאלגוריתמים עצמם.
כפי שהתברר, עושר המידע 
שסופק על ידי אימג'נט
היה התאמה מושלמת לסוג מסויים 
של אלגוריתמים ללמידת מכונה

Arabic: 
حسب كل من الكمية والنوعية
لقد كان هذا مستوًى غير مسبوق
كمثال، في حالة القطط
لدينا أكثر من 62,000 قطة
من كل الأنواع وبكل الوضعيات
ومن كل فصائل القطط
الأليفة منها والبرية
لقد كنا مغتبطين لأننا تمكنا
من جمع شتات ImageNet
وأردنا أن يستفيد المجتمع البحثي
بأكمله من هذا المشروع
فلذلك في مؤتمر TED fashion
وفرنا قاعدة البيانات كاملة
بالمجان للمجتمع البحثي حول العالم
(تصفيق)
والآن وقد امتلكنا البيانات
لنغذي عقل حاسوبنا
أصبحنا جاهزين لنعود
للخوارزميات ذاتها
وكما تبين لاحقًا، فإن ثراء
المعلومات التي وفرها ImageNet
كان متناغمًا بشكل كامل مع طراز معين
من خوارزميات تعليم الحواسيب

Hungarian: 
Minőségben és mennyiségben egyaránt
példátlan méretű.
Például a macskák esetében,
több mint 62 000 képünk volt
mindenféle külsejű és pózoló
minden fajta házi- és vadmacskákról.
Le voltunk nyűgözve, hogy 
együtt létrehoztuk az ImageNet-et,
és azt akartuk, hogy az egész 
kutatási világ profitáljon ebből,
így a TED módszerével hozzáférhetővé 
tettük az egész adatállományt.
az egész világ kutató 
közösségének, ingyenesen.
(Taps)
Most, hogy már vannak adataink, 
amit betápláljunk a számítógépeink agyába,
készen állunk arra, hogy visszatérjünk 
magukhoz az algoritmusokhoz.
Mint kiderült, az ImageNet által 
biztosított információ értéke
tökéletesen illeszkedett a gépi tanulási 
algoritmusok egy bizonyos osztályához,

Czech: 
V obou - kvantitě i kvalitě,
v nevídaném množství.
Uvedu příklad na zmiňovaných kočkách,
měli jsme více než 62 tisíc koček
různého vzhledu, v různých pózách
a všechny druhy domácích i divokých koček.
Byli jsme nadšení, že jsme mohli 
dát ImageNet dohromady
a chtěli jsme, aby toho mohl využívat
celý výzkumný svět,
takže podle TEDu, jsme celý náš data set
otevřeli
pro celosvětovou výzkumnou komunitu
zadarmo.
(Potlesk)
Když teď máme data, kterými můžeme
krmit náš počítačový mozek,
jsme připraveni se vrátit zpět 
k algoritmům jako takovým.
Jak se pak ukázalo, hojnost informací
z ImageNetu
byla perfektní pro konkrétní třídu
algoritmů pro učení strojů, které

French: 
Tant en quantité qu'en qualité,
une telle échelle de grandeur 
était une première.
Par exemple, les chats,
nous avons plus de 62 000 chats,
toutes sortes d'apparences et de poses,
toutes les espèces,
domestiques et sauvages.
C'était formidable d'avoir bâti ImageNet,
et nous voulions en faire profiter 
le monde de la recherche.
Alors, à la manière de TED,
nous avons donné l'accès aux données
à la recherche, gratuitement 
et dans le monde entier.
(Applaudissements)
Maintenant que nous avons les données
pour nourrir notre cerveau informatique,
nous pouvons revenir sur les algorithmes.
Il se trouve que la manne d'informations
désormais dans ImageNet
allait parfaitement avec 
un certain type d'algorithmes,

Japanese: 
これは量という点でも
質という点でも
かつてないスケールのものでした
一例を挙げると
ネコの画像は
6万2千点以上あって
様々な見かけや
ポーズのネコがいて
飼い猫から山猫まで
あらゆる種類を網羅しています
私たちはImageNetが
できあがったことを喜び
世界の研究者にも
その恩恵を受けて欲しいと思い
TEDの流儀で
データセットをまるごと
無償で世界の研究者コミュニティに
公開しました
(拍手)
こうしてコンピュータの脳を
育てるためのデータができ
アルゴリズムに取り組む
用意が整いました
それで分かったのは 
ImageNetが提供する豊かな情報に適した
機械学習アルゴリズムがあることです

Portuguese: 
Tanto em quantidade quanto em qualidade,
isso foi uma escala sem precedentes.
Como exemplo, no caso dos gatos,
temos mais de 62 mil gatos
de todos os aspectos e poses;
e todas as espécies
de gatos domésticos e selvagens.
Ficamos muito felizes em criar o ImageNet
e queríamos que todo o mundo das pesquisas
se beneficiasse com ele.
Assim, à moda TED, abrimos
todo o conjunto de dados
para a comunidade mundial 
de pesquisa gratuitamente.
(Aplausos)
Agora que temos os dados para alimentar
o cérebro do nosso computador,
estamos prontos para retornar
aos algoritmos em si.
Como se viu, a riqueza de informações
fornecidas pelo ImageNet
foi um ajuste perfeito para uma classe
de algoritmos de aprendizado de máquina

Chinese: 
无论是在质量上还是数量上，
这都是一个规模空前的数据库。
举个例子，在"猫"这个对象中，
我们有超过62000只猫
长相各异，姿势五花八门，
而且涵盖了各种品种的家猫和野猫。
我们对ImageNet收集到的图片
感到异常兴奋，
而且我们希望整个研究界能从中受益，
所以以一种和TED一样的方式，
我们公开了整个数据库，
免费提供给全世界的研究团体。
（掌声）
那么现在，我们有了用来
培育计算机大脑的数据库，
我们可以回到”算法“本身上来了。
因为ImageNet的横空出世，它提供的信息财富
完美地适用于一些特定类别的机器学习算法，

Russian: 
Как количественно, так и качественно
это был беспрецедентный по размеру проект.
Например, в случае с котами
в базе содержится более 62 000 котов
разных пород, в разных позах,
всех видов, как домашних, так и диких.
Мы были на седьмом небе от счастья,
когда база ImageNet была готова.
Мы хотели, чтобы она принесла пользу 
всему научному сообществу.
И мы, как и TED, открыли бесплатный
неограниченный доступ к базе данных
для всего мирового научного сообщества.
(Аплодисменты)
Сейчас, когда у нас есть база данных,
чтобы питать наш компьютерный мозг,
мы готовы вернуться к алгоритмам.
Как оказалось, база данных,
предоставленная ImageNet,
точно подходила для определённого класса
алгоритмов обучения машин,

Persian: 
از لحاظ کیفیت و کمیت
این مقیاس بی‎سابقه بود.
بعنوان مثال در مورد گربه‎ها
بیش از ۶۲٫۰۰۰ (تصویر) گربه
در انواع شکل ها و فرم بدن
و در تمام گونه‌های اهلی و وحشی داشتیم.
ما از اینکه ImageNet را ساخته بودیم
هیجان زده بودیم و
و می‎خواستیم که تمام دنیای تحقیقات
از آن بهره ببرند
پس به شیوه TED 
تمام مجموعه داده را
برای دنیای تحقیقات بصورت رایگان
باز کردیم.
(تشویق حضار)
حالا که داده‎ها را برای تغذیه مغز
رایانه هایمان داریم،
آماده ایم که برگردیم سراغ
خود الگوریتم ها.
اینطور شد که
وفور اطلاعات تهیه شده توسط ImageNet
خیلی خوب به کلاس خاصی از الگوریتمهای
یادگیری ماشینی

Korean: 
양적으로나 질적으로나
전례 없는 규모였죠.
예를 들어, 고양이의 경우
6만 2천장의 이미지가
다양한 모양과 자세,
집고양이부터 들고양이까지
모든 종류를 망라합니다.
우리는 이미지넷을 만든 것에 흥분했고
모든 연구자들과 혜택을
나누고자 했습니다.
그래서 TED 방식으로 모든 데이터를
전세계의 연구자 커뮤니티에
무료로 공개했습니다.
(박수)
이제 우리는 컴퓨터 두뇌에 
영양을 공급할 데이터가 있고,
알고리즘 자체로 돌아올 준비가 되었죠.
결과적으로 이미지넷의 풍부한 정보는
기계 학습 알고리즘의 
특정 분류에 딱 들어맞았는데,

Danish: 
I både kvalitet og kvantitet
var dette aldrig set før.
F.eks. i eksemplet med katte
har vi nu mere end 62,000 katte
af alle slags udseender og positioner
og af alle racer af både hus-
og vilde katte.
Vi var utrolig glade for at have
sammensat ImageNet,
og vi ville, at hele forskningsverdenen
ville få gavn af dette,
så på ren TED-manér åbnede vi
for hele data-sættet
gratis til hele forsknings-fællesskabet.
(Bifald)
Nu, da vi har data til at nære
vor computer-hjerne
er vi klar til at tage fat på
selve algoritmerne.
Det viste sig at overfloden af information
som ImageNet gav
passede perfekt til en særlig klasse af
maskinlærings-algoritmer

English: 
In both quantity and quality,
this was an unprecedented scale.
As an example, in the case of cats,
we have more than 62,000 cats
of all kinds of looks and poses
and across all species
of domestic and wild cats.
We were thrilled
to have put together ImageNet,
and we wanted the whole research world
to benefit from it,
so in the TED fashion,
we opened up the entire data set
to the worldwide
research community for free.
(Applause)
Now that we have the data
to nourish our computer brain,
we're ready to come back
to the algorithms themselves.
As it turned out, the wealth
of information provided by ImageNet
was a perfect match to a particular class
of machine learning algorithms

Polish: 
Zarówno pod względem ilości, jak i jakości
ta baza była unikalna.
Na przykład
mieliśmy ponad 62 000 zdjęć kotów
wszystkich rodzajów, w różnych pozach
kotów domowych i dzikich, 
z najróżniejszych gatunków.
Byliśmy tak podekscytowani 
stworzeniem ImageNet,
że chcieliśmy, aby cały naukowy świat 
mógł z tego projektu korzystać,
więc, podobnie jak TED, 
udostępniliśmy wszystkie dane
za darmo.
(Brawa)
Mając dane do zasilenia 
komputerowego mózgu,
byliśmy gotowi wrócić do algorytmów.
Jak się okazało, bogactwo informacji
dostarczonych przez ImageNet
doskonale odpowiadało konkretnej klasie 
algorytmów systemów uczących się,

iw: 
הנקראים רשת עצבים מורכבת,
שפרצו דרך על ידי 
קוניהיקו פוקושימה, ג'ף הינטון ויאן לה-קון
בשנות ה-70 וה-80.
בדיוק כמו שהמוח מכיל מיליארדי נוירונים 
המחוברים היטב,
יחידת הפעלה בסיסית ברשת הנויראלית
היא הצומת מנתב המידע דמוי נוירון.
הוא מקבל מידע מצמתים אחרים
ושולח אותם לאחרים.
יתרה מזו, מאות אלפי 
או אולי אפילו מיליוני הצמתים
מאורגנים בשכבות היררכיות,
גם כן בדומה למוח.
ברשת נויראלית טיפוסית אנו משתמשים
כדי לאמן את המודל זיהוי האובייקטים שלנו,
יש בו 24 מיליון צמתים,
140 מיליון משתנים,
ו-15 מיליארד קשרים.
זה מודל ענק.
המונע על ידי מידע נתונים עצום מאימג'נט

French: 
le réseau de neurones à convolution,
développé par Kunihiko Fukushima,
Geoff Hinton et Yann LeCun
dans les années 1970 et 80.
Tout comme le cerveau est composé 
de milliards de neurones connectés,
l'unité de base d'un réseau neuronal
est le nœud de type neurone.
Il reçoit des informations d'autres nœuds
et en envoie à d'autres.
De plus, ces centaines de milliers
voire millions de nœuds
sont organisés en couches hiérarchiques,
similaires au cerveau.
Dans le réseau neuronal classique
que nous utilisons,
il y a 24 millions de nœuds,
140 millions de paramètres,
et 15 milliards de connexions.
C'est un modèle énorme.
Avec la puissance des données d'ImageNet

Modern Greek (1453-): 
που ονομάζονται συνελικτικά
νευρωνικά δίκτυα,
που αναπτύχθηκε απ' τους Τζεφ Χίντον,
Κουνιχίκο Φουκοσίμα και Γιάν ΛεΚούν
στις δεκαετίες του '70 και το '80.
Όπως ο εγκέφαλος αποτελείται από
δισεκατομμύρια διασυνδεδεμένους νευρώνες,
η βασική λειτουργική ενότητα
σε ένα νευρωνικό δίκτυο
είναι ένας κόμβος-νευρώνας.
Δέχεται σήματα εισόδου από άλλους κόμβους
και στέλνει σήματα εξόδου σε άλλους.
Επιπλέον, αυτοί οι εκατοντάδες χιλιάδες
ή εκατομμύρια κόμβοι
είναι οργανωμένοι σε ιεραρχικά στρώμματα,
επίσης παρόμοια με αυτά του εγκεφάλου.
Ένα τυπικό νευρωνικό δίκτυο 
που χρησιμοποιούμε για να εκπαιδεύσουμε
το μοντέλο αναγνώρισης αντικειμένων,
έχει 24 εκατομμύρια κόμβους,
140 εκατομμύρια παραμέτρους
και 15 δισεκατομμύρια συνδέσεις.
Είναι ένα τεράστιο μοντέλο.
Ωθούμενο από τα μαζικά δεδομένα
του ImageNet

Italian: 
chiamata rete neurale,
innovazione di Kunihiko 
Fukushima, Geoff Hinton e Yann LeCun
negli anni '70 e '80.
Proprio come il cervello è fatto
di miliardi di neuroni ben collegati,
un'unità operativa 
elementare in una rete neurale
è un nodo tipo neurone.
Prende input di altri nodi
e invia output a altri.
Inoltre quelle centinaia 
di migliaia o persino milioni di nodi
sono organizzate in strati gerarchici,
anche simili al cervello.
In una tipica rete neurale usata per
addestrare il modello di riconoscimento
ci sono 24 milioni di nodi,
140 milioni di parametri
e 15 miliardi di connessioni.
È un modello enorme.
Alimentata dai dati di ImageNet

Thai: 
เรียกว่าเครือข่ายประสาทแบบม้วนขด
ผู้บุกเบิกคือ Kunihiko Fukushima, 
Geoff Hinton และ Yann LeCun
ย้อนกลับไปในทศวรรษ 1970 และยุค 1980
มีเซลล์ประสาทที่เชื่อมต่อกัน
อย่างมากถึงพันล้าน เหมือนสมอง
หน่วยปฏิบัติการพื้นฐานใน
เครือข่ายประสาทเทียม
เป็นโหนดแบบเซลล์ประสาท
ใช้อินพุตจากโหนดอื่น
และส่งข้อมูลไปยังโหนดอื่น
นอกจากนี้ นับร้อยนับพันหรือนับล้านๆ โหนด
ถูกจัดอยู่ในชั้นลำดับชั้น
ยังคล้ายกับสมอง
ในเครือข่ายประสาททั่วไป เราการฝึกซ้อม
รูปแบบการจดจำวัตถุของเรา
มี 24 ล้านโหนด
140 ล้านพารามิเตอร์
และการเชื่อมต่อ 15 พันล้าน
นั่นเป็นรูปแบบที่ยิ่งใหญ่
ขับเคลื่อนด้วยข้อมูลขนาดใหญ่จาก ImageNet

Czech: 
se nazývaly konvoluční neuronová síť,
vytvořené Kunihikem Fukushimou,
Geoffem Hintonem a Yannem LeCunem
během 70. a 80. let 20. století.
Stejně jako se mozek skládá z miliard
vzájemně propojených neuronů,
základní operační jednotkou 
v neuronové síti
je uzel podobný neuronu.
Vstup si vezme od jiných uzlů
a pošle výstup dalším.
Navíc tyto stovky tisíc či dokonce
miliony uzlů
jsou organizovány v hierarchistických 
vrstvách,
podobně jako v mozku.
V klasické neuronové síti, kterou
používáme,
abychom naučili náš model
rozpoznávání objektů
je 24 milionů uzlů,
140 milionů parametrů
a 15 miliard spojení.
To je obrovský model.
Poháněný ohromným množstvím dat
z ImageNet

Romanian: 
numită rețea neuronală convolutivă,
inițiată de Kunihiko Fukushima, 
Geoff Hinton și Yann LeCun
în anii '70 și '80.
La fel cum creierul constă în miliarde 
de neuroni interconectați,
o unitate elementară operațională 
dintr-o rețea neuronală
e un nod asemănător neuronului.
Primește impulsuri de la unele noduri
și trimite impulsuri altora.
Mai mult, aceste sute de mii 
sau chiar milioane de noduri
sunt organizate în straturi ierarhice,
şi ele similare creierului.
Într-o rețea neuronală tipică folosită la
antrenarea recunoașterii obiectelor
sunt 24 de milioane de noduri,
140 de milioane de parametri
și 15 miliarde de conexiuni.
E un model enorm.
Alimentată de datele masive din ImageNet

Dutch: 
die convolutioneel neuraal netwerk heet,
het eerst aangepakt door Kunihiko
Fukushima, Geoff Hinton en Yann LeCun,
in de jaren zeventig en tachtig.
Net als in de hersenen,
die bestaan uit miljarden 
goedverbonden neuronen,
is de basiseenheid 
van een neuraal netwerk
een neuronenachtig knooppunt.
Het ontvangt input
van andere knooppunten
en stuurt output naar andere.
Deze honderdduizenden, 
of zelfs miljoenen knooppunten
zijn bovendien
in hiërarchische lagen georganiseerd.
Ook weer net als in de hersenen.
In een neuraal netwerk dat we gebruiken
om voorwerpherkenning te trainen,
zitten 24 miljoen knooppunten,
140 miljoen parameters,
en 15 miljard verbindingen.
Dat is een gigantisch model.
Mogelijk gemaakt door de enorme
hoeveelheid gegevens van IMageNet

Hungarian: 
amit konvolúciós neurális hálónak hívunk,
és aminek Kunihiko Fukushima, Geoff Hinton
és Yann LeCun voltak az úttörői
régen az 1970-es és '80-as években.
Ahogyan az agyban egymáshoz szorosan 
kapcsolódó idegsejtek milliárdjai vannak,
ugyanúgy egy neurális háló 
operációs alapegysége
egy neuronszerű csomópont.
Ez bemenő adatokat fogad
más csomópontoktól
és kimenő adatokat küld a többinek.
Ezen kívül, ez a több százezer 
vagy akár több millió csomópont
hierarchikus rétegekbe szerveződött,
az agyhoz hasonlóan.
A tárgyfelismerési modellünk 
tanítására használt tipikus hálózat
24 millió csomópontot,
140 millió paramétert
és 15 milliárd kapcsolatot tartalmaz.
Ez egy hatalmas modell.
E hatalmas modell tanításához használt
óriási ImageNet-es adatmennyiségnek,

Danish: 
kaldet sammenfoldede neurale netværk,
udviklet af Kunihiko Fukushima,
Geoff Hinton og Yann LeCun
i 1970´erne og 80´erne.
Ligesom hjernen består af milliarder af
sammenkædede neuroner,
er et grundlæggende armatur i et 
neuralt netværk
som en neuron-lignende node.
Det tager input fra andre noder
og sender output til andre.
Disse hundrede tusinder eller endda
millioner af noder
er organiseret i hierarkiske lag,
ligesom i hjernen.
I et typisk neuralt netværk vi bruger
til at træne vor objekt-genkendelsesmodel,
er der 24 millioner knuder,
140 millioner parametre,
og 15 milliarder tilslutninger.
Det er en enorm model.
Drevet af de massive data fra ImageNet,

Chinese: 
称作“卷积神经网络”，
最早由Kunihiko Fukushima，Geoff Hinton，
和Yann LeCun在上世纪七八十年代开创。
就像大脑是由上十亿的
紧密联结的神经元组成，
神经网络里最基础的运算单元
也是一个“神经元式”的节点。
每个节点从其它节点处获取输入信息，
然后把自己的输出信息再交给另外的节点。
此外，这些成千上万、甚至上百万的节点
都被按等级分布于不同层次，
就像大脑一样。
在一个我们用来训练“对象识别模型”的
典型神经网络里，
有着2400万个节点，1亿4千万个参数，
和150亿个联结。
这是一个庞大的模型。
借助ImageNet提供的巨大规模数据支持，

Croatian: 
koji se zovu konvolucijske neuronske mreže
osmišljene od strane Kunihiko Fukushime,
Geoff Hintona i Yann LeCuna
davnih 1970-ih i 1980-ih.
Upravo kako se mozak sastoji
od milijardu vrlo povezanih neurona,
osnovna operacijska jedinica
neuronskih mreža
jest čvor sličan neuronu.
Prima podatke od drugih čvorova
i šalje ih drugima.
Ove stotine tisuća ili
čak milijuni čvorova
su organizirani po
hijerarhijskim slojevima
sličnim onima u mozgu.
U tipičnoj neuralnoj mreži koju koristimo
u učenju prepoznavanja modela,
ima 24 milijuna čvorova,
140 milijuna parametara,
i 15 milijardi veza.
To je ogroman model.
Upogonjen je s 
mnoštvom podataka s ImageNet-a

Spanish: 
de aprendizaje automático llamado 
red neuronal convolucional,
ideado por Kunihiko Fukushima,
Geoff Hinton y Yann LeCun
en los años 70 y 80.
Como el cerebro que tiene miles de 
millones de neuronas muy bien conectadas,
la unidad operativa fundamental
en una red neuronal
es un nodo con forma de neurona.
Toma datos de otros nodos
los procesa y los manda
a otros nodos.
Además, estos cientos de miles
o incluso millones de nodos
se organizan en capas jerárquicas,
algo parecido al cerebro.
En una red neuronal típica 
que usamos para entrenar
nuestro modelo de 
reconocimiento de objetos
hay 24 millones de nodos,
140 millones de parámetros
y 15 000 millones de conexiones.
Es un modelo enorme.
Alimentado por la información 
masiva de ImageNet

Persian: 
به نام "شبکه های عصبی در هم تنیده"
تطابق داشت،
که پیشگامانش کونیهیکو فوکوشیما و
جف هینتون و یان لیکان
در دهه‎های ۱۹۷۰ و ۱۹۸۰ بودند.
درست مثل مغز که از میلیاردها
نورون پیوسته تشکیل شده
یک واحد عملیاتی بنیادی در یک شبکه عصبی
یک گره نورون-مانند است.
از گره‎های دیگر ورودی می‎گیرد و
و خروجی را به دیگر گره‎ها می‎فرستند.
به علاوه، این صدها یا هزاران یا حتی
میلیونها گره
در لایه‎هایی با سلسله مراتب منظم شده‎اند،
مانند مغز.
در یک شبکه عصبی نوعی، برای آموزش
مدل تشخیص اشیا،
۲۴ میلیون گره،
۱۴۰ میلیون پارامتر،
و ۱۵ میلیارد اتصال وجود دارد.
این یک مدل عظیم است.
با استفاده از نیروی عظیم داده ها
از ImageNet

English: 
called convolutional neural network,
pioneered by Kunihiko Fukushima,
Geoff Hinton, and Yann LeCun
back in the 1970s and '80s.
Just like the brain consists
of billions of highly connected neurons,
a basic operating unit in a neural network
is a neuron-like node.
It takes input from other nodes
and sends output to others.
Moreover, these hundreds of thousands
or even millions of nodes
are organized in hierarchical layers,
also similar to the brain.
In a typical neural network we use
to train our object recognition model,
it has 24 million nodes,
140 million parameters,
and 15 billion connections.
That's an enormous model.
Powered by the massive data from ImageNet

Japanese: 
畳み込みニューラルネットワークと言って
福島邦彦 ジェフリー・ヒントン 
ヤン・ルカンといった人たちが
1970年代から1980年代にかけて
開拓した領域です
脳が何十億という高度に結合し合った
ニューロンからできているように
ニューラルネットワークの
基本要素となっているのは
ニューロンのようなノードです
他のノードからの入力を受けて
他のノードへ出力を渡します
何十万 何百万という
このようなノードが
これも脳と同様に
階層的に組織化されています
物を認識するモデルを訓練するために
私たちが通常使うニューラルネットワークには
2千4百万のノード
1億4千万のパラメータ
150億の結合があります
ものすごく大きなモデルです
ImageNetの膨大なデータと

Turkish: 
özel bir sınıfıyla mükemmel bir şekilde
eşleşmişti,
öncülüğünü Kunihiko Fukushima,
Geoff Hinton ve Yann LeCun'un yaptığı
1970 ve 80'lerin öncesindeki bir alan.
Beyinde meydana gelen milyarlarca
yüksek bağlantılı sinirler gibi,
sinir ağının basit bir çalışma birimine
"nöron benzeri" düğümü deniyor.
Başka düğümlerden girdi alıyorlar
ve diğer düğümlere gönderiyorlar.
Dahası, bu yüzbinlerce hatta milyonlarca
düğüm
hiyerarşik tabakalarla düzenleniyorlar
tıpkı beyin gibi.
Normal bir sinir ağında nesne tanıma
modelimizi eğitmek için,
24 milyon düğüm,
140 milyon değişken,
ve 15 milyar bağlantı kullandık.
Bu muazzam bir modeldi.
ImageNet'den elde edilen büyük veri ile

Korean: 
이를 합성곱 신경망이라고 합니다.
쿠니히코 후쿠시마, 
제프리 힌튼, 양 루캉이
1970~80년대에 개척한 영역이죠.
마치 뇌가 고도로 연결된 뉴런
수십억개로 구성된 것처럼
신경망의 기본 단위는
뉴런과 같은 노드입니다.
다른 노드에서 입력을 받고
다른 노드로 출력을 보냅니다.
게다가 이런 수십만, 수백만의 노드는
계층 형태로 조직화됩니다.
뇌와 마찬가지죠.
우리가 사물 인식 모델을 훈련하려고
사용한 전형적인 신경망에는
2천4백만의 노드,
1억4천만의 매개변수,
150억의 결합이 존재합니다.
어마어마한 모델이죠.
이미지넷의 방대한 데이터와

Polish: 
a konkretnie sieciom neuronowym
zapoczątkowanym przez Kunihiko Fukushimę, 
Geoffa Hintona oraz Yanna LeCuna
w latach 70. i 80.
Podobnie jak mózg składa się z miliardów 
połączonych ze sobą komórek nerwowych,
podstawową jednostką operacyjną
w sieci neuronowej
jest węzeł przypominający taki neuron.
Pobiera on dane wejściowe z innych węzłów
i przekazuje innym dane wyjściowe.
Co więcej te miliony węzłów
są zorganizowane w hierarchiczne warstwy,
podobnie jak mózg.
W sieci neuronowej, której użyliśmy
były 24 miliony węzłów,
140 milionów parametrów,
i 15 miliardów połączeń.
To jest olbrzymi model.
Zasilona wielką ilością danych z ImageNet,

Ukrainian: 
який називається
"згорнутою нейронною мережею",
що була розроблена Куніхіко Фукушімою,
Геоффом Гінтоном та Янном Лекуном
у 1970 - 80-х роках.
Подібно до мозку, який складається
з мільйонів поєднаних нейронів,
базова операційна одиниця 
в нейронній мережі
складається з нейроноподібних вузлів.
Вона приймає інформацію від одних вузлів
і передає її до інших.
Більше того, ці сотні тисяч,
або навіть мільйони вузлів
організовані в ієрархічні шари,
так само, як і мозок.
Типова нейронна мережа, яку
ми використовуємо для тренування
нашої моделі розпізнавання об'єкту,
має 24 мільйони вузлів,
140 мільйонів параметрів
і 15 мільярдів зв'язків.
Це величезна модель.
Оснащена великою кількістю даних
з ImageNet

Portuguese: 
chamada "rede neural convolucional",
iniciada por Kunihiko Fukushima,
Geoff Hinton e Yann LeCun
nos anos 1970 e 1980.
Assim como o cérebro é composto de bilhões
de neurônios altamente conectados,
uma unidade operacional básica
numa rede neural
é como um nó neuronal.
Ela obtém informações de outros nós
e envia dados para outros.
Além disso, essas centenas de milhares,
ou mesmo milhões de nós,
são organizadas em camadas hierárquicas,
parecidas com o cérebro.
Numa rede neural que usamos para treinar
nosso modelo de reconhecimento de objetos
há 24 milhões de nós,
140 milhões de parâmetros
e 15 bilhões de conexões.
É um modelo enorme.
Alimentada pelos dados
consideráveis do ImageNet

Vietnamese: 
gọi là mạng lưới nơ ron đan chéo,
tiên phong bởi Kunihiko Fukushima,
Geoff Hinton, và Yann LeCun
từ những năm 1970 và 1980
Giống như não bộ, nó bao gồm hàng triệu
những nơ ron kết nối chặt chẽ với nhau,
một đơn vị cơ bản trong mạng lưới neron
là những nút giống như neron
Cần phải có dữ liệu đầu vào từ nút này
và gửi dữ liệu đầu ra cho nút khác.
Hơn nữa, hàng trăm ngàn 
hoặc thậm chí hàng triệu nút
được sắp xếp trong những lớp trật tự,
cũng gần giống như não bộ.
Trong mạng lưới điển hình chúng tôi dùng
để huấn luyện những mẫu nhận diện vật thể
có 24 triệu nút,
140 triệu thông số,
và 15 tỉ liên kết.
Đó là một mẫu cực kỳ lớn.
Hỗ trợ bởi dữ liệu khổng lồ từ ImageNet

Albanian: 
të machine learning, që quhen 
convolutional neural network,
të aplikuar fillimisht nga Kunihiko 
Fukushima, Geoff Hinton, dhe Yann LeCun
ne vitet '70 dhe '80.
Ashtu si truri që përbëhet nga miliarda
neurone të lidhura ngushtë,
njësia baze operative e një rrjeti 
neuronesh (neural network)
është një nyje e ngjashme me neuronin.
Ajo merr të dhëna nga nyjet e tjera
dhe i dërgon rezultatin e përpunimit 
të tjerave.
Për më tepër, këto qindra mijra 
madje edhe miliona nyje
janë të organizuara në shtresa hierarkike,
gjithashtu të ngjashme me trurin.
Në një rrjet tipik neuronesh për të 
trajnuar modelin për njohjen e objekteve,
ndodhen 24 milion nyje,
140 milion parametra,
dhe 15 miliardë lidhje.
Ky është një model gjigand.
Falë të dhënave masive ofruar nga ImageNet

Portuguese: 
designada por "rede neural convoluta",
lançada por Kunihiko Fukushima,
Geoff Hinton e Yann LeCun,
nos anos 70 e 80.
À semelhança do cérebro,
formado por milhares de milhões
de neurónios altamente ligados,
uma operação unitária básica
numa rede neural
é idêntica a um nodo de neurónios.
Esse nodo recebe e envia informações
de outros nodos e para outros nodos.
Além disso, essas centenas de milhares
ou mesmo milhões de nodos
estão organizados em camadas hierárquicas,
à semelhança do que se passa no cérebro.
Numa rede neural típica que usamos,
para treinar o modelo
de reconhecimento de objetos
existem 24 milhões de nodos,
140 milhões de parâmetros
e 15 mil milhões de ligações.
É um modelo enorme.
Abastecido pelos imensos dados do ImageNet

Chinese: 
我們稱它為「卷積神經網絡」，
在七零及八零年代，福島邦彥、Geoff Hinton
和 Yann LeCun 等學者為該領域的先驅。
正如同大腦是由無數個緊密連結的神經元所組成，
神經網絡的基本運作單位
也是一個類神經元的節點。
它的運作方式是從別的節點得到資料，
然後再傳給其他的節點。
而且這些數不清的節點
擁有層層的組織架構，
就好像我們的大腦一樣。
在一般的神經網絡中，
我們用作訓練的物品辨識模型
就有兩千四百萬個節點、
一億四千萬個參數，
以及一百五十億個連結。
這是一個大的不得了的模型。
由ImageNet 提供巨大的資料群、

Arabic: 
يُسمى الشبكة العصبية الملتفّة
أسسها كونيهيكو فوكوشيما
وجيف هينتون ويان لي كًن
وذلك في السبعينات والثمانينات
من القرن الماضي
تمامًا كما أن الدماغ يتكون من
مليارات الأعصاب المتصلة بقوة
فإن الوحدة التشغيلية الأساسية
في الشبكة العصبية
هي العقدة العصبية
هذه العقدة تأخذ مدخلاتها من عُقَد أخرى
وترسل مخرجاتها لعُقَد أخرى
أيضًا، فإن مئات الآلاف
أو حتى الملايين من هذه العُقَد
مرتبة في طبقات هرمية
شبيهة جدا بالدماغ
في الشبكة العصبية النمطية، اعتدنا أن
ندرب نموذج التعرف على الأشياء الخاص بنا
والذي لديه 24 مليون عقدة
و140 مليون متغير
و15 مليار وصلة
هذا نموذج ضخم
مدعوم بكم هائل من البيانات من ImageNet

Russian: 
который называется 
свёрточная нейронная сеть,
начало которому положили 
Кунихико Фукушима, Джефф Хинтон
и Ян ЛеКун ещё в 1970-е и 80-е годы.
Так же как и в мозге, состоящем
из миллиардов взаимосвязанных нейронов,
простейшей операционной единицей 
нейронной сети
является нейроподобный узел.
Он принимает входные данные
от одних узлов
и отправляет выходные данные другим.
Более того, сотни тысяч 
или даже миллионы таких узлов
упорядочены по иерархическим уровням,
также по аналогии с человеческим мозгом.
В обычной нейронной сети,
которую мы используем для обучения
нашей модели распознавания, 
содержится 24 миллиона узлов,
140 миллионов параметров
и 15 миллиардов связей.
Эта модель огромна.
Функционирующая
на основе базы ImageNet

Chinese: 
並使用先進的核心處理器及圖型處理器來訓練
這個龐然大物，
卷積神經網絡就在眾人的意料外
開花結果了。
在物品辨識領域中，這樣的架構
以令人興奮的嶄新成果，傲視群雄。
電腦告訴我們
這張圖中有隻貓，
還告訴我們貓在哪裡。
當然，這世界不會只有貓，
電腦的演算告訴我們
這張圖中有一個男孩和一隻泰迪熊；
有狗，一個人，以及背景中的一支小風箏；
或這一張令人眼花撩亂的圖，
有人、滑板、欄杆、路燈，等等。
有時候，如果電腦不確定自己所見到的東西時，
我們已經將它教到可以聰明地
給一個安全的答案，而非莽撞地回答，

Albanian: 
dhe CPU-të dhe GPU-të moderne
për trajnimin e nje modeli kaq të madh,
rrjeti konvolucional i neuroneve
(convolutional neural network)
lulëzoi në një mënyrë që askush se priste.
U kthye në një arkitekturë fitimtare
për gjenerimin e rezultateve të reja
në identifikimin e objekteve.
Ky është një kompjuter duke na treguar
se ky imazh përmban një mace
dhe vendin ku macja ndodhet.
Sigurisht ekzistojnë dhe gjëra të tjera
përvec maceve,
pra ja një algoritëm komjuterik 
duke na treguar
se imazhi përmban nje djalë 
dhe një arush teddy;
një qen, një person, dhe një balonë 
të vogël në sfond;
apo një imazh shumë i ngarkuar me objekte
si një burrë, një skateboard, 
kangjella, e kështu me rradhë.
Ndonjëherë, kur kompjuteri nuk është
mjaft i sigurt për atë që sheh,
ne e kemi mësuar të tregohet i zgjuar
e të na jap nje përgjigje të vagët por 
më të sigurt, në vend që t'ia fusë kot

Persian: 
و CPU و GPU های مدرن
برای آموزش چنین مدل یکدستی،
"شبکه عصبی در هم تنیده"...
به شکلی که کسی انتظار نداشت 
شکوفا شد.
تبدیل شد به معماری برتر
برای تولید نتایج تازه و هیجان انگیز
در تشخیص اشیا.
این یک کامپیوتر هست که به ما میگه
این تصویر شامل یک گربه است
و اینکه گربه کجاست.
البته چیزهای بیشتری از گربه وجود دارد،
پس این یک الگوریتم رایانه‎ای
هست که به ما می‎گوید
تصویر شامل یک پسر هست
و یک عروسک خرس؛
یک سگ، یک آدم، و بادبادک کوچک
در پس زمینه؛
یا تصویر چیزهای شلوغ‎تر
مثل یک مرد، تخته اسکیت، نرده‎ها، 
تیر چراغ برق و چیزهای دیگر.
بعضی وقتها که رایانه مطمئن نیست
از چیزی که به آن نگاه می‎کند،
بهش یاد دادیم که به اندازه کافی باهوش باشد
تا به جای کار زیادی یک جواب مطمئن
به ما بدهد،

Thai: 
และซีพียูและ GPU ที่ทันสมัยใน
การฝึกซ้อมแบบจำลองที่ใหญ่มาก
เครือข่ายประสาทแบบม้วนขด
เบ่งบานในแบบที่ไม่มีใครเคยคาดหวัง
กลายเป็นสถาปัตยกรรมที่ชนะ
เพื่อสร้างผลลัพธ์ใหม่ที่น่าตื่นเต้น
ในการจดจำวัตถุ
นี่คือคอมพิวเตอร์ที่บอกเรา
ว่าภาพนี้มีแมว
และแมวอยู่ที่ไหน
แน่นอนว่า มีอะไรมากกว่าแมว
ดังนั้น นี่คืออัลกอริทึมของ
คอมพิวเตอร์ที่บอกเรา
ภาพมีเด็กผู้ชายและตุ๊กตาหมี
สุนัข บุคคล และว่าวขนาดเล็กในพื้นหลัง
หรือภาพของสิ่งที่ยุ่งมากๆ
เหมือนชายคนหนึ่ง สเก็ตบอร์ด 
ราว เสาไฟ และสิ่งอื่นๆ
บางครั้ง เมื่อคอมพิวเตอร์
ไม่ค่อยมั่นใจในสิ่งที่มองเห็น
เราได้สอนให้ฉลาดพอ
เพื่อให้เราคำตอบที่ปลอดภัยแทน
การกระทำที่มั่นใจมากเกินไป

Modern Greek (1453-): 
και από σύγχρονους μικροεπεξεργαστές
για την εκμάθηση αυτού του μοντέλου,
το συνελικτικό νευρωνικό δίκτυο
«άνθισε» με τρόπο που κανείς δεν περίμενε.
Έγινε η νικήτρια αρχιτεκτονική
που γέννησε συναρπαστικά αποτελέσματα
στην αναγνώριση αντικειμένων.
Αυτός είναι ένας υπολογιστής που μας λέει
ότι αυτή η εικόνα περιέχει μια γάτα
και πού βρίσκεται αυτή η γάτα.
Υπάρχουν κι άλλα πράγματα
εκτός από γάτες,
εδώ ο αλγόριθμος μας λέει
ότι η εικόνα περιέχει ένα αγόρι
και ένα αρκουδάκι,
έναν σκύλο, έναν άνθρωπο
και έναν μικρό χαρταετό στο βάθος,
ή μια εικόνα με πολλά πράγματα
όπως ένας άντρας, ένα σκέιτμπορντ, 
κάγκελα, μια κολώνα και λοιπά.
Μερικές φορές, όταν ο υπολογιστής δεν
είναι και τόσο σίγουρος για το τι βλέπει,
του μάθαμε να είναι αρκετά έξυπνος
ώστε να μας δίνει μια ασφαλή απάντηση
αντί να δεσμευτεί σε κάτι συγκεκριμένο,

iw: 
ויחידות העיבוד המרכזיות והמעבדים הגרפיים
לאימון מודל כזה כביר,
הרשת הנויראלית המורכבת
פרחה בצורה שאף אחד לא ציפה לה.
זה הפך להיות הארכיטקטורה המנצחת
ביצירת תוצאות חדשות ומרגשות 
בזיהוי אובייקטים.
זה מחשב שאומר לנו
שהתמונה הזו מכילה חתול
ואיפה נמצא החתול.
כמובן שיש יותר דברים מחתולים,
אז הנה אלגוריתם של מחשב אומר לנו
שהתמונה מכילה ילד ובובת דובי;
כלב, אדם, ועפיפון קטן ברקע;
או תמונה של דברים מאוד עסוקים
כמו איש, סקייטבורד, מעקות,
עמוד תאורה וכן הלאה.
לפעמים, כשהמחשב לא בטוח לגמרי
במה שהוא רואה,
לימדנו אותו להיות חכם מספיק
כדי לתת לנו תשובה בטוחה 
במקום להתחייב יותר מדי,

Italian: 
e dalle moderne CPU e GPU 
per addestrare un modello così immenso,
la rete neurale convoluzionale
è sbocciata in un modo 
che nessuno si aspettava.
È diventata l'architettura vincente
che genera risultati eclatanti 
nel riconoscimento degli oggetti.
Questo è un computer che ci dice
che in questa foto c'è un gatto
e dov'è il gatto.
Certo ci sono anche 
altre cose oltre ai gatti
quindi ecco 
un algoritmo informatico che ci dice
che nella foto ci sono
un ragazzo e un orsacchiotto;
un cane, una persona e
un aquilone sullo sfondo;
o una foto di molte cose curiose
come un uomo, uno skateboard,
ringhiere, un lampione e così via.
A volte quando il computer non 
è tanto sicuro di quello che vede,
gli insegnamo a 
essere abbastanza intelligente
da darci una risposta 
sicura invece d'impegnarsi troppo,

Vietnamese: 
và những CPUs và GPUs hiện đại
để huấn luyện cho một mẫu cực lớn.
mạng lưới những nơ ron đan chéo
phát triển đến mức
không ai có thể dự đoán được.
Nó trở thành kiến trúc được dùng để
điều hành những kết quả mới xuất hiện 
trong nhận diện vật thể.
Đây là một chiếc máy tính
nói với chúng ta rằng
bức hình này bao gồm một con mèo
và nơi mà con mèo đang ở.
Dĩ nhiên là còn nhiều thứ hơn là con mèo,
nên đây là một thuật toán
nói với chúng ta rằng
bức hình này bao gồm 
một đứa trẻ và một con gấu teddy;
một con chó, một người,
và một con diều nhỏ ở phía sau;
hay một bức tranh của những thứ lộn xộn
như một người, một tấm ván trượt,
tay vịn, một cái đèn đường, vân vân.
Đôi lúc, khi chiếc máy vi tính không chắc 
về những gì mà nó thấy,
chúng tôi đã dạy nó trở nên thông minh đủ
để cho chúng ta một câu trả lời an toàn 
thay vì phụ thuộc quá nhiều,

Korean: 
현대의 CPU와 GPU에 힘입어
합성곱 신경망은
아무도 예상치 못한 방식으로
꽃피었습니다.
사물의 인식에 있어
흥미롭고도 새로운 결과를 내는 
우수한 구조가 되었습니다.
이 컴퓨터는 우리에게
이 사진에 고양이가 있는지,
어디에 있는지 말해줍니다.
물론 고양이 이외의 것도
인식할 수 있고,
여기서 컴퓨터 알고리즘은 사진 속에
소년과 테디 베어가 있다고 말해줍니다.
개, 사람, 배경에 작은 연이 있습니다.
또는 많은 것이 찍힌 사진에서
사람, 스케이트 보드, 난간, 
가로등 같은 것을 가려냅니다.
때때로 컴퓨터가 보는 것이 무엇인지
확신하지 못할 때는
우리는 컴퓨터를 가르쳐서
억측을 하기 보다는
안전한 대답을 하게 합니다.

French: 
et les processeurs modernes
pour traiter cet énorme modèle,
le réseau de neurones à convolution
s'est transformé de manière inattendue.
Il est devenu l'architecture idéale
pour générer des résultats fabuleux
en reconnaissance d'objets.
Ceci est un ordinateur qui nous dit
que la photo contient un chat
et où est ce chat.
Bien sûr, il y a
autre chose que des chats.
Ici un algorithme nous dit
que la photo contient un garçon
et un ours en peluche,
un chien, une personne, 
et un cerf-volant en arrière-plan.
Ici, beaucoup d'activités
avec un homme, un skateboard, une rampe,
un lampadaire, etc.
Parfois l'ordinateur n'est pas trop sûr,
nous lui avons appris à être 
assez intelligent
pour donner une réponse sûre,
sans trop s'engager,

Japanese: 
現代のCPUやGPUの性能を使って
このような巨大なモデルを訓練することで
畳み込みニューラルネットワークは
誰も予想しなかったくらいに
大きく花開きました
これは物の認識において
目覚ましい結果を出す
大当たりのアーキテクチャとなっています
ここではコンピュータが
写真の中にネコがいることと
その場所を示しています
もちろんネコ以外のものも
認識できます
こちらではコンピュータアルゴリズムが
写真の中に男の子とテディベアが
写っていることを教えています
犬と 人物と 後方に小さな凧が
あることを示しています
とても沢山のものが
写った写真から
男性 スケートボード 手すり 
街灯などを見分けています
写っているものが何なのか コンピュータが
そんなに自信を持てない場合もあります [動物]
コンピュータには
当て推量をするよりは
確かなところを答えるよう
教えています

Polish: 
działająca dzięki nowoczesnym 
procesorom CPU i GPU
sieć neuronowa rozwinęła się w sposób,
którego nikt się nie spodziewał.
Stała się najlepszą architekturą
do osiągnięcia fascynujących rezultatów
w dziedzinie rozpoznawania obrazów.
Ten komputer mówi,
że na obrazku jest kot,
i gdzie ten kot się znajduje.
Oczywiście koty to nie wszystko,
więc tutaj komputer mówi,
że zdjęcie pokazuje chłopca 
i pluszowego misia;
psa, osobę i mały latawiec w tle;
albo zdjęcie pełne obiektów
takich jak mężczyzna, 
deskorolka, poręcz, latarnia.
Czasami, jeśli komputer 
nie jest pewien tego, co widzi,
nauczyliśmy go udzielać
wymijających odpowiedzi,

Ukrainian: 
і сучасними процесорами,
для тренування такої гігантської моделі,
згорнута нейронна мережа
продемонструвала неочікувані результати.
ЇЇ виграшна архітектура
демонструє неймовірні нові результати
у розпізнаванні об'єкта.
Це комп'ютер говорить нам,
що на фото є кіт
і де саме кіт знаходиться.
Звичайно, на фото є й інші речі,
окрім котів,
тож комп'ютерний алгоритм каже нам,
що на фото є хлопець
і плюшевий ведмедик;
собака, людина і маленький
паперовий змій на задньому плані;
або фото, на якому багато всього:
чоловік, скейтборд,
огорожа, ліхтарний стовп і так далі.
У випадках, коли комп'ютер не впевнений
у тому, що він бачить,
ми навчили його бути достатньо розумним
і давати припущення,
а не брати на себе забагато,

Hungarian: 
valamint a modern processzoroknak 
köszönhetően
a konvolúciós neurális háló
senki által nem remélt iramban fejlődött.
Ez lett a nyerő architektúra,
ami izgalmas új eredményeket hozott
az objektumfelismerésben.
Ez egy számítógép, amely megmondja nekünk,
hogy ezen a képen egy macska látható
és hogy a macska hol van.
Természetesen ott nem csak macskák vannak,
ezért itt van egy számítógépes algoritmus,
ami megmondja,
hogy a képen egy fiú 
és egy teddy maci is van;
egy kutya, egy ember, és 
egy kicsi papírsárkány a háttérben;
vagy nagyon mozgalmas dolgoknak egy képe
mint egy férfi, egy gördeszka, korlátok, 
egy lámpaoszlop és így tovább.
Néha, amikor a számítógép nem biztos
benne, hogy mit lát,
megtanítottuk arra, hogy 
kellő biztonsággal válaszoljon,
anélkül, hogy túl határozott lenne,

Romanian: 
și de unitățile moderne de procesare 
pentru a antrena un asemenea model imens,
rețeaua neuronală convolutivă a înflorit
într-un mod neașteptat.
A devenit arhitectura câștigătoare
care a generat noi rezultate captivante 
în recunoașterea obiectelor.
E un computer care ne spune
că e poza unei pisici și unde e pisica.
Sigur că nu există doar pisici,
așa că iată un computer spunându-ne
că poza conține un băiat 
și un urs de pluș,
un cățel, o persoană 
și un mic zmeu în fundal;
sau o poză foarte aglomerată
precum un bărbat, un skateboard, 
balustrade, un felinar și tot așa.
Uneori, când computerul 
nu este foarte sigur de ce vede,
l-am învățat să fie destul de deștept
încât să dea un răspuns sigur 
în loc să se chinuie prea mult,

Chinese: 
通过大量最先进的CPU和GPU，
来训练这些堆积如山的模型，
“卷积神经网络”
以难以想象的方式蓬勃发展起来。
它成为了一个成功体系，
在对象识别领域，
产生了激动人心的新成果。
这张图，是计算机在告诉我们：
照片里有一只猫、
还有猫所在的位置。
当然不止有猫了，
所以这是计算机算法在告诉我们
照片里有一个男孩，和一个泰迪熊；
一只狗，一个人，和背景里的小风筝；
或者是一张拍摄于闹市的照片
比如人、滑板、栏杆、灯柱…等等。
有时候，如果计算机
不是很确定它看到的是什么，
我们还教它用足够聪明的方式
给出一个“安全”的答案，而不是“言多必失”

Danish: 
og de moderne CPU´er og GPU´er brugt til
at træne en så stor model,
begyndte det sammenfoldede neurale netværk
at blomstre på en måde ingen forventede.
Det blev den førende arkitektur
til at genere spændende nye resultater
i objekt-genkendelse.
Dét her er en computer, der fortæller os
at dette billede indeholder en kat
og hvor katten er.
Der er selvfølgelig andre ting end katte
så her er en computer algoritme
der fortæller
at dette billede indeholder en 
dreng og en bamse;
en hund, en person og en 
lille drage i baggrunden;
eller et billede af meget travle ting
som en mand, et skateboard, rækværk,
en lygtepæl, og så videre.
Sommetider, når computeren ikke er så
sikker på hvad den ser,
har den lært at være klog nok
til at give os et sikkert svar i stedet
for at være for skråsikker sig,

Portuguese: 
dos CPUs e GPUs modernos para treinar
um modelo tão pesado quanto este,
a rede neural convoluta
floresceu de um modo que ninguém esperava.
Tornou-se na arquitetura vencedora
para a geração de resultados
sensacionais no reconhecimento de objetos.
Aqui temos um computador a dizer-nos
que esta imagem tem um gato
e a localização do gato na imagem.
É claro que há mais coisas além de gatos,
e assim temos aqui um algoritmo
de computador a dizer-nos
que a imagem contém um rapaz
e um ursinho de peluche,
um cão, uma pessoa
e um pequeno papagaio ao fundo,
ou uma imagem com muitos elementos,
tais como um homem, um "skate",
grades, um poste de iluminação, etc.
Por vezes, quando o computador 
não está seguro do que vê,
ensinámo-lo a ser
suficientemente inteligente
para nos dar uma resposta segura
em vez de se comprometer demasiado,
tal como nós faríamos.

Turkish: 
oldukça muazzam bir modeli eğitmek için
kullanılan modern CPU ve GPU'lar sayesinde
evrişimli sinirsel ağ
hiçbirimizin hayal edemeyeceği bir şekilde
gelişti.
Nesne tanımlamada etkileyeci
yeni sonuçlar üretmek için
başarılı bir mimari olmaya başladı.
Bu bilgisayarın bize söylediği,
bu fotoğrafta bir kedinin olduğu
ve kedinin nerede olduğu.
Elbette orada kedilerden daha fazlası var,
burada ise bilgisayar algoritmasının
bize söylediği
resimde bir çocuk ile oyuncak bir ayının;
bir köpeğin, bir kişinin ve arkaplanda
küçük bir uçurtmanın;
ya da çok karışık bir resimin
bir adam, bir kaykay, korkuluklar, lamba
direği v.b. gibi şeyler olduğu.
Bazen, bilgisayar ne gördüğü hakkında emin
olamayınca
çok fazla düşünmek yerine yeterince
mantıklı bir cevap vermesini öğrettik,

Czech: 
a moderními CPU a GPU k trénování
takto velkého modelu,
konvoluční neuronová síť
kvete tak, jak by nikdo nečekal.
Stala se vítěznou architekturou
k vytváření nových úžasných výsledků
v rozpoznávání objektů.
Toto je počítač, který nám říká,
že na obrázku je kočka
a kde ta kočka je.
Samozřejmě existuje víc věcí než
jen kočky,
takže tady je algoritmus počítače,
který říká,
že obrázek obsahuje chlapce a medvídka,
psa, osobu a malého draka v pozadí,
nebo velice chaotický obrázek plný věcí,
jako je muž, skateboard, zábradlí,
lampa atd.
Někdy, když si počítač není jistý, 
co vidí,
naučili jsme ho, 
aby byl dostatečně chytrý,
a aby odpověděl neutrálně, 
než aby se k něčemu zavázal,

Spanish: 
y las CPUs y GPUs modernas que 
entrenan este inmenso modelo,
la red neuronal convolucional
tuvo un éxito inesperado.
Se volvió la ingeniería ganadora
para generar nuevos y emocionantes
resultados en reconocimiento de objetos.
Esta es una computadora que nos dice
que la foto tiene un gato
y dónde está el gato.
Desde luego hay más cosas
aparte de los gatos
así que hay un algoritmo
informático que nos dice
que hay un niño y un oso
de peluche en la foto;
un perro, una persona
y un papalote al fondo;
o una foto de cosas muy ocupadas
como un hombre, una patineta,
un barandal, una lámpara etc.
A veces, cuando la computadora
no está segura de lo que ve,
le hemos enseñado
a darnos una respuesta segura
en lugar de comprometer su respuesta,

Dutch: 
en moderne processoren
om zo'n gigantisch model te trainen,
kwam het convolutioneel
neuraal netwerk tot bloei,
op een manier die niemand had verwacht.
Het werd de architectuur
die de meeste opwindende 
nieuwe resultaten leverde
op het gebied van voorwerpherkenning.
Dit is een computer die ons vertelt
dat op deze foto een kat staat
en waar de kat is.
Er zijn natuurlijk meer dingen dan katten.
Hier is een computeralgoritme dat zegt
dat op deze foto
een jongen met teddybeer staat,
een hond, een persoon
en een vliegertje op de achtergrond,
of een foto met veel dingen,
zoals een man, een skateboard,
een hek, een lantaarnpaal, enzovoort.
Soms, als de computer het
niet helemaal zeker weet,
hebben we hem geleerd
slim genoeg te zijn
om een veilig antwoord te geven
in plaats van te veel prijs te geven,

Russian: 
при помощи современных микропроцессоров
для обучения этой огромной модели,
свёрточная нейронная сеть
превзошла все ожидания.
Она позволила создать
эффективную систему
для получения новых многообещающих
результатов в распознавании объектов.
Вот компьютер, который говорит нам,
что на картинке есть кот
и где этот кот находится.
Конечно, на картинках не только коты.
Вот компьютер, который сообщает нам,
что на фото мальчик и плюшевый мишка,
собака, человек, и маленький
воздушный змей на заднем фоне.
Или фотография с большим 
количеством объектов:
мужчина, скейтборд,
перила, фонарь и т.д.
Когда компьютер не уверен в том, 
что он видит,
он обучен действовать по-умному
и давать нам наиболее безопасный
ответ, без неоправданных рисков,

Arabic: 
ووحدات مركزية حديثة لمعالجة البيانات
والصور لتدريب نموذج ضخم كهذا
الشبكة العصبية الملتفّة
تطورت بشكل لم يتوقعه أحد
وأصبحت هي المعمار الحاسوبي المتألق
في إنتاج نتائج جديدة ومثيرة
في مجال التعرف على الأشياء
هذا حاسوب يخبرنا
بأن هذه الصورة تتضمن قطة
وأين هي القطة تحديدًا
طبعًا فإن هناك أشياء أخرى عدا القطط
فهذه خوارزمية حاسوب تخبرنا
بأن هذه الصورة تحتوي على ولد ودبدوب
كلب وشخص وطائرة ورقية
صغيرة في الخلفية
أو صورة مليئة جدًا بالأشياء
مثل رَجُل ولوح تزلج ودرابزين
وعمود إنارة وهلم جرًا
أحيانًا، عندما لا يكون الحاسوب
متأكدًا جدًا حيال ما يراه
علمناه أن يكون ذكيًا بقدرٍ كافٍ
ليعطي إجابة آمنة بدلًا من أن
يرهق نفسه زيادة عن اللزوم

Portuguese: 
e os modernos CPUs e GPUs
para treinar um modelo colossal,
a rede neural convolucional
floresceu de um modo que ninguém esperava.
Tornou-se a arquitetura vencedora
para gerar novos resultados animadores
em reconhecimento de objetos.
Isto é um computador nos dizendo
que esta foto contém um gato
e onde ele está.
É claro que há mais coisas além de gatos.
Aqui está um algoritmo 
computacional nos dizendo
que a foto contém um garoto
e um urso de pelúcia;
um cão, uma pessoa
e uma pequena pipa ao fundo;
ou uma foto com muitas informações
como um homem, um skate, corrimãos,
um poste de luz, e assim por diante.
Às vezes,
quando o computador
não tem certeza do que vê,
(Risos)
nós o ensinamos 
a ser inteligente o bastante
para nos dar uma resposta segura
em vez de ficar deduzindo muito,

Croatian: 
te modernih CPJ-a i GPJ-a 
kako bi istrenirao ove ogrome modele,
skupna neuronska mreža
je procvala na način 
koji nitko nije očekivao.
Postala je ključna struktura
koja je dovodila do novih uzbudljivih 
rezultata u prepoznavanju objekata.
Ovo je računalo koje nam govori
da je na slici mačka
i gdje je mačka.
Naravno ne radi se samo o mački,
ovdje nam računalni algoritam govori
da slika sadrži
dječaka i medvjedića;
psa, osobu i malog zmaja
u pozadini;
ili slika vrlo zbrkanih stvari
poput čovjeka, skateboarda,
ograde, lampe itd.
Ponekad kada računalo 
nije sigurno što vidi,
moramo ga naučiti da bude dovoljno pametno
da nam pruži siguran odgovor,
kao što bismo mi odgovorili,

English: 
and the modern CPUs and GPUs
to train such a humongous model,
the convolutional neural network
blossomed in a way that no one expected.
It became the winning architecture
to generate exciting new results
in object recognition.
This is a computer telling us
this picture contains a cat
and where the cat is.
Of course there are more things than cats,
so here's a computer algorithm telling us
the picture contains
a boy and a teddy bear;
a dog, a person, and a small kite
in the background;
or a picture of very busy things
like a man, a skateboard,
railings, a lampost, and so on.
Sometimes, when the computer
is not so confident about what it sees,
we have taught it to be smart enough
to give us a safe answer
instead of committing too much,

Vietnamese: 
giống như cách mà chúng ta sẽ làm,
nhưng những lần khác những thuật toán
thật sự ấn tượng với chúng tôi khi nói ra
chính xác những đặc tính của đối tượng,
như là xuất xứ, hiệu, năm sản xuất
của những chiếc xe.
Chúng tôi ứng dụng thuật toán này cho
hàng triệu ảnh chụp đường phố trên Google
qua hàng trăm thành phố của Mỹ,
và chúng tôi đã nhận ra
nhiều thứ rất thú vị:
đầu tiên, nó xác nhận
sự hiểu biết chung của chúng ta
giá cả của những chiếc xe rất liên quan
với thu nhập của hộ gia đình.
Nhưng bất ngờ là,
giá của xe cũng tương ứng với
mức độ tội phạm trong những thành phố ,
hoặc tỉ lệ bầu phiếu theo mã vùng.
Đợi một chút, có phải là vậy không?
Phải chăng máy vi tính thực sự đã đạt được
hay thậm chí vượt qua khả năng con người?
Không nhanh vậy đâu.
Cho tới nay, chúng ta mới chỉ dạy 
cho máy vi tính nhìn thấy những vật thể.

Portuguese: 
como nós faríamos.
Mas outras vezes, nosso algoritmo
computacional é notável aos nos dizer
exatamente o que são os objetos,
como a marca, o modelo e o ano dos carros.
Nós cruzamos esse algoritmo com milhões
de imagens do Google Street View
em centenas de cidades americanas
e descobrimos algo muito interessante:
primeiro, confirmou-se
a nossa sabedoria popular
de que preços de carros estão relacionados
ao rendimento das famílias.
Mas surpreendentemente,
o preço dos carros também se relaciona
com as taxas de crimes nas cidades,
ou padrões de votos pelo CEPs.
Espere um pouco. É isso mesmo?
Os computadores já igualaram ou mesmo
superaram as capacidades humanas?
Não tão rápido.
Até agora, apenas ensinamos
os computadores a ver objetos.

iw: 
בדיוק כמו שאנחנו היינו עושים,
אבל בפעמים אחרות האלגוריתם הממוחשב שלנו
מצויין בלהגיד לנו
מה בדיוק הם האובייקטים,
כמו היצרן, המודל והשנה של מכוניות.
יישמנו את האלגוריתם הזה למיליוני תמונות
של מפת הרחובות של גוגל
במאות ערים אמריקניות,
ולמדנו משהו מאוד מעניין:
דבר ראשון, זה אימת את הידע הנפוץ
שמחירי מכוניות נמצאים בקשר ישיר
להכנסות משק הבית.
אבל באופן מפתיע, מחירי המכוניות 
נמצאים בקשר ישיר
עם רמת הפשע בערים,
או תבנית הצבעות על פי מיקודים.
אז רגע. זה הכל?
האם המחשב השווה או אפילו עקף 
את היכולות האנושיות?
לא כל כך מהר.
עד עכשיו, אנחנו רק לימדנו את המחשב
לראות אובייקטים.

Arabic: 
تماما كما قد نفعل نحن
لكن في أحيان أخرى تكون
خوارزميتنا مميزة في إخبارنا
عن ماهية الأشياء بدقة
كالشركة المصنعة لسيارة
وطرازها وسنة صنعها
لقد طبقنا هذه الخوارزمية على ملايين
الصور في Google Street View
عبر مئات المدن الأمريكية
وتعلمنا شيئًا مثيرًا للاهتمام حقًا
أولًا، لقد أكدت لنا حِسّنا السليم
حيث كان هناك علاقة وثيقة
بين أسعار السيارات
ومستويات الدّخل
لكن المفاجأة كانت أن أسعار
السيارات ترتبط أيضًا بعلاقة وثيقة
مع معدلات الجريمة في المدن
أو مع أنماط التصويت
حسب الأحياء والضواحي
فلتنتظروا لحظة. هل هذا كل ما في الأمر؟
هل وصلت قدرات الحواسيب لقدرات
البشر أو تجاوزتها حتى؟
ليس بهذه السرعة
حتى الآن، فقط علمنا الحاسوب
كيف يرى الأشياء

Portuguese: 
Mas outras vezes o nosso algoritmo
é brilhante a dizer exatamente
quais são os objetos na imagem,
como a marca, o modelo
e o ano de fabrico dos carros.
Aplicámos este algoritmo a milhões
de imagens do Google Street View
a centenas de cidades norte-americanas
e aprendemos algo muito interessante:
primeiro, confirmou a sabedoria comum
que diz que os preços dos carros
estão fortemente correlacionados
com os rendimentos familiares.
Mas, surpreendentemente, os preços
dos carros também estão correlacionados
com as taxas de criminalidade em cidades,
ou padrões de votação por código postal.
Mas esperem. É mesmo assim?
O computador já conseguiu mesmo igualar
ou até ultrapassar as capacidades humanas?
Vamos com calma.
Até agora, apenas ensinámos
o computador a ver objetos.

Danish: 
ligesom vi ville,
men som regel er algoritmen
utrolig god til at fortælle os
præcis hvad objekterne er,
som fremstillingen, modellen og 
årgangen af bilerne.
Vi anvendte algoritmerne i mio.
af Google Street View billeder
i hundreder af amerikanske byer,
og vi har lært noget meget
interessant:
vi fik bekræftet den gængse viden
at bilpriser korrelerer meget godt
med husholdningsindtægter.
Men overraskende nok korrelerer
bilpriser godt
med kriminalitet i byer,
eller stemmemønstre ved postnumre.
Vent lidt. Er dét alt?
Har computeren allerede nået
eller endda overhalet menneskelige evner?
Øjeblik.
Indtil videre har vi kun lært
computeren at se objekter.

Turkish: 
tıpkı bizim yapacağımız gibi
fakat başka zamanlarda bilgisayar
algoritmamız bize dikkate değer şeyler
tam olarak nesnelerin ne olduğunu
marka, model ve üretim yılı gibi şeyleri
söylüyor.
Bu algoritmayı Google Sokak Görüntüleme
ile yüzlerce Amerika şehrinden
alınmış resimlere uyguladık
ve gerçekten ilginç şeyler öğrendik:
öncelikle, hepimizin bildiği gibi araç
fiyatlarının aile gelir düzeyiyle
doğrudan ilişkili olduğunu teyit etti
fakat ilginçtir ki, araç fiyatları aynı
zamanda
şehirdeki suç oranları
ya da posta kodlarından oy verme alanları
ile de bağlantılı.
Peki biraz düşünün, bu oldu mu?
Bilgisayar henüz insan kabiliyetlerine
erişebildi mi hatta daha üstün geldi mi ?
Hayır, o kadar hızlı değil.
Şu ana dek, sadece bilgisayara nesneleri
görmesini öğrettik.

Albanian: 
sic bëjmë ne,
por në raste të tjera, algoritmi ynë është
i jashtëzakonshëm kur na tregon
saktësisht se me cilin objekt 
kemi të bëjmë,
si përbërjen, modelin, vitin e prodhimit 
të makinave.
Ne e aplikuam këtë algoritëm në miliona
imazhe të Google Street View
të qindra qyteteve amerikane,
dhe mësuam dicka shumë interesante:
së pari, konfirmoi atë qe na 
thotë dhe logjika
cmimet e makinave janë 
në përpjestim të drejtë
me të ardhurat familjare.
Por per cudi, ato lidhen
dhe me shkallën e krimit në qytete,
apo mënyrën e votimit 
sipas kodeve postare.
Prit një minutë. Kaq ishte?
Arriti kompjuteri tashmë në të njejtin 
nivel madje dhe më lart se njeriu?
Jo kaq shpejt.
Deri tani, i kemi mësuar kompjuterit
të shohë objekte.

Italian: 
proprio come faremmo noi,
ma altre volte gli algoritmi ci 
dicono in modo eccezionale
esattamente che oggetti sono,
come tipo, modello, 
anno delle macchine.
Abbiamo applicato questi algoritmi 
a tante immagini di Google Street View
in centinaia di città americane
e abbiamo imparato 
una cosa molto interessante:
primo, ha confermato 
il nostro sapere comune
che i prezzi delle auto 
sono legati molto bene
ai redditi familiari.
Ma stupisce che i prezzi 
delle auto siano legati bene anche
al tasso di criminalità nelle città,
o agli schemi di 
votazione con codici postali.
Allora aspettate. Ce l'abbiamo fatta?
Il computer ha già le stesse 
capacità dell'uomo o perfino migliori?
Non ancora.
Finora abbiamo insegnato 
ai computer a vedere oggetti.

Spanish: 
tal como lo haríamos nosotros.
Pero otras veces nuestro algoritmo 
informático es muy acertado al decirnos
qué son los objetos exactamente,
como la marca, modelo 
y año de los coches.
Aplicamos este algoritmo a millones
de imágenes de Google Street View
de cientos de ciudades
de Estados Unidos
y hemos aprendido algo muy interesante:
primero, confirmó nuestra idea
de que los precios de los autos
se relacionan bien
con los ingresos del hogar.
Pero sorprendentemente, los precios
de los autos se relacionan también
con las tasas de criminalidad
en la ciudades
o los patrones de votación
por código postal.
Un minuto. ¿Eso es todo?
¿Acaso la computadora ya sobrepasó
las capacidades humanas?
No tan rápido.
Hasta ahora solo hemos enseñado
a la computadora a ver objetos.

Korean: 
사람과 마찬가지죠.
반면 컴퓨터 알고리즘은 놀랍게도
사물이 정확히 무엇인지 
말해주기도 합니다.
자동차의 차종, 모델, 
연식 같은 것이죠.
수백개 미국 도시에서 찍은 
구글 스크리트 뷰 이미지
수백만장에 알고리즘을 적용했더니
흥미로운 것을 발견했습니다.
먼저, 일반적으로 예상하듯이
자동차 가격이 가계 수입과
매우 관련이 있다는 것이었습니다.
하지만 놀랍게도, 자동차 가격은
도시의 범죄율과도 관련이 있었고,
도시구역별 투표 경향과도
관련이 있었습니다.
잠깐만요. 그런가요?
컴퓨터는 이미 인간의 능력을 
따라잡거나 추월한 것인가요?
그렇지는 않습니다.
지금까지 우리는 컴퓨터에 
사물 인식을 가르쳤을 뿐이에요.

Modern Greek (1453-): 
όπως ακριβώς θα κάναμε και εμείς,
και άλλες φορές ο αλγόριθμος
είναι τόσο ικανός στο να μας λέει
ακριβώς τι είναι το κάθε αντικείμενο,
όπως τη μάρκα, το μοντέλο
και τη χρονιά των αυτοκινήτων.
Εφαρμόσαμε αυτόν τον αλγόριθμο σε
εκατομμύρια εικόνες του Google Street View
σε εκατοντάδες πόλεις της Αμερικής,
και μάθαμε κάτι πολύ ενδιαφέρον:
πρώτον, επιβεβαιώσαμε 
κάτι που ήταν κοινώς γνωστό
ότι οι τιμές αυτοκινήτων 
συσχετίζονται πολύ καλά
με το εισόδημα των νοικοκυριών.
Αλλά αναπάντεχα, οι τιμές των αυτοκινήτων
επίσης συσχετίζονται καλά
με την εγκληματικότητα στις πόλεις,
ή με την κατανομή ψήφων
ανά ταχυδρομικό κώδικα.
Μισό λεπτό. Αυτό είναι;
Ο υπολογιστής έφτασε ή ξεπέρασε
τις ανθρώπινες δυνατότητες;
Όχι τόσο γρήγορα.
Μέχρι τώρα, έχουμε μάθει στον υπολογιστή 
μόνο να βλέπει αντικείμενα.

Persian: 
درست مثل کاری که ما انجام می‎دهیم،
ولی در موارد دیگر الگوریتم رایانه ای ما
در گفتن اینکه
اشیا چه هستند فوق العاده است
مثل نوع ، مدل و سال ساخت ماشین.
ما این الگوریتم را به میلیونها عکس
"منظره خیابان گوگل"
در صدها شهر آمریکا اعمال کردیم
و چیز جالبی را متوجه شدیم:
اول اینکه عقل سلیم ما را تایید کرد
که قیمت خودرو وابستگی زیادی به
درآمد خانوارها دارد.
اما تعجب اینکه، قیمت خودرو
بستگی زیادی هم به
نرخ جرایم در شهرها،
یا الگوی رای دادن در شهرها بر اساس
کدپستی دارد.
صبر کن ببینم! همین؟!
آیا دیگر توانایی رایانه با توانایی انسان 
مطابقت دارد یا از آن پیشی گرفته؟
نه به این زودی.
تا حالا به رایانه یاد دادیم
که اشیا را ببیند.

Russian: 
что именно и сделал бы человек.
Но бывает и так, что наш алгоритм
совершенно безошибочно сообщает нам,
какие объекты он видит.
Например, марку, модель
и год выпуска автомобиля.
Мы применили этот алгоритм к миллионам 
фотографий на Google Street View
из сотен американских городов
и получили очень интересные результаты.
Во-первых, они подтвердили известный факт,
что стоимость автомобиля зависит
от дохода семьи.
Но, к удивлению,
цены на автомобили также зависят
от уровня преступности в городах
или даже модели голосования 
в разных штатах.
Минутку. Это свершилось?
Компьютеры догнали или даже превзошли 
человеческие возможности?
Не тут-то было.
Пока мы научили компьютеры
только видеть объекты.

Croatian: 
ali u drugim slučajevima računalni 
alogoritam nam besprijekorno kaže
što su točno ti objekti,
poput materijala, modela, godine auta.
Primjenili smo ovaj algoritam na milijune
Google Street View prikaza
u stotinama američkih gradova,
i spoznali smo nešto vrlo zanimljivo:
prvo, potvrdilo se staro pravilo
da cijene auta dobro koreliraju
s kućnim primanjima.
Ali isto tako cijene auta
koreliraju također sa
stopom kriminala u gradovima,
ili načina glasanja po poštanskom broju.
Čekajte. 
Je li to, to?
Je li nas računalo već sustigao
ili čak prestiglo u našim sposobnostima?
Ne tako brzo.
Zasad smo samo naučili
računalo da vidi objekte.

Thai: 
เช่นเดียวกับที่เราจะทำ
แต่บางครั้ง อัลกอริทึมคอมพิวเตอร์
ของเราก็น่าทึ่งที่บอกเรา
ว่าวัตถุที่มีเป็นอะไรจริงๆ
เช่นยี่ห้อ แบบ รุ่นปีของรถยนต์
เราใช้อัลกอริทึมนี้กับภาพ Google 
Street View นับล้านภาพ
ข้ามร้อยเมืองของอเมริกัน
และเราได้เรียนรู้สิ่งที่น่าสนใจจริงๆ
ประการแรก ยืนยันภูมิปัญญาทั่วไปของเรา
ว่าราคารถยนต์มีความสัมพันธ์กันเป็นอย่างดี
กับรายได้ครัวเรือน
แต่น่าเสียดายที่ราคารถยนต์ยังมี
ความสัมพันธ์กันดี
กับอัตราการเกิดอาชญากรรมในเมือง
หรือรูปแบบการลงคะแนนโดย
ใช้รหัสไปรษณีย์
รอสักครู่ นี่ใช่ไหม
คอมพิวเตอร์มีการจับคู่หรือแม้กระทั่งมี
มากกว่าความสามารถของมนุษย์หรือไม่
ไม่เร็วนัก
จนถึงปัจจุบัน เราได้สอนคอมพิวเตอร์
ให้ดูวัตถุเท่านั้น

Hungarian: 
éppúgy, ahogy mi tennénk
Máskor viszont az algoritmusunk
figyelemre méltó pontossággal közli.
hogy milyen tárgyakat lát,
mint az autók gyártmánya, 
modellje, évjárata.
Ezt az algoritmust alkalmaztuk 
a Google több millió utcaképére
amerikai városok százairól
és valami igazán érdekeset tapasztaltunk:
először is, alátámasztotta 
a mindennapi bölcsességünket,
hogy a kocsiárak nagyon szoros 
összefüggésben vannak
a háztartási jövedelmekkel.
De meglepő módon, szoros 
összefüggésben vannak
a bűnözési rátával a városokban,
valamint az irányítószámok szerinti 
szavazási mintákkal.
Na, álljunk csak meg egy percre!. 
Mi történik itt?
A számítógép már elérte vagy 
még felül is múlta az emberi képességeket?
Azért csak lassan a testtel!
Mindeddig, csak azt tanítottuk meg a 
számítógépeknek, hogy lássák a tárgyakat.

Dutch: 
wat wij ook zouden doen.
Op andere momenten is het opmerkelijk
wat het computeralgoritme ons vertelt
welke voorwerpen het precies zijn,
zoals merk, model
en bouwjaar van de auto.
We pasten dit algoritme toe op miljoenen
Google Street View-beelden
dwars door honderden Amerikaanse steden,
en we bemerkten iets interessants:
ten eerste bevestigde het ons vermoeden
dat autoprijzen gelijk op gaan
met gezinsinkomens.
Verrassend is echter, 
dat autoprijzen ook gelijk op gaan
met de misdaadcijfers in de steden,
of het stemgedrag met de postcode.
Wacht even, is dat het?
Is de computer al net zo goed als de mens
of zelfs al beter?
Niet zo snel.
Tot nu toe hebben we de computer
alleen geleerd voorwerpen te bekijken.

French: 
c'est ce que nous ferions.
D'autres fois, l'algorithme 
a la capacité incroyable
de nous dire exactement 
ce qu'est l'objet :
marque, modèle, année d'une voiture.
Nous avons utilisé cet algorithme sur
des millions d'images Google Street View,
dans des centaines de villes américaines,
et nous avons découvert 
quelque chose de très intéressant.
D'abord, il a été confirmé
que le prix des voitures
et le revenu des foyers sont liés.
Mais, étonnamment, le prix des voitures
et le taux de crimes dans les villes
sont également liés,
même chose avec la répartition
géographique des votes.
Attendez un peu... c'est tout ?
Est-ce que l'ordinateur atteint, 
voire surpasse, les capacités humaines ?
Pas si vite.
Jusque là, nous avons appris 
aux ordinateurs à voir des objets,

Polish: 
takich, jakich udzieliłby człowiek.
Ale są też przypadki, kiedy algorytm 
potrafi nad wyraz precyzyjnie określić,
jakie obiekty znajdują się na zdjęciu,
podając markę, model 
i rok produkcji samochodu.
Zastosowaliśmy ten algorytm 
do milionów zdjęć z Google Street View
powstałych w setkach amerykańskich miast
i odkryliśmy coś interesującego.
Po pierwsze potwierdził się 
popularny pogląd
dotyczący relacji cen samochodów
i dochodu gospodarstw domowych.
Co zaskakujące, okazało się, 
że ceny samochodów wiążą się też
ze skalą przestępczości w miastach,
czy schematami głosowania.
Ale zaraz, czy to już wszystko?
Czy komputer dorównał właśnie 
ludzkim możliwościom,
a może nawet je przekroczył?
Nie tak szybko.
Na razie komputer nauczył się
widzieć przedmioty.

Romanian: 
așa cum am face noi,
dar uneori algoritmul e remarcabil,
spunându-ne exact ce sunt obiectele,
ca marca, modelul, 
anul de fabricație al mașinilor.
Am aplicat acest algoritm 
pe milioane de imagini Google Street View
din sute de orașe americane
și am aflat ceva foarte interesant.
În primul rând, a confirmat 
cunoștințele generale
că prețurile mașinilor sunt corelate
cu venitul familiilor.
Dar surprinzător, sunt corelate
și cu rata criminalității în orașe
sau tiparul voturilor pe coduri poștale.
Stai un pic. Asta-i tot?
Computerul a egalat 
sau a întrecut abilităţile umane?
Să nu ne grăbim..

Ukrainian: 
як і ми самі зробили б.
Проте у інших випадках
алгоритм нашого комп'ютера
з вражаючою точністю
називає об'єкти,
такі як марка, модель та 
рік випуску машин.
Застосувавши цей алгоритм до мільйонів
зображень Google Street View,
які включають сотні американських міст,
ми виявили дещо дуже цікаве:
по-перше, він підтвердив 
відому істину про те,
що ціни на машини залежать від
прибутків домашніх господарств.
Але неочікувано виявилося, 
що ціни на машини також корелюються
з рівнем злочинності в містах,
і навіть з моделлю голосування
в різних штатах.
Зачекайте хвилинку. Чи це вже воно?
Чи комп'ютер вже досяг
чи навіть перевищив людські можливості?
Не так швидко.
Наразі ми навчили комп'ютер
бачити об'єкти.

Chinese: 
——就像人类面对这类问题时一样。
但在其他时候，我们的计算机
算法厉害到可以告诉我们
关于对象的更确切的信息，
比如汽车的品牌、型号、年份。
我们在上百万张谷歌街景照片中
应用了这一算法，
那些照片涵盖了上百个美国城市。
我们从中发现一些有趣的事：
首先，它证实了我们的一些常识：
汽车的价格，与家庭收入
呈现出明显的正相关。
但令人惊奇的是，汽车价格与犯罪率
也呈现出明显的正相关性，
以上结论是基于城市、或投票的
邮编区域进行分析的结果。
那么等一下，这就是全部成果了吗？
计算机是不是已经达到，
或者甚至超过了人类的能力？
——还没有那么快。
目前为止，我们还只是
教会了计算机去看对象。

English: 
just like we would do,
but other times our computer algorithm
is remarkable at telling us
what exactly the objects are,
like the make, model, year of the cars.
We applied this algorithm to millions
of Google Street View images
across hundreds of American cities,
and we have learned something
really interesting:
first, it confirmed our common wisdom
that car prices correlate very well
with household incomes.
But surprisingly, car prices
also correlate well
with crime rates in cities,
or voting patterns by zip codes.
So wait a minute. Is that it?
Has the computer already matched
or even surpassed human capabilities?
Not so fast.
So far, we have just taught
the computer to see objects.

Chinese: 
就像一般人會做的。
更有些時候，電腦的運算竟能夠
精準地辨別物體品項
例如製造商、型號、車子的年份。
Google 將這個演算程式廣泛地運用在
數百個美國城市的街景裡，
也因此我們從中得到了一些有趣的概念。
首先，它證實了一項廣為人知的說法，
也就是汽車價格和家庭收入
是息息相關的。
然而令人驚訝的是，汽車價格也和
城市中的犯罪率
以及區域選舉模式，有相當的關係。
等等，難道說我今天
就是來告訴各位電腦已經趕上
甚至超越人類了嗎？
還早得很呢。
到目前為止，我們只是教導電腦識別物品，

Czech: 
stejně jako bychom to udělali my,
ale jindy nám náš počítačový algoritmus
znamenitě vysvětlí,
co přesně dané objekty jsou,
jako například značka, model a rok u auta.
Aplikovali jsme tento algoritmus na 
miliony obrázků z Google Street View
napříč stovkami amerických měst,
a zjistili jsme něco velice zajímavého:
zaprvé, to potvrdilo známou pravdu,
že ceny aut jsou přímo úměrné
příjmům domácností.
A překvapivě, ceny aut 
jsou také závislé
na kriminalitě v daných městech,
a nebo volební názory na PSČ.
Takže, to je ono?
Dosáhly počítače lidských schopností,
nebo je snad dokonce přesáhly?
Ne tak rychle.
Zatím jsme počítač naučili jenom
vidět věci.

Japanese: 
ちょうど私たち自身がするように
一方で何が写っているかについて
コンピュータアルゴリズムが
驚くほど正確に
言い当てることもあります
たとえば自動車の車種や
モデルや年式のような
このアルゴリズムを
アメリカの数百都市の
何百万という
Googleストリートビュー画像に適用した結果
面白い発見がありました
まず 車の値段は
家計収入とよく相関しているという
予想が裏付けられました
でも驚いたことに 
車の値段は
街の犯罪率とも
よく相関していたんです
それはまた郵便番号区域ごとの
投票傾向とも相関しています
それでは コンピュータは
既に人間の能力に追いつき 
追い越しているのでしょうか？
結論を急がないで
これまでのところ 私たちは
コンピュータに物の見方を教えただけです

Hungarian: 
Ez olyan, mint amikor egy kis gyermek 
megtanul kimondani néhány főnevet.
Ez egy hihetetlen teljesítmény,
de csak az első lépés.
Nemsokára elérünk a fejlődés 
egy másik mérföldkövéhez,
és a gyerekek elkezdenek 
mondatokban kommunikálni.
Így ahelyett, hogy 
"ez egy macska a képen",
már azt hallották a kislánytól, hogy 
"egy macska fekszik egy ágyon".
Ahhoz, hogy egy számítógépet megtanítsunk
képeket látni és mondatokat alkotni,
a big data technika és a gépi tanulási 
algoritmusok együttesének
eggyel tovább kell lépnie.
A számítógépnek
képesnek kell lennie mind képekből,
mind pedig emberek által alkotott
természetes nyelvi mondatokból tanulni.
Annak mintájára, ahogy az agy 
egyesíti a látást a nyelvvel,
kifejlesztettünk egy modellt, ami 
összekapcsolja a látható dolgok részeit
vizuális töredékekként,

Modern Greek (1453-): 
Είναι σαν ένα μικρό παιδί που μαθαίνει
να προφέρει μερικά ουσιαστικά.
Είναι ένα απίστευτο επίτευγμα,
αλλά είναι μόνο το πρώτο βήμα.
Σύντομα, θα έρθουμε σε ένα άλλο ορόσημο
της ανάπτυξης,
και τα παιδιά αρχίζουν
να επικοινωνούν με προτάσεις.
Αντί να πει ότι στην εικόνα είναι μια γάτα
ακούσατε ήδη το κοριτσάκι να μας λέει
ότι η γάτα είναι ξαπλωμένη στο κρεβάτι.
Για να μάθουμε τον υπολογιστή να βλέπει
μια εικόνα και να παράγει προτάσεις,
ο «γάμος» των μαζικών δεδομένων
και των αλγόριθμων μηχανικής μάθησης
πρέπει να κάνει ένα ακόμα βήμα.
Τώρα, ο υπολογιστής 
πρέπει να μάθει από εικόνες
αλλά και από προτάσεις φυσικού λόγου
που έχουν παράγει άνθρωποι.
Ακριβώς όπως ο εγκέφαλος ενσωματώνει
όραση και γλώσσα,
αναπτύξαμε ένα μοντέλο 
που συνδέει μέρη οπτικών αντικειμένων,
σαν οπτικά αποσπάσματα,

Persian: 
این مثل این هست که کودک 
یاد بگیرد چند اسم بگوید.
این یک موفقیت باورنکردنی است،
اما فقط اولین قدم است.
بزودی یک مرحله مهم طی خواهد شد
و کودکان یاد می‎گیرند 
تا بصورت گفتن جمله ارتباط برقرار کنند.
پس به جای اینکه بگوید 
این یک گربه در این عکس است که قبلا شنیدید
دختر کوچولو به ما گفت این 
یک گربه خوابیده روی تخت است.
برای یاد دادن به رایانه که تصویری را 
ببیند و جملاتی تولید کند،
پیوند بین داده‎های عظیم و 
الگوریتم آموزش ماشین
باید گام دیگری بردارد.
حالا رایانه باید هم از تصاویر یاد بگیرد
هم از جملات زبان طبیعی
که توسط انسان تولید می‎شوند.
درست مثل مغز که بینایی و
زبان را به هم می‎آمیزد
ما هم مدلی ایجاد کردیم که قسمت های
اجسام بصری
مانند خرده تصاویر

Albanian: 
Si të jetë një fëmijë i vogël
duke mësuar ca emra.
është një arritje e pabesueshme,
por është vetëm hapi i parë.
Së shpejti do të hidhet një hap 
tjetër i madh zhvillimi,
dhe fëmijët do të fillojnë të flasin 
me fjali.
Kështu në vënd që të thonë
se këtu në foto është një mace,
ju e dëgjuat tashmë vajzën e vogël duke na
treguar se macja është shtrirë në krevat.
Pra, për t'i mësuar kompjuterit
të shohë një foto dhe të gjenerojë fjali,
bashkimi i ngushtë mes të dhënave 
dhe algoritmit
duhet të hedhë një hap tjetër.
Tani, kompjuteri duhet të mësojë
edhe nga imazhet
edhe nga gjuha natyrore
e folur nga njerëzit.
Ashtu sic truri integron 
shikimin me gjuhën,
ne zhvilluam një model
që lidh pjesë vizuale të objekteve
si copëza vizuale

Spanish: 
Es como un niño pequeño
que aprende a decir palabras.
Es un logro increíble,
pero es apenas el primer paso.
Pronto daremos otro paso
y los niños empiezan
a comunicarse con frases.
Así que en lugar de decir
que hay un gato en la foto,
la niña ya dice que el gato
está sobre la cama.
Así que para enseñar a una computadora
a ver una foto y generar frases
la conjunción de mucha información
y el algoritmo de aprendizaje automático
debe dar otro paso.
Ahora, la computadora tiene 
que aprender de fotografías
así como de frases en lenguaje natural
generado por humanos.
De la forma en que el cerebro 
integra visión y lenguaje,
desarrollamos un modelo que 
conecta partes de cosas visuales
como fragmentos visuales

Arabic: 
وهو في ذلك يشبه طفلًا صغيرا
يتعلم كيف ينطق بعض الكلمات
إنه إنجاز لا يصدَّق
لكنها مجرد خطوة أولى
قريبا سننجز مرحلة تطورية أخرى
والأطفال سيبدؤون بالتواصل عن طريق جُمَل
وهكذا فبدلًا من القول
بأن ما في الصورة هو قطة
لقد سمعتم بالفعل تلك الفتاة الصغيرة وهي
تخبرنا أن تلك هي قطة تستلقي على السرير
فإذن لنعلم حاسوبًا ليرى صورة
ويولّد منها جملة
فإن الزواج بين "البيانات الكبيرة"
وخوارزميات تعليم الحواسيب
يجب أن يخطو خطوة أخرى
الآن، على الحاسوب أن يتعلم من الصور
وكذلك جُمَل اللّغة الطبيعية
التي أحدثها البشر
تمامًا كما يُكامل الدماغ
بين الرؤية واللغة
طورنا نموذجًا يربط
أجزاءً من الأشياء المرئيَة
كالقصاصات المرئية مثلًا

Dutch: 
Net als een kind leren een paar
zelfstandige naamwoorden te zeggen.
Een ongelooflijke prestatie,
maar pas de eerste stap.
Er zal vlot een volgende mijlpaal
gehaald worden:
het kind zal beginnen
te communiceren in zinnen.
In plaats van te zeggen dat het een kat is
op het plaatje,
heb je het meisje al horen zeggen
dat de kat op een bed ligt.
Om een computer dus te leren
om een plaatje te zien en zinnen te maken,
moet het huwelijk tussen big data
en machineleren
de volgende stap nemen.
De computer moet zowel leren
van plaatjes
als van zinnen in natuurlijke taal,
voortgebracht door mensen.
Net zoals de hersenen
die beeld en taal integreren,
hebben we een model ontwikkeld
dat delen van zichtbare dingen,
visuele fragmenten,

Danish: 
Det er ligesom et barn, der 
lærer at udtale nogle få navneord.
Det er en utrolig stor udrettelse,
men det er kun første skridt.
Snart vil en ny udviklingsmæssig
milepæl blive nået,
og barnet begynder at 
kommunikere i sætninger.
Istedet for at sige at dette
er en kat på billedet,
har vi allerede hørt pigen sige, at dette
er en kat der ligger på en seng.
For at lære en computer at se et billede
og lave sætninger,
må sammenføringen af massive data og
maskinlærings-algoritmer
tages til et nyt niveau.
Nu må computeren lære fra både billeder
og naturlige sprog-sætninger
fra mennesker.
Ligesom hjernen integrerer vision og sprog
har vi udviklet en model, der
sammenfører dele af visuelle ting,
eller visuelle klip,

Portuguese: 
Isto é o equivalente a uma criança
que aprende a pronunciar alguns nomes.
É um feito incrível,
mas é apenas o primeiro passo.
As crianças atingem rapidamente
um novo marco no seu desenvolvimento,
começando a comunicar com frases.
Ou seja, em vez de dizer
que há um gato na imagem,
já ouvimos a menina dizer-nos
que é um gato deitado numa cama.
Para ensinar um computador
a gerar frases a partir de uma imagem,
é agora preciso que o casamento
entre o volume de dados
e a aprendizagem automática
dê mais um passo.
Agora, o computador terá que aprender,
não só a partir de imagens,
como também frases naturais da linguagem
geradas pelos seres humanos.
Tal como o cérebro integra
a visão e a linguagem,
nós desenvolvemos um modelo
que relaciona partes de coisas visuais,
tais como fragmentos visuais,

Turkish: 
Bu küçük bir çocuğun bir kaç kelime
söylemesini öğrenmesi gibi bir sey.
İnanılmaz bir başarıdır bu,
fakat bu sadece ilk adımdır.
Sonrasında, başka bir gelişimsel dönüm
noktası açığa çıkar,
ve çocuk cümlelerle iletişim kurmaya
başlar.
Yani, "bu resimdeki bir kedidir"
demek yerine
dinlediğiniz gibi küçük kız bize "bu
yatağın üzerinde uzanan bir kedidir" diyor
Bilgisayarı resimleri görmek ve cümle
kurmak için eğitmek,
big data ile makine öğrenim algoritmasının
beraberliği için
bir adım daha atılmalı.
Şimdilik, bilgisayarın her resimden
insanlar tarafından oluşturulmuş kadar
iyi cümleler öğrenmesi gerek.
Beynin görsellik ve dili bütünleştirdiği
gibi,
biz de ufak görsel parçacıklar
gibi görsel şeylerle
cümlelerdeki kelime ve ifadeleri

Japanese: 
小さな子供が名詞をいくつか
言えるようになったようなものです
ものすごい成果ですが
まだ第一歩にすぎず
次の開発目標があります
子供は文章でコミュニケーションを
するようになります
だから写真を見て小さな女の子が
単にネコと言わずに
ネコがベッドに座っていると
言うのを聞いたわけです
コンピュータが写真を見て
文章を作れるよう教えるために
このビッグデータと
機械学習の結びつきが
新たなステップを
踏む必要があります
コンピュータは
写真だけでなく
人が発する自然言語の文章も
学ぶ必要があります
脳が視覚と言語を
結びつけるように
画像の断片のような
視覚的なものの一部と

French: 
comme un jeune enfant apprend
à prononcer quelques noms.
C'est déjà incroyable,
mais ce n'est que la première étape.
Bientôt, nous atteindrons un autre niveau,
l'enfant commence à faire des phrases.
Au lieu de dire que 
c'est un chat sur la photo,
comme nous l'a dit la petite fille 
tout à l'heure.
Pour apprendre à l'ordinateur à générer 
des phrases à partir d'une photo,
le mariage entre les données
et l'algorithme d'apprentissage
doit franchir une autre étape.
L'ordinateur doit apprendre 
à partir des photos,
en utilisant des phrases 
en langage naturel
générée par l'être humain.
Tout comme le cerveau 
combine vision et langage,
notre modèle connecte 
les parties de choses visuelles,
des petits bouts visuels,

Czech: 
Je to jako malé dítě, které se učí
vyslovit pár slov.
Je to neuvěřitelný úspěch,
ale je to teprve první krok.
Brzy, další vývojový mezník bude 
dosažen,
a děti se naučí mluvit ve větách.
Takže místo tvrzení - to je kočka,
slyšeli jsme holčičku říct, že kočka
leží na posteli.
Abychom naučili počítač vidět obrázek
a vytořit věty,
vztah mezi velkým množstvím dat a
algoritmem učení strojů
musí dosáhnout další fáze.
Nyní se počítač musí učit z obou částí,
stejně tak jako jsou věty
vytvářené lidmi.
Stejně jako mozek spojuje zrak a jazyk,
vytvořili jsme model, který spojuje
části zraku,
jako vizuální ústřižky

Croatian: 
To je kao da malo dijete
učite reći nekoliko imenica.
To je ogromno postignuće,
ali je to tek prvi korak.
Uskoro će drugo razvojno postignuće
biti dosegnuto,
i djeca počinju komunicirati u rečenicama.
Stoga umjesto govorenja 
kako je mačka na slici,
već ste čuli malu djevojčicu
koja govori da mačka leži na krevetu.
Kako bi naučili računalo
da vidi sliku i stvori rečenice,
brak između velikih podataka
i algoritama strojnog učenja
mora ići korak dalje.
Računalo mora naučiti
učiti i iz slika
i iz prirodnih jezičnih rečenica
stvorenih od strane ljudi.
Upravo kako mozak integrira
vid i jezik,
razvili smo model 
koji spaja vidljive dijelove
poput vidnih komada

Thai: 
นี่เหมือนกับเด็กเล็กๆ ที่เรียนรู้ที่
จะพูดคำนามไม่กี่คำ
เป็นความสำเร็จที่น่าทึ่ง
แต่นี่เป็นเพียงขั้นตอนแรกเท่านั้น
ในไม่ช้า การพัฒนาอีกก้าวจะฮิต
และเด็กเริ่มสื่อสารเป็นประโยค
ดังนั้นแทนที่จะบอกว่านี่เป็นแมวในภาพ
คุณได้ยินแล้วสาวน้อยบอกกับ
เราว่า นี่คือแมวนอนอยู่บนเตียง
ดังนั้น เพื่อสอนคอมพิวเตอร์
ให้ดูภาพและสร้างประโยค
การจับคู่ระหว่างข้อมูลขนาดใหญ่
และกลไกการเรียนรู้ด้วยเครื่อง
ต้องใช้ขั้นตอนอื่น
ขณะนี้คอมพิวเตอร์ต้องเรียนรู้จากทั้งสองรูป
เช่นเดียวกับประโยคภาษาธรรมชาติ
ที่สร้างขึ้นโดยมนุษย์
เช่นเดียวกับสมองที่รวมวิสัยทัศน์และภาษา
เราพัฒนารูปแบบที่เชื่อมโยงสิ่ง
ที่มองเห็นบางส่วน
เช่นตัวอย่างข้อมูลภาพ

Ukrainian: 
Так само, як немовля
вчиться вимовляти слова.
Це неймовірне досягнення,
але це лише перший крок.
Згодом буде досягнуто
наступний етап розвитку,
коли діти починають спілкуватися
за допомогою речень.
Замість того, щоб сказати,
що на фото є кіт,
маленька дівчинка каже нам,
що є кіт, який лежить на ліжку.
Щоб навчити комп'ютер
бачити фото і формулювати речення,
тісний союз між величезною кількістю даних
та навчальним алгоритмом для машин
повинен запрацювати на новому рівні.
Зараз комп'ютер повинен навчатися,
використовуючи як фото,
так і речення природної мови,
за допомогою яких спілкуються люди.
Подібно до того, як мозок
поєднує бачення та мову,
ми розробили модель,
яка поєднує частини візуальних речей,
таких як візуальні фрагменти,

Vietnamese: 
Cái này giống như một đứa trẻ học cách 
bật ra một vài danh từ.
Đó là một thành tựu đáng kinh ngạc,
nhưng nó mới chỉ là bước đầu tiên.
Nhanh thôi,
những cột mốc phát triển khác sẽ đạt được,
và trẻ em bắt đầu giao tiếp bằng những câu.
Vì vậy thay vì nói 
đây là một con mèo trong bức tranh,
bạn thật sự đã nghe đứa trẻ nhỏ nói rằng
đây là một con mèo nằm trên một cái giường
Vì thế mà dạy một chiếc máy tính
nhìn một ảnh và cấu thành những câu nói,
sự liên kết giữa những dữ liệu lớn
và thuật toán
phải tiếp tục những bước tiếp theo.
Bây giờ, chiếc máy tính phải học
cả những hình ảnh
lẫn ngôn ngữ câu tự nhiên
được tạo lập bởi con người.
Giống như não bộ
kết hợp giữa cái nhìn và ngôn ngữ,
chúng tôi phát triển một hình mẫu
liên kết những phần của những vật thể
giống như những mẩu thông tin
có thể trông thấy được

English: 
This is like a small child
learning to utter a few nouns.
It's an incredible accomplishment,
but it's only the first step.
Soon, another developmental
milestone will be hit,
and children begin
to communicate in sentences.
So instead of saying
this is a cat in the picture,
you already heard the little girl
telling us this is a cat lying on a bed.
So to teach a computer
to see a picture and generate sentences,
the marriage between big data
and machine learning algorithm
has to take another step.
Now, the computer has to learn
from both pictures
as well as natural language sentences
generated by humans.
Just like the brain integrates
vision and language,
we developed a model
that connects parts of visual things
like visual snippets

Romanian: 
Am învățat computerul să vadă obiecte,
ca un copil care pronunță câteva cuvinte.
E o realizare incredibilă,
dar e doar primul pas.
Curând, un alt prag va fi atins,
iar copiii vor comunica în propoziții.
Astfel în loc să spună 
că „asta e o pisică în poză”,
deja ați auzit-o pe fetiță, spunându-ne 
că e „o pisică întinsă pe pat”.
Ca să învățăm un computer să vadă o poză 
și să genereze propoziții,
mariajul dintre colecțiile mari de date
și algoritmii de învățare automată
trebuie să facă un nou pas.
Computerul trebuie să învețe din imagini
dar și din propozițile rostite de oameni.
La fel cum creierul integrează 
viziunea și limbajul,
am dezvoltat un model 
ce conectează părți vizuale,

Chinese: 
就像小孩子牙牙學語一樣，
雖然這是個傲人的進展，
但它不過是第一步而已，
很快地，下一波具指標性的後浪就會打上來了，
小孩子開始進展到用句子來溝通。
因此，他已經不會用「這是貓」
來描述圖片，
而是會聽到這個小女孩說「這是躺在床上的貓」。
因此，要教導電腦看到圖並說出句子，
必須進一步地仰賴龐大資料群
以及機器的學習演算。
現在，電腦不僅要學習圖片識別，
還要學習人類自然的
說話方式。
就如同大腦要結合視覺和語言一樣，
我們做出了一個模型，
它可以連結不同的可視物體，
就像視覺片段一樣，

iw: 
זה כמו שילד קטן לומד לבטא מספר
שמות עצם.
זה הישג מדהים,
אבל זה רק הצעד הראשון.
בקרוב, עוד אבן דרך התפתחותית תושג,
וילדים מתחילים לתקשר במשפטים.
אז במקום להגיד - זה חתול בתמונה,
כבר שמעתם את הילדה הקטנה אומרת לנו
שזה חתול ששוכב על מיטה.
אז ללמד מחשב לראות תמונה
ולייצר משפטים,
הנישואים בין ביג דאטה 
לאלגוריתם לימוד מכונה
צריכים לקחת עוד צעד.
עכשיו, המחשב צריך ללמוד משתי התמונות
כמו גם ממשפטים טבעיים בשפה
שנוצרים על ידי בני אדם.
בדיוק כמו שהמוח מייצר ראייה ושפה,
אנחנו פיתחנו מודל שמקשר חלקים
של דברים ויזואלים
כמו מקטעים קצרים

Korean: 
마치 어린 아이가 명사 몇개를
배운 것과 같죠.
엄청난 성과이지만
그저 첫 걸음에 불과합니다.
곧 다음 개발 목표에 이를 것이고,
어린 아이는 문장으로 
소통을 하기 시작할 겁니다.
그래서 사진을 보고 
'고양이입니다' 하는 대신
여러분이 이미 들었듯
'고양이가 침대에 누워 있다'고 합니다.
컴퓨터가 사진을 보고
문장을 만들게 가르치려면,
빅 데이터와 기계 학습 
알고리즘의 결합이
또 한발짝 나아가야 합니다.
이제 컴퓨터는 사진 뿐만 아니라
사람이 만든 자연 언어 문장도
배워야 합니다.
뇌가 시각과 언어를 결합하듯이,
우리가 개발한 모델은
이미지의 단편과 같은
시각적 요소를

Russian: 
Это сродни тому, как маленький ребёнок
учится произносить несколько слов.
Это невероятное достижение,
но это всего лишь первый шаг.
Вскоре будет пройден
новый этап развития,
и ребёнок сможет составлять 
из слов предложения.
И вместо того чтобы сказать,
что на картинке кошка,
маленькая девочка скажет, 
что кошка лежит на кровати.
Для того чтобы научить компьютер видеть
картинку и составлять предложения,
связь между большой базой данных
и алгоритмом обучения машин
должна выйти на новый уровень.
Теперь компьютер должен учиться
не только по фотографиям,
но и на основе предложений
естественного языка,
составляемых человеком.
Отталкиваясь от факта, 
что мозг объединяет зрение и язык,
мы разработали модель,
соединяющую части визуальной картины,
как маленькие фрагменты,

Polish: 
Można go porównać do małego dziecka, 
które nauczyło się pierwszych słów.
To niesamowite osiągnięcie,
ale to tylko pierwszy krok.
Wkrótce kolejny milowy krok
i dziecko nauczy się tworzyć zdania.
Dziewczyna z początku prelekcji 
nie mówi, że na zdjęciu jest kot,
tylko że kot leży na łóżku.
Żeby nauczyć komputer 
patrzenia na zdjęcia i tworzenia zdań,
połączenie danych 
i algorytmu systemów uczących się
musi posunąć się dalej.
Teraz komputer musi uczyć się 
zarówno ze zdjęć,
jak i ze zdań
tworzonych przez ludzi.
Tak, jak mózg łączy wizję i język,
rozwinęliśmy model, 
który łączy fragmenty rzeczy,
jak elementy wizualne,

Portuguese: 
É como uma criancinha aprendendo
a pronunciar algumas palavras.
É um feito incrível,
mas é apenas o primeiro passo.
Em breve, outro marco
de desenvolvimento será atingido,
e as crianças começam
a se comunicar por meio de frases.
Então, em vez de dizer 
que isto é um gato na foto,
vocês ouviram a garotinha nos dizendo
que isto é um gato deitado na cama.
Então, para ensinar um computador
a ver uma foto e criar frases,
o casamento entre os dados
e o algoritmo de aprendizado de máquina
deve dar outro passo.
Agora, o computador tem que aprender
tanto com as fotos
quanto com as frases em linguagem natural
geradas por humanos.
Assim como o cérebro integra
visão e linguagem,
nós desenvolvemos um modelo
que conecta partes de coisas visuais,
como fragmentos visuais,

Italian: 
È come un bambino piccolo che 
impara a pronunciare alcuni sostantivi.
È un risultato incredibile,
ma è solo il primo passo.
Presto raggiungeremo 
un'altra pietra miliare dello sviluppo
e i bambini inizieranno 
a comunicare con frasi.
Allora invece di dire 
che c'è un gatto nella foto,
avete sentito la ragazzina dire
che è un gatto sdraiato sul letto.
Quindi per insegnare al computer 
a vedere una foto e generare frasi,
il connubio fra Big Data e
algoritmo di apprendimento automatico
deve fare un altro passo.
Ora il computer deve 
imparare sia dalle foto
che dalle frasi naturali
generate dagli uomini.
Proprio come il cervello 
integra lingua e visione,
abbiamo sviluppato un modello 
che collega parti di oggetti ottici
come frammenti ottici

Chinese: 
这就像是一个小宝宝学会说出几个名词。
这是一项难以置信的成就，
但这还只是第一步。
很快，我们就会到达
发展历程的另一个里程碑：
这个小孩会开始用“句子”进行交流。
所以不止是说这张图里有只“猫”，
你在开头已经听到小妹妹
告诉我们“这只猫是坐在床上的”。
为了教计算机看懂图片并生成句子，
“大数据”和“机器学习算法”的结合
需要更进一步。
现在，计算机需要从图片和人类创造的
自然语言句子中同时进行学习。
就像我们的大脑，
把视觉现象和语言融合在一起，
我们开发了一个模型，

Ukrainian: 
зі словами та фразами у реченнях.
Близько 4 місяців тому,
ми нарешті поєднали усе це докупи
і створили одну з перших
моделей комп'ютерного розпізнавання,
яка здатна створювати
подібні до людських речення,
коли бачить фото вперше.
Зараз я продемонструю вам,
що говорить комп'ютер,
коли бачить фото,
які описувала маленька дівчинка
на початку моєї доповіді.
(Відео) Комп'ютер: Чоловік
стоїть поряд зі слоном.
Великий літак стоїть
на злітно-посадковій смузі.
ФФЛ: Звичайно, ми продовжуємо наполегливо
працювати над удосконаленням алгоритмів,
і йому ще треба багато чого навчитися.
(Оплески)
Комп'ютер все ще допускає помилки.
(Відео) Комп'ютер: Кіт лежить на ліжку
в ковдрі.

Hungarian: 
szavakkal és kifejezésekkel a mondatokban.
Körülbelül négy hónappal ezelőtt
végül mindezt összekötöttük
és megalkottuk az első 
számítógép látómodellek egyikét,
amely képes létrehozni 
egy emberihez hasonló mondatot,
amikor először lát egy képet.
Nos, készen állok bemutatni önöknek, 
hogy mit mond a számítógép,
amikor látja a képet
amit a kislány látott az előadás elején.
(Video) Számítógép: 
Egy férfi áll egy elefánt mellett.
Egy nagy repülőgép ül 
egy reptéri kifutópálya tetején.
FFL: Természetesen még sokat kell 
dolgoznunk az algoritmusunk fejlesztésén,
és ez még sokat fog tanulni.
(Taps)
A számítógép még követ el hibákat.
(Videó) Számítógép: Egy macska fekszik 
egy ágyon egy takaróban.

iw: 
עם מילים וביטויים במשפטים.
לפני ארבעה חודשים בערך,
סוף סוף קשרנו את כל זה ביחד
ויצרנו את אחד ממודלי 
הראייה הממוחשבת הראשונים
שמסוגלים לייצר משפט בדומה לאדם
כאשר הוא רואה תמונה בפעם הראשונה.
עכשיו, אני מוכנה להראות לכם
מה המחשב אומר
כשהוא רואה את התמונה
שהילדה הקטנה ראתה בתחילת השיחה הזו.
(וידאו) מחשב: איש עומד ליד פיל.
מטוס גדול עומד על מסלול טיסה.
פיי פיי: כמובן, אנחנו עדיין עובדים קשה
כדי לשפר את האלגוריתמים שלנו,
ועדיין יש לו הרבה ללמוד.
(מחיאות כפיים)
והמחשב עדיין עושה טעויות.
(וידאו) מחשב: חתול שוכב על מיטה בשמיכה.

French: 
avec des mots ou groupes de mots,
pour en faire des phrases.
Il y a environ 4 mois,
nous avons enfin réussi
à créer l'un des premiers 
modèles de vision artificielle
capagle de générer une phrase
comme un être humain
qui découvre une image.
Aujourd'hui, je suis prête à vous montrer
ce que dit l'ordinateur
quand il voit la photo
que la petite fille voyait tout à l'heure.
(Vidéo) L'ordinateur :
Un homme est debout à coté d'un éléphant.
Un grand avion est assis 
sur une piste d'aéroport.
FFL : Bien sûr, il y a encore 
beaucoup de travail sur les algorithmes,
l'ordinateur a encore
beaucoup à apprendre,
(Applaudissements)
et il fait encore des erreurs.
(Vidéo) Ordinateur : un chat est couché
sur un lit dans une couverture.

Thai: 
มีคำและวลีในประโยค
ประมาณสี่เดือนที่ผ่านมา
เราโยงไว้ด้วยกันทั้งหมด
และผลิตโมเดลวิสัยทัศน์ทาง
คอมพิวเตอร์เครื่องแรก
ที่มีความสามารถในการสร้าง
ประโยคเหมือนมนุษย์
เมื่อเห็นภาพเป็นครั้งแรก
ตอนนี้ฉันพร้อมที่จะแสดง
สิ่งที่คอมพิวเตอร์พูด
เมื่อเห็นภาพ
ที่สาวน้อยเห็นในตอนต้นของการพูดคุยนี้
(วิดีโอ) คอมพิวเตอร์: มีชายคนหนึ่งกำลังยืนอยู่ข้างช้าง
เครื่องบินขนาดใหญ่จอดอยู่
ในรันเวย์ของสนามบิน
FFL: แน่นอน เรายังคงทำงานอย่างหนัก
เพื่อปรับปรุงอัลกอริทึม
และยังคงมีสิ่งที่จะเรียนรู้อยู่มากมาย
(เสียงปรบมือ)
และคอมพิวเตอร์ยังทำผิดพลาด
(วิดีโอ) คอมพิวเตอร์: แมวนอนบนเตียงในผ้าห่ม

Chinese: 
可以把一部分视觉信息，像视觉片段，
与语句中的文字、短语联系起来。
大约4个月前，
我们最终把所有技术结合在了一起，
创造了第一个“计算机视觉模型”，
它在看到图片的第一时间，就有能力生成
类似人类语言的句子。
现在，我准备给你们看看
计算机看到图片时会说些什么
——还是那些在演讲开头给小女孩看的图片。
（视频）计算机：
“一个男人站在一头大象旁边。”
“一架大飞机停在机场跑道一端。”
李飞飞：
当然，我们还在努力改善我们的算法，
它还有很多要学的东西。
（掌声）
计算机还是会犯很多错误的。
（视频）计算机：
“一只猫躺在床上的毯子上。”

Vietnamese: 
với những từ ngữ và cụm từ trong câu.
Khoảng 4 tháng trước,
chúng tôi cuối cùng cũng liên kết chúng
lại với nhau
và tạo ra một trong những hình mẫu 
máy tính có thị giác đầu tiên
có khả năng tạo ra một câu
giống như con người
khi nó thấy một bức ảnh lần đầu tiên.
Bây giờ, tôi sẵn sàng cho bạn thấy 
điều mà máy vi tính nói
khi nó trông thấy bức ảnh
mà cô gái nhỏ đã thấy
ở phần mở đầu của bài nói này.
(Video) Máy vi tính: Một người đàn ông
đang đứng cạnh một con voi.
Một máy bay lớn đậu phía trên một
đường băng sân bay.
FFL: Dĩ nhiên, chúng tôi vẫn đang làm việc
chăm chỉ để phát triển những thuật toán,
và vẫn còn rất nhiều thứ để học
(vỗ tay)
Và máy tính vẫn còn mắc nhiều lỗi.
(Video) Máy tinh: một con mèo đang nằm 
trong chăn trên một cái giường

Dutch: 
verbindt met woorden en zinsdelen.
Ongeveer vier maanden geleden
voegden we dit allemaal samen
en maakten een van de eerste 
computervisie-modellen
dat in staat is mensentaalachtige
zinnen te maken
als het voor de eerste keer
een plaatje ziet.
Ik ben zover dat ik wil laten zien
wat de computer zegt
als die het plaatje ziet
van het meisje dat je aan het begin 
van de talk hebt gezien.
(Video) Computer: Een man staat
naast de olifant.
Een groot vliegtuig staat
op een startbaan.
FFL: Natuurlijk werken we hard
aan het verbeteren van de algoritmes
en er moet nog veel geleerd worden.
(Applaus)
De computer maakt nog steeds fouten.
(Video) Computer: Een kat 
ligt op een bed in een laken.

Spanish: 
con palabras y frases en oraciones.
Hace unos 4 meses
finalmente juntamos todo esto
y produjimos uno de los primeros
modelos de visión artificial
que puede generar frases
como las de un humano
cuando ve una foto por primera vez.
Ahora estoy lista para mostrarles
lo que dice la computadora
cuando ve la fotografía
que la niña vio al inicio de esta charla.
(Video) Computadora:
Un hombre está junto a un elefante.
Un avión grande está encima
de una pista de aeropuerto.
FFL: Desde luego, seguimos
trabajando para mejorar los algoritmos
y aún tiene mucho que aprender.
(Aplausos)
Y la computadora aún comete errores.
(Video) Computadora: Un gato 
recostado en la cama en una sábana.

Arabic: 
مع كلمات وعبارات في جُمل
منذ حوالي أربعة أشهر
ربطنا أخيرًا بين كل هذه الأجزاء
وأنتجنا واحدًا من أوائل
نماذج الإبصار الحاسوبية
القادرة على توليد جُمل
مقاربة للغة البشر
عندما ترى صورة للمرة الأولى
الآن، أنا مستعدة لأريك
ما يقول الحاسوب
عندما يرى الصورة
التي رأتها تلك الفتاة الصغيرة
في أول هذه المحادثة
(فيديو) الحاسوب: رجلٌ يقف إلى جانب فيل
طائرة كبيرة تقبع على رأس مَدْرج مطار
فاي-فاي لي: طبعًا، لا نزال نعمل
باجتهاد لنطور خوارزميتنا
ولا يزال أمامها الكثير لتتعلمه
(تصفيق)
ولا يزال الحاسوب يقع في أخطاء
(فيديو) الحاسوب: قطة تستلقي
في بطانية على سرير

Albanian: 
me fjalë dhe shprehje në fjali.
Rreth katër muaj më parë,
më në fund i bashkuam të gjitha
dhe prodhuam një nga modelet e para 
të vizionit kompjuterik
që bën të mundur gjenerimin e fjalive
të ngjashme me ato që thonë njerëzit
kur shohin një foto për herë të parë.
Tani, jam gati t'ju tregoj
se cfare thotë kompjuteri
kur sheh të njëjtën foto
që vajza e vogël po shihte 
në fillim të kësaj bisede.
(Video) Kompjuteri: Një njeri po qëndron
pranë një elefanti.
Një avjon i madh duke qëndruar
në një pistë aeroporti.
FFL: Patjeter, ne po punojmë ende fort
për përmirësimin e algoritmave tanë,
dhe kemi ende shumë për t'i mësuar.
(Duartrokitje)
Dhe kompjuteri prapë bën gabime.
(Video) Kompjuteri: Një mace e shtrirë
në një krevat në një batanije.

Modern Greek (1453-): 
με λέξεις και φράσεις προτάσεων.
Πριν από περίπου τέσσερις μήνες,
συνθέσαμε όλα αυτά τα κομμάτια
και δημιουργήσαμε ένα από τα πρώτα μοντέλα
υπολογιστικής όρασης
ικανό να παράγει φυσικές προτάσεις
την πρώτη φορά που βλέπει μια εικόνα.
Τώρα, είμαι έτοιμη να σας δείξω 
τι λέει ο υπολογιστής
όταν βλέπει την εικόνα
που είδε το κορίτσι στην αρχή της ομιλίας.
(Βίντεο) Υπολογιστής: Ένας άντρας στέκεται
δίπλα σε έναν ελέφαντα.
Ένα μεγάλο αεροπλάνο βρίσκεται
πάνω σε έναν αεροδιάδρομο.
Φέι-Φέι Λι: Φυσικά, δουλεύουμε σκληρά
για να βελτιώσουμε τον αλγόριθμό μας,
και έχει να μάθει ακόμα πολλά.
(Χειροκρότημα)
Και ο υπολογιστής ακόμα κάνει λάθη.
(Βίντεο) Υπολογιστής: Μια γάτα είναι
ξαπλωμένη στο κρεβάτι με μια κουβέρτα.

Italian: 
a parole e espressioni nelle frasi.
Circa quattro mesi fa,
abbiamo finalmente provato tutto insieme
e prodotto uno dei primi 
modelli di visione artificiale
capace di generare 
una frase tipo quella umana
quando vede 
una foto per la prima volta.
Ora sono pronta 
a mostrarvi cosa dice il computer
quando vede la foto
che la ragazzina ha visto 
all'inizio di questa conferenza.
Un uomo in piedi 
vicino a un elefante.
Un grande aereo 
sulla pista di un aeroporto.
Certo, lavoriamo duro 
per migliorare i nostri algoritmi
e ci sono ancora molte cose da imparare.
(Applausi)
E il computer fa ancora errori.
Un gatto sdraiato 
a letto con una coperta.

Romanian: 
ca fragmente vizuale,
cu cuvinte și propoziții în fraze.
Cam acum 4 luni
am pus totul cap-la-cap,
și am creat unul dintre primele
computere ce recunosc imaginile
şi e capabil să genereze
propoziții similare celor umane
când vede o poză pentru prima dată.
Veţi vedea ce spune computerul despre poza
pe care a văzut-o fetița la început.
„Un bărbat stă lângă un elefant.”
„Un avion mare 
stă pe pista unui aeroport.”
Bineînțeles, încă lucrăm din greu 
să îmbunătățim algoritmii
și are încă multe de învățat.
(Aplauze)
Iar computerul încă face greșeli.
„O pisică întinsă pe pat într-o pătură.”

Croatian: 
s riječima i frazama u rečenicama.
Otprilike prije četiri mjeseca,
konačno smo uspjelo sve povezati
i proizveli smo jedan od prvih
modela računalnog vida
koji je sposoban stvoriti
rečenicu sličnu ljudskoj
kada vidi sliku po prvi puta.
Pokazat ću vam
što računalo kaže
kada vidi slike
koje je mala djevojčica vidjela
na početku govora.
(Video) Računalo: Čovjek stoji 
pored slona.
Veliki avion sjedi na vrhu
avionske piste.
FFL: Naravno, i dalje se trudimo
unaprijediti naše algoritme,
i još puno toga mora naučiti.
(Pljesak)
I računalo i dalje pravi greške.
(Video) Računalo: Mačka leži
na krevetu u deci.

Persian: 
را به کلمات و عبارات در جملات پیوند میزند.
حدود چهار ماه پیش،
بالاخره همه اینها را به هم پیوند زدیم
و یکی از اولین مدلهای دید رایانه‎ای را
که وقتی یک تصویر را برای اولین بار می‎بیند
قادر به تولید جملات 
همانند انسانها هست تولید کردیم.
حالا آماده هستم که بهتون نشان دهم 
که یک رایانه وقتی تصویری که
وقتی تصویری را می‎بیند که
اون دختر کوچولوی اول سخنرانی آن را دید.
(صدای رایانه): یک مرد کنار یک فیل
ایستاده است.
یک هواپیمای بزرگ روی 
باند پروازفرودگاه نشسته.
(سخنران): البته ما هنوز داریم سخت تلاش
می‎کنیم که الگوریتم‎مان را بهتر کنیم،
و هنوز چیزهای زیادی هست که باید یاد بگیرد.
(تشویق حضار)
و رایانه هنوز اشتباه می‎کند.
(صدای رایانه): یک گربه زیر لحاف
دراز کشیده روی تخت.

Japanese: 
文章の中の単語やフレーズを
繋ぎ合わせるモデルを
私たちは開発しました
４ヶ月ほど前
ついに私たちは
すべてをまとめ
初めて見た写真について
人が書いたような
記述文を生成できる
最初のコンピュータ・ビジョン・
モデルを作り上げました
冒頭で小さな女の子が説明したのと
同じ写真を見て
そのコンピュータが何と言ったか
お見せしましょう
「ゾウの横に立っている男」
「空港の滑走路にいる大きな飛行機」
私たちは今もアルゴリズムを改良しようと
熱心に取り組んでいて
学ぶべきことは
まだまだあります
(拍手)
コンピュータは
まだ間違いを犯します
「ベッドの上の毛布の中のネコ」

English: 
with words and phrases in sentences.
About four months ago,
we finally tied all this together
and produced one of the first
computer vision models
that is capable of generating
a human-like sentence
when it sees a picture for the first time.
Now, I'm ready to show you
what the computer says
when it sees the picture
that the little girl saw
at the beginning of this talk.
(Video) Computer: A man is standing
next to an elephant.
A large airplane sitting on top
of an airport runway.
FFL: Of course, we're still working hard
to improve our algorithms,
and it still has a lot to learn.
(Applause)
And the computer still makes mistakes.
(Video) Computer: A cat lying
on a bed in a blanket.

Korean: 
문장 속 단어나 문구와 연결합니다.
약 4달 전
우리는 마침내 이 모두를 엮어
최초의 컴퓨터 비전 모델 
하나를 만들었습니다.
사진을 처음 보았을때 사람과 같이
문장을 만들어내는 모델입니다.
이제, 여러분께 컴퓨터가 사진을 보고
말하는 것을 보여드리겠습니다.
앞서 어린 소녀가 봤던 사진입니다.
(컴퓨터) "남자가 
코끼리 옆에 서 있습니다."
"큰 비행기가 공항 활주로 끝에 있습니다."
물론, 우리는 여전히 알고리즘을
개량하려고 일하고 있고
배워야 할 게 많습니다.
(박수)
컴퓨터는 여전히 실수를 저지릅니다.
(컴퓨터) "고양이가 침대 위
이불 안에 있습니다."

Portuguese: 
com palavras e expressões em frases.
Há cerca de 4 meses,
conseguimos finalmente conjugar tudo isto
e produzir um dos primeiros
modelos de visão computacional
capaz de gerar uma frase semelhante
à gerada por um ser humano,
quando vê uma imagem pela primeira vez.
Agora, estou pronta para vos mostrar
o que o computador diz
quando vê a imagem
que a menina viu no início desta palestra.
(Vídeo) Computador: 
Um homem está ao pé de um elefante.
Um avião de grande porte 
poisado na pista de um aeroporto.
FFL: Claro que ainda estamos a trabalhar
arduamente para melhorar os algoritmos,
e o computador ainda tem
muito que aprender.
(Aplausos)
O computador ainda faz erros.
(Vídeo) Computador:
Um gato deitado numa cama num cobertor.

Turkish: 
birleştirecek bir model geliştirdik.
Yaklaşık dört ay önce,
sonunda bütün bunları bağladık
ve bir fotoğrafı ilk kez gördüğünde
bir insan gibi cümle kurabilme
yeteneğine sahip
ilk bilgisayar görme modelinden
bir tane yaptık.
Şu anda, bilgisayarın konuşmamızın başında
küçük kızın gördüğü resimleri gördüğünde
neler söylediğini size göstermeye hazırım.
(Video) Bilgisayar:
Bir adam filin yanında duruyor.
Geniş bir uçak, uçak pistinin üstünde
oturuyor.
FFL: Tabii, hala sıkı bir şekilde
algoritmamızı geliştirmek için çalışıyoruz
ve henüz öğreneceği çok sey var.
(Alkış)
Bilgisayar henüz hatalar yapmakta.
Bilgisayar: Bir kedi battaniyenin içinde
yatakta uzanıyor.

Polish: 
z wyrazami i określeniami w zdaniach.
Cztery miesiące temu
w końcu połączyliśmy to wszystko razem
i stworzyliśmy jeden z pierwszych modeli 
widzenia komputerowego,
który umie tworzyć zdania
na temat pierwszy raz widzianego zdjęcia.
Pokażę wam, co komputer powiedział,
kiedy zobaczył zdjęcia,
które widziała dziewczynka 
z początku tej prelekcji.
(Wideo) Komputer: 
Człowiek stoi obok słonia.
Duży samolot na pasie startowym.
FFL: Oczywiście ciągle pracujemy 
nad poprawieniem naszych algorytmów
i one muszą się jeszcze sporo nauczyć.
(Brawa)
Komputer nadal popełnia błędy.
(Wideo) Komputer: 
Kot na łóżku zawinięty w koc.

Czech: 
se slovy a frázemi ve větách.
Zhruba před čtyřmi měsíci,
jsme to konečně spojili
a vytvořili jeden z prvních modelů
počítačového zraku,
který je schopen vytvářet lidskou větu,
když vidí daný obrázek poprvé.
Nyní vám ukážu, co počítač řekne,
když vidí obrázek,
který viděla holčička na začátku.
(Video) Počítač: Muž stojí vedle slona.
Velké letadlo sedí na letištní runwayi.
FFL: Samozřejmě, stále pracujeme
na zlepšení našich algoritmů
a stále je toho hodně, co se učit.
(Potlesk)
A počítač dělá i chyby.
(Video) Počítač: Kočka ležící na posteli
pod dekou.

Danish: 
med ord og fraser i sætninger.
For fire måneder siden
fik vi endelig sammensat alt dette
og producerede en af de første
computervision modeller
der er i stand til at lave
en menneskelignende sætning
når den ser et billede for første gang.
Nu er jeg klar til at vise jer
hvad computeren siger,
når den ser billedet af
hvad den lille pige så 
i starten af dette foredrag.
(Video) Computer: En mand står
ved siden af en elefant.
Et stort fly står på en landingsbane
i en lufthavn.
FFL: Selvfølgelig arbejder vi stadig hårdt
med at forbedre vor algoritmer,
og den har stadig meget at lære.
(Bifald)
Og computeren laver stadig fejl.
(Video) Computer: En kat ligger i et tæppe
på en seng.

Chinese: 
並附上句子用的字詞和片語。
約四個月前，
我們終於把所有的元素全部兜起來了，
做出了第一個電腦版的模型，
它有辦法在初次看到照片時
說出像人類般自然的句子，
好，現在我要給各位看看電腦
對於演講一開頭
那位小女孩所看到的影像，
它又是如何理解的。
(電腦) 有個人站在大象旁邊。
一架大飛機停在機場跑道上。
(主講人) 當然，我們仍戮力於改善這電腦程式，
它還有很多要學。
(觀眾鼓掌)
電腦還是會犯錯。
(電腦) 一隻貓包著毯子躺在床上。

Portuguese: 
com palavras e ideias em frases.
Há uns quatro meses,
finalmente juntamos tudo isso,
e produzimos um dos primeiros
modelos de visão computacional
capaz de gerar frases do jeito humano
quando vê uma foto pela primeira vez.
Agora, vou mostrar o que o computador diz
quando vê a foto
que a garotinha viu,
no início desta palestra.
(Vídeo) Computador: Um homem está
em pé, próximo a um elefante.
Um grande avião sentado em cima
de uma pista de aeroporto.
FFL: Claro, estamos trabalhando com afinco
para melhorar nossos algoritmos,
e ele ainda tem muito o que aprender.
(Aplausos)
E o computador ainda comete erros.
(Vídeo) Computador: Um gato deitado
numa cama com um cobertor. (Risos)

Russian: 
со словами и фразами в предложениях.
Около четырёх месяцев назад
мы привели всё это
к общему знаменателю
и создали одну из первых моделей 
компьютерного зрения,
способную, подобно человеку,
создавать предложения
после просмотра фотографии в первый раз.
Сейчас я покажу вам, 
что говорит компьютер,
когда видит фотографию,
которую описывала девочка 
в начале этого доклада.
(Видео) Компьютер: 
Рядом со слоном стоит мужчина.
Большой самолёт находится
на взлётно-посадочной полосе аэропорта.
ФФЛ: Конечно, мы продолжаем усердно 
работать над улучшением нашего алгоритма,
и ему предстоит ещё многому научиться.
(Аплодисменты)
Компьютер всё ещё допускает ошибки.
(Видео) Компьютер: 
Кот лежит на кровати в одеяле.

Italian: 
Quindi quando vede troppi gatti,
crede che tutto 
somigli a un gatto.
Un ragazzino con una mazza da baseball.
(Risate)
Se non ha mai visto uno spazzolino 
lo confonde con una mazza da baseball.
Un uomo a cavallo
in una strada vicino a un edificio.
(Risate)
Non abbiamo 
insegnato l'Art. 101 ai computer.
Una zebra in una prateria.
E non ha imparato a apprezzare
la magnifica bellezza della natura
come me e voi.
Quindi è un lungo vaggio.
Andare dall'età zero
all'età tre era faticoso.
La vera sfida è andare 
da 3 a 13 e più lontano.
Ripensate alla foto 
del bambino con la torta.
Finora abbiamo insegnato 
al computer a vedere oggetti
o a raccontarci una semplice 
storia quando vede un'immagine.

Albanian: 
FFL: Sigurisht, kur sheh kaq shumë mace,
mendon pastaj që cdo gjë 
mund të duket si mace.
(Video) Kompjuteri: Një djalë i vogël 
duke mbajtur një shkop bejzbolli.
(Të qeshura)
FFL: Nëse s'ka parë kurrë furcë dhëmbësh,
e ngatërron atë me një shkop bejzbolli
(Video) Kompjuteri: Një burrë hipur 
mbi kalë në një rrugë pranë një ndërtese.
(Të qeshura)
FFL: Ende nuk i kemi mësuar art 
kompjuterave.
(Video) Kompjuteri: Një zebra duke 
qëndruar në një fushë me bar
FFL: Dhe ende nuk ka mësuar të çmojë
bukurinë mahnitëse të natyrës
ashtu siç bëjmë ne.
Pra ka qenë një udhëtim i gjatë.
Ishte mjaft vështirë të shkonim 
nga mosha zero në tre.
Sfida e vërtetë është të shkojmë
nga tre në 13 e më tej.
Më lini t'ju risjell këtë foto
të djalit me tortën.
Deri tani, ne i kemi mësuar kompjuterave
të shohin sende
madje dhe të na tregojnë histori
të thjeshta duke parë një foto.

Croatian: 
FFL: Naravno, kada vidi 
previše mačaka,
misli da bi sve moglo
izgledati kao mačka.
(Video) Računalo: Dječak
drži bejzbolsku palicu.
(Smijeh)
FFL: Ili, ako nije vidio četkicu za zube,
pomiješat će je s bejzbolskom palicom.
(Video) Računalo: Čovjek jaše konja
niz ulicu pored zgrade.
(Smijeh)
FFL: Nismo računalo naučili 
neke osnove umjetnosti.
(Video) Računalo: Zebra stoji
u polju trave.
FFL: I nije naučio diviti se
prekrasnoj ljepoti prirode
kao vi i ja.
Bilo je to dugo putovanje.
Od rođenja do treće godine je bilo teško.
Pravi izazov je doći 
od treće do trinaeste godine, i dalje.
Podsjetit ću vas s opet s ovom 
slikom dječaka i kolača.
Dosad smo naučili računalo 
da vidi objekte
ili čak nam kaže jednostavnu priču
onoga što je na slici.

Dutch: 
FFL: Als hij te veel katten ziet,
kan hij gaan denken dat alles een kat is.
(Video) Computer: Een jongetje
heeft een honkbalknuppel vast.
(Gelach)
FFL: Als hij nog nooit een tandenborstel
heeft gezien, raakt hij in de war.
(Video) Computer: Een man rijdt paard
door een straat langs een gebouw.
(Gelach)
FFL: We hebben Art 101 nog niet
aan de computer geleerd.
(Video) Computer: Een zebra
staat in een grasveld.
FFL: Het heeft nog niet geleerd 
de prachtige natuur te waarderen,
zoals jullie en ik doen.
De weg is dus lang.
Het viel niet mee
om van nul naar drie jaar te komen
Van drie tot 13 jaar of verder,
is helemaal een grote uitdaging.
Denk nog even aan dit plaatje
van de jongen en de taart.
Tot nu toe hebben we de computer geleerd
om voorwerpen te zien
of zelfs een simpel verhaaltje
te vertellen bij het zien van een plaatje.

Russian: 
ФФЛ: Конечно, когда он видит
слишком много котов,
он считает, что всё остальное
тоже выглядит как кот.
(Видео) Компьютер: 
Мальчик держит бейсбольную биту.
(Смех)
ФФЛ: Если он не видел зубной щётки,
он принимает её за бейсбольную биту.
(Видео) Компьютер: Мужчина едет верхом 
по улице рядом со зданием.
(Смех)
ФФЛ: Мы не обучили компьютер 
основам искусства.
(Видео) Компьютер: 
Зебра стоит на поле с травой.
ФФЛ: Он также ещё не может оценить
красоту природы так,
как это можем мы с вами.
Это длительный процесс.
Дорасти до трёх лет было трудно.
Ещё сложнее — от трёх 
до тринадцати и так далее.
Позвольте вам снова показать фотографию
мальчика с тортом.
Компьютер уже умеет видеть предметы
и даже вкратце рассказывать историю о том,
что изображено на фотографии.

French: 
FFL : Bien sûr, s'il voit trop de chats,
il pense que tout 
est peut-être un chat.
(Vidéo) Ordinateur : un garçon
tient une batte de base-ball.
(Rires)
FFL : Ou alors, s'il n'a jamais vu 
de brosse à dents, elle devient une batte.
(Vidéo) Ordinateur : Un homme se promène
à cheval près d'un bâtiment.
(Rires)
Nous n'avons pas enseigné 
l'histoire de l'art à l'ordinateur.
(Vidéo) L'ordinateur : Un zèbre 
se trouve dans un pré.
FFL : Et il ne sait pas apprécier
la beauté de la nature
comme vous et moi.
Ça a donc été un long voyage.
Aller de 0 à 3 ans a été difficile.
Le vrai défi est d'aller de 3 à 13
et bien au-delà.
Revoici l'image du garçon avec le gâteau.
Jusque là, nous avons appris
à l'ordinateur à voir des objets
ou à créer une petite histoire
d'après une photo.

Polish: 
FFL: Jeśli widział zbyt wiele kotów,
wszystko zaczyna mu przypominać kota.
(Wideo) Komputer: 
Chłopczyk trzyma kij baseballowy.
(Śmiech)
FFL: Jeśli nie widział 
szczoteczki do zębów,
myli ją z kijem baseballowym.
(Wideo) Komputer: Mężczyzna jadący 
konno po ulicy obok budynku.
(Śmiech)
FFL: Nie nauczyliśmy jeszcze 
komputera podstaw sztuki.
(Wideo) Komputer: Zebra na pastwisku.
FFL: Nie umie też doceniać piękna natury,
jak my.
To była długa droga.
Przejście od wieku zero
do 3 lat było trudne.
Ale prawdziwym wyzwaniem jest 
przejście od 3 lat do 13 i dalej.
Pozwólcie, że przypomnę wam 
zdjęcie chłopca z tortem.
Dotąd uczyliśmy komputer
dostrzegać przedmioty,
a nawet opowiedzieć krótką historię
na podstawie zdjęcia.

Modern Greek (1453-): 
Φέι-Φέι Λι: Φυσικά, αφού έχει δει 
τόσες πολλές γάτες,
νομίζει ότι τα πάντα μοιάζουν με γάτες.
(Βίντεο) Υπολογιστής: Ένα αγόρι κρατάει
ένα ρόπαλο του μπέιζμπολ.
(Γέλια)
ΦΦΛ: Ή αν δεν έχει δει οδοντόβουρτσες
τις μπερδεύει με ρόπαλα του μπέιζμπολ.
(Βίντεο) Υπολογιστής: Ένας άντρας ιππεύει
ένα άλογο στο δρόμο δίπλα σε ένα κτίριο.
(Γέλια)
Φέι-Φέι Λι: Δεν έχουμε μάθει στους
υπολογιστές τα βασικά για τις τέχνες.
(Βίντεο) Υπολογιστής: Μια ζέβρα στέκεται
σε ένα λιβάδι.
Φέι-Φέι Λι: Δεν έχει μάθει να εκτιμά
την εκπληκτική ομορφιά της φύσης
όπως εσείς και εγώ.
Ήταν ένα μεγάλο ταξίδι.
Το να πάμε από τις ηλικίες 0 μέχρι 3
ήταν δύσκολο.
Η πραγματική πρόκληση είναι να πάμε
από τα 3 στα 13 και παραπέρα.
Θέλω να σας υπενθυμήσω με αυτή την εικόνα
του παιδιού και της τούρτας.
Μέχρι τώρα, έχουμε διδάξει τον υπολογιστή
να βλέπει αντικείμενα
και ακόμα να μπορεί να μας πει μια ιστορία
όταν βλέπει μια εικόνα.

Portuguese: 
FFL: É claro, quando ele vê muitos gatos,
ele acha que tudo se parece com um gato.
(Vídeo) Computador: Um garoto
está segurando um taco de beisebol.
(Risos)
FFL: Se nunca viu uma escova de dentes,
ele a confunde com um taco de beisebol.
(Vídeo) Computador: Um homem monta
um cavalo na rua, próximo a um edifício.
(Risos)
FFL: Não ensinamos Arte 101
aos computadores.
(Vídeo) Computador: Uma zebra
num campo gramado.
FFL: E ele não aprendeu a apreciar
a deslumbrante beleza da natureza
como nós apreciamos.
Tem sido uma longa jornada.
Ir da idade zero a três foi difícil.
O verdadeiro desafio é ir
dos 3 aos 13 e além disso.
Vejam esta foto do garoto
com o bolo novamente.
Até então, ensinamos
o computador a ver objetos
ou mesmo contar-nos uma simples 
história quando vê uma foto.

Vietnamese: 
FFL: Nên đương nhiên, khi nó nhìn thấy 
quá nhiều mèo
nó sẽ nghĩ mọi thứ
có thể nhìn giống như một con mèo.
Máy tính: Một chàng trai trẻ
đang cầm một cái vợt bóng chày
(cười lớn)
FFL: Nếu nó chưa bao giờ thấy bàn chải,
nó sẽ nhầm lẫn với một cái vợt bóng chày
Máy tính: Người đàn ông đang cưỡi ngựa 
xuống một con đường gần một tòa nhà.
(cười lớn)
FFL: Chúng tôi chưa dạy
môn nghệ thuật cơ bản cho máy tính
Máy tính: Một con ngựa vằn đang đứng 
trên một bãi cỏ.
FFL: Và nó chưa được học để trân trọng 
vẻ đẹp tuyệt mỹ của thiên nhiên
như tôi và bạn.
Vì thế nó là một hành trình dài.
Để đi từ 0 tuổi đến 3 tuổi là đã khó.
Thử thách thực sự là đi 
từ 3 đến 13 tuổi và còn xa hơn nữa.
Để tôi nhắc cho bạn bức ảnh này 
về một bé trai và chiếc bánh một lần nữa.
Trước đó, chúng ta đã dạy
máy tính nhìn thấy những vật thể

Hungarian: 
FFL: Így természetesen, 
amikor túl sok macskát lát,
azt gondolja, hogy 
minden hasonlít egy macskára.
(Videó) Számítógép: 
Egy fiatal fiú tart egy baseball ütőt.
(Nevetés)
FFL: Vagy, ha ez még nem látott fogkefét, 
összetéveszti egy baseballütővel.
(Videó) Számítógép: Egy férfi lovagol 
lenn az utcán egy épület mellett.
(Nevetés)
FFL: Még nem tanítottunk meg 
a művészet alapjait a számítógépeknek.
(Videó) Számítógép: 
Egy zebra áll egy füves mezőn.
FFL: És ez nem tanulta meg értékelni 
a természet lenyűgöző szépségét
mint önök és én.
Nos, ez egy hosszú út volt.
Nehéz volt eljutni
a nullától a három éves korig.
Az igazi kihívás a háromtól a tizenháromig
jutni és annak a határain is túl.
Hadd emlékeztessem önöket
a fiúnak és a tortának erre képére.
Mindez idáig, megtanítottuk 
a számítógépet a tárgyakat látni
vagy még egyszerű történeteket mondani 
nekünk, mikor egy meglát egy képet.

Arabic: 
فاي-فاي لي: وهكذا بالطبع، فعندما يرى
الكثير من القطط
يظن أن كل شيء قد يبدو مثل قطة
(فيديو) الحاسوب: طفل صغير يحمل مضرب بيسبول
(ضحك)
فاي-فاي لي: أو إن لم يكن رأى فرشاة أسنان
من قبل فقد يخلط بينها وبين مضرب بيسبول
(فيديو) الحاسوب: رَجل يمتطي حصانًا
في آخر الشارع بجانب مبنًى
(ضحك)
فاي-فاي لي: لم نشرح للحواسيب
درس مبادئ الفن
(فيديو) الحاسوب: حمار وحشي يقف
في حقل من العشب
فاي-فاي لي: ولم يتعلم كذلك كيف
يُقَدّر جمال الطبيعة الساحر
كما تُقَدّره أنت وأنا
إذن فقد كانت رحلة طويلة
الانتقال من عمر صفر إلى عمر
ثلاث سنوات هو عمل شاق
التحدي الحقيقي هو أن تنتقل من 3 سنوات
إلى 13 سنة وأبعد من ذلك
دعوني أذكركم بهذه الصورة
للطفل والكعكة مرة أخرى
حتى الآن، علمنا الحاسوب أن يبصر الأشياء
أو أن يحكي لنا قصة بسيطة عندما يرى صورة

Czech: 
FFL: samozřejmě, že když vidí tolik koček,
myslí si, že všechno může vypadat jako
kočka.
(Video) Počítač: Mladý chlapec drží 
baseballovou pálku.
(Smích)
FFL: Nebo pokud ještě neviděl kartáček,
splete si ho s basebalkou.
(Video) Počítač: Muž jede na koni po ulici
vedle budovy.
(Smích)
FFL: Nenaučili jsme naše počítače 
základy umění.
(Video) Počítač: Zebra stojí na poli trávy.
FFL: A ještě neumí ocenit krásu přírody
jako vy a já.
Je to dlouhá cesta.
Dostat se od věku 0 do 3 let bylo těžké.
Opravdová výzva je dostat se od 3 let
ke 13 a dál.
Dovolte mi ukázat ještě jednou obrázek 
chlapce s dortem.
Zatím jsme počítač naučili vidět objekty,
či dokonce říct krátce co vidí na obrázku.

Portuguese: 
FFL: Claro que, depois de ver
muitos gatos,
ele pensa que tudo é um gato.
(Video) Computador: Um menino
segura um taco de basebol.
(Risos)
FFL: Ou, se o computador
nunca viu uma escova de dentes,
confunde-a com um taco de basebol.
(Vídeo) Computador: Um homem a cavalo
desce uma rua ao pé de um edifício.
(Risos)
FFL: Não ensinámos aos computadores
a disciplina de Introdução à Arte.
(Vídeo) Computador: 
Uma zebra num relvado.
FFL: Também não aprenderam ainda
a apreciar o esplendor da natureza,
como vocês e eu fazemos.
Portanto, tem sido um longo percurso.
Ir dos zero aos três anos foi difícil.
O verdadeiro desafio será ir
dos três anos aos treze e para além disso.
Vou mostrar-vos novamente
esta imagem do rapaz e do bolo.
Até agora, ensinámos
o computador a ver objetos
ou mesmo a contar-nos uma pequena história
quando vê uma imagem.

English: 
FFL: So of course, when it sees
too many cats,
it thinks everything
might look like a cat.
(Video) Computer: A young boy
is holding a baseball bat.
(Laughter)
FFL: Or, if it hasn't seen a toothbrush,
it confuses it with a baseball bat.
(Video) Computer: A man riding a horse
down a street next to a building.
(Laughter)
FFL: We haven't taught Art 101
to the computers.
(Video) Computer: A zebra standing
in a field of grass.
FFL: And it hasn't learned to appreciate
the stunning beauty of nature
like you and I do.
So it has been a long journey.
To get from age zero to three was hard.
The real challenge is to go
from three to 13 and far beyond.
Let me remind you with this picture
of the boy and the cake again.
So far, we have taught
the computer to see objects
or even tell us a simple story
when seeing a picture.

Thai: 
FFL:ดังนั้น แน่นอนเมื่อเห็นแมวมากเกินไป
เครื่องคิดว่าทุกอย่างอาจดูเหมือนแมว
(วิดีโอ) คอมพิวเตอร์: เด็กหนุ่มคนหนึ่งกำลังถือไม้เบสบอล
(เสียงหัวเราะ)
FFL: หรือถ้ายังไม่เคยเห็นแปรงสีฟัน 
ก็จะสับสนกับไม้ตีเบสบอล
(วิดีโอ) คอมพิวเตอร์: คนขี่ม้าไปตาม
ถนนข้างตึก
(เสียงหัวเราะ)
FFL: เราไม่ได้สอนวิชา Art 101 ให้แก่คอมพิวเตอร์
(วิดีโอ) คอมพิวเตอร์: ม้าลายยืนอยู่ในทุ่งหญ้า
FFL: และยังไม่ได้เรียนรู้ที่จะชื่นชมความงาม
อันน่าทึ่งของธรรมชาติ
เช่นคุณและฉัน
ดังนั้น จึงเป็นการเดินทางที่ยาวนาน
เพื่อให้ได้มาตั้งแต่อายุศูนย์
ถึงสามปี ยังเป็นเรื่องยาก
ความท้าทายที่แท้จริงคือ การไป
จากสามปีถึง 13 ปีและไกลเกินกว่านั้น
ฉันขอเตือนคุณด้วยภาพของ
เด็กชายและเค้กนี้อีกครั้ง
จนถึงปัจจุบัน เราได้สอน
คอมพิวเตอร์ให้ดูวัตถุ
หรือแม้กระทั่งบอกเล่าเรื่องราว
ที่เรียบง่ายเมื่อได้เห็นภาพ

Spanish: 
FFL: Y cuando ha visto
demasiados gatos,
cree que todo lo que ve
parece un gato.
(Video) Computadora: Un niño 
tiene un bate de béisbol.
(Risas)
FFL: O si nunca ha visto
un cepillo de dientes,
lo confunde con un bate de béisbol.
(Video) Computadora: Un hombre 
montando un caballo junto a un edificio.
(Risas)
FFL: No le hemos enseñado
arte elemental a las computadoras.
(Video) Computadora: Una cebra
en un campo de hierba.
FFL: Y no ha aprendido a apreciar
la belleza deslumbrante
de la naturaleza,
como lo hacemos nosotros.
Así que ha sido un largo camino.
Pasar de los 0 a los 3 años fue difícil.
El verdadero reto es llegar 
a los 13 y mucho más todavía.
Recordemos nuevamente esta foto
del niño y el pastel.
Hasta ahora, le hemos enseñado
a la computadora a ver objetos
o incluso darnos una pequeña 
historia cuando ve la foto.

Ukrainian: 
ФФЛ: Звичайно, коли він бачить
дуже багато котів,
він вважає, що все має виглядати, як кіт.
(Відео) Комп'ютер: Хлопець
тримає бейсбольну біту.
(Сміх)
ФФЛ: Або, якщо він не бачив зубну щітку,
він переплутає її з бейсбольною битою.
(Відео) Комп'ютер: Чоловік їде на коні
по вулиці біля будинку.
(Сміх)
ФФЛ: Ми не вчили комп'ютери
розуміти мистецтво.
(Відео) Комп'ютер: Зебра стоїть
на полі, вкритому травою.
ФФЛ: Він не навчився цінувати
надзвичайну красу природи,
як це робимо ми з вами.
Ми пройшли довгий шлях.
Було важко дістатися
від 0 до 3 років.
Але справжній виклик - 
це пройти від 3 років до 13 і далі.
Дозвольте мені нагадати вам це фото
з хлопчиком і пирогом.
Ми вже навчили комп'ютер
бачити об'єкти
і навіть розповідати прості історії
про те, що він бачить на фото.

Japanese: 
ネコを沢山見過ぎたせいで
何でもネコみたいに
見えるのかもしれません
「野球バットを持つ小さな男の子」
(笑)
歯ブラシを見たことがないと 
野球バットと混同してしまいます
「建物脇の道を馬に乗って行く男」
(笑)
美術はまだコンピュータに
教えていませんでした
「草原に立つシマウマ」
私たちのように
自然の美を慈しむことは
まだ学んでいません
長い道のりでした
０歳から３歳まで行くのは
大変でした
でも本当の挑戦は３歳から13歳 
さらにその先へと行くことです
あの男の子とケーキの写真を
もう一度見てみましょう
私たちはコンピュータに
物を識別することを教え
写真を簡単に説明することさえ
教えました

Turkish: 
FFL: Tabii, oldukça fazla kedi
gördüğünden
herşeyin kediye benzeyebileceğini
düşünüyor.
Bilgisayar: Genç erkek bir beysbol
sopasını tutuyor.
(Gülüşmeler)
FFL: Ya da, henüz bir diş fırçası
görmemişse, beysbol sopasıyla karıştırıyor
Bilgisayar: Bir adam binanın kenarından
atını sokak aşağı sürüyor.
(Gülüşmeler)
FFL: Henüz bilgisayarlara Sanat 101
dersini öğretmedik.
Bilgisayar: Bir zebra otlukların içinde
duruyor.
FFL: Ve henüz doğanın büyüleci güzelliğini
takdir etmeyi bizim gibi öğrenmedi.
Uzun bir yolculuktu.
Sıfırdan üç yaşına getirmek oldukça zordu.
Asıl zor olan üç yaşından on üç yaş ve
daha ötesine götürebilmek.
Size bu resmi tekrar hatırlatmak istiyorum,
çocuk ve kekin olduğu.
Şu ana dek, bilgisayara nesneleri
görebilmesini
hatta gördüğü resimden küçük bir hikaye
anlatmasını bile öğrettik.

Chinese: 
李飞飞：所以…当然——如果它看过太多种的猫，
它就会觉得什么东西都长得像猫……
（视频）计算机：
“一个小男孩拿着一根棒球棍。”
（笑声）
李飞飞：或者…如果它从没见过牙刷，
它就分不清牙刷和棒球棍的区别。
（视频）计算机：
“建筑旁的街道上有一个男人骑马经过。”
（笑声）
李飞飞：我们还没教它Art 101
（美国大学艺术基础课）。
（视频）计算机：
“一只斑马站在一片草原上。”
李飞飞：它还没学会像你我一样
欣赏大自然里的绝美景色。
所以，这是一条漫长的道路。
将一个孩子从出生培养到3岁是很辛苦的。
而真正的挑战是从3岁到13岁的过程中，
而且远远不止于此。
让我再给你们看看这张
关于小男孩和蛋糕的图。
目前为止，
我们已经教会计算机“看”对象，
或者甚至基于图片，
告诉我们一个简单的故事。

iw: 
פיי פיי: אז כמובן, כשהוא רואה 
יותר מדי חתולים,
הוא חושב שהכל יכול להיראות כמו חתול.
(וידאו) מחשב: ילד צעיר מחזיק אלת בייסבול.
(צחוק)
פיי פיי: או אם הוא לא ראה מברשת שיניים,
הוא מבלבל את זה עם אלת בייסבול.
(וידאו) מחשב: איש רוכב על סוס 
במורד הרחוב ליד בניין.
(צחוק)
פיי פיי: לא לימדנו את המחשבים 
מבוא לאומנות.
(וידאו) מחשב: זברה עומדת בשדה עשב.
פיי פיי: והוא לא למד להעריך 
את היופי המדהים של הטבע
כמוני וכמוכם.
אז עדיין יש לו דרך ארוכה.
להגיע מגיל אפס לשלוש היה קשה.
האתגר האמיתי הוא להגיע 
משלוש לשלוש עשרה ומעבר לזה.
תרשו לי להזכיר לכם עם התמונה
של הילד והעוגה שוב.
עד עכשיו, לימדנו את המחשב לראות אובייקטים
או אפילו לספר לנו סיפור פשוט
כשהוא רואה תמונה.

Danish: 
FFL: Så selvfølgelig, når den ser
for mange katte,
tror den at alt ligner en kat.
(Video) Comp.: En lille dreng
holder et baseball bat.
(Latter)
FFL: Eller hvis den ikke har set en tand-
børste før, tror den at det er et bat.
(Video) Comp.: En mand rider en hest
på en vej ved siden af en bygning.
(Latter)
FFL: Vi har ikke lært computere kunst.
(Video) Comp.: En zebra står på en eng.
FFL: Og den har ikke lært at værdsætte
naturens utrolige skønhed
som du og jeg.
Så det har været en lang rejse.
Det var svært at nå treårsalderen.
Udfordringen ligger i at nå 13-årsstadiet
og endnu længere frem.
Lad mig minde jer om billedet af drengen
og kagen igen.
Indtil videre har vi lært computere
at se objekter
eller endda fortælle en simpel historie
når den ser et billede.

Romanian: 
Când vede prea multe pisici,
crede că totul arată ca o pisică.
„Un băiat ținând o bâtă de baseball.”
(Râsete)
Dacă n-a văzut o periuță de dinți, 
o confundă cu o bâtă de baseball.
„Un bărbat călărește un cal 
pe o stradă lângă o clădire.”
(Râsete)
Nu le-am predat arta computerelor.
„O zebră stând într-un câmp cu iarbă.”
N-a învățat să aprecieze 
frumusețea naturii ca şi noi.
A fost o călătorie lungă.
Să ajungem cu vârsta
de la 0 la 3 ani a fost greu.
Adevărata provocare e 
să trecem de la 3 la 13 și mai departe.
Să vă reamintesc 
poza asta cu băiatul și tortul.
Până acum am învățat computerul 
să vadă obiecte
sau chiar să ne spună o poveste simplă 
când vede poza.

Persian: 
(سخنران): قطعا وقتی 
تعداد زیادی گربه می‎بیند
ممکن است فکر کند که همه چیز شبیه گربه است.
(صدای رایانه): یک پسربچه 
یک چوب بیسبال در دست دارد.
(خنده حضار)
(سخنران): و اگر مسواک ندیده باشد
آن را با چوب بیسبال اشتباه می‎گیرد.
(صدای رایانه): مردی که در خیابان
کنار یک ساختمان اسب سواری می‎کند.
(خنده حضار)
(سخنران): ما به رایانه‎ها کلاس 
هنر پایه تدریس نکردیم.
(صدای رایانه): یک گورخر ایستاده
در زمینی پوشیده از علف.
(سخنران): و یاد نگرفته که قدر 
زیبایی مسحور کننده طبیعت
را مثل من و شما بداند.
بله، سفر درازی بوده
تا از سن صفر به سه سالگی برسیم
دشوار بود.
سختی واقعی رفتن از سه سالگی به
۱۳ سالگی و فراتر هست.
اجازه بدهید به شما با این تصویر 
پسر و کیک یادآوری کنم.
تا الان به رایانه یاد دادیم 
که اجسام را ببیند
یا حتی وقتی یک تصویر را می‎بیند 
یک داستان ساده به ما بگوید.

Chinese: 
(主講人) 因為它看了太多貓了，
以至於它見到了什麼都像貓咪。
(電腦) 一位小男孩握著一支球棒。
(觀眾笑)
(主講人) 或者，如果電腦是第一次看到牙刷，
會把它與球棒混淆。
(電腦) 一個人在建築物旁的街道上騎馬。
(觀眾笑)
(主講人) 我們還沒讓電腦上基礎美術課。
(電腦) 一匹斑馬站在原野中。
(主講人) 電腦還沒辦法像人類一樣，
學會欣賞大自然的美景。
這是條漫漫長路，
要從零歲發展到三歲是很難的，
更艱深的挑戰在於從三歲發展到十三歲，
甚至到更遠的階段。
讓我用這張男孩與蛋糕的圖片來進一步說明，
直到今日，我們已經教會了電腦識別物品，
甚至於在看到一張圖後，可以簡單地敘述。

Korean: 
고양이를 너무 많이 봐서
뭐든지 고양이로 보이는지도 모르죠.
(컴퓨터) "어린 소년이 
야구 방망이를 들고 있습니다."
(웃음)
칫솔을 본 적이 없다면 
야구 방망이와 혼동합니다.
(컴퓨터) "남자가 말을 타고 
건물 옆 길을 내려갑니다."
(웃음)
우리는 컴퓨터에게 
미술을 가르치지 않았습니다.
(컴퓨터) "얼룩말이 초원에 서있습니다"
컴퓨터는 자연의 경이로운 
아름다움에 감상하는 것을
배우지도 않았습니다.
이는 오랜 여정이었습니다.
0세에서 3세까지 가는 건
힘들었습니다.
하지만 진짜 도전은 3세에서 13세,
그 이상으로 나아가는 것입니다.
이 소년과 케이크의 사진을
다시 보시죠.
지금까지 우리는 컴퓨터에
사물을 식별하고
간단한 말을 하는 것을 가르쳤습니다.

Polish: 
(Wideo) Komputer: 
Osoba przy stole z tortem
FFL: Ale na tym zdjęciu widać dużo więcej,
niż tylko osobę i tort.
Komputer nie widzi, 
że ten tort to włoski przysmak,
serwowany tylko na Wielkanoc.
Chłopiec ma na sobie ulubioną koszulkę,
którą dziadek przywiózł mu z Sydney.
Widać, jak bardzo jest 
w tym momencie szczęśliwy
i co mu właśnie chodzi po głowie.
To mój syn, Leo.
Podczas zmagań z wizualną inteligencją
myślę bez przerwy o Leo
i o przyszłym świecie, 
w którym będzie żył.
W którym maszyny będą umiały widzieć,
lekarze i pielęgniarki będą mieli 
dodatkową parę niezmęczonych oczu,
które będą pomagać w leczeniu pacjentów.
Samochody będą bezpieczniejsze.

Hungarian: 
(Videó) Számítógép: Egy ember ül 
egy asztalnál egy tortával.
FFL: Azonban sokkal több 
látható ezen a képen,
nemcsak egy ember és egy torta.
Amit a számítógép nem lát az az, 
hogy ez egy különleges olasz torta,
amit csak Húsvétkor szolgálnak fel.
A fiú a kedvenc pólóját viseli,
amit apukájától kapott ajándékba 
egy Sydney-i kirándulás után,
és hogy önök és én mindannyian 
meg látjuk, hogy milyen boldog,
és hogy pontosan mi járt a fejében 
abban a pillanatban.
Ez a fiam Leo.
A vizuális megértés utáni kutatásom során
állandóan Leora gondolok,
és a jövőbeni világra, amiben élni fog.
Amikor a gépek képesek lesznek látni,
az orvosoknak és az ápolóknak 
lesz egy plusz fáradhatatlan szempárjuk,
amely segíteni fog a diagnózisban 
és a betegeket ellátásában.
Az autók intelligensebben és 
biztonságosabban fognak haladni az úton.

Croatian: 
(Video) Računalo: Osoba sjedi
za stolom s kolačem.
FFL: Ali postoji puno više
na ovoj slici
nego samo osoba i kolač.
Što računalo ne vidi jest
da je to poseban talijanski kolač
koji se jedino servira za vrijeme Uskrsa.
Dječak nosi svoju omiljenu majicu
koju je dobio od oca
nakon putovanja u Sidney,
i vi i ja možemo reći da je jako stretan
i što je na njegovom umu 
u ovom trenu.
To je moj sin Leo.
Na mom pohodu na vidnu inteligenciju,
razmišljam o Leu konstantno
i budućnosti u kojoj će živjeti.
Kada uređaji vide,
doktori i sestre će imati
dodatan par neumornih očiju
koje im pomažu dijagnosticirati
i pobrinuti se za pacijenta.
Auti će voziti pametnije
i sigurnije na putu.

Spanish: 
(Video) Computadora: Una persona sentada
a la mesa con un pastel.
FFL: Pero hay mucho más
en esta fotografía
que simplemente una persona y un pastel.
Lo que la computadora no ve es que 
este es un pastel especial italiano
exclusivo de Pascua.
El niño viste su camiseta favorita,
que le regaló su papá
tras un viaje a Sídney,
y nosotros podemos decir
qué tan feliz está
y qué pasa por su mente
en ese momento.
Ese es mi hijo Leo.
En mi búsqueda de inteligencia visual,
pienso constantemente en él
y en el futuro en que va a vivir.
Cuando las máquinas puedan ver,
los médicos y enfermeras tendrán
un par extra de ojos incansables
para ayudarlos a diagnosticar
y cuidar de los pacientes.
Los autos andarán de forma
inteligente y segura en los caminos.

Romanian: 
„O persoană stând la masă cu un tort.”
Dar e mult mai mult în această poză
decât o persoană și un tort.
Computerul nu vede 
că acesta e un tort italian special
servit doar în preajma Paștelui.
Băiatul poartă tricoul său preferat
dăruit de tatăl său,
după o excursie în Sydney,
iar noi putem vedea cât de fericit e
și ce are de gând.
Acesta e fiul meu Leo.
În cercetarea inteligenței vizuale,
mă gândesc constant la Leo
și la lumea în care va trăi.
Când mașinăriile pot vedea,
doctorii și asistentele vor avea 
alte perechi de ochi neobosiți
să-i ajute să diagnosticheze 
și să aibă grijă de pacienți.
Mașinile vor merge mai inteligent 
și mai sigur pe drum.

Chinese: 
（视频）计算机：
”一个人坐在放蛋糕的桌子旁。“
李飞飞：但图片里还有更多信息
——远不止一个人和一个蛋糕。
计算机无法理解的是：
这是一个特殊的意大利蛋糕，
它只在复活节限时供应。
而这个男孩穿着的
是他最喜欢的T恤衫，
那是他父亲去悉尼旅行时
带给他的礼物。
另外，你和我都能清楚地看出，
这个小孩有多高兴，以及这一刻在想什么。
这是我的儿子Leo。
在我探索视觉智能的道路上，
我不断地想到Leo
和他未来将要生活的那个世界。
当机器可以“看到”的时候，
医生和护士会获得一双额外的、
不知疲倦的眼睛，
帮他们诊断病情、照顾病人。
汽车可以在道路上行驶得
更智能、更安全。
机器人，而不只是人类，

Czech: 
(Video) Počítač: Člověk sedí u stolu
s dortem.
FFL: Ale na tom obrázku je toho 
o tolik více
než jen člověk a dort.
Co počítač nevidí, je, že je to speciální
italský dort,
který se podává pouze při Velikonocích.
Chlapec má na sobě své nejoblíbenější 
tričko,
které mu dal jeho otec po cestě do Sydney,
a vy i já dokážeme říct, jak je šťastný
a co si právě myslí.
Toto je můj syn Leo.
Při řešení zrakové inteligence,
myslím na Lea neustále,
a na svět, ve kterém bude žít.
Když stroje mohou vidět,
doktoři a sestry budou mít navíc
pár neúnavných očí,
které jim pomohou diagnostikovat
a starat se o pacienty.
Auta budou jezdit chytřeji a 
bezpečněji.

Turkish: 
Bilgisayar: Biri yaş pastanın olduğu
masada oturuyor.
FFL: Fakat bu resimde sadece bir kişi ve
pastadan
daha fazlası var.
Bilgisayarın göremediği şey,
onun sadece Paskalya süresince
servis edilen özel bir İtalyan pastası
olduğu.
Çocuk, babası tarafından Sidney gezisinden
sonra kendisine hediye edilen
en sevdiği tişörtünü giyiyor,
hepimiz onun nasıl mutlu olduğunu
ve şu anda kafasından geçenleri
söyleyebiliriz.
Bu benim oğlum Leo.
Görsel zeka araştırmalarımda,
durmaksızın Leo'yu
ve içinde yaşayacağı geleceği düşünüyorum.
Makineler görebildiğinde,
doktor ve hemşireler, tanı koymak ve
hastalarla ilgilenmek için
ek olarak yorulmayan
göz çiftlerine sahip olacaklar.
Arabalar yollarda daha güvenli
daha akıllı bir şekilde gidecek.

Persian: 
(صدای رایانه): یک شخص نشسته سر یک میز
با یک کیک.
(سخنران): اما در این عکس 
خیلی چیزهای دیگر غیر از یک
آدم و کیک هست.
چیزی که رایانه نمی‎بیند این است که
این یک کیک مخصوص ایتالیایی
که فقط در زمان عید پاک پخته می‎شود
هست.
پسر تی‎شرت مورد علاقه‎اش را پوشیده
که توسط پدرش بعنوان هدیه بعد از سفر
به سیدنی به او داده شده.
و من و شما همه می‎توانیم بگویم
که چقدر خوشحال هست
و دقیقا در آن لحظه در ذهنش چه می‎گذرد.
این پسر من "لیو" هست.
در جستجوی من برای هوش بصری
مدام به "لیو" فکر می‎کنم
و آینده‎ای که او زندگی خواهد کرد.
زمانی که ماشینها می‎توانند ببینند،
پزشکان و پرستاران یک جفت چشم
خستگی ناپذیراضافه خواهند داشت
که به آنها کمک خواهد کرد برای تشخیص
و مراقبت از بیماران.
خودروها هوشمندانه‎تر و ایمن‎تر
در جاده‎ها حرکت خواهند کرد.

Modern Greek (1453-): 
(Βίντεο) Υπολογιστής: Κάποιος κάθεται
σε ένα τραπέζι με ένα κέικ.
ΦΦΛ: Άλλα υπάρχουν κι άλλα
πράγματα σε αυτή την εικόνα
εκτός από τον άνθρωπο και το κέικ.
Αυτό που δεν βλέπει ο υπολογιστής είναι
ότι αυτό είναι ένα ειδικό ιταλικό κέικ
που σερβίρεται μόνο κατά την περίοδο
του Πάσχα.
Το αγόρι φοράει την αγαπημένη του μπλούζα
που του την έφερε ο πατέρας του
από ένα ταξίδι στο Σίδνεϊ,
και εμείς μπορούμε να δούμε
πόσο χαρούμενο είναι
και τι ακριβώς σκέφτεται αυτή τη στιγμή.
Αυτός είναι ο γιος μου, ο Λέο.
Στην αναζήτησή μου για οπτική νοημοσύνη
σκέφτομαι τον Λέο συνέχεια
και τον μελλοντικό κόσμο
στον οποίο θα ζήσει.
Όταν οι μηχανές θα μπορούν να δουν,
οι γιατροί και νοσοκόμοι θα έχουν
ένα ζευγάρι ακούραστα μάτια
να τους βοηθάνε να διαγνώσουν
και να φροντίσουν τους ασθενείς τους.
Τα αυτοκίνητα θα οδηγούν πιο έξυπνα
και πιο ασφαλή στο δρόμο.

iw: 
(וידאו) מחשב: אדם יושב ליד שולחן עם עוגה.
פיי פיי: אבל יש עוד כל כך הרבה בתמונה הזו
מאשר רק אדם ועוגה.
מה שהמחשב לא רואה זה שזו
עוגה איטלקית מיוחדת
שמוגשת רק בחג הפסחא.
הילד לובש את החולצה האהובה עליו
שניתנה לו על ידי אביו אחרי טיול בסידני,
ואתם ואני יכוים להגיד כמה מאושר הוא
ומה בדיוק הוא חושב ברגע הזה.
זה בני ליאו.
במסע שלי לאינטלגנציה חזותית,
אני כל הזמן חושבת על ליאו
ועל העולם העתידי בו הוא יחיה.
כשמכונות יכולות לראות,
לרופאים ואחיות יהיה עוד זוג עיניים
שלא מתעייפות
כדי לעזור להם לאבחן ולדאוג למטופלים.
מכוניות ינועו 
בצורה חכמה יותר ובטוחה יותר בדרכים.

French: 
(Vidéo) L'ordinateur : Une personne 
assise à une table avec un gâteau.
FFL : Mais il y a beaucoup plus
qu'une personne et un gâteau.
Ce que l'ordinateur ne voit pas
est que c'est un gâteau italien spécial
servi uniquement à Pâques.
Le garçon porte son t-shirt préféré,
celui que lui a offert son père
après un voyage à Sydney,
et vous et moi voyons bien
à quel point il est heureux
et ce qu'il pense à ce moment.
C'est mon fils Léo.
Au cours de ma quête
de l'intelligence visuelle,
Léo était constamment dans mes pensées
ainsi que le monde dans lequel il vivra.
Quand les machines pourront voir,
les médecins et infirmières auront
une paire d'yeux infatigables en plus
pour les aider au diagnostic
et au soin des patients.
Les voitures seront plus intelligentes
et plus sûres.

Danish: 
(Video) Computer.: En person sidder ved
et bord med en kage.
FFL: Men der er så meget mere ved
dette billede
end kun en person og en kage.
Hvad computeren ikke ser, er at dette
er en speciel italiensk kage
som kun bliver serveret ved påske.
Drengen er i sin yndlings t-shirt
som hans far gav ham efter en 
tur til Sydney,
og vi kan se hvor glad han er
og præcis hvad han tænker i dette øjeblik.
Dette er min søn Leo.
På min mission for visuel intelligens
tænker jeg konstant på Leo
og fremtidens verden han vil leve i.
Når maskiner kan se
vil læger og sygeplejersker have
ekstra utrættelige øjne
til at hjælpe med at diagnosticere
og pleje patienter.
Biler vil være klogere og sikrere
på vejene.

English: 
(Video) Computer: A person sitting
at a table with a cake.
FFL: But there's so much more 
to this picture
than just a person and a cake.
What the computer doesn't see
is that this is a special Italian cake
that's only served during Easter time.
The boy is wearing his favorite t-shirt
given to him as a gift by his father
after a trip to Sydney,
and you and I can all tell how happy he is
and what's exactly on his mind
at that moment.
This is my son Leo.
On my quest for visual intelligence,
I think of Leo constantly
and the future world he will live in.
When machines can see,
doctors and nurses will have
extra pairs of tireless eyes
to help them to diagnose
and take care of patients.
Cars will run smarter
and safer on the road.

Russian: 
(Видео) Компьютер:
Человек сидит за столом с тортом.
ФФЛ: На этой фотографии
изображено гораздо больше,
чем просто человек и торт.
Компьютер не видит, что это особый 
итальянский торт,
который пекут только во время Пасхи.
На мальчике надета
его любимая футболка,
которую ему подарил отец 
после поездки в Сидней.
И невооружённым глазом видно,
как счастлив мальчик
и о чём именно он думает в этот момент.
Это мой сын Лео.
В моих поисках визуального интеллекта
я постоянно думаю о Лео
и о том мире, в котором он будет жить.
Когда машины будут способны видеть,
доктора и медсёстры обзаведутся
дополнительной парой неустающих глаз
для диагностики заболеваний
и ухода за пациентами.
Машины на дорогах станут 
умнее и безопаснее.

Japanese: 
「ケーキのあるテーブルにつく人」
しかしこの写真には
単に人とケーキというよりも
遙かに多くのものがあります
コンピュータが見なかったのは 
このケーキが特別なイタリアのケーキで
イースターの時に
食べるものだということです
男の子が着ているのは
お気に入りのTシャツで
お父さんがシドニー旅行の
おみやげにくれたものだということ
私たちはみんな 
この男の子がどんなに喜んでいるか
何を思っているかが分かります
これは息子のレオです
視覚的な知性を
追い求める探求の中で
私はいつもレオのことや
レオが住むであろう
未来の世界のことを考えています
機械に見ることが
できるようになれば
医師や看護師は疲れを知らない
別の目を手に入れて
患者の診断や世話に
役立てられるでしょう
自動車は道路をより賢明に
安全に走行するようになるでしょう

Korean: 
(컴퓨터) "한 사람이 케이크가 있는 
테이블에 앉아 있습니다."
그러나 이 사진에는
사람과 케이크 이외에
더 많은 것이 들어있죠.
컴퓨터가 보지 못하는 것은 
이 특별한 이태리 케이크가
부활절에만 먹는 것이란 겁니다.
소년은 자기가 좋아하는 
티셔츠를 입고 있는데
아이 아버지가 시드니 여행을 
다녀와 선물로 준 것입니다.
여러분과 저는 이 아이가 
얼마나 기뻐하는지,
저 순간 무슨 생각을 하는지 
이야기할 수 있습니다.
제 아들 레오입니다.
시각 지능에 대한 탐구를 하며
저는 항상 레오와
레오가 살 미래세계를 생각합니다.
기계가 인식을 하게 되면,
의사와 간호사는
쉬지 않는 기계 눈을 이용해
환자를 진단하고 돌볼 수 있겠지요.
자동차는 더 똑똑하고 안전하게
도로를 주행할 겁니다.

Portuguese: 
(Vídeo) Computador: Uma pessoa
sentada à mesa com um bolo.
FFL: Mas há muito mais nesta foto
do que apenas uma pessoa e um bolo.
O que o computador não vê
é que esta é uma colomba
que é servida apenas durante a Páscoa.
O garoto está vestindo
a sua camiseta preferida,
que lhe foi dada de presente
pelo pai após uma viagem a Sydney.
E nós podemos ver a felicidade dele,
e o que está se passando em sua mente
exatamente naquele momento.
Este é o meu filho Leo.
Em minha busca pela inteligência visual,
penso nele constantemente
e no mundo futuro em que ele viverá.
Quando as máquinas puderem ver,
médicos e enfermeiros terão
pares extras de olhos incansáveis
para ajudá-los a diagnosticar
e cuidar de pacientes.
Os carros funcionarão de forma
mais inteligente e segura nas estradas.
Robôs, não apenas seres humanos,

Arabic: 
(فيديو) الحاسوب: شخص يجلس
إلى مائدة مع كعكة
فاي-فاي لي: لكن هناك المزيد
والمزيد في هذه الصورة
أكثر من مجرد شخص وكعكة
ما لا يراه الحاسوب أن تلك
هي كعكة إيطالية مميزة
تُقَدّم فقط بمناسبة عيد الفِصْح
الولد يرتدي قميصه المفضّل
الذي أعطاه إياه والده كهدية
بعد رحلة إلى سيدني
وجميعنا نرى كم هو سعيد
ونستطيع أن نخمن ما يدور في خَلَده
في تلك اللحظة
هذا هو ابني ليو
أثناء بحثي عن الذكاء البصري
كنت أفكر في ليو باستمرار
وعن عالم المستقبل الذي سيعيش فيه
عندما ستتمكن الحواسيب من الإبصار
الأطباء والممرضات سيحظون بأزواج
إضافية من العيون التي لا تَكِلّ
لتعينهم على تشخيص المرضى والعناية بهم
ستسير السيارات على الطرقات
بشكل أذكى وأكثر أمانًا

Vietnamese: 
hoặc kể một câu chuyện đơn giản
khi nhìn thấy một bức ảnh.
Máy tính: Một người ngồi
trên một cái bàn với một cái bánh.
FFL: Nhưng còn rất nhiều thứ 
về bức ảnh này
hơn là chỉ một người và một cái bánh.
Điều mà máy tính không thấy được
đây là một chiếc bánh kiếu Ý rất đặc biệt
chỉ ăn vào dịp Phục Sinh.
Thằng bé đang mặc
chiếc áo thun yêu thích của nó
trao cho cậu như một món quà của bố cậu
sau một chuyến đi đến Sydney.
và bạn và tôi có thể thấy được
cậu bé trông vui đến thế nào
và điều thực sự trong tâm trí của nó
vào lúc đó.
Đây là con trai tôi Leo.
Trong khi nghiên cứu về
trí thông minh hình ảnh,
tôi không ngừng nghĩ về Leo
và tương lai mà nó sẽ sống.
Khi những chiếc máy có thể nhìn,
bác sĩ và y tá sẽ có thêm 
những đôi mắt không mệt mỏi
để giúp họ chẩn đoán
và chăm sóc bệnh nhân.
Những chiếc xe sẽ chạy nhanh hơn
và an toàn hơn trên đường.

Ukrainian: 
(Відео) Комп'ютер: Людина сидить
за столом з пирогом.
ФФЛ: Але на фото присутні
значно більше об'єктів,
ніж лише людина і пиріг.
Повз увагу комп'ютера проходить те,
що це спеціальний італійський пиріг,
який їдять виключно на Паску.
Хлопець одягнутий у свою 
улюблену футболку,
яку йому батько привіз із Сіднею.
Ми з вами можемо сказати,
наскільки він щасливий
і що саме у нього на думці
в цей момент.
Це мій син Лео.
У моїх пошуках візуального інтелекту
я постійно думаю про Лео
і майбутній світ, у якому йому 
доведеться жити.
Коли машини зможуть бачити,
лікарі та медсестри отримають
додаткові пари невтомних очей,
які допомагатимуть їм у діагностуванні
та догляді за хворими.
Машини їздитимуть обачніше
і безпечніше на дорогах.

Thai: 
(วิดีโอ) คอมพิวเตอร์: คนนั่งอยู่ที่โต๊ะกับเค้ก
FFL: แต่มีอะไรมากขึ้นในภาพนี้
ไม่ใช่แค่คนและเค้ก
สิ่งที่คอมพิวเตอร์ไม่เห็นคือ 
นี่เป็นเค้กอิตาเลียนพิเศษ
ที่ให้บริการเฉพาะในช่วงเทศกาลอีสเตอร์
เด็กชายกำลังใส่เสื้อยืดที่ชอบ
พ่อให้เขาเป็นของขวัญหลังจาก
เดินทางไปซิดนีย์
และคุณและฉันทั้งหมดสามารถ
บอกได้ว่า เด็กมีความสุขแค่ไหน
และสิ่งที่อยู่ในใจของเขาในขณะนั้น
นี่คือลีโอลูกชายของฉัน
ในการสืบเสาะของฉันต่อปัญญาจากภาพ
ฉันคิดถึงเลโออย่างต่อเนื่อง
และโลกอนาคตที่ลูกจะมีชีวิตอยู่
เมื่อเครื่องสามารถมองเห็น
แพทย์และพยาบาลจะมีสายตา
ที่ไม่รู้จักเหน็ดเหนื่อย
เพื่อช่วยในการวินิจฉัยและดูแลผู้ป่วย
รถยนต์จะทำงานได้อย่างชาญฉลาด
และปลอดภัยยิ่งขึ้นบนท้องถนน

Chinese: 
(電腦) 一個人和蛋糕坐在桌旁。
(主講人) 這張照片其實蘊涵著更多的東西，
不僅只有人和蛋糕。
電腦看不出這是種特別的義式蛋糕，
人們只有在復活節時才會做。
這個男孩穿著他最心愛的T恤，
是去雪梨玩的時候，他的父親送的，
各位和我都可以看得出他有多快樂，
以及當時他的心裡在想什麼。
這是我兒子，李奧。
在探索智能視覺的旅途上，
我不斷地想到他，
以及他在將來生活的世界，
當未來，機器有了視覺，
醫生和護士就多了雙永不倦怠的眼睛，
幫助他們診斷及照顧病人；
行駛在路上的車子可以更聰明、更安全；

Italian: 
Una persona seduta 
a tavola con una torta.
Ma c'è molto di più in questa foto
di una persona con una torta.
Ciò che il computer non vede è 
che è una torta italiana speciale
che si serve solo a Pasqua.
Il bambino indossa 
la sua t-shirt preferita
regalatagli dal padre 
dopo un viaggio a Sidney,
e possiamo notare quanto sia felice
e cosa c'è di preciso 
nella sua mente in quel momento.
Questo è mio figlio Leo.
Nella mia ricerca 
dell'intelligenza ottica,
penso a Leo di continuo
e al mondo futuro in cui vivrà.
Quando le macchine potranno vedere,
i medici e gli infermieri avranno 
un paio extra di occhi instancabili
a aiutarli 
con diagnosi e cura dei pazienti.
Le auto saranno più 
intelligenti e sicure sulla strada.

Dutch: 
(Video) Computer: Een persoon
zit aan tafel met een taart.
FFL: Maar er zit meer aan vast
dan alleen een persoon en een taart.
De computer ziet niet dat dit
een speciale Italiaanse taart is
die alleen met Pasen wordt gegeten.
De jongen draagt zijn lievelingsshirt
die hij heeft gekregen van zijn vader
na een reis naar Sydney,
en iedereen ziet hoe blij hij is
en waar hij precies aan denkt
op dat moment.
Dit is mijn zoon Leo.
Bij mijn zoektocht
naar visuele intelligentie
denk ik steeds aan Leo
en aan zijn toekomstige wereld.
Als machines kunnen zien,
zullen doktoren en verpleegsters
een extra paar onvermoeibare ogen hebben
om te helpen bij de diagnose
en om voor de patiënten te zorgen.
Auto's zullen slimmer 
en veiliger over de weg rijden..
Robots, niet alleen mensen,

Portuguese: 
(Vídeo) Computador: Uma pessoa
sentada à mesa com um bolo.
FFL: Mas há muito mais nesta imagem
do que somente uma pessoa e um bolo.
O que o computador não consegue ver
é que se trata de um bolo italiano especial
que só se serve durante a Páscoa.
O rapaz está a usar
a sua T-shirt preferida
que o pai lhe ofereceu
após uma viagem a Sydney.
Tanto eu como vocês conseguimos ver
como o rapaz está feliz
e o que se passa exatamente
na sua mente nesse momento.
Este é o meu filho Leo.
Na minha busca pela inteligência visual,
penso frequentemente no Leo
e no mundo em que ele viverá no futuro.
Quando as máquinas conseguirem ver,
médicos e enfermeiros irão ter
um par adicional de olhos incansáveis
para os ajudar a diagnosticar
e cuidar dos seus doentes.
Os automóveis irão andar na estrada
de modo mais inteligente e seguro.

Albanian: 
(Video) Kompjuteri: Nje person i ulur 
pranë tavolinës me një tortë.
FFL: Por ka shumë më tepër në këtë foto
sesa thjesht një person dhe një tortë.
Kompjuteri nuk mund të shohë
se kjo është një tortë e vecantë italiane
që shërbehet vetëm në kohën e Pashkëve.
Djali ka veshur bluzën e tij të preferuar
të cilën ia ka dhuruar i ati,
pas një udhëtimi ne Sidney,
dhe ne mund ta shohim
se sa i lumtur është ai
dhe cfarë i kalon nëpër mend
në ato momente.
Ky është im bir, Leo.
Në kërkimin tim për inteligjencë vizuale,
mendoj për Leon vazhdimisht
dhe për botën e së ardhmes 
ku ai do të jetojë.
Kur një makineri do të mund të shohë,
doktorët dhe infermjerët do të kenë
një palë sy të palodhur shtesë
për t'i ndihmuar të përcaktojnë diagnoza
dhe të kujdesen për pacientët.
Makinat do të vozitin në mënyrë 
më inteligjente dhe më të sigurtë

Portuguese: 
Os robôs, não apenas os seres humanos,
irão ajudar-nos a enfrentar
zonas de catástrofe,
salvando feridos e encarcerados.
Iremos descobrir novas espécies,
melhores materiais,
e explorar limites nunca antes vistos
com a ajuda de máquinas.
Pouco a pouco, estamos a dar
às máquinas a capacidade de ver.
Primeiro, ensinamo-las a ver.
Depois, elas ajudam-nos a ver melhor.
Pela primeira vez, os olhos humanos
não estarão sozinhos
na exploração e compreensão
do nosso mundo.
Iremos usar máquinas
não somente pela sua inteligência,
mas também para colaborar com elas
de formas que ainda
não conseguimos imaginar.
Esta é a minha missão:
dar inteligência visual aos computadores
e criar um futuro melhor
para o Leo e para o mundo.
Obrigada.
(Aplausos)

French: 
Des robots, pas seulement des humains,
nous aideront à sauver des vies
dans des zones sinistrées.
Nous découvrirons de nouvelles espèces,
de meilleurs matériaux,
nous explorerons d'autres frontières,
avec l'aide des machines.
Petit à petit, nous donnons la vue
aux machines.
D'abord nous leur apprenons à voir.
Puis c'est elles
qui nous aident à mieux voir.
Pour la première fois, les yeux humains
ne seront pas les seuls
à questionner et explorer notre monde.
En plus d'utiliser les machines
pour leur intelligence,
nous collaborerons avec elles
de manière inédite.
C'est ma quête :
donner aux ordinateurs
l'intelligence visuelle
et créer un meilleur avenir 
pour Léo et pour le monde.
Merci.
(Applaudissements)

Persian: 
ربات‎ها، نه فقط انسانها
به ما در خطرکردن در مناطق فاجعه‎زده برای 
نجات مصدومان و زخمی‎ها کمک خواهند کرد.
گونه‎های جدید خواهیم یافت،
مواد بهتر،
و مرزهای نادیده را با کمک ماشینها
اکتشاف خواهیم کرد.
کم کم داریم به ماشینها بینایی می‎بخشیم.
ابتدا ما به آنها دیدن را می‎آموزیم.
سپس آنها به ما کمک می‎کنند تا بهتر ببینیم.
برای اولین بار چشمان انسان
تنها چشمانی نخواهند بود
که تفکر می‎کنند و جهان ما را کاوش می‎کنند.
ما نه تنها از ماشینها برای
هوش آنها استفاده می‎کنیم،
بلکه با آنها به روش هایی که 
نمی‎توانیم تصور کنیم همکاری خواهیم کرد.
این جستجوی من است:
تا به رایانه ها هوش بصری بدهم
و آینده بهتری برای "لیو" و جهان خلق کنم.
متشکرم.
(تشویق حضار)

Arabic: 
الرجال الآليون
وليس البشر فحسب
سيساعدوننا في مواجهة نطاقات الكوارث
لينقذوا المحتجزين والجرحى
سنكتشف أنواع مخلوقات جديدة
ومواد أفضل
وسنستكشف الأبعاد غير المرئية
بمساعدة الحواسيب
شيئًا فشيئًا، نحن نمنح
حاسة البصر للحواسيب
في البداية نعلمها كيف ترى
ثم ستساعدنا لنرى بشكل أفضل
لأول مرة، لن تكون عيون البشر هي الوحيدة
التي تتأمل وتستكشف عالمنا
لن يقتصر استخدامنا للحواسيب لأجل ذكائها
بل سوف نتعاون معها
بطرق لا يمكننا حتى تخيلها
هذا هو أملي
أن أعطي الحواسيب ذكاءً بصريًا
وأن أخلق مستقبلًا أفضل
من أجل ليو ومن أجل العالم
شكرًا
(تصفيق)

Modern Greek (1453-): 
Ρομπότ, όχι μόνο άνθρωποι,
θα μας βοηθάνε σε ζώνες καταστροφής
να σώσουμε εγκλωβισμένους και τραυματίες.
Θα ανακαλύψουμε καινούργια είδη,
καλύτερα υλικά,
και θα εξερευνήσουμε αόρατα σύνορα
με τη βοήθεια των μηχανών.
Σιγά-σιγά δίνουμε όραση στις μηχανές.
Πρώτα, θα τους μάθουμε να βλέπουν.
Μετά, θα μας βοηθήσουν να δούμε καλύτερα.
Για πρώτη φορά, τα ανθρώπινα μάτια
δεν θα είναι τα μόνα
που μελετούν και εξερευνούν τον κόσμο.
Δεν θα χρησιμοποιούμε τις μηχανές 
μόνο για τη νοημοσύνη τους,
θα συνεργαζόμαστε με τρόπους
που δεν μπορούμε να φανταστούμε.
Αυτός είναι ο στόχος μου:
να δώσω στους υπολογιστές οπτική νοημοσύνη
και να φτιάξω ένα καλύτερο μέλλον 
για τον Λέο και για τον κόσμο.
Σας ευχαριστώ.
(Χειροκρότημα)

Portuguese: 
nos ajudarão a realizar buscas
em áreas de desastres
e a salvar pessoas soterradas e feridas.
Descobriremos novas espécies,
materiais melhores
e exploraremos lugares que não podemos ver
com a ajuda das máquinas.
Pouco a pouco, estamos dando
visão às máquinas.
Primeiro, as ensinamos a ver,
então elas nos ajudam a ver melhor.
Pela primeira vez,
os olhos humanos não serão os únicos 
ponderando e explorando nosso mundo.
Não usaremos as máquinas
apenas pela sua inteligência;
colaboraremos também com elas
de uma maneira que nem sequer imaginamos.
Esta é a minha busca:
dar aos computadores inteligência visual
e criar um futuro melhor
para o Leo e para o mundo.
Obrigada.
(Aplausos)

Romanian: 
Roboții, nu doar oamenii,
ne vor ajuta în zonele de dezastru 
pentru a-i salva pe captivi și răniți.
Vom descoperi noi specii,
materiale mai bune
și vom explora frontiere nevăzute 
cu ajutorul mașinăriilor.
Încet-încet, facem mașinăriile să vadă.
Întâi le învățăm pe ele să vadă.
Apoi ne vor ajuta să vedem noi mai bine.
Pentru prima dată, nu doar ochii umani
vor analiza şi explora lumea.
Vom folosi mașinăriile
pentru inteligența lor
şi vom colabora cu ele 
în moduri în care nici nu ne imaginăm.
Asta e misiunea mea:
să ofer computerelor inteligența vizuală
și să creez un viitor mai bun 
pentru Leo și pentru lume.
Mulțumesc.
(Aplauze)

Czech: 
Roboti, nejen lidé,
nám pomohou prozkoumat místa neštěstí,
aby zachránili uvězněné a zraněné.
Objevíme nové druhy,
lepší materiály,
a prozkoumáme neznámé hranice,
když nám stroje pomohou.
Postupně dáváme zrak strojům.
Nejdřív je učíme vidět.
Pak nám pomohou pomoci vidět lépe.
Poprvé, lidské oči nebudou jediné,
které zkoumají a objevují náš svět.
Nebudeme stroje používat jenom
kvůli jejich inteligenci,
ale můžeme spolupracovat způsoby,
které si ani neumíme představit.
Toto je můj úkol:
dát počítačům zrakovou inteligenci,
a vytvořit tak lepší budoucnost
pro Lea a svět.
Děkuji
(Potlesk)

Vietnamese: 
Robots, không chỉ con người,
giúp chúng ta đến với khu vực bị thiên tai
để cứu những người mắc kẹt và thương vong.
Và chúng ta sẽ khám phá ra những loài mới,
vật liệu tốt hơn,
và khám phá những biên giới chưa tưng thấy
với sự giúp đỡ của máy móc.
Từng chút từng chút một,
chúng ta cho máy móc thị giác.
Đầu tiên, chúng ta dạy chúng cách nhìn.
Sau đó, chúng sẽ giúp
chúng ta nhìn rõ hơn.
Lần đầu tiên, đôi mắt của con người
không còn là thứ duy nhất
nghĩ ngợi và khám phá thế giới này.
Chúng ta sẽ không chỉ sử dụng máy móc
nhờ sự thông minh của chúng,
chúng ta còn có thể hợp tác với chúng
theo những cách không thể tưởng tượng nỗi.
Đây là mong muốn của tôi:
cho máy tính sự thông minh thị giác
và tạo ra một tương lai tốt hơn 
cho Leo và cho thế giới.
Cám ơn.
(vỗ tay)

Spanish: 
Robots, y no solo humanos,
nos ayudarán a desafiar zonas de desastre
para salvar heridos y atrapados.
Descubriremos nuevas especies,
mejores materiales,
y exploraremos fronteras nunca vistas
con ayuda de las máquinas.
Poco a poco, damos a las máquinas
el don de la vista.
Primero les enseñamos a ver.
Luego ellas nos ayudarán a ver mejor.
Por primera vez, los ojos humanos
no serán los únicos
que exploren nuestro mundo.
No solo usaremos máquinas
por su inteligencia,
también colaboraremos con ellas de 
formas que ni siquiera imaginamos.
Esta es mi misión:
dar a las computadoras 
inteligencia visual
y crear un mejor futuro
para Leo y para el mundo.
Gracias.
(Aplausos)

English: 
Robots, not just humans,
will help us to brave the disaster zones
to save the trapped and wounded.
We will discover new species, 
better materials,
and explore unseen frontiers
with the help of the machines.
Little by little, we're giving sight
to the machines.
First, we teach them to see.
Then, they help us to see better.
For the first time, human eyes
won't be the only ones
pondering and exploring our world.
We will not only use the machines
for their intelligence,
we will also collaborate with them
in ways that we cannot even imagine.
This is my quest:
to give computers visual intelligence
and to create a better future
for Leo and for the world.
Thank you.
(Applause)

Turkish: 
Robotlar, sadece insanlar değil,
enkaz bölgelerinde tutsak ve yaralıları
kurtarmada bizimle göğüs gerecekler.
Yeni tür, daha iyi malzemeler bulacak
ve makinelerin yardımıyla, görünmeyen
sınırları keşfedeceğiz.
Azar azar, makinelere görme yetisini
veriyoruz.
Önce, biz onlara görmeyi öğretiyoruz.
Sonra, onlar daha iyi görebilmemiz için
bize yardım ediyor.
Öncelikle, dünyamızı keşfetmek
ve düşünmek için gözlerimiz
sadece insan gözleri olmayacak.
Makineleri sadece zekaları için
kullanmıyor,
aynı zamanda hayal bile edemeyeceğimiz bir
şekilde onlarla iş birliği yapıyoruz.
Benim araştırmam bu:
bilgisayarlara görsel zekayı vermek
ve Leo için, dünya için daha iyi bir
gelecek oluşturmak.
Teşekkürler.
(Alkış)

Chinese: 
人類與機器人能一起
共同投入災區的救援工作，拯救受困人員及傷者；
我們還可以發現新品種
與更好的材料，
探索未知的疆界，
這一切都可仰賴機器的協助。
一步一步地，我們賦予機器視覺，
先教他們識別物品，
然後它們也讓我們看得更清楚，
這是第一次人類的眼睛不是唯一
可以用來思考和探索世界的工具，
我們不僅可以利用機器的智能，
更可以運用更多你想像不到的方式攜手合作。
這是我想追求的目標：
給予機器智慧之眼，
為李奧和整個世界創造更美好的未來。
謝謝各位。
(觀眾鼓掌)

Danish: 
Robotter, ikke kun mennesker,
vil hjælpe med at redde sårede
mennesker på ulykkessteder.
Vi vil opdage nye arter,
bedre materialer,
og udforske nye territorier
ved hjælp af maskiner.
Vi lærer maskiner at se med tiden.
Først lærer vi dem at se.
Så lærer de os at se bedre.
For første gang vil menneskelige øjne
ikke være de eneste
som iagttager og udforsker vor verden.
Vi vil ikke blot bruge maskiner for
deres intelligens,
vi vil også samarbejde med dem på
måder vi end ikke kan forestille os.
Dette er min mission:
at give computere visuel intelligens
og at skabe en bedre fremtid
for Leo og for verden.
Tak skal I have.
(Bifald)

Croatian: 
Roboti, ne samo ljudi,
će pomoći u opasnim situacijama
kako bi spasili zatočene i ozljeđene.
Otkrit ćemo nove vrste,
bolje materijale,
i istražiti neviđene granice
uz pomoć uređaja.
Malo po malo, dajemo 
vid uređajima.
Prvo, smo ih naučili da vide.
Onda nam oni pomažu vidjeti bolje.
Po prvi put, ljudsko oko 
neće biti jedino
koje gleda i istražuje svijet.
Nećemo koristiti uređaje
zbog njihove inteligencije,
surađivat ćemo s njima
na načine koje ne možemo zamisliti.
Ovo je moj pothvat:
dati računalima vidnu inteligenciju
i stvoriti bolje sutra
za Lea i za svijet.
Hvala vam.
(Pljesak)

Italian: 
I robot, non solo gli umani,
ci aiuteranno a salvare 
persone intrappolate e ferite.
Scopriremo nuove 
specie, materiali migliori,
e esploreremo frontiere 
invisibili con l'aiuto delle macchine.
Un po' alla volta 
diamo la vista alle macchine.
In primo luogo le insegnamo a vedere.
Poi ci aiutano a vedere meglio.
Per la prima volta 
gli occhi umani non saranno i soli
a meditare e esplorare il nostro mondo.
Useremo le macchine non 
solo per la loro intelligenza,
ma collaboreremo anche con loro 
in modi che neanche immaginiamo.
Questa è la mia ricerca:
dare ai computer intelligenza ottica
e creare un futuro 
migliore per Leo e per il mondo.
Grazie.
(Applausi)

Hungarian: 
A robotok, nem csak az emberek,
segíteni fognak nekünk
katasztrófák helyszínén a csapdába 
esettek és sérültek mentésében.
Új fajokat, jobb anyagokat 
fogunk felfedezni,
és felfedezünk ismeretlen 
határterületeket a gépek segítségével.
Lassanként, látóképességet 
adunk a gépeknek.
Először megtanítjuk őket látni.
Azután ők segítenek nekünk jobban látni.
Első alkalommal, nem az 
emberi szemek lesznek az egyetlenek,
melyek elmerengenek
és felfedezik a világot.
Nem csak az intelligenciájukért 
fogjuk használni a gépeket,
olyan módon is együtt fogunk működni 
velük, amit még el sem tudunk képzelni.
Ez az én küldetésem:
vizuális intelligenciát
adni a számítógépeknek,
és egy jobb jövőt teremteni 
Leo és világ számára.
Köszönöm.
(Taps)

Chinese: 
会帮我们救助灾区被困和受伤的人员。
我们会发现新的物种、更好的材料，
还可以在机器的帮助下
探索从未见到过的前沿地带。
一点一点地，
我们正在赋予机器以视力。
首先，我们教它们去“看”。
然后，它们反过来也帮助我们，
让我们看得更清楚。
这是第一次，人类的眼睛不再
独自地思考和探索我们的世界。
我们将不止是“使用”机器的智力，
我们还要以一种从未想象过的方式，
与它们“合作”。
我所追求的是：
赋予计算机视觉智能，
并为Leo和这个世界，
创造出更美好的未来。
谢谢。
（掌声）

Dutch: 
zullen ons helpen rampplekken te betreden
om ingeslotenen en gewonden te redden.
We zullen nieuwe soorten ontdekken
en betere materialen,
en ongeziene gebieden verkennen
met behulp van machines.
Beetje bij beetje geven we machines
gezichtsvermogen.
Eerst leren we ze te kijken.
Daarna helpen ze ons bij het kijken.
Voor het eerst zijn menselijke ogen
niet de enige
die over de wereld nadenken
en haar verkennen.
We gaan de machines niet alleen
vanwege hun intelligentie gebruiken,
en gaan met ze samenwerken
op manieren die we ons 
niet kunnen voorstellen.
Dit is mijn zoektocht:
computers visuele intelligentie geven
en een betere toekomst geven
aan Leo en aan de wereld.
Dank je wel.
(Applaus)

Japanese: 
人間だけでなくロボットも
災害地域に取り残され負傷した人々を救出する
手助けができるようになるでしょう
私たちは機械の助けを借りて 
新種の生物やより優れた素材を発見し
未だ見ぬフロンティアを
探検するようになるでしょう
私たちは少しずつ機械に
視覚を与えています
最初に私たちが
機械に見ることを教え
それから機械が より良く見られるよう
私たちを助けてくれることでしょう
歴史上初めて
人間以外の目が
世界について考察し
探求するようになるのです
私たちは機械の知性を
利用するだけでなく
想像もできないような方法で
機械と人間が協力し合うようになるでしょう
私が追い求めているのは
コンピュータに視覚的な知性を与え
レオや世界のために
より良い未来を作り出すということです
ありがとうございました
(拍手)

Korean: 
인간 뿐 아니라 로봇이
재난 지역에서 갇히고 부상당한 사람을 
구하는 걸 도울 겁니다.
우리는 기계의 도움으로 
새로운 종, 더 나은 물질을 발견하고
보지 못한 개척지를 
탐험하게 될 겁니다.
조금씩 우리는 기계에게
시각을 주고 있습니다.
처음에 우리는 기계에게
보는 것을 가르쳤습니다.
다음엔, 기계가 우리를 도와
더 잘 보게 할 겁니다.
처음으로, 인간의 눈이 아닌 것이
세계를 생각하고 탐험하게 되었습니다.
우리는 인공지능 때문에
기계를 이용할 뿐만 아니라
상상치 못했던 방식으로 
기계와 협력하게 될 것입니다.
이것이 제 탐구입니다.
컴퓨터에 시각 지능을 부여하는 것,
그리고 레오와 세계를 위해서
더 나은 미래를 만드는 것입니다.
감사합니다.
(박수)

Russian: 
Не только люди, но и роботы
смогут оказывать помощь в зонах бедствий
и спасать людей из-под завалов.
С помощью машин мы откроем
новые виды животных и растений,
усовершенствуем материалы
и расширим границы своей деятельности.
Постепенно машины обретут зрение.
Сначала мы научим их видеть.
Затем они помогут видеть лучше нам самим.
Впервые человек будет
осваивать и осознавать мир
посредством не только своих,
но и компьютерных глаз.
Мы будем не только использовать машины 
благодаря их интеллекту,
но и работать совместно с ними так,
как никто и не мог вообразить.
Это моя задача:
дать машинам визуальный интеллект
и создать лучшее будущее
для Лео и всего мира.
Спасибо.
(Аплодисменты)

Ukrainian: 
Роботи, а не лише люди,
допомагатимуть у зонах катастроф
рятувати поранених людей.
За допомогою машин
ми відкриємо нові види,
кращі матеріали
і дослідимо небачені нові можливості.
Потроху ми даємо машинам зір.
Спочатку ми вчимо їх бачити.
Потім вони допоможуть 
нам бачити краще.
Вперше людські очі
вже не єдині,
що можуть спостерігати
і досліджувати наш світ.
Ми не лише будемо використовувати
інтелект машин,
ми також будемо співпрацювати з ними
різними неймовірними способами.
Я бачу своє завдання у тому,
щоб надати комп'ютерам
візуальний інтелект
і створити краще майбутнє
для Лео і для світу.
Дякую
(Оплески)

Albanian: 
Robotët, jo vetëm njerëzit,
do të na ndihmojnë të deportojmë në zonat
e fatkeqësive, të shpëtojmë të plagosurit
Ne do të zbulojmë specie të reja,
materiale më të mira,
dhe do të eksplorojmë kufij të padukshëm
me ndihmën e kompjuterave
Dalë ngadalë, po i japim kompjuterit
aftësinë për të parë.
Në fillim i mësojmë të shohin.
Më pas, ata na ndihmojnë ne të shohim 
më mirë.
Për herë të parë, sytë njerëzorë, 
nuk do të jenë të vetmit
që do të shohin dhe eksplorojnë botën.
Nuk do t'i përdorim kompjuterat
vetëm për inteligjencën,
por do të bashkëpunojmë me to
në mënyra që as nuk mund t'i imagjinojmë.
Ky është qëllimi im:
t'i japim kompjuterave 
inteligjencë vizuale
dhe të krijojmë një të ardhme më të mirë
për Leon dhe botën.
Faleminderit.
(Duartrokitje)

Polish: 
Roboty, nie tylko ludzie,
będą pomagać w poszukiwaniu rannych 
na obszarach dotkniętych przez katastrofy.
Odkryjemy nowe gatunki, lepsze materiały
i przekroczymy nieznane dotąd granice
dzięki pomocy maszyn.
Powoli dajemy wzrok maszynom.
Najpierw uczymy je widzieć.
Potem one pomogą nam lepiej widzieć.
Po raz pierwszy ludzkie oczy 
nie będą jedynymi,
które odkrywają świat.
Będziemy używać maszyn 
nie tylko dla ich inteligencji.
Naszą współpracę z nimi 
trudno sobie teraz wyobrazić.
To moje zadanie:
dać komputerom wizualną inteligencję
i stworzyć lepszą przyszłość 
dla Leo i dla świata.
Dziękuję.
(Brawa)

iw: 
רובוטים, לא רק בני אדם,
יעזרו לנו לעמוד בגבורה באזורי אסון
ולהציל את הלכודים והפצועים.
אנחנו נגלה מינים חדשים,
חומרים טובים יותר,
ונחקור גבולות חדשים
עם עזרה של המכונות.
לאט לאט, אנחנו נותנים יכולת ראייה למכונות.
קודם כל, אנחנו מלמדים אותם לראות.
לאחר מכן, הם יעזרו לנו לראות טוב יותר.
בפעם הראשונה, העיניים האנושיות 
לא יהיו העיניים היחידות
שמהרהרות וחוקרות את העולם.
אנחנו לא רק נשתמש במכונות
בשביל האינטליגנציה שלהם,
אנחנו גם נשתף איתן פעולה בדרכים
שאנחנו אפילו לא יכולים לדמיין.
זה המסע שלי:
לתת למחשבים תבונה חזותית
וליצור עתיד טוב יותר
בשביל ליאו ובשביל העולם.
תודה רבה.
(מחיאות כפיים)

Thai: 
หุ่นยนต์ไม่ใช่แค่มนุษย์
จะช่วยให้เรากล้าได้กล้าเสียในเขตภัยพิบัติ
เพื่อช่วยผู้ที่ติดกับและได้รับบาดเจ็บ
เราจะค้นพบสายพันธุ์ใหม่ วัสดุที่ดีขึ้น
และสำรวจแนวที่มองไม่เห็นด้วย
ความช่วยเหลือของเครื่อง
เรากำลังให้เครื่องมองเห็นทีละเล็กทีละน้อย
อันดับแรก เราสอนให้เครื่องเห็น
จากนั้น ก็ช่วยให้เราดูดีขึ้น
เป็นครั้งแรก ดวงตาของมนุษย์จะไม่
ขบคิดและ
สำรวจโลกของเราอย่างโดดเดี่ยว
เราจะไม่เพียงแต่ใช้เครื่องเพื่อสติปัญญา
ของเครื่อง
เราจะร่วมมือกับเครื่องด้วยวิธีที่
เราไม่สามารถจินตนาการได้
นี่คือภารกิจของฉัน
ทำให้คอมพิวเตอร์ฉลาด
และเพื่อสร้างอนาคตที่ดีขึ้นสำหรับ
ลีโอและสำหรับโลก
ขอขอบคุณ
(เสียงปรบมือ)
