
Thai: 
นี้เป็นการเพิ่มเติมวิดีโอของ Brais ในเรื่องการเรียนรู้ลึก(deep learning)
การเรียนรู้ลึกเป็นสิ่งที่ยิ่งใหญ่ในตอนนี้
และมีความขัดแย้งระหว่างการวิจัยมากว่ามันจะคือเป็น สิ่งนี้หรือไม่
สิ่งที่ยิ่งใหญ่ที่ทุกอย่างจะเปลี่ยนแปลง
หรือไม่ว่าจะเป็นเปลวไฟในกระทะ เช่นเครือข่ายประสาทเทียม
(artificial neural networks) ในยุค 80
ทุกคนได้ตื่นเต้นมาก และพวกมันได้ผลค่อนข้างเป็นผลดี
และเมื่อพวกเขาตระหนักว่าพวกมันไม่สามารถแก้ปัญหาทั้งหมดให้กับพวกเขา ผมไม่ทราบว่า
อะไรคือสิ่งที่คุ้มค่า เหล่านี้เป็นเรื่องใหญ่ ผมคิดนะ
[Offscreen] มาพูดคุยเกี่ยวกับ convoluted neural networks ผมพูดถูก ใช่มั้ย?
Convolutional neural networks (CNN)
[Offscreen] อ๋อ โอเค
มันรวมถึงเครือข่ายประสาทลึก(deep neural networks) ซึ่งเป็นสิ่งที่ Brais ได้พูดถึง
และ kernel convolution ซึ่งเป็นสิ่งที่ผมได้พูดถึง ในวิดีโอก่อนหน้า
ผมแนะนำให้ผู้คนดูวิดีโอนั้น
คุณจะรู้ว่ามันมีผู้ดำเนินรายการที่สนุกสนาน ใช่มั้ย?
* หัวเราะจาก Offscreen *
แต่ แต่เพราะ ถ้าคุณไม่ได้รู้จัก kernel convolution นี่จะไม่ให้ความกระจ่างมากนักแก่คุณ
ดูวิดีโอนั่นก่อน อย่างแรกเลย
[Offscreen] ดังนั้นที่ kernel convolutions ที่เราทำในกราฟิกและสิ่งต่างๆ อย่าง เอ่อ sobel op-
ใช่ การดำเนินการ Sobel การทำให้เบลอแบบ Gaussian และสิ่งพวกนี้
โดยเฉพาะ การดำเนินการของโซเบล และ การหาขอบภาพ (edge detection)

Turkish: 
Bu, Brais'in derin öğrenme konusundaki videolarına bir tür takip
Yani derin öğrenme şu anda büyük bir şey
ve bunun olup olmayacağı üzerine araştırma arasında bazı anlaşmazlıklar var - bu, bu * o *
Her şeyi değiştirecek en büyük şey bu
ya da bu tavada başka bir flaş olup olmadığı gibi, yapay sinir ağları 80'lerde idi
Herkes çok heyecanlandı ve oldukça iyi sonuçlar aldı.
ve onlarla tüm sorunları çözemediklerini anladıklarında, bilmiyorum
Buna değer, bunlar önemli, sanırım.
[ekran dışı] Convoluted sinir ağları hakkında konuşalım, öyle mi dedim?
Konvolüsyonel sinir ağları.
[ekran dışı] Ah, tamam, tamam
Her iki derin sinir ağını birleştiriyorlar, yani Brais'in konuştuğu şey.
ve önceki bir videoda bahsettiğim şey olan çekirdek kıvrımları.
İnsanlara bu videoyu izlemelerini tavsiye ederim
Eğlenceli bir ev sahibi var, değil mi?
* ekrandan gülmek *
Öyleyse, ama, ama, çünkü, bir çekirdek evriminin ne olduğunu bilmiyorsanız, bu sizin için pek bir anlam ifade etmeyecektir.
Öyleyse önce o videoyu izle
[ekran dışı] Demek grafikte yaptığımız çekirdek çevrimleri ve sobel op-
Evet, Sobel operasyonları, Gauss bulanıkları ve bunun gibi şeyler.
Özellikle sobel işlemleri ve kenar tespiti

English: 
This is kind-of a follow up to Brais' videos on deep learning
So deep learning is kind of a big thing at the moment
and there's some disagreement between research over whether this is gonna be - the, this is *it*
This is the big thing that's gonna change everything
or whether this is another flash in the pan, like artificial neural networks were in the 80s
Everyone got very excited and they got quite a good results
and when they realized that they couldn't solve all the problems with them, I don't know
For what it's worth, these are a big deal, I think
[offscreen] Let's talk about convoluted neural networks, have I said that right?
Convolutional neural networks.
[offscreen] Ah, right, ok
They combine both deep neural networks, which is what Brais was talking about
and kernel convolutions, which is what I talked about in a previous video.
I would thoroughly recommend people watch that video
You know, it's got an entertaining host, right?
*laugh from offscreen*
So, but, but, because, if you don't know what a kernel convolution is, this isn't gonna make much sense to you
So watch that video first
[offscreen] So that's the kernel convolutions we did on graphics and things like, uh, sobel op-
Yeah, Sobel operations, Gaussian blurs, and things like this.
Sobel operations in particular, and edge detection

Thai: 
ดังนั้น ถ้าเราคิด กลับไปที่เครือข่ายประสาทเทียม (artificial neural network) แบบดั้งเดิม
ตกลง สิ่งที่เรามีคือเราได้มี input ข้อมูลบางอย่างที่เรากำลังพยายามที่จะเรียนรู้, OK
เราได้มีชั้นซ่อน (hidden layers) เอาล่ะ แล้วเราได้มีการส่งออกไปชั้น output
อาจจะแค่หนึ่ง ผมไม่ทราบ
และเหล่านี้เชื่อมต่อแบบเต็ม เพื่อให้เรามีการเชื่อมต่อจำนวนมากจากที่นี่
และนี่ และที่นี่ และเหล่านี้จะเชื่อมต่อกับที่นี่
และอื่นๆ ผมแค่ร่างภาพไม่กี่อย่างของพวกมัน
และแล้วเหล่านี้ทั้งหมดที่เชื่อมต่อไปยังจุดสิ้นสุด
ตกลง ตอนนี้ใช้ความคล้ายคลึงกันของ Brais เราได้พูดคุยเกี่ยวกับราคาบ้าน
ตกลง ดังนั้นนี้จะเป็นอย่างจำนวนห้องนอน
และนี้จะเป็นอย่าง "มีสระว่ายน้ำมั้ย"
และนี่จะเป็น แบบว่า พื้นที่แต่ละชั้นเป็นยังไง
และมันมีสวนที่ดี และอื่น ๆ
เหล่านี้จำนวนมาก ตกลงโหนดจำนวนมากของภายในที่เราไม่ได้สนจริงๆ หรือที่ผมไม่ได้สน
เอ่อ, และอื่น ๆ และอื่น ๆ และแล้วในที่สุด ในตอนท้ายเรามีราคาบ้าน
ตอนนี้ ราคาบ้านหลังนี้เป็นฟังก์ชั่นที่มีความซับซ้อนของ input เหล่านี้
มันซับซ้อนเพราะ
โหนดนี้ ที่นี่ บางส่วนเป็นเชิงเส้น หรือไม่เชิงเส้น ตอนนี้
การรวมกันของสิ่งเหล่านี้ ตกลง โน่นนิด
บวกนี่หน่อย บวกนี่อีกนิด บวกนี้อีกเล็กน้อย

Turkish: 
Yani, geleneksel bir yapay sinir ağını düşünürsek
Tamam, elimizde olan, öğrenmeye çalıştığımız bir tür girişimiz var.
bazı gizli katmanlarımız var, tamam ve sonra bazı çıktı katmanlarımız var.
belki sadece bu, bilmiyorum
Bunlar tamamen bağlantılı, bu yüzden buradan birçok bağlantımız var.
ve burada ve burada ve bunlar buraya bağlı
ve böylece, sadece bir kaçına çizim yapıyorum.
ve sonra bunların hepsi sona bağlıdır.
Tamam, şimdi Brais'in analojisini kullanarak, ev fiyatları hakkında konuşuyorduk.
Tamam, bu, yatak odası sayısı gibi bir şey olacak
ve bu "havuza sahip" gibi bir şey olurdu
ve bu, bildiğiniz gibi, hangi alandır?
ve iyi bir bahçeye sahipti.
Bunlardan birçoğu, tamam, özellikle de umursayacağımız bir sürü iç düğüm, yoksa umrumda değil.
Ah, doğru, vb., Ve sonra ve sonunda sonunda bir ev fiyatımız var.
Şimdi bu ev fiyatı nedir, bu girdilerin karmaşık bir işlevidir.
Karmaşık çünkü
Bu düğüm burada bazı doğrusal ya da doğrusal olmayan şimdi
bunlar. tamam, bundan biraz
artı biraz, artı biraz, artı biraz

English: 
So, if we think back to a traditional artificial neural network
ok, what we've got is we've got some kind of input we're trying to learn, ok
we've got some hidden layers, alright, and then we've got some output layers
maybe just this one, I don't know
And these are fully connected, so we have lots of connections from here
and here and here and these are connected to here
and so on, I'm just drawing in a few of them,
and then these are all connected to the end.
ok, Now using Brais's analogy, we were talking about house prices.
ok, so, this will be something like number of bedrooms,
and this would be something like "has it got a pool"
and this would be, you know, what floor space is it
and has it got a good garden and so on
lots of these, ok, lots of inner nodes that we don't really care about particularly, or I don't
Uh, right, and so on and so forth, and then finally at the end we have a house price.
Now what this house price is, is a complicated function of these inputs.
It's complicated because
this node here is some linear, or non-linear now, combination of
these. ok, so, a bit of this
plus a bit of this, plus a bit of this, plus a bit of this

Turkish: 
Bazı doğrusal olmayan fonksiyonlar sayesinde.
Bu, bunların farklı bir birleşimidir.
Bu, yine, bunların farklı birleşimi, vb.
Ve sonra bu, bunların farklı bir kombinasyonu
Görüyorsun, burada bir çeşit soyutlama yaratıyorsun.
kombinasyon kombinasyonlarının bulunduğu yer
Ve bu işlev çok karmaşık
Brais kara kutu hakkında konuştuğunda, bazı yönlerden aynen olduğu gibi
çünkü bu bireysel ağırlıklara bakamıyoruz ve “peki bunun 2'si var, bu demek olmalı” diyemiyoruz.
çünkü ne anlama geldiğini bilmiyoruz, değil mi?
Genel şemada, bu ağın tamamında, bireysel ağırlığın ne anlama geldiğini bilmiyoruz.
Ve dürüst olmak gerekirse, o kadar umurunda bile olmayabiliriz.
Gerçekten umursadığımız şey, ev fiyatını ne kadar iyi tahmin edeceği, buna dayanarak ne kadar doğru olduğu.
farklı bir giriş için, bunu değiştiririz, çıktıyı okuruz - iyi mi?
Evet? Parlak!
Tamam, şimdi, görüntüler için, bu benim zamanımın çoğunu harcadığım şey.
bu bir başlangıç, ama benim için pek kullanışlı değil.
Bunun bizim girdilerimiz olduğunu düşünüyorsanız, tamam, ve size bir evin resmini veririm ve derim ki "doğru, bu evin ne kadar değerli olduğunu söyle"

English: 
through some non-linearity function.
This is a different combination of these.
This, again, different combination of these, and so on, right
And then this, a different combination of these
So, you can see, you're building up some kind of level of abstraction here
where you've got combinations of combinations
And that function is very complicated
When Brais talked about a black box, in some ways that's exactly what it is
because we can't look at these individual weights and say, "well that's got .2 of this one, so that must mean this"
because we just don't know what it means, right
In the grand scheme of things, in this whole network, we don't know what that individual weight means
And to be honest, we might not even care that much
What we really care about is how well does it predict house price, how accurate is that based on that
for a different input, so we change this, read the output - is it good?
Yes? Brilliant!
ok, now, for images, which is obviously what I spend most of my time around,
this is a start, but it's not very useful to me.
If you think that this is our inputs, ok, and I give you a picture of a house, and I say "right, tell me how much this house is worth"

Thai: 
ผ่านฟังก์ชั่นที่ไม่เป็นเชิงเส้นบางอย่าง
นี้ เป็นชุดการรวมกันที่แตกต่างของพวกเหล่านี้
นี้ อีกครั้ง ชุดการรวมกันที่แตกต่าง และต่อไปเรื่อยๆ ใช่มั้ย
แล้วนี้ ชุดการรวมที่แตกต่างของสิ่งเหล่านี้
ดังนั้นจะเห็นได้ว่า คุณกำลังสร้างอะไรบางอย่างระดับของนามธรรม ที่นี่
ที่คุณได้มีการรวมกันของการรวมกัน
และฟังก์ชั่นที่มีความซับซ้อนมาก
เมื่อ Brais พูดเกี่ยวกับกล่องดำ ในทางที่ว่า นี่คือสิ่งที่มันเป็น
เพราะเราไม่สามารถมองน้ำหนักของแต่ละอันเหล่านี้ และพูดว่า "อืม มี 0.2 ของหนึ่งในนี้ งั้นต้องหมายถึงนี่"
เพราะเราก็ไม่ทราบว่ามันหมายถึงอะไร ใช่มั้ย
ในโครงใหญ่ของสิ่งที่อยู่ในเครือข่ายทั้งหมดนี้ เราไม่ทราบว่าน้ำหนักของแต่อันหมายความว่าอะไร
และเอาตรงๆ นะ เราอาจไม่ได้สนใจมันมาก
สิ่งที่เราสนใจ คือมันคาดการณ์ราคาบ้านได้ถูกต้อง ความแม่นยำจากสิ่งเหล่านั้นตะหาก
สำหรับการป้อนข้อมูล input ที่แตกต่างกัน ดังนั้นเราจึงเปลี่ยนนี่ อ่าน output - ดีมั้ยล่ะ?
ใช่? ยอดเยี่ยม!
ตกลง ตอนนี้สำหรับภาพซึ่งจะเห็นได้ชัดว่า สิ่งที่ผมใช้เวลาส่วนใหญ่ของผมไปกับมัน
นี้คือจุดเริ่มต้น แต่ก็ไม่ได้มีประโยชน์มากกับผม
หากคุณคิดว่านี่เป็น input ของเรา ตกลง และผมให้ภาพของบ้านแก่คุณและบอกว่า "บอกฉันว่าบ้านหลังนี้มีค่าเท่าไหร่"

Turkish: 
tamam, peki, ne?
Peki nasıl, tamam, yapabileceğim iki şey var, doğru
her şeyden önce, görüntüye dayanarak, yatak odası sayısı gibi şeyleri hesaplamayı deneyebilirim.
ve onları buraya koy.
Bir şekilde bazı özellikleri hesaplıyordum
ve sonra onları buraya koyup bu özellikleri öğreniyor olurdum.
Bunu yapmanın akıllıca bir yolu, çünkü bunun dışında oldukça zor.
Akıllı, çünkü o kadar fazla nörona sahip olmak zorunda değiliz.
Her şeyde, aslında modelimiz için daha önce kullandığımız ağları kullanabiliriz.
Evimizde tek yapmamız gereken, görüntü analizini yapan kod parçasını çözmek.
Şimdi, sadece evin dışına ait bir resmi temel alan bir odadaki oda sayısını bulmaya çalışan herkes bana bunun yapılamayacağını söyleyecektir.
Bu zor.
Tamam, saf bir şekilde düşünebilirsin, bunun yerine ne yapabiliriz?
sadece görüntüyü buraya koy.
Bunu ilk piksel yap,
ve bu ikinci piksel,
ve bu üçüncü piksel,
ve diğerleri, tamam.
Öyleyse, bu ihtiyaç duyabileceği tüm bilgilere sahip.
Ama o, ama sorun bu

English: 
ok, well, what?
So how do I, ok, so there's two things I could do, right
first of all is I could try and calculate things like number of bedrooms and stuff, based on the image
and put them in here
In some way, I'd be calculating some features
and then I'd be putting them in here and learning on those features.
That is quite a smart way of doing it, because, apart from that's obviously quite difficult
um, it's smart because we don't have to have that many more neurons
In anything, we can actually use the same network as we used before for our model
on our house, all we have to do is work out the bit of code that does the image analysis
Now, anyone that's tried to find out the number of rooms in a house based only on one picture of the outside of the house will tell me that that can't be done, right
That's hard.
Ok, so you could naively think, what we could do instead
is just put the image in here.
Make this the first pixel,
and this the second pixel,
and this the third pixel,
and so on, ok.
Then, this has got all the information it could ever need, right
But it, but that's the problem

Thai: 
ok อืม อะไรนะ?
ผมทำได้อย่างไร, OK จึงมีสองสิ่งที่ผมทำได้ ใช่มั้ย
อันแรกคือผมอาจจะลองและคำนวณสิ่งต่างๆ เช่น จำนวนห้องนอน และสิ่งต่างๆ ที่อยู่บนภาพ
และใส่ไว้ในที่นี่
ในบางทาง ผมจะคำนวณคุณสมบัติ (features) บางอย่าง
แล้วผมจะวางไว้ในที่นี่ และการเรียนรู้เกี่ยวกับคุณลักษณะเหล่านั้น
ค่อนข้างเป็นวิธีที่ฉลาดในการทำมัน เพราะ นอกจากนี้ เห็นได้ชัดว่าค่อนข้างยาก
อืม มันเป็นฉลาด เพราะเราไม่จำเป็นต้องมี โหนดเซลล์ประสาทอื่น ๆ อีกมากมาย
ในทุกสิ่ง เราสามารถใช้เครือข่ายเดียวกับที่เราใช้มาก่อนสำหรับโมเดลของเรา
ในบ้านของเรา ทั้งหมดที่เราต้องทำคือการเขียนโค้ดที่จะวิเคราะห์ภาพ
ตอนนี้ ใครที่พยายามที่จะหาจำนวนของห้องพักในบ้านที่อยู่เฉพาะในหนึ่งภาพของนอกบ้าน
จะบอกว่าที่ไม่สามารถทำได้ ใช่มั้ย นั่นล่ะที่ยาก
ตกลง ดังนั้นคุณอาจคิดอย่างไร้เดียงสาว่า สิ่งที่เราสามารถทำแทน
เป็นเพียงการใส่ภาพในที่นี่
ทำให้นี่เป็นพิกเซลแรก
และนี่พิกเซลสอง
และนี่พิกเซลที่สาม
และอื่น ๆ , OK
จากนั้น นี้ได้มีข้อมูลทั้งหมดที่มันต้องการ ใช่มั้ย
แต่มัน แต่ ที่เป็นปัญหา

Turkish: 
7 megapiksel görüntü, bu 7 milyon giriş düğümü, diyelim ki bir sonraki katmanda 7 milyon düğüm var.
her biri birbirine bağlanırsa, bunun bilgisayarımı eriteceğini görebilirsiniz.
denemeyi ve yaratmayı bile deneyecek, çok fazla bilgi
Bu yüzden alanımızı biraz örnekliyoruz.
Genelde yapacağımız şey, bazı küçük özellik alt kümelerini hesaplamaktır.
ve sonra onları bu tarafa koyardık.
Yani bu oldukça önemli. Yani, geleneksel makine öğrenimi biraz böyle yapılır.
Yani Michel bu konuda bazı videolar yaptı. Birinin yüzüyle ilgili bazı özellikleri hesapla
ve bunu bazı makine öğrenme algoritmasına dahil edin.
Yapmadığın şey, sadece öğrenme yüzüne makine öğrenme algoritmasını koymaya çalışmak.
çünkü orada çok fazla bilgi var
Şimdiye kadar, tamam mı? Konvolüsyonel sinir ağlarının devreye girdiği yer orasıdır.
Böylece, evrişimsel sinir ağları bu düğümlerin her birini bir çekirdek evrişimi ile değiştirir.
Yani, bir Sobel kenar dedektörü gibi
Şimdi, daha önce yapmam gerekenin yerine, bir şeyin üzerinde bir Sobel kullanıldı ve sonra makine bunu öğrendi.
Buna sadece hangi özelliklerin ilginç olduğunu öğrenme fırsatı veriyorum.
belki bir kenar algılama, belki bir köşe algılama

English: 
7 megapixel image, that's 7 million input nodes, let's say we have 7 million nodes on the next layer
each one connects to each other one, you can see that that's just gonna melt my computer
it's not even gonna try and create it, it's too much information
That's why we downsample our space a little bit.
What we would usually do is calculate some small subset of features
and then we would put them in at this end.
So that's quite important. So, traditional machine learning is done a bit like that.
So Michel's done some videos on this. Calculate some features about someone's face
and put that in to some machine learning algorithm
What you don't do is try and put the machine learning algorithm just on the face
because it's too much information there
Until now, ok, right? That's where convolutional neural networks step in.
So, convolutional neural networks replace each of these nodes with a kernel convolution.
So, like, a Sobel edge detector
Now, so instead of what I would've done before, which was run a Sobel over something and then machine learn on that,
I just give this the opportunity to learn which features are interesting
maybe it is an edge detection, maybe it is a corner detection

Thai: 
ภาพ7 ล้านพิกเซล นั่น 7 ล้านโหนดข้อมูล input เลย สมมติว่าเรามี 7 ล้านโหนดในชั้นถัดไป
แต่ละคนเชื่อมต่อกับแต่ละคนอื่น ๆ ที่คุณจะเห็นได้ว่าคอมพิวเตอร์ของผมรับไม่ไหว
ก็ไม่อยากแม้แต่จะพยายามและสร้างมันขึ้นมา มันเป็นข้อมูลที่มากเกินไป
นั่นเป็นเหตุผลที่หาทางเราลดข้อมูล (down sample) ในพื้นที่ของเรานิด ๆ หน่อย ๆ
สิ่งที่เรามักจะทำคือการคำนวณบางเซตย่อยเล็ก ๆ ของคุณสมบัติ(features)
และจากนั้นเราจะใส่พวกมันในตอนท้ายนี่
เป็นสิ่งสำคัญมาก ดังนั้น การเรียนรู้ในแมชชีนแบบดั้งเดิมจะทำแบบนั้น
Michel ทำวิดีโอบางส่วนเกี่ยวกับเรื่องนี้ คำนวณ features บางอย่างเกี่ยวกับใบหน้าใครบางคน
และใส่อัลกอริธึมการเรียนรู้ของแมชชีนบางอย่าง
สิ่งที่คุณไม่ได้ทำ คือพยายามและใส่อัลกอริธึมการเรียนรู้ของแมชชีนแค่บนใบหน้าตรงๆเลย
เพราะมันมีข้อมูลที่มากเกินไป
จนถึงขณะนี้ โอเคใช่มั้ย? นั่นคือสิ่งที่ convolutional neural networks เข้ามาทำ
ดังนั้น convolutional neural networks ได้ใส่แต่ละโหนดเหล่านี้ด้วย kernel convolution
ดังเช่น ตัวตรวจจับขอบภาพของโซเบล (Sobel edge detector)
ตอนนี้ แทนที่สิ่งที่ผมจะได้ทำมาก่อนหน้า ซึ่งได้เรียกรันโซเบลบนบางอย่างแล้วต่อด้วยบางสิ่ง แล้ว แมชชีนเรียนรู้สิ่งนั้นต่อ
ผมเพียงให้นี้มีโอกาสที่จะเรียนรู้ว่าคุณสมบัติ(features) ไหนที่น่าสนใจ
บางที มันอาจจะเป็นการตรวจหาขอบ บางทีมันอาจจะคือการตรวจหามุม

Thai: 
บางที มันอาจจะเป็นสิ่งที่เน้นสิ่งที่อยู่ตรงกลางของภาพ
หรือสิ่งที่เน้นที่มุมบนด้านซ้าย
มันไม่ได้สนจริงๆ และที่จริงคือ ผมไม่ทราบว่าสิ่งที่พวกมันเป็นคืออะไร
เอาล่ะ, ถ้าผมให้คุณ ภาพของบ้านสองพันภาพ
และขอให้คุณที่จะคาดการณ์ราคาบ้านบนพื้นฐานของภาพ
ผมไม่ทราบว่า ผมสามารถทำนายราคาได้มั้ย แต่มันอาจจะเป็น - หน้าต่างมีเท่าไหร่ และสิ่งที่ต้องการนี้
แต่ผมไม่รู้แบบแน่นอนจริงๆ
และคอมพิวเตอร์สามารถทำแบบถึก(brute-force)ผ่านสิ่งเหล่านั้นได้เร็วกว่าที่ผมทำได้ ผมบอกเลย
แล้วผมจะทั้งคาดการณ์มันและสามารถมองย้อนกลับไปและพูดว่า "โอ้ มันเป็นเพราะที่หน้าต่างเลย ราคาทั้งหมดนี้"
ดังนั้น ขอให้คิดว่าเรามีภาพของเรา ตกลง ดังนั้น
ผมจะละความคล้ายคลึงบ้านในขณะนี้ เพราะผมจะต้องวาดภาพของบ้านจำนวนมาก
ถ้าผมทำอย่างนั้น ตกลง ดังนั้นมาคุยเกี่ยวกับว่า  CNN ทำงานอย่างไร
อืม และทำไมมันมีประโยชน์ เรามีภาพของบางสิ่งบางอย่าง
ตอนนี้ ผมได้เห็น convolutional neural networks ใช้สำหรับสิ่งที่ไม่ใช่ภาพ
แต่ตอนนี้ เราจะพูดแค่เกี่ยวกับภาพ
นี่คือภาพของ ฉัน มันไม่ได้เป็นเป็นที่ชื่นชอบนัก แต่ผมจะใช้มัน
ขณะนี้ มีสามแชนแนล ที่นี่, OK
ดังนั้น นี้เป็นปริมาณ 3D จริงในบางแง่
จำได้มั้ย เมื่อเราได้พูดคุยเกี่ยวกับภาพ 3 มิติ,

English: 
maybe it's something that highlights whatever's in the middle of the picture
Or something that highlights the top left-hand corner
it doesn't really matter, and the point is I don't know what they are
right, if I give you, you know, two thousand pictures of houses
and ask you to predict house prices based on the pictures
I don't know for sure, I can guess, but it might be - that how many windows it has and things like this
but I don't know for sure.
And a computer can brute-force through those things much quicker than I can and tell me
And then I can go, I can both predict it, and I can look back and say, "oh, it was windows after all"
So, let's imagine that what we have is our image, ok, so
I'm gonna move away from the house analogy now because I'm gonna have to draw a lot of pictures of houses
if I do that. Ok, so let's talk about CNN works
Um, and why it's useful. So, we have an image of something
Now, I have seen convolutional neural networks used for non-images
but for now, we'll just talk about images
This is a picture of, let's say me. It's, you know, it's not a great likeness but I'll stick by it
Now, there are three channels here, ok.
So this is actually a 3D volume, in some sense
remember when we talked about 3D images,

Turkish: 
belki resmin ortasında ne varsa vurgulayan bir şey
Veya sol üst köşeyi vurgulayan bir şey
bu gerçekten önemli değil ve asıl mesele ne olduklarını bilmiyorum.
haklısın, sana bilirsin, iki bin ev resmi
ve sizden resimlere dayanarak konut fiyatlarını tahmin etmenizi isteyin
Kesin olarak bilmiyorum, tahmin edebilirim, ama olabilir - kaç tane penceresi olduğu ve bunun gibi şeyler olabilir.
ama kesin olarak bilmiyorum.
Ve bir bilgisayar benden çok daha hızlı bir şekilde bu şeyleri zorlayarak yapabilir ve bana söyler.
Sonra gidebilirim, ikisini de tahmin edebilirim ve arkama bakıp "ah, sonuçta pencerelerdi" diyebilirim.
Öyleyse, sahip olduğumuz şeyin imajımız olduğunu hayal edelim, tamam mı?
Şimdi ev benzetmesinden uzaklaşacağım çünkü çok sayıda ev resmi çizmem gerekecek
eğer bunu yaparsam. Tamam, peki CNN işleri hakkında konuşalım.
Um, ve neden faydalı. Öyleyse, bir şeyin görüntüsüne sahibiz.
Şimdi, imgesel olmayan görüntüler için kullanılan evrimsel sinir ağlarını gördüm.
ama şimdilik, sadece resimlerden bahsedeceğiz.
Bu bir resim, diyelim bana. Bu, bilirsin, büyük bir benzerlik değil ama ben buna sadık kalacağım
Şimdi, burada üç kanal var, tamam.
Yani bu aslında bir anlamda bir 3D hacmi
3D görüntüler hakkında konuştuğumuzu hatırla.

English: 
you could view RGB as a, in some sense, 3D
So, the first plane is our R, G, and B, or vice versa
What we do is, if we performed a Sobel edge detection on this,
what it would do is produce another image that was  slightly smaller than this
and only one deep.
So hypothetically, it would be another image where the edges, let's say the horizontal edges, were highlighted
So it would kinda look like, that, or something, I don't know
some half of my face where the horizontal edges are highlighted, ok
It's not a great diagram
But there would only be one output, because Sobel just outputs a number between 0 and 255, as soon as you scale it, ok
Now the problem is that I don't know that Sobel's the best thing for this task, ok
It might be, right, it might be useful to detect edges on houses, to work out what their prices are
or if you want to detect faces, to detect the size of the face, that kind of makes sense
On the other hand, it's gonna produce a lot of erroneous bits
if I was sitting in front of a tree, there's gonna be loads of edge stuff going on there that I don't care about
In a convolutional neural network, what we do is we do, let's say, 60 of these on the first layer.

Thai: 
คุณสามารถดู RGB เป็นในบางแง่เป็น 3D
ดังนั้น ระนาบแรกคือ R, G, และ B หรือ ในทางกลับกัน
สิ่งที่เราทำคือ ถ้าเราดำเนินการตรวจจับขอบภาพแบบโซเบลในเรื่องนี้
สิ่งที่มันจะทำคือการผลิตภาพที่มีขนาดเล็กกว่านี้เล็กน้อย
และมีเพียงความลึกหนึ่ง
ดังนั้นสมมุติฐาน ก็จะเป็นภาพอื่นที่ขอบ สมมติว่าขอบแนวนอนเป็นส่วนเน้น
ดังนั้น จึงค่อนข้างจะมีลักษณะเช่นนั้นหรือบางสิ่ง ผมไม่ทราบ
บางส่วนครึ่งของใบหน้าของผมที่ขอบแนวนอนจะถูกเน้น, OK
มันไม่ได้เป็นแผนภาพที่ดี
แต่จะเป็นเพียงหนึ่ง input เพราะโซเบลให้ค่าเพียงตัวเลขระหว่าง 0 และ 255 เมื่อคุณสเกลมัน โอเค
ตอนนี้ปัญหาคือว่า ผมไม่ทราบว่าโซเบลเป็นสิ่งที่ดีที่สุดสำหรับงานนี้ ตกลง
มันอาจจะถูกต้องก็อาจจะมีประโยชน์ในการตรวจสอบขอบบ้านที่จะคิดออกว่าราคาบ้านคืออะไรก็ได้
หรือถ้าคุณต้องการที่จะตรวจสอบขนาดของใบหน้า นั่นก็เข้าท่า
ในทางกลับกัน ก็จะผลิตบิตที่ผิดพลาดจำนวนมาก
ถ้าผมนั่งอยู่หน้าต้นไม้ มันจะมีขอบที่เกิดขึ้นมากมายที่ผมไม่สนใจมัน
ใน convolutional neural network สิ่งที่เราทำ คือ สมมติว่า สิ่งเหล่านี้จำนวน 60 ในชั้นแรก

Turkish: 
RGB'yi bir anlamda 3D olarak görüntüleyebilirsiniz.
Yani, ilk uçak bizim R, G ve B, ya da tam tersi
Yaptığımız şey, bunun üzerine bir Sobel kenarı tespiti yaparsak,
ne yapacağı, bundan biraz daha küçük olan başka bir görüntü üretmek.
ve sadece bir derin.
Yani varsayımsal olarak, yatay kenarları vurgulayalım, kenarların vurgulandığı başka bir resim olurdu.
Yani, öyle bir şey olurdu, ya da bilmiyorum, bilmiyorum
yatay kenarların vurgulandığı yüzümün bir kısmı tamam
Harika bir diyagram değil
Ama sadece bir çıktı olacaktı, çünkü Sobel sadece ölçeklendirir etmez hemen 0 ile 255 arasında bir sayı çıkardı, tamam
Şimdi sorun şu ki, bu iş için Sobel'in en iyi şey olduğunu bilmiyorum, tamam
Doğru olabilir, evlerdeki kenarları tespit etmek, fiyatlarının ne olduğunu hesaplamak faydalı olabilir.
veya yüzleri algılamak, yüzün boyutunu algılamak istiyorsanız, bu mantıklı
Öte yandan, çok fazla hatalı bit üretecek
Bir ağacın önünde oturuyor olsaydım, orada umursamadığım birçok şey olacak.
Konvolüsyonel bir sinir ağında yaptığımız şey, diyelim ki, bunlardan 60'ını ilk katman üzerinde yapalım.

English: 
So we have one, and then behind it we have another one, and behind it we have another one, and behind it we another one, and so on, going this way.
So the first one will be some convolution process applied to this whole image
that takes three input channels and outputs one output channel
The next one will be a different kernel convolution operation
so each of these will have a different kernel
those are our weights, those are these values here
In sort of our analogy back to normal learning
Um, and so let's say we have 60 of those, or 64 of those
One of them might be detecting edges, one of them might be detecting corners
Um, and then we use them as our features for learning
Now that's a start, but we're - this is is deep learning now, right, so what do we do now
well, what we now do is we do more features based on these features
So we find combinations of corners, combinations of edges, that make something interesting
My face is not just a circle of edges, what it is is a number of corners and edges and bits of texture and things
all in a specific shape that is unique to, uh, well, certainly to a human face, but even unique to me
right, because we're capable of distinguishing between different people

Thai: 
ดังนั้นเราจึงมีแล้วหนึ่ง ที่อยู่เบื้องหลังมันเรามีอีกหนึ่ง ที่อยู่เบื้องหลังมันเรามีอีกหนึ่ง ที่อยู่เบื้องหลังมันแล้วเรามีอีกหนึ่ง และอื่น ๆ ไปเรื่อยๆ
ดังนั้นก่อนจะนำกระบวนการ convolution บางอย่าง ไปใช้กับภาพทั้งหมดนี้
นั่นใช้ 3 แชนแนล input และ 1 แชนแนล output
อันต่อไป จะมีการดำเนินการของ kernel convolution ที่แตกต่างกัน
เพื่อให้แต่ละอันเหล่านี้จะมี kernel ที่แตกต่างกัน
นั่นคือน้ำหนัก (weights) ของเรา ค่าเหล่านี้ ที่นี่
ในความคล้ายคลึงของเราได้กลับไปสู่การเรียนรู้แบบปกติ
อืม พูดได้ว่าเรามี  เหล่านั้น 60 หรือ  เหล่านั้น 64
หนึ่งในนั้นอาจจะมีการตรวจสอบขอบ หนึ่งของพวกมันอาจจะมีการตรวจสอบมุม
อืม แล้วเราใช้พวกมันเป็นคุณสมบัติ (features) ของเรา สำหรับการเรียนรู้
ตอนนี้ที่เริ่มต้น แต่เรา - นี่คือคือการเรียนรู้ลึก (deep learning) ตอนนี้ เราจะทำในอะไรขณะนี้
ดี สิ่งที่เราทำคือการที่เราทำคุณสมบัติอื่น ๆ เพิ่มขึ้นจากคุณสมบัติเหล่านี้
ดังนั้นเราจึงหา การรวมกันของมุม การรวมกันของขอบที่ทำให้เกิดสิ่งที่น่าสนใจ
ใบหน้าของฉันไม่ได้เป็นเพียงวงกลมของขอบ มันคืออะไรคือจำนวนของมุม และขอบและพื้นผิวเล็กน้อย และสิ่งต่างๆ
ทั้งหมดในรูปร่างเฉพาะที่เป็นเอกลักษณ์ เอ่อ ใบหน้าของมนุษย์อย่างแน่นอน แต่ที่เป็นเอกลักษณ์กับผม
ใช่มั้ย เพราะเราสามารถแยกความแตกต่างระหว่างผู้คนที่แตกต่างกัน

Turkish: 
Yani bir tane var, ve ardında bir tane daha var ve onun arkasında bir tane daha var ve onun arkasında bir tane daha var, ve böyle devam ediyor.
Dolayısıyla, ilki bu görüntünün tümüne uygulanan bazı evrişim süreci olacak.
bu üç giriş kanalını alır ve bir çıkış kanalını çıkarır
Bir sonraki, farklı bir çekirdek evriş operasyonu olacak
yani bunların her birinin farklı bir çekirdeği olacak
bunlar bizim ağırlıklarımız, buradaki değerler
Analojimizden normal öğrenmeye geri dönelim
Diyelim ki, bunlardan 60'ımız veya 64'ümüz var
Biri kenarları, biri de köşeleri tespit ediyor olabilir.
Sonra bunları öğrenme için özelliklerimiz olarak kullanıyoruz.
Şimdi bu bir başlangıç, ama biz - bu şimdi derin öğrenme, tamam, peki şimdi ne yapacağız
peki, şimdi yaptığımız şey, bu özelliklere dayanarak daha fazla özellik yapmak.
Bu yüzden ilginç bir şeyler yapan köşelerden oluşan kombinasyonlar, kenarlardan oluşan kombinasyonlar buluyoruz
Yüzüm sadece kenarlardan oluşan bir çember değil, bir dizi köşeden ve kenarlardan ve doku parçalarından
hepsi kesinlikle bir insan yüzüne özgü, hatta bana özgü olan belirli bir biçimde
Doğru, çünkü farklı insanları ayırt edebiliyoruz.

Thai: 
ดังนั้น หน้าต่างเคอร์เนลนี้จะลงไปที่พิกเซลที่นี่
ตกลง นี้จะเปลี่ยนไปเกี่ยวกับภาพนี้ และผลิตภาพแสดงผลนี้
และจากนั้นต่อไปจะทำเช่นเดียวกัน และต่อไปจะทำเช่นเดียวกัน
แล้วเราจะทำสิ่งเดียวกันในนี้
ให้ผมทำมันในปากกาที่แตกต่าง เพื่อให้เราสามารถมองเห็นได้ดีขึ้น
นี่คือ kernel convolution สีแดงของผม
และนี่เปลี่ยนไปและผลิตภาพอีกอันหนึ่ง
ซึ่งเป็นการรวมกันเล็กน้อยของ มุมและขอบ บางทีนะ
หรือบางสิ่งบางอย่าง. ผมหมายถึงระดับที่สองนี้ก็ไม่ได้จะเป็นนามธรรมเกินไป แต่เราจะได้ไอเดีย
ดังนั้นจึงเป็นรูปร่างบางอย่างที่เป็นแบบ ...
มันไม่ได้ให้เราเข้าใจ แต่มันให้บางอย่างแก่แมชชีนให้เข้าใจได้
และจะมีชุดของเหล่านี้อีก ดังนั้นจะมีเหล่านี้จำนวนมาก ที่กลับไป
ทั้งหมดเหล่านี้จะมีลักษณะที่แตกต่างกัน และมีบางการแสดงที่แตกต่างกันของใบหน้าของผมเปลี่ยนในทางหนึ่งที่เป็นประโยชน์
และอีกครั้งที่ผมไม่ได้เลือกสิ่งเหล่านี้ มันได้รับการเรียนรู้เช่นเดียวกับอัลกอริธึมการเรียนรู้ลึกปกติ
ดังนั้นผมจึงไม่ต้องพูดว่า "ผมคิดว่าขอบมีความสำคัญสำหรับเรื่องนี้แน่นอน "
เพราะผมไม่ได้รู้แน่ชัด
ดังนั้น เราทำเช่นนี้และบางครั้งเรายังทำการลดขนาดข้อมูล (downsample) ขนาดของภาพเหล่านี้
เพียงเพื่อประหยัด memory, ตกลง, แต่เราจะไม่พูดถึงในที่นี้มากเกินไป

English: 
So, this kernel window will go down to this pixel here
ok, so this will slide about this image and produce this output image
and then the next one will do the same, and the next one will do the same
Then we do the same thing on this one
let me do it in a different pen so we can see better.
Here's my red kernel convolution
and this slides about and produces another image,
which is a slight combination of, maybe, corners and edges
or something. I mean, this second level, it's not gonna be too abstract, but we'll get the idea
So there's gonna be some sort of shape that's gonna be sort of...
It's not gonna make much sense to us, but it'll make some sense to this machine.
And there'll be another set of these, so there'll be lots of these, right, going back
All of these will look different and be some different representation of my face transformed in some way, to be useful
And again, I haven't picked these, these have been learned, just like a normal deep learning algorithm
So I haven't had to say, "I definitely think edges are important for this"
cause I don't know for sure.
So this goes on, and we keep doing this, and sometimes we also downsample the size of these images,
just to save memory, ok, but we won't dwell on that too much.

Turkish: 
Böylece bu çekirdek penceresi bu pikselin altına düşecek
tamam, bu yüzden bu görüntüde kayar ve bu görüntüyü oluşturur
ve sonra bir sonraki aynı şeyi yapacak ve bir sonraki aynı yapacak
Sonra da aynı şeyi yapıyoruz.
daha iyi görebilmemiz için farklı bir kalemle yapmama izin verin.
İşte benim kırmızı çekirdek evrim
ve bu kayarak kayar ve başka bir görüntü oluşturur,
bu, belki köşe ve kenarların hafif bir birleşimidir.
ya da başka birşey. Demek istediğim, bu ikinci seviye çok soyut olmayacak, ama biz fikir edeceğiz
Demek bir çeşit şekil olacak.
Bize pek bir şey ifade etmeyecek, ancak bu makineye bir anlam ifade edecek.
Ve bunlardan başka bir set olacak, bu yüzden bunlardan bir sürü olacak, doğru, geri dönecek
Bunların hepsi farklı görünecek ve bir şekilde dönüştürülmüş yüzümün farklı bir temsili olacak, faydalı olacak
Ve yine, bunları toplamadım, bunlar normal bir derin öğrenme algoritması gibi öğrenildi.
Bu yüzden, "Kesinlikle bunun için kenarların önemli olduğunu düşünüyorum" demedim.
çünkü emin değilim.
Böylece bu devam ediyor ve bunu yapmaya devam ediyoruz ve bazen bu görüntülerin boyutunu da örnekliyoruz,
sadece hafızadan tasarruf etmek için, tamam, ama bunun üzerinde fazla durmayacağız.

Turkish: 
Ve, aşağı örneklememiz ve bazen bu evrişim işlemlerinin görüntüyü biraz küçültmesi nedeniyle,
çünkü sonuna kadar gitmiyorlar, değil mi?
5'e 5 bir çekirdeğiniz varsa, 2 piksel kenara gidemezsiniz çünkü kenardan çıkıyorsunuz
bu yüzden endişelenmiyoruz, sadece biraz küçülüyoruz
Sonunda, çok daha küçük bir görüntü elde ediyoruz ve birçok özellik geri dönüyor.
Yani bunlar benim değişik evirimler, evirimler, evirimler
Ve her biri farklı görünecek ve farklı bir şeyi temsil edecek
ve bunun ne olduğunu bilmiyoruz.
Yani bu, ortasında bir yüz olduğunda vurgulanabilir veya olmadığında karanlık olabilirdi
Bu, belirli bir pozisyonda bir kulak varken, vurgulanabilir.
Sonunda, bunlar sadece bir piksel olmaktan çıkacak ve çok çok uzun
Yani esasen orada yaptığımız şey mekansal boyutu tamamen kaldırdık.
Artık uzamsal bilgi kalmadı, hiçbir şeyin nerede olduğunu bilmiyoruz. Ama ne olduğunu biliyoruz, çünkü tüm bu özelliklerde listeleniyor.
Bunlar şimdi sonunda nöronlarımız.
Yani bunlara işaret eden birkaç katman daha var, ve sonunda, sonunda şunu söylüyor:
“Bu, Mike'ın yüzünün resmi mi?”

Thai: 
และเพราะวิธีการที่เรา downsample และวิธีการดำเนินการหดภาพเหล่านี้เล็กน้อยบางครั้ง,
ทำให้ที่พวกมันไม่ได้ไปที่ขอบตลอด ใช่มั้ย
หากคุณมี kernel 5x5 คุณไม่สามารถไปที่ขอบ 2 พิกเซล นั่นทำให้คุณกำลังจะตกขอบ
ดังนั้นเราจึงไม่ต้องกังวลเกี่ยวกับการที่เราเพิ่งได้ขนาดเล็กกว่าเล็กน้อย
ในท้ายที่สุด เราจบลงด้วยภาพที่มีขนาดเล็กมาก และคุณสมบัติจำนวนมากไปตลอดทางย้อนกลับมา
ดังนั้น เหล่านี้เป็น convolutions ของ convolutions ของ convolutions ของ convolutions ที่แตกต่างกันของผม
และแต่ละอันจะมีลักษณะที่แตกต่าง และเป็นตัวแทนของบางสิ่งบางอย่างที่แตกต่างกัน
และเราไม่ทราบว่ามันคืออะไร
ดังนั้น หนึ่งนี้อาจจะมีการเน้นเมื่อมันมีใบหน้าที่อยู่ตรงกลาง หรือมันอาจจะมืดเมื่อไม่มี
หนึ่งนี้อาจจะมีการเน้นเมื่อมีหูที่ตำแหน่งใดตำแหน่งหนึ่ง และอื่น ๆ
ในที่สุดเหล่านี้จะได้เป็นเพียงแค่หนึ่งพิกเซลและยาวมากๆๆๆ
สิ่งหลักที่เราทำคือ เราเอามิติเชิงพื้นที่ออกอย่างสมบูรณ์
ไม่มีข้อมูลเชิงพื้นที่เหลือ เราไม่ทราบว่าเป็นอะไร แต่เรารู้ว่ามันคืออะไร เพราะมันระบุไว้ในคุณสมบัติทั้งหมดเหล่านี้
มีโหนดเซลล์ประสาทของเราในตอนท้าย
ดังนั้น เราจึงมีชั้นอื่น ๆ อีกนิดหน่อยที่ชี้ไปที่เหล่านี้ และแล้วในที่สุดเรามีหนึ่ง output ในตอนท้ายที่ระบุว่า
"นี่คือภาพของใบหน้าของไมค์?"

English: 
And, because of the way that we downsample, and the way that sometimes these convolution operations slightly shrink the image,
cause they don't go all the way to the edge, right
If you've got a 5 by 5 kernel, you can't go to the edge 2 pixels cause you're going off the edge
so we don't worry about that, we just get slightly smaller
In the end, we end up with a much smaller image, and lots of features going all the way back
So these are my different convolutions of convolutions, of convolutions, of convolutions
And each one will look different, and represent something different
and we don't know what that is.
So this one, could be highlighted when it's a face in the middle, or it could be dark when there isn't
This one might be highlighted when there's an ear at a certain position, and so on.
Eventually, these will get down to being just one pixel, and very very long
So essentially what we've done there is we completely removed the spatial dimension.
There's no more spatial information left, we don't know where anything is. But we know what it is, because it's listed in all these features.
These now are our neurons at the end.
So we have a couple more layers that point to these, and then finally, we have one at the end that says
"Is this a picture of Mike's face?"

English: 
And it produces a 1 if it is, and a 0 if it isn't. And then what we do is, just like a normal network, we train it.
So we say, "here's a picture of me", ok , so this should be a 1. And let's say it's 0.5.
cause it's kind of random. So we adjust these weights, and we adjust the weights inside all these kernel convolutions.
[offscreen] So does that adjustment happen manually?
No, it happens using a, uh, well, it's coded in, um, but it's usually performed by a library, and it's using a process called back propagation.
So what we do is we basically predict what direction we have to move the weights in to improve our output,
and then we move them over slightly in that direction.
And we have to do it in reverse order, because these ones
depend on these ones, depend on these ones, and vice versa, what we do is we say,
well, look, given that I've said it's 0.5 chance of Mike and we want a 1,
how do I change these weights here to get slightly closer to 1?
and I do it. And then I say, "how do I change these again to do even better?" and so on
and then I work my way back, ok, that kind of maths we're not gonna go into, right.
A lot of these things are, are implemented in libraries

Turkish: 
Ve eğer öyleyse 1, eğer değilse 0 üretir. Ve sonra yaptığımız şey, normal bir ağ gibi, onu eğitiyoruz.
Bu yüzden, "işte benim bir resmim" diyoruz, tamam, öyleyse bu 1 olmalı. Ve diyelim ki 0.5.
çünkü bu biraz rastgele. Böylece bu ağırlıkları ayarlıyoruz ve tüm bu çekirdek kıvrımlarının içindeki ağırlıkları ayarlıyoruz.
[ekran dışı] Peki bu ayar manuel olarak mı oluyor?
Hayır, a, eh, eh, eh, kodlanır, um, ama genellikle bir kütüphane tarafından gerçekleştirilir ve geri yayılım adı verilen bir işlem kullanır.
Öyleyse yaptığımız şey temel olarak çıktılarımızı iyileştirmek için ağırlıkları hangi yöne kaydırmamız gerektiğini tahmin etmemiz,
ve sonra onları bu yönde hafifçe hareket ettiririz.
Ve bunu ters sırada yapmak zorundayız, çünkü bunlar
bunlara bağlı, bunlara bağlı, ve tam tersi, biz ne diyoruz,
Bak, Mike'ın 0,5 şansı olduğunu söylediğimden beri, 1 tane istiyoruz.
Bu ağırlıkları 1'e biraz yaklaşmak için nasıl değiştirebilirim?
ve ben yapıyorum. Ve sonra, "Bunları daha iyi yapmak için nasıl tekrar değiştiririm?" Dedim. ve bunun gibi
ve sonra geri döndüm, tamam, girmeyeceğimiz türden matematik, doğru.
Bunların çoğu kütüphanelerde uygulanmaktadır.

Thai: 
และจะผลิต 1 ถ้ามันเป็น และ 0 ถ้ามันไม่ได้เป็น และแล้วสิ่งที่เราทำคือ เช่นเดียวกับเครือข่ายปกติ เราฝึกมัน
ดังนั้นเราจึงพูดว่า "นี่คือภาพของฉัน" ตกลง ดังนั้นนี้ควรจะเป็น 1 และขอบอกว่ามันเป็น 0.5
ทำให้เกิดเป็นแบบสุ่ม ดังนั้นเราจึงปรับน้ำหนักเหล่านี้ และเราปรับน้ำหนักภายใน kernel convolutions ทั้งหมดนี้
[Offscreen] ดังนั้นการปรับเกิดขึ้นด้วยมือ?
ไม่ มันเกิดขึ้นโดยใช้ เอ่อ ก็เขียนโค้ดไว้ แต่ก็มักมีในคลัง library และจะใช้กระบวนการที่เรียกว่า back propagation
ดังนั้น สิ่งที่เราทำคือ เราก็คาดการณ์ทิศทางที่จะย้ายเพื่อปรับปรุงน้ำหนักเพื่อ output ที่ดีขึ้น
และจากนั้นเราย้ายพวกมันในทิศทางนั้นเล็กน้อย
และเราจะต้องทำในลำดับที่กลับเพราะพวกเหล่านี้
ขึ้นอยู่กับสิ่งเหล่านี้ขึ้นอยู่กับสิ่งเหล่านี้ และในทางกลับกัน สิ่งที่เราทำคือเราพูดว่า
อืมม ดูสิ ผมได้ว่ามันมีโอกาส 0.5 เป็นไมค์และเราต้องการที่ 1
ผมจะเปลี่ยนน้ำหนักเหล่านี้ ที่นี่ จะได้ใกล้ชิด 1 ขึ้นเล็กน้อย ?
และผมทำมัน แล้วผมพูดว่า "ผมจะเปลี่ยนเหล่านี้อีกครั้งเพื่อทำให้ดียิ่งขึ้น?" เป็นต้น
และจากนั้นผมทำงานทางย้อนกลับ, OK, เป็นคณิตศาสตร์ที่เราไม่อยากเข้าไปอธิบายลึกมาก ใช่มั้ย
สิ่งเหล่านี้จำนวนมากเป็นแบบนี้ ถูกเขียนโค้ดไว้ในคลัง  libraries

English: 
So as a researcher, I mean, much as I'd like to implement some of these things, it takes quite a long time
just because programming takes a while, right, and
And, it's better for me just to apply these things and get good results
than it is for me to reinvent the wheel all the time, constantly, if everyone was programming the same things over and over again,
no one would get anything done
So, I'd have to start by programming up Linux, to get, to get, I'm not claiming I can, by the way,
and, and so on. So, you know, let's not reinvent the wheel.
Um, so I do this, I send in, let's say 1000 pictures, 500 of which are me
you know, so I've been to a photo shoot or something, right
and 500 of which are not.
And I train it so the convolutions and these weights on the output are such that
it gets 1 when it's a picture of me and 0 when it isn't.
And then I can look at these convolutions and say "what is it about me that's distinctive?"
And it's probably gonna be finding, um, you know, weird shapes on my face, right
cause it's a bit of a weird shape, so it - things that are unique to me
Now in a more general situation, there's a big database called ImageNet
They have a competition every year to see who can classify these images the best.

Turkish: 
Bir araştırmacı olarak demek istediğim, bunlardan bazılarını uygulamak istediğim kadar uzun sürüyor.
programlamanın biraz zaman alması, doğru ve
Ve, sadece bunları uygulamak ve iyi sonuçlar elde etmek benim için daha iyi.
Herkes aynı şeyi tekrar tekrar programlıyorsa, tekerleği her zaman yeniden icat etmemden daha,
kimse bir şey yapamaz
Öyleyse, elde etmek, elde etmek için yapabileceğimi iddia etmiyorum, bu yüzden Linux programlayarak başlamak zorunda kalacağım.
ve, vb. Yani, bilirsin, tekerleği yeniden icat etmeyelim.
Ben de bunu yapıyorum, gönderirim, diyelim ki 500 tanesi benim, 1000 resim
bilirsin, o yüzden fotoğraf çekmeye falan gittim, değil mi?
ve bunların 500'ü değil.
Ve ben bunu eğitiyorum, böylece konvolüsyonlar ve çıktıdaki bu ağırlıklar öyle
O benim resmim olduğunda 1, olmadığında 0 alır.
Ve sonra bu konvolüsyonlara bakabilir ve "benimle ilgili özel olan nedir?" Diyebilirim.
Muhtemelen yüzümde tuhaf şekiller bulmaya başlayacak, değil mi?
çünkü bu biraz garip bir şekil, bu yüzden - bana özgü olan şeyler
Şimdi daha genel bir durumda, ImageNet adında büyük bir veritabanı var.
Her yıl bu görüntüleri kimin en iyi şekilde sınıflandırabileceğini görmek için bir yarışması var.

Thai: 
ดังนั้น ในขณะที่นักวิจัย หมายถึง ผมต้องการที่จะจัดเตรียมสิ่งเหล่านี้มากแค่ไหน ก็จะใช้เวลาค่อนข้างนาน
เพียงเพราะการเขียนโปรแกรมใช้เวลา ใช่มั้ย และ
และมันจะดีกว่าสำหรับผม เพียงที่จะใช้สิ่งเหล่านี้และได้รับผลดี
ดีกว่าคือสำหรับผมไม่ต้องผลิตอีกครั้งตลอดเวลา ถ้าทุกคนเขียนเขียนโปรแกรมสิ่งเดียวกันซ้ำแล้วซ้ำอีก
ไม่มีใครที่จะทำอะไรได้เสร็จสักที
ดังนั้น ผมจะต้องเริ่มต้นด้วยการเขียนโปรแกรมลินุกซ์ขึ้น ที่จะได้รับ ผมไม่ได้อ้างว่าผมสามารถ ยังไงก็ตาม
และอื่น และอื่น ๆ ดังนั้น คุณจะรู้ว่าให้ไม่ต้องสร้างล้อขึ้นมาเอง
อืม ผมจึงทำเช่นนี้ ผมส่ง สมมติว่า 1,000 ภาพ ซึ่ง 500 ภาพเป็นผม
ผมเคยไปถ่ายภาพหรืออะไรแบบนี้
และ 500 ภาพซึ่งไม่ได้เป็นผม
และฉันฝึกมันเพื่อให้ convolutions และน้ำหนักเหล่านี้ ส่ง output ออก กล่าวว่า
จะได้รับ 1 เมื่อมันภาพของผมและ 0 เมื่อมันไม่ได้เป็นภาพผม
แล้วผมสามารถดู convolutions เหล่านี้ และพูดว่า "มันคืออะไรเกี่ยวกับผมที่โดดเด่นเป็นพิเศษ"
และก็อาจจะเป็นหา เอ่อ รูปทรงแปลก ๆ บนใบหน้าของผม ใช่มั้ย
ทำให้เกิดเป็นรูปร่างแปลกเล็กน้อย ดังนั้น มัน - สิ่งที่เป็นเอกลักษณ์ของผม
ตอนนี้อยู่ในสถานการณ์ทั่วไปมากขึ้น มีฐานข้อมูลใหญ่ที่เรียกว่า ImageNet
พวกเขามีการแข่งขันเป็นประจำทุกปี เพื่อดูว่าใครสามารถแบ่งภาพเหล่านี้ที่ดีที่สุด

English: 
So dogs, cats, planes, trees, and so on
OK, they're all in there, and there's a thousand or so images of each
right, so, we have a really big network that's much bigger than this little one I drew
and we say, "right, let's throw millions of images at this", right, thousands of cats, thousands of dogs
and we have lots more outputs than just the one,
and we say "what is it?" and it says "it's a dog" and it is. *dog bark*
Convolutional neural networks have been around for a little while
but, they've really started to be big in about 2012 when it - when someone came along, applied one of these to ImageNet, and got incredible results.
And so on and so forth. And now there's this big push and everyone's trying to get even better results, and even better results.
Now, I work on more of the applied end of computer science, so I'm more interested in how this affects plant science and things like this
So that's what we're working on.
Um, but, the kind of results we're seeing are really really impressive
So, I mean, case in point, I've done, I've done some root tip detection, so detection of root tips in images, right, of plants
and, um, I've got some software that I've already programmed

Thai: 
ดังนั้นสุนัข, แมว, เครื่องบิน, ต้นไม้, และอื่น ๆ
ตกลง พวกมันทั้งหมดในนั้น มีเป็นพัน หรือ ภาพของแต่ละคน
ใฃ่มั้ย เพื่อให้เรามีเครือข่ายใหญ่จริงๆ ที่ใหญ่กว่าอันเล็ก ๆ ที่ผมร่างไว้
และเราพูดว่า "เอาละ มาโยนภาพล้านภาพใส่นี่" เอาล่ะ หลายพันภาพของแมว หลายพันภาพของสุนัข
และเรามี output จำนวนมากกว่าเพียงแค่หนึ่ง
และเราพูดว่า "มันคืออะไร?" และกล่าวว่า "มันเป็นสุนัข" และมันก็เป็น *หมาเห่า*
Convolutional neural networks ได้มีอยู่มาชั่วขณะเวลาหนึ่ง
แต่พวกมันได้เริ่มต้นยิ่งใหญ่จริงๆ เป็นประมาณ 2012 เมื่อมัน - เมื่อมีคนมาพร้อมนำไปใช้อย่างใดอย่างหนึ่งเหล่านี้เพื่อ ImageNet และได้ผลลัพธ์ที่น่าทึ่ง
และอื่น ๆ และอื่น ๆ และตอนนี้มีนี้การผลักดันขนาดใหญ่และทุกคนพยายามที่จะได้รับผลดียิ่งขึ้นและยิ่งขึ้น
ตอนนี้ ผมทำงานเกี่ยวกับประยุกต์การใช้วิทยาการคอมพิวเตอร์ ดังนั้นผมสนใจในวิธีการนี้ มีผลต่อสาขาพืชศาสตร์อย่างไร และสิ่งที่ต้องการนี้
นั่นคือสิ่งที่เรากำลังทำงานอยู่
อืม แต่ผลที่เราเห็นน่าประทับใจจริงๆ
ดังนั้น ผมหมายถึงกรณีในจุดที่ผมได้ทำ ผมได้ทำการตรวจสอบปลายรากบางอย่างเพื่อให้การตรวจสอบของปลายรากในภาพของพืช
และเอ่อ ผมมีซอฟแวร์บางอย่างที่ผมเคยตั้งโปรแกรมแล้ว

Turkish: 
Yani köpekler, kediler, uçaklar, ağaçlar vb.
Tamam, hepsi orada, ve binlerce resim var
Doğru, yani, çizdiğim bu küçük ağlardan çok daha büyük olan gerçekten büyük bir ağımız var.
ve "doğru, buna milyonlarca görüntü atalım" diyoruz, doğru, binlerce kedi, binlerce köpek
ve biz sadece bir taneden daha fazla çıktımız var.
ve biz de "bu nedir?" diyoruz. ve "Bu bir köpek" diyor ve öyle. *köpek havlaması*
Konvolüsyonel sinir ağları bir süredir buralarda
ancak 2012'de, biri geldiğinde, bunlardan birini ImageNet'e uyguladıktan ve inanılmaz sonuçlar aldıklarında, gerçekten büyük olmaya başladılar.
Ve diğerleri ve diğerleri. Ve şimdi bu büyük itişme var ve herkes daha da iyi sonuçlar almaya ve hatta daha iyi sonuçlar almaya çalışıyor.
Şimdi, bilgisayar biliminin uygulamalı sonu hakkında daha fazla çalışıyorum, bu yüzden bunun bitki bilimini ve bunun gibi şeyleri nasıl etkilediği ile ilgileniyorum.
Demek üzerinde çalışıyoruz.
Ama gördüğümüz sonuçlar gerçekten etkileyici.
Yani, kasıtlı olarak, yaptım, bazı kök ucu algılamaları yaptım, bu yüzden görüntülerde kök uçlarının tespiti, doğru, bitkilerin
ve, um, zaten programladığım bazı yazılımlarım var

Turkish: 
ve kök uçlarını algılamak için düşük seviyeli bir özellik dedektörü yaklaşımı yaptım
ve% 70 civarında, tamam, beklediğiniz gibi, çünkü bazı kök kıllarının kök ucu ile ilgili olarak kafaları karışır.
ya da biraz leke, ya da belki birbirine çok yakın iki kök ipucu var ve kafası karışıyor
Bu, benim eğittiğim CNN,% 98 doğrudur
Ve onları% 99 doğrulukla bulur.
Çok fazla hata yapmaz.
Ve bu binlerce görüntünün üzerinde.
[ekran dışı] Bu, yaptığınız işin henüz pencereden çıktığı anlamına mı geliyor?
Evet. Uh, hayır, bir ölçüde, evet ve bir ölçüde, hayır.
Bir ağ oluşturmak ve eğitmek ve görüntüleri hazırlamak için uzmanlığa ihtiyacınız var.
Ve belli ki yapılması gereken işler var ve bir evrimsel sinir ağıyla ne kadar problem çözebileceğinize dair bazı anlaşmazlıklar var.
Yani, ipucu bulmanın ötesinde köklerle yapabileceğiniz daha birçok şey var.
Hepsini bir evrişimsel sinir ağı ile yapabilir misiniz?
Bilmiyorum, göreceğiz. Deniyoruz, göreceğiz.
Belki de değil. Belki de yaptığınız şey, diğer makine öğrenme algoritmaları gibi, başka birçok şeyi de yapan bir paket içinde bir araç olarak kullanmanızdır.

English: 
and I've kind of done a low-level feature detector approach to detecting root tips
and it's about 70%, ok, which is what you would expect, because maybe some root hair gets confused as to root tip
or a bit of blotch of dirt, or maybe there's just two root tips really close together and it gets confused
This, the CNN that I trained, um, is 98% accurate
And it finds them with 99% accuracy.
It doesn't make many mistakes.
And that's over thousands of images.
[offscreen] So does that mean the work you've done already just goes out the window?
Yep. Uh, no, to an extent, yes, and to an extent, no.
You need expertise to be able to craft a network and train it and prepare the images.
And there's obviously work to be done, and there's some disagreement over how much of a problem you can solve with a convolutional neural network
So, there are lots more things you can do with roots beyond finding tips.
Can you do all of them with a convolutional neural network?
I don't know, we'll see. Are we trying, but, we'll see.
Maybe not. So maybe what you do is you use this as a tool, just like other machine learning algorithms, within a package that does lots of other things as well.

Thai: 
และผมได้วิธีการตรวจจับคุณสมบัติระดับต่ำเพื่อตรวจสอบปลายราก
และก็ถูกต้องประมาณ 70%, OK, ซึ่งเป็นสิ่งที่คุณคาดหวังเพราะบางทีบางรากขนสับสนกับปลายราก
หรือตุ่มของสิ่งสกปรกเล็กน้อยหรืออาจจะมีเพียงแค่สองปลายรากมันใกล้กันและจะสับสน
นี้ CNN ที่ผมได้ฝึกฝน เอ่อ มีความถูกต้อง 98%
และก็พบว่าพวกมันมีความแม่นยำ 99%
มันไม่ได้ทำผิดพลาดมาก
และมากกว่าหลายพันภาพ
[Offscreen] ดังนั้นหมายความว่า งานที่คุณได้ทำมาแล้วเพียงแค่ไปออกไปนอกหน้าต่าง?
อ๋อ เอ่อ ไม่ มีขอบเขต ใช่ และมีขอบเขต ไม่
คุณต้องมีความเชี่ยวชาญเพื่อให้สามารถประดิษฐ์เครือข่ายและการฝึกมัน และเตรียมความพร้อมภาพ
และเห็นได้ชัดว่างานทำได้ และมีความขัดแย้งว่าเท่าใดของปัญหาคุณสามารถแก้ด้วย convolutional neural network
ดังนั้น มีสิ่งจำนวนมากที่คุณสามารถทำอะไรได้กับรากเกินกว่าหาปลายราก
คุณสามารถทำทั้งหมดของพวกมันที่มี convolutional neural network (CNN)?
ผมไม่ทราบว่า เราจะได้เห็นกัน พวกเราจะพยายาม แต่เราจะเห็น
อาจจะไม่. ดังนั้น บางที สิ่งที่คุณทำคือการที่คุณใช้เป็นเครื่องมือเช่นเดียวกับอัลกอริธึมการเรียนรู้ของแมชชีนอื่น ๆ ที่อยู่ในแพคเกจที่ได้ทำสิ่งอื่น ๆ จำนวนมาก เช่นกัน

Turkish: 
Öte yandan, sadece kedi ve köpek tespiti yapıyorsanız, bir CNN de kullanabilirsiniz, çünkü her şeyden daha iyi yapar.
Botnet'in parçalarını kullanabilmesinin başka bir amacı dağılan bilgisayarlardır.
[kaybolur] Şimdi, belli ki bazı nesneler diğerlerine nazaran buna daha uygun, fakat ne kadar çok resim çekersek o kadar iyidir. Burada hiçbir derinlik yok, tamam

English: 
On the other hand, if you're just doing cat and dog detection, you might as well use a CNN, cause it's gonna do better than anything else.
The other purpose for ways the botnet can use its parts is for distributed computing [fades out]
[fades in] Now, some objects obviously are more amenable to this than others, but the more images we get, the better it is. There's no depth involved here at all, ok

Thai: 
ในทางตรงกันข้าม ถ้าคุณแค่ทำการตรวจสอบแมวและสุนัข คุณอาจใช้ CNN เพราะมันจะทำได้ดีกว่าสิ่งอื่น
บรรยายไทยโดย ytuaeb sciencemath
