
Turkish: 
Karar vermek için makine öğrenmeyi veya AI güdümlü teknikleri kullanmaya başlamak giderek daha yaygın hale geliyor.
Örneğin dünya üzerinde, kredi kontrollerinin sağlık kontrollerini biliyorsunuzdur ve bunlar hayat boyu değişebilir
Tamam, bu yüzden bu hakkı almamız çok önemli, hayalinizdeki evin ipoteği aracılığıyla kendinizi geri çevirdiyseniz, çünkü kelimenin tam anlamıyla
Bilgisayar hayır diyor
Sınıflandırma hakkında biraz konuşalım. Şimdi etiketlerimizin olduğu bir veri setimiz var.
Tamam, bazı giriş özelliklerimiz veya girişlerimiz var.
Nitelikler veya birçok örnek boyutlandırır ve bu nitelikler için bazı etiketlerimiz vardır.
Pekala, örneğin kitaplarımız, kitap ya da müzik türümüz ve müzikli türümüz var.
Denemek ve sınıflandırmak istediğimiz şeyler
Dolayısıyla denetlenen öğrenme, verilerimiz için etiketlere sahip olduğumuz fikridir. Yani hala örneklerimiz olacak
Örneklerimizin özelliklerine veya boyutlarına sahip olacağız. Ancak artık verilerimiz için etiketlerimiz de var.
Sınıflandırma, sınıflandırıcılar hakkında konuşmaya başlamadan önce bu etiketleri bu örneklere doğru şekilde nasıl atayacağımızı öğrenme sürecidir.

English: 
It's becoming increasingly common to start using machine learning or AI driven techniques to make decisions
The world over so for example, you know credit checks health checks, and these can be life-changing
right, so it's really important we get this right you could find yourself turned down through a mortgage on your dream house because quite literally
The computer says no
Let's talk a little bit about classification. So now we have a data set where we've got labels
All right, so we've got some input features or input
Attributes or dimensions lots of instances and we've got some labels for these attributes
All right, and so we've got for example books and the type of book or music and the genre with the music
Things that we want to start to try and classify
So supervised learning is the idea that we've got labels for our data. So we're still gonna have instances
We're gonna have attributes or dimensions to our instances. But we've also now got labels for our data and so
Classification is the process of learning how to correctly assign these labels to these instances before we start talking about classifiers

Turkish: 
Öğrenme süreci ve makine öğrenme süreci hakkında biraz konuşalım
kullanmak istiyorum, veri setime sahip olduğumu ve tüm sınıfları doğru bir şekilde tahmin edebildiğimi söylemek yeterli değil.
O zaman birileri daha önce hiç görmediğimiz herhangi bir yeni veriye sahip olsaydık neler olacağını iyi soracaktır?
Belki bazı tıbbi verileriniz vardır ve beni düzeltebilirsiniz.
Bütün hastalıkları teşhis et, ama yeni bir hasta ortaya çıkıyor ve sen hastalığın yanlış teşhisini koyabilirsin, değil mi? Bu yardımcı olmadı
kimse
İhtiyacımız olan, bu yaklaşımları gerçek dünyada ne kadar iyi uyguladıklarını bilmemiz için düzenli bir eğitim ve test yöntemi.
Yani yapacağımız şey, daha önce olduğu gibi bazı veri kümelerimiz var.
Bazı örneklerimizin olduğu ve bu şekilde bazı özelliklerimizin olduğu ve bildiğiniz gibi.
Gerçekten önemli olmayan birkaç özellik olabilir.
ve ayrıca şimdi sık sık Y hakkı olarak adlandırdığımız etiketlerimiz de var ama bu, hepsinin bir vektörü olacak
Veriler için etiketler, bu yüzden bu etiket bir olabilir B'nin bir kaç iki katı olabilir
Ve bu birkaç üç olabilir
Yani bu biraz da bizim tenis örneğimize benziyor, burada hava durumu ve oynayacağız?

English: 
Let's talk a little bit about the learning process and machine learning process
we want to use it's not enough to say I've got my data set and I can correctly predict all of the classes right because
Then someone will ask well what happens if we have any new data that we haven't seen before right?
Maybe you've got some medical data and you can correct me
Diagnose all of the diseases but a new patient comes along and you could incorrectly diagnose the disease, right? That's not helped
anyone
What we need is a regimented way of training and testing these approaches so that we know how well they apply in the real world
So what we're going to do is we've got some data set just like before
Where we've got some instances and we've got some attributes this way and so, you know
We might have a lot of attributes a few it doesn't really matter
and we also now have our labels which we often call Y right but this is going to be a vector of all of the
Labels for data, so this could be label one-one B's could be a few twos down here
And this could be a few three
So this is a bit like our tennis example where we had this is the weather outlook and are we going to play?

Turkish: 
Tenis bugün değil mi? Evet ya da hayır, böylece ikili sınıflandırma için birden fazla etiketiniz ya da sadece ikiniz olabilirdi
Tüm bu veriler üzerinde bir sınıflandırıcı yetiştirmek yeterli değildir
Bu sınıflandırıcıya yeni bir veri uyguladığımızda düzgün çalışacağından emin olmak istiyoruz.
Peki, yapacağımız şey bu verileri eğitim setlerine ayıracağımız.
Ve test setleri böylece eğitim setinde eğitim alacağız.
Doğrulama setine giderken test edeceğiz ve sonunda işimiz bittiğinde hemen yapacağız
Test setimizde son bir test
Bunu yapmamızın sebebi, yanlışlıkla sistemi kazanmadığımızdan emin olmanın çok güvenli bir yoludur.
Eğitim setinde kazara inanılmaz iyi sonuçlar bildirmiyoruz
fakat bunun nedeni hepimiz Makine'ye o şeyleri göstermemizdir, bu yüzden daha sonra yapılacak bir test setinin geçerliliğini kaldırırız.
Eğitim doğrulama ve test setinde verilerinizin tam olarak ne kadarının gittiğini şimdi genelleştireceğinden emin olun
sağ
tipik
Eğitim için% 70 gibi bir şey kullanabilirsiniz
Bunu yapmak için makul bir yol olacak olan testler için% 15'in doğrulanması için% 15
Peki, bunu doğru yaptığımız için kullanabileceğimiz bazı iyi sınıflandırıcılar nelerdir? Hayal edelim. Örneklerimiz var

English: 
Tennis today, right? Yes, or no so that you could have multiple labels or just two for binary classification
It's not enough just to train a classifier over all this data
We want to make sure that this classifier will work properly when we apply a new data to it
So what we're going to do is we're going to separate this data into training sets
And testing sets so we're going to train on the training set
Then we're going to test as we go on the validation set and then right at the end when we're finished we're going to do
a final test on our test set
The reason we do this is it's a very safe way to make sure that we don't accidentally gain the system
We don't accidentally report incredibly good results on the training set
but that's because we all just show the Machine those things so we hold out the validation of a test set for later to make
Sure that it will generalize now exactly how much of your data goes in the training validation and testing set is really up to you
right
typically
You might use something like 70% for training
15% for validation of 15% for testing that will be quite a reasonable way of doing it
So what are some good classifiers we could use given that we've done this right? Let's imagine. We've got our instances

English: 
We've got our attributes and we split them up probably randomly into training validation and testing
What we want to do is train our classifier on the training set and then test it on the validation and testing sets to see
How we're getting on so what algorithms could we use? Let's start with a simplest. One of all zero are in zero
Are we just take the most common label and that's what we predict every time. It's V
You've got five minutes until the deadline just hand something in
Approach to machine learning in the case of playing tennis or not playing tennis we could say well I play tennis more than I didn't
So we'll just assume that I'm going to play tennis and predict. Yes all the time
All right, regardless of what the weather is this is not a good way to perform machine learning
But I suppose it does give you a baseline accuracy, right?
If you're baseline of just yet saying yes to everything is sixty percent accuracy
Then if your machine learning doesn't perform at least a 60 percent, we know we've got a real problem
We can go one better than that
We can use one R one R is where we pick one of our attributes
We made classification based only on that and then we pick the best of those attributes
I mean, it's slightly better than 0 R but not a lot

Turkish: 
Niteliklerimiz var ve bunları muhtemelen rastgele olarak eğitim doğrulama ve test etme bölümlerine ayırdık.
Yapmak istediğimiz, sınıflandırıcımızı eğitim setinde eğitmek ve daha sonra bunu görmek için doğrulama ve test setlerinde test etmektir.
Nasıl gidiyoruz, hangi algoritmaları kullanabiliriz? En basitinden başlayalım. Sıfırdan biri sıfırda
En yaygın etiketi alıyor muyuz ve her seferinde tahmin ettiğimiz şey budur. Bu v
Son teslim tarihine bir şey teslim edene kadar beş dakikanız var
Tenis oynamak ya da tenis oynamak durumunda makine öğrenmeye yaklaşım, söyleyemediğimizden daha fazla tenis oynarım diyebiliriz.
Bu yüzden sadece tenis oynayacağımı ve tahmin edeceğimi varsayacağız. Evet her zaman
Tamam, hava nasıl olursa olsun, makine öğrenmesi için iyi bir yol değil.
Ama sanırım size temel bir doğruluk veriyor, değil mi?
Eğer henüz her şeye evet demek istiyorsan, yüzde altmış doğruluktur.
O zaman makine öğreniminiz en az yüzde 60 yapmıyorsa, gerçek bir sorunumuz olduğunu biliyoruz.
Bundan daha iyisini yapabiliriz
Bir tane kullanabiliriz R bir R bizim niteliklerimizden birini seçtiğimiz yerdir
Sadece buna dayanarak sınıflandırma yaptık ve sonra bu özelliklerin en iyisini seçtik
Yani, 0 R'den biraz daha iyi ama çok değil

English: 
So you'll find you will find references to bees in military too a little bit but not very much
Because we use much more powerful approaches to this. So let's talk about one example classifier is very popular and that's
KNN or k nearest neighbor let's imagine. We've got a to
Attribute data set. So I like to draw in two dimensions. It's just a little easier for me
And so we've got attribute one and attribute two, and we've got some different data points in here now
Don't forget also that each of these is going to have a prediction as well
so if this one
Is going to have let's say a label if we did play tennis when we want to test a new data point an unseen data
So a new person comes along who may or may not play tennis. They're going to appear over here
We measure them and we find the K number of nearest neighbors to this point
So that's this one this one this one this one and this one
so this will be 1 2 3 4 5 6 this would be K of 6 and then we take the majority vote or the
Average of these responses so if four out of six of these people play tennis, this would be assigned to play tennis

Turkish: 
Yani orduda arılara referanslar bulacağınızı, çok fazla değil
Çünkü biz buna daha güçlü yaklaşımlar kullanıyoruz. Öyleyse bir örnek sınıflandırıcı hakkında konuşalım, çok popüler ve bu
KNN ya da k en yakın komşuyu hayal edelim. Yapmamız gereken bir şey var.
Öznitelik veri seti. Bu yüzden iki boyutta çizmeyi seviyorum. Benim için biraz daha kolay
Ve böylece bir ve iki numaralı özelliklere sahibiz ve şimdi burada bazı farklı veri noktalarımız var.
Bunların her birinin de bir tahmini olacağını da unutmayın
öyleyse eğer bu
Yeni bir veri noktasını test etmek istediğimizde tenis oynamadıysak, görülmemiş bir veriyi söyleyelim mi?
Böylece, tenis oynayabilecek ya da oynayamayacak yeni bir kişi geliyor. Burada görünecekler
Onları ölçüyoruz ve bu noktaya en yakın K sayısını buluyoruz.
Demek bu, bu, bu, bu, bu
yani bu 1 2 3 4 5 6 olacak, bu 6'nın K'si olacak ve sonra çoğunluk oylamasını ya da
Bu cevapların ortalaması, eğer bu altı kişiden dördü tenis oynuyorsa, bu tenis oynamak için atanır.

English: 
So the output is what in the existing data set. Have we already seen nearby?
And can we use that to make a prediction?
So this is quite a good approach obviously choosing K is a little bit difficult to do
Right and this starts to get very very slow when you've got hundreds and hundreds of dimensions finding for K nearest points to a point
When you've got tens of thousands of dimensions or tens of thousands of instances, it's not easy to do even with good data structures
Why it starts to get slow quite quickly nevertheless. This is an effective and popular approach
Are there any alternatives there is one decision trees. All right, now I like decision trees
They have a nice benefit that once we created a decision tree
Which is just a series of decisions on is the data this yes, is it this?
No, once we've done all that we can actually look at the rules and say ok. That's how a decision was made
And that's quite a good rule set. So kind of a way of lighting a sort of if-else
Programming language, but you're doing it automatically let's draw out another data set
So we've got our instances down here and we've got our attributes here and remember for each of our instances

Turkish: 
Bu yüzden çıktı, mevcut veri setinde olandır. Yakınlarda gördük mü?
Bunu bir tahmin yapmak için kullanabilir miyiz?
Yani bu oldukça iyi bir yaklaşım, açıkça K'nin seçilmesi biraz zor.
Doğru ve K, bir noktaya en yakın noktaları bulmak için yüzlerce ve yüzlerce boyut bulduğunda bu çok yavaş olmaya başlar.
On binlerce boyuta veya on binlerce örneğe sahipseniz, iyi veri yapılarıyla bile yapmak kolay değildir
Neden yine de oldukça hızlı bir şekilde yavaşlamaya başlar. Bu etkili ve popüler bir yaklaşımdır
Herhangi bir alternatif var mı karar ağaçları var. Tamam, şimdi karar ağaçları hoşuma gidiyor
Karar ağacını bir kez yarattığımız için büyük yararı var.
Hangi kararların alındığı, hangi veriler bu evet, öyle mi?
Hayır, hepsini yaptıktan sonra aslında kurallara bakıp tamam diyebiliriz. Bir karar böyle verildi
Ve bu oldukça iyi bir kural seti. Bir nevi başka türlü aydınlatmanın bir yolu.
Programlama dili, ancak bunu otomatik olarak yapıyorsunuz başka bir veri seti çıkaralım
Yani burada örneklerimiz var ve burada niteliklerimiz var ve örneklerimizin her birini hatırlıyoruz.

Turkish: 
Çıktısını almaya çalıştığımız bir etikete sahip olacağız.
Tamam
Yani burada iyi
1 2 3 4 5 6 ve benzeri biliyorsunuz
Diyelim ki düşünelim ama bu bir kredi çeki tarafından verilen bir kredi puanı
Bu yüzden, aslında başka krediniz varsa, bana harcadığınız para miktarına bağlı olarak çizmeleriniz var.
ve
Yapmak istediğimiz şey, daha fazla kredinize izin verilip verilmeyeceği konusunda bir karar vermek değil mi?
Yani cevap evet ya da hayırdır, bu yüzden bir karar ağacı öznitelikleri temel alarak verileri bölümlendirir.
Diyelim ki ilk kural kredi notu kredi notu
5 soru işaretinden büyük veya ona eşit ve cevabınız evet ise
Cevap hayırsa devam ederiz.
Sonra aslında burada bir yaprak düğümü çıkardık
Burada kredinin reddedildiğini söylüyoruz, tamam, yani kredi notları beş. Henüz değil
Şimdi tamam diyoruz, kazanıyorlar mı?
Diyelim ki yılda 10,000 veya başka bir şey söyleyelim.
Cevabınız evet ise, bir sonraki aşamaya geçiyoruz, eğer hayır ise o zaman yeterince kredi almazlar.

English: 
We're going to have some label that we're trying to output
All right
So here well
You know 1 2 3 4 5 6 and so on
So let's imagine but this is a credit score by a credit check
So you've got actually boots based on how much money you've got how much you spent me to me if you already have other loans
and
What we want to do is make a decision as to whether you should be allowed more credit or not, right?
So the answer is yes or no quite simply so a decision tree is going to partition the data up based on the attributes
So let's say the first rule is credit rating credit rating
You know greater than or equal to 5 question mark and if the answer is yes
We continue if the answer is no
Then we actually output a leaf node here
Which says credit denied here we say, okay, so the credit ratings are by five. It's not a no yet
Now we say okay do they earn?
More than let's say 10,000 a year or something like that
And if the answer is yes, we proceed to the next stage if it's no then they don't earn enough credit denied

Turkish: 
Karar ağacının şimdi yaptığı budur, bunu kendiniz tasarlamak zorunda değilsiniz. Sizin için karar ağaçları üretecek algoritmalar var
İşe yarayacakları yol, bu özelliklerden birini veri çıkışı için en iyi şekilde ayıran her seviyede seçmeleridir.
örneğin
evet, birçok farklı örneğiniz var ve eğitim setinizde karar yok
Kredi notunu evet ve anotları ayırmanın en iyi yolu
Bunlardan biri her adım için en iyisi olacak ve hepsini böyle bir ağaç yapısında kullanabiliriz.
biz sadece evet ile sonuçlanan bir dizi yaprak düğümüne ulaşana kadar ve
Sadece burun ve sonra veri geldiğinde bunu uygulamak çok basittir
bu kuralları uygularız ve karar ağacına geçilecek bir karar alırız.
İfadeler halinde dikkatlice seçilmiş bir demet programlama eşdeğer
ama elbette ki yararı, bunu çok sayıda
Tüm bunları kendiniz yapmak zorunda kalmadan çok hızlı bir şekilde nitelikler atıyorsunuz, değil mi?
Yani evet, kendin yapmaktan daha iyi değil, ama çok daha hızlı. Öyleyse şuna bazı kodlarda bakalım:

English: 
This is what a decision tree does now you don't have to design this yourself. There are algorithms to produce decision trees for you
The way they will work is they will pick one of these attributes at each level that best separates for data out
so for example
you've got a lot of different instances of yes and no decisions in your training set is
credit rating the best way of separating out the yeses and anodes and
One of them is going to be best for each individual step and we can use all of them in a tree structure like this
until we get to a series of leaf nodes which end up with only yeses and
Only nose and then is very simple to apply this when you data comes along
we apply these rules and we get to a decision a decision tree is going to be
Equivalent to programming a bunch of carefully chosen if statements
but of course the benefit is that you can do this over a huge number of
Attributes very very quickly without having to do all this yourself, right?
So yes, it's not much better than doing it yourself, but it's much quicker. So let's have a look at this in some code

Turkish: 
Sınıflandırma ve benzeri şeyler için bugün farklı bir yazılımı değiştirip kullanacağız.
Weka'yı kullanacağımıza dair tahmin, karar ağaçları gibi şeylerin uygulanmasını sağlayan çok basit bir araçtır. Çok çok basit
Ve bizim yaptığımız gibi aynı veri temizleme işlemlerinden bazılarına sahiptir, ancak grafik biçiminde zaten kredi raporumuzu hazırladık
sağ
bu yüzden, çok sayıda girdinin olduğu kredi verisine sahibiz, ne kadar para kazandıkları gibi
Bunları bir dosyaya koymadan önce herhangi bir krediyi reddettiğim için buraya gireceğim.
Dosyamı bulacağım. Şu an burada olacak. JSON dosyaları çeşitli dosya tiplerini yükleyebilirsiniz
Örneğin, bir CSV yükleyeceğiz. Bu bizim kredi verilerimiz. Yani yaklaşık 600 satır var
İnsanların Japonya olduğunu düşündüğüm olsun olmasın, aslen gelen bu verilere kredi verildi veya verilmedi.
Yani yaş borcumuz gibi şeyler var
Medeni durumun zaten bankada müşteri olup olmadığı
Ehliyet alıp almadıklarını ve şu anki kredi puanlarını aldıklarını ve Weka’nın yaptıklarının tüm bunları doldurduğunu görebilirsiniz.
Nominal olup olmadıklarını ya da zaten sayısal değerleri olup olmadıklarını öğrenin
Örneğin, kredi notu sayısal bir değerdir

English: 
we're going to change and use a different piece of software today because for things like classification and
Prediction we're going to use Weka it's a very simple tool that makes applying things like decision trees. Very very simple
And it has some of the same data cleaning processes as our does but in a graphical form, we've already prepared our credit report
right
so we've got credit data where we have a number of inputs things like how much money do they make whether they've
Defaulted on any credit before we have these in a file so I'm gonna go in here
I'm gonna find my file. It's gonna be in here right now. You can load up various file types JSON files
For example, we're gonna load a CSV. It's our credit data. So we have about 600 rows of
Whether or not people I think it was Japan this data originally came from were given credit or not
So we have things like age debt
Marital status whether they're a customer at the bank already
Whether they've got a driving license what their current credit score is and you can see that what Weka has done is load all these
Work out whether they're nominal or values numerical values already
So for example credit score is a numerical value

Turkish: 
Ve burada farklı türleri ve kredi için onaylanıp onaylanmadıklarını gösteren hızlı bir histogramı görebilirsiniz.
Sonunda onaylanmış Weka, elde etmeye çalıştığımız çıktı veya sınıflandırma olarak yorumladı.
Pekala, bu veri setinde 307 tane var neredeyse bu yazı tipini görebilirsiniz.
307 onayladı ve
383
Reddedilen kredi. Öyleyse bir karar ağacı geliştirelim ve nasıl olacağını görelim. Yani sadece sınıflandırmaya gidiyoruz
Bir karar ağacı seçeceğiz. Yani biz 0r seçebileceğimizi seçeceğiz
Bu, standart karar ağacınız olan ağaçlara ve j48'e kadar inmeyecek.
Yüzde ayrımı kullanacağız ve eğitim setimiz için% 70'i seçeceğiz. Bu onaylama ayarına sahip değil
Birinin onaylanıp onaylanmadığını tahmin edeceğiz ve sonra eğiteceğiz.
Bu ne olursa olsun, bu silah karar ağacını eğitecek ve sonra bizim için doğruluğunun bazı ölçümlerini üretecektir.
Doğru sınıflandırıldığını görebiliyor musun?
Test setinin% 85'i iyi. Yani, bu insanlar için çok şey ifade ediyor.
Belki de bu% 15'lik bir miktar mağdur olmuş olabilir ve sonra burada bir karışıklık matrisi bulabiliriz.

English: 
And you can see here a quick histogram that shows the different types and whether they've been approved for credit
Approved at the bottom Weka has interpreted as the output or the classification that we're trying to achieve
Alright, so in this data set we have 307 you can almost see that font
307 approved and
383
Denied credit. So let's train up a decision tree and see how it does. So we only go to classify
We're going to select a decision tree. So we're going to choose we could choose 0r
That's not so gonna go down to trees and j48, which is your standard decision tree
We're gonna use a percentage split and we're going to select 70% for our training set. This one doesn't have a validation set
We're gonna be predicting whether one what they were approved and then we're gonna train
up like this what happens this weapon will train the decision tree and then it will produce for us some measurements of its accuracy you
Can see it's correctly classified
85% of the testing set which is good. I mean, it means a lot to these people
So maybe those 15% could be a bit aggrieved and then we get a confusion matrix down here

Turkish: 
Yani, evet, 76’nın doğru olduğunu söylüyoruz.
izin verilen kredi ve
22 yanlış reddedildi ve eğer yüzler doğru olarak reddedildi ve dokuz kişiye kazara izin verildi, değil mi?
Demek şimdi burada görebildiğimiz tek şey
Karar ağaçları hakkında güzel olan şey şu anda bu kurallara bakıp ne olduklarını görebiliyor olmamız.
Böylece görselleştirilmiş ağaca girebiliriz
Ve böylece, karar verilen en önemli özelliğin bir krediye temerrüde düşmüş olup olmadıklarını görebilirsiniz.
Bundan önce. Yani daha önce bir borcu ödemeyen kişi, eğer varsa, derhal reddedilir.
Bir kredi için temerrüde düşmediyseniz, istihdam edilip edilmediklerine ve çalıştıklarına bakmaya başlar.
Onlara kredi verecek
Tamam. Basit bir kural sistemidir ve veri miktarı göz önüne alındığında yapabileceği en iyisidir.
İstihdam edilmediklerinde aldık, ama bu onların gelirlerine bakacak
Belki serbest meslek sahibi, yaşadıkları yerde evli olup olmadıklarına ve tekrar gelirlerine karar vereceklerdir.
Doğru, böylece karmaşık karar verme süreçleri yapmak için özellikleri birkaç kez kullanabilirsiniz
Yani bu çok basit bir ağaç

English: 
So we're saying that of the yeses a 76 were correctly
allowed credit and
22 were denied incorrectly and if the noes a hundred were correctly denied and nine were accidentally allowed, right?
So that's the ever we can see here now
The nice thing about decision trees is we can now look at these rules and see what they are
So we can go into visualized tree
And so you can see that the most important attribute that is decided on is whether or not they defaulted on a loan
Prior to this. So anyone that defaulting on a loan before is immediately denied credit if they
Haven't default on a loan then it starts to look at whether they were employed and if they are
It's going to give them credit
All right. It's a simple rule system and it's the best it can do given the amount of data
We've got if they aren't employed, but it's going to look at their income
Maybe they're self-employed gonna make a decision then whether they're married where they live and their income again
Right, so you can use attributes multiple times to make complex decision making processes
So this is a very simple tree

English: 
Which actually has performed pretty well on this data set and it's not a huge data set for 85% That's not too bad
Once you've used a classifier so KNN or a decision tree to classify your data
You want to know really as how well as it performs on your testing set so you could quite simply calculate accuracy
So what is the percentage of the time that we were correct iein?
Obviously that's going to be hard to do for many classes, but for credit yes or no 85 percent is not bad
Right if our if our average was guessing at 50% it's quite a lot better than that
there's another type of classified as perhaps a little bit more common these days and a little bit more powerful with decision trees and that's
The support vector machine. So what is a support vector machine?
well
what we're going to try and do is
Separate our classes based on a line or plane or some separation in the attributes that we have
But what we're going to do is try and maximize a separation between these two classes to make our decision more effective
So let's imagine we have two attributes just like before so this is actually because one misses attribute two

Turkish: 
Aslında bu veri setinde oldukça iyi performans gösterdi ve% 85 için devasa bir veri seti değil. Bu fena değil.
Bir sınıflandırıcı kullandıktan sonra KNN veya verilerinizi sınıflandırmak için bir karar ağacı kullanın.
Test setinizde ne kadar iyi performans gösterdiğini bilmek istersiniz, böylece hassasiyeti kolayca hesaplayabilirsiniz
Peki doğru olduğumuz zamanın yüzdesi nedir?
Açıkçası, birçok ders için bunu yapmak zor olacak, ama kredi için evet ya da hayır yüzde 85 fena değil
Tabii eğer ortalamamız% 50 olarak tahmin ediliyorsa, bundan çok daha iyi
Bugünlerde belki biraz daha yaygın, karar ağaçlarında ise biraz daha güçlü olarak sınıflandırılmış başka bir tür daha var.
Destek vektör makinesi. Peki, bir destek vektör makinesi nedir?
iyi
deneyip yapacağımız şey
Sınıflarımızı bir çizgi veya düzlem ya da sahip olduğumuz özniteliklerin bir kısmına göre ayırın.
Ancak yapacağımız şey, kararımızı daha etkili hale getirmek için bu iki sınıf arasındaki ayrımı denemek ve en üst düzeye çıkarmaktır.
Öyleyse, daha önce olduğu gibi iki özelliğe sahip olduğumuzu düşünelim, bu yüzden aslında bir tanesi iki özelliği özlüyor.

English: 
Don't forget this is labeled training data. So we know which classes either been already. This is not like clustering
So maybe we have some data over here and we have maybe some data over here
Now obviously this is our quite an easy one
We're going to try to find a decision boundary between these two classes that maximizes a separation
So for example one decision boundary we could pick will be this one here
Right, but it's not perfect because it's very close to this point here and it's very close to this point here
So these are on the fringes are being misclassified
Right and you've got to think that this is just a training set if we start to bring in testing data that may appear around
Here or around here. Maybe that's the stuff that gets misclassified
So what a support vector machine will do is pick a line between these data points
Where the distance to the nearest point is maximized these nearest points are called support vectors, right? So this
Margin here is going to be as big as we can get it so you can imagine if we move this around the margins going
To get bigger and smaller now the nice thing about support vector machines in a kind of almost reverse PCA approach

Turkish: 
Bunun etiketli eğitim verileri olduğunu unutmayın. Yani biz zaten hangi sınıfların olduğunu biliyoruz. Bu kümeleme gibi değil
Bu yüzden belki burada bir veri var ve burada belki biraz veri var
Şimdi açıkçası bu bizim oldukça kolay olan
Bu iki sınıf arasında bir ayrılığı maksimize eden bir karar sınırı bulmaya çalışacağız.
Mesela seçebileceğimiz bir karar sınırı burada olacak
Doğru, ama mükemmel değil çünkü burada bu noktaya çok yakın ve bu noktaya çok yakın.
Yani bunlar saçaklar üzerinde yanlış sınıflandırılıyor
Doğru ve etrafta görünebilecek verileri test etmeye başlarsak, bunun sadece bir eğitim seti olduğunu düşünmelisin.
Burada ya da buralarda. Belki de yanlış sınıflandırılmış olan şey budur.
Öyleyse bir destek vektör makinesinin yapacağı şey, bu veri noktaları arasında bir çizgi seçmek.
En yakın noktaya olan uzaklığın maksimize edildiği yerlerde, bu en yakın noktalara destek vektörleri denir, değil mi? Yani bu
Buradaki marj, alabileceğimiz kadar büyük olacak, böylece bunu, marjların etrafında hareket ettirip geçirmediğimizi hayal edebilirsiniz.
Büyültmek ve küçültmek, neredeyse ters PCA yaklaşımıyla vektör makinelerini desteklemenin en güzel yanıdır

English: 
You can convert this into a higher dimensional space and perform quite complicated
Separation of things aren't really obviously separable like this things that are essentially we have to have a nonlinear decision made, right?
So not a simple line something more complex like a curve a lot of the time we're going to look at precision and recall
So recall is a measure off for all the positive things
But all the people that should have been granted credit how when even actually were like so we should have said yes
How many times did we actually say?
Yes, right
And that's a measure of how good is our algorithm at spotting
That class and precision is of the ones it spotted what percentage of them were, correct?
You can imagine a situation where your recall might be very high because you've just said yes to everyone right?
So yes
You spotted every single person that should have got credit
But also your precision is low because you were giving it to loads of people who shouldn't have had it, right?
So a really good algorithm is going to be one that has a very high precision and a very high recall
Right, and we combine these measures into one score?
F1 or F score and this is going to be a value between Norton one. Where one is

Turkish: 
Bunu daha yüksek boyutlu bir uzaya dönüştürebilir ve oldukça karmaşık bir şekilde gerçekleştirebilirsiniz.
Şeylerin ayrılması, aslında doğrusal olmayan bir karar vermemiz gereken bu şeyler gibi açıkça ayrılamazlar, değil mi?
Bu yüzden basit bir çizgi değil, çoğu zaman bir eğri gibi daha karmaşık bir şey, hassas bir şekilde bakacağız ve hatırlayacağız.
Yani hatırlama tüm olumlu şeylerin ölçüsüdür.
Ancak kredi alması gereken bütün insanlara, gerçekte nasıl olsalardı, yani evet demeliydik.
Aslında kaç kere demiştik?
Evet doğru
Ve bu tespitte algoritmamızın ne kadar iyi olduğunun bir ölçüsü
Bu sınıf ve kesinlik, yüzde kaçının doğru olduğunu tespit ettiler.
Herkese evet dediğiniz için hatırlatmanızın çok yüksek olabileceği bir durum hayal edebilirsiniz.
Yani evet
Kredi alması gereken her bir kişiyi gördün
Ama aynı zamanda hassasiyetin de düşük çünkü onu almaması gereken bir sürü insana veriyordun, değil mi?
Bu yüzden gerçekten iyi bir algoritma, çok yüksek bir hassasiyete ve çok yüksek bir geri çağırma özelliğine sahip olacak.
Doğru, ve bu önlemleri bir puanda birleştiriyoruz.
F1 veya F skoru ve bu Norton olanı arasında bir değer olacak. Biri nerede

Turkish: 
Kesinlikle mükemmel. Ve sıfır hiç çalışmaz. Bu durumda eğitim verilerimiz nereden geldi?
Tren randevumuzu internetten aldık, değil mi?
Ama eğer bir kredi ajansıysanız
Öyleyse yapacağınız şey, bu ilk kararları almak için insanları kullanacaksınız.
O zaman bir makineyi eğitecek ve insanların yapabileceği kadar iyi yapıp yapamayacağını görmek için test yapacaksın
Belki de bu karar ağacının yanlış sınıflandırılmış insanların yüzde 15'ini yakalayamadığı konusunda nüanslar vardır.
Bu insanlara yardım etmek için daha iyi yapabileceğimiz bir şey var mı?
Yani pratikte ne olacağını göreceksiniz, sizin antrenör sisteminiz
Ama belki de tamamen güvenebilirsin belki de çok açık bir şekilde
Evet, sadece evet demek için bir karar ağacı veya başka bir sınıflandırıcı kullanabilir miyiz?
Bu insanlar iyi
Belki de bariz bir şekilde hayır diyebileceğimizi biliyor.
Kredi almayacaklar
Ama son vakalar için ortadaki insanlar, belki de o zaman bir insanı bu döngüye sokarız.
Bu yüzden eğitim örneklerimiz için verilerimizde
Tüm özelliklere sahip olacağız ve daha sonra bu veriler için zaten bilinen bir etikete sahip olacağız.
Ama evet diyor ki, o kişi krediye izin verilmedi veya krediye izin verildi. Sağ? Yani biz bu eğitim örneklerini kullanacağız

English: 
Absolutely, perfect. And zero is doesn't work at all. Where did our training data come from in this case?
We've got our train date off Internet, right?
But if you're a credit agency
Then what you're going to do is you're going to use humans to make these initial decisions
Then you're going to train a machine and you're going to test to see whether it can do as well as people can do right
Maybe there's nuance there that this decision tree couldn't capture those 15 percent of people that were misclassified
Is there something we could have done better to help those people?
So what you'll find it happens in practically is your trainer system
But maybe you don't rely on it entirely maybe for the very obvious
Yes is we can use a decision tree or some other classifier to just say yeah
Those people are fine
Maybe for the obvious knows we can say no
They're not going to get credit
But for the edge cases the people in the middle, maybe that's when we bring a human into the loop
So in our data set for our training examples
We're going to have all of the attributes and then we're crucially gonna have an already known label for that data
But says yes that person was denied credit or they were allow credit. Right? So we're going to use those training examples of

Turkish: 
özellikleri gir ve çıktıları ver
Sınıflandırıcı ve ardından sonuçları test edeceğiz ve bilinmeyen durumlar için görünmeyen test verilerimizi kullandığımızda işe yarayıp yaramayacağını
Sınıflayıcılar, grupları evet veya hayır B veya C gibi gizli etiketlere koymamızı sağlar
Durumumuzun ne olduğuna bağlı olarak. Çok güçlüler ve yeterli eğitim verisine sahip olduğunuz sürece
Gerçek hayattaki kararları almak için onları kullanabilmeliyiz.
İleriye gitmek istediğimiz şey sadece evet veya hayır'dan hareket etmeye başlamaktır, aslında çıktı değerleri üretebiliriz.
Bu algoritmalardan gerçek değerleri gerileyebilir miyiz?
Biraz daha güçlü bir şey hakkında konuşalım
Bu yapay sinir ağları
şimdi
AI terimini gördüğünüz anda medyadaki herhangi bir zamanda gerçekte konuştukları şey makine öğrenmesi ve konuştukları şeydir.
Hakkında bazı büyük sinir ağı. Şimdi. Bunun için biraz daha küçük tutalım ama ne olduğunu hayal edelim

English: 
input attributes and output yes or no decisions to train our
Classifier and then we're going to test the results and whether or not it'll work when we use our unseen test data for unknown cases
Classifiers let us put groups into discreet labels yes or no a B or C
Depending on what our situation is. They're very powerful and as long as you've got enough training data
We should be able to use them to make real-life decisions
What we want to do going forward is start to move from just yes or no to can we actually produce output values
You know, can we regress actual values out of the these algorithms?
Let's talk a little bit about something more powerful
That's artificial neural networks
now
Anytime in the media at the moment when you see the term AI what they're actually talking about is machine learning and what they're talking
About is some large neural network. Now. Let's keep it a little bit smaller for this but let's imagine what
