
Turkish: 
Veri nedir doğru Bu veri olduğuna eminim
Doğru bu veri, bu resmi ya da bu bilgiyi biliyorsunuz
Bu veri mi? Veri nedir?
Bu yüzden son videodaki veriler hakkında çok konuştuk
Verileri analiz etmemiz ve anlayabilmemiz neden önemlidir? Fakat veriler nedir? Herkesin ürettiği veriler var
Şirketler bize üretiyorlar. Sosyal medyayı ne zaman kullandığımızı biliyorsunuz.
ama o ve
Ne olduğunu anlamak, onu doğru kullanabilmenin ön şartıdır.
Endişelendiğimiz kadarıyla belki de en önemli şey
Yani, verileri bilimsel olarak analiz etmeye çalışan insanlar, verilerin ölçülebilir olması gerekir, öyle değil mi?
yani fikir, bilirsin, insanların neye benzediği ile ilgili bir anket yapacaksanız
Herkes aynı ölçek ve aynı derecelendirme sistemini kullanıyor olmalı
Aksi takdirde, hiç mantıklı gelmiyor
Birinden beşe bir şeyleri derecelendirememeli ve başkasının iyi olduğunu düşündüğümü söyleyemem

English: 
What is data right I'm pretty sure that's data
Right is this data, you know this picture or that data
Is this data? What what is data?
So we talked a lot about data in the last video
Why is it important that we can analyze and understand data, but what is data? Everybody has data everybody's generating it
Companies are generating on us. We're generating it ourselves, you know when we use social media so on
but what is it and
Understanding what it is is a prerequisite for being able to use it properly
Perhaps the most important thing as far as we're concerned
So people who are trying to analyze data sort of scientifically is the data has to be measurable, right?
so the idea is, you know, if you're going to do a survey on what people like
Everyone's got to be using the same scale and the same rating system
Otherwise, it doesn't make any sense
Well, we can't have someone rating things from one to five and someone else saying I thought it was good

Turkish: 
Doğru çünkü hangisinden beşe biri iyi. Bilmiyoruz, bilmiyoruz
Tamam
Böylece, herkes verilerinizin tutarlı bir formatta olması gereken en az aynı şeyi yapacaktır.
Biraz daha yakınız.
Bir anlam ifade edebilmek için. Veri hakkında konuştuğumuzda genel olarak konuşuyoruz
Dört farklı türümüz var ve bunu bu noir kelimesiyle özetliyoruz. Yani n, o, ben, r, noir
Ve bu farklı veri türlerinin her birini tamamıyla farklı şeyler yapabiliriz.
Yani n bu ilk tip yani nominal değer bu
Normal veriler, ölçebileceğimiz değerler arasında mesafe olmadığı yerde
Doğru, çünkü onlar gerçekten büyük miktarlar değil ve biz onları sipariş edemeyiz. Yani iyi bir örnek renk olur
Belki de en sevdiğin renk kırmızıdır. Ve en sevdiğim renk mavi
Hangisinin diğerinden daha iyi olduğunu bilmiyorum
Aralarında herhangi bir ölçüm yoktur ve medlara yeşile daha yakın mavidir. Biliyor musun, bu hiç mantıklı değil, değil mi?
Dalga boylarından bahsetmiyoruz. Sadece renklerden bahsediyoruz, değil mi?
Diğer güzel bir örnek şu anda arkanızdaki futbolcu sayılarıyla sembolik olarak söyleyelim.

English: 
Right because which one of one to five is good. We don't you know, we don't know
All right
So everyone is going to be doing the same thing your data's got to be a consistent format and once that's achieved at least
We're a little bit closer
To be able to make some sense of it. Broadly speaking when we talk about data
We kind of have four different types and we summarize this with this nice noir word. So n, o, i, r, noir
And each of these different types of data we can do different things with all right
So n that's the first type so this is nominal data
The normal data is where we have no distance between the values that we can measure
Right because they're not really quantities and we can't order them. So a good example would be colors
So maybe you have your favorite color is red. And my favorite color is blue
I don't know which is better than the other
There is no measurement between them right is blue closer to green the medes. You know, that doesn't make any sense, right?
We're not talking about wavelengths. We're just talking about the colors, right?
Another good example would be lets say in football player numbers on your back right now symbolically

Turkish: 
Bazen belirli oyuncu numaralarının bir anlamı olabilir, ancak bunları karşılaştıramaz ve kontrastlayamazsınız
8'in 4'ten 2 kat daha iyi olduğunu söyleyemezsiniz. Tamam, bu hiç mantıklı değil, değil mi?
Ayrıca onları genel olarak doğru oyuncu olarak sipariş edemezsiniz.
16, bir oyuncu 13 listesinden önce veya sonra gitmez ama biliyorsun, ama bu bir anlam ifade etmiyor, değil mi?
Yani nominal veriler veridir ve faydalıdır, değil mi?
Gerçekten önemli olabilir ama etiketlerimizin olduğu yerlerden biri.
Ancak bu etiketleri sipariş etmenin bir yolu yoktur, böylece hala analiz edebilirsiniz, ancak örneğin hesaplayamazsınız.
ortalama bu ortalama sağ? Bu hiç mantıklı olmaz
Yapabilecekleriniz modu hesaplamaktır, böylece en yaygın olanı hesaplayabilirsiniz, böylece daha fazla insanın kırmızıyı tercih ettiğini söyleyebilirsiniz.
Maviye ama bildiğini söyleyemezsin
İnsanların sevdiği ortalama renk bir çeşit çamurlu kahverengi haktır. Bu hiç mantıklı gelmiyor, değil mi?
Bu listeden aşağı indikçe bazı veri türlerinde biraz daha fazla bilgi veriyoruz.
Yani bir sonraki sıra
yani sıralı verilerde
Bir siparişimiz var, ancak şeyler arasındaki mesafeleri ölçemeyiz, bu yüzden iyi bir örnek şöyle bir şey olurdu

English: 
Sometimes certain player numbers have a meaning but you can't compare and contrast them
You can't say that 8 is 2 times better than 4. All right, that doesn't make any sense, right?
You also can't really order them in general right player
16 doesn't go before or after player 13 in a list but you know, but that doesn't make any sense, right?
So nominal data is data where and it's useful, right?
It could be really important but it's data where we we kind of have labels
But no way of ordering these labels so you can still analyze it, but you can't for example calculate
the average that the mean average right? That wouldn't make any sense
What you can do is calculate the mode so you can calculate the most common one so you could say that more people prefer red
To blue but you couldn't say you know
The average color that people like is a sort of muddy brown right. That doesn't make any sense at all, right
So as we go down this list, we get slightly more and more informative in some sense types of data
So the next one is ordinal
so in ordinal data
we have an order but we can't measure distances between things so a good example would be something like

Turkish: 
Pozisyonlar insanlar bir yarışta bitti. Bilirsin, belki önce ben bitirdim
Süper hızlıyım, üçüncü bitirmedin mi?
Ancak, bu tür verilere dahil olmayan bir parçası olduğumuzda
Bunun için ayrı bir değere sahip olmalısın, başka bir örnek, hepimiz aşina olduğumuz derecelendirme sistemleri, değil mi?
Belki de bir ila beş yıldız arasında bir filmi derecelendiririm ve bir ila beş yıldız arasında bir filmi derecelendirirsiniz
ama bunu gerçekten söyleyemezsin
dört yıldız almış olan film iki gol atan filmden iki kat daha iyi
Çünkü bu çok öznel bir şey ve sıralı verileriniz varsa, bu yıldızlar arasında gerçek bir ölçülebilir mesafe yoktur.
Modu tekrar hesaplayabilirsiniz. En hesaplayabilirsiniz
Döndürülen tüm değerlerin ortak değeri ya da ortasındaki ortancayı hesaplayabilirsiniz, değil mi?
Belki de bir yarışta elli koşucuyu tanıyorsunuzdur. 25inci sıra kabaca konuşan medyanı biliyor olacaksınız.
Bu yüzden, bir sonraki aşamada hala çok kullanışlı değil. Aralık verileri aralık verilerimiz var
Bir siparişimiz var ve mesafemiz var, ancak bu ölçek için mutlak bir sıfırımız yok
Yani iyi bir örnek derece santigrat derece veya Fahrenheit derece olabilir

English: 
Positions people finished in a race. So, you know, maybe I finished first
I'm super quick right you didn't you finished third
But how far we are a part that isn't included in that kind of data
You'd have to have a separate value for that another example what we're all familiar with is rating systems, right?
So perhaps you I rate a film from one to five stars and you rate the film from one to five stars
but you can't really say that a
film that's got four stars is two times better than one that scored two
Because that's a very subjective and it's there's no real sort of measurable distance between these stars if you have ordinal data
You can calculate the mode again. You can calculate the most
Common value of all the values that were returned or you can calculate the median the one that sits in the middle, right?
So maybe you know fifty runners in a race the 25th position roughly speaking is going to be you know around the median
So it's still not hugely useful, right the next up. We have interval data interval data
We have an order and we have a distance, but we have no sort of absolute zero for this scale
So a good example would be something like degree Celsius or degrees Fahrenheit

Turkish: 
Sıfır derece santigrat sıcaklık değil. Belirli bir sıcaklık, değil mi?
Yani elli derecenin yüz derecenin yarısı olduğunu söyleyemeyiz
Bir buçuk numara var ama gerçekten mantıklı değil, değil mi?
Onlar yüz derecenin 50'den, yani sıfırdan daha sıcak olduğunu söyleyebiliriz, değil mi?
Yani bu aralık verileri şimdi aralık verileri
Sıralı ile yapabileceğimizden biraz daha fazla şey yapmamıza izin veriyor, mod ve medyanı hesaplayabiliyoruz.
Şimdi ortalama sıcaklığı hesaplayın. Sorun yok
Ayrıca yağmur gibi şeyleri belirli bir pencere için minimum ve maksimum sıcaklıkları hesaplayabiliriz, değil mi?
Yani bu oldukça yararlı bir başka iyi aralık örneği tekrar pH seviyesi olacak, sıfırın pH'ı çok asidik demektir
Asitlik olmadığı ya da hiç pH olmadığı anlamına gelmez. Bunu söyleyebiliriz ki
Yani 13, pH 7'den yüksek, pH 3'ten yüksek
Ve bu sayıların birbirinden ne kadar uzakta olduğunu biliyoruz, ancak birinin bir diğerinin iki katı olup olmadığını söyleyemeyiz.
Dolayısıyla, inceleyeceğimiz son veri türü oran verisidir.
Yani bu tam olarak aralık gibidir, çünkü şimdi bir tür gerçek sıfır değerine sahibiz.

English: 
Zero degrees Celsius isn't no temperature. It's it's a specific temperature, right?
So we can't say that fifty degrees is half of a hundred degrees
I have a numbers a half but doesn't really make sense, right?
They are we can we can say that a hundred degrees is hotter than 50, which is hotter than zero, right?
So this is interval data now interval data
Lets us do a few more things than we could with ordinal as well as be able to calculate the mode and median we can
Now calculate the mean temperature. That's okay
And we could also calculate things like the rain the minimum and maximum temperatures for a certain window, right?
So that's pretty useful another good example of interval will be pH level right again, the pH of zero means very acidic
It doesn't mean there is no acidity at all or no pH at all. We can say that a
So 13 is higher than a pH of 7 is higher than a pH of 3
And we know how far apart these numbers are but we can't necessarily say if one is double one another one
So the final kind of data we're going to look at is ratio data
So this is exactly like interval, except we now have a sort of true zero value

English: 
So a good example of this would be degrees Kelvin right. So Kelvin has an absolute zero which is the absolute average
absence of any kind of heat right and when it goes upwards so we can say that in terms of Kelvin a hundred is
Half of 200 and so on like this and we can get to 0 another example would be number of children, right?
Zero children means the absence of any children and you can also say that let's say four children is double the amount of two children
And two many to look after in my opinion
So that is an example of ratio data
Right now ratio data is quite similar in terms of what you can calculate to interval, but it allows some more
complicated statistical measures such as t-test
So these are the types of data now actually, it's quite important how you structure your data in general
We can't just have it sitting in some massive spreadsheet with no thought given to where everything is, right
There's actually a pretty standard way of doing this that we're going to look at
Data comes in lots of forms, right different types of measurements different experiments people are going to collect it in different ways
But actually there's a very standard way that we use
To represent data once it's actually on a computer so we can have some kind of table of our data

Turkish: 
Bu yüzden buna güzel bir örnek Kelvin derecesinde olabilir. Öyleyse, Kelvin mutlak sıfıra sahiptir ki bu mutlak ortalamadır
herhangi bir ısının olmaması ve yukarı doğru gittiğinde, Kelvin cinsinden yüz olduğunu söyleyebiliriz.
200'ün yarısı ve bunun gibi ve 0'a başka bir örnek alabilirsek çocuk sayısı olur, değil mi?
Sıfır çocuk herhangi bir çocuğun olmaması anlamına gelir. Diyelim ki dört çocuğun iki çocuğun miktarının iki katı olduğunu söyleyelim.
Ve bence dikkat edilmesi gereken iki kişi
Yani bu oran verisinin bir örneği
Şu anda oran verisi, aralıklarla hesaplayabileceğiniz değer bakımından oldukça benzer, ancak bazılarına izin veriyor
t-testi gibi karmaşık istatistiksel önlemler
Yani bunlar aslında şu anda veri türleridir, verilerinizi genel olarak nasıl yapılandırdığınız oldukça önemlidir.
Her şeyin nerede olduğuna dair hiçbir fikrimiz olmadan, sadece büyük bir elektronik tabloda oturmasını sağlayamayız.
Aslında bunu yapmamızın oldukça standart bir yolu var.
Veriler birçok formda gelir, doğru farklı ölçümler türleri farklı deneyler insanlar farklı şekillerde toplarlar
Ama aslında kullandığımız çok standart bir yol var.
Verileri aslında bilgisayarda olduktan sonra temsil etmek, böylece verilerimizle ilgili bir tabloya sahip olabiliriz.

Turkish: 
Biz neredeyse her zaman
verilerimizi bunun gibi bir matriste temsil eder
İki boyutlu masa, üst kısım boyunca yapılması çok daha kolay çünkü
Ölçtüğümüz şeyler olan özelliklerimizi doğru kullanacağız.
Öyleyse bir örnek belki insanlarla ilgili veri topluyoruz, böylece ismimizi alabiliriz.
Bu bazı nominal veri olurdu ve o zaman yaş boyunu biliyorsunuz
Bu yüzden sütunlar satırları ölçtüğümüz her şeye nitelik verir.
Bunlar bizim sahip olduğumuz örnekler veya örnekler, yani tüm bireysel insanlar.
Yani burada kişi 1 ve kişi 2 kişi 3 ve kişi 3 John ve orada denir
54'ü biliyorsun, 5 ayağı 11'i ya da her neyse biliyorsun.
Her ne doğruysa söyleyeceğin gibi, istediğin kadar satır olduğunu biliyorsun.
öyleyse konuştuğumuzda
Öznitellikler
İnsanların bunlar için birçok farklı terim kullandığı sütun sayısından bahsediyoruz. Onları özellikler olarak düşünmeyi seviyorum
Öznitelikler bir başkasıdır ve verilerinizin son sütununda şimdi oldukça sık satırlar veya örnekler veriyoruz.
Bazen ayrıldı ama gerçekten önemli değil. Çıktımız olacak
Belki bu insanlara dayanarak bir karar vermeye çalışıyoruz.

English: 
We almost always
represent our data in a matrix like this a
Two-dimensional table because it's much easier to do and so along the top
We're going to have our attributes right which are the the things we've been measuring
So an example would be maybe we're collecting data on people so we could have name
That would be some nominal data and then, you know age height
So the columns are attributes all the things we've been measuring the rows
Those are the instances or the samples we've got so that's all the individual people
So here's person 1 and person 2 person 3 and person 3 is called John and there
You know 54 and you know 5 foot 11 or whatever, you know
Whatever right and so on and you can put you know have as many rows as you want
so when we talk about
attributes
We're talking about the number of columns people use lots of different terms for these. I like to think of them as features
Attributes is another one and we have instances or samples down the rows now quite often on the very last column of your data
Sometimes separated out but not really important. We'll have our output
Maybe we're trying to make a decision based on these people

Turkish: 
Belki bunlar bir futbol takımı adayıdır ve diyoruz ki, bilirsin, takımda olacaklar mı yok mu?
Yani bu evet. Hiçbir John yapmadı
Evet, hayır, hayır ve böylece ve böylece karar alma sürecimizi analiz edebilir ve bilmenize karar verebiliriz
Bu şeylerin şu anda karar verme sürecimizi bir örnek olarak bildiren herhangi bir yönü var mı?
Verileri daima bu şekilde yapılandırırız
Ama eğer yapmazsak büyük bir problem haline gelir, çünkü tüm bu zamanınızı biçimlendirmek ve çalışmak için harcamak zorunda kalırsınız.
Ne biliyorsunuz ve ne biliyorsunuz, John neden masanın üstünde listeleniyor veya listelenmiyor? Ve biliyorsun, hiçbir şey artık bir anlam ifade etmiyor.
Öyleyse gerçek bir veri setine bakalım ve tüm bunları işlem halinde göreceğiz
Yani burada birisinin tenis oynamaya gidip gitmeyeceğine dair bir veri setimiz var.
Doğru ve gidip gitmeyecekleri, hava koşullarının ne olduğuna biraz bağlı olacak, doğru
Yani örneğin oynamayı sevmiyoruz
Çok sıcak olduğunda tenis veri seti, veri seti ile aynıdır. Çoktan baktık
Bir CSV dosyasında tutulan R'ye yükleyeceğiz. Yani tenis CSV okuyor

English: 
Maybe these are candidates for a football team and we're saying, you know, are they gonna be on the team or not?
So this is yes. No John's made it
Yes, no, no and so on and that way we could perhaps analyze our decision-making process and decide you know
Is there any aspect of these things that inform our decision-making process as an example right now?
We always structure data in this way
But if we don't it becomes a huge problem because you end up spending all this time formatting and trying to work out
What's what and you know, why is John listed down the table or not across the table? And you know, nothing makes any sense anymore
So let's look at an actual data set and we'll see all this in action
So we have here a data set of whether someone goes to play tennis
Right and whether or not they go is going to depend a little bit on what the weather conditions are, right
So we don't like to play for example
When it's too hot the tennis data set is just the same structure as a data set. We looked at already
We're gonna load it into R it's held in a CSV file. So tennis read CSV

English: 
Tennis now we're using R for this because it's free and it has a load of decent functions for analyzing examining
Visualizing data, right? So we're going to be using it throughout these videos
obviously you could use MATLAB or Python or some other library if you wanted to
I think that you should use whatever you're most comfortable with
Looking at these rows and tables
I mean, it looks a lot like something like Microsoft Excel
You could do this data analysis in Excel
Some people would disagree. No, Excel is perfectly good for what it does you could do with data analysis in it. I think that
Excel in it doesn't enforce anything to do with
Observations versus variables and things like that. These are distinctions that are not really made in Excel
Obviously if you enforce those rules yourself that's going to work, but you have to be a little bit more
You know regimented and rule-based about it
Think the consensus would be that if you really want to get into data analysis and start doing things like principal component analysis or more
Advanced statistical measures something like R or Python is going to help a lot more
Okay
So I've loaded the data set and if we look up the data set

Turkish: 
Tenis şimdi bunun için R kullanıyoruz çünkü ücretsizdir ve sınavı analiz etmek için çok sayıda iyi fonksiyona sahiptir
Verileri görselleştirmek değil mi? Bu yüzden bu videolar boyunca kullanacağız
Tabii ki MATLAB, Python veya başka bir kütüphaneyi kullanabilirsiniz.
Bence en rahat edeceğin şeyi kullanmalısın.
Bu satırlara ve tablolara bakmak
Microsoft Excel gibi bir şeye benziyor
Bu veri analizini Excel'de yapabilirsiniz
Bazı insanlar aynı fikirde olmazdı. Hayır, Excel, içindeki veri analizi ile yapabilecekleriniz için mükemmeldir. bence
Excel'in içinde yapılması gereken hiçbir şey yoktur
Gözlemler değişkenlere karşı ve buna benzer şeyler. Bunlar gerçekten Excel’de yapılmayan ayrımlar.
Açıkçası bu kuralları kendiniz uygularsanız işe yarayacak, fakat biraz daha fazla olmanız gerekecek.
Bu konuda alay ve kural tabanlı biliyorsun
Mutabakatın gerçekten veri analizine girmek ve temel bileşen analizi veya daha fazlası gibi şeyler yapmaya başlamak istiyorsanız, olacağını düşünün.
Gelişmiş istatistiksel önlemler R veya Python gibi bir şey daha çok yardımcı olacak
Tamam
Böylece veri setini yükledim ve veri setine bakarsak

Turkish: 
bu yüzden, verilerin farklı birkaç satırına bakarız, 6 farklı değişken veya 6 özellik olduğunu görürsünüz ve
Bu veri setinde 14 örnek veya gözlem var.
R onlara gözlemler diyor. Öyleyse söylediğimiz altı sütunumuz var ve
veri setimizin on dört satırı ve bu veri seti
aynen gibi yapılandırılmış
Bu kişi bir dakika önce bakmakta olduğum veri setini
Yani, tek bir vakayı inceleyebiliriz, 3. günde ne olduğunu söyleyebiliriz?
Öyleyse üçüncü güne bakalım, böylece 3. günde tenis diyebiliriz
Ve üçüncü günde bulutlu olduğunu söyleyebiliriz. Sıcaklık sadece beş derece oldu
Nem yüksekdi, rüzgar yoktu ve tenis oynamaya karar verdiler, değil mi?
Bu yüzden biraz soğuk, ama sanırım bir yol verdi
Böylece tüm farklı sıcaklıklara bakabiliriz, örneğin, tüm farklı tahminler tenis doları görünümü
Tamam
Veri setindeki tüm görünümlere bakabiliriz ki güneşli güneşli bulutlu yağmurlu olduğunu söyleyebiliriz.

English: 
so we look at the top few rows of the data you'll see that there are 6 different variables or 6 attributes and
This data set has 14 instances or observations
R calls them observations. So what we're saying is we have six columns and
fourteen rows right of our data set and this data set is
structured exactly like
This people data set that I was looking at a minute ago
So we can examine a single instance we can say what is it about day three?
So let's have a look at day three so we can say tennis on day 3
And we can say on day three it was overcast. The temperature was only five degrees
The humidity was high there wasn't any wind so they decided to play tennis, right?
So it's a bit chilly, but I guess they gave it a go
So on we could also look at all the different temperatures, for example, all the different forecasts tennis dollar outlook
All right
And we can look at all the outlooks in the data set so we can say we've got sunny sunny overcast rainy rainy

Turkish: 
yağmurlu ve benzerleri ve burada R gibi bir şey kullanarak ne tür havalara baktığımıza dair bir fikir edinebiliriz.
Örnekleri inceleyebilirsiniz
Bunları birlikte gruplandırabileceğiniz veya uygun gördüğünüz gibi ayrı ayrı inceleyebilir ve daha sonra çalışmaya başlayabilirsiniz.
Bu veri kümesi ne anlama geliyor
Şimdi bu veri seti, makine öğrenimi gibi bir şey kullanabilmeniz için gerçekte oynanıp oynatılmadıklarını gösteren son sütuna sahiptir.
Diğer sütunlara dayanarak bu son sütunu tahmin etmek için. Bu veri seti hakkında başka bir şey yapabileceğiniz bir şey.
Bu oldukça ilginç, farklı veri türlerinden birkaç örneğe sahip olması. Daha önce bakıyorduk
Unutmayın, nominal sıra aralığı ve oranımız var.
Bu nedenle, örneğin Outlook gerçekten nominal bir alandır, nominal bir veri türüdür
Belki yağmurludan güneşliye kadar sipariş vermenizi önerebilirsin, ama sonra bulutlu, bilirsin
Gerçekten bir anlam ifade etmiyor
yani bu, örneğin modu hesaplayabileceğiniz ve günlerin çoğunun yağmurlu veya bunun gibi bir şey olduğunu söyleyebileceğiniz bir tür nominal değerdir.
Daha önce tartıştığımız gibi sıcaklık santigrat derece. Yani bu olacak
Aralık, verileri sipariş edebiliriz ve söyleyebiliriz, ancak bunlardan biri diğerinden 50 uzakta

English: 
rainy and so on and we can get a feel for what kind of weather we're looking at here as well using something like R
You can examine the instances
You can examine the individual attributes you can group them together or not as you see fit and then you can start to drill into
What this dataset means
Now this dataset has in it the final column which is whether they actually played so you could use something like machine learning
To predict that final column based on the other columns. That's something you could do one other thing about this dataset
It's quite interesting is it has a few examples of the different kinds of data. We were looking at earlier
So remember we have nominal ordinal interval and ratio
So for example Outlook is really a nominal field right, it's a nominal data type
You could perhaps suggest that you could order it from rainy through to sunny, but then cloudy overcast, you know
It doesn't really make any sense
so this is kind of nominal you could calculate for example the mode and say that most of the days were rainy or something like this
Temperature as we discussed before this is in Celsius. So this is going to be
Interval we can order the data and we can say but one of them is 50 away from another one

Turkish: 
Fakat bunun ne kadar önemli olduğunu söyleyemeyiz. Bu sıcaklık iki katı mı yoksa yarım sıcaklık mı?
Gerçekten söyleyemiyoruz, bu yüzden nem sıralıdır, bu yüzden normalden daha yüksek nem olduğunu söyleyebiliriz, değil mi?
Ancak, bunun kimin ölçtüğüne, farklılıklarının nerede ve nihayet nerede bulunduğuna bağlı olarak ne kadar bağlı olacağını gerçekten söyleyemeyiz.
Saatte kilometre olarak rüzgar. Sıfır, rüzgar değil. Evet, olumsuz rüzgar alamazsın. Yani bu bir oran değil mi?
Saatte 20 mil veya saatte 20 kilometre rüzgar olduğunu, ondan iki kat fazla olduğunu söyleyebilirsiniz.
Bu küçük veri setinin tüm veri türlerini içerdiğini söyleyebileceğiniz bir şey.
yani farklı
Bunları kullanarak hesaplayabileceğiniz istatistikler ve ölçüler ne tür verilere bağlı olduğuna bağlıdır
Böylece çok basit bir veri setinin bile olduğunu görebiliriz.
Bunun gibi, çok çeşitli türden veri ve bu verileri yorumlayabilmemizin farklı yolları var.
Doğru, yalnızca Outlook'un iyi olup olmadığına göre oynama kararı alırsanız
Belki de tüm sorunu çözmeyeceksin, değil mi?
Yani bunlar ilerledikçe bakacağımız türden şeyler.
Bundan sonra yapabileceğimiz bir şey de bu verileri görselleştirmektir. Bazı kalıpları denemeye ve anlamaya veya bir tür bilgi edinmeye başlayın
Çok önemli bir araç ama düzgün kullanmalısın
Sadece hiçbir şeyi ve her şeyi çizemezsiniz

English: 
But we can't say how much of a difference that it's like. Is that double the temperature or half a temperature?
We can't really say so humidity is ordinal so we can say high is more humidity than normal, right?
But we can't really say how much that's going to depend on who was measuring it and where their differences lie and finally
Wind in kilometers per hour. Well, zero is no wind. Yeah, you can't have negative wind. So this is a ratio, right?
You can say that 20 mile an hour wind or 20 kilometers an hour wind, is two times more than ten
That's something you can say this little dataset contains all the kinds of data
so the different
Statistics and measures you can calculate using these it's going to depend on what kind of data they are
So we can see that even a very simple data set
Like this has loads of different kinds of data and different ways we could interpret this data
Right, if you make a decision to play based only on whether the Outlook is good
You're maybe not going to solve the whole problem, right?
So these are the kind of things we'll be looking at as we go forward
And one thing we might do next is to visualize this data. Start to try and understand some patterns or extract some kind of knowledge
They're very important tool but you've gotta use it properly
You can't just plot anything and everything

Turkish: 
Kullandığınız her harita hipotezinizi desteklemeli veya hikayeyi denemeli
Doğru anlatmaya mı çalışıyorsun? Sadece bir şey çizemezsin çünkü doğru çizilebilir mi?
Uygunsuz grafik kullanmak ve yalnızca verilerinizin alt kümelerini seçmek ile ilgili çok fazla sorun varsa bunun bir anlamı olmalı.
Bu çok büyük bir problem

English: 
Every chart you use has got to support your hypothesis or it's got to try and show the story
You're trying to tell right? You don't just plot something because it could be plotted right?
There's got to be a point to if there's a lot of problems with using inappropriate graphs and only picking subsets of your data
That's a huge problem
