
English: 
Preparing your data so the programs can read it is probably the most important task in data mining.
Today, I'll show you how to load your data in Orange.
Orange can read several data formats such as Excel, tab and comma separated files.
The data is normally a table, where data instances are in rows and data attributes are in columns.
But why just do the talking and no walking?
Let's make our own data.
I'll use Google Sheets to create a simple data set.
Say we have a group of people
and we would like to know whether we can predict the gender
based on their physical characteristics.
Ok, our people will have a name, so we know who's who.
Then we also know their gender,
height and weight.
And we know how they look like, so let's put down also their eye and hair color.

Portuguese: 
Preparar seus dados para que os programas possam lê-los é provavelmente a tarefa mais importante na mineração de dados.
Hoje, mostrarei como carregar seus dados no Orange.
Orange pode ler vários formatos de dados, como Excel, tab e arquivos separados por vírgulas (.csv).
Os dados são normalmente uma tabela, em que os registros de dados estão em linhas e os atributos de dados estão em colunas.
Mas chega de papo, vamos fazer?
Vamos criar nossos próprios dados.
Usarei as Planilhas do Google para criar um conjunto de dados simples.
Digamos que temos um grupo de pessoas
e gostaríamos de saber se podemos prever o gênero
baseado nas suas características físicas.
Ok, nosso pessoal terá nomes, então sabemos quem é quem.
E nós também sabemos o gênero deles,
altura e peso.
E nós sabemos como eles se parecem, então vamos colocar também a cor dos olhos e do cabelo deles.

Serbian: 
Priprema podataka za rad u softverima
je verovatno najvažniji zadatak Data Mining-a.
Danas ću Vam pokazati kako da 
učitate svoje podatke u Orange.
Orange podržava nekoliko formata podataka, poput Excel-a, tabulatorom- i zarezom-razdvojenih datoteka.
Podaci se obično nalaze u tabelarnom obliku, 
gde redovi predstavljaju instance, a kolone atribute.
Ali zašto da pričamo u prazno?
Hajde da napravimo sopstvene podatke.
Koristićemo Google Sheets da 
napravimo jednostavan skup podataka.
Recimo da posmatramo grupu ljudi
i da želimo da predvidimo pol osobe
na osnovu njenih fizičkih karakteristika.
U redu. Naše osobe će imati imena 
('name'), da bi se znalo ko je ko.
Zatim, znamo njihov pol ('gender'),
visinu ('height') i masu ('weight').
Znamo i kako izgledaju. 
Stoga - zabeležimo i njihovu boju očiju i kose.

Turkish: 
Verilerinizi programların okuyabilmesi için hazırlamak muhtemelen veri madenciliğinde en önemli görevdir.
Bugün, verilerinizi Orange'a nasıl yükleyeceğinizi göstereceğim.
Orange, Excel, sekme ve virgülle ayrılmış dosyalar gibi çeşitli veri formatlarını okuyabilir.
Veriler normalde, veri örneklerinin satırlarda ve veri özniteliklerinin sütunlarda olduğu bir tablodur.
Ama neden sadece konuşuyorsun ve yürümiyorsun?
Kendi verilerimizi yapalım.
Basit bir veri kümesi oluşturmak için Google E-Tablolar'ı kullanacağım.
Diyelim ki bir grup insanımız var
ve cinsiyeti tahmin edip edemeyeceğimizi bilmek istiyoruz
fiziksel özelliklerine göre.
Tamam, halkımızın bir ismi olacak, bu yüzden kimin kim olduğunu biliyoruz.
Sonra cinsiyetlerini de biliyoruz,
yükseklik ve ağırlık.
Ve nasıl göründüklerini biliyoruz, bu yüzden gözlerini ve saç rengini de bırakalım.

Spanish: 
Preparar sus datos para que los programas puedan leerlos
es probablemente la tarea más importante en la minería de datos.
Hoy, te mostraré cómo cargar tus datos en Orange.
Orange puede leer varios formatos de datos como Excel, tabulación y archivos separados por comas.
Los datos son normalmente una tabla,
donde las instancias de datos están en filas y los atributos de datos están en columnas.
Pero, ¿por qué hablar y no caminar?
Hagamos nuestros propios datos.
Usaré Google Sheets para crear un conjunto de datos simple.
Digamos que tenemos un grupo de personas
y nos gustaría saber si podemos predecir el género
basado en sus características físicas.
Ok, nuestra gente tendrá un nombre, así que sabemos quién es quién.
Entonces también sabemos su género,
altura y peso.
Y sabemos cómo se ven, así que dejemos también el color de sus ojos y cabello.

English: 
I have this data set for my friends, Jill, Jack, Mark, Ann, and so on.
Their names are all strings - that is text.
Gender won't be a string but a categorical value,
because our people will belong to one of the two groups, male or female.
My friends naturally have different heights and weights
which are numerical values.
Some of my friends are tall, others short,
some slim and others a bit chubby.
The color of their eyes and hair are again two categorical values,
since the eyes can be either blue, brown or green and the hair black, brown, blonde or red.
Now we have our data.
Still, other than providing the data, I have not explicitly specified attribute types,
so let's hope Orange will guess them correctly.

Spanish: 
Tengo este conjunto de datos para mis amigos, Jill, Jack, Mark, Ann, etc.
Sus nombres son todas cadenas, es decir, texto.
El género no será una cadena sino un valor categórico,
porque nuestra gente pertenecerá a uno de los dos grupos, hombre o mujer.
Mis amigos, naturalmente, tienen diferentes alturas y pesos
que son valores numéricos.
Algunos de mis amigos son altos, otros bajos,
algunos delgados y otros un poco gorditos.
El color de sus ojos y cabello son nuevamente dos valores categóricos,
ya que los ojos pueden ser azules, marrones o verdes y el cabello negro, marrón, rubio o rojo.
Ahora tenemos nuestros datos.
Aún así, aparte de proporcionar los datos, no he especificado explícitamente los tipos de atributos,
así que esperemos que Orange los adivine correctamente.

Turkish: 
Arkadaşlarım Jill, Jack, Mark, Ann, vb. İçin bu veri setine sahibim.
İsimlerinin hepsi dize - yani metin.
Cinsiyet bir dize değil, kategorik bir değer,
çünkü halkımız erkek ya da kadın olmak üzere iki gruptan birine ait olacak.
Arkadaşlarım doğal olarak farklı yükseklik ve ağırlıklara sahip
bunlar sayısal değerlerdir.
Bazı arkadaşlarım uzun, diğerleri kısa,
bazı ince ve diğerleri biraz tombul.
Gözlerinin ve saçlarının rengi yine iki kategorik değerdir,
çünkü gözler mavi, kahverengi veya yeşil olabilir ve saç siyah, kahverengi, sarışın veya kırmızı olabilir.
Şimdi verilerimiz var.
Yine de, veri sağlamak dışında, öznitelik türlerini açıkça belirtmedim,
Umarım Orange onları doğru tahmin eder.

Serbian: 
Ovaj skup podataka opisuje moje prijatelje - 
Jill, Jack, Mark, Ann, itd.
Njihova imena su polja tekstualnog tipa 
(nizovi karaktera).
Pol neće biti niz karaktera, 
već kategorički tip
jer naše osobe pripadaju jednoj od
dveju grupa - muškarcima ili ženama.
Prirodno, moji prijatelji imaju 
različite visine i mase,
koje su predstavljene
numeričkim vrednostima.
Neki od mojih prijatelja su visoki, drugi niski, 
jedni mršavi a drugi punački.
Boja njihovih očiju i kose su, 
takođe, kategoričke vrednosti,
jer njihove oči mogu biti - plave, braon ili zelene, 
a njihova kosa - crna, smeđa, plava ili riđa.
Sada imamo naše podatke.
Ipak, osim što smo uneli podatke, 
nismo eksplicitno izrazili tipove atributa -
stoga, nadajmo se da će
ih Orange tačno prepoznati.

Portuguese: 
Eu tenho esse conjunto de dados para meus amigos, Jill, Jack, Mark, Ann e assim por diante.
Seus nomes são todos do tipo texto (string).
O sexo não será do tipo texto (string), mas um valor categórico,
porque nosso pessoal pertencerá a um dos dois grupos, masculino ou feminino.
Meus amigos naturalmente têm diferentes alturas e pesos
que são valores numéricos.
Alguns dos meus amigos são altos, outros baixos, alguns magros e outros um pouco gordinhos.
A cor dos seus olhos e cabelos são novamente dois valores categóricos,
já que os olhos podem ser azuis, marrons ou verdes e os cabelos pretos, marrons, loiros ou ruivos.
Agora nós temos nossos dados.
Ainda assim, apesar de fornecer os dados, não especifiquei explicitamente os tipos de atributos,
então vamos esperar que o Orange os adivinhe corretamente.

Serbian: 
Sada ćemo učitati naše podatke u Orange.
Iskopirajmo podeljeni link i
nalepimo ga u 'File' operator.
Pogledajmo prvo podatke u tabeli 
('Data Table' operator).
Orange je tačno pretpostavio da prva 
kolona sa imenima sadrži meta-atribute,
ali je netačno označio boju kose
kao klasni (izlazni) atribut.
Hm. Možda je trebalo da stavimo pol 
kao poslednju kolonu u tabeli?
Ali, hajde da popravimo ovo u Orange-u.
Možemo preurediti podatke 
koristeći 'Select Columns' operator.
Stavićemo atribut za boju kose 
('hair color') u ulazne atribute,
a pol ('gender') u polje za izlazni atribut.
Još jedna brza provera u tabeli podataka 
('Data Table') i spremni smo.
Svoje podatke, možete sačuvati na 
računaru koristeći 'Save' operator.

English: 
Now we load our data in Orange.
Let's copy a shareable link and paste it into a File widget.
Let us first view the data in a data table.
Orange correctly assumed the first column with names contains our meta attributes,
but it incorrectly made the hair color our class variable.
Hmm. Maybe I should have gender as the last column in the table?
But let us fix this in Orange.
We can rearrange the data with Select Columns widget.
We'll put hair color attribute into features
and gender in target variable box.
One quick check in a data table and we're good.
You can also save the data to your computer with Save widget.

Turkish: 
Şimdi verilerimizi Turuncu olarak yüklüyoruz.
Paylaşılabilir bir bağlantıyı kopyalayalım ve bir Dosya widget'ına yapıştıralım.
Önce verileri bir veri tablosunda görüntüleyelim.
Orange, adların bulunduğu ilk sütunun meta özelliklerimizi içerdiğini doğru bir şekilde varsaydı,
ama yanlış saç rengini sınıf değişkenimiz yaptı.
Hmm. Belki de tablodaki son sütun olarak cinsiyet almalıyım?
Ama bunu Orange ile düzeltelim.
Sütunları Seç widget'iyle verileri yeniden düzenleyebiliriz.
Saç rengi özelliğini özelliklere koyacağız
ve cinsiyet hedef değişken kutusunda.
Bir veri tablosunda hızlı bir kontrol ve biz iyiyiz.
Verileri Kaydet widget'ı ile bilgisayarınıza da kaydedebilirsiniz.

Spanish: 
Ahora cargamos nuestros datos en Orange.
Copiemos un enlace que se pueda compartir y pegúelo en un widget de archivo.
Primero veamos los datos en una tabla de datos.
Orange asumió correctamente que la primera columna con nombres contiene nuestros meta atributos,
pero incorrectamente hizo que el color del cabello fuera nuestra variable de clase.
Hmm ¿Quizás debería tener género como la última columna de la tabla?
Pero arreglemos esto en Orange.
Podemos reorganizar los datos con el widget Select Columns (Seleccionar columnas).
Pondremos el atributo de color de cabello en las características
y género en el cuadro 'Target Variable' (variable objetivo).
Un chequeo rápido en una tabla de datos y estamos bien.
También puede guardar los datos en su computadora con el widget Save (Guardar).

Portuguese: 
Agora nós carregamos nossos dados no Orange.
Vamos copiar um link compartilhável e colá-lo em um widget "File" (arquivo).
Vamos primeiro ver os dados em uma "Data Table" (tabela de dados).
Orange corretamente assumiu que a primeira coluna com nomes contém nossos meta atributos,
mas isso fez com que a cor do cabelo se tornasse incorretamente nossa variável de classe.
Hmm. Talvez eu deva ter gênero como a última coluna da tabela?
Mas vamos consertar isso no Orange.
Podemos reorganizar os dados com o widget "Select Columns"(Selecionar  Colunas).
Vamos colocar o atributo cor do cabelo em características
e gênero na caixa de variável de destino.
Uma verificação rápida em uma tabela de dados e estamos bem.
Você também pode salvar os dados em seu computador com o widget "Save"(Salvar).

Turkish: 
Verileri Orange'ın yerel sekme biçiminde kaydetmek en iyisidir,
çünkü özellikler için başlık ek açıklamaları otomatik olarak ekler.
Verilerinizi yerel olarak tanımlamak isteyebilirsiniz.
Öncekiyle aynı verileri kullanacağım
sadece bu sefer onları Excel'e kopyaladım.
Özellik adlarının altına fazladan iki satır ekleyeceğim,
ilkinde değişken türünü ayarlayın,
ve ikincisinde değişken tür.
Özellik türü için, sürekli olarak C kullanacağım, 
bu sayısal özellikler,
Ayrık veya kategorik nitelikler için D ve dize değerleri için S.
Nitelik türü için cinsiyet altında sınıf yazacağım
ve bazı ek bilgiler sağlayan öznitelikler altında meta.
Şimdi verilerimiz analiz için hazırlanmıştır.

Spanish: 
Es mejor guardar los datos en el formato delimitado por tabulaciones (nativo de Orange),
ya que agrega automáticamente anotaciones de encabezado para los atributos.
Es posible que desee definir sus datos localmente.
Usaré los mismos datos que antes
solo que esta vez, los copié a Excel.
Agregaré dos filas adicionales debajo de los nombres de los atributos,
establecer el tipo de atributo en el primero,
y especie de atributo en el segundo.
Para el tipo de atributo, usaré C para continuo, 
eso es atributos numéricos,
D para atributos discretos o categóricos y S para valores de cadena.
Para la especie de atributo escribiré clase bajo género
y meta bajo los atributos que proporcionan información adicional.
Ahora nuestros datos están listos para el análisis.

English: 
It's best to save the data in Orange's native tab format,
since it automatically appends header annotations for attributes.
You might want to define your data locally.
I will use the same data as before
only this time, I copied them to Excel.
I will add two extra rows under attribute names,
set variable type in the first one,
and variable kind in the second.
For the attribute type, I will use C for continuous, 
that is numerical attributes,
D for discrete or categorical attributes and S for string values.
For the attribute kind I will write class under gender
and meta under the attributes that provide some extra information.
Now our data is all set for the analysis.

Serbian: 
Najbolje je sačuvati ih u izvornom
Orange-ovom 'tab' formatu,
jer automatski dodaje zaglavlje
za opis atributa.
Možda ipak budete želili da definišete 
svoje podatke u lokalu.
Koristićemo iste podatke kao malopre, 
samo ćemo ih ovaj put iskopirati u Excel.
Dodaćemo dodatna dva reda 
ispod naziva atributa,
definisati tip atributa u prvom redu,
i namenu atributa u drugom.
Za tip atributa, koristićemo 'C' za 
kontinualne (numeričke),
'D' za diskretne (kategoričke), a 'S' za
tekstualne vrednosti (nizove znakova).
Za namenu atributa, upisaću 'class' 
(klasni atribut) ispod pola ('gender'),
i 'meta' ispod atributa koji pružaju
neku dodatnu informaciju.
Sada su naši podaci spremni za analizu.

Portuguese: 
É melhor salvar os dados no formato de tabulação nativa da Orange,
já que ele anexa automaticamente anotações de cabeçalho para atributos.
Você pode querer definir seus dados localmente.
Eu vou usar os mesmos dados de antes
só que desta vez, eu os copiei para o Excel.
Eu adicionarei duas linhas extras em nomes de atributos,
definir o tipo de variável no primeiro,
e tipo de variável no segundo.
Para o tipo de atributo, vou usar "C" para contínuo, isto é atributos numéricos,
"D" para atributos discretos ou categóricos e "S" para valores de texto (string).
Para o tipo de atributo eu vou escrever classe abaixo de gênero
e meta sob os atributos que fornecem alguma informação extra.
Agora nossos dados estão prontos para a análise.

English: 
Today we've learned how to prepare the data, manually annotate it,
and subsequently adjust which feature is considered a class attribute.

Portuguese: 
Hoje aprendemos a preparar os dados, anotá-los manualmente
e, posteriormente, ajustar qual recurso é considerado um atributo de classe.

Spanish: 
Hoy hemos aprendido cómo preparar los datos, anotarlos manualmente,
y posteriormente ajustar qué característica se considera un atributo de clase.

Serbian: 
Danas smo naučili kako da pripremimo 
podatke, ručno ih označimo,
i, konačno, prilagodimo koji atribut se 
smatra klasnim (izlaznim) atributom.

Turkish: 
Bugün verileri nasıl hazırlayacağımızı, manuel olarak not ekleyeceğimizi,
ve daha sonra hangi özelliğin sınıf niteliği olarak kabul edileceğini ayarlayın.
