
English: 
One of the great things about being a
data scientist
is being able to predict the future.
Of course I'm not talking about an old lady and a crystal ball
rather predicting from solid data,
with some degree of certainty
Today I'll show you how to use Predictions widget
to predict class labels for instances in our data set.
This time I'll be using data on fruits and vegetables.
Because I will use these data to train my
classifier I will refer to it as a training data set.
We have nine features in the training set
including the calorie count, proteins, 
fiber, vitamin and mineral content.
Based on these features, we would like to predict whether a plant is a fruit or a vegetable.

Spanish: 
Una de las mejores cosas de ser un
científico de datos
es poder predecir el futuro.
Por supuesto que no estoy hablando de una anciana y una bola de cristal,
más bien prediciendo a partir de datos sólidos,
con cierto grado de certeza.
Hoy te mostraré cómo usar el widget de Predicciones
para predecir etiquetas de clase para instancias en nuestro conjunto de datos.
Esta vez usaré datos sobre frutas y verduras.
Porque usaré estos datos para entrenar a mi
clasificador Me referiré a él como un conjunto de datos de entrenamiento.
Tenemos nueve funciones en el conjunto de entrenamiento,
incluyendo el conteo de calorías, proteínas, 
contenido de fibra, vitaminas y minerales.
En base a estas características, nos gustaría predecir si una planta es una fruta o una verdura.

Portuguese: 
Uma das grandes coisas sobre ser um
cientista de dados
é ser capaz de prever o futuro.
Claro que não estou falando de uma velhinha e uma bola de cristal
e sim de prever a partir de dados robustos, com algum grau de certeza.
Hoje vou mostrar como usar o widget "Predictions"(Predições)
para prever rótulos de classe para instâncias em nosso conjunto de dados.
Desta vez eu utilizarei dados sobre frutas e legumes.
Como eu vou usar esses dados para treinar meu classificador,
vou me referir a eles como um conjunto de dados de treinamento.
Temos nove características no conjunto de treinamento
incluindo a contagem de calorias, proteínas, 
fibra, vitamina e conteúdo mineral.
Com base nessas características, gostaríamos de prever se uma planta é uma fruta ou um vegetal.
Claro que estamos interessados ​​em saber

Spanish: 
Una de las mejores cosas de ser un
científico de datos
es poder predecir el futuro.
Por supuesto que no estoy hablando de una anciana y una bola de cristal,
más bien prediciendo a partir de datos sólidos,
con cierto grado de certeza.
Hoy te mostraré cómo usar el widget de Predicciones
para predecir etiquetas de clase para instancias en nuestro conjunto de datos.
Esta vez usaré datos sobre frutas y verduras.
Porque usaré estos datos para entrenar a mi
clasificador, me referiré a él como un conjunto de datos de entrenamiento.
Tenemos nueve variables en el conjunto de entrenamiento,
incluyendo el conteo de calorías, proteínas, 
contenido de fibra, vitaminas y minerales.
En base a estas características, nos gustaría predecir si una planta es una fruta o una verdura.

French: 
L'une des grandes choses d'être un
scientifique des données
est de pouvoir prédire l'avenir.
Bien sûr, je ne parle pas d'une vieille dame et d'une boule de cristal
prédire plutôt à partir de données solides,
avec un certain degré de certitude.
Aujourd'hui, je vais vous montrer comment utiliser le widget Predictions
pour prédire les étiquettes de classe pour les instances de notre ensemble de données.
Cette fois, je vais utiliser des données sur les fruits et légumes.
Parce que je vais utiliser ces données pour former mon classificateur,
je vais y faire référence comme un ensemble de données de formation.
Nous avons neuf fonctionnalités dans l'ensemble de formation
y compris le nombre de calories, les protéines, 
teneur en fibres, vitamines et minéraux.
Sur la base de ces caractéristiques, nous aimerions prédire si une plante est un fruit ou un légume.
Bien sûr,

Serbian: 
Jedna od dobrih stvari kada je neko 
Data Scientist
je mogućnost da predvidi budućnost.
Naravno, ne mislim na staricu i kristalnu kuglu,
već na predviđanje iz podataka,
sa određenim nivoom sigurnosti.
Danas ću vam pokazati kako da 
koristite 'Predicitions' operator
kako biste predvideli klase 
instanci iz našeg skupa podataka.
Ovog puta, koristićemo podatke 
o voću i povrću.
Pošto ćemo koristiti ove podatke da obučimo klasifikator, zvaćemo ih trening skupom podataka.
U skupu podataka postoji devet atributa,
uključujući broj kalorija, proteina, 
vlakana, sadržaj vitamina i minerala.
Na osnovu ovih atributa, želimo da predvidimo
da li je posmatrana biljka voće ili povrće.

French: 
nous voulons savoir les caractéristiques qui sont les plus importantes pour notre classification.
Qu'est-ce qui nous dit le mieux si
quelque chose est un fruit ou un légume?
Nous allons vérifier cela avec la classification
Visionneuse d'arbre.
Ici, nous pouvons bien visualiser
qui présente le mieux diviser le
données à des sous-ensembles purs
où prévaut l'une des classes.
Dans notre cas, le plus
caractéristique importante est le nombre de calories
puis le contenu de la vitamine A et
protéines
ce sont donc très probablement les facteurs décisifs de nos prévisions.
Ok, maintenant il est temps de faire des prédictions.
Disons que j'ai mes propres trois plantes
pour lesquelles je voudrais savoir si ce sont des fruits ou des légumes.
Je connais leurs valeurs de potassium, de vitamines et de calories,
écrivons donc ceci dans les feuilles Google.
La seule chose à laquelle je dois faire attention
est d'utiliser les mêmes noms exacts pour les attributs de mon ensemble de données de test
afin qu'Orange puisse les faire correspondre correctement.
Maintenant, chargeons les données dans Orange 
et lisez-le dans le widget Table de données.

English: 
Of course we're interested in which
features are the most important for our classification.
What tells us best if
something is a fruit or a vegetable?
We'll check this with classification
Tree Viewer.
Here, we can nicely visualize
which features best split the
data to pure subsets
where one of the classes prevails.
In our case, the most
important feature is the calorie count
and then the content of vitamin A and
proteins
so most likely these will be the deciding factors in our predictions.
Ok, now it's time to make some predictions.
Say I have my own three plants for which I would like to know whether they're a fruit or a vegetable.
I know their potassium, vitamin and calorie values,
so let's write this down in Google sheets.
The one thing I need to be careful of, is to use the exact same names for the features in my test data set
so that Orange can match them correctly.
Now let's load the data in Orange 
and read it in the Data Table widget.

Serbian: 
Naravno, zanima nas koji atributi su 
najvažniji za našu klasifikaciju.
Šta nam najbolje govori da li je nešto
voće ili povrće?
Saznaćemo odgovor koristeći stablo odlučivanja ('Classification Tree Viewer' operator).
Njime možemo efektno da prikažemo
koji atributi najbolje razdvajaju 
skup podataka na čiste podskupove
u kojima jedna klasa preovlađuje.
U našem slučaju, najvažniji atribut
je broj kalorija ('calorie count'),
a zatim sadržaj vitamina A i proteina.
Stoga će najverovatnije to biti ključni 
faktori za naša predviđanja.
U redu.
Vreme je za predviđanja!
Recimo da imamo tri biljke za koje 
želimo da saznamo da li su voće ili povrće.
Poznate su nam njihove vrednosti kalijuma ('potassium'), vitamina ('vitamin') i kalorija ('calorie'),
te hajde da ih zapišemo u Google Sheets.
Moramo biti pažljivi da upotrebimo identične 
nazive atributa u našem test skupu podataka
kako bi ih Orange ispravno spojio.
Sada ćemo učitati podatke u Orange i 
učitati u 'Data Table' operator.

Spanish: 
Por supuesto que estamos interesados ​​en qué características son las más importantes para nuestra clasificación.
¿Qué nos dice mejor si
algo es una fruta o una verdura?
Comprobaremos esto con clasificación
Visor de árboles.
Aquí, podemos visualizar muy bien
qué características mejor dividen el
datos a subconjuntos puros
donde prevalece una de las clases.
En nuestro caso, la mayoría
característica importante es el conteo de calorías
y luego el contenido de vitamina A y
proteínas.
Lo más probable es que estos sean los factores decisivos en nuestras predicciones.
Ok, ahora es el momento de hacer algunas predicciones.
Digamos que tengo mis propias tres plantas para las cuales me gustaría saber si son una fruta o una verdura.
Sé sus valores de potasio, vitaminas y calorías,
así que escribamos esto en las hojas de Google.
De lo único que debo tener cuidado es de usar exactamente los mismos nombres para las características en mi conjunto de datos de prueba
para que Orange pueda combinarlos correctamente.
Ahora carguemos los datos en Orange 
y léelo en el widget Tabla de datos.

Portuguese: 
quais são as
características mais importantes para a nossa classificação.
O que nos diz melhor se
algo é uma fruta ou um vegetal?
Vamos verificar isso com classificação "Tree Viewer" (Visualização de árvores).
Aqui, podemos visualizar bem
quais características dividem melhor os
dados para subconjuntos puros
onde uma das classes prevalece.
No nosso caso, a característica mais importante é a contagem de calorias
e depois o teor de vitamina A e
proteínas
então, muito provavelmente, esses serão os fatores decisivos em nossas previsões.
Ok, agora é hora de fazer algumas previsões.
Digamos que eu tenha três plantas para as quais gostaria de saber se elas são uma fruta ou um vegetal.
Eu sei seus valores de potássio, vitaminas e calorias,
então vamos escrever isso nas planilhas do Google.
A única coisa que eu preciso ter cuidado,
é usar exatamente os mesmos nomes para as características no meu conjunto de dados de teste
para que o Orange possa combiná-los corretamente.
Agora vamos carregar os dados no Orange e ler-los no widget "Data Table" (Tabela de Dados).

Spanish: 
Estamos interesados ​​en qué características son las más importantes para nuestra clasificación.
¿Qué nos dice mejor si
algo es una fruta o una verdura?
Comprobaremos esto con clasificación
Visor de árboles.
Aquí podemos visualizar muy bien
que características mejor dividen el
datos a subconjuntos puros
donde prevalece una de las clases.
En nuestro caso, la mayoría
característica importante es el conteo de calorías
y luego el contenido de vitamina A y
proteínas.
Lo más probable es que estos sean los factores decisivos en nuestras predicciones.
Ok, ahora es el momento de hacer algunas predicciones.
Digamos que tengo mis propias tres plantas para las cuales me gustaría saber si son una fruta o una verdura.
Sé sus valores de potasio, vitaminas y calorías,
así que escribamos esto en las hojas de Google.
De lo único que debo tener cuidado es de usar exactamente los mismos nombres para las características en mi conjunto de datos de prueba
para que Orange pueda combinarlos correctamente.
Ahora carguemos los datos en Orange 
y léelo en el widget Tabla de datos.

English: 
Ok, all of our data is here.
Connect the File widget with Predictions.
Do we see anything yet?
Of course not.
We need to give the widget 
some classification model first.
Actually, I've already built the model from my training set with the Classification Tree widget.
Now all I need to do, is connect the Classification Tree to Predictions.
I can now view the predictions directly in the widget.
Seems like two of my plants are fruit and one is a vegetable.
Of course I can use other classifiers as well.
A fast and simple one is logistic regression.
I wonder if its predictions will be different.
Let's check.
Again, I will connect Logistic Regression widget to the File widget
and then pass the predictor to Predictions.

Portuguese: 
Ok, todos os nossos dados estão aqui.
Conecte o widget "File" (Arquivo) com "Predictions" (Previsões).
Já consegue ver alguma coisa?
Claro que não.
Precisamos fornecer ao widget 
algum modelo de classificação primeiro.
Na verdade, eu já construí o modelo do meu conjunto de treinamento
com o widget "Classification Tree" (Árvore de Classificação).
Agora tudo o que preciso fazer é conectar a Árvore de Classificação às Previsões.
Agora posso visualizar as previsões diretamente no widget.
Parece que duas das minhas plantas são frutas e uma é um vegetal.
Claro que posso usar outros classificadores também.
Um outro classificador rápido e simples é a regressão logística.
Será que suas previsões serão diferentes?
Vamos checar.
Novamente, conectarei o widget "Logistic Regression" (Regressão Logística) ao widget "File" (Arquivo)
e depois passar o preditor para "Predictions" (Previsões).

Spanish: 
Ok, todos nuestros datos están aquí.
Conecte el widget de archivo con predicciones.
¿Ya vemos algo?
Por supuesto no.
Necesitamos dar el widget 
algún modelo de clasificación primero.
En realidad, ya he construido el modelo a partir de mi conjunto de entrenamiento con el widget Árbol de clasificación.
Ahora todo lo que necesito hacer es conectar el árbol de clasificación a las predicciones.
Ahora puedo ver las predicciones directamente en el widget.
Parece que dos de mis plantas son frutas y una es vegetal.
Por supuesto, también puedo usar otros clasificadores.
Una rápida y simple es la regresión logística.
Me pregunto si sus predicciones serán diferentes.
Vamos a revisar.
Nuevamente, conectaré el widget de Regresión logística al widget de Archivo
y luego pasar el predictor a Predicciones.

Serbian: 
U redu, svi naši podaci su ovde.
Povežimo 'File' operator sa 
'Predictions'-om.
Da li se išta primećuje?
Naravno da ne.
Prvo moramo da obezbedimo
operatoru neki klasifikacioni model.
Zapravo, model smo već izgradili nad trening 
skupom podataka 'Classification Tree' operatorom.
Sve što je sada potrebno, jeste da spojimo 'Classification Tree' sa 'Predictions' operatorom.
Sada možemo videti predviđanja
direktno u operatoru.
Čini se da su dve biljke voće,
a jedna povrće.
Naravno, možemo koristiti
i druge klasifikatore.
Jedan brz i jednostavan klasifikator
je logistička regresija ('Logistic Regression').
Pitam se da li će 
predviđanja biti drugačija?
Hajde da proverimo.
Ponovo, povezaćemo 'Logistic Regression'
sa 'File' operatorom
i onda ćemo propustiti prediktor
do 'Predictions' operatora.

Spanish: 
Ok, todos nuestros datos están aquí.
Conecte el widget de archivo con predicciones.
¿Ya vemos algo?
Por supuesto no.
Necesitamos dar el widget 
algún modelo de clasificación primero.
En realidad, ya he construido el modelo a partir de mi conjunto de entrenamiento con el widget Árbol de clasificación.
Ahora todo lo que necesito hacer es conectar el árbol de clasificación a las predicciones.
Ahora puedo ver las predicciones directamente en el widget.
Parece que dos de mis plantas son frutales y una vegetal.
Por supuesto, también puedo usar otros clasificadores.
Una rápida y simple es la regresión logística.
Me pregunto si sus predicciones serán diferentes.
Vamos a revisar.
Nuevamente, conectaré el widget de Regresión logística al widget de Archivo
y luego pasar el predictor a Predicciones.

French: 
Ok, toutes nos données sont ici.
Connectez le widget File avec Predictions.
Voyons-nous encore quelque chose?
Bien sûr que non.
D'abord, nous devons donner le widget un modèle de classification.
En fait, j'ai déjà construit le modèle à partir de mon ensemble d'entraînement avec le widget Arbre de classification.
Maintenant, tout ce que je dois faire, c'est connecter l'arbre de classification aux prédictions.
Je peux maintenant voir les prédictions directement dans le widget.
On dirait que deux de mes plantes sont des fruits et une est un légume.
Bien sûr, je peux également utiliser d'autres classificateurs.
Une régression logistique est rapide et simple.
Je me demande si ses prévisions seront différentes.
Allons vérifier.
Encore une fois, je vais connecter le widget Logistic Regression au widget File
puis passez le prédicteur à Prédictions.

French: 
On dirait que la régression logistique est d'accord
avec les prévisions de l'arbre de classification.
En fait, j’ai utilisé le
données réelles pour un kiwi, des asperges et une framboise.
C'est deux fruits et un légume.
Les prévisions étaient en effet correctes.
Aujourd'hui, nous avons appris à
classer nos données avec l'arbre de classification,
comment construire des modèles de prédiction,
et, enfin, comment les utiliser sur un nouvel ensemble de données.
Bien que nous ayons fait des prédictions, nous n'avons pas vraiment évalué la qualité de ces modèles de prédiction.
Dans la vidéo à venir, nous parlerons
évaluation et notation du modèle.

Spanish: 
Parece que la regresión logística está de acuerdo
con predicciones del árbol de clasificación.
De hecho, he usado el
datos reales para un kiwi, espárragos y una frambuesa.
Eso es dos frutas y una verdura.
Las predicciones eran, de hecho, correctas.
Hoy hemos aprendido a
clasificar nuestros datos con el árbol de clasificación,
cómo construir modelos de predicción,
y, finalmente, cómo usarlos en un nuevo conjunto de datos.
Si bien hemos realizado las predicciones, no hemos evaluado realmente qué tan buenos fueron estos modelos de predicción.
En el próximo video hablaremos sobre
modelo de evaluación y puntuación.

Portuguese: 
Parece que a regressão logística concorda com previsões da Árvore de Classificação.
De fato, eu usei o
dados reais para um kiwi, espargos e uma framboesa.
Isso é duas frutas e um vegetal.
As previsões estavam, de fato, corretas.
Hoje aprendemos como
classificar nossos dados com árvore de classificação,
como construir modelos de previsão,
e, finalmente, como usá-los em um novo conjunto de dados.
Embora tenhamos feito as previsões, não avaliamos realmente quão bons eram esses modelos de previsão.
No próximo vídeo, vamos falar sobre
avaliação e pontuação do modelo.

English: 
Seems like Logistic Regression agrees
with predictions from Classification Tree.
As a matter of fact, I have used the
actual data for a kiwi, asparagus and a raspberry.
That is two fruits and a vegetable.
Predictions were, indeed, correct.
Today we've learned how to
classify our data with classification tree,
how to build prediction models,
and, finally, how to use them on a new data set.
While we have made the predictions, we have not really evaluated how good this prediction models were.
In the upcoming video we'll talk about
model evaluation and scoring.

Spanish: 
Parece que la regresión logística está de acuerdo
con predicciones del árbol de clasificación.
De hecho, he usado el
datos reales para un kiwi, espárragos y una frambuesa.
Eso es dos frutas y una verdura.
Las predicciones eran, de hecho, correctas.
Hoy hemos aprendido a
clasificar nuestros datos con el árbol de clasificación,
cómo construir modelos de predicción,
y, finalmente, cómo usarlos en un nuevo conjunto de datos.
Si bien hemos realizado las predicciones, no hemos evaluado realmente qué tan buenos fueron estos modelos de predicción.
En el próximo video hablaremos sobre
evaluación y puntuación de modelos.

Serbian: 
Izgleda da se logistička regresija slaže
u predviđanjima sa stablom odlučivanja.
Zapravo, koristili smo realne podatke za 
kivi, šparglu i malinu.
To su dve voćke i jedna povrćka.
Predviđanja su, zaista, tačna.
Danas smo naučili kako da klasifikujemo 
podatke koristeći stablo odlučivanja,
kako da gradimo prediktivne modele
i, konačno, kako da ih koristimo
na novim podacima.
Iako smo izvršili predviđanja, nismo 
izvršili evaluaciju kvaliteta dobijenih modela.
Više o tome - u sledećem klipu.
