
Portuguese: 
Os dados podem ser mais ou menos complexos.
Imagine um conjunto de dados com muitas características, digamos, 100 (cem).
Como você sabe quais recursos são mais importantes?
E como você poderia projetar os dados num plano 2D?
Uma das técnicas populares para responder a esta pergunta
é a análise de componentes principais ou PCA.
O PCA transforma os dados em um novo espaço de atributos
onde as características não são correlacionadas
e classificados pelo grau de variância explicada.
Deixe-me mostrar isso, pintando alguns dados.
Embora esses dados estejam em 2D,
nós poderíamos identificar a posição de cada ponto
apenas conhecendo sua coordenada em um novo eixo inclinado.
Esse também seria nosso principal componente.

Serbian: 
Podaci mogu da budu manje 
ili više kompleksni.
Zamislite skup podataka sa mnogo 
atributa, recimo stotinu.
Kako znamo koji su atributi najvažniji
i kako potencijalno možemo projektovati 
podatke u 2-D ravan?
Jedna od popularnih tehnika koja daje 
odgovor na ovo pitanje
je Analiza glavnih komponenti - PCA 
(Principal component Analysis).
PCA transformiše podatke 
u novi prostor atributa
gde su atributi nekorelisani
i rangiraju se na osnovu procenta 
varijanse koji objašnjavaju.
Pokazaću vam ovo tako što ću naslikati 
neke podatke..
Iako su ovi podaci dvodimenzionalni,
možemo identifikovati poziciju 
svake tačke
prosto znajući njene koordinate 
na novoj označenoj osi.
Ona će ujedno biti naša 
glavna komponenta.

English: 
Data can be more or less complex.
Imagine a data set with many features, say a hundred.
How do you know which features matter the most
and how could you possibly project the data onto a 2D plane?
One of the popular techniques to answer this question
is principal component analysis or PCA in short.
PCA transforms the data into a new attribute space
where features are uncorrelated
and ranked by the degree of explained variance.
Let me show you this by painting some data.
Although this data is in 2D,
we could identify the position of each point
just by knowing its coordinate in a new tilted axis.
This would also be our principal component.

French: 
Les données peuvent être plus ou moins complexes.
Imaginez un ensemble de données avec de nombreuses fonctionnalités, disons une centaine.
Comment savez-vous quelles fonctionnalités sont les plus importantes
et comment pourriez-vous éventuellement projeter les données sur un plan 2D?
L'une des techniques populaires pour répondre à cette question
est l'analyse en composantes principales ou ACP en bref.
PCA transforme les données en un nouvel espace d'attributs
où les fonctionnalités ne sont pas corrélées
et classés selon le degré de variance expliquée.
Permettez-moi de vous montrer cela en peignant quelques données.
Bien que ces données soient en 2D,
nous pourrions identifier la position de chaque point
juste en connaissant ses coordonnées dans un nouvel axe incliné.
Ce serait également notre principale composante.

German: 
Daten können mehr oder weniger komplex sein.
Stellen Sie sich einen Datensatz mit vielen Funktionen vor, beispielsweise hundert.
Woher wissen Sie, welche Funktionen am wichtigsten sind?
Und wie könnten Sie die Daten möglicherweise auf eine 2D-Ebene projizieren?
Eine der beliebtesten Techniken zur Beantwortung dieser Frage
ist Hauptkomponentenanalyse oder kurz PCA.
PCA wandelt die Daten in einen neuen Attributraum um
wo Features nicht korreliert sind
und nach dem Grad der erklärten Varianz geordnet.
Lassen Sie mich Ihnen dies zeigen, indem Sie einige Daten malen.
Obwohl diese Daten in 2D sind,
Wir konnten die Position jedes Punktes identifizieren
nur indem man seine Koordinate in einer neuen geneigten Achse kennt.
Dies wäre auch unsere Hauptkomponente.

Portuguese: 
Sua direção é definida pelo vetor PC1.
Se nossos dados estão em um espaço de muitas dimensões,
talvez apenas alguns componentes principais sejam suficientes para explicá-lo.
Vamos ver isso em ação.
Desta vez, vou usar o conjunto de dados 'wine' com 13 características.
Um espaço tridimensional é difícil de entender
então estaremos usando o PCA para transformar os dados em menos dimensões.
Como você descobre quantos componentes principais devem ser usados?
A melhor escolha é selecionar alguns dos primeiros componentes principais
que explicam, digamos, 80% da variabilidade.
Orange mostra a proporção da variância explicada em um diagrama de seixos.
Cinco componentes principais no meu conjunto de dados
já explicam pouco mais de 80% da variabilidade.

French: 
Sa direction est définie par le vecteur PC1.
Si nos données se trouvent dans un espace multidimensionnel,
peut-être que quelques éléments principaux suffisent à l'expliquer.
Voyons cela en action.
Cette fois, je vais utiliser un ensemble de données «vin» avec 13 fonctionnalités.
Un espace en 13 dimensions est difficile à saisir
nous allons donc utiliser PCA pour transformer les données en moins de dimensions.
Comment savez-vous combien de composants principaux choisir?
Le meilleur choix est de sélectionner les premiers composants principaux
qui expliquent, disons, 80% de la variabilité.
Orange montre la proportion de la variance expliquée dans un diagramme d'éboulis.
Cinq composants principaux dans mon ensemble de données
expliquent déjà un peu plus de 80% de la variabilité.

Serbian: 
Njen smer je definisan vektorom PC1.
Ukoliko se naši podaci nalaze u 
višedimenzionom prostoru
možda bi svega nekoliko glavnih komponenti 
bilo dovoljno da ga objasni.
Hajde da to vidimo na primeru.
Ovog puta ću koristiti 'wine' -
skup podataka, sa 13 atributa.
Trinaestodimenzionalni 
prostor teško je pojmiti,
te ćemo koristiti analizu glavnih komponenti da transformišemo podatke u manje dimenzija.
Kako da znamo koliko glavnih 
komponenti da odaberemo?
Najbolji izbor je da se odabere 
prvih nekoliko
koje objašnjavaju, na primer, 
80% varijabiliteta.
Orange prikazuje procenat objašnjene 
varijanse na 'scree diagram'-u.
Prvih pet glavnih komponenti našeg 
skupa podataka
već objašnjava više od 80% varijabiliteta.

German: 
Seine Richtung wird durch den Vektor PC1 definiert.
Wenn unsere Daten in einem vieldimensionalen Raum liegen,
Vielleicht reichen nur ein paar Hauptkomponenten aus, um es zu erklären.
Lassen Sie uns dies in Aktion sehen.
Dieses Mal verwende ich einen 'Wein'-Datensatz mit 13 Funktionen.
Ein 13-dimensionaler Raum ist schwer zu erfassen
daher verwenden wir PCA, um die Daten in weniger Dimensionen umzuwandeln.
Woher wissen Sie, mit wie vielen Hauptkomponenten Sie arbeiten müssen?
Am besten wählen Sie die ersten Hauptkomponenten aus
das erklärt beispielsweise 80% der Variabilität.
Orange zeigt den Anteil der erklärten Varianz in einem Gerölldiagramm.
Fünf Hauptkomponenten in meinem Datensatz
erklären bereits etwas mehr als 80% der Variabilität.

English: 
Its direction is defined by the vector PC1.
If our data lie in a many dimensional space,
maybe only a couple of principal components are enough to explain it.
Let's see this in action.
This time, I'll be using 'wine' data set with 13 features.
A 13 dimensional space is difficult to grasp
so we'll be using PCA to transform the data into fewer dimensions.
How do you know how many principal components to go with?
The best choice is to select the first few principal components
that explain, say, 80% of variability.
Orange shows the proportion of explained variance in a scree diagram.
Five principal components in my data set
already explain slightly more than 80% of variability.

German: 
Ich kann den transformierten Datensatz in der Datentabelle überprüfen.
Nun wollen wir sehen, wie unsere transformierten Daten in einem Streudiagramm aussehen.
Ich werde die Daten nur mit den ersten beiden Komponenten zeichnen.
Die drei verschiedenen Reben sind wirklich schön getrennt.
Es stellt sich heraus, dass chemische Komponenten Flavanoide genannt werden
sind diejenigen, die die erste Komponente am meisten definieren,
gefolgt von Phenolen.
Heute haben wir gelernt, wie wir unsere Daten transformieren können
in eine Reihe von linear unkorrelierten Merkmalen
mit Hauptkomponentenanalyse.
Nächstes Mal zeigen wir Ihnen eine andere Möglichkeit, Features mit dem Rank-Widget zu bewerten.

Serbian: 
Transformisani skup podataka možemo 
proveriti u tabeli.
Hajde sada da pogledamo kako naš transformisani 
skup podataka izgleda na grafiku.
Na grafiku ćemo prikazati samo prve 
dve glavne komponente.
Tri različite vrste vina su 
relativno lepo razdvojene.
Ispostavlja se da hemijska jedinjenja - 
flavanoidi -
najviše određuju prvu 
glavnu komponentu.
Za njima slede fenoli.
Danas smo naučili kako da 
transformišemo naše podatke
u skup linearno nezavisnih atributa
koristeći analizu glavnih komponenti.
Sledeći put, atribute ćemo rangirati na 
drugi način - koristeći 'Rank' operator.

Portuguese: 
Eu posso verificar o conjunto de dados transformados na tabela de dados.
Agora vamos ver como nossos dados transformados se parecem em um gráfico de dispersão.
Vou traçar os dados usando apenas os dois primeiros componentes.
As três videiras diferentes são muito bem separadas.
Acontece que os componentes químicos chamados flavonóides
são aqueles que definem melhor o primeiro componente,
seguido por fenóis.
Hoje aprendemos a transformar nossos dados
em um conjunto de recursos lineares não correlacionados
com análise de componentes principais.
Na próxima vez, mostraremos outra maneira de classificar recursos com o widget Classificação.

English: 
I can check the transformed data set in the data table.
Now let's see how our transformed data looks like in a scatter plot.
I will plot the data using just the first two components.
The three different vines are really nicely separated.
Turns out that chemical components called flavanoids
are those that define the first component the most.
followed by phenols.
Today we've learned how to transform our data
into a set of linearly uncorrelated features
with principal component analysis.
Next time, we'll show you another way to rank features with Rank widget.

French: 
Je peux vérifier l'ensemble de données transformé dans le tableau de données.
Voyons maintenant à quoi ressemblent nos données transformées dans un nuage de points.
Je tracerai les données en utilisant uniquement les deux premiers composants.
Les trois vignes différentes sont vraiment bien séparées.
Il s'avère que les composants chimiques appelés flavanoïdes
sont ceux qui définissent le plus le premier composant.
suivi de phénols.
Aujourd'hui, nous avons appris à transformer nos données
dans un ensemble de fonctionnalités linéairement non corrélées
avec analyse en composantes principales.
La prochaine fois, nous vous montrerons une autre façon de classer les fonctionnalités avec le widget Classement.
