
English: 
By now we know that we can visualize our data and browse through data subsets,
But what else can we do with our data instances?
Perhaps put them in logical groups?
We will use the good old iris data set as in our previous videos.
We've already observed that flowers are different.
But how do we know whether they're just one single group of flowers, like one single species,
or they belong to different groups of irises?
I will show you how to discover groups
and possibly subgroups and sub subgroups
using a method called hierarchical clustering.
So how does this clustering work?
Naturally, we would like to group the flowers together
so that those with similar leaf measurements will belong to the same group.
For two flowers we can check each measurement

Portuguese: 
Agora sabemos que podemos visualizar nossos dados e navegar pelos subconjuntos de dados,
Mas o que mais podemos fazer com nossas instâncias de dados?
Talvez colocá-los em grupos lógicos?
Usaremos o bom e velho conjunto de dados da "íris" como nos vídeos anteriores.
Nós já observamos que as flores são diferentes.
Mas como sabemos se elas são apenas um único grupo de flores, como uma única espécie,
ou pertencem a diferentes grupos de íris?
Eu vou te mostrar como descobrir grupos
e possivelmente subgrupos e sub-subgrupos
usando um método chamado clustering  (agrupamento) hierárquico.
Então, como funciona esse clustering?
Naturalmente, gostaríamos de agrupar as flores juntas
de modo que aquelas com medidas de folhas semelhantes pertencerão ao mesmo grupo.
Para duas flores podemos verificar cada medida

Serbian: 
Do sada smo saznali da možemo da vizuelizujemo 
naše podatke i prolazimo kroz njihove podskupove,
ali šta još možemo učiniti sa njima?
Možda da ih svrstamo u logične grupe?
Koristićemo dobri stari 'Iris' skup podataka 
kao i u našim prethodnim klipovima.
Već smo zapazili da se 
cvetovi razlikuju međusobno,
ali kako znamo da li postoji samo jedna grupa cvetova, npr. jedna jedina vrsta,
ili oni pripadaju različitim 
vrstama (grupama) irisa?
Sada ću vam pokazati kako da
otkrijete grupe,
a potencijalno i podgrupe 
ili pod-podgrupe
koristeći metodu 
hijerarhijskog klasterovanja.
Dakle, kako ovo klasterovanje funkcioniše?
Prirodno, želimo da grupišemo cvetove
tako da se oni sa najsličnijim 
dimenzijama listova nalaze u istoj grupi.
Za svaka dva lista, možemo proveriti dimenzije

Spanish: 
Por ahora sabemos que podemos visualizar nuestros datos y navegar a través de subconjuntos de datos.
Pero, ¿qué más podemos hacer con nuestras instancias de datos?
¿Quizás ponerlos en grupos lógicos?
Utilizaremos el viejo conjunto de datos de iris como en nuestros videos anteriores.
Ya hemos observado que las flores son diferentes.
Pero, ¿cómo sabemos si son un solo grupo de flores, como una sola especie,
o pertenecen a diferentes grupos de iris?
Te mostraré cómo descubrir grupos
y posiblemente subgrupos y subsubgrupos
usando un método llamado agrupamiento jerárquico.
Entonces, ¿cómo funciona este agrupamiento?
Naturalmente, nos gustaría agrupar las flores juntas
para que aquellos con medidas de hoja similares pertenezcan al mismo grupo.
Para dos flores podemos verificar cada medida

German: 
Inzwischen wissen wir, dass wir unsere Daten visualisieren und Datenuntergruppen durchsuchen können.
Aber was können wir noch mit unseren Dateninstanzen tun?
Vielleicht in logische Gruppen einteilen?
Wir werden den guten alten Iris-Datensatz wie in unseren vorherigen Videos verwenden.
Wir haben bereits beobachtet, dass Blumen anders sind.
Aber woher wissen wir, ob es sich nur um eine einzelne Gruppe von Blumen handelt, wie eine einzelne Art?
oder gehören sie zu verschiedenen Gruppen von Iris?
Ich werde Ihnen zeigen, wie Sie Gruppen entdecken
und möglicherweise Untergruppen und Unteruntergruppen
verwenden einer Methode namens hierarchisches Clustering.
Wie funktioniert dieses Clustering?
Natürlich möchten wir die Blumen zusammenfassen
so dass diejenigen mit ähnlichen Blattmaßen zur gleichen Gruppe gehören.
Für zwei Blumen können wir jede Messung überprüfen

German: 
und berechnen Sie die Differenz zwischen den Messungen.
Quadrieren Sie es, um sicherzustellen, dass es positiv ist
und summieren Sie dann die quadratischen Differenzen über alle vier Messungen.
Am Ende können wir die Wurzel der Summe so berechnen, dass sie mit den ursprünglichen Maßeinheiten übereinstimmt.
Ha, ich habe gerade die euklidische Distanz neu erfunden.
Trotzdem können wir von hier aus sehen, dass die Ähnlichkeit umso größer ist, je kleiner der Abstand ist.
Blumen Entfernungen können jetzt verwendet werden, um hierarchische Cluster zu erstellen.
Verbinden Sie das Widget "Hierarchisches Clustering" mit dem Widget "Entfernungen".
Hierarchisches Clustering zeigt ein Dendrogramm an
dies ist ein Baum, der die Struktur der entdeckten Cluster zeigt
und der Abstand zwischen diesen Clustern.

English: 
and compute the difference between the measurements.
Square it to make sure it's positive
and then sum the square differences across all four measurements.
At the end, we can compute the root of the sum to match the original measurement units.
Ha, I've just reinvented the Euclidean distance.
Still we can see from here, that the smaller the distance is the larger the similarity.
Flower distances can now be used to construct hierarchical clustering.
Connect the Hierarchical Clustering widget with the Distances widget.
Hierarchical clustering displays a dendrogram
which is a tree that reveals the structure of the discovered clusters
and the distance between these clusters.

Portuguese: 
e calcular a diferença entre as medições.
Elevamos ao quadrado para nos certificarmos de que é positivo
e, em seguida, somamos as diferenças quadradas em todas as quatro medições.
No final, podemos calcular a raiz da soma para corresponder às unidades de medida originais.
Ha, eu acabei de reinventar a distância euclidiana.
Ainda podemos ver daqui, que quanto menor a distância, maior a semelhança.
As distâncias das flores agora podem ser usadas para construir o clustering (agrupamento) hierárquico.
Conecte o widget Hierarchical Clustering (Clustering Hierárquico) com o widget Distances (Distâncias).
O Clustering Hierárquico exibe um dendrograma
que é uma árvore que revela a estrutura dos clusters descobertos
e a distância entre esses clusters.

Spanish: 
y calcule la diferencia entre las medidas.
Ajústalo para asegurarte de que sea positivo
y luego sume las diferencias cuadradas en las cuatro medidas.
Al final, podemos calcular la raíz de la suma para que coincida con las unidades de medida originales.
Ja, acabo de reinventar la distancia euclidiana.
Aún podemos ver desde aquí, que cuanto menor es la distancia, mayor es la similitud.
Las distancias de flores ahora se pueden usar para construir agrupaciones jerárquicas.
Conecte el widget Hierarhical Clustering (agrupación jerárquica) con el widget Distances (distancias).
La agrupación jerárquica muestra un dendrograma
que es un árbol que revela la estructura de los grupos descubiertos
y la distancia entre estos grupos.

Serbian: 
i izračunati razliku među njima.
Kvadriraćemo ih da budemo sigurni 
da su pozitivne
i sabrati dobijene kvadrate 
razlika između sve četiri dimenzije.
Na kraju, možemo izračunati koren dobijenog zbira, 
kako bismo dobili izvorne jedinice merenja.
Ha! Upravo smo ponovo izumeli
Euklidsku udaljenost.
Ipak, možemo primetiti iz datog da -
što je udaljenost manja - veća je sličnost.
Udaljenost između cvetova se sada može 
upotrebiti za hijerarhijsko klasterovanje.
Povežimo 'Hierarchical Clustering' 
operator sa 'Distances' operatorom.
'Hierarchical clustering' operator
prikazuje dendrogram
koji predstavlja stablo koje otkriva 
strukturu dobijenih klastera,
kao i udaljenost između njih.

English: 
Let's make this dendrogram more telling and annotate the branches with the species of iris.
It looks like clustering indeed made sense of the data
as flowers of the same species are clustered together.
However, there's an area with some mix-up.
Let's mark it.
Selected flowers, I mean data instances,
will be on the output of Hierarchical Clustering widget.
To check these instances, we will send them to the data table.
And voilà, here they are.
Looking at this data table, I am not much smarter.
Wouldn't it be cool to see these selected flowers in some visualization
and say in the context of every other flower in our data set?
We've done this before and we'll do it again.
We will use Scatter Plot widget to visualize all 150 flowers.
Now not this visualization. I want the interesting one.

Portuguese: 
Vamos tornar esse dendograma mais revelador e anotar os ramos com as espécies da íris.
Parece que o agrupamento dos dados realmente fez sentido
e flores da mesma espécie estão agrupadas.
No entanto, há uma área com alguma confusão.
Vamos marcar isso.
Flores selecionadas, melhor dizendo, instâncias de dados,
estará na saída do widget Clustering Hierárquico.
Para verificar essas instâncias, nós as enviaremos para a tabela de dados.
E pronto! Aqui estão eles.
Olhando para essa tabela de dados, não pareço muito mais inteligente.
Não seria legal ver essas flores selecionadas em alguma visualização
e digamos, no contexto de todas as outras flores em nosso conjunto de dados?
Já fizemos isso antes e faremos de novo.
Vamos usar o widget "Scatter Plot" (Gráfico de Dispersão) para visualizar todas as 150 flores.
Não quero esta visualização. Eu quero a interessante.

German: 
Lassen Sie uns dieses Dendrogramm aussagekräftiger gestalten und die Zweige mit der Irisart versehen.
Es sieht so aus, als ob Clustering tatsächlich Sinn für die Daten gemacht hätte
als Blüten der gleichen Art sind zusammen gruppiert.
Es gibt jedoch einen Bereich mit einigen Verwechslungen.
Markieren wir es.
Ausgewählte Blumen, ich meine Dateninstanzen,
wird in der Ausgabe des Hiergetical Clustering-Widgets angezeigt.
Um diese Instanzen zu überprüfen, senden wir sie an die Datentabelle.
Und voilà, hier sind sie.
Wenn ich mir diese Datentabelle ansehe, bin ich nicht viel schlauer.
Wäre es nicht cool, diese ausgewählten Blumen in einer Visualisierung zu sehen?
und sagen im Zusammenhang mit jeder anderen Blume in unserem Datensatz?
Wir haben das schon einmal gemacht und wir werden es wieder machen.
Wir werden das Streudiagramm-Widget verwenden, um alle 150 Blumen zu visualisieren.
Nun nicht diese Visualisierung. Ich möchte das Interessante.

Serbian: 
Hajde da učinimo ovaj dendrogram informativnijim označivši grane vrstama irisa.
Čini se da je klasterovanje dalo poentu podacima,
jer su cvetovi iste vrste grupisani zajedno.
Ipak, postoji prostor preklapanja.
Hajde da ga označimo.
Odabrani cvetovi, tj. instance podataka
nalaziće se na izlazu operatora 
'Hierarchical Clustering'.
Da bismo proverili ove instance, 
prosledićemo ih do 'Data Table' operatora.
I, gle čuda, evo ih!
Posmatranje ove tabele podatka, 
ipak, ne donosi novu informaciju.
Ne bi li bilo super da 
vizuelizujemo odabrane cvetove,
npr. u kontekstu svih ostalih cvetova iz 
našeg skupa podataka?
Ovo smo već činili i uradićemo ponovo.
Koristićemo 'Scatter Plot' operator
da vizuelizujemo svih 150 cvetova.
Sada ne želimo ovaj grafik, 
već onaj interesantan.

Spanish: 
Hagamos que este dendrograma sea más revelador y anotemos las ramas con las especies de iris.
Parece que la agrupación de hecho tiene sentido de los datos
ya que las flores de la misma especie se agrupan juntas.
Sin embargo, hay un área con cierta confusión.
Vamos a marcarlo.
Flores seleccionadas, me refiero a instancias de datos,
estará en la salida del widget de agrupación jerárquica.
Para verificar estas instancias, las enviaremos a la tabla de datos.
Y voilà, aquí están.
Mirando esta tabla de datos, no soy mucho más inteligente.
¿No sería genial ver estas flores seleccionadas en alguna visualización
y a lo mejor en el contexto de cualquier otra flor en nuestro conjunto de datos?
Hemos hecho esto antes y lo haremos nuevamente.
Usaremos el widget Scatter Plot para visualizar las 150 flores.
No esta visualización. Quiero la interesante.

Spanish: 
Aquí está.
Ahora conecte el agrupamiento jerárquico al diagrama de dispersión.
La confusión es, naturalmente, en la región limítrofe entre iris virginica e iris versicolor.
Ahora podemos navegar a través de clústeres en agrupación jerárquica
y observe su mapeo en el diagrama de dispersión.
Tal como lo hicimos en el video anterior.
Es útil si tenemos ambas ventanas abiertas al mismo tiempo para observar los resultados.
Así es como Orange se convirtió en una herramienta para la exploración de conglomerados.
Hay mucho más que puedes hacer con la agrupación en combinación con otros widgets de Orange.
Pero por hoy, esto es todo.
Hemos aprendido que la agrupación jerárquica requiere información sobre las distancias en la entrada,
que muestra un dendrograma en la visualización,
y que podemos seleccionar instancias de datos en los grupos del dendograma
para enviarlos a otros widgets de Orange.

Serbian: 
Evo ga.
Sada povežimo 'Hierarchical Clustering' operator sa 'Scatter Plot'-om.
Mešanje nastaje, prirodno, u graničnom 
regionu između 'iris virginica' i 'iris versicolor'.
Sada možemo proći kroz klastere u 
'Hierarchical Clustering' operatoru
i posmatrati njihova mapiranja 
na 'Scatter Plot'-u.
Baš kao što smo uradili u
prethodnom klipu.
Od pomoći će biti da držimo oba prozora 
istovremeno otvorena, kako bismo videli rezultat.
Eto kako je Orange postao alat
za istraživanje klastera.
Možete postići još mnogo toga u klasterovanju, 
u kombinaciji sa drugim operatorima.
Ali, to je to za danas.
Naučili smo da hijerarhijsko klasterovanje 
zahteva informaciju o udaljenosti instanci,
da prikazuje dendrogram kao vizuelizaciju,
i da možemo odabrati instance u 
klasterima dendrograma
kako bismo ih prosledili 
drugim operatorima.

Portuguese: 
Aqui está.
Agora, conecte o clustering hierárquico ao gráfico de dispersão.
A confusão é, naturalmente, na região limítrofe entre a íris virginica e a íris versicolor.
Agora podemos navegar pelos clusters em Clustering Hierárquico
e observar seu mapeamento no Gráfico de Dispersão.
Assim como fizemos no vídeo anterior.
Ajuda se tivermos ambas as janelas abertas ao mesmo tempo para observar os resultados.
É assim que o Orange se tornou uma ferramenta para exploração de cluster.
Há muito mais que você pode fazer com clustering em combinação com outros widgets do Orange.
Mas por hoje, é isso.
Aprendemos que o agrupamento hierárquico requer informações sobre distâncias na entrada,
que exibe um dendrograma na visualização,
e que podemos selecionar instâncias de dados nos clusters do dendograma
para gerá-los para outros widgets do Orange.

English: 
Here it is.
Now connect Hierarchical Clustering to the Scatter Plot.
The mix-up is, naturally, in the bordering region between iris virginica and iris versicolor.
We can now browse through clusters in Hierarchical Clustering
and observe their mapping in the Scatter Plot.
Just like we did in the previous video.
It helps if we have both windows open at the same time to observe the results.
This is how Orange became a tool for cluster exploration.
There is so much more you can do with clustering in combination with other Orange widgets.
But for today, this is it.
We've learned that hierarchical clustering requires information on distances in the input,
that it displays a dendrogram in the visualization,
and that we can select data instances in the clusters of the dendogram
to output them to other Orange widgets.

German: 
Hier ist es.
Verbinden Sie nun das hierarchische Clustering mit dem Streudiagramm.
Die Verwechslung liegt natürlich im Grenzbereich zwischen Iris virginica und Iris versicolor.
Wir können jetzt Cluster in Hierarchical Clustering durchsuchen
und beobachten Sie ihre Zuordnung im Streudiagramm.
Genau wie im vorherigen Video.
Es ist hilfreich, wenn beide Fenster gleichzeitig geöffnet sind, um die Ergebnisse zu beobachten.
Auf diese Weise wurde Orange zu einem Werkzeug für die Cluster-Exploration.
Mit Clustering in Kombination mit anderen Orange-Widgets können Sie noch viel mehr tun.
Aber für heute ist es das.
Wir haben gelernt, dass hierarchisches Clustering Informationen zu Entfernungen in der Eingabe erfordert,
dass es ein Dendrogramm in der Visualisierung anzeigt,
und dass wir Dateninstanzen in den Clustern des Dendogramms auswählen können
um sie an andere Orange Widgets auszugeben.
