
Italian: 
 - Ciao a tutti e benvenuti a questo video 
 nella nostra serie sulla scienza dei dati grafici. 
 In questo video, 
 impareremo gli algoritmi di centralità, 
 che sono una delle categorie tradizionali 
 di algoritmi grafici. 
 Come ho detto, vengono utilizzati algoritmi di centralità 
 per cercare di capire quali sono i nodi importanti 
 nel loro grafico. 
 E ci sono molti modi diversi 
 di importanza determinante. 
 Potrebbe essere basato sul numero di connessioni 
 come nella centralità del grado, 
 o forse è solo quale nodo è il più facilmente raggiungibile 
 all'interno di un grafico o di un sottografo. 
 O forse quello che ci interessa 
 è trovare quale nodo ha il maggior controllo 
 flusso eccessivo in un grafico. 
 O forse è l'importanza transitiva 
 di un nodo per noi importante. 
 Quindi esaminiamoli uno per uno. 
 Quindi laurea centralità, 
 Penso che questo sia probabilmente il più semplice degli algoritmi. 
 E l'idea qui è che stiamo contando il numero di persone in arrivo 
 o relazioni in uscita da un nodo, 
 e lo stiamo usando per trovare nodi popolari in un grafico. 
 E così potrebbe essere usato per trovare qualcosa di simile 
 che è l'utente Twitter più popolare. 
 Quindi forse scopriremo Katy Perry 
 ha 45 milioni di follower, 
 e questo sarebbe un modo per usare la centralità del grado 
 per capire chi sono gli utenti importanti 

English: 
- Hello everybody and
welcome to this video
in our series about graph data science.
In this video,
we're going to learn about
centrality algorithms,
which are one of the
traditional categories
of graph algorithms.
As I said, centrality algorithms are used
to try and work out what
are the important nodes
in their graph.
And there are lots of different ways
of determining importance.
It could be that it's based
on the number of connections
as in degree centrality,
or perhaps it's just which node
is the most easily reachable
within a graph or sub-graph.
Or perhaps what we're interested
in is finding which node
has the most control
over flow in a graph.
Or perhaps it's the transitive importance
of a node that's important to us.
So let's go through those one by one.
So degree centrality,
I think this is probably the
simplest of the algorithms.
And the idea here is we're
counting the number of incoming
or outgoing relationships from a node,
and we're using it to find
popular nodes in a graph.
And so that could be used
as to find something like
which is the most popular Twitter user.
So maybe we find out Katy Perry
has got 45 million followers,
and that would be a way
of using degree centrality
to work out who are the important users

English: 
on the Twitter social graph.
Or perhaps it's used
for detecting fraudsters
from legitimate users in
an online auction site.
Perhaps they're doing
way more transactions
than a normal user would.
The next one is closeness centrality.
Now here, it's a way of detecting those
that are able to spread
information efficiently
through a sub-graph.
Let's just quickly have
a look at the formula
that's used to compute this.
So what we're working
out is we want to know
what are the number of hops from each node
to every other node in the graph.
And then we're gonna sum those up,
and then we'll divide it by one.
And so what we get is what
we call the average farness
of a node web.
A far-ness of one would mean
that you can reach
every node with one hop.
So there's a direct link
from you to every node,
and then a lower number would mean
you're much further away.
So the higher numbers are better here.
And this algorithm can be used
to help maybe detect individuals
in favorable positions to
control and acquire information
in an organization.
Or it could be used maybe as a heuristic
for estimating arrival time

Italian: 
 sul grafico sociale di Twitter. 
 O forse è usato per rilevare i truffatori 
 da utenti legittimi in un sito di aste online. 
 Forse stanno facendo molte più transazioni 
 rispetto a un normale utente. 
 Il prossimo è la centralità della vicinanza. 
 Ora qui, è un modo per rilevarli 
 in grado di diffondere le informazioni in modo efficiente 
 attraverso un sottografo. 
 Diamo solo uno sguardo veloce alla formula 
 utilizzato per calcolarlo. 
 Quindi quello che stiamo lavorando è che vogliamo sapere 
 qual è il numero di salti da ogni nodo 
 a ogni altro nodo nel grafico. 
 E poi li riassumeremo, 
 e poi lo divideremo per uno. 
 E quindi ciò che otteniamo è ciò che chiamiamo la lontananza media 
 di un nodo web. 
 Significherebbe una lontananza di uno 
 che puoi raggiungere ogni nodo con un salto. 
 Quindi c'è un collegamento diretto da te a ogni nodo, 
 e quindi un numero inferiore significherebbe 
 sei molto più lontano. 
 Quindi i numeri più alti sono migliori qui. 
 E questo algoritmo può essere utilizzato 
 per aiutare forse a rilevare gli individui 
 in posizioni favorevoli al controllo e all'acquisizione di informazioni 
 in un'organizzazione. 
 Oppure potrebbe essere usato forse come euristico 
 per stimare l'orario di arrivo 

English: 
in a package delivery network.
Betweenness centrality is the
next one we're gonna look up.
And again, here, we're looking at,
it's a way of detecting
the amount of influence
that a node has over the flow
of information in a graph.
And it's often sometimes useful
for finding out which are bridge nodes,
which ones are sitting on the intersection
of lots of different sub-graphs.
If we took our Twitter example, again,
maybe there's a community
of people talking about Java
and a community of
people talking about EFJ,
and we're trying to find out
what's the person sitting
on that intersection.
And again, there's a
formula that we can use
to compute this.
And so what we're saying here
is that we wanna work out
for every pair of nodes
in the complete case,
for each pair of nodes,
find out how many shortest paths there are
between those nodes,
and then find out how
many times each node,
a specific node, fits on that path.
So we're trying to see, like,
for a particular (indistinct)
how many times are you
sitting on the shortest path
between other pairs of nodes in the graph?
Now betweenness centrality,
the complete version generally
takes very, very long to run
'cause it's gotta
compute the shortest path

Italian: 
 in una rete di consegna di pacchi. 
 La centralità di Betweenness è la prossima che cercheremo. 
 E ancora, qui, stiamo guardando, 
 è un modo per rilevare la quantità di influenza 
 che un nodo ha sul flusso di informazioni in un grafico. 
 E spesso a volte è utile 
 per scoprire quali sono i nodi bridge, 
 quali sono seduti all'incrocio 
 di molti sottografi diversi. 
 Se prendessimo di nuovo l'esempio di Twitter, 
 forse c'è una comunità di persone che parla di Java 
 e una comunità di persone che parlano di EFJ, 
 e stiamo cercando di scoprire qual è la persona seduta 
 su quell'incrocio. 
 E ancora, c'è una formula che possiamo usare 
 per calcolarlo. 
 E quindi quello che stiamo dicendo qui è che vogliamo allenarci 
 per ogni coppia di nodi nel caso completo, 
 per ogni coppia di nodi, 
 scopri quanti percorsi più brevi ci sono 
 tra quei nodi, 
 e poi scopri quante volte ogni nodo, 
 un nodo specifico, si adatta a quel percorso. 
 Quindi stiamo cercando di vedere, tipo, per un particolare (indistinto) 
 quante volte sei seduto sul sentiero più breve 
 tra altre coppie di nodi nel grafico? 
 Ora tra centralità, 
 la versione completa richiede generalmente molto, molto tempo per essere eseguita 
 perché deve calcolare il percorso più breve 

Italian: 
 tra tutte le coppie di nodi nell'intero grafico, 
 che in realtà non scala a grandi grafici. 
 E quindi di solito utilizzerai una soluzione approssimativa qui. 
 E ancora, è utile per trovare influencer, 
 e non sono necessariamente le persone 
 che sono seduti in posizioni dirigenziali. 
 Può anche essere utile per trovare i punti di trasferimento 
 in una rete, come una rete elettrica 
 o forse per i micro blog da capire 
 come possono diffondere il loro blog su Twitter 
 in altri sottografi. 
 E poi l'ultimo che vedremo 
 si chiama PageRank, 
 e questo leggermente diverso dagli altri 
 in questo tempo ci stiamo provando 
 per trovare l'influenza transitiva. 
 Non vogliamo solo conoscere la nostra influenza da soli. 
 Vogliamo sapere che siamo collegati ad altri nodi importanti? 
 E quindi questo proviene dal motore di ricerca di Google. 
 E può essere utilizzato per consigli. 
 Quindi Twitter ha una variante di questo 
 chiamato PageRank personalizzato 
 per uno dei loro sistemi di raccomandazione. 
 Oppure può essere utilizzato in, 
 viene spesso utilizzato nei sistemi di rilevamento di anomalie e frodi. 
 E ci sono un paio di varianti 
 anche di questo algoritmo. 

English: 
between all pairs of
nodes in the whole graph,
which doesn't really scale to big graphs.
And so you'll usually use an
approximate solution here.
And again, it's useful
for finding influencers,
and they're not necessarily the people
that are sitting in management positions.
It can also be useful for
finding the transfer points
in a network, such as an electrical grid
or perhaps for micro blogs to figure out
how can they spread
their blog around Twitter
into other sub-graphs.
And then the last one
that we're gonna look at
is called PageRank,
and this one slightly
different than the others
in that this time we're trying
to find the transitive influence.
We don't just wanna know
our influence on our own.
We wanna know are we connected
to other important nodes?
And so this one originates
from the Google search engine.
And it can be used for recommendations.
So Twitter have a variant of this
called Personalized PageRank
for one of their recommendation systems.
Or it can be used in,
it's often used in anomaly
and fraud detection systems.
And there are a couple of variants
of this algorithm as well.

Italian: 
 Quindi immagino che potresti considerare in realtà il PageRank come una variante 
 di centralità autovettore, 
 dove eravamo interessati alla direzione 
 delle relazioni. 
 E poi c'è un'altra variante chiamata ArticleRank, 
 che è simile 
 ma è un po 'più adatto ad alcuni casi d'uso. 
 Quindi questa è la fine di questo video sugli algoritmi di centralità. 
 E si spera che ora tu abbia una migliore comprensione 
 di come trovare i nodi importanti in un grafico. 

English: 
So I guess you could consider
actually PageRank is a variant
of eigenvector centrality,
where we were interested in the direction
of the relationships.
And then there's another
variant called ArticleRank,
which is similar
but is quite a bit better
suited to some use cases.
So that's the end of this
video on centrality algorithms.
And hopefully you've now
got a better understanding
of how to find the
important nodes in a graph.
