
German: 
Eine häufige Einschränkung bei biologischen Daten 
vergleicht mehrere Experimente.
Die sogenannten Batch-Effekte sind häufig 
die primäre Quelle der Variabilität
und die Expression von Einzelzellgenen ist keine Ausnahme.
In diesem Video werden wir diese Effekte veranschaulichen und geeignete Gegenmaßnahmen vorstellen.
Wir werden den Datensatz über Zellen des Immunsystems im menschlichen Knochenmark verwenden.
Die 3.000 Zellen stammen aus zwei Experimenten,
Kontroll- oder Ruhezellen,
und diejenigen, die mit Interferon behandelt wurden, um eine Immunantwort zu induzieren.
Versuchen wir zunächst, die Daten zu verstehen.
Nach dem Anwenden der Skalierung und Normalisierung
Ein t-SNE-Diagramm zeigt mehrere Zellcluster.
Wenn wir die Punkte färben, die die Zellen darstellen 
von der Versuchsquelle,

Spanish: 
Una advertencia común con cualquier dato biológico está comparando múltiples experimentos.
Los llamados efectos por lotes son a menudo 
la fuente primaria de variabilidad
y la expresión génica unicelular no es una excepción.
En este video, ilustraremos estos efectos y presentaremos contramedidas adecuadas.
Utilizaremos el conjunto de datos sobre las células del sistema inmunitario en la médula ósea humana.
Las 3.000 células provienen de dos experimentos,
células de control o en reposo,
y aquellos tratados con interferón para inducir una respuesta inmune.
Intentemos dar sentido a los datos primero.
Después de aplicar escala y normalización,
un gráfico de t-SNE revela varios grupos de células.
Si coloreamos los puntos que representan las celdas 
por la fuente del experimento,

English: 
A common caveat with any biological data 
is comparing multiple experiments.
The so-called batch effects are often 
the primary source of variability
and single-cell gene expression is no exception.
In this video, we will illustrate these effects and present suitable countermeasures.
We will use the data set on immune system cells in human bone marrow.
The 3,000 cells come from two experiments,
control or resting cells,
and those treated with interferon to induce an immune response.
Let's try to make sense of the data first.
After applying scaling and normalization,
a t-SNE plot reveals several cell clusters.
If we color the dots representing the cells 
by the experiment source,

English: 
we can see batch effects at work.
Clustering is driven primarily by the source of the experiment.
Now, because the two experiments should contain similar cell types
we can attempt to match them with data set alignment.
Data set alignment relies on canonical correlation analysis
and finds share directions in the space of the two data sets.
Let's select 23 canonical components
using the handy shared correlations plot.
After discarding experiment specific variation,
the clusters remain
But are now composed of mixtures from the two experiments.
Neat!
Let us now see what happens with the actual cell types.
We will score the cells according to the 
expression of marker genes.
a task we have explored in our previous video.

German: 
Wir können Batch-Effekte bei der Arbeit sehen.
Clustering wird hauptsächlich von der Quelle des Experiments gesteuert.
Nun, weil die beiden Experimente ähnliche Zelltypen enthalten sollten
Wir können versuchen, sie mit der Datensatzausrichtung abzugleichen.
Die Datensatzausrichtung basiert auf einer kanonischen Korrelationsanalyse
und findet gemeinsame Richtungen im Raum der beiden Datensätze.
Lassen Sie uns 23 kanonische Komponenten auswählen
Verwenden des praktischen Diagramms für gemeinsame Korrelationen.
Nach dem Verwerfen der experimentellen spezifischen Variation
Die Cluster bleiben erhalten
Sie bestehen nun aber aus Gemischen aus den beiden Experimenten.
Ordentlich!
Lassen Sie uns nun sehen, was mit den tatsächlichen Zelltypen passiert.
Wir werden die Zellen nach dem bewerten 
Expression von Markergenen.
Eine Aufgabe, die wir in unserem vorherigen Video untersucht haben.

Spanish: 
Podemos ver los efectos por lotes en el trabajo.
La agrupación es impulsada principalmente por la fuente del experimento.
Ahora, porque los dos experimentos deberían contener tipos de células similares
podemos intentar hacerlos coincidir con la alineación del conjunto de datos.
La alineación del conjunto de datos se basa en el análisis de correlación canónica
y encuentra direcciones compartidas en el espacio de los dos conjuntos de datos.
Seleccionemos 23 componentes canónicos
usando la práctica gráfica de correlaciones compartidas.
Después de descartar la variación específica del experimento,
los racimos permanecen
Pero ahora están compuestos de mezclas de los dos experimentos.
¡Ordenado!
Veamos ahora qué sucede con los tipos de células reales.
Vamos a puntuar las celdas de acuerdo con el 
expresión de genes marcadores.
una tarea que hemos explorado en nuestro video anterior.

English: 
This time, instead of entering our own list of markers,
we will use markers from an existing database.
Marker genes will help us identify different cell types in t-SNE plots
before and after batch correction.
To combine cell type scores with a batch correct data
we will merge cell scores
and display everything in a scatter plot.
Now we are able to interactively change 
the selection of marker genes
and see the effects
Let's take the dendritic cells and select all their markers.
In the original t-SNE, we can clearly see 
the dendritic cells form two clusters,
one for each data set.
In the batch corrected t-SNE, the dendritic cells correctly form a single group

Spanish: 
Esta vez, en lugar de ingresar nuestra propia lista de marcadores,
Utilizaremos marcadores de una base de datos existente.
Los genes marcadores nos ayudarán a identificar diferentes tipos de células en los gráficos de t-SNE
antes y después de la corrección de lotes.
Para combinar puntajes de tipo de celda con un lote de datos correctos
fusionaremos los puntajes de las celdas
y mostrar todo en un diagrama de dispersión.
Ahora podemos cambiar interactivamente 
la selección de genes marcadores
y ver los efectos
Tomemos las células dendríticas y seleccionemos todos sus marcadores.
En el t-SNE original, podemos ver claramente 
las células dendríticas forman dos grupos,
uno para cada conjunto de datos.
En el t-SNE corregido por lotes, las células dendríticas forman correctamente un solo grupo

German: 
Dieses Mal, anstatt unsere eigene Liste von Markern einzugeben,
Wir werden Marker aus einer vorhandenen Datenbank verwenden.
Markergene helfen uns, verschiedene Zelltypen in t-SNE-Plots zu identifizieren
vor und nach der Chargenkorrektur.
Kombinieren von Zelltyp-Scores mit chargenrichtigen Daten
Wir werden die Zellwerte zusammenführen
und alles in einem Streudiagramm anzeigen.
Jetzt können wir uns interaktiv verändern 
die Auswahl von Markergenen
und sehen Sie die Auswirkungen
Nehmen wir die dendritischen Zellen und wählen alle ihre Marker aus.
Im ursprünglichen t-SNE können wir deutlich sehen 
Die dendritischen Zellen bilden zwei Cluster.
eine für jeden Datensatz.
In der chargenkorrigierten t-SNE bilden die dendritischen Zellen korrekt eine einzelne Gruppe

English: 
We can examine remaining cell types, such as naive T cells,
or naive B-cells.
Notice that in the batch corrected data, 
the cells of the same type appear close together,
often in the same cluster.
Nice!
Dataset alignment widget can unify data coming from different data sources
and make it ready for downstream processing and analysis.

Spanish: 
Podemos examinar los tipos de células restantes, como las células T ingenuas,
o células B ingenuas.
Observe que en los datos corregidos por lotes, 
las celdas del mismo tipo aparecen muy juntas,
a menudo en el mismo grupo.
¡Agradable!
El widget de alineación del conjunto de datos puede unificar datos provenientes de diferentes fuentes de datos
y prepárelo para el procesamiento y análisis posteriores.

German: 
Wir können verbleibende Zelltypen wie naive T-Zellen untersuchen.
oder naive B-Zellen.
Beachten Sie, dass in den chargenkorrigierten Daten 
Die Zellen des gleichen Typs erscheinen nahe beieinander.
oft im selben Cluster.
Nett!
Das Dataset Alignment Widget kann Daten aus verschiedenen Datenquellen vereinheitlichen
und bereiten Sie es für die Weiterverarbeitung und Analyse vor.
