
English: 
Choosing which statistical test to use.
There are many different tests you can
use in statistics.
Sometimes it can be quite difficult to know which is the correct test to use.
This video will talk about seven tests you are likely to use.
involving means proportions and
relationships.
When you are trying to work out which is
the most appropriate test
there are three questions you should ask
One. What level of measurement was used for
the data we are analyzing.
2. How many samples do we have?
3. What is the purpose of our analysis?
I will now explain each of these
questions
1. Data or level of measurement
Is our data nominal or interval/ratio?
Nominal data is also called categorical,
qualitative
or nonparametric
Examples of nominal data are color
whether parts are defective or not,

Spanish: 
Cómo elegir qué prueba estadística usar.
Existen muchas pruebas diferentes
que se pueden utilizar en estadísticas.
A veces, puede ser difícil saber
cuál es la prueba correcta a utilizar.
Este video incluye siete pruebas
que es probable que utilice,
que incluyen promedios, proporciones
y relaciones.
Cuando intenta decidir
cuál es la prueba más apropiada
existen tres preguntas que debe hacerse.
1. ¿Qué nivel de medición se utilizó
para los datos que analizamos?
2. ¿Cuántas muestras tenemos?
3. ¿Cuál es el propósito del análisis?
A continuación,
explicaré cada una de estas preguntas.
1. Datos o nivel de medición.
¿Nuestros datos son nominales
o de intervalo/relación?
Los datos nominales se denominan
también categóricos, cualitativos
o no paramétricos.
Son ejemplos
de datos nominales: el color,
si las partes son defectuosas o no

English: 
or preferred type of chocolate.
Nominal summary values are usually
stated as frequencies, proportions or
percentages.
The tests that involve nominal data are:
Test for a proportion
Difference of two proportions
and chi-squared test for independence
The other type of data
is interval/ratio
also called quantitative
Examples of interval/ratio data are
daily sales figures for choconutties
weight of peanuts 
or temperature
the most common summary value for interval/ratio data is a mean.
Tests that involve interval/ratio data are: 
Test for a mean
difference of two means -  independent
samples
difference of two means - paired
and regression analysis.
For more help on levels of measurement see our  video:
"Types of data nominal, ordinal, interval/ratio"
Ordinal data can be classified with
nominal or interval/ratio 

Spanish: 
o la clase de chocolate preferido.
Los valores sumarios nominales
se suelen enunciar como frecuencias,
proporciones o porcentajes.
Las pruebas que involucran
datos nominales son:
la prueba para proporciones,
la diferencia de dos proporciones,
y la prueba de independencia X al cuadrado.
La otra clase de dato
es el intervalo/relación,
también denominada cuantitativa.
Son ejemplos de datos
de intervalo/relación:
cifras de ventas diarias
de barras de chocolate con cacahuetes,
el peso de los cacahuetes
o la temperatura.
El valor sumario más común para los datos
de intervalo/relación es un promedio.
Las pruebas que involucran
datos de intervalo/relación son:
la prueba de promedios,
la diferencia de dos promedios
(muestras independientes),
la diferencia de dos promedios
(par de muestras),
y el análisis regresivo.
Para recibir más ayuda sobre
los niveles de medición, vea el video:
"Clases de datos nominales,
ordinales, de intervalo/relación".
Los datos ordinales se clasifican
como nominal o de intervalo/ratio

Spanish: 
según las circunstancias.
2. Muestras
A continuación, preguntamos
cuántas muestras están involucradas.
¿Es una sola muestra con la que probamos
una estadística relevante
contra un valor hipotético?
¿O son dos muestras
que se comparan entre sí?
¿O es una sola muestra,
pero cada observación
tiene una medición o puntaje
para más de una variable?
La misma muestra se mide dos veces.
Si deseamos comparar una proporción
o un promedio contra un valor determinado,
esto involucrará una sola muestra.
Si comparamos dos grupos de personas
o cosas diferentes
como hombres y mujeres, o personas
de dos departamentos diferentes,
entonces tendríamos dos muestras.
Si tenemos dos conjuntos de información
sobre las mismas personas o cosas,
diríamos que tenemos una muestra
con dos variables.
Un ejemplo es un conjunto de días,
y la información sobre cuántas barras
se venden y cuál era la temperatura.
O un conjunto de personas,
y la información sobre su sexo
y clase de chocolate preferido.

English: 
depending on the circumstances.
2. Samples
Next we ask how many samples are
involved
Is there one sample for which we are  testing
the relevant statistic 
against a hypothesized value
or are there two samples
which are being compared with each other
or
is the one sample but each observation
has a measure or score
for more than one variable?
The same sample is measured twice.
If we wish to compare a proportion or
a mean against a given value,
this will involve one sample. 
If we're comparing two different lots of
people or things such as men and women
or people from two different departments
then we would have two samples.
If we have two sets of information on
the same people of things
we would say we have one sample  with two
variables.
An example is one set of days and
information on how many choconutties
are sold and what the temperature was.
Or - one set of people and information on their
gender and preferred type of chocolate.

English: 
Finally we ask
What is the purpose of the analysis?
We can be testing against the
hypothesized value
comparing two statistics
or looking for a relationship.
Chi-squared test for independence and regression are similar 
in that they are looking at the relationship between two variables
The difference between them is in the
kind of data.
If you would summarize the data in s
table,
we would use a chi-squared test fo 
independence
whereas if you would put it on a scatter
plot
you would use regression analysis.
Here iss an example for each of these
tests.
They relate back or out other videos teaching about hypothesis testing.
After each description of the scenario
pause the video
and see if you can identify the correct
test before we tell you the answer.
Helen is still selling choconutties.
Example one:
sufficient nuts.
Helen was concerned whether the quantity
of nuts was sufficient in her choconutties.

Spanish: 
Finalmente, preguntamos:
"¿Cuál es el propósito del análisis?".
Podemos probar algo
contra un valor hipotético,
comparar dos estadísticas
o buscar una relación.
La prueba de independencia X al cuadrado
y el análisis regresivo son similares
porque observan la relación
entre dos variables.
La diferencia está en la clase de datos.
Si resumiera los datos en un gráfico,
usaríamos una prueba
de independencia X al cuadrado;
pero si usara un diagrama de dispersión,
utilizaría el análisis regresivo.
Veremos ejemplos
para cada una de las pruebas.
Se relacionan con los otros videos
que enseñan la prueba hipotética.
Luego de cada descripción del escenario,
pause el video,
e intente identificar la prueba correcta
antes de que le digamos la respuesta.
Helen aún vende barras
de chocolate con cacahuetes.
Ejemplo 1
Cacahuetes suficientes
A Helen le preocupaba
si la cantidad de cacahuetes
era suficiente para sus barras
de chocolates.
Tomó una muestra de 20 paquetes,

English: 
She took a sample of twenty
packets and found the weight of nuts in
each packet
Pause the video
1. Data
The weight was interval/ratio data.
2. Samples
There was just one sample of twenty packets
of choconutties.
3. Purpose. 
Helen was comparing against given value
Thus, the test she needs to use is
Test for a mean.
Example Two
Prize tickets
In a promotional campaign twenty percent of
all packs of choconutties should
include tickets for free prizes.
Helen takes a sample of fifty packets and
finds that seven of them 
have winning tickets
Pause the video
1. Data: For each bar we are saying yes or no,
only to be lumped whether or not
 there is a ticket.
This is nominal data from which we get a
sample proportion of seven out of fifty
Or 0.14
Samples
There is one sample of fifty packets

Spanish: 
y descubrió el peso de los cacahuetes
en cada paquete.
Ponga pausa.
1. Datos
El peso era el dato de intervalo/relación.
2. Muestras
Había una sola muestra
de 20 paquetes de barras.
3. Propósito
Helen comparaba
contra el valor determinado,
entonces, la prueba que debe usar
es la prueba de promedios.
Ejemplo 2:
Billetes de premios.
En una campaña promocional,
el 20 % de los paquetes de barras
deberían incluir billetes
de premios gratuitos.
Helen toma una nuestra de 50 paquetes,
y descubre que 7 de ellos
tienen billetes ganadores.
Pause el video.
1. Datos
Para cada barra, decimos sí o no,
según haya o no un billete.
Es un dato nominal del que conseguimos
una proporción de la muestra de 7 sobre 50
o 0,14.
Muestras
Hay una sola muestra de 50 paquetes.

English: 
Purpose.
Helen is comparing the sample value
against a given value: twenty percent
We conclude that the test she needs to use is test for a proportion.
Example three
Bar longevity compared with nuttabars.
Helen thinks her choconutties last longer than the competition, nuttabars. 
She gets 36 people to eat one of each, and records their eating times.
Pause now
1. Data. Helen collects times taken in seconds
so this is interval/ratio data.
2. Samples
There is one sample of thirty-six people
but with two scores for each person
the time for the choconuttie and the time for the nuttabar.
3. Purpose
She is looking at whether there iss a
difference in the amount of time taken
for each of the bars.
Thus the test is difference of two means, paired sample.
Example four

Spanish: 
Propósito
Helen compara el valor de la muestra
contra un valor determinado, el 20 %.
Concluimos que la prueba que debe usar
es la prueba para proporciones.
Ejemplo 3:
Longevidad de la barra
comparada con la competencia.
Helen piensa que sus barras durarán más
que la competencia, las barras de nueces.
Consigue a 36 personas para que coman
una de cada una,
y registra los tiempos que lleva comerlas.
Ponga pausa.
1. Datos
Helen recolecta los tiempos
tomados en segundos
entonces esto es
un dato de intervalo/relación.
2. Muestras
Hay una sola muestra de 36 personas,
pero con dos puntajes para cada persona:
el tiempo para las barras de cacahuetes
y el tiempo para las barras de nueces.
3. Propósito
Está viendo si existe diferencia
en la cantidad de tiempo que lleva
comer cada barra.
Entonces, la prueba es la diferencia
de dos promedios (par de muestras).
Ejemplo 4:

English: 
Defective wrapping from two wrapping machines
Helen thinks there is a difference in
performance between 
the two wrapping machines in her factory.
She checks 200 bars from
one machine and 150 bars from the other.
For each bar she is seeing if the wrapping is
satisfactory or not
She finds that ten out of two hundred
bars from the first machine
and nine out of 150 bars from the second machine
are badly wrapped.
Pause the video
Data. The information for each bar is OK or not ok
This is nominal data.
It has been summarized as frequencies.
2. Samples
 there are two independent
samples 
one sample from each of the two machines
3. Purpose
Helen is comparing the proportions from
the two samples
We can see that the test is
difference of two proportions.
Example five

Spanish: 
Envoltorio defectuoso
de dos máquinas para envolver.
Helen cree que hay una diferencia
en el rendimiento
entre las dos máquinas para envolver
las barras en su fábrica.
Revisa 200 barras de una máquina
y 150 barras de la otra.
Por cada barra, revisa si el envoltorio
es satisfactorio o no.
Descubre que 10 de cada 200 barras
de la primera máquina
y 9 de cada 150 barras
de la segunda máquina
están mal envueltas.
Ponga pausa.
Datos
La información para cada barra
es "Bien" o "Mal".
Este es un dato nominal.
Se ha resumido como frecuencias.
2. Muestras
Existen dos muestras independientes,
una muestra de cada una
de las dos máquinas.
3. Propósito
Helen compara las proporciones
de las dos muestras.
Podemos ver que la prueba
es la diferencia de dos proporciones.
Ejemplo 5
¿Los stickers ayudan a las ventas?

Spanish: 
Helen explora si tener stickers gratuitos
hace la diferencia en las ventas.
Tiene las cifras de ventas durante 13 días
donde ofrecía los stickers gratuitos
y 10 días donde no los ofrecía.
Ponga pausa y decida la prueba.
Datos
Por cada día, Helen tiene
un número o valor
que corresponde a las ventas de ese día.
Este es un dato de intervalo/relación.
Se resume como un promedio
de la cifra de ventas.
2. Muestras
Hay dos muestras:
una muestra para días con stickers
y otra muestra para días sin stickers.
3. Propósito
Helen compara el promedio
de las cifras de ventas
para los dos enfoques.
Concluimos que la prueba a utilizar es:
la diferencia de dos promedios
(muestras independientes).
Ejemplo 6:
¿Las ventas se ven afectadas
por la temperatura?
Helen quiere saber si existe una relación
entre la temperatura diaria
y las ventas de barras.
Tiene los datos sobre las ventas
y la temperatura

English: 
Do stickers help sales?
Helen is exploring whether having free
stickers makes a difference to sales.
She has the sales figures for thirteen
days when she did offer free stickers
and ten days when she did not. 
Pause and decide on the test
Data. For each day Helen has a number or value
corresponding to the sales for that day
This is interval/ratio data
It is summarized as a mean member of
sales.
2. Samples
There are two samples one sample for
days with stickers 
and one sample for days without.
3. Purpose
Helen is comparing the average sales
figures for the two treatments
we conclude that the test to use is...
Difference of two means independent
samples
Example six
Are sales affected by temperature?
Helen wants to see if there is a
relationship between the daily
temperature and sales of choconutties.
She has data on sales and temperature

Spanish: 
durante 30 días de semana de ventas.
Ponga pausa.
Datos
Las ventas y la temperatura
son variables de intervalo.
Muestras
Existe una muestra de 30 días con dos
mediciones o puntajes por cada día.
Propósito
Helen está interesada en la relación
entre las ventas y la temperatura.
Esto nos lleva a decidirnos
por el análisis regresivo.
Ejemplo 7:
Los hombres, las mujeres
y la preferencia de chocolate.
Helen piensa en vender barras
de chocolate amargo, chocolate con leche
y chocolate blanco.
Cree que los hombres y las mujeres
tienen preferencias diferentes
en cuanto a la clase.
Recolecta datos de 50 clientes,
teniendo en cuenta si son hombre o mujer
y les pregunta qué variedad prefieren.
Ponga pausa y decida.
Datos
Helen registra la clase de chocolate
y el sexo de la persona.
Las dos son variables nominales.
Muestras

English: 
for thirty weekdays of sales
Pause!
Data. Sales and temperature at both interval
variables
Samples
There is one sample of thirty days with two
measures or scores for each day.
Purpose.
Helen is interested in the relationship
between sales and temperature
This leads us to decide that the test is regression.
Example seven
Men and women and chocolate preference
Helen is thinking of selling dark chocolate, milk chocolate and white chocolate
choconutties.
She thinks that men and women might have different preferences with regard to type. 
She collects data from fifty customers, noting down if they are men or women
and asking them which variety they prefer.
Pause the video and decide.
Data. Helen records the type of chocolate and sex of person.
These are both nominal variables.
Samples.

Spanish: 
Existe una sola muestra de 50 clientes,
pero con dos mediciones o variables.
Propósito
Helen quiere saber si existe una relación
entre las dos variables.
Entonces, debe usar la prueba
de independencia X al cuadrado.
Estos fueron siete ejemplos
de las siete pruebas resumidas.
Existen numerosas pruebas estadísticas,
y se podrían considerar otros elementos,
pero este resumen le ayudará a comprender
qué hacen estas siete pruebas básicas,
y qué buscar cuando decide
qué prueba utilizará.

English: 
There is one sample of fifty customers
but with two measures or variables.
Purpose.
Helen is looking at whether there is a relationship 
variables
Thus the test is chi-squared test for independence.
Those are seven examples of the seven tests
outlined here.
There are numerous other statistical
tests and other things may need to be
considered,
but this summary will help you to
understand what these seven basic tests do
and what to look for when deciding
on which test to choose.
