
Bulgarian: 
Дошло е време е за избори
и има балотаж между кандидат А
и кандидат В.
Ние сме анкетиращи.
Искаме да разберем
каква е вероятността кандидат А да спечели изборите.
В идеалния случай ще анкетираме 
цялата генерална съвкупност
от вероятни гласоподаватели ето тук.
Нека да кажем, че имаме 100 000 гласоподаватели
и искаме да попитаме всеки един за кого ще гласува.
Така бихме могли
да получим частта от генералната съвкупност,
която ще подкрепя кандидат А.
Но вероятно няма да бъде реалистично,
всъщност определено не е реалистично
да анкетираме всички 100 000 души.
Вместо това ще направим нещото,
което обикновено правим в статистиката,
т.е. ще направим извадка
и на база на нея статистически ще
оценим този параметър.
Нека да направим една извадка тук.
Това е размерът на извадката,

English: 
- [Instructor] It is election season,
and there is a runoff between candidate A
versus candidate B.
And we are pollsters.
And we're interested
in figuring out, well,
what's the likelihood that
candidate A wins this election?
Well, ideally, we would go
to the entire population
of likely voters right over here,
let's say there's 100,000 likely voters,
and we would ask every one of
the them, who do you support?
And from that,
we would be able to get
the population proportion,
which would be, this
is the proportion that
support,
support
candidate A.
But it might not be realistic.
In fact, it definitely
will not be realistic
to ask, well, all 100,000 people.
So instead, we do the thing
that we tend to do in statistics is,
is that we sample this population,
and we calculate a
statistic from that sample
in order to estimate this parameter.
So let's say we take a
sample right over here.
So this sample size,
let's say n equals 100.

Korean: 
요즘 선거철이죠
그리고 후보자 A와 후보자 B 사이에
결선 투표가 진행되고 있습니다
여러분은 여론 조사 요원들입니다
후보자 A가 이 투표에서 당선될
확률을 알아내 보고자 합니다
후보자 A가 이 투표에서 당선될
확률을 알아내 보고자 합니다
이상적으로는, 여기에 있는
전체 유권자들을
조사해봐야겠죠
여기 10만 명의 유권자들이
있다고 생각해 봅시다
그리고 누구를 지지하는지 한 명씩
모두 물어본다고 생각해 봅시다
그러면 그 결과로부터
모비율을 계산할 수 있습니다
이 모비율은 후보자 A의 지지율입니다
이 모비율은 후보자 A의 지지율입니다
이 모비율은 후보자 A의 지지율입니다
이 모비율은 후보자 A의 지지율입니다
하지만 별로
현실적인 방법은 아닙니다
사실, 10만명의 사람들을
모두 조사한다는 것은
명백히 현실적이지 않습니다
따라서 대신 통계학에서
사용하는 방법을 써 봅시다
따라서 대신 통계학에서
사용하는 방법을 써 봅시다
전체 모집단 중 일부 표본을 추출하여
추출된 표본으로부터
통계량을 계산하고
이를 이용해 후보자 A의
지지율을 계산하는 것입니다
이 표본을 추출한다고 생각해 봅시다
추출된 이 표본의 크기, n은 100입니다

Italian: 
È la stagione elettorale
e c'è un ballottaggio tra il candidato A
ed il candidato B.
E noi siamo dei sondaggisti.
E ci interessa capire
qual è la probabilità che il candidato A vinca queste elezioni?
Idealmente, andremmo dall'intera popolazione
dei potenziali votanti, qui,
diciamo che ci sono 100,000 potenziali votanti,
e chiederemmo ad ognuno di loro, "quale candidato sostieni"?
E da ciò,
saremmo in grado di ottenere la proporzione della popolazione
che sarebbe, questa è la proporzione che
sostiene
sostiene
il candidato A.
Ma potrebbe non essere possibile
Anzi, non sarà sicuramente possibile
chiedere a tutte le 100,000 persone.
Dunque, facciamo invece quello
che si fa solitamente in statistica
ovvero campioniamo questa popolazione,
e calcoliamo una statistica da quel campione
in modo da stimare questo parametro.
Quindi diciamo che prendiamo un campione proprio qui.
Con questa dimensione del campione,
diciamo che n è uguale a 100.

Bulgarian: 
нека да бъде n = 100.
Изчисляваме дела от извадката
на поддръжниците на кандидат А.
От тези 100 души, нека кажем, че 54
ще подкрепят кандидат А.
Значи дела от извадката тук е 0,54.
И за да си подскажем,
че не винаги ще получаваме 0,54,
би могло да има ситуация,
в която сме анкетирали други 100 души
и сме получили различен дял от извадката.
Например 0,58.
И в статистиката вече имаме инструментите
да анализираме 
разпределението на възможните
дялове от извадките.
Говорихме за това,
когато се занимавахме с извадкови разпределения.
Може да имаме извадковото разпределение
на дела от извадката.
Това разпределение ще бъде специфично,
спрямо размера на извадката.

Korean: 
추출된 이 표본의 크기, n은 100입니다
그런 다음 후보자 A를 지지하는
표본비율을 계산합니다
100명 중에 54명이
후보자 A를 지지한다고 가정합시다
그러면 표본비율은 0.54가 됩니다
물론 표본비율은
항상 0.54가 아닐 수도 있습니다
예를 들어 보면
아까와는 다른 100명을 추출했을 때
표본비율이 아까와 달라질 수 있죠
이것은 표본비율이
 0.58이라고 해 봅시다
통계학에는 얻을 수 있는 모든
가능한 표본비율들의 분포를
통계학에는 얻을 수 있는 모든
가능한 표본비율들의 분포를
알아보는 방법들이
이미 마련되어 있습니다
알아보는 방법들이
이미 마련되어 있습니다
표본분포를 다룰 때 이것에 대해
이미 언급한 바 있습니다
표본분포를 다룰 때 이것에 대해
이미 언급한 바 있습니다
표본비율의 표본분표입니다
표본비율의 표본분표입니다
표본비율의 표본분표입니다
표본비율의 표본분표입니다
표본비율의 표본분표입니다
이 분포는
정한 표본의 크기

Italian: 
E calcoliamo la proporzione campionaria
che sostiene il candidato A.
Quindi su 100, diciamo che 54
affermano che andranno a votare per il candidato A.
Quindi la proporziona campionaria in questo caso è 0.54.
E giusto per osservare
che non otterremo sempre 0.54,
Ci potrebbe essere stata una situazione
in cui noi avremmo campionato dei 100 diversi,
ed avremmo forse ottenuto una media campionaria diversa.
Forse in quella situazione, avremmo ottenuto 0.58.
Ed in statistica abbiamo già gli strumenti
per valutare questo,
la distribuzione delle possibili
proporzioni campionarie che potremmo ottenere.
Ne abbiamo parlato
quando abbiamo parlate delle distribuzioni campionarie.
Si potrebbe per esempio avere la distribuzione campionaria
delle proporzioni campionarie
delle proporzioni campionarie,
E questa distribuzione sarà specifica
per la dimensione del nostro campione,

English: 
And we calculate the sample proportion
that support candidate A.
So out of the 100, let's say that 54
say that they're going
to support candidate A.
So the sample proportion here is 0.54.
And just to appreciate
that we're not always going to get 0.54,
there could've been a situation
where we sampled a different 100,
and we would've maybe gotten
a different sample proportion.
Maybe in that one, we got 0.58.
And we already have
the tools in statistics
to think about this,
the distribution of the possible
sample proportions we could get.
We've talked about it
when we thought about
sampling distributions.
So you could have the
sampling distribution of
the sample proportions,
of the sample
proportions,
proportions.
And it's going, this
distribution's going to be specific
to what our sample size is,

Italian: 
per
n uguale a 100.
E potremmo dunque indicare
le possibili proporzioni campionarie che potremmo ottenere
ed i loro valori di probabilità con questa distribuzione campionaria.
Quindi facciamolo.
Otterremo una cosa del genere.
E dato che la dimensione del nostro campione
è molto inferiore rispetto a quella della popolazione,
e molto minore del 10%
possiamo assumere che ogni persona che andiamo ad intervistare
sia approssimativamente independente.
Inoltre, se facciamo l'ipotesi che la vera proporzione
non è troppo vicina né a 0 né ad 1,
allora possiamo dire che, beh, guarda
questa distribuzione campionaria sarà approssimativamente normale.
Avremo quindi una normale, questa specie di curva a forma di campana.
E sappiamo molte cosa riguardo la distribuzione campionaria
delle proporzioni campionarie.
Sappiamo già, ad esempio,
e se questo ti è estraneo, ti incoraggio a
guardare i video al riguardo su Khan Academy,
che la media di questa distribuzione campionaria
sarà la proporzione effettiva della popolazione.

Bulgarian: 
За
n равно на 100.
Можем да опишем
възможните дялове от извадката
и колко са вероятни с помощта на
това извадково разпределение.
Нека го направя.
Ще изглежда горе-долу така.
Тъй като размерът на извадката
е толкова по-малък от генералната съвкупност,
т.е. много по-малък от 10%
можем да допуснем, че всеки анкетиран човек
представлява приблизително независим опит.
Ако направим допускането, 
че действителният дял
не е твърде близо до нула или едно,
то можем да твърдим, че
това извадково разпределение ще е относително близо до нормално разпределение.
Значи ще имаме нормално разпределение, т.е. тази камбанкова крива.
Също така знаем много за извадковото разпределение
на дела от извадката.
Вече знаем например,
и ако това е чуждо за теб, те каня да
погледнеш другите видеа 
по тази тема в Кан Академия,
че средната стойност на това извадково разпределение
ще бъде действителният дял
на генералната съвкупност.

English: 
for
n is equal to 100.
And so we can describe
the possible sample
proportions we could get
and their likelihoods with
this sampling distribution.
So let me do that.
So it would look something like this.
Because our sample size
is so much smaller than the population,
it's way less than 10%,
we can assume that each
person we're asking,
that it's approximately independent.
Also, if we make the assumption
that the true proportion
isn't too close to zero
or not too close to one,
then we can say that, well, look,
this sampling distribution is
roughly going to be normal.
So we'll have a normal, this
kind of bell curve shape.
And we know a lot about
the sampling distribution
of the sample proportions.
We know already, for example,
and if this is foreign to
you, I encourage you to
watch the videos on this on Khan Academy,
that the mean of this
sampling distribution
is going to be the actual
population proportion.

Korean: 
즉
n = 100인 경우에 대한 것입니다
그리고 얻을 수 있는 표본비율들과
그리고 얻을 수 있는 표본비율들과
이 표본분포에 대한 그것들의
확률을 설명할 수 있습니다
한 번 설명해 보도록 하겠습니다
일단 이렇게 나타내 봅시다
이 표본의 크기는 모집단의 
크기보다 훨씬 작습니다
이 표본의 크기는 모집단의 
크기보다 훨씬 작습니다
모집단 크기의 10%도 채 되지 않죠
따라서 조사하는 사람 각각은
모두 서로 독립적입니다
따라서 조사하는 사람 각각은
모두 서로 독립적입니다
또한 실제 비율이
너무 0이나 1에
가깝지 않다고 가정하면
다음과 같이 말할 수 있습니다
이 표본분포는 대략적으로
정규분포를 따른다고요
그러므로 이와 같이 종 모양으로 생긴
 정규 분포 곡선을 그릴 수 있습니다
표본비율의 표본분포에 대해
많은 것을 알 수 있습니다
표본비율의 표본분포에 대해
많은 것을 알 수 있습니다
만약 잘 모르겠다면
칸아카데미의 동영상들을
볼 것을 추천드립니다
칸아카데미의 동영상들을
볼 것을 추천드립니다
이 표본분포의 평균이
실제 모비율이 된다는 것을
알고 있습니다

Korean: 
또한 표본분포의 표준편차가
어떻게 되는지도 알고 있죠
자
이 값이 표준편차라고 해 봅시다
여기가 표준편차 두 배
여기가 평균에서
표준편차 3배 위이고
표준편차에 -1, -2, -3을 곱한 값은
각각 이렇게 되죠
따라서 이 거리
여기 있는 이 표준편차는
표본비율들로 이루어진
표본분포의 표준편차로
이렇게 나타냅니다
이미 이 공식을 알고 있죠
이것은 p 값에
1-p를 곱하고
참고로 p는 모비율입니다
그런 다음 표본 크기로 
나눈 값의 제곱근입니다
그래서 이렇게  n = 100이라고
명시한 것입니다
첫 번째 경우
이 경우에 대해서만 생각해 봅시다
n = 100인 표본을 추출했을 때
그리고 0.54의 표본비율을 얻었을 때
여기는 수많은 결과가
있을 수 있습니다

Bulgarian: 
Също така знаем какво ще бъде стандартното отклонение
в този случай.
Е,
нека демонстрирам. Примерно това ще едно стандартно отклонение.
Това ще са две стандартни отклонения.
Това ще са три стандартни отклонения.
Това ще е едно стандартно отклонение,
 две стандартни отклонения,
три стандартни отклонения 
под средната стойност.
Това разстояние – 
нека го покажа в друг цвят –
това стандартно отклонение тук,
което обозначаваме като стандартното отклонение
на частта от извадката за това извадково разпределение,
ще намерим с формулата, която видяхме и по-рано.
То ще бъде равно на корен квадратен от р
умножено по едно минус р,
където р е частта от генералната съвкупност,
цялото върху размера на извадката.
Ето защо е специфично за n равно на 100.
И в този първи сценарии,
нека се фокусираме върху този тук,
когато направим извадка с размер n равно на 100
и получим дял от извадката 0,54,
тук може да получим много 
различни резултати.

English: 
And we also know what
the standard deviation
of this is going to be.
So,
let me, maybe that's
one standard deviation.
This is two standard deviations.
That's three standard
deviations above the mean.
That's one standard deviation,
two standard deviations,
three standard deviations below the mean.
So this distance, let me do
this in a different color,
this standard deviation right over here,
which we denote as the
standard deviation of
the sample proportions, for
this sampling distribution,
this is, we've already
seen the formula there.
It's the square root of p
times one minus p,
where p is, once again,
our population proportion
divided by our sample size.
That's why it's specific
for n equals 100 here.
And so in this first scenario,
let's just focus on this
one right over here,
when we took a sample size of n equals 100
and we got the sample proportion of 0.54,
we could've gotten all
sorts of outcomes here.

Italian: 
E sappiamo anche quale sarà la deviazione standard
Dunque,
diciamo che questa è una deviazione standard.
Questa è due deviazioni standard.
Questa è tre deviazioni standard, al di sopra sopra la media.
Questa è una deviazione standard, due deviazione standard,
tre deviazioni standard, al di sotto della media.
Quindi questa distanza, facciamola in un colore diverso
questa deviazione standard qui,
che indichiamo col nome di deviazione standard
delle proporzioni campionarie, per questa distribuzione campionaria,
questa è, ne abbiamo già visto la formula:
è la radice quadrata di p
per 1 meno p,
dove p è, ancora una volta, la nostra proporzione di popolazione
diviso per la nostra dimensione del campione.
Ecco perché è specifica per n uguale a 100 qui.
Perciò in questo primo scenario,
concentriamoci solo su questo qui,
quando abbiamo preso una dimensione del campione di n uguale a 100
ed abbiamo ottenuto la proporzione campionaria di 0.54,
avremmo potuto avere qualsiasi tipo di risultato qui.

Bulgarian: 
Може би тук е 0,54.
Причината да работя с тази несигурност е,
че всъщност нямам представа какъв е истинският
параметър на генералната съвкупност,
какъв е действителният дял от 
генералната съвкупност.
Но нека ти задам
малко по-лесен въпрос.
Каква е вероятността
частта от извадката 0,54
да е между
два пъти две стандартни отклонения
от р?
Спри видеото и помисли за това.
Е, това е същото като да кажа, че
 ако направя извадка
и пресметна частта от извадката ето тук,
каква ще бъде вероятността 
резултатът ми да бъде в рамките на
две стандартни отклонения 
от средната стойност?
Е, това на практика ще бъде
ето тази площ тук.
И ние знаем от изучаваните нормални криви,

English: 
Maybe 0.54 is right over here.
Maybe 0.54 is right over here.
And the reason why I
had this uncertainty is
we actually don't know what the real
population parameter is,
what the real population proportion is.
But let me ask you maybe a
slightly easier question.
What is,
what
is
the probability,
probability
that
our sample proportion of 0.54
is within,
is within two times
two standard deviations
of p?
Pause the video, and think about that.
Well, that's just saying, look,
if I'm gonna take a sample
and calculate the sample
proportion right over here,
what's the probability that I'm within
two standard deviations of the mean?
Well, that's essentially going to be
this area right over here.
And we know, from studying normal curves,

Italian: 
Forse 0.54 è qui.
Forse 0.54 è qui.
E il motivo per cui ho avuto questa incertezza è
che di fatto non sappiamo quale sia il vero
parametro della popolazione,
qual è la proporzione effettiva della popolazione.
Ma lascia che ti chieda una domanda forse leggermente più semplice:
Qual è,
quale
è
la probabilità,
probabilità
che
la nostra proporzione campionaria di 0.54
sia all'interno,
sia all'interno di due volte la deviazione standard
di p?
Metti in pausa il video e pensaci.
Beh, questo equivale a dire, se prendo un campione
e calcolo la proporzione campionaria qui,
qual è la probabilità che io mi trovi entro
due deviazioni standard della media?
Beh, questa probabilità sarà essenzialmente
quest'area qui.
E sappiamo dallo studio delle curve normali,

Korean: 
0.54가 이쯤에 있을 수도 있고
이쯤에 있을 수도 있습니다
이것을 확실하게 말할 수 없는 이유는
실제 모수인 모비율을
정확히 알 수 없기 때문입니다
실제 모수인 모비율을
정확히 알 수 없기 때문입니다
실제 모수인 모비율을
정확히 알 수 없기 때문입니다
좀 더 쉬운 질문을 해 보죠
0.54라는 표본비율이
0.54라는 표본비율이
0.54라는 표본비율이
0.54라는 표본비율이
0.54라는 표본비율이
0.54라는 표본비율이
0.54라는 표본비율이
p 위 아래로 표준편차
두 배 내에 있을 확률은 어떻게 될까요?
p 위 아래로 표준편차
두 배 내에 있을 확률은 어떻게 될까요?
p 위 아래로 표준편차
두 배 내에 있을 확률은 어떻게 될까요?
잠깐 동영상을 멈추고 생각해 보세요
이 표본집단을 추출해서
여기 있는 표본비율을 계산한다고 하면
그 표본비율이 평균에 대해서
표준편차 두 배 내에
위치할 확률은 어떻게 될까요?
그것은 바로
여기의 면적과 같겠죠
그리고 여러분은 정규분포 곡선을
이미 배웠기 때문에

Korean: 
약 95%의 면적이
표준편차에 두 배 내에
위치한다는 것을 알고 있습니다
따라서 이 확률은
대략 95%가 될 것입니다
크기가 100인 표본 집단을 추출해서
표본비율을 계산하면
95%의 경우에
그 표본비율은 표준편차
두 배 내에 위치하겠죠
그런데 이 문장을 한 번 봅시다
이 문장을 가지고
더 추론적인 문장을 만들 수 있습니다
더 추론적인 문장을 만들 수 있습니다
다음과 같이 말할 수 있습니다
모비율 p가
모비율 p가
모비율 p가
모비율 p가
표본비율에서 표준편차에 두 배 내에  
위치할 확률이 95%이라고요
표본비율에서 표준편차에 두 배 내에  
위치할 확률이 95%이라고요
표본비율에서 표준편차에 두 배 내에  
위치할 확률이 95%이라고요
표본비율에서 표준편차에 두 배 내에  
위치할 확률이 95%이라고요
표본비율에서 표준편차에 두 배 내에  
위치할 확률이 95%이라고요
동영상을 잠깐 멈추고
이 두 문장이 같은 의미인지
생각해 보세요

English: 
that approximately 95% of the area
is within two standard deviations.
So this is approximately 95%.
95% of the time that I
take a sample size of 100
and I calculate this sample proportion,
95% of the time,
I'm going to be within
two standard deviations.
But if you take this statement,
you can actually construct
another statement
that starts to feel a little bit more,
I guess we could say inferential.
We could say there,
there is
a 95%
probability
that
the population proportion p is
within,
within two standard deviations,
two standard deviations of p-hat,
which is equal to 0.54.
Pause this video.
Appreciate that these two
are equivalent statements.

Italian: 
che circa il 95% dell'area
è entro due deviazioni standard.
Quindi questo è all'incirca il 95%.
Il 95% delle volte che prendo un campione di dimensione 100
e calcolo la proporzione campionaria,
il 95% delle volte,
Sarò entro due deviazioni standard.
Ma se si prende questa affermazione,
si può di fatto elaborare un'altra affermazione
che inizia ad essere un po' più,
potremmo dire "inferenziale".
Potremmo dire:
C'è
una probabilità del 95%
che
la proporzione della popolazione p sia
entro
entro due deviazioni standard
entro due deviazioni standard da p cappuccio,
che è uguale a 0.54
Metti in pausa il video.
E note che queste due affermazioni sono equivalenti.

Bulgarian: 
че приблизително 95% от цялата площ
е в рамките на две стандартни отклонения.
Значи това е приблизително 95%.
95% от случаите, когато направя извадка с размер 100
и изчисля частта от извадката,
ще получа резултат,
който е в рамките на 
2 стандартни отклонения.
Но ако използваме това твърдение,
можем да си изведем ново твърдение,
което ще бъде следствие на първото.
Можем да кажем, че:
Има
95% шанс
частта от генералната съвкупност р
да бъде в рамките
на две стандартни отклонения от р с шапка,
(р с диакритичен знак)
което е равно на 0,54.
Сега си спри видеото.
Опитай се да осмислиш тези две еквивалентни твърдения.

English: 
If there's a 95% chance
that our sample proportion
is within two standard deviations
of the true proportion,
well, that's equivalent to
saying that there's a 95% chance
that our true proportion is
within two standard deviations
of our sample proportion.
And this is really, really interesting
because if we were able to
figure out what this value is,
well, then we would be able to create
what you could call a confidence interval.
Now, you immediately might
be seeing a problem here.
In order to calculate this,
our standard deviation
of this distribution,
we have to know our population parameter.
So pause this video,
and think about what we would do instead.
If we don't know what p is here,
if we don't know our
population proportion,
do we have something that
we could use as an estimate
for our population proportion?
Well, yes, we calculated p-hat already.
We calculated our sample proportion.
And so a new statistic
that we could define
is the standard error,

Korean: 
구한 표본비율이 실제 비율에서
표준편차 두 배 내에 있을
확률이 95%라는 것은
실제 비율이 구한 표본비율에서
표준편차 두 배 내에 있을
확률이 95%라는 것과 같은 말입니다
표준편차 두 배 내에 있을
확률이 95%라는 것과 같은 말입니다
그리고 이것은 참으로
흥미로운 사실입니다
이 값이 무엇인지
알아낼 수 있기만 하다면
신뢰구간을 알아내는 것이
가능하기 때문입니다
여기에서 한 가지 문제가 발생합니다
여기 있는
이 분포의 표준편차를 계산하려면
이 모수를 알야아 합니다
동영상을 잠깐 멈춘 후
어떻게 해야할지 생각해 보세요
이 p 값이 무엇인지 모른다면
즉 모비율을 모른다면
p 대신 사용할
추정치가 존재할까요?
있습니다
이미 이것, 표본비율을 계산했습니다
있습니다
이미 이것, 표본비율을 계산했습니다
그러면 표준오차라는
새로운 통계량을 정의해 봅시다
그러면 표준오차라는
새로운 통계량을 정의해 봅시다

Italian: 
Se c'è una probabilità del 95% che la nostra proporzione campionaria
sia entro due deviazioni standard dalla proporzione effettiva,
beh, questo equivale a dire che c'è una probabilità del 95%
che la nostra proporzione effettiva sia entro due deviazioni standard
dalla nostra proposizione campionaria.
E questo è davvero, davvero interessante
perché se fossimo in grado di trovare questo valore
allora saremmo in grado di creare
quello che viene chiamato un "intervallo di confidenza".
Ora potresti immediatamente vedere un problema qui.
Per poter calcolare questo,
la nostra deviazione standard di questa distribuzione,
dobbiamo conoscere il parametro della popolazione.
Quindi metti in pausa questo video
e pensa a cosa potremmo fare in alternativa.
Se non conosciamo il valore di p qui,
se non conosciamo la proporzione della popolazione
abbiamo qualcosa che potremmo usare come stima
per la nostra proporzione della popolazione?
Ebbene sì, abbiamo già calcolato p cappuccio.
Abbiamo calcolato la nostra proporzione campionaria.
E dunque una nuova statistica che potremmo definire
è l'errore standard,

Bulgarian: 
Ако има 95% шанс частта от извадката
да бъде в рамките на две стандартни
 отклонения от действителната част,
то това е същото като да кажем, че има 95% шанс
действителният дял да е в рамките 
на две стандартни отклонения
от дела на извадката.
И това е много, много интересно,
защото ако можем да намерим тази стойност,
то ще можем да създадем
това, което наричаме доверителен интервал.
Сега, веднага можеш да забележиш проблем тук.
За да изчислим тази стойност,
стандартното отклонение на това разпределение,
ще трябва да знаем параметъра на генералната съвкупност.
Сега спри видеото
и помисли какво можем да направим вместо това.
Ако не знаем на колко е равно р тук,
ако не знаем дела от генералната съвкупност,
имаме ли нещо, което можем да използваме като приближение
на дела от генералната съвкупност?
Ами, да, имаме – вече изчислихме р-къщичка.
Изчислихме дела от извадката.
Сега можем да определим друга статистическа величина –
стандартната грешка

Korean: 
표본비율의 표준오차이죠
이 값을 다음과 같이
나타낼 수 있습니다
모비율을 모르기 때문에
표본비율을 사용합니다
표본비율에 
1- 표본비율의 값을 곱한 후
그 값을 n으로 나눕니다
이 경우에는 n이 100이죠
이 경우에는 n이 100이죠
따라서
이 영상에서 증명하지는 않겠지만
이것은 불편추정량입니다
바로 여기에 대해서 말이죠
따라서 이 값은 0.54에
1 -  0.54를 곱한 후
그러니까 0.46을 곱하고
그런 다음 그 값을 100으로 나눕니다
그러면 0.54에
0.46을 곱한 후
100으로 나누고
괄호를 닫고 제곱근을 취해 봅시다
소수 셋째 자리에서
반올림하여 나타내보면
사실 넷째 자리에서
반올림하여도
계산 결과는 약 0.05가 됩니다
따라서 이 값은

Italian: 
l'errore standard delle nostre proporzioni campionarie.
E possiamo definirlo come uguale,
dato che non conosciamo la proporzione della popolazione,
useremo la proporzione campionaria,
p cappuccio moltiplicato per (1 meno p cappuccio)
tutto diviso per n.
In questo caso, chiaramente, n è uguale a 100.
Lo sappiamo.
Ed in effetti viene fuori che,
non lo dimostrerò in questo video,
che è effettivamente uno stimatore non distorto
per questo qui.
Quindi questo sarà uguale a 0.54
per (1 meno 0.54)
quindi è 0.46,
tutto diviso per 100.
Quindi abbiamo la radice quadrata di .54
per .46
diviso per 100,
chiudo le mie parentesi, premo invio.
Dunque, se approssimo al centinaio più vicino
a dire il vero, persino se arrotondo al millesimo più vicino
sarà circa 500.
Quindi questo sarà circa,

Bulgarian: 
или по-точно стандартната грешка на дела от извадката.
Можем да я дефинираме
и понеже не знаем дела от
генералната съвкупност,
ще използваме дела от извадката,
р-чавка, умножено по едно минус р-чавка,
цялото върху n.
в този случай, разбира се, n е равно на 100.
Това го знаем.
Оказва се,
и няма да го доказвам в това видео,
че това всъщност е неизместена оценка
за това тук.
Резултатът ще бъде равен на 0,54
умножено по едно минус 0,54,
значи 0,46,
цялото върху 100.
Имаме корен квадратен от 0,54
по 0,46
делено на 100,
затварям скобата, ентър.
Ако закръгля до стотните, ще се получи...
Всъщност дори ще закръгля до хилядните
и ще получа приблизително 5/100.
Това ще бъде,

English: 
the standard error of
our sample proportions.
And we can define that as being equal to,
since we don't know the
population proportion,
we're going to use the sample proportion,
p-hat times one minus p-hat,
all of that over n.
In this case, of course, n is 100.
We do know that.
And it actually turns out,
I'm not going to prove it in this video,
that this actually is
an unbiased estimator
for this right over here.
So this is going to be equal to 0.54
times one minus 0.54,
so it's 0.46,
all of that over 100.
So we have the square root of .54
times .46
divided by 100,
close my parentheses, Enter.
So if I round to the nearest
hundredth, it's going to be,
actually, even if I round
to the nearest thousandth,
it's going to be approximately 5/100.
So this is going to be,

Italian: 
sarà circa 0.05.
Quindi un altro modo per dire tutte queste cose è,
che noi non conosciamo esattamente questo
ma ora ne abbiamo una stima.
Quindi potremmo ora affermare con un
95%
di confidenza, e questo verrà spesso chiamato
il nostro livello di confidenza
con un 95% di confidenza tra,
tra,
e dunque noi vorremmo andare due deviazioni standard
sotto la nostra proporzione campionaria
che abbiamo appena calcolato.
Che sarebbe 0.54 meno due volte 5/100.
Che sarebbe 0,54 meno 10/100.
Che sarebbe 0.44.
E vorremmo anche andare due errori standard
sopra la proporzione campionaria.
Che sarebbe quella meno 10/100.
E lo 0.64
dei votanti,
dei

Bulgarian: 
това ще бъде приблизително 0,05.
Друг начин да кажем цялото това тук е,
че не знаем точната стойност тук,
но имаме нейно приближение.
И сега можем да кажем с
95% увереност, а това ще бъде
нашият доверителен интервал ето тук.
С 95% увереност между...
И искаме да отидем на две стандартни грешки
надолу от частта от извадката,
която сме изчислили.
Това ще бъде 0,54 минус два пъти 0,05,
което е 0,44.
Също така искаме да отидем на две стандартни грешки
над частта от извадката.
Това ще е тази стойност плюс 0,10
плюс 0,54.
И 0,64

English: 
this is approximately 0.05.
So another way to say all
of these things is, instead,
we don't know exactly this,
but now we have an estimate for it.
So we could now say with
95%
confidence, and that will often be known
as our confidence level right over here,
with 95% confidence between,
between,
and so we'd want to go two standard errors
below our sample proportion
that we just happened to calculate.
So that would be 0.54
minus two times 5/100.
So that would be 0.54 minus 10/100,
which would be 0.44.
And we'd also want to
go two standard errors
above the sample proportion.
So that would be that plus 10/100.
And 0.64
of voters,
of

Korean: 
약 0.05입니다
지금까지의 내용을 종합해보면
이 값은 정확히 알 수 없지만
그 대신 사용할 추정치는
계산할 수 있습니다
따라서 이제
95%의 신뢰도로
95% 유의수준이라고도 하는데
95% 유의수준이라고도 하는데
이 95% 유의수준으로
이 95% 유의수준으로
방금 계산한 표본비율에서
표준오차 두 배 내려가야 하니까
방금 계산한 표본비율에서
표준오차 두 배 내려가야 하니까
방금 계산한 표본비율에서
표준오차 두 배 내려가야 하니까
0.54 - 2 x 0.05를 해보면
0.54 - 2 x 0.05를 해보면
0.44가 되겠죠
그리고 표본비율에서 
표준오차 두 배 올라가면
그리고 표본비율에서 
표준오차 두 배 올라가면
표본비율에 0.1을 더한 것과 같으므로
0.64가 되죠
그러면 95%의 확률로 0.44에서 0.64의
 모집단이 후보자 A를 지지합니다
그러면 95%의 확률로 0.44에서 0.64의
 모집단이 후보자 A를 지지합니다

Italian: 
votanti
sostiente,
sostiente
A,
E così questo intervallo che abbiamo qui,
da 0.44
a 0.64,
questo sarà noto come il nostro intervallo di confidenza,
intervallo di confidenza.
E questo cambierà,
non solo nel punto di partenza e nel punto finale,
ma cambierà nell'intera lunghezza
del nostro intervallo di confidenza,
cambierà in base a
a quale proporzione campionaria abbiamo scelto
per quel campione di 100.
Un'idea correlata all'intervallo di confidenza
è quella del margine di errore,
margine
di errore.
E per questo particolare caso,
per questo particolare campione,
il nostro margine di errore,
dato che siamo interessati al 95% di confidenza,
allora sarebbe due errori standard.
Quindi il nostro margine di errore qui è due volte il nostro errore standard,
che sarebbe 0.1 o 0.10.
E così abbiamo un margine di errore

Bulgarian: 
от избирателите
подкрепят
кандидат А.
Този интервал тук,
от 0,44 до 0,64
ще бъде нашият доверителен интервал.
Доверителен
интервал.
И това ще се променя
и то не само началната и крайната точка,
но също така и дължината на
доверителния интервал,
ще се променя в зависимост от това
каква част от извадката сме получили
за тази извадка от 100 анкетирани.
Сродна на доверителния интервал концепция
ще бъде допустимата грешка.
За този конкретен случай,
за тази конкретна извадка
допустимата грешка,
тъй като ни интересува 95% увереност,
ще бъде две стандартни грешки.
Значи допустимата грешка тук е два пъти стандартната грешка,
т.е. ще бъде 0,1.
Значи ще отидем една допустима грешка

English: 
voters
support,
support
A.
And so this interval that
we have right over here,
from 0.44
to 0.64,
this will be known as
our confidence interval,
confidence
interval.
And this will change,
not just in the starting
point and the end point,
but it will change the actual length
of our confidence interval,
will change depending on
what sample proportion we happened to pick
for that sample of 100.
A related idea to the confidence interval
is this notion of margin of error,
margin
of error.
And for this particular case,
for this particular sample,
our margin of error,
because we care about 95% confidence,
so that would be two standard errors.
So our margin of error here is
two times our standard error,
would just be 0.1 or 0.10.
And so we're going one margin of error

Korean: 
그러면 95%의 확률로 0.44에서 0.64의
 모집단이 후보자 A를 지지합니다
그러면 95%의 확률로 0.44에서 0.64의
 모집단이 후보자 A를 지지합니다
그러면 95%의 확률로 0.44에서 0.64의
 모집단이 후보자 A를 지지합니다
그러면 95%의 확률로 0.44에서 0.64의
 모집단이 후보자 A를 지지합니다
그래서 바로 이 구간
0.44에서
0.64까지의 구간
이 구간이 신뢰구간이 됩니다
이 구간이 신뢰구간이 됩니다
이 구간이 신뢰구간이 됩니다
그리고 이 구간은 변할 수 있습니다
시작 지점과 끝 지점 뿐만 아니라
신뢰구간의 길이 또한
변할 수 있습니다
100명의 표본 중에서
표본 비율이 얼마인지에 따라서
달라집니다
표본 비율이 얼마인지에 따라서
달라집니다
신뢰구간과 관련된 또다른 개념은
오차범위입니다
오차범위입니다
오차범위입니다
이 경우에는
이 표본에 대해서는
오차범위를 계산해 보면
95% 유의수준을 생각해 보면
표준오차의 두 배입니다
그러므로 이 경우 오차 범위는
표준오차에 2를 곱한 값입니다
이 값은 0.1 또는 0.10입니다
따라서 신뢰구간은 표본비율에서

Bulgarian: 
над частта от извадката ето тук
и една допустима грешка
под частта от извадката ето тук,
за да дефинираме доверителния интервал.
И както споменах, тази допустима грешка няма да е
една и съща всеки път като правим извадка.
В зависимост от частта от извадката
ще се определи и допустимата грешка,
защото тя се изчислява основно
чрез стандартната грешка.
Друга интерпретация на това е,
че когато методът, който използвахме,
за да получим този интервал,
този доверителен интервал,
го използваме още веднъж и още веднъж и т.н.
ще ни даде интервали,
които няма да бъдат еднакви.
Ще зависи от частта от извадката,
но ще създава интервали,
които включват в себе си действителния дял,
който в повечето случаи не знаем.
Ще включва действителния дял 
в 95% от случаите.
Ще поработим върху логиката 
зад това в бъдещи видеа.
Ще видим как интервалът се променя,
как допустимата грешка се променя.

English: 
above our sample
proportion right over here
and one margin of error
below our sample
proportion right over here
to define our confidence interval.
And as I mentioned, this
margin of error is not going
to be fixed every time we take a sample.
Depending on what our
sample proportion is,
it's going to affect our margin of error
because that is calculated, essentially,
with the standard error.
Another interpretation of this is
that the method that we used
to get this interval right over here,
the method that we used
to get this confidence,
to get this confidence interval,
when we use it over and over,
it will produce intervals,
and the intervals won't
always be the same.
It's gonna be dependent
on our sample proportion,
but it will produce intervals
which include the true proportion,
which we might not know
and often don't know.
It'll include the true
proportion 95% of the time.
I'll cover that intuition
more in future videos.
We'll see how the interval changes,
how the margin of error changes.

Italian: 
sopra la nostra proporzione campionaria qui
ed un margine di errore
sotto la nostra proporzione campionaria qui
per definire il nostro intervallo di confidenza.
E come ho detto, questo margine di errore non sarà
lo stesso ogni volta che prendiamo un campione.
A seconda di quale è la nostra proporzione campionaria,
il nostro margine di errore sarà influenzato da essa
perché viene calcolato, in sostanza,
con l'errore standard.
Un'altra interpretazione di questo è
che il metodo che abbiamo usato
per ottenere questo intervallo qui,
il metodo che abbiamo usato per ottenere questa confidenza,
per ottenere questo intervallo di confidenza,
se lo usiamo più e più volte
produrrà degli intervalli,
e questi intervalli non saranno sempre uguali
Dipenderanno dalla nostra proporzione campionaria,
ma produrrà degli intervalli
che includono la proporzione reale,
che potremmo non conoscere e spesso non conosciamo.
Comprenderà la proporzione reale il 95% delle volte.
Tratterò questa intuizione in altri video futuri.
Vedremo come gli intervalli cambiano,
come il margine di errore cambia.

Korean: 
오차범위만큼을 더한 값과
오차범위만큼을 뺀 값
사이의 구간입니다
오차범위만큼을 뺀 값
사이의 구간입니다
그렇게 신뢰구간을
정의할 수 있습니다
언급했듯이, 오차범위는
표본을 추출할 때마다 계속 바뀝니다
표본비율에 따라서
오차 범위는 계속 바뀝니다
외냐하면 오차 범위를
계산하는 식 안에
표준오차가 포함되어 있기 때문이죠
이것을 다른 식으로 해석해보면
바로 이 구간을 얻기 위해
사용했던 방법
바로 이 구간을 얻기 위해
사용했던 방법
이 신뢰구간을
얻기 위해서 사용했던 방법을
계속 여러 번 사용하면
각각의 경우마다
신뢰구간을 구할 수 있습니다
그리고 그 구간들은
항상 일정하지는 않습니다
그것은 표본비율에 따라
달라질 것입니다
하지만 구간은 
 실제 비율을 포함하기는 할 것입니다
하지만 구간은 
 실제 비율을 포함하기는 할 것입니다
모비율의 값을 실제로
구하기는 어렵지만 말입니다
95%의 확률로 신뢰구간은
모비율을 포함합니다
이에 대해서는 추후의 동영상에서
더 다루도록 하겠습니다
구간과 오차범위가
어떻게 달라지는지 알아보겠습니다
구간과 오차범위가
어떻게 달라지는지 알아보겠습니다

English: 
But when you do this calculation
over and over and over again,
95% of the time,
your true proportion is
going to be contained
in whatever interval you
happen to calculate that time.
Now, another interesting question is,
is, well, what if you wanted to
tighten up the intervals on average?
How would you do that?
Well, if you wanted to
lower your margin of error,
the best way to lower the margin of error
is if you increase this
denominator right over here.
And increasing that denominator means
increasing the sample size.
And so one thing that you will often see
when people are talking
about election coverage is,
well, we need to sample more people
in order to get a lower margin of error.
But I'll leave you there,
and I'll see you in future videos.

Italian: 
Ma se si calcola questo
ancora e ancora e ancora
il 95% delle volte
la proporzione reale sarà contenuta
all'interno di qualunque intervallo si sta calcolando.
Ora, un'altra domanda interessante è,
è, dunque, se volessi
stringere gli intervalli in media?
Come si potrebbe fare?
Beh, se volessi abbassare il margine di errore,
il modo migliore per abbassare il margine di errore
è quello di aumentare questo denominatore proprio qui.
Ed aumentare il denominatore significa
aumentare la dimensione del campione.
Ed infatti una cosa che si sente spesso
quando le persone parlano di copertura elettorale è,
beh, dovremmo campionare più persone
per ridurre il margine di errore.
Ma lascerò l'argomento qui,
ci vediamo nei prossimi video.

Korean: 
이 계산을
여러 번 반복적으로 하면
95%의 경우에
실제 비율은 계산한 그 
구간안에 있습니다
실제 비율은 계산한 그 
구간안에 있습니다
또다른 흥미로운
질문 하나를 던져 보겠습니다
구간을 평균적으로
줄이고 싶다면
어떻게 해야 할까요?
어떻게 하면 될까요?
오차범위를 줄이기 위해서
가장 좋은 방법은
바로 분모를 증가시키는 것입니다
분모를 증가시킨다는 것은
표본의 크기를
증가시키는 것을 의미합니다
사람들이 선거 보도에
대해 얘기할 때
이 내용을 자주 보게 될 것입니다
오차범위를 줄이기 위해서는
더 많은 사람들을 대상으로
표본조사를 해야 한다는 것 말입니다
오늘은 여기서 마치고
다음 동영상에서
찾아뵙도록 하겠습니다

Bulgarian: 
Но като направиш това изчисление
много пъти,
в 95% от случаите
действителният дял ще се съдържа
в интервала, който се е получил.
Сега, друг интересен въпрос е
какво трябва да направим,
за да стесним тези интервали в общия случай.
Как ще го постигнем?
Е, ако искаме да намалим допустимата грешка,
най-добрият начин да го постигнем
е да увеличим този делител тук.
А това означава
да увеличим размера на извадката.
Затова едно от нещата, за които
 често ще чуеш да се говори
по време на избори е,
че размерът на извадката трябва да бъде по-голям,
за да се намали допустимата грешка.
Но ще оставим темата до тук
и ще те видя в следващото видео.
