
Bulgarian: 
Тук имаме списък от 15 числа
и искам да помислим кои са 
отдалечените стойности.
За да си помогнем, нека визуализираме
разпределението на числата.
Нека направим това.
Тук, на числовата ос,
имаме всички числа от едно до 19.
Да видим, имаме две единици.
Мога да кажа, че това е едната единица, а това е втората единица.
Имаме една шестица.
Нека сложим тази шестица тук.
Имаме 13...
или имаме два пъти числото 13.
Ще дойдем ето тук, едното 13 и второто 13.
Да видим, имаме три пъти 14.
14,
14
и 14.
Имаме два пъти 15.
15,
15.
Имаме 16 веднъж.

Korean: 
숫자 15개가 있고
이 숫자들의 이상치에 대해
생각해 볼 것입니다
이것에 도움을 주고자 이 숫자들의
분포를 시각화할 것입니다
이것에 도움을 주고자 이 숫자들의
분포를 시각화할 것입니다
그럼 해봅시다
따라서 이러한 수직선에
1에서 19까지의
모든 숫자들이 있습니다
1이 2개 있고
1이 2개 있고
6이 1개 있고
6을 여기다 둡시다
13이 2개가 있습니다
13이 2개가 있습니다
따라서 여기다가 표시할겁니다
14는 3개가 있습니다
따라서 14
14
14
15는 2개 있기에
15
15
16은 1개 있습니다

English: 
- [Instructor] We have a
list of 15 numbers here,
and what I want to do is
think about the outliers.
And to help us with that,
let's actually visualize this,
the distribution of actual numbers.
So let us do that.
So here, on a number line,
I have all the numbers from one to 19.
And let's see, we have two ones.
So I could say that's one
one and then two ones.
We have one six.
So let's put that six there.
We have got a 13,
or we have two 13s.
So we're gonna go up
here, one 13 and two 13s.
Let's see, we have three 14s.
So 14,
14,
and 14.
We have a couple of 15s, 15, 15.
So 15,
15.
We have one 16.

Korean: 
16을 여기다 둘 것입니다
18은 3개 있습니다
하나, 둘, 셋
하나
둘
그리고 셋
마지막으로 19가 있습니다
여기에 19를 둡니다
이 분포를 보면
시각적으로 수의 분포를 보게 되면
이 분포의 가장 중요한 부분은
바로 이 부분일 것입니다
따라서 어떤 사람들은
3개의 이상치가 있다고 생각할 수 있고
이 2개의 1과 1개의 6 말입니다
어떤 사람들은
보니까 6은 꽤 가까운 것 같은데
두 개의 숫자 1만 이상치인 것 같다고
생각할 수도 있습니다
이것들은 상식적인 대답일 수 있습니다
하지만 생각을 통일하고자
통계학자들은
가끔 규칙을 사용할 때도 있습니다
사분이수범위의
1.5배를 넘어가는 모든
것들 즉 Q1보다 작거나 Q3보다 큰
모든 것들을
이상치라고 정의합니다
제가 한 이야기가 무엇일까요?
그럼 일단 실제로 중앙값과
Q1과 Q3를 구해봅시다

Bulgarian: 
Това е нашето число 16.
Имаме три пъти 18.
Едно, две, три.
Едно,
две
и после три.
После имаме веднъж 19.
После имаме 19.
Когато погледнеш
визуалната дистрибуция на числата,
изглежда сякаш сърцевината на разпределението, така да кажем,
е в тази област ето тук.
Някои хора може да кажат:
"Имаме три отдалечени стойности.
Това са двете единици и шестицата."
Някои хора може да кажат:
"Шестицата е достатъчно близо.
Може би само двете единици 
са отдалечени стойности."
И двете становища са разумни.
Сега, за да дойдем на една и съща вълна,
статистиците понякога използват едно правило.
Казваме, че всичко, което е повече от
един и половина пъти интерквартилния обхват
от под Q1 или над Q3,
това ще са отдалечените стойности.
За какво говоря?
Всъщност, нека определим медианата,
Q1 и Q3 тук.

English: 
So that's our 16 there.
We have three 18s.
One, two, three.
So one,
two,
and then three.
And then we have a 19.
Then we have a 19.
So when you look,
when you look visually at
the distribution of numbers,
it looks like the meat of the
distribution, so to speak,
is in this area, right over here.
And so some people might say,
"Okay, we have three outliers.
"There are these two ones and the six."
Some people might say,
"Well, the six is kinda close enough.
"Maybe only these two ones are outliers."
And those would actually be
both reasonable things to say.
Now to get on the same page,
statisticians will use a rule sometimes.
We say, well, anything that is more than
one and a half times
the interquartile range
from below Q-one or above Q-three,
well, those are going to be outliers.
Well, what am I talking about?
Well, let's actually, let's
figure out the median,
Q-one and Q-three here.

English: 
Then we can figure out
the interquartile range.
And then we can figure
out by that definition,
what is going to be an outlier?
And if that all made sense to you so far,
I encourage you to pause this video
and try to work through it on your own,
or I'll do it for you right now.
All right, so what's the median here?
Well, the median is the middle number.
We have 15 numbers, so the
middle number is going to be
whatever number has seven on either side.
So it's gonna be the eighth number.
One, two, three, four, five, six, seven.
Is that right?
Yep, six, seven, so that's the median.
And then you have one, two,
three, four, five, six, seven
numbers on the right side too.
So that is the median,
sometimes called Q-two.
That is our median.
Now what is Q-one?
Well, Q-one is going to be the
middle of this first group.
This first group has seven numbers in it.
And so the middle is going
to be the fourth number.
It has three and three,
three to the left, three to the right.
So that is Q-one.

Bulgarian: 
После можем да определим интерквартилния размах.
И можем да определим кои са 
отдалечените стойности според определението.
Ако всичко това е имало смисъл за теб до тук,
окуражавам те да поставиш видеото на пауза
и да опиташ самостоятелно да го решиш
или сега ще го направя вместо теб.
Каква е медианата тук?
Медианата е средното число.
Имаме 15 числа, така че средното число ще е
това число, което има по седем други от всяка страна.
Това ще е осмото число.
Едно, две, три, четири, пет, шест, седем.
Правилно ли е това?
Да, шест, седем, така че това е медианата.
После имаш едно, две, три, четири, пет, шест, седем
числа и от дясната страна.
Това е медианата, понякога наричана Q2.
Това е нашата медиана.
Кое е Q1?
Q1 ще е средното число в тази първа група.
Първата група има седем числа.
Средното от тях ще е четвъртото число.
Има три и три,
три отляво и три отдясно.
Това е Q1.

Korean: 
그러면 사분위수 범위를
알 수 있습니다
그러면 이것을 이용하여
이상치를 알 수 있을 것입니다
만약 이 모든 것들이 이해가 되었다면
이 영상을 잠시 멈추고
스스로 구해볼 것을 권해드립니다
아니면 제가 대신 풀어드릴 겁니다
그럼 여기서 중앙값은 무엇일까요
중앙값이란 분포의
중앙에 있는 수입니다
15개의 숫자가 있으므로 중앙에 있는
숫자는 양 옆으로
숫자 7개가 있을 것입니다
즉 8번째 숫자일 것입니다
하나, 둘, 셋, 넷, 다섯, 여섯, 일곱
맞죠?
따라서 이것이 중앙값이 될 것입니다
그러면 우측에도
하나, 둘, 셋, 넷, 다섯, 여섯, 일곱개의
숫자들이 있습니다
따라서 이것이 Q2라고 지칭되는
중앙값이 될 것입니다
이것이 바로 중앙값입니다
그럼 Q1은 무엇일까요
일단 Q1은 이 첫 그룹의
중앙에 있습니다
첫 그룹은 7개의 숫자가 있습니다
따라서 중앙은 4번째 숫자일 것입니다
좌측에는 3개
우측에도 3개의 숫자가 있을 것입니다
따라서 이것이 Q1입니다

English: 
And then Q-three is going
to be the middle of this upper group.
Well, that also has seven numbers in it.
So the middle is going
to be right over there.
It has three on either side.
So that is Q-three.
Now what is the interquartile
range going to be?
Interquartile range
is going to be equal to
Q-three
minus Q-one,
the difference between 18 and 13.
Between 18 and 13,
well, that is going to be 18 minus 13,
which is equal to five.
Now to figure out outliers,
well, outliers are gonna
be anything that is below.
So outliers,
outliers,
are going to be less than
our Q-one
minus 1.5,
times our interquartile range.
And this, once again, this
isn't some rule of the universe.
This is something that statisticians
have kind of said, well,
if we want to have a better
definition for outliers,
let's just agree that
it's something that's

Korean: 
Q3는 위의 그룹의
중앙에 있습니다
Q3는 위의 그룹의
중앙에 있습니다
이 또한 7개의 숫자가 있을텐데
그것의 중간은 여기에 위치할 것입니다
3개씩 양쪽에 분포해 있습니다
따라서 이 값이 Q3입니다
그러면 사분범위는 무엇이 될까요?
사분위수 범위는
사분위수 범위는 바로
Q3
빼기 Q1
즉 18 빼기 13일 것입니다
18과 13 사이의 차
즉 18 -13은
5가 될 것입니다
따라서 이상치를 구하려면
이상치는 곧
이상치는 곧
이상치는
Q1 - (1.5 × 사분위수 범위)보다 작은
Q1 - (1.5 × 사분위수 범위)보다 작은
Q1 - (1.5 × 사분위수 범위)보다 작은
값들일 것입니다
이것 또한 절대적 법칙은 아니고
통계학자들이 이상치에
대한 더 나은 정의에 대해 고민하다
대한 더 나은 정의에 대해 고민하다
Q1 - (1.5 × 사분위수 범위)보다

Bulgarian: 
После, Q3 ще е
средата на тази горна група. 
Тя също има седем числа.
Средното от тях ще е ето тук.
Има по три други от всяка страна. 
Това е Q3.
Какъв ще е интерквартилният размах?
Интерквартилният размах
ще е равен на Q3 минус Q1,
разликата между 18 и 13.
Между 18 и 13,
това ще е 18 минус 13,
което е равно на пет.
За да намерим отдалечените стойности,
те ще са всичко под това.
Отдалечените стойности
ще са по-малки
от Q1
минус 1,5
пъти интерквартилния размах.
Отново, това не е някакво вселенско правило.
Това е нещо, за което статистиците
са казали:
"Ако искаме да имаме по-добро определение за отдалечените стойности,
нека се съгласим, че това е нещо, което е

Bulgarian: 
повече от един и половина пъти
интерквартилния размах под Q1.
Или
отдалечените стойности може да са по-големи от Q3
плюс един и половина пъти
интерквартилния размах.
Отново, това просто
хората са сметнали за подходящо.
Някой може да спори, че трябва да е 1,6.
Или някой може да каже, че трябва да е едно, две или нещо такова.
Но с това хората са съгласни.
Нека помислим какви са тези числа.
Вече знаем Q1.
Това ще е 13
минус 1,5 пъти интерквартилния размах.
Нашият интерквартилен размах тук е пет.
Тоест, 1,5 пъти по пет, което е 7,5.
Това е 7,5.
Колко е 13 минус 7,5?
13 минус седем е шест,
а после изваждаш още 0,5 и това е 5,5.
Така, имаме отдалечените стойности.
Отдалечените стойности

English: 
more than one and half times
the interquartile range below Q-one.
Or,
or an outlier could be
greater than Q-three
plus one and half times
the interquartile range,
interquartile range.
And once again, this is somewhat,
you know, people just
decided it felt right.
One could argue it should be 1.6.
Or one could argue it should
be one, or two, or whatever.
But this is what people
have tended to agree on.
So let's think about
what these numbers are.
Q-one we already know.
So this is going to be 13
minus 1.5 times our interquartile range.
Our interquartile range here is five.
So it's 1.5 times five, which is 7.5.
So this is 7.5.
13 minus 7.5 is what?
13 minus seven is six,
and then you subtract another .5, is 5.5.
So we have outliers,
outliers.
Outliers

Korean: 
작은 값들을 이상치라 정의해서
나온 식입니다
작은 값들을 이상치라 정의해서
나온 식입니다
혹은
Q3 + (1.5 × 사분위수 범위)보다 큰값을 
이상치로 정의할 수 있습니다
Q3 + (1.5 × 사분위수 범위)보다 큰값을 
이상치로 정의할 수 있습니다
Q3 + (1.5 × 사분위수 범위)보다 큰값을 
이상치로 정의할 수 있습니다
다시 말하지만 이것은
어느 정도 맞아
보였기에 정해진 것입니다
어떤 사람은 1.6을 곱해야 한다
주장할 수 있습니다
혹은 1 또는 2와 같은 값을 곱해야 한다
라고 할 수 있습니다
하지만 1.5가 대부분이
납득하는 값입니다
따라서 이 값들이
얼마인지 알아봅시다
Q1은 이미 알고 있습니다
따라서 이것은 13 빼기
(1.5 × 사분위수 범위)일 것입니다
사분위수 범위는 5이기 때문에
1.5 × 5 즉, 7.5가 나옵니다
따라서 이 값은 7.5입니다
13 - 7.5는 얼마죠?
13 - 7은 6이므로
여기다 0.5를 빼주면 5.5가 됩니다
따라서 이제는 이상치를
이상치를
이상치를

Korean: 
5.5보다 작은 값들이라 할 수 있습니다
혹은
Q3은 18이므로
이 값은 7.5가 되고
18 더하기 7.5는
25.5이기 때문에
25.5보다 더 큰 값들을
이상치라 할 수 있습니다
25.5보다 더 큰 값들을
이상치라 할 수 있습니다
25.5보다 더 큰 값들을
이상치라 할 수 있습니다
따라서 이를 바탕으로
이상치에 대한 수치적인 정의를
내릴 수 있습니다
우리는 대충 느낌적으로
음 이것은 이상치이고, 저것은
아닌것 같아 하는게 아닙니다
이 논리를 바탕으로 하면
 2개의 이상치를 구할 수 있습니다
이 2개의 1만 5.5보다 작습니다
이 2개의 1만 5.5보다 작습니다
여기가 바로 그 임게점입니다
따라서 이 6은
턱걸이로 범위 안에 든 것입니다
그리고 상한에는 이상치가 없습니다
하나 더 생각해야 할 것은
바로 Q1, 중앙값, 범위를
기반으로 해 상자 그림을
그리는 것입니다
이상치에 대해 고려해 그릴 수도
이상치에 대해 고려해 그릴 수도

English: 
would be less than 5.5.
Or
the Q-three is 18,
this is, once again, 7.5.
18 plus 7.5
is 25.5,
or outliers,
outliers greater than 25,
25.5.
So based on this, we have a,
kind of a numerical definition
for what's an outlier.
We're not just subjectively saying,
well, this feels right
or that feels right.
And based on this, we
only have two outliers,
that only these two
ones are less than 5.5.
Only these two ones are less than 5.5.
This is the cutoff, right over here.
So this dot just happened to make it.
And we don't have any
outliers on the high side.
Now another thing to think about
is drawing box-and-whiskers plots
based on Q-one, our median, our range,
all the range of numbers.
And you could do it either
taking in consideration your outliers

Bulgarian: 
ще са по-малко от 5,5.
Или,
Q3 е 18,
това е, отново, 7,5.
18 плюс 7,5
е 25,5.
Или отдалечени са
и стойностите, по-големи от 25,5.
Въз основа на това имаме един вид
цифрово определение за отдалечените стойности.
Не казваме просто субективно:
"Това изглежда добре или това изглежда добре."
Въз основа на това имаме само две отдалечени стойности,
като само тези двете са по-малки от 5,5.
Само тези две единици са по-малки от 5,5.
Това е границата, ето тук.
Това е точката.
Нямаме отдалечени стойности от високата страна.
Друго нещо, за което да се замислим,
е създаването на диаграма тип "кутия с мустаци",
базирана на Q1, медианата ни, размаха ни,
целия диапазон числа.
Можеш да го направиш или
като вземеш предвид отдалечените стойности,

Bulgarian: 
или без да взимаш предвид отдалечените стойности.
Има два начина, по които можем да го направим.
Нека изчистя всичко това.
Вече намерихме всичко това.
Нека го изчистя.
Нека нарисуваме диаграма 
тип "кутия с мустаци".
Ще сложа още една,
нека направя две тук.
Това е една
и нека поставя още една тук долу.
Това е още една.
Сега, ако нарисуваме
класическа диаграма тип "кутия с мустаци" тук,
бихме казали, че медианата ни е на 14.
Ще го направя и по двата начина.
Медианата ни е на 14.
Медианата е на 14.
Q1 е на 13.
Q1 е на 13
и Q1 е на 13.
Q3 е на 18.
Q3 e на 18.
Q3 е 18.
Това е частта с кутията.
Нека го нарисувам като
истинска кутия.
Ето го най-добрия

English: 
or not taking into
consideration your outliers.
So there's a couple of
ways that we can do it.
So let me actually clear,
let me clear all of this.
We've figured out all of this stuff.
So let me clear all of that out.
And let's actually draw
a box-and-whiskers plot.
So I'll put another,
another, actually let me do two here.
That's one,
and then let me put
another one down there.
And then this is another.
Now if we were to just draw
a classic box-and-whiskers plot here,
we would say, all right,
our median's at 14.
And actually, I'll do it both ways.
Our median's at 14.
Median's at 14.
Q-one's at 13.
Q-one's at 13,
and Q-one's at 13.
Q-three is at 18.
Q-three is at 18,
Q-three is 18.
So that's the box part.
Now let me draw that as an actual,
let me actually draw that as a box.
So my best attempt,

Korean: 
고려하지 않은채 그릴 수도 있습니다
따라서 그리는 방법이 여러가지입니다
그럼 이제 이것을 다 지워봅시다
이것은 이미 다 구했습니다
다 지워봅시다
그리고 이제 상자 그림을 그려봅시다
여기에 하나 더
아니 2개 더 수직선을 그릴 것입니다
첫번째
하나 더 추가하면
두번째
만약 고전적인 상자 그림을 그리면
만약 고전적인 상자 그림을 그리면
일단 중앙값은 14이고
그냥 두 방법 다 해봅시다
중앙값은 14입니다
중앙값은 14입니다
Q1은 13이고
Q1은 13이고
Q1은 13이고
Q3은 18입니다
Q3은 18입니다
Q3은 18입니다
따라서 이것이 상자 부분입니다
차라리 이것을 실제
상자처럼 그려봅시다

English: 
there you go.
That's the box.
And this is also a box.
So far, I'm doing the exact same thing.
Now if we don't want to consider outliers,
we would say, well, what's
the entire range here?
Well, we have things that go
from one all the way to 19.
So one way to do it is to, hey,
we start at one.
And so our entire range, we go,
actually let me draw it a
little bit better than that.
We're going all the way,
all the way from one
to 19.
Now in this one, we're
including everything.
We're including even these two outliers.
But if we don't want to
include those outliers,
we want to make it clear
that they're outliers,
well, let's not include them.
And what we can do instead is say,
all right, including
(chuckles) our non-outliers,
we would start at six
'cause six we're saying
is in our data set,
but it is not an outlier.
Let me make this look better.
So we're gonna,
we are going to

Korean: 
이렇게 말입니다
이렇게 말입니다
이것이 상자입니다
이 또한 상자입니다
여기까지 모든 과정은 동일합니다
이상치들을 고려하고 싶지 않다면
여기서 범위는 무엇일까요
1에서 19까지의 숫자들이 있습니다
어떤 사람은
1에서 시작해서
따라서 전체 범위는
좀 더 제대로 그려봅시다
1에서 부터
1에서 부터
19까지일 것입니다
따라서 이 경우는
모든 수를 포함하고 있습니다
두 이상치 또한 포함하고 있습니다
하지만 만약 이 두 이상치를
포함하고 싶지 않다면
이상치임을 제대로 드러내기 위해
포함시키지 말아 봅시다
그러면 이상치가 아닌 것들만
포함시키게 되면
6에서 시작하게 되는데
왜냐하면 6은 자료 집합 안에 있지만
이상치가 아니기 때문입니다
좀 더 이쁘게 만들어 봅시다
그러면 이제
6에서 시작하여 19까지 갈 것입니다

Bulgarian: 
ми опит.
Това е кутията.
Това също е кутия.
Правя същото нещо.
Ако не искаме да вземем предвид
отдалечените стойности, бихме се запитали какъв е целият размах тук.
Имаме неща, които са от едно чак до 19.
Един начин да направим това е да
започнем от едно.
Това е целият ни размах,
нека го нарисувам малко по-добре от това.
Преминаваме цялото това разстояние,
цялото разстояние от едно
до 19.
При това включваме всичко.
Включваме дори тези две отдалечени стойности.
Но ако не искаме да включим 
тези отдалечени стойности,
искаме да поясним, че те са 
отдалечени стойности,
нека не ги включваме.
Вместо това можем да
включим тези, които не са отдалечени стойности,
като ще започнем от шест,
понеже казахме, че шест е в набора ни данни,
то те не е отдалечена стойност.
Нека направим това да изглежда по-добре.
Ние ще започнем от

Korean: 
6에서 시작하여 19까지 갈 것입니다
또 이상치가 있다는 것을
표현하기 위해
이상치를 여기에 표시할 것입니다
다시 말하지만
이것은 같은 자료 집합에 대해
이상치를 없엔 상자 그림입니다
이 표는 이상치가 어디에 존재하는지
명확히 표현해주고 있습니다

Bulgarian: 
шест и ще продължим до 19.
После, за да кажем, че имаме тези отдалечени стойности,
ще поставим това, тук имаме отдалечени стойности.
Отново, това е диаграма тип "кутия с мустаци"
за същия набор данни, 
без отдалечените стойности.
При това тук поясняваме
къде точно са отдалечените стойности.

English: 
start at six and go all the way to 19.
And then to say that
we have these outliers,
we would put this, we
have outliers over there.
So once again, this is
a box-and-whiskers plot
of the same data set without outliers.
And this is one where we make specific,
we make it clear where
the outliers actually are.
