
Bulgarian: 
В други видеа се запознахме с
идеята за крива на плътността на случайната величина,
която е обобщение на едно разпределение
на данни, и в бъдеще
ще разгледаме неща като вероятностна плътност.
Но в това видео искам да
помислим какво можем да извлечем от тези характеристики,
как можем да опишем кривите на плътността
и разпределенията, които те представляват.
Имаме четири такива ето тук
и първото нещо, за което искам да говоря, е
дали можем приблизително да изчислим каква стойност ще е
средното число или медианата за този набор данни,
описан от тези криви на плътността.
Просто да ни припомня, ако имаме един набор данни
и ги подредим от най-малкото до най-голямото число,
медианата ще е средната стойност,
точката по средата между средните две стойности.
В такъв случай искаме да открием стойността,
за която половината от стойностите са над тази стойност,
а половината от стойностите са под.
Когато гледаш една крива на плътността,

Korean: 
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

English: 
- [Instructor] In other
videos we introduce ourselves
to the idea of a density curve,
which is a summary of a distribution,
a distribution of data, and in the future
we'll also look at things
like probability density.
But what I want to talk
about in this video is
think about what we can glean from them,
the properties, how we can
describe density curves
and the distributions they represent.
And we have four of them right over here,
and the first thing I
want to think about is
if we can approximate what value would be
the middle value or the
median for the data set
described by these density curves.
So just to remind ourselves,
if we have a set of numbers
and we order them from least to greatest,
the median would be the middle value,
or the midway between
the middle two values.
In a case like this, we
want to find the value
for which half of the
values are above that value
and half of the values are below.
So in looking at a density curve,

English: 
you'd want to look at the area,
and you'd want to say, OK, at what value
do we have equal area
above and below that value?
And so for this one, just eyeballing it,
this value right over
here would be the median.
And in general, if you have a symmetric
distribution like this, the median will be
right along that line of symmetry.
Here we have a slightly
more unusual distribution,
this would be called
a bimodal distribution
where you have two major lumps right
over here, but it is symmetric.
And that point of symmetry
is right over here,
and so this value, once
again, would be the median.
Another way to think about it is,
the area to the left of that value
is equal to the area to the right
of that value, making it the median.
But what if we're dealing with
non-symmetric distributions?
Well we'd want to do the same principle.
We would want to think,
at what value is the area

Korean: 
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

Bulgarian: 
трябва да гледаш тази област,
а после ще попиташ: "При коя стойност
имаме равни области над и под тази стойност?".
За тази крива, просто на пръв поглед,
тази стойност ето тук ще е медианата.
Като цяло, ако имаш симетрично
разпределение като това, медианата ще е
точно по тази ос на симетрия.
Тук имаме малко по-необичайно разпределение,
това би било наречено бимодално разпределение,
при което имаш два главни върха
ето тук, но е симетрично.
Точката на симетрия е ето тук,
така че тази стойност, отново, ще е медианата.
Друг начин да си представим това е,
че областта вляво от тази стойност
е равна на областта вдясно
на тази стойност, което я прави медиана.
Но какво ще стане, ако работим върху несиметрични разпределения?
Бихме искали да приложим същия принцип.
Искаме да помислим при коя стойност областта

Korean: 
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

Bulgarian: 
отдясно и областта отляво са равни?
Отново, това няма да е супер точно,
но ще опитам да го направя приблизително.
Може да ти се иска да отидеш точно на върха
на това издигане ето тук, но ако направя това,
пределно ясно е, дори на пръв поглед,
че дясната област ето тук
е по-голяма от лявата област.
Така че това няма да е медианата.
Ако преместя медианата малко надясно,
може би някъде тук, това изглежда доста по-близо.
Отново, изчислявам това приблизително,
но можем да кажем, че тази област тук
изглежда доста близо до областта ето тук.
Ако това е така,
тогава тя ще е медианата.
Подобно, при тази тук,
може би ето тук и, отново,
изчислявам приблизително, но изглежда логично,
че тази област тук е равна на тази,

English: 
on the right and the
area on the left equal?
And once again this isn't
going to be super exact,
but I'm going to try to approximate it.
You might be tempted
to go right at the top
of this lump right over here,
but if I were to do that
it's pretty clear, even eyeballing it,
that the right area right over here
is larger than the left area.
So that would not be the median.
If I move the median a
little bit over to the right,
this maybe right around here,
this looks a lot closer.
Once again, I'm approximating it,
but it's reasonable to
say that the area here
looks pretty close to the
area right over there.
And if that is the case,
then this is going to be the median.
Similarly, on this one right over here,
maybe right over here, and once again
I'm just approximating it,
but that seems reasonable,
that this area is equal to that one,

Bulgarian: 
въпреки че тази е по-дълга и по-ниска,
а тази част от кривата е много по-висока,
въпреки че намалява надясно.
Това е медианата за непрекъснати
разпределения като това,
това ще е стойността, при която областта вляво
и областта вдясно са равни.
Но какво да кажем за средната стойност?
За средната стойност взимаш всяка възможна стойност
и ги изчисляваш спрямо честотите им,
изчисляваш спрямо честотите
и събираш всичко това.
При симетричните разпределения средната стойност
и медианата ще са еднакви.
Това ще бъде също и средната стойност,
това ще бъде също и средната стойност.
Ако искаш да си представиш това от гледна точка на физиката,
средната точка ще е балансиращата точка,
точката, при която ще поставиш
малка опорна точка и ще
балансираш разпределението.
Можеш да поставиш малка опорна точка тук
и можеш да си представиш, че това нещо
ще я балансира.
Всичко това е извлечено от тази идея за

English: 
even though this is
longer it's much lower,
this part of the curve is much higher
even though it goes on less to the right.
So that's the median for well behaved
continuous distributions like this,
it's going to be the value
for which the area to the left
and the area to the right are equal.
But what about the mean?
Well the mean is, you take
each of the possible values
and you weight it by their frequencies,
you weight it by their frequencies
and you add all of that up.
And so for symmetric distributions
your mean and your median
are actually going to be the same.
So this is going to be your mean as well,
this is going to be your mean as well.
If you want to think about
it in terms of physics,
the mean would be your balancing point,
the point at which you would want to put
a little fulcrum and you would
want to balance the distribution.
And so you could put a little fulcrum here
and you could imagine that this thing
would balance, this thing would balance.
And that all comes out of this idea of the

Korean: 
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

English: 
weighted average of all
of these possible values.
What about for these less
symmetric distributions?
Well let's think about it over here.
Where would I have to put
the fulcrum, or what does
our intuition say if we
wanted to balance this?
Well, we have equal areas on either side,
but when you have this long tail
to the right it's going to pull the mean
to the right of the median in this case.
And so our balance point is probably
going to be something closer to that.
And once again, this
is me approximating it,
but this would roughly be our mean.
It would sit, in this case,
to the right of our median.
Let me make it clear, this
median is referring to that,
the mean is referring to this.
In this case, because
I have this long tail
to the left, it's likely
that I would have to
balance it out right over here.
So the mean would be this
value, right over there.
And there's actually a term for these

Bulgarian: 
средно претеглената стойност за всички тези възможни стойности.
А какво да кажем за тези по-малко симетрични разпределения?
Нека помислим върху това тук.
Къде бих поставил опорната точка и какво казва
логическото ни мислене за балансирането на това?
Имаме равни области и от двете страни,
но когато имаш тази дълга опашка
надясно, тя ще издърпа средната стойност
надясно от медианата в този случай.
Така че балансиращата ни точка вероятно
ще е някъде по-близо до това.
Отново, просто приблизително изчислявам,
но това ще е грубо средната ни стойност.
В този случай ще е вдясно от медианата.
Нека поясня, медианата се отнася до това,
средната стойност се отнася до това.
В този случай, понеже имам тази дълга опашка
наляво, вероятно ще трябва да
балансирам това ето тук.
Средната стойност ще е тази стойност ето тук.
Всъщност има термин за тези

Korean: 
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

Korean: 
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

English: 
non-symmetric distributions where
the mean is varying from the median.
Distributions like this are
referred to as being skewed.
And this distribution,
where you have the mean
to the right of the median, where you have
this long tail to the right,
this is called right skewed.
Now, the technical idea
of skewness can get
quite complicated, but generally speaking,
you can spot it out when you have
a long tail on one direction,
that's the direction in
which it will be skewed,
or if the mean is to that
direction of the median.
So the mean is to the right of the median,
so generally speaking, that's going
to be a right skewed distribution.
So the opposite of that,
here the mean is to the left
of the median and we have this long tail
on the left of our distribution,
so generally speaking

Bulgarian: 
несиметрични разпределения, при които
средната стойност се различава от медианата.
Разпределения като тези се наричат асиметрични.
При това разпределение, когато средната стойност
е вдясно от медианата, когато тази дълга опашка е
надясно, това се нарича разпределение с дясно изтеглено рамо.
Техническата идея за изтеглянето може да стане
доста объркана, но като цяло,
можеш да го забележиш, когато имаш
дълга опашка в една посока,
това е посоката на изтеглянето
или средната стойност ще е в тази посока, спрямо медианата.
Така че средната стойност е отдясно на медианата,
така че, като цяло, това ще е разпределение
с дясно изтеглено рамо.
Противоположно на това, тук средната стойност е отляво
на медианата и имаме тази дълга опашка
отляво, така че ще опишем това

English: 
we will describe these as
left skewed distributions.

Korean: 
.

Bulgarian: 
като разпределение с ляво изтеглено рамо.
