
English: 
- [Voiceover] Hey guys.
Before talking about the
vector form for the quadratic
approximation of multivariable functions,
I've got to introduce this
thing called the Hessian matrix.
Essentially what this is,
is just a way to package
all the information of the
second derivatives of a function.
Let's say you have some kind
of multivariable function
like the example we had in the last video,
e to the x halves multiplied by sine of y,
so some kind of of a
multivariable function.
What the Hessian matrix
is, and it's often denoted
with an H, but a bold
faced H, is it's a matrix,
incidentally enough, that contains all
the second partial derivatives of f.
The first component is gonna
be, the partial derivative
of f with respect to x twice
in a row, and everything
in this first column is
kind of like you first do it
with respect to x, because
the next part is the second
derivative where first you
do it with respect to x

Korean: 
안녕하세요 
여러분
벡터를 이용해 다변수 함수를
 근사하는 방법을
이야기하기 이전에,
헤세 행렬(Hessian Maxtrix)에
대해서 알아봅시다
헤세 행렬은
이계 도함수 정보를
모두 모아놓은 집합입니다
다음과 같은 다변수 함수가
있다고 가정해봅시다
지난 영상에서 사용한 예시와
동일한 예시입니다
e의 x/2 제곱 곱하기
sin(y) 입니다
이 함수는 
다변수 함수입니다
헤세 행렬은,
주로
대문자 H 를 굵게 그려
표현합니다
앞서 말했듯이
이 행렬은
f 의 이계 도함수를
모두 포함합니다
첫 번째 원소는,
f 를 x에 대해서 두 번
편미분한 도함수이고,
1열의 원소들은 모두
이와 유사하게
x 에 대해서 우선적으로 한 번
편미분하면 됩니다
1열 2행은 
x에 대해서 한 번 편미분하고

English: 
and then you do it with respect to y.
That's the first column of the matrix.
Then up here it's the partial
derivative where first you do
it with respect to y and then
you do it with respect to x,
and then over here it's
where you do it with
respect to y both times in a row.
Partial with respect to
y both times in a row.
Let's go ahead and actually compute this
and think about what this would look like
in the case of our specific function here.
In order to get all the second
partial derivatives we first
should keep a record of the
first partial derivatives.
The partial derivative
of f with respect to x.
The only place x shows up is
in this e to the x halves.
Bring down that 1/2 e to
the x halves and sine of y
just looks like a constant
as far as x is concerned.
Sine of y.
Then the partial derivative
with respect of y.
Partial derivative of f with respect to y.
Now e to the x halves
looks like a constant

Korean: 
그 다음 y 에 대해서 
편미분합니다
여기 적힌 두개의 편도함수가
1열의 원소가 됩니다
2열 1행은
y,x 순서로 
편미분해줍니다
그리고 2열 2행은
y 에 대해서 두 번 
편미분해줍니다
 
자 그러면
우리가 설정한 
함수의 경우
헤세 행렬이
어떻게 나오는지 알아봅시다
이계 편도함수를 
찾기 위해서는
우선적으로 일계 편도함수
정보들을 알아야 합니다
f 의 x 에 대한 편도함수는
x 가 유일하게 
e의 지수부분에서 등장하므로,
½ 곱하기 e의 x/2 제곱
곱하기 sin(y)가 됩니다
y 는 상수 취급하므로
sin(y)는 그대로 써줍시다
이제 y 에 대한 
일계 편도함수를 구해야 합니다
f 의 y 에 대한 편도함수는,
이제 e의 x/2 제곱이 
상수 취급되고,

English: 
and it's being multiplied by
something that has a y in it,
e to the x halves.
The derivative of sine of
y, since we're doing it
with respect to y is cosine of y.
These terms won't be included
in the Hessian itself
but we're just keeping a record of them
because now when we go
into fill in the matrix,
this upper left component,
we're taking the second partial
derivative where we do it with
respect to x then x again.
Up here is when we did
it with respect to x,
if we did it with respect
to x again we bring down
another 1/2 so that becomes
1/4 by e to the x halves
and that sine of y just
still looks like a constant.
Then this mixed partial
derivative where we do it with
respect to x then y, so we
did it with respect to x here.
When we differentiate
this with respect to y,
the 1/2 e to the x halves
just looks like a constant
but then derivative of sine
of y ends up as cosine of y.
Then up here, it's gonna be
the same thing but let's see

Korean: 
sin(y)를 미분해준 것을
곱하면 됩니다
e의 x/2 제곱
곱하기
sin(y) 의 미분값인
cos(y)를 곱해줍시다
일계 편도함수는
헤세 행렬에 직접 들어가지는 않지만
이계 편도함수를 
구하기 위해서
꼭 필요한 정보들이므로
기록해 둡시다
예를 들어
1행 1열의 경우
f 의 x 에 대한 일계편도함수를
한 번 더 편미분해야 합니다
이 위에 초록색으로 적힌 
일계 편도함수를
x 에 대해서 한 번 더
편미분하면
¼ 곱하기 e의 x/2 제곱
곱하기
sin(y) 가 됩니다
2행 1열의 혼합 편도함수의
경우
x , y 순서로
편미분 해야하므로
다시 한번 이 초록색 함수를
y 에 대해서 편미분하면
½ 곱하기 e의 x/2 제곱
곱하기
cos(y) 가 됩니다
2열의 경우 
동일한 방법이 적용하면,

English: 
when you do it in the other direction,
when you do it first
with respect to y then x.
Over here we did it
first with respect to y.
If we took this derivative
with respect to x,
you'd have the 1/2 would
come down, so that would be
1/2 e to the x halves
multiplied by cosine of y
because that's just looks
like a constant since
we're doing it with respect
to x the second time.
That would be cosine of y,
and it shouldn't feel like a
surprise that both of these
terms are not to be the same.
With most functions that's the case.
Technically not all functions.
You can come up with some crazy things
where this won't be
symmetric, where you’ll
have different terms in the
diagonal, but for the most part
those you can expect to be the same.
In this last term here where
we do it with respect to
y twice, we now think of taking
the derivative of this whole
term with respect to y, that
e to the x halves looks like
a constant and derivative of
cosine is negative sine of y.
This whole thing, a matrix,
each of whose components

Korean: 
1행 2열의 경우
y , x 순서로 편미분하므로
이미 구해놓은
y 에 대한 편도함수를
x 에 대해서 다시
편미분해주면 되므로
계산해보면
½ 곱하기 e 의 x/2 제곱 곱하기
cos(y)가 됩니다
왜냐하면 x 에 대해서 
편미분할 때에는
y 를 상수 취급하기 
때문입니다
따라서 cos(y) 를 곱하게
되는 것입니다
2행 1열과
1행 2열이 같은 것은
놀라운 일이 아니라,
거의 대부분의 함수에서 동일하게 나옵니다
하지만 모든 함수에 대해서
항상 성립하지는 않습니다
가끔씩 괴상한 함수들의 경우
이 두 원소가
같은 값을 갖지 않기도 하지만,
대부분의 함수의 경우
두 원소는
같은 값을 갖습니다
2행 2열의 경우
y에 대해서 두 번 편미분하므로,
이 편도함수를
y 에 대해서  한 번 더 
편미분해주면
e의 x/2 제곱 
곱하기 - sin(y) 가 됩니다
이렇듯 어떤 함수의
이계 도함수를 모아놓은 행렬을

English: 
is a multivariable
function, is the Hessian.
This is the Hessian of f,
and sometimes bold write it
as Hessian of f specifying
what function its of.
You could think of it as
a matrix valued function
which feels kind of weird
but you plug in two different
values, x and y, and you'll get a matrix,
so it's this matrix valued function.
The nice thing about
writing it like this is that
you can actually extend
this so that rather
than just for functions
that have two variables,
let's say you had a function,
kind of like clear this up,
let's say u had a function
that had three variables
or four variables or any number.
Let's say it was a
function of x, y, and z,
then you can follow this
pattern and following down
the first column here the
next term that you would get
would be the second
partial derivative of f,
where first you do with respect to x,
and then you do it with respect to z.
Then over here it would be
the second partial derivative
of f, where first you
did it with respect to y
and then you do it with respect to z,

Korean: 
헤세 행렬이라고 합니다
이 예제는
f에 대한 헤세 행렬이라고 하며,
H 아래 첨자에 f 를 써서
어떤 함수에 대한 헤세 행렬인지를 알려줍니다
이는 행렬함수이기도 한데,
이상하게 보일지도 모르지만,
x 와 y 에 값을 대입해주면
행렬을 얻게 되므로
이는 행렬함수라고 할 수 있습니다
이 표기법의 장점은
두 개의 변수를
갖는 경우뿐 아니라
그 이상의 변수를 갖는 경우로
확장 가능하다는 것입니다
[글씨 지우는 중]
세 개의 변수를 갖는
함수를 다룬다고 합시다
혹은 그 이상의 변수도 좋습니다
x, y, z를 변수로 가지는
함수가 있습니다
앞서 한 방법을 통해
계산해보면,
1열 3행으로는
이계 편도함수가 들어가고,
이는
f 의 x 에 대한 일계 편도함수를
z 에 대해서 한번 더
편미분 해 준 것이 됩니다
2열 3행의 경우
f 의 y 에 대한 일계 편도함수를
z 에 대해서 한번 더 
편미분 해 준 것이 됩니다

Korean: 
여기 옆에도 지워야겠군요
왜냐하면 이번에는
3열까지 확장이 되어
이계 편도함수를 적어줘야
하기 때문입니다
3열 1행은
z, x 순서로 편미분해주고
3열 2행은
3열 2행은
z, y 순서로 편미분해주며
3열 3행은
 
z 에 대해서 두 번
편미분해주면 됩니다
이 3x3 행렬이
세 개의 변수를 갖는 함수의
헤세 행렬이 됩니다
이 예제를 통해서
네 개의 변수를 갖는 경우
4x4 행렬을 얻을 것임을
알 수 있습니다
만일 100개의 변수를 다룬다면
100x100 행렬을 
얻을 것입니다
이 표기의 
좋은 점은
기호로써 이계 편도함수 정보를
대체할 수 있다는 것입니다
다음 영상에서
이 표기의 
장점을
다변수 함수의 이차 근사를 통해
살펴보도록 하겠습니다
이변수 함수뿐 아니라 
그 이상의 변수를 갖는 경우에도

English: 
I'll clear up even more room here,
because you'd have another
column where you'd have the
second partial derivative,
where this time everything first
you do it with respect to z
and then with respect to x.
Then over here you'd have
the second partial derivative
where first you do it with respect
to z and then with respect to y.
Then there is the very
last component you'd have
the second partial derivative
where first you do it with
respect to, well, I guess you
do it with respect to z twice.
This whole thing, this three
by three matrix would be
the Hessian of a three variable function.
You can see how you could
extend this pattern where if it
was a four variable function
you'd get a four by four matrix
of all of the possible
second partial derivatives.
If it was a 100 variable function
you would have a 100 by 100 matrix.
The nice thing about having
this is then we can talk
about that by just referencing the symbol
and we'll see in the
next video how this makes
it very nice to express,
for example the quadratic
approximation of any kind
of multivariable function
not just a two variable
function and the symbols

English: 
don't get way out of hand
'cause you don't have to
reference each one of these
individual components.
You can just reference
the matrix as a whole
and start doing matrix operations.
I will see you in that next video.

Korean: 
오직 H 라는 표기를 이용해서
이계 편도함수를 나타낼 수 있으므로
각각의 원소를 직접 
적어 줄 필요가 없습니다
헤세 행렬로 표기한 다음에
행렬 연산을 해 주면
되는 것입니다
다음 영상에서 만납시다
