
English: 
I'm Lorry Hardt, the
global product marketing
manager for Advanced
Analytics, and joining me today
is Jonathan Wexler,
the principal product
manager for SAS's
Machine Learning suite.
Jonathan, thanks for
talking with me today.
JONATHAN WEXLER: Glad
to be here, Lorry,
to discuss our new release.
LORRY HARDT:
Justifiably, there's
a lot of hype that
surrounds supplying
more advanced
modeling techniques,
such as machine learning.
This is coming from the C level
enterprise architecture leaders
to chief analytic officers.
This has really
become a hot topic.
What are your thoughts on this?
Why now?
JONATHAN WEXLER:
Lorry, to be frank,
machine learning is
not a new concept.
Many of these techniques,
such as neural networks,
have been around for many years.
It's just that the
technology has finally
caught up with the
computational need for analyzing
large complex data sources,
including suspicious trading
activity,
recommendation engines,

Korean: 
고급 분석 글로벌 제품 마케팅 매니저 Lorry Hardt입니다.
오늘은 SAS의 머신러닝 제품 책임 매니저인 Jonathan Wexler와 함께 뜻 깊은 시간을 가져보려고 합니다.
오늘 함께 해 주셔서 감사합니다.
새로운 솔루션 출시에 대한 이야기를 위해 이 자리에 참석하게 되어 기쁩니다.
아시다시피 머신러닝 같은 고급 모델링 기법을 제공하는 것이
엔터프라이즈 아키텍처 경영진들이나 최고 분석 책임자들 사이에서 많은 이슈가 되고 있는데요,
이에 대해 어떻게 생각하시나요? 왜 지금 이렇게 이슈가 된 걸까요?
사실, 머신러닝은 새로운 개념은 아닙니다.
신경망 같은 기법들은 오래 전부터 존재했습니다.
단지, 이런 기술들이 의심스러운 거래 활동, 추천 엔진 같은 대량의 복잡한 데이터 분석과

English: 
to analyzing complex images.
LORRY HARDT: One
of the key areas
that when we discuss
machine learning
is the enabling non-expert
data scientists or even
business analysts
with the ability
to rapidly explore
and model data.
In SAS's latest release of SAS
Visual Data Mining and Machine
Learning, how do you see
this product addressing
those types of tasks?
JONATHAN WEXLER: Lorry,
SAS Visual Data Mining
and Machine Learning
enables users
to rapidly expand
their models in a very
visual interactive way.
This solution enables users to
analyze data in the experience
that they feel comfortable with.
They can quickly go from data
prep to interactive modeling
to advanced
pipelining, and finally
and most importantly,
to deployment all
within this one solution.
Let's see SAS Visual Data Mining
and Machine Learning in action.
For my particular
use case, I'm trying
to analyze what
chemical factors helped
me predict the quality of wine.
I've already prepared my
data using a data preparation
area of SAS Visual Data
Mining and Machine Learning,
and now I'm in the process
of exploring and expanding

Korean: 
복잡한 이미지 분석을 위한 필요성을 마침내 충족시키게 된 것이지요.
머신러닝에 대한 핵심 포인트 중 하나는 데이터 담당자나 비즈니스 분석가가 아닌 사람들도
빠르게 데이터를 탐색하고 모델링할 수 있는 능력을 갖출 수 있도록 지원한다는 점입니다.
최근 출시된 SAS Visual Data Mining and Machine Learning(VDMML)이
이런 유형의 작업을 어떻게 지원할 수 있다고 보고 계신가요?
SAS VDMML 은 사용자가 시각적인 대화형 방식으로 모델을 빠르게 확장할 수 있도록 지원합니다.
이 솔루션의 경우, 사용자는 편안한 환경에서 대화형 방식으로 데이터를 분석할 수 있습니다.
데이터 준비에서 대화형 모델링, 그리고 고급 파이프라인까지 생성할 수 있습니다.
가장 중요한 점은 모든 것을 이 솔루션 하나에 적용할 수 있다는 것입니다.
그럼 이제, 실제로 작동하고 있는 SAS VDMML 을 살펴보도록 할까요?
저의 경우, 어떤 화학적 인자가 와인의 품질을 예측하는 데 도움을 주었는지 분석하려고 합니다.
저는 SAS VDMML 의 데이터 준비 영역 기능을 통해 이미 데이터를 준비해 두었고,

English: 
my analysis by using advanced
machine learning techniques.
So I can very quickly
add in a neural network,
and before I build
my neural network,
the system gives
me an indication
of what I'm about to build.
So if I'm not familiar
with the neural network,
it shows me that it's about
to add in a network diagram
and various assessment metrics.
And it's very easy to
build this neural network.
I can just select my attributes
and the neural network
will build itself
in near real-time.
I can interact with
the neural network
by adding additional
hidden layers.
I can change any
of the activation
functions of the hidden
layers themselves.
I can also edit any of
the additional options.
I can even take advantage of
SAS's advanced auto-tuning
where the model
will automatically
find the best performing
attributes for me.

Korean: 
이제 고급 머신러닝 기법을 이용해서 데이터 분석을 탐색하고 확장하는 과정 중에 있습니다.
이를 통해 빠르게 신경망에 포함시킬 수 있고,
제가 신경망을 구축하기 전에 시스템은 제가 구축하려는 것에 대한 지시 사항을 제공합니다.
제가 신경망에 익숙하지 않더라도
시스템은 무엇을 네트워크 다이어그램과 다양한 평가 지표에 포함시키려고 하는지 보여줍니다.
게다가 이 신경망을 구축하는 것은 아주 간단해서
제가 속성을 선택하면 실시간으로 신경망이 자동 구축됩니다.
저는 은닉층(hidden layer)을 추가해서 신경망과 대화할 수 있고,
은닉층의 활성화 등 어느 활성화 기능이든 사용할 수 있습니다.
또 모든 추가 옵션을 편집하는 것도 가능합니다.
심지어 모델이 최고 성능을 내는 속성을 자동으로 찾아주는 SAS의 고급 오토 튜닝도 활용할 수 있습니다.

English: 
I can also interpret
my results by looking
at a relative importance plot.
Typically, machine learning
models are black box
and you're not
given an indication
of the most important factors
that drive your model.
LORRY HARDT: Jonathan,
you mentioned
in this latest release users can
rapidly expand their analyzes.
Can you give an example of that
type of analytic expansion?
JONATHAN WEXLER: Sure, Lorry,
within SAS Visual Data Mining
and Machine Learning, we
give users the ability
to enhance their interactive
models by mixing and matching
different techniques, applying
more advanced methods,
and even integrating
programming into their analyzes.
Let's go back to
that neural network.
What SAS Visual Data
Mining and Machine Learning
allows you to do is
expand this neural network
and build upon it by
creating a pipeline.
And by creating a
pipeline, this enables
me to try out different advanced
machine learning techniques.
And you'll see here that
the pipeline represents
all of the steps
that I took inside
the exploratory environment.
But now that I'm in
this more advanced view,

Korean: 
상대적으로 중요한 플롯을 살펴보고 결과를 해석할 수도 있습니다.
일반적으로 머신러닝 모델은 블랙박스와 같아서
여러분의 모델을 구동하는 가장 중요한 요소에 대한 정보를 제공하지 않는 것이 보통입니다.
이번 최신 출시버전에서 사용자가 분석을 빠르게 확장할 수 있다고 말하셨는데,
그런 유형의 분석 확장에 대한 예를 들어주실 수 있을까요?
물론이죠. SAS VDMML 을 통해 우리는 다양한 기법들을 조합하고, 고급 분석 방법을 적용하며,
심지어 프로그래밍을 분석에 통합시켜 사용자들이 대화형 모델을 강화할 수 있는 능력을 제공합니다.
이제, 신경망으로 한번 되돌아가볼까요?
SAS VDMML 을 통해 이 신경망을 확장하고 파이프라인을 생성해서 신경망 위에 구축할 수 있습니다.
그리고 파이프라인 생성을 통해 다양한 고급 머신러닝 기법들을 시험해볼 수도 있습니다.
여러분은 여기에서, 파이프라인은 탐색 환경 내부에서 진행한 모든 단계를 나타낸다는 것을 알 수 있으실 겁니다.

Korean: 
그러나 지금 저는 고급 보기로 각 단계를 확인할 수 있기 때문에 고급 기법을 사용할 수 있습니다.
예를 들어, 이상치(outlier)를 제거하거나 별도로 모델링해서 이상 탐지 기능을 시험해볼 수 있습니다.
게다가, 다른 고급 기법을 포함시킬 수도 있습니다.
의사 결정 트리 노드를 포함시킬 수도 있고, 그래디언트 부스팅 노드 같은 것을 포함시킬 수도 있어요.
뿐만 아니라 시스템이 최고 성능의 모델을 자동으로 선택해줍니다.
이제 결과를 살펴봅시다.
이 경우, 시스템은 KS 통계량이 가장 높은 그래디언트 부스팅 모델을 선택했고,
제가 구축한 대화형 신경망 및 의사 결정 트리와 비교를 수행했습니다.
시스템은 주어진 조건에서 최상의 모델을 선택해 준 것이지요.
저는 옵션을 변경해서 이 파이프라인을 맞춤화할 수도 있습니다.
즉, 저는 고급 분석을 위한 완전한 유연성을 확보한 거죠.
사용자들이 빠르게 협업하고 그들의 분석을 공유할 수 있다고 말씀하셨는데,
사용자들이 이런 우수 사례 템플릿을 어떻게 활용할 수 있나요?

English: 
I have more advanced
techniques available to me.
So for example, I can
try anomaly detection
to either remove outliers
or model them separately.
I can also add in other
advanced techniques.
I could add in a
decision tree node.
I can also add in, for example,
a gradient boosting node.
And the system
will automatically
pick the best
performing model for me.
Let's take a look
at the results.
In this case, it
picked the gradient
boosting model with the
highest KS statistic,
but it also compared itself to
the interactive neural network
that I built and a decision
tree that I added in.
The system automatically
picked the best model for me.
I can also customize this
pipeline by changing options.
I have complete flexibility
to enhance this analysis.
LORRY HARDT: Jonathan,
you mentioned
that users can quickly
collaborate and share
their analyzes.
How can users take advantage of
these best practice templates?

Korean: 
SAS는 SAS 툴박스에 저장된 다수의 우수 사례 템플릿을 제공합니다.
데이터 담당자들도 자체적인 파이프라인을 생성해 커뮤니티에서 공유할 수 있어요.
그리고 이는 비즈니스 분석가들에게 신속한 결과를 산출할 수 있는 능력을 부여합니다.
제가 이미 구축했던 파이프라인을 다시 살펴보면,
SAS 툴박스에 액세스하면
이를 통해 SAS 우수 사례 파이프라인을 활용할 수도 있고
이미 우수 사례로 검증이 완료된 제 동료의 파이프라인을 포함시킬 수도 있습니다.
이 우수 사례 파이프라인은 그래디언트 부스팅, 오토 튜닝 기능 사용,
그리고 심층 신경망까지 다양한 고급 기법을 결합했습니다.
심지어 SAS 코드를 활성화할 수 있는 기능도 있습니다.
자, 이제 실행시켜 볼까요?

English: 
JONATHAN WEXLER:
Out of the box, SAS
will provide a series of
best practice templates.
These are stored
in the SAS toolbox.
Data scientists can also
create their own pipelines
and share them with
the community, which
in turn, a business
analysts is empowered
to produce rapid results.
If we go back to the pipeline
that I've already built,
I can access the
SAS toolbox, which
allows me to take advantage
of either SAS best practice
pipelines, or even
add in a pipeline
from one of my coworkers,
a proven best practice.
Now this best practice
pipeline has a mix and match
of different advanced
techniques from gradient
boosting to using our
auto tuning to even
a deep neural network.
It even has the ability
to enable SAS code.
Let's run it.
And you can see it still
picked the gradient boosting

Korean: 
시스템이 가장 높은 KS 통계량이 있는 그래디언트 부스팅 모델을 여전히 선택했다는 것을 확인할 수 있죠.
그리고 앙상블 모델도 있어요.
제 의사 결정 트리에 대해 오토 튜닝을 했고 로지스틱 회귀와 심층 신경망도 포함시켰어요.
하지만 여전히 최고 모델은 그래디언트 부스팅이었습니다.
이 파이프라인은 사용자가 자체 코드를 작성할 수 있도록 지원한다는 것도 말씀 드렸는데요.
이 시스템은 사전 구축된 SAS 노드를 사용할 수 있을 뿐만 아니라 SAS 코드를 포함시킬 수도 있고,
완전한 SAS 언어를 자유자재로 사용해서 프로시져, 매크로, 데이터 스텝 등을 포함시킬 수 있어요.
이를 통해 여러분의 데이터를 위한 최고의 모델 구축을 실현할 수 있습니다.
분석 수명주기는 더 이상 논의 대상이 아니라는 말씀도 하셨는데요,
이에 대한 보충 설명이 필요할 것 같습니다.
완전한 모델이란 실행 능력과 함께 기업의 필요시 신속하게 대응할 수 있도록 하며
조치도 취할 수 있도록 해야 하는 것이지요.
우리는 개방된 세계에서 살고 있습니다.
이런 모델을 조직 내에서 내부적으로나 외부적으로 생산 과정에 구축하기 위한 능력에 대해 설명해주실 수 있을까요?

English: 
model, which had the
highest KS statistic.
It also had an ensemble
model in there.
It also did auto tuning
for my decision tree,
and it also added in
a logistic regression
and a deep neural network,
but the gradient boosting
was still the champion model.
Now I mentioned this
pipeline also enables
users to write their own code.
With this system, you can not
only use pre-built SAS nodes,
but you can also
add in SAS code,
and you have the
complete SAS language
available at your
fingertips to be
able to add in procedures,
macros, data step,
and so forth.
So you can really
build the best model
that makes sense for your data.
LORRY HARDT: One other
thought from you.
The analytic lifecycle
is no longer a debate.
It is necessary to support.
No model's complete unless
you get it into action,
enable businesses
to respond quickly,
and take action if needed.
Likewise, we live
in an open world.
Can you talk about
the ability to get
these models in production
internally and externally
within the organization?
JONATHAN WEXLER:
Absolutely, Lorry.

English: 
As the scale and
demand increases
for these properly
tuned analytic models,
having an effective deployment
strategy and architecture
is a key component in
the analytics lifecycle.
Let me take you
through a few steps.
So if I go back to
my pipeline, let's
take a look at how we can deploy
these models very quickly.
So if I go over to the
pipeline comparison area,
this screen will
compare the models
across the different
pipelines that I've built.
It will automatically pick
the best model for me.
Now I can override this
pipeline comparison,
I can even add in
challengers, but once I
have decided which model
or models I want to deploy,
the system enables you to
deploy these in the method
that you see fit.
You can publish these models
to databases or to Hadoop
with one click with no rewrite.
I can instantly
score these models
once they're pushed
to the database.
This allows for tremendous
flexibility in building
and testing models instantly.
I can also download
a scoring API.

Korean: 
물론이죠. 이처럼 알맞게 조정된 분석 모델에 대한 요구와 규모가 증가하면서
효과적인 적용 전략과 아키텍처를 보유하는 것이 분석 수명주기의 핵심 요소가 되었습니다.
그럼 몇 가지 단계를 살펴볼까요?
제 파이프라인으로 되돌아가서 이 모델이 어떻게 이렇게 빨리 구축되었는지 살펴 봅시다.
파이프라인 비교 영역의 검토를 실행하면
스크린에서는 제가 구축했던 다양한 파이프라인 전체의 모델들을 비교하는 화면이 나타납니다.
그리고 제게 가장 적합한 모델을 자동적으로 선택해줍니다.
이제 이 파이프라인 비교를 위해 다른 조건을 추가할 수도 있지만,
일단 어떤 모델을 적용할 것인지 결정하면 시스템은 적합한 방법을 통해 모델들을 적용할 수 있도록 지원합니다.
사용자는 이들 모델들을 다시 작성할 필요 없이 단 한번의 클릭으로 데이터베이스나 Hadoop에 저장 및 공유할 수 있습니다.
모델들이 데이터베이스에 푸싱되면 저는 곧 바로 모델들의 스코어를 매길 수 있습니다.
이처럼 굉장히 유연하게 모델을 구축하고 테스트할 수 있게 된 것입니다.
이 외에도 점수 부여 API를 다운로드할 수 있습니다.

English: 
This API call is given to
a user in multiple ways.
It's given to them
in a SAS wrapper,
but it's also
wrapped with Python.
So users have the
ability to call
these methods and the
score code in the method
that they see fit.
And if you had a
web application,
we'll even give you
the REST API call.
So you have the ability to
call these models in the way
that you see fit.
LORRY HARDT: Jonathan,
thanks so much for sharing
SAS Visual Data Mining and
Machine Learning with us today.
JONATHAN WEXLER: You're
very welcome, Lorry.
LORRY HARDT: Thanks
for watching.

Korean: 
API 호출은 여러 방식으로 사용자에게 제공되는데, SAS 래퍼로 제공되기도 하고 Python과 함께 래핑되기도 합니다.
따라서 사용자는 본인들이 적합하다고 생각하는 방식과 점수 코드를 호출할 수 있습니다.
또한 만약 웹 애플리케이션이 있는 경우, REST API 호출도 제공 가능하기 때문에
사용자들은 자신이 적합한 방식으로 이런 모델들을 호출할 수 있습니다.
오늘 SAS VDMML에 대해 설명해 주셔서 대단히 감사합니다.
저도 영광입니다.
시청해 주셔서 감사합니다.
문의사항은 SAS 코리아 홈페이지 상단의 Contact Us로 부탁드립니다. 감사합니다.
