
Japanese: 
チャールズ 調子はどうですか？
とてもいいです マイケルは？
私もです ありがとう
さて今日のトピックは何でしょう？
この画面からすると
アンサンブル学習とブースティングですか？
まさにそれです
これからお話しするのは
アンサンブル学習というアルゴリズムです
すでに学んだことにも関連します
そして特にブースティングが中心となります
アンサンブル学習の中で
私の一番のお気に入りです　始めましょうか
そうしましょう
それではまずこれから始めます
ちょっとした練習問題からです
ある問題について考えてみてください
特にスパムメールについて考えてください
それについてはよく考えますね
通常この分類タスクについて考える時は
何通かメールを受け取ってそれが
スパムか否かを決めます
今までに学んだことから考えると決定木の使用や

Chinese: 
Charles 过得怎么样？
非常好 Michael 你呢？
我也很好 谢谢
太好了 猜猜我们今天要讲什么？
看屏幕上的标题
应该是集成学习和 Boosting 之类
不错 这正是我们要讲的
我们要讲一类名叫“集成学习”的算法
你会发现
这类算法牵扯到我们一直在做的一些事
另外我们将重点花时间介绍 Boosting
Boosting 是我最喜欢的集成学习算法
准备好开始了吗？
开始吧
好 我先跟你做个小练习
我需要你考虑一个问题
具体来说
你需要考虑一个与垃圾邮件有关的问题
在这个问题上我想了很多
一般来说 我们都会把这个问题当成分类工作
我们先收到电子邮件 然后判断是不是垃圾邮件
根据我们到现在为止讲过的内容
我们在考虑这个问题的时候

Arabic: 
‫مرحبًا Charles، كيف الحال؟
‫>> الأمور على ما يرام يا Michael. كيف حالك أنت؟
‫>> بخير، شكرًا لك.
‫>> بخير، بخير. هل تتوقع ما سنتحدث عنه اليوم؟
‫>> حسنًا، بقراءة ما على هذه الشاشة، يبدو أنه
‫ قد يكون متعلقًا بطريقة التعليم بالتجميع، وخوارزمية التعزيز أيًا كان ذلك.
‫>> نعم، هذا بالضبط ما
‫ سنتحدث عنه. سنتحدث عن
‫ نوع من الخوارزميات يُسمى المتعلمات بالتجميع. وأعتقد أنك سترى
‫أنها مرتبطة ببعض ما نقوم به بالفعل،
‫وبشكل خاص سنقضي معظم أوقاتنا في التركيز على خوارزمية التعزيز.
‫لأن خوارزمية التعزيز هي المفضلة لدي
‫عند الحديث عن خوارزميات التعليم بالتجميع. لذا هل أنت جاهز لذلك؟
‫>> أجل! لنفعل ذلك.
‫>> حسنًا. إذن، أرغب في بدء ذلك
‫ من خلال إجراء تدريب صغير معك. أريد منك أن
‫ تفكر في مشكلة. حسنًا. والمشكلة
‫ المحددة التي أريدك أن تفكر فيها هي البريد الإلكتروني العشوائي.
‫>> اممم، أفكر فيها كثيرًا.
‫>> إذن، بشكل عادي، إذا اعتبرنا هذا الأمر مهمة
‫تصنيف، فعندها سنأخذ بعض رسائل البريد الإلكتروني، ثم نقرر
‫ما إذا كانت بريد عشوائي أم لا.
‫وبالنظر إلى ما تكلمنا عنه إلى الآن

English: 
Hey Charles, how's it goin'?
>> It's going pretty well Michael. How's it going with you?
>> Good, thank you.
>> Good, good, good. Guess what we're going to talk about today?
>> Well, reading off this screen, it looks
like maybe ensemble learning, and boosting, whatever that is.
>> Yes, that's exactly what we're
going to talk about. We're going to talk about
a class of algorithms called ensemble learners. And I think you will See
that they're related to some of the stuff that we've been doing already,
and in particular we're going to spend most of our time focusing on, boosting.
because boosting is my favorite of the
ensemble learning algorithms. So you ready for that?
>> Yeah! Let's do it.
>> Okay. So, I want to start this out by,
going through a little exercise with you. I want you
to think about a problem. Okay. And the particular
problem I want you to think about is, spam email.
>> Mm, I think about that a lot.
>> So, normally if we were thinking of this a classification
task, right, where we're going to take some email and we're going to decide
if it's spam or not. Given what we've talked about so
far we would be thinking about using a decision tree or

Portuguese: 
Como vai, Charles?
>> Muito bem, Michael. E você?
>> Bem, obrigado.
>> Muito bom. Adivinhe sobre o que vamos falar hoje?
>> Bem, lendo esta tela, parece que
talvez seja aprendizagem conjunta, e boosting, sei lá...
>> Sim, é exatamente sobre isso
que vamos falar. Vamos falar sobre
uma classe de algoritmos chamada aprendizes conjuntos. E acho que você verá
que eles estão relacionados a algum material que já abordamos.
Particularmente, vamos dedicar grande parte do nosso tempo falando sobre o boosting.
Porque o boosting é o meu algoritmo de aprendizagem
conjunta favorito. Então, você está preparado?
>> Sim! Vamos lá.
>> Certo. Então, quero começar
fazendo um pequeno exercício com você. Quero que você
pense em um problema. Certo. O problema sobre o qual
quero que você reflita é email de spam.
>> Hum, eu penso muito nisso.
>> Então, normalmente, se estivéssemos pensando nisso como uma tarefa de
classificação, na qual fôssemos usar um email e decidir
se ele é um spam ou não... Tendo como base o que abordamos até
aqui, pensaríamos em usar uma árvore de decisão,

Portuguese: 
redes neurais ou k e n, o que for aplicável ao
email. Sugeriríamos todos esses tipos
de coisas complicadas. Eu quero propor uma alternativa que
nos levará à aprendizagem conjunta. Certo? E esta é a alternativa.
Não quero que você tente pensar em alguma regra
complicada que possa descobrir e que capturaria o email de spam.
Em vez disso, quero que você descubra algumas regras simples
que sejam indicativas do email de spam. Serei mais
específico, Michael. Temos este problema relacionado ao email de spam. Ou seja,
você terá uma mensagem de email e precisa de algum programa de
computador que determine automaticamente se algo é um
spam ou não. E eu quero que você me ajude a
escrever um conjunto de regras que determinarão
isso. Quero que você pense em regras simples. Você pode
pensar em algumas regras simples que possam indicar que algo é um spam?
>> Tudo bem, eu posso. Sim, eu posso pensar em algumas regras simples. Só não sei se
elas seriam muito boas, mas seriam melhores que nada. Se, por exemplo,
ela mencionar meu grau de virilidade, eu estaria propenso a acreditar que

Japanese: 
ニューラルネットワークまたは
メールを意味するk近傍法など
そんな複雑なことばかり浮かんだでしょう
私が代わりに提案するのは
アンサンブル学習を可能にするものです
スパムメールを捕らえるような
複雑なルールは考えないでください
代わりにスパムの兆候になるような
単純なルールを考えてください
ではスパムメールに悩まされているとします
あなたはスパムメールを受け取ったどうかを
コンピュータに自動的に判断してほしい
それを実現するためのルールを
私に分かるように作ってください
メールがスパムメールだと定義するための
簡単なルールを考えることができますか？
いくつか考えられると思います
よいルールかどうかはともかく
何もないよりはマシです
もしメール本文が
男らしさをアピールする内容ならば

English: 
you know neural networks or kNN whatever that means
with email. We would be coming up with all of these sort
of complicated things. I want to propose an alternative which is
going to get us to ensemble learn. OK and here's the alternative.
I don't want you to try to think of some complicated
Rule that you might come up with that would capture spam email.
Instead, I want you to come up with some simple rules
that are indicative of spam email. Okay, so let me be
specific, Michael. We have this problem with spam email. That is,
you you're going to get some email message and you want some computer
program To figure out automatically for you if something is a
piece of spam or it isn't. And I want you to help
write a set of rules that'll help me to figure that
out. And I want you to think about simple rules, so can
you think of any simple rules that might indicate that something is spam?
>> Alright I can, yeah I can think of some simple rules. I don't think
they would be very good, but they might better than nothing. Like If for example
it mentions how manly I am, I, I would be, be willing to believe that

Chinese: 
会用到决策树、神经网络、kNN 等等能用于电子邮件的内容
我们会遇到所有这些复杂内容
我希望用另外一种方法
这种方法能帮助我们明白“集成学习” 方法是这样的
我们不去考虑捕捉垃圾邮件
所用的那些复杂规则
我需要你想一些象征性的规则来挑出垃圾邮件
Michael 下面我具体说一下这个方法
我们要解决垃圾邮件问题 这个问题是这样的
你会收到许多电子邮件
你希望计算机程序能自动挑出垃圾邮件和正常邮件
我需要你帮我写一些规则
以实现筛选邮件的目的
你需要想一些简单规则
你能不能想到任何能表明邮件属于垃圾邮件的简单规则？
我可以想到一些简单规则
我想到的可能不是最恰当的 但总比什么都想不到强
比如说 如果邮件中提到我多么有男人味 我会觉得收到了垃圾邮件

Arabic: 
‫سنفكر في استخدام شجرة القرار أو الشبكة العصبونية أو شبكة "k and n"
‫،أيًا كان ذلك يعني مع البريد الإلكتروني. سنجد أنفسنا أمام جميع هذه الأنواع
‫من الأشياء المعقدة. لذا، أرغب في اقتراح بديل
‫سيؤدي إلى الوصول بنا إلى التعليم بالتجميع. وهذا هو البديل.
‫لا أريد منك محاولة التفكير في قاعدة
‫معقدة قد تصل إليها من شأنها اكتشاف رسائل البريد الإلكتروني العشوائي.
‫وبدلًا من ذلك، أريدك أن تصل إلى بعض القواعد البسيطة
‫ التي من شأنها الإشارة إلى رسائل البريد الإلكتروني العشوائي. لذا دعنا نكون أكثر
‫وضوحًا، يا Michael. لدينا هذه المشكلة مع رسائل البريد الإلكتروني العشوائي. بمعنى،
‫ستأخذ بعض رسائل البريد الإلكتروني وتطلب
‫من برنامج على جهاز كمبيوتر أن يكتشف تلقائيًا
‫ما إذا كانت عشوائية أم لا. وأريد منك المساعدة في
‫كتابة مجموعة من القواعد لمساعدتي في اكتشاف
‫ذلك. وأريد منك التفكير في قواعد بسيطة، لذا هل بإمكانك
‫التفكير في أية قواعد بسيطة يمكنها الإشارة إلى أن هناك رسالة بريد عشوائي؟
‫>> حسنًا يمكنني التفكير في بعض القواعد البسيطة. ولا أعتقد أنها
‫ستكون جيدة جدًا، ولكنها ستكون أفضل من لا شيء. مثل، إذا ذكرت
‫الرسالة، على سبيل المثال، ما يتعلق بمدى رجولتي، فعندها سأعتقد

Portuguese: 
era uma mensagem de spam. Então, por exemplo, se o corpo da mensagem contiver a palavra "mainly" (viril).
>> Certo, eu gosto disso. Gosto. Quando o corpo
contém a palavra "manly".
Eu gosto dessa regra porque geralmente recebo mensagens que não são spam e contém a palavra
"manly". Então eu acho que o spam de um homem é o email normal de outro homem.
>> [LAUGH] Acho que sim.
>> Provavelmente. Alguma outra regra?
>> Claro. Se a mensagem for enviada por minha esposa, provavelmente não é spam.
>> OK, então, vejamos... da esposa.
>> O nome dela é Lisa. Agora vamos chamá-la de esposa. Então,
digamos, menos... vou colocar um sinal de mais aqui, então sabemos que
algumas regras indicam que é spam, enquanto
outras indicam que não é spam. Certo. Algo mais?
>> Possivelmente o tamanho da mensagem. Eu acho. O que, por exemplo?
>> Eu não sei. Não sei se isso seria muito
preciso, mas eu acho que alguns spams que recebo
às vezes são muito curtos, do tamanho da
URL. Do tipo... verifique este site, e lá está apenas uma URL.

Japanese: 
私はそのメールを
スパムメールだと認識するでしょうね
いいですね　メールの本文に
“男らしさ”が含まれる場合
いいルールです
頻繁にそんなメールを受け取りますが
スパムと感じる人もいればその逆もあるわけですね
そういうこともありそうですね
他に何かルールはありますか？
仮に配偶者からのメールならば
スパムではないでしょう
なるほど　差出人が配偶者の場合ですね
名前はリサにしましょう
いや 配偶者と呼びます
こちらが負でこちらは正にしましょう
スパムであることを示すルールと
スパムでないことを示すルールができました
他には？
メール本文の長さでしょうか
例えば？
正しいかは分かりませんが
いくつかのスパムの中には
URLのように短いものもあります
閲覧を促す一言とURLだけの内容のものです

Arabic: 
‫ أنها رسالة بريد إلكتروني عشوائي. إذن إذا كان نص الرسالة يحتوي على كلمة رجولة.
‫>> حسنًا، جيد أنك ذكرت ذلك. عندما يحتوي
‫النص على كلمة رجولة.
‫أحب هذه القاعدة، نظرًا لاستلامي في كثير من الأحيان رسائل بريد إلكتروني غير عشوائية تتحدث عن
‫الرجولة. لذا أظن أن رسالة البريد الإلكتروني العشوائية لدى شخص هي رسالة بريد إلكتروني عادية لدى شخص آخر.
‫>> [LAUGH] أعتقد أن هذا صحيح.
‫>> على الأرجح. هل لديك قواعد أخرى؟
‫>> بالتأكيد، إذا كانت الرسالة من زوجتي، فعلى الأرجح أنها ليست عشوائية.
‫>> حسنًا، إذن دعنا نرى، رسالة واردة من الزوجة.
‫>> اسمها ليسا. لا سنسميها "زوجة". ومن ثم
‫دعنا نقول "سالب"، وسأضع علامة الموجب هنا، إذن نحن نعرف
‫أن بعض القواعد تشير إلى الرسالة العشوائية، بينما بعض
‫القواعد الأخرى تشير إلى أن الرسالة ليست عشوائية. حسنًا، هل هناك شيء آخر؟
‫>> من المحتمل طول الرسالة. على ما أعتقد. مثل ماذا؟
‫>> لا أعرف. لا أدري مدى دقة
‫ذلك، لكن أعتقد أن بعض الرسائل العشوائية التي
‫أستلمها في بعض الأحيان تكون قصيرة للغاية، تكون على سبيل المثال عنوان
‫URL. مثل، هيا تعرف على هذا الموقع، ويكون بها عنوان URL.

Chinese: 
正文里包含“男人味”字样的邮件对我来说就是垃圾邮件
不错
正文包含“男人味”这个规则不错
我经常收到谈及男人味的正常邮件
由此看来 在一个人看来是垃圾的邮件在其他人看来可能是正常邮件
我觉得也是这样
或许吧 还有其他规则吗？
有 我妻子发来的邮件应该不属于垃圾邮件
好的 我记一下 妻子发来的
我妻子叫 Lisa 我们这里就笼统记作妻子
记个减号 在这里记个加号
这样我们就能区分哪些规则表明邮件是垃圾邮件
哪些表明邮件是正常邮件 还有吗？
— 我觉得邮件长度应该也算吧 — 能具体说说吗？
说不太好 我也没法准确描述
我只是觉得
有时候我收到的垃圾邮件内容很短
有的只包含一个网址 比如说 嗨 看看这个网站 然后下面给出网址

English: 
was a spam message. So like if the body of the message contains the word manly.
>> Okay, I like that. like that when body
contains manly.
I like that rule, because I often get non-spam messages talking about
manly. So I guess one man's spam is another man's normal email.
>> [LAUGH] I guess that's true.
>> Probably. Any other rules?
>> Sure if it, you know if it comes from my spouse it's probably not spam.
>> OK, so let's see, from spouse.
>> Her name's Lisa. Now we're going to call our spouse. So
let's say minus, I'm going to go to plus here, so we know
some rules are indicitive of being spam, and some
rules are indicitive of not being spam. Okay, anything else?
>> Possibly the length of the message. I guess. Like what?
>> I don't know. I don't know that this would be very
accurate, but I think some of this, some of the spam I
get sometimes is very, very short just like the, it's like the
URL. Like hey, check out this site, and then there's a URL.

Chinese: 
不错 内容短 只包含网址
这些规则不错 我们想想还有没有其他规则
这个规则怎么样 只包含图片
嗯
我收到过不少只包含图片的垃圾邮件
我知道有的邮件点开以后
里面全是各种加拿大药物的图片
没错 还有这种邮件 我也收到很多
嗯
很多故意写错
仔细看又能读懂的字词
嗯 我不知道这种规则应该怎么表达
或许可以列举这类字词
通过规则列举使用这种方式修改的字词
我想是的
有点像是黑名单 由词语组成的黑名单
就像我说的“男人味”你说的“prawn”
对 就是这种词
这种词不胜枚举 对吗？垃圾邮件里还有一个知名度挺高的用语
年龄稍大点的人都应该还记得这个吧？

Arabic: 
‫>> اممم، رائع. إذن، سنقول قصيرة.
‫بها عناوين URL فقط. اممم، جيد أنك ذكرت تلك القواعد. دعنا نرى ما إذا كان بإمكاننا
‫التفكير في أي شيء آخر. آه، ماذا عن هذه. هذه صورة فحسب.
‫>> مم.
‫>> أحصل على الكثير من تلك حيث توجد صورة فحسب.
‫>> صحيح، وإذا نظرت
‫ إلى الصورة يتضح أنها حول مستحضرات صيدلانية من Canada.
‫>> بالضبط. وهذه أحصل عليها كثيرًا.
‫>> اممم،
‫>> الكثير من الكلمات ذات التهجئة الخطأ والتي ينتهي بك المطاف بقراءتها على أنها
‫كلمة حقيقية.
‫>> مم. لكن لا أعرف كيفية كتابة ذلك
‫كقاعدة. أو بإمكانك سرد الكلمات فحسب.
‫>> مثل القواعد أو الكلمات التي
‫تم تعديلها بالفعل بهذه الطريقة. أظن ذلك.
‫>> نعم، نوع من القوائم السوداء للكلمات.
‫>> حسنًا إذن، كلمات مثل، سأقول "رجولة"، وأنت تقول "برون".
‫>> أو مهما كان القول. نعم، هناك الكثير والكثير
‫منها. أليس كذلك؟ أقصد، واحدة أخرى مشهورة جدًا
‫ ستتذكرها إذا كنت كبيرًا في السن إلى حد ما، هل تتذكر هذه؟

Portuguese: 
>> Hum, eu gosto dessa. Então diremos apenas "short" (curto).
Contém apenas URLs. Hum, eu gosto dessas regras. Vamos ver se conseguimos
pensar em algo mais. Ah, o que acha desta? É apenas uma imagem.
>> Hum.
>> Eu recebo muitos daqueles que contêm apenas uma imagem.
>> Sei... e, quando você
olha a imagem, são vários produtos farmacêuticos do Canadá.
>> Exatamente. Este aqui é um tipo que recebo muito.
>> Hum.
>> Muitas palavras com erro ortográfico que você acaba lendo como se fosse
uma palavra real.
>> Hum. Mas eu não sei como escreveria isso
como uma regra. Ou você poderia simplesmente listar as palavras.
>> Como regras que... palavras que já
foram modificadas dessa forma. Acho que sim.
>> Sim, uma espécie de lista negra... uma lista negra de palavras.
>> Certo. Então palavras como... eu diria "manly" (viril), mas você estava dizendo "prawn" (camarão).
>> Seja lá o que for, existe uma tonelada
delas. Certo? Outra que é muito popular,
se você tiver idade suficiente, é esta aqui, lembra dela?

Japanese: 
いいですね　短いメールとしましょう
URLだけのメールも追加します　いいですね
画像のみのメールはどうでしょうか？
なるほど
私にはよく画像のみのメールが届きます
なるほど　画像を開くと
カナダの製薬会社のものだったり
まさに私がよく受け取るものです
そうですか
メールを読み進めると
単語のスペルミスだらけだったりします
でもどのようなルールとして
書いたらよいのか分かりません
ただ単語をリストアップしてもよいでしょう
ではルールとして例えば
“こういうふうに間違えた単語”とか
ええ　単語のブラックリストのようですね
私は“男らしい”と言いましたが
あなたは“バカ”だと
そんな感じのものがたくさんあるわけです
もう1つのよく使われるものはこれです
もしあなたがいい年ならばこれを覚えていますか？

English: 
>> Hm, I like that. So, we'll just say short.
Just contains URLs. Hm, I like those rules. Let's see if we can
think of anything else. Oh, how about this one. It's just an image.
>> Hm.
>> I get a lot of those where it's just an image.
>> I see, like in it's it's and if you
look at the picture it's all various pharmaceuticals from Canada.
>> Exactly. Here's one I get a lot.
>> Hm,
>> Lots of misspelled words that you end up reading as being
a real word.
>> Hm. But I don't know how I'd write that
as a rule. Or you could just list the words.
>> Like rules that, words that have already
been modified in that way. I guess so.
>> Yeah, kind of a, kind of a black list, a black list of words.
>> Okay so, words like, I would say manly, but you were saying prawn.
>> Or whatever that says. yeah, so they're and they're tons
of these. Right? I mean, another one that's, that's very popular
if you're old enough anyway is this one, remember this one?

English: 
>> Oh, sure that was sometimes a virus, right?
>> Yes. Our young, our younger viewers will not know this but this was one
of the first big spam messages that would
get out there. Make money fast. And there's
tons and tons of these. We could come up with a bunch of them. Now, here's
something they all kind of have in common,
Michael, and you've touched on this all ready.
All of them are sort of right. They're useful but no one of them is going to be
very good at telling us whether a message has
spam on its own. Right. So the word manly is
evidence but it's not enough to decide whether something
is spam or not. It's from your spouse, it's evidence
it's not spam, but sometimes you get messages from
your spouse that are in fact spam, because in fact,
she didn't actually send them. You know, and so
on and so forth. And sometimes she did email
from Princes in Nigeria. I didn't. And they're not
always spam. I, I actually do, but any case,
sometimes people are asking you for money, and maybe
that's message you want to ignore, but it isn't

Portuguese: 
>> Ah, sim, às vezes era vírus, certo?
>> Sim. Nossos espectadores mais jovens não saberão disso, mas essa foi uma
das primeiras mensagens de spam que
surgiram. Make money fast. Há toneladas e
mais toneladas delas. Poderíamos citar várias. Agora, aqui está
algo que todas elas têm em comum,
Michael, e você já falou.
Todas elas estão certas, de certo modo. Elas são úteis, mas nenhuma delas será
muito boa a ponto de nos dizer se uma mensagem é
spam. Certo. Portanto, a palavra "manly" (viril) é uma
evidência, mas isso não é suficiente para decidir se algo
é spam ou não. É da sua esposa, é evidência,
não é spam, mas às vezes você recebe mensagens da
sua esposa que são spam, porque
ela, na verdade, não as enviou. E por aí
vai. E, às vezes, ela recebeu mesmo um email
do Príncipe da Nigéria. Eu não recebo. E elas nem sempre são
spams. Eu, na verdade, recebo, mas em todo caso,
às vezes as pessoas estão pedindo dinheiro a você e talvez
essa seja a mensagem que você queira ignorar, mas ela não é

Japanese: 
はい　時々ウイルスになるものですよね
ええ 若い受講生はご存じないかもしれませんが
元祖スパムメッセージの1つです
“手早く稼ごう”
本当に数が多いので すぐ考えつくことができます
これらすべてに共通点があります
マイケル これはすでに扱いましたね
それらすべては大体正しいですね
ただそれらは便利だが1つも
スパムメールかを示すものはありません
ですから“男らしい”という単語は根拠にはなるが
スパムか否かの決定には不十分です
配偶者からのメールはスパムでないという
根拠があると思えますがそれが時として
実はスパムであることがあります
真の差出人が彼女ではないからです
あり得ることです　そして時々彼女が
ナイジェリアの王子とメールをしていました
それらのメールが
いつもスパムなわけではありません　私と違って
時に人はあなたにお金を請うことがあるでしょう
無視したいと思っても

Arabic: 
‫>> أوه، بالتأكيد كانت تمثل في بعض الأحيان رسالة فيروس، أليس كذلك؟
‫>> بلى. لن يعرف مشاهدونا الصغار هذا الأمر ولكنها كانت
‫أولى رسائل البريد العشوائي الشهيرة
‫التي تصل إلينا. احصل على المال بسرعة. وهناك الكثير والكثير
‫منها. سينتهي بنا المطاف إلى مجموعة منها. والآن، هناك
‫ شيء تشترك فيه جميع القواعد
‫Michael، وأنت لمست ذلك بالفعل.
‫فجميعها تمثل جزءًا من الحقيقة. وجميعها مفيدة، إلا أن أي منها
‫ لم يتمكن من إخبارنا بشكل دقيق ما إذا كانت الرسالة
‫عشوائية أم لا. صحيح. إذن كلمة "رجولة"
‫تمثل دليلًا ولكنه ليس كافيًا لنقرر ما إذا كانت الرسالة
‫عشوائية أم لا. وكون الرسالة من زوجتك، فذاك دليل
‫ على أنها ليست عشوائية، ولكن في بعض الأحيان تستلم رسائل على أنها من
‫زوجتك، وتكون في الحقيقة رسالة عشوائية،
‫لأن الزوجة لم ترسلها في الواقع. وهكذا
‫وهلم جرا. وفي بعض الأحيان تحصل على رسالة بريد إلكتروني من
‫أمراء في نيجيريا. مثلما حدث لي. ولا تكون
‫دائمًا رسائل عشوائية. لقد حدث لي ذلك بالفعل، ولكن على أي حال،
‫في بعض الأحيان تكون عن أشخاص يطلبون منك نقود، وربما
‫ترغب في تجاهل هذه الرسالة، ولكنها ليست

Chinese: 
想起来了 这句话以前曾病毒式传播过吧？
是的 比较年轻的观众可能不知道这句话
这可是历史上最早大规模传播的垃圾信息
“快速生财之道”
类似的垃圾信息不胜枚举 我们可以想出一大堆
这些规则有个共同点
Michael 你应该已经接触过了
所有这些规则都有几分正确 它们都很有用
但是没有一个能单独地确凿证明邮件是垃圾邮件
是的 虽然出现“男人味”这个词表明邮件可能是垃圾邮件
但无法充分确定邮件是否真的是垃圾邮件
如果邮件来自你妻子
则有证据表明邮件不是垃圾邮件
但有时候 你妻子发给你的实际上也是垃圾邮件
因为邮件实际上并不是真是你妻子发给你的
诸如此类的例子还有许多
有时候你收到来自“尼日利亚王子”的电子邮件
说真的 这种邮件也不见得一定是垃圾邮件
不管怎么说 有时候别人会跟你要钱
可能你会忽略这样的邮件

English: 
necessarily spam. And some people are very interested in
getting like this and don't consider it spam, right?
>> So, so, okay, so I can see that these would
all maybe provide some evidence, but it seems really hard tp figure out the
right way of combining them all together to I don't know, make a decision.
>> Right, this is exactly right. And by the
way, if you think about something like decision tree, you
could. There's really a sort of similar problem going on
there. We can think of each of the nodes in
a decision tree as being a very simple rule and
the decision tree tells us how to combine them. Right?
So, we need to figure out how to do that
here and that is the fundamental notion of ensemble learning.
>> But wait, isn't, couldn't you also do something similar with
something like neural net. Right? Where each of these now becomes a
feature and we're just trying to learn weights for combining them
all together. So That would kind of satisfy what you were talking about.
>> True, I mean I think the the difference here in this case and
and I think you're absolutely right but
one difference here is that typically with the
new network we've already built the network
itself and the nodes and we're trying
to learn the weights whereas in something
like a decision tree you're building up rules

Portuguese: 
necessariamente spam. E algumas pessoas estão muito interessadas em
receber mensagens com essas e não a consideram spam, certo?
>> Certo, certo, tudo bem. Então eu vejo que tudo isso
talvez forneça alguma evidência, mas parece que é realmente difícil determinar a
maneira certa de combiná-las para... sei lá... tomar uma decisão.
>> Certo. É exatamente isso. E, a
propósito, se você pensar em algo como uma árvore de decisão, você
poderia. Há realmente um problema similar
envolvido aqui. Podemos pensar em cada um dos nós de
uma árvore de decisão como uma regra muito simples e
a árvore de decisão nos diz como combiná-los. Certo?
Então, precisamos determinar como fazer isso
aqui, e essa é a noção fundamental da aprendizagem conjunta.
>> Mas, espere aí... não é... você não poderia também usar algo similar com
uma espécie de rede neural? Certo? Em que cada um deles agora se torne uma
característica e nós apenas tentemos aprender formas de
combiná-los. Isso corresponderia ao que você está falando.
>> Verdade. Acho que a diferença aqui, neste caso, e
acho que você está absolutamente certo, mas
uma diferença aqui é que geralmente com a
nova rede que já construímos, a rede
propriamente e os nós, e estamos tentando
aprender os pesos, ao passo que em algo
como uma árvore de decisão, você está criando regras

Chinese: 
但这样的邮件却不一定就是垃圾邮件 甚至还有人对这种邮件很感兴趣
并不认为这是垃圾邮件 对吧？
是的
我觉得 虽然这些规则能提供一些证据
但是很难结合这些规则作出最终判断
完全正确
另外 你也可以用决策树的方式来想这个问题
这个问题也属于类似决策树的问题
我们可以将决策树中的每个节点
视作简单规则
决策树可以告诉我们如何把这些规则结合在一起 对吗？
我们要做的就是怎么实现这一点
这也正是集成学习的基本概念
等等
我们能不能用使用类似于神经网络的方法呢？
将每个规则视作一个特征 然后我们学习权重
从而把规则结合起来 这样也能满足你所说的要求
是的 你说的完全正确
我的意思是
这个例子中的不同之处在于
在使用神经网络时
我们已经建立好了网络和节点本身
我们尝试学习各节点的权重
而在决策树中 你是随着过程的进行逐渐建立规则

Arabic: 
‫بالضرورة رسالة عشوائية. وهناك بعض الأشخاص مهتمون جدًا
‫بالحصول على مثل هذه الرسائل ولا يعتبرونها من رسائل البريد الإلكتروني العشوائي، أليس كذلك؟
‫>> إذن، حسنًا، أنا أدرك أن
‫جميع هذه القواعد قد توفر بعض الأدلة، ولكن يبدو أنه من الصعب بالفعل اكتشاف
‫ الطريقة الصحيحة لدمجها جميعًا لكي نصل إلى قرار.
‫>> هذا صحيح تمامًا. وبالمناسبة،
‫إذا فكرت في شيء مثل شجرة القرار،
‫فستجد بالفعل مشكلة مماثلة
‫تواجهك. يمكننا اعتبار كل عقدة في
‫شجرة القرار كقاعدة بسيطة جدًا وستخبرنا
‫شجرة القرار بكيفية دمجها. أليس كذلك؟
‫إذن نحتاج إلى اكتشاف كيفية القيام بذلك
‫هنا وهذه هي الفكرة الأساسية لنظرية التعليم بالتجميع.
‫>> ولكن انتظر، ألا يمكنك أيضًا القيام بشيء مماثل باستخدام
‫شيء مثل الشبكة العصبونية. أليس كذلك؟ حيث أصبح الآن كل منها
‫ميزة، ونحن نحاول فقط تعلم طرق دمجها
‫جميعًا معًا. وبالتالي يتضح بشكل أكثر ما كنا نتحدث عنه.
‫>> صحيح، أعتقد أنك على صواب بالتأكيد
‫ولكن
‫هناك فارق واحد في هذه الحالة هنا
‫فعادة، مع الشبكة الجديدة، نقوم بالفعل ببناء الشبكة
‫ذاتها والعُقد ونحاول
‫تعلم الموازين بينما في شيء
‫مثل شجرة القرار أنت تقوم ببناء القواعد

Japanese: 
必ずしもスパムではなく こういうメッセージに
興味がある人はそれがスパムとは思いません
分かりました
それらは根拠を与えるかもしれないが
これらのルールを組み合わせて
意思決定をするのはとても難しそうです
そうですね　まさにそのとおりです
決定木のことを思いつくかもしれませんが
類似する問題がそこにはあるのです
決定木の各ノードを単純なルールとしてやれば
決定木がルールの組み合わせ方を教えてくれます
ではどうやってそれを実現するのでしょうか？
これがまさにアンサンブル学習の
基本的な概念なのです
しかしニューラルネットはダメですか？
これらのルールを特徴として
その組み合わせ方を学習するので
ピッタリな気がします
ええ　ただ私が言いたいのは
もちろんあなたも正しいと思います
しかしここで1つ違うのは
ニューラルネットではすでにネットワークと
ノードがあり その重みを学習するわけですが
一方アンサンブル学習ではルールを構築するのです

English: 
as you go along. And typically with ensemble learning you're building up a
bunch of rules and combining them together until you got something that's good
enough. But you're absolutely right. You
could think of neural networks as being
an ensemble of little parts. Sometimes
hard to understand, but an ensemble nonetheless.

Arabic: 
‫ بمرور الوقت. وعادة مع التعليم بالتجميع نقوم ببناء
‫مجموعة من القواعد ودمجها معًا حتى تحصل على شيء
‫جيد بما يكفي. ولكنك على صواب بالتأكيد. يمكنك
‫اعتبار شبكات [UNKNOWN] كمجموعة
‫تتكون من أجزاء صغيرة. أحيانًا
‫يكون من الصعب فهم ذلك، لكن عن التجميع يزول ذلك.

Japanese: 
一般的にアンサンブル学習は
十分な結果を得られるまで
多くのルールを作ったり組み合わせたりします
しかしあなたは正しいです
ニューラルネットは小さい部品の
アンサンブル（集まり）だと考えることもできます
理解し難いですがやはりアンサンブルなのです

Portuguese: 
durante o processo. E geralmente, com a aprendizagem conjunta, você está criando uma
série de regras e combinando-as até obter algo que seja bom o
suficiente. Mas você está absolutamente certo. Você
poderia pensar em redes [UNKNOWN] como
um conjunto de pequenas partes. Às vezes,
difícil de entender, mas um conjunto.

Chinese: 
在集成学习中 你通常要建立一堆规则
然后合并这些规则 直到得出足够好的结果
你说的完全正确
你可以把神经网络想象成小零件的集合
虽然有时候不好理解
但集成就是这样
