情報数理学特論 I 第06回

第5~8回は
 動画「What is Deep Learning? 」
の内容を学びます。

第8回の終わりに課題を出します。
指示に従い提出して下さい。

必要に応じて
 「字幕」を利用したり、
 「再生速度」を調整して、
内容を理解していきましょう。

以下、動画を理解する為のヒントを記載します。

What is Deep Learning?

第6回は
動画の
 2:31~5:12
の理解を目指します。

深層学習ベースで作られた
 チェス対戦ソフトウェア
 翻訳ソフトウェア
が強力な性能を見せたことや
その背景が解説されています。

 

■2:31~3:00

huge は とてつもなく大きい という意味で使われます。計算量が大きいとき時の「大きい」を表現する方法の1つです。

Garry Kasparov は人名です。チェスの元世界チャンピオン。人類の代表としてディープ・ブルーと対戦しました。

この辺りで、チェスの時代に通用したアプローチ、
つまり決定を繰返したアルゴリズムをベースとしたアプローチと
深層学習が異なるものだという流れを感じてみて下さい。

■3:01~3:30

これまでのチェスソフトのプログラムでは戦い方を人間が考えていたのに対し、
深層学習では何をセットアップとし、何を入力としているか、しっかりと把握してみましょう。

人間が30年以上かかった経験を、深層学習では短時間で得られる理由が何か、
話の流れから推測できていますか?
できていなければ、動画を繰返し視聴しておきましょう。

■3:30~4:00

alpha zero は コンピュータプログラム の名前です。こちらもニュースで世界中を騒がせたものですから、知っていると思います。

そして話題は ゲームから translating (翻訳)へ移行します。

■4:01~4:30

look-up table は 列挙タイプの表 を意味します。名簿とか、冊子版のシラバスなどがその例です。項目や調べそうなことをずらっと列挙し、必要な時に時間をかけて調べる仕組みになっています。項目が足りなかったり(例:古い名簿をみたため最近の転入性が書かれていないとき)、同様のことが複数書かれていて判別がつかなかったとき(例:名簿に同姓同名が数百人いるとき)などは、ミスが発生します。

web は 複雑なグラフ というイメージです。wwwの最後の w と同じ意味です。

REENACTMENT は計算機関係の用語ではありません。本題から離れる為解説しませんが、興味のある人はリエナクトメントで検索してみると良いでしょう。

expert は 専門家 という意味です。大学院博士後期課程を出ている人や、大学の教員などをイメージすれば良いでしょう。

linguists は 言語学者 を意味します。ところで、数学者って英語で書けますか?また、計算機科学者、情報理論研究者も英語で書けるようにしておきましょう。

音声にはなっていませんが、画面を見ていると「英語→スペイン語→英語」という流れで翻訳の性能チェックをしています。
この手の事は自分で行うと面白いので、色々な言語で試してみましょう。

 

■4:31~5:12

最近、自動翻訳の性能が高まったと言われています。この背景にも深層学習があります。動画を見て、どうして深層学習が優れているか、理由を掴んでみましょう。

error rate は 失敗が発生する確率 を意味します。ここでは翻訳に失敗する確率と捉えれば良いでしょう。
符号理論や情報理論を受講している方は「通信路の雑音によるエラー確率 じゃない!」ということを意識して欲しいです。そちらは「noise rate」とか「(ビット反転なら) flip probability」とか「(消失誤りなら)erasure probability」と表現します。一方で、符号理論や情報理論で「error rate」と言うと「復号して得られた推定語が、元来の符号語やメッセージと異なる確率」を意味します。
これらの区別になれるためには、符号理論や情報理論の英語の書籍を普段から読んでおくのが良い方法です。

recognizing a face は 顔認識 という意味です。人工知能系の分野や画像処理の分野では、認識を recognition と表現することが多いです。