ディープニューラルネットワーク(Deep Neural Network)とは、その名の通り「深い」構造を持つニューラルネットワークのことです。通常のニューラルネットワークが3層(入力層・隠れ層・出力層)で構成されているのに対し、ディープニューラルネットワークは何層もの隠れ層を持っています 。
(過去の記事「ニューラルネットワーク(NN)とは?AI技術の根幹をシンプルに解説」もご参照ください)
これは、建物の構造に例えると分かりやすいでしょう。シンプルな平屋建て(浅いネットワーク)では限られた機能しか持てませんが、高層ビル(深いネットワーク)では各階に異なる部署や機能を配置でき、より複雑な業務を行えます。
低層階では基本的な情報処理、中層階ではより専門的な分析、高層階では全体を見渡した意思決定というように、階層ごとに異なる役割があるのです。ディープニューラルネットワークも同様に、層の階層性を活かしてより複雑なパターンを認識できる仕組みだと言えます。
ディープニューラルネットワークの最大の特徴は、「階層的な特徴抽出」能力です。浅い層では単純な特徴を、深い層ではより抽象的で複雑な特徴を抽出します 。
(引用元:This is Rakuten Tech)
例えば、顔認識のディープニューラルネットワークでは、
4.最深層:「この人は誰か」を判断
というように、階層的に理解をしています。これは子どもの学習過程にも似ています。最初はアルファベットを覚え(基本要素)、次に単語を理解し(中間層)、やがて文章の意味(深い層)、そして文脈や含意(最深層)を理解できるようになります。
従来の(浅い)ニューラルネットワークでは、複雑な問題に対応するために、一つの層に大量のニューロンを用意する必要がありました。一方、ディープニューラルネットワークでは層を深くすることで、少ないニューロン数でも複雑な問題を解決できます。
これは、一つの大きな会議室で全員が同時に議論(浅いネットワーク)するよりも、小さなチームに分かれて段階的に問題を解決(深いネットワーク)していく方が効率的なのと似ています。
ディープニューラルネットワークの歴史で重要なのは「勾配消失問題」とその克服です。層が深くなるほど、学習時に必要な信号が層を伝わる間に弱まり、最初の層まで届かなくなる問題がありました。
これは、長い列でささやきゲームをするとメッセージが途中で変わってしまうのに似ています。この問題によって、長年ディープニューラルネットワークの実用化は困難とされていました。
しかし、2000年代後半から、事前学習などの新しい学習方法や強力なGPUの登場により、この問題が解決され、ディープニューラルネットワーク実用化の道が開かれたのです。
ディープニューラルネットワークは、現代AIの中核技術として、以下のようなさまざまな分野で活用されています。
●ゲームAI:複雑な戦略ゲームで人間に勝利
例えば、スマートフォンの顔認証やボイスアシスタント、翻訳アプリなど、私たちが日常的に使うテクノロジーの多くにディープニューラルネットワークが使われています。
ディープニューラルネットワークの登場は、AI技術に革命をもたらしました。これまでのAIは、人間があらかじめ「これが重要な特徴だ」と定義したパターンやルールに頼っていました。しかし、ディープニューラルネットワークでは「何が重要な特徴なのか」という発見作業そのものを、システムが自動的に行えるようになりました。
この「重要な特徴を自分で見つけ出す能力」こそが、ディープニューラルネットワークの本質であり、人間が気づかなかったパターンも発見できる強みです。今後もディープニューラルネットワークの発展は続き、より少ないデータでも効率的に学習できる手法や、より解釈しやすいモデルの研究が進んでいくでしょう。