ディープラーニングの計算方法

AIが活躍する「分類」領域では、目覚ましい進化が起こっています。その一つがディープラーニングです。ディープラーニングと言えば、その歴史も面白いものです。初めにその存在が広まったのは、画像認識のコンテストでした。それまでの機械学習の限界を軽々と突破したことから注目されるようになったのです。驚かれるかもしれませんが、実は既に人間の画像認識能力を超えていると言われています。もちろん画像認識において、人間のように感情が生じるわけではありませんが、少なくとも分類作業については人間より優秀なのです。ウサギの画像を見て可愛いと思うことはできませんが、それをウサギであると認識することは可能なのです。機会が何故そのように分類することが可能なのかと言えば、データとデータの距離を認識しているからです。例えば直線距離であれば、それをユークリッド距離として処理しています。ユークリッド距離の値が大きいほど、見分けが付きやすいというわけです。もちろん変数は沢山ありますから計算は複雑なのですが、基本的には距離が類似度を決定するのだと言えます。距離の種類については、他にコサイン類似度、マハラノビス距離等が挙げられます。類似しているかどうかの比較対象は、いわゆる教師データが担います。すなわち、教師データに含まれていないものについては、類似度を測ることが出来ません。但し、教師なし学習ができる機械であれば可能です。さて、機械学習の主役に躍り出ているのがニューラルネットワークですが、そもそもニューラルネットワークの語源は生物学にあります。つまりモデルは人間の神経回路なのです。神経回路を数値化すれば、機械に応用できるという考えが根底にあることになります。この考えは結果的に正しいものでした。人間の脳はニューロンとシナプスの間を電気信号が走っており、正しくコンピュータのような構造になっています。これまで開発されてきたコンピュータは、この脳の構造によく似ています。脳は数百億のネットワークを構成しますが、コンピューターもそれに負けじと進化を遂げてきたのです。