ニューラルネットワークとディープラーニング-7
ニューラルネットワークとディープラーニング
amazon kindle版を出版しました。
畳み込み層
畳み込み層は画像認識の能力を飛躍的に向上刺さることができ、現在の標準的な画像認識のニューラルネットワークにはほとんど用いられています。畳み込み層はニューロンの特徴である。画像の特徴、例えば画像の境界面の抽出や形状を抽出するものとなります。
図5.2.1に畳み込み層を考慮したニューラルネットワークの構造を示します。畳み込み層は、画像の特徴量を抽出するフィルタの役目をします。プーリング層は、畳み込み層で抽出した特徴量を圧縮します。そして、プーリング層の出力をニューラルネットワークの入力とします。このような操作によって、画像から得られるデータの特徴が圧縮され学習でき、学習の効率化が実現できます。畳み込み層とプーリング層は複数用いられる場合が一般的です。本書では、画像が粗いため畳み込み層とプーリング層を1層用いることにします。カラーの画像を扱うときにはRGBそれぞれの畳み込み層、プーリング層を用います。また、ReLU(Rectified Linear Unit)層も用いています。
図5.2.1 畳み込み層を考慮したニューラルネットワークの構造
(1)畳み込み層
畳み込み層では、図に示すようにカーネル(フィルタ)を様々用意しておき、このカーネルを画像の各座標でスライドさせながら結果を出力します。カーネルによって特徴量が抽出されることになります。
図のように3×3のカーネルを用意し、それぞれの座標ごとに、カーネルを掛け合わせます。この掛けた結果を合計し、9で割った値を出力していきます。図(b)では、計算した結果を示します。数字の「1」は縦方向に強く結果が現れることが分かります。
(a)計算概要
(b)計算例
図5.2.2 畳み込み層の計算概要