GO-AHEADの日記

GO-AHEADで出版した書籍の紹介をします

ニューラルネットワークとディープラーニング-7

ニューラルネットワークディープラーニング

amazon kindleを出版しました。


 

畳み込み層
 畳み込み層は画像認識の能力を飛躍的に向上刺さることができ、現在の標準的な画像認識のニューラルネットワークにはほとんど用いられています。畳み込み層はニューロンの特徴である。画像の特徴、例えば画像の境界面の抽出や形状を抽出するものとなります。


 図5.2.1に畳み込み層を考慮したニューラルネットワークの構造を示します。畳み込み層は、画像の特徴量を抽出するフィルタの役目をします。プーリング層は、畳み込み層で抽出した特徴量を圧縮します。そして、プーリング層の出力をニューラルネットワークの入力とします。このような操作によって、画像から得られるデータの特徴が圧縮され学習でき、学習の効率化が実現できます。畳み込み層とプーリング層は複数用いられる場合が一般的です。本書では、画像が粗いため畳み込み層とプーリング層を1層用いることにします。カラーの画像を扱うときにはRGBそれぞれの畳み込み層、プーリング層を用います。また、ReLU(Rectified Linear Unit)層も用いています。

f:id:GO-AHEAD:20200212145559p:plain

図5.2.1 畳み込み層を考慮したニューラルネットワークの構造

 

(1)畳み込み層
 畳み込み層では、図に示すようにカーネル(フィルタ)を様々用意しておき、このカーネルを画像の各座標でスライドさせながら結果を出力します。カーネルによって特徴量が抽出されることになります。
 図のように3×3のカーネルを用意し、それぞれの座標ごとに、カーネルを掛け合わせます。この掛けた結果を合計し、9で割った値を出力していきます。図(b)では、計算した結果を示します。数字の「1」は縦方向に強く結果が現れることが分かります。

f:id:GO-AHEAD:20200212145641p:plain

(a)計算概要

f:id:GO-AHEAD:20200212145653p:plain


(b)計算例
図5.2.2 畳み込み層の計算概要