ニューラルネットワークとディープラーニング-6
ニューラルネットワークとディープラーニング
amazon kindle版を出版しました。
手書き文字の認識
手書き文字で最もよく用いられるのがMNISTです。このデータセットは学習用でデータ60000枚と検証用データ10000枚の合計7万枚のデータになっています。
しかし、このデータで学習させると通常のPCでは、学習に時間がかかりすぎますので、optdigitsデータセットを用いて計算することにします。学習用データは3823枚、評価用データは1797枚あります。ここでは、評価用のデータ1797枚を学習することにします。学習データの1797枚の内20%の360枚を評価用データとします。
学習データの画像データの例は次のようになります。画像の大きさは8×8で0~16の画素の値があります。データの最初に出てくる0~9の数字を図で表すと次のようになります。