モモ果樹冬期せん定枝のニューラルネットワークによる識別

大島詩音

1. はじめに
岡山県のモモ果樹園でも近年の人手不足は深刻で，規模の大きな農家では，摘果作業や袋掛け，収穫作業等をアルバイトに頼っている。一方で，日当たりや果樹全体の栄養分配などを予測しながら行うせん定は，経験が必要な難しい作業である。本研究では，この作業の支援を目的として，せん定すべき枝の識別を画像処理によって行った。枝は様々な情報を有し，空間内では枝同士複雑な相互関係を形成しているが，今回は分岐部分に着目して，せん定したものとしなかったものを学習させた。

2. 実験装置および方法
モモの品種は「白鳳」で，樹勢が同様の果樹3本を選び，せん定作業の前後をデジタルカメラで撮影した。ニューラルネットワーク開発ツールにはSONYのNeural Network Consoleを用い，中間層2層の構成を用いて2値分類を行った。教師有り学習であるので，分岐部分の画像は手作業で正方形の領域で抽出し，せん定したものとしなかったものに分類した。画像処理では，分岐部分以外の背景には余分な情報が無いことが望ましいが，実際の現場では空を背景にできる一部のアングル以外では，他の枝の映り込みは避け得ない。そこで，背景に他の枝がある場合と無い場合，それらを合わせた場合それぞれで学習させて認識率を比較した。また，分岐部分の形に注目するためのグレースケール画像と，色にも注目するカラー画像とでも比較を行った。画像はそれぞれ50枚で，いずれも2割を評価用に用いた。また，学習回数は損失関数が十分小さくなるところを目安とした。

3. 実験結果及び考察
表1に評価用の画像の認識率を示す。学習と評価に使う画像をランダムに入れ替えて，3回学習を行わせた結果を平均した。グレースケール画像（グレー）の背景が空の場合，せん定しない枝をせん定しない（なし）と判定した確率が49.1 %で，せん定する枝をせん定する（あり）と判定した確率が87.8 %であったことを表す。グレースケール画像では，せん定の認識率がなしより高く，背景が空の場合が，枝の場合より高くなった。どちらも用いた複合の場合，なしはその中間的な値となったが，せん定は認識率が低下した。いずれの場合でも，なしは50 %以下であり，半分以上をせん定すると判定してしまっていた。これらのことから，グレースケール画像の場合は，一般的な画像処理と同様，注目すべき情報以外を排除することで認識率が向上するが，せん定しない画像の特徴を捉えることは難しいことが分かった。これに対してカラー画像の場合は，なしの認識率が高くなった。このことは，せん定しない画像の色情報には特徴があることを示唆しているが，目視では判断できなかった。
今回，空を背景とした画像を50枚程度しか取り出せなかったため，それが学習の制約条件となってしまった。そこで，画像を回転，反転加工して，400枚に増やした状態での比較も行った。結果を表2に示す。全ての条件で70 %以上となり，認識率が向上した。また，背景が空より，枝や複合の方が認識率が高い傾向であった。深層学習においては，より多様なデータバリエーションが，予測精度の向上に繋がるとされており，今回は2層構成であるが深層学習であるので，画像を増やしたことで認識率が高くなったと考えられた。
今回分岐部分にのみ注目して分類を行い，70 %以上の認識率を得ることが出来た。現場で支援するにはさらなる認識率の向上が必要であるが，今回背景に配慮した撮影は不要なことが分かったので，より容易な画像収集が可能となった。

表1　せん定ありとなしの認識率（%）

表2　画像400枚での認識率（%）