モモ果樹冬期せん定枝のニューラルネットワークによる識別

大島詩音

1. はじめに
岡山県のモモ果樹園でも近年の人手不足は深刻で,規模の大きな農家では,摘果作業や袋掛け,収穫作業等をアルバイトに頼っている。一方で,日当たりや果樹全体の栄養分配などを予測しながら行うせん定は,経験が必要な難しい作業である。本研究では,この作業の支援を目的として,せん定すべき枝の識別を画像処理によって行った。枝は様々な情報を有し,空間内では枝同士複雑な相互関係を形成しているが,今回は分岐部分に着目して,せん定したものとしなかったものを学習させた。

2. 実験装置および方法
モモの品種は「白鳳」で,樹勢が同様の果樹3本を選び,せん定作業の前後をデジタルカメラで撮影した。ニューラルネットワーク開発ツールにはSONYのNeural Network Consoleを用い,中間層2層の構成を用いて2値分類を行った。教師有り学習であるので,分岐部分の画像は手作業で正方形の領域で抽出し,せん定したものとしなかったものに分類した。画像処理では,分岐部分以外の背景には余分な情報が無いことが望ましいが,実際の現場では空を背景にできる一部のアングル以外では,他の枝の映り込みは避け得ない。そこで,背景に他の枝がある場合と無い場合,それらを合わせた場合それぞれで学習させて認識率を比較した。また,分岐部分の形に注目するためのグレースケール画像と,色にも注目するカラー画像とでも比較を行った。画像はそれぞれ50枚で,いずれも2割を評価用に用いた。また,学習回数は損失関数が十分小さくなるところを目安とした。

3. 実験結果及び考察
表1に評価用の画像の認識率を示す。学習と評価に使う画像をランダムに入れ替えて,3回学習を行わせた結果を平均した。グレースケール画像(グレー)の背景が空の場合,せん定しない枝をせん定しない(なし)と判定した確率が49.1 %で,せん定する枝をせん定する(あり)と判定した確率が87.8 %であったことを表す。グレースケール画像では,せん定の認識率がなしより高く,背景が空の場合が,枝の場合より高くなった。どちらも用いた複合の場合,なしはその中間的な値となったが,せん定は認識率が低下した。いずれの場合でも,なしは50 %以下であり,半分以上をせん定すると判定してしまっていた。これらのことから,グレースケール画像の場合は,一般的な画像処理と同様,注目すべき情報以外を排除することで認識率が向上するが,せん定しない画像の特徴を捉えることは難しいことが分かった。これに対してカラー画像の場合は,なしの認識率が高くなった。このことは,せん定しない画像の色情報には特徴があることを示唆しているが,目視では判断できなかった。
今回,空を背景とした画像を50枚程度しか取り出せなかったため,それが学習の制約条件となってしまった。そこで,画像を回転,反転加工して,400枚に増やした状態での比較も行った。結果を表2に示す。全ての条件で70 %以上となり,認識率が向上した。また,背景が空より,枝や複合の方が認識率が高い傾向であった。深層学習においては,より多様なデータバリエーションが,予測精度の向上に繋がるとされており,今回は2層構成であるが深層学習であるので,画像を増やしたことで認識率が高くなったと考えられた。
今回分岐部分にのみ注目して分類を行い,70 %以上の認識率を得ることが出来た。現場で支援するにはさらなる認識率の向上が必要であるが,今回背景に配慮した撮影は不要なことが分かったので,より容易な画像収集が可能となった。

表1 せん定ありとなしの認識率(%)
oshima1.jpg
表2 画像400枚での認識率(%)
oshima2.jpg