glnet による空撮画像のセマンティックセグメンテーション 小倉...

1
補助ブランチを導入した GLNet による空撮画像のセマンティックセグメンテーション EP16025 小倉一真 指導教授:山下隆義 1. はじめに 超高解像度画像のセマンティックセグメンテーションは, 広域の情報を迅速に把握するための手段として,需要が高 まっている.CNN を用いた超高解像度画像のセマンティッ クセグメンテーションでは,推論時にメモリ使用量が大幅 に増加する.GLNet[1] は,ダウンサンプリングを行った画 像とパッチで切り分けた画像を使用することにより,メモ リ使用量を抑えた手法である.しかし,GLNet はダウンサ ンプリングによる解像度の低下により,小さなオブジェク トの識別が困難である.そこで本研究では,GLNet にパッ チ分解サイズを大きくした画像を入力する補助ブランチを 追加することでメモリ使用量を抑えつつ精度向上を図る. 2.GLNet GLNet は,ダウンサンプリングした画像を入力するグ ローバルブランチと,パッチ画像を入力するローカルブラ ンチから構成される.GLNet の処理の流れを図 1 に示す. 各ブランチの特徴マップを共有することにより,ダウンサ ンプリングのみを使用した際の問題点であるジャギーの影 響を緩和することが可能である. Local Branch Global Branch patches downsample Prediction Regularization Aggregation deep feature map sharing Global Local 500×500 500×500 Input Image 2448×2448 1: GLNet の処理の流れ 3. 提案手法 GLNet ではダウンサンプリングによる局所領域の情報 の損失が多いため,小さなオブジェクトのセマンティックセ グメンテーションが困難である.そこで本研究では,パッ チ分割サイズを大きくした画像を入力する補助ブランチを 導入することで,局所領域の特徴の損失を抑制する手法を 提案する. 3.1. 補助ブランチを導入した GLNet ネットワークは全体をダウンサンプリングした画像を入 力するグローバルブランチとパッチ画像を入力するローカ ルブランチ,パッチ分割サイズを大きくし,ダウンンサン プリングを行った画像を入力する補助ブランチで構成され る.ローカルブランチに入力する画像は重なりを考慮して 作成する.図 2 にネットワークの構造と特徴マップ共有の 流れを示す.補助ブランチはグローバルブランチと特徴マッ プ共有を行うことで,大域の特徴を取得できる.また,補 助ブランチはグローバルブランチよりも高い解像度を入力 するため,細部の情報の欠落を抑えることが可能である. ローカルブランチからグローバルブランチへの特徴マップ 共有を行わないことで補助ブランチの追加によるメモリ使 用量の増加を抑制する. Local patch 1 patch 2 patch N Auxiliary Auxiliary Global Auxiliary Auxiliary Local patch 1 patch N patch 2 Auxiliary Branch Local Branch Global Branch downsample Input Image patches downsample Prediction Regularization Aggregation deep feature map sharing Global Local Auxiliary patches 2448×2448 500×500 500×500 1224×1224 500×500 deep feature map sharing 2: 補助ブランチを導入した GLNet 3.2. 特徴マップの共有 特徴マップは大域の特徴を持つブランチから局所領域の 特徴を持つブランチへ共有を行う.まず,参照している入 力画像と同じ位置でトリミングを行う.その後,共有する ブランチの特徴マップのサイズと一致するようにアップサ ンプリングを行い,共有するブランチの特徴マップと連結 することにより特徴マップを共有している. 4. 評価実験 従来の GLNet と提案手法を用いて,セマティックセグ メンテーションの評価実験を行う. 4.1. 実験概要 セマティックセグメンテーションの評価実験を行うにあ たり,衛星画像のデータセットである DeepGlobe Land Cover Classification を使用する.803 枚の超高解像度画 像で構成されており,学習に 454 枚,検証に 142 枚,テス トに 207 枚をランダムに分割し使用する. 4.2. 実験結果 3 にセグメンテーション結果を示す.通常の GLNet と提案手法の結果を比較すると,提案手法は上段の水域ク ラスが GLNet よりも精度が向上していることが確認でき る.しかし,下段の放牧地クラスと農業地クラスは GLNet と比較して精度が低下していることが分かる. 入力画像 教師画像 GLNet 提案手法 農業地帯 都市地帯 放牧地帯 森林 水域 不毛地帯 3: セグメンテーション結果 1 GLNet と提案手法の class accuracy mIoUメモリ使用量の比較を示す.表 1 より,補助ブランチを導 入することで最も出現確率の低い水域クラスの accuracy 向上した.メモリ使用量を比較すると,提案手法は GLNet と比較して約 250MB の増加のみで小領域の検出精度を向 上させることができた.一方で,mIoU GLNet より低 下していることが分かる.特に,放牧地クラスの accuracy を比較すると,提案手法は精度が低下していることから, 農業地クラスや放牧地クラスのような類似クラスの識別に 影響があったと考えられる.これは,パッチで切り取った 画像を追加で使用しているため,局所的な特徴に過剰に反 応したことが原因だと考えられる. 1: class accuracy mIoU とメモリ使用量比較 class accuracy [%] mIoU [%] メモリ使用量 [MB] 水域 農業地 放牧地 出現確率 2.3 59.0 7.3 - - GLNet 82.7 95.3 50.6 69.9 2101 提案手法 84.6 94.5 40.8 67.4 2373 5. おわりに 本研究では,GLNet に補助ブランチを導入することで, 250MB のメモリ使用量の増加で小領域の識別精度の向 上を確認した.しかし,類似クラスの識別精度の低下によ mIoU の低下を確認した.今後は類似クラスの識別精度 向上について考案する. 参考文献 [1] W. Chen, et al., “Collaborative Global-Local Networks for Memory-Efficient Segmentation of Ultra-High Reso- lution Images”, CVPR, 2019.

Upload: others

Post on 01-Aug-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: GLNet による空撮画像のセマンティックセグメンテーション 小倉 ...mprg.jp/data/FLABResearchArchive/Bachelor/B19/Abstract/... · 2020-02-25 · 2.GLNet GLNet

補助ブランチを導入した GLNetによる空撮画像のセマンティックセグメンテーション

EP16025 小倉一真 指導教授:山下隆義

1.はじめに超高解像度画像のセマンティックセグメンテーションは,

広域の情報を迅速に把握するための手段として,需要が高まっている.CNNを用いた超高解像度画像のセマンティックセグメンテーションでは,推論時にメモリ使用量が大幅に増加する.GLNet[1]は,ダウンサンプリングを行った画像とパッチで切り分けた画像を使用することにより,メモリ使用量を抑えた手法である.しかし,GLNetはダウンサンプリングによる解像度の低下により,小さなオブジェクトの識別が困難である.そこで本研究では,GLNetにパッチ分解サイズを大きくした画像を入力する補助ブランチを追加することでメモリ使用量を抑えつつ精度向上を図る.2.GLNet

GLNet は,ダウンサンプリングした画像を入力するグローバルブランチと,パッチ画像を入力するローカルブランチから構成される.GLNetの処理の流れを図 1に示す.各ブランチの特徴マップを共有することにより,ダウンサンプリングのみを使用した際の問題点であるジャギーの影響を緩和することが可能である.

Local

patch 1 patch 2 patch NAuxiliary

Auxiliary

Global

Auxiliary

Auxiliary

Local

patch 1 patch Npatch 2

Auxiliary

Auxiliary

Local

patch 1 patch Npatch 2

Local Branch

Global Branch

patches

downsamplePrediction

Regularization Aggregationdeep

feature mapsharing

Global

Local

500×500

500×500Input Image

2448×2448

Local Branch

Global Branch

patches

downsamplePrediction

Regularization Aggregationdeep

feature mapsharing

Global

Local

500×500

500×500Input Image

2448×2448

図 1: GLNetの処理の流れ3.提案手法

GLNet ではダウンサンプリングによる局所領域の情報の損失が多いため,小さなオブジェクトのセマンティックセグメンテーションが困難である.そこで本研究では,パッチ分割サイズを大きくした画像を入力する補助ブランチを導入することで,局所領域の特徴の損失を抑制する手法を提案する.

3.1.補助ブランチを導入したGLNet

ネットワークは全体をダウンサンプリングした画像を入力するグローバルブランチとパッチ画像を入力するローカルブランチ,パッチ分割サイズを大きくし,ダウンンサンプリングを行った画像を入力する補助ブランチで構成される.ローカルブランチに入力する画像は重なりを考慮して作成する.図 2にネットワークの構造と特徴マップ共有の流れを示す.補助ブランチはグローバルブランチと特徴マップ共有を行うことで,大域の特徴を取得できる.また,補助ブランチはグローバルブランチよりも高い解像度を入力するため,細部の情報の欠落を抑えることが可能である.ローカルブランチからグローバルブランチへの特徴マップ共有を行わないことで補助ブランチの追加によるメモリ使用量の増加を抑制する.

Local

patch 1 patch 2 patch NAuxiliary

Auxiliary

Global

Auxiliary

Auxiliary

Local

patch 1 patch Npatch 2

Auxiliary Branch

Local Branch

Global Branchdownsample

Input Image

patches

downsample

Prediction

Regularization

Aggregation

deepfeature map

sharing

Global

Local

Auxiliary

patches

2448×2448

500×500

500×500

1224×1224

500×500

deepfeature map

sharing

1. crop 2. upsample 3. concatenate

featuremap

featuremap 1

1. crop 2. upsample 3. concatenate

Auxiliaryfeature

map

Localfeaturemap 1

図 2: 補助ブランチを導入した GLNet

3.2.特徴マップの共有特徴マップは大域の特徴を持つブランチから局所領域の

特徴を持つブランチへ共有を行う.まず,参照している入力画像と同じ位置でトリミングを行う.その後,共有するブランチの特徴マップのサイズと一致するようにアップサンプリングを行い,共有するブランチの特徴マップと連結することにより特徴マップを共有している.4.評価実験従来の GLNetと提案手法を用いて,セマティックセグ

メンテーションの評価実験を行う.

4.1.実験概要セマティックセグメンテーションの評価実験を行うにあ

たり,衛星画像のデータセットである DeepGlobe LandCover Classification を使用する.803 枚の超高解像度画像で構成されており,学習に 454枚,検証に 142枚,テストに 207枚をランダムに分割し使用する.

4.2.実験結果図 3にセグメンテーション結果を示す.通常の GLNet

と提案手法の結果を比較すると,提案手法は上段の水域クラスが GLNetよりも精度が向上していることが確認できる.しかし,下段の放牧地クラスと農業地クラスはGLNetと比較して精度が低下していることが分かる.

入力画像 教師画像 GLNet 提案手法

農業地帯 都市地帯 放牧地帯 森林 水域 不毛地帯

図 3: セグメンテーション結果表 1 に GLNet と提案手法の class accuracy と mIoU,

メモリ使用量の比較を示す.表 1より,補助ブランチを導入することで最も出現確率の低い水域クラスの accuracyが向上した.メモリ使用量を比較すると,提案手法はGLNetと比較して約 250MBの増加のみで小領域の検出精度を向上させることができた.一方で,mIoUは GLNetより低下していることが分かる.特に,放牧地クラスの accuracyを比較すると,提案手法は精度が低下していることから,農業地クラスや放牧地クラスのような類似クラスの識別に影響があったと考えられる.これは,パッチで切り取った画像を追加で使用しているため,局所的な特徴に過剰に反応したことが原因だと考えられる.表 1: class accuracyとmIoUとメモリ使用量比較

class accuracy [%]mIoU [%] メモリ使用量 [MB]

水域 農業地 放牧地出現確率 2.3 59.0 7.3 - -

GLNet 82.7 95.3 50.6 69.9 2101

提案手法 84.6 94.5 40.8 67.4 2373

5.おわりに本研究では,GLNetに補助ブランチを導入することで,

約 250MBのメモリ使用量の増加で小領域の識別精度の向上を確認した.しかし,類似クラスの識別精度の低下によるmIoUの低下を確認した.今後は類似クラスの識別精度向上について考案する.参考文献[1] W. Chen, et al., “Collaborative Global-Local Networks

for Memory-Efficient Segmentation of Ultra-High Reso-

lution Images”, CVPR, 2019.