石川チャレンジ1:土地被覆分類への道(予告)
リモセンと言ったら植生分類
GEEのチュートリアルその他で土地被覆分類の紹介は分かりやすくされていて、その通りに手軽にできます。分類のアルゴリズムも決定木、SVM、ランダムフォレスト…と各種揃っています。分類はQGISだとかRだとか無料のソフトを使ってもできるけど、GEEだとダウンロードや前処理の手間がいらないのがメリット。とはいえ、まああえて探求しようというほどには興味がなかったんだけど、これを見ていたらやってみたくなった↓。 www.mdpi.com
GEEならば広範囲の分類もパワーで押し切ってできちゃうし、いろんなデータを手軽にくっつけたりできるのかと。というわけで、今回のテーマは、
地理的な解像度が高い分類を広範囲にできるのかな?っていうのと、
Sentinel1の画像その他を組み合わせるとどうなるんだろうかな? という2点です。元論文だと、8個のカテゴリーを90%くらいの正答率で分類できたそうです。すげー。
始める前に
山も海も里もある石川にしてみる
どこがいいかなと思ったんですが、広すぎない県、海から高山まである県ということで思いついた石川にしてみました。ただ、舳倉島その他沖合の島や岩礁は除いて、本州近辺だけ。
教師データはどうするか
教師データがないので、どうやって確保するかですが、とりあえず環境省植生図のシェープファイルを使って、ポリゴンからポイントを生成することにしました。描写スケールの問題で、正しい教師データが得られないポイントもあるけど、そこは目をつぶります。元の論文では教師データの数を5,000から50,000に増やしてみても分類精度は3%しか上がらなかったといっているから、とりあえず10,000ポイントくらいを作ってみます。
カテゴリー分け
環境省植生図は非常に細かい分類がなされています。非常に素晴らしい仕事です。それをリモセンで分類となると、ちょっと難しそうなので凡例を眺めて適当に分類しなおします。生態学的な妥当性というより、リモセンでできそうな方に歩み寄ったと。元論文では耕作地と一つにされているけど、そこは水田とそれ例外を耕作地に分類するという9分類にしてみましょうか。果樹園は森林と耕作地のどっち?とかとか細かく言いはじめるとよくわかんないんですが。この辺は様子をみて変えるかも。
というわけで、しばらく様子見ながらやってみることにします。