石川チャレンジ4:GoogleEarthEngineで地図化
やっとGEEに到達
あーだこーだとやって、これで行きましょうと行くまでの体感が長かった。実際はそんなにかかってないんだけど。 というわけで、GEEで分類します。見本があるのでそれに倣って書けば大丈夫。
実際はこう。
//ポイントデータからラスタ情報を取得して教師データを作成 var trainingData = trainingLayers.sampleRegions({ collection: pointsInt, // 教師データのポイントのFeatureCollection(シェープファイル) properties: [label], // 分類するクラスの列名 scale: 10, // 縮尺10m単位で取得 tileScale: 16 // 数を大きくしておくと(最大16)時間切れになる可能性がへる. }); // 分類機の作成 var classifier = ee.Classifier.smileRandomForest({ numberOfTrees: 500, // ntree variablesPerSplit:5, // Rの結果からのmtry minLeafPopulation: 1, bagFraction: 0.632, // RのrandamForestパッケージのデフォルトはこの数値らしい }).train(trainingData, label, bands_all); // 分類機とラスタのレイヤを使って全域を分類 var classifiedRF = trainingLayers.classify(classifier);
結果をみる
石川県全体
あまり違いがわからない。
凡例は濃緑:高木林、薄緑:低木林、青緑:湿地、黄色:草地、オレンジ:耕作地、肌色:水田、薄赤:裸地、灰色:人工物、青:水域。
金沢の兼六園とか美術館とかのあたり
お手本はこちら↓ 結果↓
思ったよりいい感じ。変数(レイヤの種類)が増えるにつれてまとまっていく感じがある。耕作地と予測された場所(オレンジ色)が縁取りのようにあるのが気になる。
凡例は濃緑:高木林、薄緑:低木林、青緑:湿地、黄色:草地、オレンジ:耕作地、肌色:水田、薄赤:裸地、灰色:人工物、青:水域。
白山のメインのあたり
お手本
結果↓
どれが正しいのかよくわかんないから、なんともいえない。一番左の図は低木(=ハイマツとか)がほとんど描写されていない。
小松市粟津町周辺
お手本
結果↓
感想は金沢に同じ。
数値的な出来の判定
GoogleEarthEngineで別に発生させた8000点を使った評価
正解率は86.9%だった。
開放水域 | 耕作地 | 高木林 | 湿地 | 人工物 | 水田 | 草地 | 低木林 | 裸地 | |
---|---|---|---|---|---|---|---|---|---|
開放水域 | 1891 | 1 | 2 | 0 | 0 | 0 | 1 | 1 | |
耕作地 | 2 | 52 | 39 | 0 | 24 | 45 | 10 | 4 | 9 |
高木林 | 20 | 65 | 4026 | 0 | 35 | 124 | 99 | 118 | 21 |
湿地 | 1 | 0 | 0 | 0 | 1 | 1 | 0 | 0 | 0 |
人工物 | 3 | 25 | 20 | 0 | 353 | 94 | 5 | 0 | 6 |
水田 | 5 | 18 | 25 | 3 | 27 | 526 | 5 | 2 | 2 |
草地 | 1 | 1 | 20 | 0 | 3 | 4 | 48 | 2 | 2 |
低木林 | 0 | 0 | 38 | 0 | 0 | 0 | 6 | 27 | 1 |
裸地 | 20 | 4 | 37 | 1 | 22 | 14 | 8 | 5 | 26 |
Rで別に発生させた7448点を使った評価
正解率は87.3% (CI: 86.48 - 88.01%)だった。表は省略。前回作ったグラフと見比べるとGGEの結果は低い気がする。大体あってるけど、同じ結果と言っていいのかな?は自信なし。(続く)