panoptic segmentation

今日は、前々から試してみたかった、panoptic segmentationをDetectron2を用いて実験してみました。

panoptic segmentation

  • Panoptic segmentationは、Semantic Segmentation と Instance Segmentation を足し合わせたようなタスク。
  • 入力は画像で、出力には Semantic Segmentation のように、全てのピクセルにラベルが振られ、かつ数えられる物体に関しては、個別で認識した結果が返される。

  • 数えられるクラス(車や人)を Thing クラスといい、数えられないクラス(空や道)を Stuff クラスといいます。Thing クラスに対して Instance Segmentation、Stuff クラスに対してSemantic Segmentation を行うタスク。

参考

論文

コンピュータビジョンの最新論文調査

実験対象

東京競馬場パドックですね。

youtu.be

結果

[https://youtu.be/7RF8mFQ1QvM:embed:cite]

考察

  • 人間はperson、馬はhorseと正しく認識しているのがわかります。
  • 建物は、一つのくくりでbuildingとなっています。
  • 観客は残念ながら人として人してしていない様です
  • パドックに何頭、馬がいて、騎手が何人いるか、管理員がどのくらいいるのか? などは分析できそうです。

ソースコード

github.com