可視化ツールSand Danceを使ってみた。

日経ソフトウェアを読んでいたらVS Codeの Sand Danceを使って、いろんなデータを用いて分析してみたくなったので試してみました。

Sand Danceとは

Sand Danceは2011月にMicrosoft社の研究機関であるMicrosoft ResearchからリリースされたBIツールのようです。

github.com

install方法

VScode拡張機能蘭に「sandD」と入力すると「sandDance for VSCode」がでてきますのでインストールします。

f:id:unachan_kz:20201206143714p:plain

データ分析してみる。

今回は、五島市のデータを分析したいので、政府統計の総合窓口からデータ(csv)をダウンロードします。

www.e-stat.go.jp

実際に分析する。

1. VScodeでダウンロードファイルを開きます。

きちんと文字化けせずに開けていることを確認します。

2. 次にVSCodecsvのファイル名を選択して「右クリック」して「View in SandDance」を選択します。

f:id:unachan_kz:20201206144423p:plain

文字が文字化けしてしまいました。 f:id:unachan_kz:20201206144348p:plain

3. 文字コードをShift JISからUTF-8に変更する

環境がMacOSのため、文字コードを変更する必要がありました。 私はMacのターミナル上で、該当ファイルに対して下記コマンドを実行し、ファイルフォーマットを変えました。

#文字コードの確認
$nkf -g 09000-3.csv
Shift_JIS

#文字コードを変更します。
$nkf -w --overwrite 09000-3.csv

#文字コードを再度確認する。
nkf -g 09000-3.csv            
UTF-8

4. SandDanceの再度実行します。

f:id:unachan_kz:20201206144917p:plain

5. 余計な空欄を削除する。

エディタもしくはpythonなどを用いて、余計な行を削除します。

6. 可視化

f:id:unachan_kz:20201206150741p:plain

前処理を工夫してデータの工夫する必要がありますが、面白い分析できますね。