可視化ツールSand Danceを使ってみた。
日経ソフトウェアを読んでいたらVS Codeの Sand Danceを使って、いろんなデータを用いて分析してみたくなったので試してみました。
Sand Danceとは
Sand Danceは2011月にMicrosoft社の研究機関であるMicrosoft ResearchからリリースされたBIツールのようです。
install方法
VScodeの拡張機能蘭に「sandD」と入力すると「sandDance for VSCode」がでてきますのでインストールします。
データ分析してみる。
今回は、五島市のデータを分析したいので、政府統計の総合窓口からデータ(csv)をダウンロードします。
実際に分析する。
1. VScodeでダウンロードファイルを開きます。
きちんと文字化けせずに開けていることを確認します。
2. 次にVSCodeのcsvのファイル名を選択して「右クリック」して「View in SandDance」を選択します。
文字が文字化けしてしまいました。
3. 文字コードをShift JISからUTF-8に変更する
環境がMacOSのため、文字コードを変更する必要がありました。 私はMacのターミナル上で、該当ファイルに対して下記コマンドを実行し、ファイルフォーマットを変えました。
#文字コードの確認 $nkf -g 09000-3.csv Shift_JIS #文字コードを変更します。 $nkf -w --overwrite 09000-3.csv #文字コードを再度確認する。 nkf -g 09000-3.csv UTF-8
4. SandDanceの再度実行します。
5. 余計な空欄を削除する。
エディタもしくはpythonなどを用いて、余計な行を削除します。
6. 可視化
前処理を工夫してデータの工夫する必要がありますが、面白い分析できますね。