こんにちは、ゼネットの福地です。
今回はMicrosoft Power BIを使ってデータ分析をしていこうと思います。
BIとは?
BIはビジネスインテリジェンスの略称となっていて、経営・会計などの意思決定のために データを収集・蓄積・分析・報告して意思決定する手法のことです。 なかでもデータ分析やデータマイニングするツールのことをBIツールと呼び、広く活用されています。
ゼネットではMicrosoftが提供しているPower BIというツールを使ってデータ分析しています。 基本無料で利用ができ、入門向けとしては始めやすい製品です。
公式HP:https://powerbi.microsoft.com/ja-jp/
Power BIは二つのアプリケーションで構成されています。
Power BI Desktop :データソース設定と分析資料の作成をデスクトップ上で行うツール
Power BI:作成した分析資料をクラウド上で公開し、閲覧・分析をするツール
今回は上記のPower BI Desktopのインストールと簡単なデータ分析をご紹介します。
Microsoft Power BI のインストール
前提ですが、動作環境についてですができればPCのメモリ8GB以上がよいでしょう。 8GBでもかなり動作が重く感じるかと思います。 本気でデータ分析するならデータ量も大量になるのでスペック高めだとよいですね。
余談でした。
では公式サイトからPower BI Desktopをインストールしていきましょう。
公式ダウンロードページが見つかりにくいので下記にリンクを掲載します。
ダウンロードサイト:https://www.microsoft.com/en-us/download/details.aspx?id=58494
ダウンロードサイトで日本語を選択すると日本語版が手に入ります。 プログラムは適宜PCにあったものを選択してください。(本記事では×64版で進めていきます。) ダウンロードが終わったらインストーラを起動し表示に沿って次へを押していきましょう。 特にカスタマイズ項目はありません。
インストール出来たら起動し下記画面が出ればOKです。
データ分析(超入門編)
では使い方の紹介をはさみながらデータ分析していきましょう。
まず分析するなら対象データが必要です。 このブログでは下記サイトからデータをダウンロードして使います。 形式はCSVです。
東京都オープンデータカタログサイト(東京都 新型コロナコールセンター相談件数) :https://catalog.data.metro.tokyo.lg.jp/dataset/t000010d0000000071 catalog.data.metro.tokyo.lg.jp
これを使って、日ごとの相談件数を表示をしようと思います。
データのダウンロードができたら 起動後の画面から「データを取得」を押しましょう。 接続できるデータ形式が表示されます。 EXCEL、CSVからDB、Azureまで多様なデータソースが選べます。 ゼネットでもクラウド上にあるDBと接続してデータ取得をしています。 今回は超入門ということで先ほどダウンロードしたCSVを読み込みたいので 「テキスト/CSV」を選択し、ダウンロードしたCSVを選択。 データのプレビューが出るので今回はこのまま「読み込み」を選択。 画面のフィールド項目に取り込んだCSVの項目が出れば成功です。 データの準備ができました!
ではデータ資料作成・・・・の前に画面の説明をします。
- キャンバス:グラフや表などの分析資料の本体が表示される領域
- 視覚化:グラフや表の形を決める選択項目
- フィールド編集:選択したグラフや表の表示内容や形式を変更する
- フィールド:グラフや表に表示するデータの選択項目
- ツールバー:データの取り込みやデータの中身の加工、Power BIクラウドへの発行等
簡単ですがこのような構成になっています。 今回は①~④を使っていきます。
ではようやくデータ分析です。
1.視覚化から表現したいグラフの選択します。今回は折れ線グラフを選択します。 選択するとキャンバスに折れ線グラフが表示されます。
2.つづいてフィールドから項目を選択していきます。画面のように項目が出ていない場合はCSV名の左にある>を押して下さい。 項目の中から「受付_年月日」「相談件数」のチェックを入れてください。画像のようにグラフが出たら成功です。(見やすくするためにグラフを大きくしています。適宜調整してください。)
3.今状態だと年ごとの相談件数になっています。ここから軸に表示された「受付年月日」の下矢印を開いてリスト内の「受付年月日」を選択してください。グラフが一日ごとのプロットに切り替わります。
今回は一旦ここまでで完成ということにしようと思います。 これだけ見ても、相談件数が多くなっているところが第〇波と言われた時期と被っていると分かるのではないでしょうか。 この状態で視覚化のグラフを切り替えると切り替えた先のグラフに見え方が変わります。 ぜひ試してみてください。
終わりに
まだまだできることはいろいろあるのですが、 記事が長くなりすぎた関係で今回はここまでにします。 超入門編ということで、データと取り込んで出すだけでしたがいかがでしたでしょうか? 基本的にはこのようにデータを取り込んで色々なグラフを作ってデータの特徴を探していきます。
まだまだ、絞り込や別のグラフとの連携や、データ同士のリレーション、加工等々できることがたくさんあるので 今後も何回かに分けて記事にしていこうかなと思います。
ではまた。(つづく?)