初めまして、株式会社ゼネット新入社員の平松です。
先日初めて「和から株式会社」さんの「データ利用・活用超入門-データを情報に変える統計学-」勉強会に参加しました。
今回の勉強会に参加しようと思ったきっかけはこれからの社会でデータを活用する機会が増えてくると思いデータ分析の仕方を学びたいと思ったからです。みなさんにも少しでも興味を持っていただけたら幸いです。
学んだこと
・データを情報にする方法やデータ分析に必要な基礎を知りました。
・業務ですぐに使えるデータ分析の方法を学べました。
集計と可視化の歴史
集計はいつから始まったのか?
「統計の基礎スキルは集計と可視化です。では皆さん、集計はいつから
していると思いますか?」というところから講義が始まりました。
正直自分は古墳時代頃から集計をし始めていたと思っていました。
しかし、実際は紀元前4000年のバビロニアの頃から行っていたそうです。
はるか昔から人間はデータを扱っていたようですね!
統計学として認知されたのは15世紀からのようです。
統計にはデータと情報が必要不可欠です。
ではデータと情報の違いは何なのか??
それはデータは文字や数字の集まり、それを人間が読み取れるようにしたもの
が情報であるということを学びました。
データの読み方、考え方
データ分析は分解が大事!
問題を解決するにあたってデータを分解することでそのデータが何をして
いるのかが明確化されます。
例:会社の売り上げデータの場合(マンツーマン講義)
平均値に踊らされるな!
平均値は注意が必要ということを学びました。私たちが普段よく使う
平均値には大きな罠があります。それはデータのばらつきが多くある場合、
平均値と中央値の差が大きくなってしまうということです。そのため、
平均値が正しい値とならないのです。平均値だけが出ている場合中央値も
意識するようにしましょう。
例:日本国民の年収
自分の年収が420万円だとします。平成29年度の日本国民の平均年収は
560万2000円、年収の中央値は442万となっています。平均年収が560万
2000円と聞くと自分の年収が平均よりかなり低いと感じてしまいます。
しかし、実際の中央値は442万であるためそこまで自分の年収が低くない
ことが分かります。一部の富裕層の年収が高くなるとそれに応じて平均値
も高くなってしまいます。
すぐに業務で使えるピボットテーブルの使い方
データ分析をする際にExcelで表を作成すると思うのですが、たくさんのデータ
がありどことどこが関係しているのかがとても分かりずらくなっています。
そこでデータ分析をする上で大切な分解と可視化を行えるのがピボットテーブ
ルです。
ピボットテーブルを使うことで分解と可視化が簡単にできます。
以下のようなある会社のデータ表があるとします。
会社の役職ごとの年収の平均が知りたい場合、Excelの「挿入」→「おすすめの
ピボットテーブル」を押すことで下の図のような表が作成されます。
このままでは各部署ごとの合計年収となります。「年収のセルを右クリック」→
「値の集計方法」→「平均」を選ぶことで部署ごとの平均年収が分かる表を作成
することができます。また、この表からグラフも作成することができます。
ピボットグラフのフィールドにある性別をしたの列(分類項目)のところに
ドラックアンドドロップすることで男女別の役職ごとの平均年収の表を作成
することができます。また、グラフも同時に表に適した形になります。
行ラベルの下矢印のボタンをクリックしてフィルタの課長のチェックボックス
をクリックすることで下の図のように課長を除いたデータ表を作成することが
できます。
さいごに
私自身統計学は難しそうなイメージでしたがわかりやすく説明して
いただいたので統計学に対するハードルが下がりました。これからは
AIも発達していきデータを活用することが増えてくると思うのでデータ分析
の仕方について勉強していきたいです。
今回の勉強会を開催していただいた和から株式会社様、講義してくださった
川原様ありがとうございました。
参考文献
和から株式会社 データ利用・活用超入門-データを情報に変える統計学-
HP:https://wakara.co.jp/course/72385