クイックなデータ分析(事例)

(読了時間=約 2 分)

数表をざっと見て傾向をつかむというのは訓練すればある程度できるようになるけれども、データが膨大になってくるとなかなか全体を見通してというわけにはいかない。そういう場合に、エクセルで簡単に分析をして傾向値をつかむことができるととても便利だ。

ということで、エクセルを使ったクイックアナリシスの実例をご紹介します。

題材は、過去の電力使用量実績データ。東京電力のホームぺージからダウンロードできます。これをもとに、「最大電力使用量の季節変動を見る」というお題に挑戦してみます。

落としたcsvデータはこれ。
日ごと、時間ごとの電力使用量のデータで、24×365=8,760行もあります。

まず、この表の脇に「最大電力」という欄を作って、計算式を入れます。
例えば元日の最大電力は、”max(C4:C27)”。maxというのは最大値を返す関数です。
これを毎日23:00の段階で計算することとし、それ以外の時間ではゼロを表示するようにします。式で書くと、

“=if(B27=$B$27,MAX(C4:C27),0)”

B27は時刻のセル。これが”23:00″であるというのが条件式なのですが、時刻の関数は思わぬエラーが出ることがあるので、大事をとってB27=23:00などと書かずにB27=$B$27と、絶対参照を使って書いています。

if 文とか、絶対参照と相対参照の違いはちゃんと理解しておくと良いです。
maxなどの関数はいろいろあるので全て覚える必要はありません。忘れてしまったらgoogleで「excel 最大値」で検索したらいい。関連ページがぞろぞろ出てきます。

式を記入したら、これをデータの最終行まで一気にコピーします。

次に、計算式の列全体を選択してコピーし、同じ場所に「値貼り付け」。
これで計算式が消去され、計算結果が数値として確定されます。

この処理を忘れると後で参照先が変わって計算結果が違う数字になってしまうので要注意。

そしたら今度は、データ範囲全てを選択して、最大電力の降順(大きい順)に並べ替えます。
こうすると、最大電力の書かれた23:00のデータが上に並び、その次に他の時間帯(最大電力欄がゼロ)のデータが並ぶ形になります。

次に、いらないデータを消去します。
画面をスクロールして、最大電力欄がゼロになっている行を見つけ、そこから下のデータを削除するわけです。

これで残ったのは日ごとの最大電力データだけ。
で、改めてこのデータを選択して日付順に並べ替えます。

これで日付順の最大電力のデータがとれました。
「TIME」と「実績」の欄のデータはもう不要ですので削除します。

そうしたら、残ったデータを選択してグラフウィザードを立ち上げます。
トレンドをざっと見たいので折れ線グラフにします。残りの設定は全てデフォルトのままでひとまずOK。

これでグラフができあがり。
見た目はまだアレですけど、ひとまずトレンドは見て取ることができます。

時間的には、ここまでの作業で慣れれば5分くらい。
元データは8,000行以上で、日ごとのデータにしても365行のデータになるんですが、エクセルを使えば簡単にこれらのデータを処理して、いろいろな分析結果を得ることができます。

資料の作りこみは大事ですが、その前にすべきなのは、分析で何がわかったのか、そして、何を相手に伝えるべきか、ということです。そのためにはこうしたクイックな分析を何度も回してファクトを縦横斜めに見ていく必要があります。

エクセルをシンプルに使いこなす術を身につけ、呼吸をするように数値分析を行うようになれれば、仕事上大きな武器になることは間違いありません。

ご参考にして戴ければと思います。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です