前回はExcelで散布図を作る方法について触れました。今回はヒストグラムです。
ヒストグラムは棒グラフのうちの一つですが、通常の棒グラフとは違う、特殊な目的で使われます。
この記事を読むことで、
- ヒストグラムがどのような場合に使えば便利なのか分かる
- ヒストグラムの作り方とデータ集計の方法が分かる
といった効果を期待できます。
ヒストグラムを使う目的
![](https://sys-daddy.com/wp-content/uploads/2020/07/3348184_s.jpg)
ヒストグラムは、横軸に階層、縦軸にデータ数をとった棒グラフで、グループ内の分布やバラツキを確認するために使われます。
ヒストグラムはこのような場面でよく使われます。
- 身長の分布を確認する
- 工業製品のバラツキを把握する
- テストの点数分布を確認する
他にも、この世界で起こる自然現象のほとんどはヒストグラムで表すことができます。
また、ヒストグラムは、問題解決でよく使われる「QC7つ道具」の一つであることも知られています。
このように、様々な場面でヒストグラムを活用できますので、Excelでヒストグラムを作れるようになると、様々な現象の実態をつかむのにとても役にたちます。
ヒストグラムの作り方
![](https://sys-daddy.com/wp-content/uploads/2020/07/1066546_s.jpg)
ヒストグラムの作り方は、生データから直接作る方法と集計後にグラフを作る方法の2種類があります。
生データから直接作る
Excel2016から、「統計グラフ」を作る機能が使えるようになりました。この統計グラフメニューからヒストグラムを作ることが出来ます。
集計されていない生データから直接グラフを作ることが出来ますので、自分だけでデータの分析を行うことに向いています。階層の調整も容易に行うことができます。
但し、生データからヒストグラムを作った場合、系列名が分かりづらいという欠点があります。
集計後にグラフを作る
データを集計して作る方法は、セルに入力した文字を系列名に設定できます。
他人に伝えるためのグラフを作るためには、集計後のデータからヒストグラムを作ってあげるとよいでしょう。
Excel2013以前をご使用の方は、統計グラフを使う機能がありませんので、棒グラフからヒストグラムを作ることになります。
- 生データから「試作型」のヒストグラムを作り、仕様を決める
- 仕様が決まったら、集計後のデータから「他人に伝える」ヒストグラムを作る
以上の順番に沿えば、効果的にヒストグラムを作ることができます。
生データから直接ヒストグラムを作る
実際に日別の平均気温からヒストグラムを作成してみます。
気象庁のホームページで、過去の気象データをダウンロードすることが出来ます。
期間も細かく指定できるようです。
![気象庁のホームページ](https://sys-daddy.com/wp-content/uploads/2020/07/JMA_data_01.jpg)
ここでは、名古屋市の一年間の平均気温データをサンプリングしています。
![名古屋の平均気温データ](https://sys-daddy.com/wp-content/uploads/2020/07/make_statistic_chart_01.jpg)
範囲を選択し、グラフメニューの統計グラフを選択します。
![統計グラフの挿入](https://sys-daddy.com/wp-content/uploads/2020/07/make_statistic_chart_02.jpg)
ヒストグラムをクリックすると、自動でグラフが作成されました。
![統計グラフからヒストグラムを作成](https://sys-daddy.com/wp-content/uploads/2020/07/make_statistic_chart_03.jpg)
系列の書式設定で、ピンの範囲設定で系列(バー)の数を変えることが出来ます。初期設定では4に設定されています。
![範囲を設定](https://sys-daddy.com/wp-content/uploads/2020/07/make_statistic_chart_06.jpg)
ピンを2に設定して系列を増やしてみました。
![範囲を小さくした](https://sys-daddy.com/wp-content/uploads/2020/07/make_statistic_chart_08.jpg)
7に設定して系列を減らしてみました。
![範囲を大きくした](https://sys-daddy.com/wp-content/uploads/2020/07/make_statistic_chart_07.jpg)
作成されたヒストグラムについて分析してみます。
「正規分布になっているのではないか」と予想してヒストグラムを作ってみたのですが、実際はふた山型のヒストグラムになったようです。
5.8~9.8℃付近と21.8~25.8℃付近の2つの温度帯については、日数が多くなっていることが分かります。
![2つの山が表示された](https://sys-daddy.com/wp-content/uploads/2020/07/histogram_analyze_01.jpg)
- 折れ線グラフなどで温度推移と対象日付の検索を行う
- データ範囲を増やすか変えるなどして、サンプリング期間が原因かを調査
- 地点を変更して名古屋近辺のみの現象であるのか確認
「なぜふた山型になったのか」という理由を調査するためにできることが、以上の3項目です。
実際に札幌と那覇についても同じように調査してみました。
札幌は温度差とヒストグラムの高低差が大きくなりました。
![札幌のデータ](https://sys-daddy.com/wp-content/uploads/2020/07/histogram_analyze_02.jpg)
一方、那覇は逆に温度差と高低差が小さくなりました。
![那覇のデータ](https://sys-daddy.com/wp-content/uploads/2020/07/histogram_analyze_03.jpg)
ここから、北の地方ほどふた山の傾向が大きくなるのではないかという仮説が立てられることになります。
統計グラフから直接ヒストグラムの作ると、生データからすぐに結果が分かりますが、項目名がわかりづらくなります。
ヒストグラムを作るためにデータを集計する
サンプリングしたデータを階層別に集計する方法は4つあります。
- FREQUENCY関数
- SUMPRODUCT関数
- COUNTIFS関数
- ピボットテーブル
FREQUENCY関数
Excel2010以前は、主にFREQUENCY関数が使われていました。
生データの範囲と全階層の上限値を指定します。
![FREQUENCY関数](https://sys-daddy.com/wp-content/uploads/2020/07/histogram_function_01.jpg)
Microsoft365はスピルの対象関数のようですので、1個目のセルに数式を入れたら全ての階層に反映されるようです。
![スピルとして処理](https://sys-daddy.com/wp-content/uploads/2020/07/histogram_function_02.jpg)
SUMPRODUCT関数
また、SUMPRODUCT関数でも同じような計算を行えます。
![SUMPRODUCT関数](https://sys-daddy.com/wp-content/uploads/2020/07/histogram_function_03.jpg)
SUMPRODUCT関数については過去に記事を投稿していますので、よかったらご覧ください。
COUNTIFS関数
Excel 2013以降はCOUNTIFS関数でも対応出来ます。
![SOUNTIFS関数](https://sys-daddy.com/wp-content/uploads/2020/07/histogram_function_05.jpg)
不等号を使う場合は、前後を「”>=”」などのようにダブルクォーテーションで囲む必要がありますので、注意してください。
ピボットテーブル
また、ピボットテーブルを使っても楽に集計することが出来ます。
Excel2013以前を使用していれば、ピボットテーブルで試作する方法でもよいでしょう。
注意すべきところは、範囲を設定した結果が、FREQUENCY関数を使った場合と異なることです。
範囲の不等号の設定が違うものと思われますので、精度の高いデータが求められる場合は特に注意が必要です。
![ピボットテーブル](https://sys-daddy.com/wp-content/uploads/2020/07/histogram_function_06.jpg)
ピボットテーブルについては、後日記事を掲載する予定にしています。
集計後データからヒストグラムを作る
棒グラフからヒストグラムを作る方法は、感覚的に分かり易くできます。
一方、統計グラフを使って集計後データからヒストグラムを作るためには、系列設定の変更が必要になります。
棒グラフからヒストグラムを作る
まずは、定番としてつかわれている棒グラフからヒストグラムを作る方法について紹介します。
元データを選択し、集合棒グラフを選択します。
![集合縦棒グラフを作成](https://sys-daddy.com/wp-content/uploads/2020/07/make_bar_histogram_01.jpg)
棒グラフが作成されましたが、ヒストグラムはかけ離れた状態です。
![装飾前](https://sys-daddy.com/wp-content/uploads/2020/07/make_bar_histogram_02.jpg)
系列の間隔を0%にします。
![要素の間隔を調整](https://sys-daddy.com/wp-content/uploads/2020/07/make_bar_histogram_03.jpg)
ヒストグラムっぽくなりましたが、系列の境界線が無いので、見た目がよくありません。
![要素の間隔を調整した後](https://sys-daddy.com/wp-content/uploads/2020/07/make_bar_histogram_04.jpg)
枠線を白に設定します。
![線を白にする](https://sys-daddy.com/wp-content/uploads/2020/07/make_bar_histogram_05.jpg)
境界線がはっきり表示されて、見た目も少し良くなりました。
![線を白にした](https://sys-daddy.com/wp-content/uploads/2020/07/make_bar_histogram_06.jpg)
更に塗りつぶし・軸・データラベルを設定し、見やすいグラフに仕上げました。
![更に装飾した](https://sys-daddy.com/wp-content/uploads/2020/07/make_bar_histogram_07.jpg)
また、項目名が長くなる場合は、縦棒グラフを横棒にすると見やすくなります。
統計グラフ機能から項目別にヒストグラムを作る
集計後のデータから統計グラフを使った場合、集計済みデータを生データと見なしてグラフを作るため、系列の並びがくずれてしまいます。
![並びがくずれたヒストグラム](https://sys-daddy.com/wp-content/uploads/2020/07/make_bar_histogram_08.jpg)
書式設定のビンを「分類項目別」に変更します。
![ピンの設定](https://sys-daddy.com/wp-content/uploads/2020/07/make_bar_histogram_09.jpg)
棒グラフから作るのと同じようなヒストグラムを作ることが出来ます。
![ピンの設定後](https://sys-daddy.com/wp-content/uploads/2020/07/make_bar_histogram_10.jpg)
まとめ
![](https://sys-daddy.com/wp-content/uploads/2020/07/3591458_s.jpg)
ヒストグラムを使うことで、様々なものや現象のバラツキを分かり易く表現することができます。
Excelを使えばヒストグラムを簡単に作ることができます。
特に、最近のバージョンでは統計グラフを活用することでデータを集計する手間もかかりません。
他人に伝える資料を作る前に、一度生データから直接作り確認することで、より的を得たヒストグラムを効率よく作ることが出来ます。
次回は、パレート図について記事を掲載する予定です。
最後まで読んで頂き、ありがとうございました。