ヒストグラムは データの分布を視覚的に把握するための基本的なグラフ です。数値データを区間(ビン、bin)ごとに分け、各区間に含まれるデータの数(頻度)を棒の高さで表します。主に連続量データ(例:身長、温度、収入など)のばらつきや傾向を把握するのに使われます。
チャートの見方
| 要素 | 説明 |
|---|---|
| 横軸 (X軸) | データの範囲を表します。例:0〜10、10〜20などの区間(ビン)に分割されます。 |
| 縦軸 (Y軸) | 各区間に含まれるデータの数(頻度)を表します。 |
| 棒の幅 | ビンの幅。幅が広いと大まかな傾向、狭いと細かい変動が見えます。 |
| 棒の高さ | 該当する区間内の観測値の数を示します。 |
| 総面積 | 度数の合計が全体のデータ数に対応します。確率密度ヒストグラムでは面積が1になります。 |
背景と特徴
ヒストグラムは 統計学の基本的な可視化手法のひとつ で、19世紀後半にフランスの数学者アドルフ・ケトレー(Adolphe Quetelet)やイギリスの統計学者フランシス・ガルトン(Francis Galton)らによって広く用いられるようになりました。
ガウス分布(正規分布)との関連が深く、データの中心傾向やばらつきを把握するための標準的な手段として教育・研究・ビジネス分析など幅広い分野で利用されています。
ビンの幅や区間の設定方法によって印象が大きく変わるため 適切なビン幅の選択(例:Sturges法、Freedman–Diaconis法など) が重要です。
応用例
| 分野 | 利用目的 | 例 |
|---|---|---|
| 教育・心理 | テスト点数の分布を把握 | 80点以上の学生の割合など |
| 医学・生物 | 測定値のばらつき分析 | 血圧・体温・体重の分布 |
| 経済・マーケティング | 顧客層の把握 | 年収や購買金額の分布 |
| 製造・品質管理 | 製品誤差の分析 | 製品の寸法精度や不良率 |
類似・関連チャート
| チャート名 | 違い・特徴 |
|---|---|
| 棒グラフ | カテゴリデータ(離散値)を比較する。間隔に意味はない。 |
| 密度プロット | ヒストグラムを平滑化し、滑らかな曲線で分布を表す。 |
| ボックスプロット | 四分位数・外れ値など、分布の要約統計を示す。 |
まとめ
ヒストグラムは、数値データの分布や偏り、ばらつきを一目で理解できる、最も基本的でありながら強力な可視化手法です。ビン幅や区間設定の工夫によって、データの特徴をより的確に伝えることができます。統計的理解の出発点として、データ分析・教育・報告書など幅広い用途で活用されています。