Featured image of post ドット・プロット(Dot Plot)

ドット・プロット(Dot Plot)

ドット・プロット(Dot Plot)は、1つのデータ点を1つのドット(点)で表し、データの分布や度数を視覚的に示すグラフです。

各データを横軸上に配置し、同じ値を持つドットを縦方向に積み上げることで、データの集中やばらつきを直感的に理解できます。

少量データの分布比較やカテゴリ別の傾向比較に適しています。

歴史的経緯

ドット・プロットの概念は19世紀末の統計教育に端を発しますが、1970年代にジョン・W・トゥキー(John W. Tukey)が提唱した「探索的データ解析(Exploratory Data Analysis)」の中で改めて注目されました。

トゥキーは「データを生のまま観察する」ことを重視し、ヒストグラムや箱ひげ図と並ぶ基本的な可視化手法として位置づけています。

データ構造

ドット・プロットは主に1変数の数値データまたはカテゴリ別の数値データを用います。データは次のような形式を取ります。

カテゴリ
A3
A4
A4
B5
B7

同じ値を持つデータがある場合は、ドットを縦方向に積み上げて表現します。

目的

ドット・プロットの目的は、データ分布の全体像をシンプルに把握することです。階級区分を設定せず、生データをそのまま表現できるため、少量データの可視化や外れ値の確認に有効です。

ドット・プロットは統計学や教育現場で頻繁に利用される基本的な可視化手法です。特に、サンプルサイズが小さいときや、個々の観測値を可視化したい場合に有効です。棒グラフやヒストグラムと異なり、データの粒度を失わずに度数分布を表現できます。

また、データ分析や説明の場面で「ヒストグラムよりも正確に個々の値を見せたい」場合に有効です。

ユースケース

  • 少量データ(例:10人のテスト点数)の分布確認
  • 複数カテゴリ間の分布比較(例:地域別・性別など)
  • 教育現場における探索的データ解析(EDA)の導入
  • 箱ひげ図の前段階としての確認可視化

特徴

特徴内容
視認性データ数が少ない場合、分布の形を直感的に把握できる
単純性階級化を必要とせず、生データを直接表示する
比較性カテゴリごとの分布の違いを簡単に比較できる
制約データ数が多いと重なりが発生し、可読性が下がる

チャートの見方

横軸は変数の値、縦方向の積み上げはその値を持つデータ数(頻度)を表します。ドットが密集している箇所は値の集中を、孤立したドットは外れ値を示唆します。カテゴリを複数並べることで、グループごとの分布の違いを比較できます。

要素内容
横軸データ値またはカテゴリ(名義・順序スケール)
縦軸度数(その値を取るデータの数)
点の配置各値の上にドットを積み上げて頻度を表す
点の個数データの度数をそのまま表現する
配色や形状複数のカテゴリ比較やグループ分けのために用いられることがある

このチャートでは、棒グラフのように面積ではなく「点の数」で度数を伝えるため、データの離散的な分布を直感的に把握できます。また、値が重なる場合は上下にドットが積み上がることで分布の密度を視覚的に表現します。

デザイン上の注意点

  • スケールの統一:カテゴリごとの比較には、軸スケールを揃えることが重要。
  • ドットサイズ:データ数に応じてドットのサイズを調整し、重なりを防ぐ。
  • 配置方法:縦積み(stacked)またはジッター配置(jittered)を採用。
  • 配色:カテゴリの識別には一貫した配色を用いる。

応用例

  • ストリップチャート(Strip Chart):ドットをランダムに配置して重なりを軽減する形式。
  • スウォームプロット(Swarm Plot):ドット同士が重ならないよう最適配置する形式(Seabornなどで実装)。
  • 複合可視化:平均線や箱ひげ図を重ねて、統計指標と分布を併せて表示。

代替例

チャート種別適する状況特徴
ヒストグラムデータ数が多い場合階級化して全体傾向を把握
箱ひげ図要約統計を重視する場合四分位や外れ値を簡潔に表示
バイオリンプロット分布形状を滑らかに表したい場合カーネル密度推定による滑らかな形状

まとめ

ドット・プロットは、シンプルながらも情報量の多い分布可視化手法です。

少量データや教育目的でのデータ理解に特に適しています。

度数を点の数で示すことで、少量データの比較やカテゴリ別の分布把握に優れています。棒グラフやヒストグラムに比べ、データの個々の構成をより直感的に伝えることができます。

参考・出典

Licensed under CC BY-NC-SA 4.0
Nov 16, 2025 13:02 +0900