Featured image of post モザイク・プロット(Mosaic Plot)

モザイク・プロット(Mosaic Plot)

モザイク・プロット(Mosaic Plot, Mosaic Display)は、カテゴリ変数同士の関係を、セルの面積で表現する可視化手法です。Hartigan & Kleiner (1981) によって提案され、その後 Friendly (2001) が歴史的・理論的に整理しました。

基本原理は以下のとおりです。

  • 1.横方向の分割:最初の変数のカテゴリごとに、全体に対する比率に応じた幅を割り当てる。
  • 2.縦方向の分割:その中を、別の変数のカテゴリごとの割合に応じて高さ方向に分割する。
  • 3.面積:結果として得られる長方形(タイル)の面積が、そのカテゴリ組み合わせの度数や確率に比例する。

こうして、2変数のクロス集計表を直感的に理解できるだけでなく、3変数以上でも再帰的に分割を重ねることで多次元データを可視化できます。

モザイク・プロットの特徴と強み

  • クロス表の視覚化 …単なる数表では見えにくい「カテゴリの組み合わせごとの大きさ」を、面積として一目で把握できます。
  • 条件付き割合の理解 …たとえば「男女 × 喫煙有無」のような表では、「全体に占める男女比」と「各性別内での喫煙率」を同時に表現可能です。
  • モデル診断ツールとしての応用 …Friendly (2001) は、モザイク・プロットを 対数線形モデル (log-linear model) との組み合わせで活用できると述べています。観測度数と期待度数の差(残差)をセルの色で示すことで、独立性から逸脱しているパターンを直感的に見つけることができます。
  • 順序最適化と探索的分析 …カテゴリや変数の並び順を工夫することで、相関関係やパターンがより明確になります。再帰的に分割するため、変数の順序は見え方に強く影響します。
  • 教育的な効果 …「量(度数)と割合(比率)の両方を面積で同時に表す」という特性から、データの相対関係を理解するトレーニングツールとしても有用です。

活用場面の具体例

  • 社会調査やアンケート分析 …属性(性別、年代、居住地など)と回答カテゴリの関係を、全体比率と内訳比率を同時に示せます。
  • マーケティング分析 …製品カテゴリー × 購入チャネルなど、二次元クロス表の分布を直感的に把握できます。
  • 統計教育 …クロス表の数値をグラフ化することで、独立性・相関関係を視覚的に理解する教材になります。
  • 探索的データ分析 (EDA) …データを統計モデルにあてはめる前に、偏りや分布の特徴を見つける第一歩として有効です。

マリメッコ・チャートとの比較

一方、マリメッコ・チャート(Marimekko chart, Mekko chart) は、ビジネスインテリジェンスやダッシュボードで広く使われる可視化です。その仕組みはモザイク・プロットと非常に近く 「幅可変の積み上げ棒グラフ」 として理解されます。横幅が第1変数の比率を、縦方向の積み上げが第2変数の割合を示し、セルの面積が組み合わせの大きさを表します。

両者を比較すると次のように整理できます。

観点 モザイク・プロット (Mosaic Plot) マリメッコ・チャート (Marimekko / Mekko Chart)
起源・文脈 統計学に由来。Hartigan & Kleiner (1981)、Friendly (2001) らが整理 BI・経営分析で普及。名称はフィンランドのブランド「Marimekko」に由来
定義・構造 再帰的分割により、セル面積 ∝ 度数(確率) 幅可変の積み上げ棒グラフ。セル面積 ∝ 度数(確率)
主な目的 クロス表(分割表)の可視化、統計モデル診断 市場シェアや売上構成などのビジネスデータ可視化
色付け 統計的残差(期待度数との差)を色で表すなど分析的用途 セグメントごとに色分けしてプレゼンテーションに活用
実装例 R (mosaicplot, vcd, ggmosaic)、JMP、S-PLUS Tableau、PowerPoint (think-cell)、Spotfire、AnyChart
利用分野 統計教育、探索的データ分析、モデル適合度の診断 経営ダッシュボード、マーケティング資料、売上内訳の提示
強み 多変数対応や残差可視化など統計分析との親和性 ビジネスデータを直感的に伝える視覚的効果
限界 面積比較は視覚的に誤差が出やすい。カテゴリ数が多いと見づらい 幅の変化が直感的に理解されにくい場合がある

まとめ

  • モザイク・プロットは、カテゴリ変数の交差を面積で表す統計的可視化の基本手法で、モデル診断や教育にも使われる。
  • マリメッコ・チャートは、同じ構造を持ちつつ、ビジネス用途で「市場シェア × セグメント比率」を直感的に示すために定着した呼び方。
  • 両者は原理的にはほぼ同じチャートであり、文脈によって呼び名や強調点が異なると考えるのが妥当。

参考・出典

Licensed under CC BY-NC-SA 4.0