Featured image of post コミュニケーションの媒介としてのデータ可視化

コミュニケーションの媒介としてのデータ可視化

「情報の科学と技術」2020年8月号 特集:RDF/SPARQLの検索と可視化にて初出の論考です。

要約

大量のデータは,ただデータとして存在しているだけでは有効活用できない。データ可視化の価値について考察した。価値は人が感じるものである。そこでデータ可視化を発信者と受信者によるコミュニケーションの媒介と捉え,そのあり方を考察した。代表的なワークフローを選出し,発信者主体のものと受信者主体のもので二分し,概観した上で,そこから浮かび上がるニーズとコミュニケーションのあり方を考察した。データ可視化は人間社会において,人が人に何かを伝えたり,誰かの課題を解決することをサポートしたりと,今後も重要な役割を担うことは間違いない。

キーワード: データ可視化,コミュニケーション,研究,情報デザイン,データジャーナリズム,データビジネス,ワークフロー

1. はじめに

SPARQL/RDFの活用により,複数のデータソースを統合してリッチなデータを作成することが可能となる。大量のデータは,ただデータとして存在しているだけでは有効活用できない。データの活用とその価値について,データ可視化という観点から考察した。データ可視化を発信者と受信者によるコミュニケーションの媒介と捉え,そのあり方を考察した。文中に個別の断りはないが,スモールデータやビッグデータのいずれかに限定しない。

2. コミュニケーションとしてのデータ可視化

データ可視化を含む,データを活用した何らかの成果物をここではデータ・プロダクトと呼ぶことにする。データ・プロダクトは,作り手(生産者)と使い手(消費者)がいて,はじめて成り立つといえる。これを両者によるコミュニケーションであると捉え,作り手を発信者,使い手を受信者と言い換えることにする。データ可視化はデータ・プロダクト構成要素の一つであり,コミュニケーションとして捉える際に最も大事な要素であると考える。そこで,データ可視化が関わる領域において提唱されているワークフローから代表的なものを選出し,筆者の判断で発信者のモチベーションやニーズありきで成り立つ発信者主体のものと,同様に受信者主体のもので二分し,概観する。その上で,そこから浮かび上がるニーズとコミュニケーションのあり方を考察した。

3. 発信者主体のコミュニケーション

発信者のモチベーションやニーズが中心にあって成立するデータ・プロダクトは表現伝達型であるといえる。以下の領域から選出した。

  • 研究(問題解決型)
  • 情報デザインやアート表現
  • データジャーナリズム
    以下,領域ごとに代表的なワークフローを紹介し,データ可視化のニーズとコミュニケーションのあり方を考察する。

3.1 研究(問題解決型)

3.1.1 研究(問題解決型)のワークフロー

研究のワークフローには様々なものが提唱されており学術領域によっても異なるが,ここでは丸山宏「新企業の研究者をめざす皆さんへ」1)を参照した。丸山氏は,研究を個別の問題を解く「問題解決型」と今までにないシステムを作ってみる「設計型」に大別している。筆者の解釈では,「問題解決型」はその問題を解決したいという発信者のモチベーションにより研究が開始される。逆に「設計型」は企業など外部からの依頼に応じて取り組むことが多いのではないか。ここでは発信者主体の研究として「問題解決型」を念頭にワークフローを紹介する。

  • 1.1 研究の入口:良い問題(研究課題)を選ぶ
  • 1.2 研究本体:問題を解く
    • 1.2.1 問題の分割
    • 1.2.2 仮説生成と検証
    • 1.2.3 仮説の検証
    • 1.2.4 関係の推論
    • 1.2.5 因果の推論
    • 1.2.6 改善を行う
    • 1.2.7 ソリューションを設計する
  • 1.3 研究の出口結果を価値につなげる
    • 1.3.1 技術移転
    • 1.3.2 間接的な貢献
    • 1.3.3 研究をまとめること

データ可視化の関わり方としては研究本体における「1.2.2 仮説の生成と検証」〜「1.2.5 因果の推論」における探索的分析や確証的分析といったデータ分析の結果として,および「1.3.3 研究をまとめること」における研究結果を他人にもわかるようにまとめる際に付随するデータ可視化であろう。

3.1.2 研究(問題解決型)におけるデータ可視化のニーズ

前項で述べた通り,探索的分析や確証的分析における分析結果としてのデータ可視化と,研究成果のプレゼンテーションやアウトリーチのためのデータ可視化に大別する。

前者においては,データ分析の成果が出ることがゴールとなり,これを見逃さない可視化が重要となる。利用するRやPythonといったプログラミング言語でのデータ分析パッケージの完成度が高ければ,可視化について注意すべきことは少ない。パッケージの完成度が低いものについては利用を予め避けるか,問題を認識した上で対処する必要がある。たとえばPythonのためのチャート描画ライブラリであるMatplotlibにおいて,ヴァージョン1.*までは,デフォルトのプロパティサイクルの色は‘r’,’g’,’b’,’c’,‘m’,’y’,’k’(つまり液晶ディスプレイ用発色方式RGBと,印刷用発色方式CMYKでの色の単色利用)であった2)が,これは出力媒体の発色方式であり,データの性質との整合性は何もなかった。これはヴァージョン2.0以降改善されている。

後者においては,前者をそのまま掲出する場合と,より広範なアウトリーチを求めて異なる表現が必要とされることがあり,表現伝達のプロフェッショナルではないため,悩む研究者も多いと推察する。

3.1.3 研究(問題解決型)におけるデータ可視化を用いたコミュニケーション

受信者による発信内容の理解と行動変容をコミュニケーションのゴールと捉える。受信者側の認知を大きく変えたい場合,もしくは発信内容への興味関心が薄い受信者へ働きかけたい場合,たとえば食料廃棄の問題を広く訴える際は廃棄量をチャートで示すよりも廃棄される膨大な食料を写真で提示した方が受信者側の認知が増すこともある。同様のことをデータ可視化による伝達で実現を目指す場合,たとえばインフォグラフィックとして多用されるようなグラフィック表現とする前提で,数値の表現においてビジュアル変数として長さを選ぶのか,面積を選ぶのか,色を選ぶのかによって受信者側の認知は変わる。

3.2 情報デザインやアート表現

3.2.1 情報デザインやアート表現のワークフロー

ウェブコンテンツとしてのインタラクティブなデータ可視化の情報デザイナーとして有名なBen FryやMoritz Stefanerなどのワークフローを踏まえて,Data Visualization Handbook 3)において,Juuso Koponen, Jonatan Hildenは以下のようなワークフローを提案している。

  • 1-a. 定義…コミュニケーションの目的,ターゲットグループ,グラフィックのためのコンテキストを整理。
  • 1-b. 発見&収集…使用するデータを確認する。データの信頼性と技術的品質を確保し,必要に応じて他の情報源からのデータで補完する。
  • 2. 探索と整理…収集したデータを様々なツールを使って調べ,使える形に整理する。設定された目的に照らし合わせて,興味のない,あるいは適切でないデータをフィルタリングする。
  • 3. スケッチ&実験…様々な方法でデータ提示していく。
  • 4. 作成と精緻化…提示方法が選択されたあと,公開用のグラフィックを作成,精緻化していく。
  • 5-a. 評価…公開後,使用状況やリーチに関するフィードバックを収集し,コミュニケーションの目的が達成されているかどうかを確認する。
  • 5-b. 更新と拡張…Webコンテンツの開発・メンテナンスなので,公開後も継続して行う。必要に応じて,更新や拡張を行う。

3.2.2 情報デザインにおけるデータ可視化のニーズ

情報グラフィックにおけるデータ可視化は,「3.スケッチ&実験」にある通り様々な可能性を探る際に,探索的な可視化を素早く反復しながら試すことが求められる。その際,スタンダードなグラフィックアプリケーション,たとえばAdobe Illustratorなどにおいて,十分な探索的データ可視化が行える機能が付属しているとは言い難い。そこで一から探索的な表現を探ることが可能なデザイナー向けクリエイティブコーディング環境を用いることが多く,代表的なものとして,Processing,D3.js,Three.jsなどが挙げられる。これまで存在していたチャートがデータ表現のテンプレートだとすると,これらを用いることによってテンプレートに収まらない新しいチャート表現が生まれる可能性がある。近年ではエリア・チャートの欠点を克服したストリーム・グラフ 4)という新しいチャートが開発され,定着している。

3.2.3アート表現におけるデータ可視化のニーズ

アート作品にコンセプトを込める際,データの扱いにもコンセプトとの整合性が求められる。データ・プロダクトの成果物としては必ずしも可視化とは限らず,視覚以外の感覚へ訴える作品化も多く,その場合はデータ・フィジカライゼーションと呼ばれる。またテクノロジーを生かした即応性(リアルタイム性)を求められることもある。あらかじめ蓄積されたデータや即時的にセンサーから入力されたデータが組み合わされ,視覚表現や,感覚表現のためのアクチュエーターへの出力として活用される。エンドユーザーがデータの数値を正確に認知することよりも,エンドユーザーの生体的な反応を引き出すような演出が優先されることも多い。

3.2.4 情報デザインやアート表現におけるデータ可視化を用いたコミュニケーション

一言で語れるものではないが,情報デザインであれば扱うデータや情報が誤解されることなく受信者へ伝達されること,アート表現であればコンセプトや作品としての完成度を受信者が体感することがコミュニケーションになり得る。

3.3 データジャーナリズム

3.3.1 データジャーナリズムのワークフロー

ここでは,既存のデータジャーナリズムの取り組みをバランスよくまとめている資料である,マイクロソフトによる「DataJournalismPlaybook」5)を参照する。「データジャーナリズムとは,そのデータを調査し,理解し,形にして,説得力のあるストーリーとして伝えるプロセスのことだ」とし,プロセスは直線的ではなく,反復するものだという前置きのあと,以下のワークフローを紹介している。

  • 1. アイデアと仮説の生成
  • 2. データ収集
  • 3. データクリーニング
  • 4. データのインポートとモデリング
  • 5. データ探査
  • 6. ストーリーボードとデータの可視化
  • 7. データの可視化の洗練8.出版と共有

3.3.2 データジャーナリズムにおけるデータ可視化のニーズ

報道機関のコンテンツを速報ニュースと調査報道に大別する。

前者においては,たとえばAIによるアラートシステムが挙げられる。データ可視化が使用されるのは,速報性の高い出来事の日時や場所の把握や提示などだろう。

後者においては,政治・社会・経済・スポーツなどの報道機関が扱うジャンルごとの「5.データ探索」や「6.ストーリーボード」のほかにも,社会に広く流通する情報媒体としての紙や写真,動画など膨大な量のバイナリー形式の非構造データをデータ・レコグニションして報道すべきインサイトを発見することや,テキストデータのマイニングが挙げられる。社会に多くみられるネットワーク関係(人間関係や企業の取引関係)からインサイトを発見するため,膨大なバイナリー形式の非構造データを構造化した上でグラフ構造をもたせて,検索機能やネットワーク可視化を提供し調査報道に活用しようとする,ICIJによる「パナマ文書」の調査報道 6)やMicrosoftによる「JFKFiles」7)といった事例が存在する。

3.3.3 データジャーナリズムにおけるデータ可視化を用いたコミュニケーション

ジャーナリズムの舞台が新聞やテレビといったマスメディアのみだった時代は媒体の特性もあり一方的な表現伝達にならざるをえなかった。インタラクティブなデータ可視化を通じたコミュニケーションは受信者たる読者の行動変容を促し,情報探索を通じて,社会的な問題を個人的な問題として捉え直すことを促進する。それはジャーナリズムが自ら規定した役割,つまり社会課題を伝達するが社会課題の解決そのものの行為には関わらない,という従来の線引きに揺らぎをもたらす。

3.4 発信者主体のまとめ

発信者主体のモチベーションやニーズから始まるデータ可視化のワークフローと,そこで必要とされるデータ可視化のニーズ,必要とされるコミュニケーションについて,領域ごとに考察した。

データの中から如何に伝えるべきインサイトを漏れなく発見し,発信者が信じる効果的な方法で表現・伝達すべきかに注目しているかがわかる。伝達後については,データ・プロダクトの完成度という観点での反復的な更新が語られるのみであることが多い。

4.受信者主体のコミュニケーション

受信者のモチベーションやニーズが中心にあって成立するデータ・プロダクトは課題解決型であるといえる。以下の領域から選出した。

  • 研究(設計型)
  • ビジネス(データビジネス)
  • ビジネス(経営指標トラッキング)
  • 公共サービス

以下,領域ごとに代表的なワークフローを紹介し,データ可視化のニーズとコミュニケーションのあり方を考察する。

4.1 研究(設計型)

4.1.1 研究(設計型)のワークフロー

Tamar Munznerが「四レベルのバリデーション」(Four Levels For Validation) 8)として提唱している。データ・プロダクトの制作に伴う複雑な問題を四レベルに分割することで,異なる懸念事項を個別に解決できる分析フレームワークとしても機能する。以下の四レベルに分割している。

  • 1. ドメイン状況(Domain situation)…対象ドメイン,対象ユーザーを定め,解くべき要件を定義する。その際,インタビュー,観察,調査などを行うこともある。ただ,対象ユーザーからいくら詳しくヒアリングしても真の課題が明らかにならない場合もある,としている。
  • 2. データ/タスク抽象化(Data/task abstraction)…ドメイン固有の問題とデータを,ドメインに依存しない汎用的なタスクとデータへ定義し直す。
  • 3. ビジュアル・エンコーディング/インタラクション慣用句(Visual encoding/interaction idiom)…ビジュアル・エンコーディングとインタラクション方法の設計を指す。
  • 4. アルゴリズム(Algorithm)…それらのイディオムを計算機でインスタンス化するアルゴリズムの設計を指す。これらはカスケードな関係にあり,上位レベルの出力は,下位レベルへ影響を与える。工程が上位から下位へ進み,あるレベルのブロックをよりよく理解することで,他のレベルのブロックを精緻化するためのフィードバックとなり,反復することもある前提である。

まずは受信者の課題を如何に解決するかがゴールであり,そのために必要なタスクとデータを明らかにした上で汎用なそれらへと変換する。その上で適切なビジュアル・エンコーディングとインタラクションを定義する,というのが大まかな流れだ。

上位から下位へ工程が進んでいく問題駆動型(problem-driven)と,下位から上位へ工程が進んでいく技術主導型(technique-driven)と提案されている。技術主導型は発信者主体寄りの考え方だが,ここでは論旨に合わず省略しても論旨を損ねないため省略し,問題駆動型のみを前提とする。

4.1.2 研究(設計型)におけるデータ可視化のニーズ

対象となる業務分野固有の課題を,如何に汎用的なタスクとデータ処理に置き換えるかが重要となる。ここでのタスクはビジュアル・エンコーディングとインタラクションで実行することになるため,データ可視化はユーザー・インターフェイスそのものの役割を果たす。またコンピュータで全自動に行うことが可能な処理はデータ可視化の必要は必ずしもない。Munzner氏が書いているように,人間がタスクに介在するからこそ,データ可視化はユーザー・インターフェイスとして重要な役割を果たす。

4.1.3 研究(設計型)におけるデータ可視化を用いたコミュニケーション

研究(設計型)においては,開発開始時や開発中に,発信者と受信者でコミュニケーションをしっかり取り,本当に必要なタスクとデータ処理は何なのかをよく突き詰める必要がある。Katy Börnerによると,受信者が自身の課題を正しく言語化できるとは限らないが,それでも受信者やエンドユーザーの開発への参加は,成功の必須要件だ9)という。

4.2 ビジネス(データビジネス)

4.2.1 ビジネス(データビジネス)のワークフロー

ここでいうデータビジネスは,データそのものが重要な資産であるサービスを提供するビジネスを指す。データビジネスにおいてワークフローは様々あるが,山本大祐「AIプロジェクト実践読本」10)に標準的なものが掲載されていたので引用する。「課題解決とサービス実装のための」という副題がついている通り,実社会でAIを活用するための実際的な知識や産業別ケーススタディを紹介している。開発プロセスとして以下をあげている。

  • 1. プロジェクト・プランニング
  • 2. PoC(机上実証→フィールド実装)…仮説検証
  • 3. 製品開発
  • 4. 導入・運用…反復的な追加学習

2は「AIを作るフェーズ」と,3・4は「AIを使うフェーズ」と言い換え可能で,データ可視化の観点では,2は数理モデルを作成する際の各種データ分析結果としてのデータ可視化であり,3・4においては,実際のサービスのUXやユーザー・インターフェイスの一部としてのデータ可視化である。

4.2.2ビジネス(データビジネス)におけるデータ可視化のニーズ

開発されたAIサービスを現場で活用するエンドユーザーのリテラシーに合わせて設計することが重要となる。SaaS(Software as a Service)とよばれるB2Bサービスでは受信者・エンドユーザーの行動をデジタル的に追跡できることが,既存のB2Bサービスと比べた際の圧倒的なメリットであり,利用状況を継続的に観察しながらUXやユーザー・インターフェイスを改善し,カスタマーサクセスを実現していくことが求められる。その際の観察はデータ可視化を通じて行われる。

4.2.3 ビジネス(データビジネス)におけるデータ可視化を用いたコミュニケーション

実際のサービスのUXやユーザー・インターフェイスの一部としてのデータ可視化について述べる。使い手であるエンドユーザーは幅広く,ときに一般消費者や一般消費者向けサービスの店頭販売員であることもある。データ分析の際に用いるような抽象度の高いデータ可視化やユーザー・インターフェイスよりも,現実に存在している何かを模している(たとえば店舗レイアウト)ことや,一画面あたりのタスク数や選択肢が限定されていること,パソコンではなくスマートデバイスで操作できること,などが求められることがある。

4.3 ビジネス(経営指標トラッキング)

4.3.1 ビジネス(経営指標トラッキング)におけるワークフロー

ここではセルフB.I.(Business Intelligence)の大手Tableauのワークフローを参照する。TableauではTableau Blueprint 11)として,ワークフローの雛形が提供されている。それによると,

  • 1.分析戦略
  • 2.エグゼクティブアドボカシーとプロジェクトチーム
  • 3.アジャイル性,スキル,コミュニティを確立することで,Tableauの導入と運用を支援
    • 3-1.アジャイル性…導入,監視,メンテナンス
    • 3-2.スキル…教育,評価,分析のベストプラクティス
    • 3-3.コミュニティ…コミュニケーション,エンゲージメント,サポート

であり、プランナーのゴールは,利用企業が「データドリブンな組織になる」こととしている。ビジネス上のニーズに応じた様々なデータ活用が事業部・課など組織内のグループ単位で行われる。その際必要なデータが様々な場所やサービスに点在することから,それら多様なデータソースを一元的に集約し,それぞれの課題に合わせた柔軟なダッシュボード作りを行うことが可能であるセルフB.I.ツールが用いられることが多い。

4.3.2 ビジネス(経営指標トラッキング)におけるデータ可視化のニーズ

標準的には二十種類程度のいわゆる統計チャートが可視化に用いられ,受信者・エンドユーザーによるドリルダウンのためのフォーム要素(プルダウンやラジオボタン,チェックボックス)などと共に用いられることが多い。

4.3.3 ビジネス(経営指標トラッキング)におけるデータ可視化を用いたコミュニケーション

データ可視化はコミュニティにおいて,シェアすべき欠かせない主役的存在である。組織内であれば意思決定のための共通認識やエビデンスとして,組織外ではアメリカを始め日本においてもたとえばTableauコミュニティが活発にデータ可視化作品やその技法をシェアしあい,所属組織を超えて対話を生み出すコミュニケーションとして用いられている。

4.4 公共サービス

4.4.1 公共サービスにおけるワークフロー

総務省が地方公共団体向けに「地方公共団体におけるデータ利活用ガイドブック」12)を公表している。この中でワークフローに近い「第3章データを活用した行政サービス開発の進め方」から引用する。

  • ステップ1: 目的を定めよう
  • ステップ2: サービス内容を考えよう
  • ステップ3: 実現方法を考えよう
    • 3-1: どのようなデータが必要か明らかにしよう
    • 3-2: データを使うための手続を確認しよう
    • 3-3: データの入手・共有方法を確認しよう
    • 3-4: データを使った後に行うことを確認しよう
  • ステップ4: サービスを開発しよう
  • ステップ5: 効果や課題を確認しよう

ステップ1,2に関連して,サービス設計十二箇条が定められており「利用者のニーズから出発する」「全ての関係者に気を配る」などが挙げられており,受信者のニーズを念頭に作られていることがわかる。ここでは各地方自治体において,データを活用してその地域特有の課題解決に資するサービスを構築することが求められていることがわかる。別途公表されている「総務省ICTスキル総合習得プログラム」13)と合わせて考えると,データのクレンジングと可視化,分析,実際のサービスにおいて,データ可視化が用いられることが予想される。

4.4.2公共サービスにおけるデータ可視化のニーズ

ガブ・テックにおいてはデジタルトランスフォーメーションを含めた行政手続きのデジタル化の一部としてのデータ可視化,シビック・テックにおいては自助や共助のための行政資源や地域資源の顕在化としてのデータ可視化,地方公共団体においては地方創生のための地域資源の発見と活用のためのデータ可視化がある。「RESAS(地域経済分析システム)」14)はそのために開発運用されている。

4.4.3 公共サービスにおけるデータ可視化を用いたコミュニケーション

発信者と受信者の役割が固定的ではなく,時に入れ替わる。自助や共助のための行政資源や地域資源の顕在化としてのデータ可視化は,セクターを超えた,発信者・受信者間だけでなく、発信者同士や受信者同士のコミュニケーションをも促進する。

4.5 受信者主体のまとめ受信者主体のモチベーションやニーズから始まるデータ

可視化のワークフローと,そこで必要とされるデータ可視化のニーズ,必要とされるコミュニケーションについて,領域ごとに考察した。

どれも受信者のニーズ,つまり課題解決などの価値提供ありきであり,それが実現できるデータ・プロダクトを完成させることを成功と定義しているかがわかる。

5.ニーズ及びコミュニケーションという観点からみたデータ可視化

5.1ニーズという観点からみたデータ可視化

これまで考察したデータ可視化のニーズを,発信者主体・受信者主体別に一覧する。

(1) 発信者主体
  • 研究成果のプレゼンテーションやアウトリーチの一部として
  • 新しい表現のためのデザインスケッチや実験として
  • テクノロジーを生かした入力データの即応性ある表現として
  • 人間社会に多く流通する非構造データを元に,人間関係や企業の取引関係を描き出す手段として
(2) 受信者主体
  • 課題解決のために実行するタスクのユーザー・インターフェイスとして
  • サービスのUXやユーザー・インターフェイスそのものもしくはその一部として
  • 組織内のデータ集約と,利用者それぞれの課題に合わせて作成可能な柔軟なダッシュボードとして
  • 自助や共助のための行政資源や地域資源の顕在化として
(3) 共通
  • データ・レコグニション,データ・クレンジング,探索的分析,確証的分析に付随するデータ可視化

5.2 コミュニケーションという観点からみたデータ可視化

これまで考察したデータ可視化のコミュニケーションのあり方を,発信者主体・受信者主体別に一覧する。

(1) 発信者主体
  • 発信内容の興味関心が薄い層への働きかけ
  • データや情報,コンセプトの発信者の意図通りの伝達
  • 情報探索を通じて,社会的な問題を個人的な問題として捉え直すことを促進
(2) 受信者主体
  • 開発時における継続的な意思疎通やその成果物として
  • 開発後サービス提供時におけるカスタマーサクセスの一部として
  • 発信と受信の役割が固定的ではなく対話を生み出す手段として

6.おわりに

データ可視化を発信者と受信者によるコミュニケーションの媒介物と捉え,そこで必要とされるニーズとコミュニケーションのあり方について考察した。

発信者主体のコミュニケーションは,表現伝達型として,発信者側での伝えるべきインサイトの発見及び表現と時には受信者側での行動変容をも念頭に置くべきである。

受信者主体のコミュニケーションは,課題解決型として,受信者側の課題解決に資するために,受信者側と発信者側での十分なコミュニケーションが必須となる。

いずれにしてもデータ可視化は人間社会において,人が人に何かを伝えたり,誰かの課題を解決することをサポートしたりと,今後も重要な役割を担うことは間違いない。

参考文献

Licensed under CC BY-NC-SA 4.0