データジャーナリズムにおける第一人者であるサイモン・ロジャースが提唱しているワークフローを紹介します。明確なステップに分かれていないため、筆者による意訳が含まれています。
- 入手データの精査…ブレイキングニュース、定期的に行われるイベント、探求される研究、その他データなど、シェアされたデータについて、「何と比べるべきか・どんな変化を示すべきか」「データにはどんな意味があるか」「どんな他のデータと組み合わせるべきか」といった点を精査する
- データのクレンジング…「間違ったフォーマット、マージされたセル、不必要な列、異なる単位の混入」をクレンジングする
- データに対する計算…結果に対する検証、必要に応じて再計算を行う
- 公表…「社内グラフィックチームによる可視化」「フリーツールによる可視化」「そのまま公表」「読み物コンテンツ」などの手段による公表
オリジナルの初稿は2013年に公開されたもので、かなり初期の提唱であることがわかります。図化はご本人ではなく、Mark McCormickさんが担当しました。