2017年9月27日水曜日

書評:グラフをつくる前に読む本(献本御礼)



著者より、「分析に関わる方にぜひ読んでもらいたい」ということで、ご恵贈いただいた。
松本さんとは直接の面識はないのだが、SNSを通じてメンションなどをさせてもらっており、今回めでたく著書を出版されたことは喜ばしい。おめでとうございます。

さて、本書についてであるが、この本の主題は「可視化」である。
データ分析における花形は長らく様々なアルゴリズムにあると思われがちであるが、
分析結果をいかに可視化し、わかりやすく表現するか、またミスリーディングしないように適切な可視化手法をするかという点はまだまだ注目されきっていない分野のため、このような入門書が出ることは業界にとっても大変喜ばしいと思った。

過去に寄稿記事で可視化に関しては2つほど記事を書いたことがあるが、本書はもっと丁寧に解説を加えているので、よりきちんと学びたい初学者には良いだろう。

・私の過去の寄稿記事
分析結果を可視化するグラフ--その用途と注意点(前編)
分析結果を可視化するグラフ--その用途と注意点(後編)

下記に本書の目次を紹介する。

第1章 グラフとデータ
- 私たちにもっとも身近な「統計データ」の意外な歴史
- そもそも「データ」とは何だろう?
- 知っておきたいデータの型,横断面データと時系列データ

第2章 棒グラフ
- ビジネスの現場で最も使われている棒グラフ
- 「グラフ」の生みの親は誰なのか?

第3章 折れ線グラフ
- 時系列データなら折れ線グラフ
- 誰が「折れ線グラフ」を考え出したのか?

第4章 円グラフ
- 実は使用が推奨されていない円グラフ
- 誰がグラフ表現的に誤った「円グラフ」を考え出したのか?

第5章 レーダーチャート
- 複数のグラフの良い所取りしたレーダーチャート
- 誰が「レーダーチャート」を考え出したのか?

第6章 ヒートマップ
- 表を色で塗って視覚的に訴えるヒートマップ
- 誰が「ヒートマップ」を考え出したのか?

第7章 散布図
- 2種類のデータの関係性を表現する散布図
- 誰が「散布図」を考え出したのか?

第8章 積み上げグラフ
- 総量の違うデータ項目の内訳同士を比較するなら積み上げ棒グラフ
- 内訳の推移を表現するなら面グラフ

特別付録 データジャーナリズム入門
付録1 日本の生産性は本当に低いのか?
付録2 雑誌は本当に衰退しているのか?
付録3 「大阪都構想」はなぜ否決されたのか?

見てのとおり、大枠の構成として、各グラフの使い方や特性を説明した後に、そのグラフが発明された歴史を解説する内容となっている。
今までこういった解説は着眼点になかったので、面白い切り口だと思う。
より深くグラフを理解して使いたい場合、その出自やコンテキストを知っておくとより良いだろう。

グラフはツールを使えば簡単に作成できる分、誤用も多く、円グラフの誤用における炎上は今のSNSでは界隈の人間であれば容易に想像できるだろう。
しかし、これもコンテキストの高い情報であり、入門者にとってはたまたま誤っただけであり、他意はないのかもしれないので、そうした方への転ばぬ先の杖として本書を利用してもらうのが良いと感じる。

分析力を高めたい若者が最近多く入ってきているので、そうした若者へ本書を手渡したいと思っている。
松本さん、ご恵贈ありがとうございました。

ページビューの合計