2021年07月23日

「FACTFULNESS ファクトフルネス」

20210723「FACTFULNESS」.png

ハンス・ロスリング (Hans Rosling)/オーラ・ロスリング (Ola Rosling)/アンナ・ロスリング・ロンランド (Anna Rosling Rönnlund) 著
上杉 周作/関 美和 訳
日経BP 出版

 タイトルの FACTFULNESS は、ハンス・ロスリング氏による造語で、事実にもとづいていることを指しています。著者たちによると、人は、さまざまな本能に妨げられ、誤った思い込みによって、自分が接していない世界に対し事実にもとづかない認識を持っているのだそうです。

 この本の最初には、自分がそうした誤解をしている側の人間かどうかを確かめるためのクイズが用意されています。自分の職業を考えると恥ずかしいのですが、わたしも誤って認識している側に含まれていました。

 この本では、そういった誤った認識を誘発する本能、@分断本能、Aネガティブ本能、B直線本能、C恐怖本能、D過大視本能、Eパターン化本能、F宿命本能、G単純化本能、H犯人捜し本能、I焦り本能、を紹介し、それら本能の存在にあらかじめ気づき、事実にもとづかない思い込みによる判断をくださないようそれぞれに対する具体的な注意点が説明されています。

 わたし自身、どの本能にも引きずられているように思いますが、特に、ネガティブ本能 (世界はどんどん悪くなっているという思い込み) が強いのかもしれません。たとえば、世界的に見て収入格差はどんどん広がっているのではないかと感じています。

 著者は、そういったとき、数字など事実をもとに確かめるよう勧めています。収入でいえば、いまだに 1 日 1 ドル以下で生活する方々がいるいっぽう、莫大な収入を得る方が次々と登場しているのは事実で、人々の収入をヒストグラム化すると、横軸は広がっています。ただ、全体的な分布は右側にシフトしていっていることが見てとれるはずだと著者はいいます。

 さらに著者は、10 の本能がどう利用されているのかも指摘しています。わたしたちには、外部の雑音から自分たちを守るための防御壁のようなものが備わっていて、そこには 10 個の穴があり、それぞれが前述の本能と対応し『分断本能の穴』『ネガティブ本能の穴』『直線本能の穴』となっています。マスメディアは、そのことを十分理解していて、その穴を通り抜けられない情報を流そうとはしません。つまり、わたしたちは、マスメディアが本能の穴を利用していることを認識し、防御壁を通った情報に踊らされないようにする必要があるというのです。

 わたしにとっては意外に見える数字を多方面にわたり知ることができた、とにかく衝撃的な一冊でした。
posted by 作楽 at 21:00| Comment(0) | 和書(データ活用) | このブログの読者になる | 更新情報をチェックする

2021年07月20日

「データ分析のためのデータ可視化入門」

20210720「データ分析のためのデータ可視化入門」.jpg

キーラン・ヒーリー (Kieran Healy) 著
瓜生 真也/江口 哲史/三村 喬生 訳
講談社 出版

 データ可視化関連書籍に対する鋭い指摘が載っていました。知覚認知的観点から優れたグラフはどういったものか、改善を必要とする具体例をもとに議論する本もあれば、グラフを作成するコードのレシピを紹介する本もありますが、その両方を兼ね備えた本は、なかなか見当たらないという指摘です。

 良いチャートの条件を語るのに、チャート作成ツールを選ぶ必要がないいっぽう、どのようにチャートを作成するかは、ツールに限った話になるため、良いチャートの議論とチャートの作成手順を分けるのは合理的に見えます。ただ、読者は『わかりやすいチャートを作るプロセス全体』を実現したくて本を頼っているので、前者では、どのように作ればいいのかという問題は解決されず、後者では、どのようなチャートを目指すべきかという問題は解決されません。

 そのため、この本のゴールは『かしこく・わかりやすく・再現可能な方法によるデータ可視化について、その考え方と方法論の両方を紹介すること』となっています。使っているのは、フリーの R とその統合開発環境 (Integrated Development Environment: IDE) RStudio です。

 おもに、tidyverse パッケージ、ggplot() 関数を使ってチャートを作りながら、頭の働かせ方 (principles) と手の動かし方 (practice) の両方を学べるようになっています。使いこなせれば便利だと思ったのは、 ggplot() 関数を使った地図の描画 (第 7 章) です。

 また、この本を機に R の浸透具合を伺い知ることができました。R の各種パッケージをダウンロードできる CRAN (Comprehensive R Archive Network) ミラーサイトは日本にも何か所もあり、日本語ドキュメントも想像以上に充実しています。いつか、地図チャートをとっかかりに R に取り組みたいと思います。
posted by 作楽 at 21:00| Comment(0) | 和書(データ活用) | このブログの読者になる | 更新情報をチェックする

2021年07月07日

「データビジュアライゼーションの教科書」

20210707「データビジュアライゼーションの教科書」.jpg

藤 俊久仁/渡部 良一 著
秀和システム 出版

 内容が大きく二分されます。ひとつは理論で、もうひとつは個別具体的なチャートをもとに改善策を示す実践的内容です。前者でおもしろかったのは、ビジュアライゼーションの目的による分類です。後者では、いくつか新しい気づきを得ることができました。

 ビジュアライゼーションの目的による分類は、次のような図であらわされていました。

20210707「データビジュアライゼーションの教科書」1.png

『仮説検証型』の例としては、売上の半分以上はリピーターによって占められているのではないかという仮説を立てたうえで、データを視覚化し、仮説が事実かどうかをデータで裏付けるというプロセスになっています。

『仮説探索型』の例としては、売上を伸ばすためにデータから何かわかることはないだろうかという漠然とした目的や疑問をもとにデータを視覚化し、消費者向けの製品カテゴリを改善させれば売上が伸びるのではないかといった仮説を導き出すプロセスです。

『事実報告型』の例は、売上・利益・客数を週次でモニタリングしたいといった定点観測指標を視覚化し、売上は増えているのに利益が減っているのはなぜだろうかといった傾向の把握や着目点の特定に至るプロセスです。

『事実説明型』の例は、データをもとに伝えたい一連の事実や発見を視覚化し、作り手が伝えたいことを読み手が理解できるようにします。

『事実報告型』の『事実』にしても、『事実説明型』の『事実』にしても、視覚化した時点で何らかの意図が入り込むので、『事実』ということばがありのままの姿を指しているとは言えない気もしますが、著者の意図はわかります。

『主張説得型』は、自分の主張を訴えかけるためにデータをもとに事実や発見を視覚化し、作り手が伝えたいことを読み手が理解するという流れになっています。

『主張表現型』は、データを用いた新しい表現や美しさを追求して、データを視覚化し、読み手の共感・感動が得られるというプロセスを意図しています。

 もちろん、これが絶対的な分類ではないと思いますが、こういった類型化は興味深い試みだと思います。
posted by 作楽 at 21:00| Comment(0) | 和書(データ活用) | このブログの読者になる | 更新情報をチェックする

2021年06月22日

「問題解決ができる! 武器としてのデータ活用術」

20210622「武器としてのデータ活用術」.jpg

柏木 吉基 著
翔泳社 出版

 副題は「高校生・大学生・ビジネスパーソンのためのサバイバルスキル」です。学生や社会人がデータ活用スキルを伸ばすことができるよう著者が支援した経験がベースになっています。データを活用できないのはなぜか尋ねられることが多いので、何から説明すべきか参考にしたくて読みました。

 本当の初心者、つまりデータというものを活用した経験がなかったり、社会に出て間がなかったりする方々には、こういうことを説明する必要があるのだと学ぶことができました。この著者が説明していることはどれも、わたしが説明する必要があるとすら思っていなかったことでした。目の前にいる人が、自分が当然だと思っていることを当然と思っていないことに気づけなければ、何も伝わらないのだと思い知った気がします。

 たとえば、考えることが重要だという点で認識を合わせることは必須です。データを活用しようと思ったとき、データ分析手法を学ぶことより、目的を明確化し、仮説を立て、結果から結論を導きだすほうが重要です。

 また、正解はひとつではないのが当たり前だということに互いが納得する必要があります。(正解だと断定できないことが多いともいえます。) また、ある結論を支える材料も、ひとつ見つければ、それで終わりということでもありません。

 そのほか、仮説を立てても立証できるとは限りませんし、データをヴィジュアル化しても仮説が立てられないこともあるでしょう。いろいろなデータを複数の視点で試してみる必要があります。その点については、次のチャートがわかりやすかったと思います。左側の『指標を特定する』前に『目的・問題を定義する』が入っている点も優れていると思います。データを見ているうちに、解決すべき問題から外れてしまうことは起こりがちだからです。

20210622「武器としてのデータ活用術」1.png

 また、著者が難しいことばを使っていない点も見習いたいと思います。たとえば、評価をする際に必要な比較のテクニックについて『「値の大きさ」「推移」「バラつき」「比率」の四つの尺度で適切にデータの特徴を捉える』ようアドバイスしています。『標準偏差』という単語さえ使っていません。

 基本こそ、しっかりおさえるべきだと学ばせていただきました。
posted by 作楽 at 21:00| Comment(0) | 和書(データ活用) | このブログの読者になる | 更新情報をチェックする

2021年06月19日

「データ視覚化のデザイン」

20210619「データ視覚化のデザイン」.jpg

永田 ゆかり 著
SBクリエイティブ 出版

 データを活用したいけれど、どう活用すればいいのかわからないというエントリレベルの方々に参考になる情報が載っています。

 わたしは、グラフなどの資料を見て、『メッセージが読みとりにくい』『何を伝えたいのか見えない』などの所感を抱くことが多い割に、どういった改善案を提示すればいいのか、わかっていませんでしたが、そのヒントがこの本にありました。新たな情報を脳が受けるときにかかる『認知的負荷』を下げるよう、著者は助言しています。つまり、詰めこみすぎに注意すべきということです。

 たとえば、色の多用をやめ、グレーのみにするとか、際立たせたい部分のみカラーをつけるとかの工夫が必要です。3 色を限度にカテゴリ別に色分けするのもいいかもしれません。(人間が一度に認識できる色の数は 8 色までと言われているそうです。)

 タイトルなども、中立的にするのか、意見を前面に出すのかなどを充分に練ったうえで絞りこみ、そのうえで重要なことは大きく表示します。あわせて、フォントの種類なども極力減らします。

 罫線や凡例なども、本当に必要か吟味します。そうして、絞りこんだ結果として空白が生じても、恐れる必要はありません。少なさなど何かを語る空白は、そのままにしておくべきです。

 またわたしは、『やって (加工して) みないとわからない』ということも度々言っている気がしますが、その点についても、何を見てみるのかわからない方もいるのではないかと気づかされました。

 棒グラフで量を比べてみる、円グラフで割合を見てみる、折れ線グラフで推移を見てみるあたりまでは、実践できる方が多いかもしれませんが、その先に何を試してみるかを伝えるべきだったように思います。

 たとえば、推移を見るときも一般的な折れ線グラフのほか、ヒートマップやエリアチャート (面グラフ) を作成してみたり、要素が多くトレンドが異なる場合は、折れ線を分けるスパークラインを活用するという方法もあります。

 さらに、まったく別の観点から、分布や関係性に注目したり、地図を使って視覚化するという方法もあります。ヒストグラムや箱ひげ図 (ボックスプロット) を活用すると、分布傾向を把握できます。散布図や散布図よりさらに変数をひとつ増やしたバブルチャートを作成すると、関係性を俯瞰することができます。昔と違って、コロプレス図などもフリーソフトで作ることができるので、感覚的に把握できる地図を利用しない手はないと思います。

 数字の羅列を視覚化するための引き出しを少しずつ増やす方法を具体的に知ることができました。
posted by 作楽 at 21:00| Comment(0) | 和書(データ活用) | このブログの読者になる | 更新情報をチェックする