2021年07月07日

「データビジュアライゼーションの教科書」

20210707「データビジュアライゼーションの教科書」.jpg

藤 俊久仁/渡部 良一 著
秀和システム 出版

 内容が大きく二分されます。ひとつは理論で、もうひとつは個別具体的なチャートをもとに改善策を示す実践的内容です。前者でおもしろかったのは、ビジュアライゼーションの目的による分類です。後者では、いくつか新しい気づきを得ることができました。

 ビジュアライゼーションの目的による分類は、次のような図であらわされていました。

20210707「データビジュアライゼーションの教科書」1.png

『仮説検証型』の例としては、売上の半分以上はリピーターによって占められているのではないかという仮説を立てたうえで、データを視覚化し、仮説が事実かどうかをデータで裏付けるというプロセスになっています。

『仮説探索型』の例としては、売上を伸ばすためにデータから何かわかることはないだろうかという漠然とした目的や疑問をもとにデータを視覚化し、消費者向けの製品カテゴリを改善させれば売上が伸びるのではないかといった仮説を導き出すプロセスです。

『事実報告型』の例は、売上・利益・客数を週次でモニタリングしたいといった定点観測指標を視覚化し、売上は増えているのに利益が減っているのはなぜだろうかといった傾向の把握や着目点の特定に至るプロセスです。

『事実説明型』の例は、データをもとに伝えたい一連の事実や発見を視覚化し、作り手が伝えたいことを読み手が理解できるようにします。

『事実報告型』の『事実』にしても、『事実説明型』の『事実』にしても、視覚化した時点で何らかの意図が入り込むので、『事実』ということばがありのままの姿を指しているとは言えない気もしますが、著者の意図はわかります。

『主張説得型』は、自分の主張を訴えかけるためにデータをもとに事実や発見を視覚化し、作り手が伝えたいことを読み手が理解するという流れになっています。

『主張表現型』は、データを用いた新しい表現や美しさを追求して、データを視覚化し、読み手の共感・感動が得られるというプロセスを意図しています。

 もちろん、これが絶対的な分類ではないと思いますが、こういった類型化は興味深い試みだと思います。
posted by 作楽 at 21:00| Comment(0) | 和書(データ活用) | このブログの読者になる | 更新情報をチェックする

2021年06月22日

「問題解決ができる! 武器としてのデータ活用術」

20210622「武器としてのデータ活用術」.jpg

柏木 吉基 著
翔泳社 出版

 副題は「高校生・大学生・ビジネスパーソンのためのサバイバルスキル」です。学生や社会人がデータ活用スキルを伸ばすことができるよう著者が支援した経験がベースになっています。データを活用できないのはなぜか尋ねられることが多いので、何から説明すべきか参考にしたくて読みました。

 本当の初心者、つまりデータというものを活用した経験がなかったり、社会に出て間がなかったりする方々には、こういうことを説明する必要があるのだと学ぶことができました。この著者が説明していることはどれも、わたしが説明する必要があるとすら思っていなかったことでした。目の前にいる人が、自分が当然だと思っていることを当然と思っていないことに気づけなければ、何も伝わらないのだと思い知った気がします。

 たとえば、考えることが重要だという点で認識を合わせることは必須です。データを活用しようと思ったとき、データ分析手法を学ぶことより、目的を明確化し、仮説を立て、結果から結論を導きだすほうが重要です。

 また、正解はひとつではないのが当たり前だということに互いが納得する必要があります。(正解だと断定できないことが多いともいえます。) また、ある結論を支える材料も、ひとつ見つければ、それで終わりということでもありません。

 そのほか、仮説を立てても立証できるとは限りませんし、データをヴィジュアル化しても仮説が立てられないこともあるでしょう。いろいろなデータを複数の視点で試してみる必要があります。その点については、次のチャートがわかりやすかったと思います。左側の『指標を特定する』前に『目的・問題を定義する』が入っている点も優れていると思います。データを見ているうちに、解決すべき問題から外れてしまうことは起こりがちだからです。

20210622「武器としてのデータ活用術」1.png

 また、著者が難しいことばを使っていない点も見習いたいと思います。たとえば、評価をする際に必要な比較のテクニックについて『「値の大きさ」「推移」「バラつき」「比率」の四つの尺度で適切にデータの特徴を捉える』ようアドバイスしています。『標準偏差』という単語さえ使っていません。

 基本こそ、しっかりおさえるべきだと学ばせていただきました。
posted by 作楽 at 21:00| Comment(0) | 和書(データ活用) | このブログの読者になる | 更新情報をチェックする

2021年06月19日

「データ視覚化のデザイン」

20210619「データ視覚化のデザイン」.jpg

永田 ゆかり 著
SBクリエイティブ 出版

 データを活用したいけれど、どう活用すればいいのかわからないというエントリレベルの方々に参考になる情報が載っています。

 わたしは、グラフなどの資料を見て、『メッセージが読みとりにくい』『何を伝えたいのか見えない』などの所感を抱くことが多い割に、どういった改善案を提示すればいいのか、わかっていませんでしたが、そのヒントがこの本にありました。新たな情報を脳が受けるときにかかる『認知的負荷』を下げるよう、著者は助言しています。つまり、詰めこみすぎに注意すべきということです。

 たとえば、色の多用をやめ、グレーのみにするとか、際立たせたい部分のみカラーをつけるとかの工夫が必要です。3 色を限度にカテゴリ別に色分けするのもいいかもしれません。(人間が一度に認識できる色の数は 8 色までと言われているそうです。)

 タイトルなども、中立的にするのか、意見を前面に出すのかなどを充分に練ったうえで絞りこみ、そのうえで重要なことは大きく表示します。あわせて、フォントの種類なども極力減らします。

 罫線や凡例なども、本当に必要か吟味します。そうして、絞りこんだ結果として空白が生じても、恐れる必要はありません。少なさなど何かを語る空白は、そのままにしておくべきです。

 またわたしは、『やって (加工して) みないとわからない』ということも度々言っている気がしますが、その点についても、何を見てみるのかわからない方もいるのではないかと気づかされました。

 棒グラフで量を比べてみる、円グラフで割合を見てみる、折れ線グラフで推移を見てみるあたりまでは、実践できる方が多いかもしれませんが、その先に何を試してみるかを伝えるべきだったように思います。

 たとえば、推移を見るときも一般的な折れ線グラフのほか、ヒートマップやエリアチャート (面グラフ) を作成してみたり、要素が多くトレンドが異なる場合は、折れ線を分けるスパークラインを活用するという方法もあります。

 さらに、まったく別の観点から、分布や関係性に注目したり、地図を使って視覚化するという方法もあります。ヒストグラムや箱ひげ図 (ボックスプロット) を活用すると、分布傾向を把握できます。散布図や散布図よりさらに変数をひとつ増やしたバブルチャートを作成すると、関係性を俯瞰することができます。昔と違って、コロプレス図などもフリーソフトで作ることができるので、感覚的に把握できる地図を利用しない手はないと思います。

 数字の羅列を視覚化するための引き出しを少しずつ増やす方法を具体的に知ることができました。
posted by 作楽 at 21:00| Comment(0) | 和書(データ活用) | このブログの読者になる | 更新情報をチェックする

2020年09月26日

「医学統計の基礎のキソ 3」

20200926「医学統計の基礎のキソ 3」.jpg

浅井 隆 著
アトムス 出版

「医学統計の基礎のキソ 2」に続いて、シリーズ最終にあたる第 3 巻を読みました。カバーされている内容は、次のとおりです。

−選択基準 (inclusion criterion) と除外基準 (exclusion criterion)
−ランダム (無作為) 抽出区分 (random allocation)
−ランダム化比較研究 (randomized controlled trial:RCT)
−パワー分析 (power analysis)
−αエラー (α error) とβエラー (β error)
−ホーソン効果 (Hawthorne effect)
−プラセボ効果 (placebo effect)
−スタディグループ (study group) とコントロールグループ (control group)
−盲検化 (blinding)/マスキング (masking)
−二重盲検法 (double blind method) と一重盲検法 (single blind method)
−二重盲検ランダム化比較研究 (double-blind randomized controlled trial)
−コンソート声明 (CONSORT statement/Consolidated Standards of Reporting Trials statement statement)

 この中のパワー分析の power とは検出力を指しています。『差がある』のを、仮説検定で『有意差あり』として検出できる能力です。0.8 の場合、80% の確率で正しく有意差があると検出できます。

 これに関連する用語に、αエラーとβエラーがあります。前者は、『差がない』のに、仮説検定で『有意差あり』と誤った判定をすることで、後者は逆に『差がある』のに、仮説検定で『有意差なし』と誤った判定をすることです。

 医療で用いられる統計は、患者の治療に結びつくだけに、信頼性に関する情報は論文においても常にチェックするよう勧められています。実践的なシリーズ書籍だと思います。
posted by 作楽 at 21:00| Comment(0) | 和書(データ活用) | このブログの読者になる | 更新情報をチェックする

2020年09月25日

「秒速で人が動く数字活用術」

20200925「秒速で人が動く数字活用術」.png

小早川 鳳明 著
PHP 研究所 出版

 数字をビジュアル化することは、ビジネスパーソンが日常的に行なっていることだと思いますが、ありがちなのが、ビジュアル化自体に満足してしまい、目的に沿わせることを忘れてしまうことです。

 この本には、わたし自身が実践していることが正しいと確認できたことと、これまで実践してこなかったけれど今後取り入れたいことがありました。

 前者は、オーディエンスの設定と漏れの防止です。ビジュアル化に限らず、何かを見せるとき、わたしはオーディエンスを広げ過ぎず、決定権をもった方々に限定することを心がけています。著者は『説得する相手の顔をふたりだけ思い浮かべる』ことを勧めています。たとえば、会長と社長、社長と副社長といった、ふたりです。

 漏れの防止について著者は、人を動かすためには、抜け穴のない論理的な説明が必要だとし、抜けも漏れもないロジックツリーの作成を勧めています。ロジックツリーは、具体的には次のようなものです。

20200925「秒速で人が動く数字活用術」1.png

 後者のわたしが実践できていなかったことは、データのマスキングと相手がよく知っている数字の前段利用です。

 わたしは、データをすべて見せるようにしていましたが、著者は、自分の主張に直接関係しない数字は、敢えて見せない (マスキングする) ことを勧めています。たしかに、アウトプットがすっきりとし、どこを見てもらいたいのかが明確になります。

 また、相手を動かすために信頼を得る手段として、自分が主張したい数字の前段に、相手がよく知っている数字をもってくることは有効だと思えました。

 相手を説得するという目的を果たすために数字をどう使うかという視点では、参考になるメソッドが紹介されていると思います。
posted by 作楽 at 20:00| Comment(0) | 和書(データ活用) | このブログの読者になる | 更新情報をチェックする