2020年07月30日

「数字に騙されないための 10 の視点 統計的な?」

20200730「統計的な?」.png

アンソニー・ルーベン (Anthony Reuben) 著
田畑 あや子 訳
すばる舎 出版

 わたしが数字を見るときに気をつけていることが、この本の終わりのほうに書かれてありました。アンケート調査や経済モデルを見るときに『最初にすべきことは、その調査を実施したのは誰で、それに金を払っているのは誰かを確かめることだ。それによって正当化されるキャンペーンをしているグループが発注している場合は、その結論を少し疑うべきだが、独立したグループであっても、かたよったグループと同じように間違う場合がある』。

 しかし、それよりもっと端的なヒントが最初に記されていました。『これは真実だとしたら理にかなっているだろうか』。その数字が本当だったら理屈に合わないと思ったら、疑うべきだということです。

 そう言われても、理にかなっているか何をどのように評価すればいいか、なかなかわからないものです。だから著者は、こういうときは特に注意すべきという具体例を 10 点あげています。

 たとえば、実数がなくパーセントだけ表示されているときは、注意が必要だと警告しています。『毎日ソーセージを 1 本かベーコンを 3 切れ食べていれば、膵臓がんの発症リスクが 20 パーセント上昇する。』とあった場合、わたしなどは反射的にソーセージやベーコンを食べるのが怖くなります。しかし、実数を見ると、違う印象を受けることもあります。具体的には、1 日にソーセージを 1 本かベーコンを 3 切れを食べていなければ、400 人中 5 人が (生涯で) 発症し、それらを食べていれば、6 人に増えるという実数です。

 また、原価計算も危険だと注意を促しています。その理由は、 算出方法次第で、何かを安く、あるいは高く見せることが簡単だからです。まず、特定ケースの原価を見せる動機を考え、そのコストが特定ケース以外でも負担されるものか、あるいはその特定ケース限定の追加費用かを確認して、目の前の原価計算にどれだけの信頼がおけるか判断するよう勧めています。

 いつも、わたし自身がうまく説明できない単語『信頼水準』と『信頼区間』についても、ONS が出す失業者数を例に『失業者数の変化を表す数字は一般的には信頼水準 95 パーセントで約 7 万 5000 の信頼区間であるが、その意味は、失業者数の変化は ONS が出した数字のプラスマイナス 7 万 5000 の範囲であることに 95 パーセント確信をもっているということ』と、わかりやすく説明しています。

 数字に騙されないようにするためのコツがつかめるようになる良書だと思います。
posted by 作楽 at 22:00| Comment(0) | 和書(データ活用) | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]