2020年09月03日

「難しいことはわかりませんが、統計学について教えてください!」

20200903「統計学について教えてください!」.png

小島 寛之 著
SBクリエイティブ 出版

数字に騙されないための 10 の視点 統計的な?」を読んだのをきっかけに、統計でどんなことができるか、工夫次第でうまく伝えられるようになれるかも……と思うようになり、統計関係の本を少しずつ読んでいて、これもその 1 冊です。

 本書では、ストーリー仕立てで統計の手法が扱われているのですが、『標準化』の例は参考にしたいと思いました。某大学のミスキャンパス候補 (ファイナリスト) の体型データをもとに、ミスキャンパスに選ばれた者がプロポーション面で、どう抜きん出ているのか数値であらわしてみようという試みです。

 以下のサンプルデータを見ると、ファイナリストはみなスタイルがいいように見えます。

20200903「統計学について教えてください!」1.png

 これを標準化すると、次のようになります。

20200903「統計学について教えてください!」2.png

 これらの数値はすべて、ファイナリストの平均にどれくらい近いかをあらわしています。(0 に近いほど平均に近いことをあらわします。) 赤枠の数字が目を惹きます。

 Aは、身長も体重も平均を大きく下回り、このサンプルのなかではとても小柄なのが、一目瞭然です。また、Fは、体重やウエストはほぼ平均なのにバストもヒップも平均を大きく上回り、いわゆる『ボンッキュッボン』なのが、わかります。

 標準化は、身長と体重といった単位の違うものの比較を容易にするメリットがあり、次の式で簡単に計算できます。(サンプル数によっては、それこそ電卓でも充分です。)

 {(データ) − 平均値} ÷ 標準偏差

 標準偏差は、データの偏差 ({(データ) − 平均値}) を二乗してから合計し、データの数で割り、その平方根を求めるとわかります。

 二乗してからルートを取るなどと面倒なことをする理由がわからなくても、標準化するメリットについては、このデータを見るとよくわかるので、巧みな説明だと思いました。
posted by 作楽 at 20:00| Comment(0) | 和書(データ活用) | このブログの読者になる | 更新情報をチェックする