2021年07月20日

「データ分析のためのデータ可視化入門」

20210720「データ分析のためのデータ可視化入門」.jpg

キーラン・ヒーリー (Kieran Healy) 著
瓜生 真也/江口 哲史/三村 喬生 訳
講談社 出版

 データ可視化関連書籍に対する鋭い指摘が載っていました。知覚認知的観点から優れたグラフはどういったものか、改善を必要とする具体例をもとに議論する本もあれば、グラフを作成するコードのレシピを紹介する本もありますが、その両方を兼ね備えた本は、なかなか見当たらないという指摘です。

 良いチャートの条件を語るのに、チャート作成ツールを選ぶ必要がないいっぽう、どのようにチャートを作成するかは、ツールに限った話になるため、良いチャートの議論とチャートの作成手順を分けるのは合理的に見えます。ただ、読者は『わかりやすいチャートを作るプロセス全体』を実現したくて本を頼っているので、前者では、どのように作ればいいのかという問題は解決されず、後者では、どのようなチャートを目指すべきかという問題は解決されません。

 そのため、この本のゴールは『かしこく・わかりやすく・再現可能な方法によるデータ可視化について、その考え方と方法論の両方を紹介すること』となっています。使っているのは、フリーの R とその統合開発環境 (Integrated Development Environment: IDE) RStudio です。

 おもに、tidyverse パッケージ、ggplot() 関数を使ってチャートを作りながら、頭の働かせ方 (principles) と手の動かし方 (practice) の両方を学べるようになっています。使いこなせれば便利だと思ったのは、 ggplot() 関数を使った地図の描画 (第 7 章) です。

 また、この本を機に R の浸透具合を伺い知ることができました。R の各種パッケージをダウンロードできる CRAN (Comprehensive R Archive Network) ミラーサイトは日本にも何か所もあり、日本語ドキュメントも想像以上に充実しています。いつか、地図チャートをとっかかりに R に取り組みたいと思います。
posted by 作楽 at 21:00| Comment(0) | 和書(データ活用) | このブログの読者になる | 更新情報をチェックする