2008/06/04

統計学入門書2種

その数学が戦略を決める」に触発されて、統計学の本を2冊ばかし購入。



「完全独習 統計学入門」
小島 寛之
ダイヤモンド社
2006/09/29 (初版第5刷 2008/2/5)
1890円


正規分布の意味するところをちゃんと理解しようと思い、たまたま手に取った本書の著者名を見て、おお、そういえばblogを読んでいるではないか、と気づき、ついで、中身をめくって分かり易そうな工夫がしてあり、役に立ちそうな予感がしたので購入。

統計学に対する基本的な理解を得るに最適な一冊に思える。
標本と母集団の違いを理解することが最終ゴールである(と思った)。
基本的には統計を理解するために必要なツール(いろいろな平均、分散、標準偏差、いろいろな正規分布など)の説明。
おかげで標準偏差の意味(ばらつき具合ですが平均±2標準偏差内に95%含まれるとか)も理解できるし、おまけに偏差値(学力偏差値)の捉え方も誤解が生じないように配慮がなされている(平均±標準偏差はマイナス側にいようが、プラス側にいようが差はないですよ)。偏差値も母集団次第であることも理解できる(学力が高い母集団と低い母集団では、同じ成績を取ったとしても偏差値は変わる、つまり相対的)。
また、標本は標本であるが故に、例えば、標本の平均は母集団の平均とは言えないが推測することが可能、など(いや、考えてみれば当たり前だが)。
あと、株のボラリティリティ(リスク指標)、シャープレシオ、95%予言的中区間(筆者の造語)と95%信頼区間の違い、t分布、検定とか。
ここぞと言うところには「コラム」や「補足」で考え方、問題の捉え方を文字通り補足している。
「文献案内」では、参考にした/なる文献を理由を交えて紹介しているのも親切。もうちょっと勉強してみようかと思わせる。

実運用では「母集団が正規分布に従っている」かどうかを検証する必要があり、そこが難しいところではないか。

統計学へ招待するための試みがちりばめられ、著者と編集者の気合いが感じられる。
知っている人が見過ごしやすい知らない人の間違い易いポイントに気を配ったり、できるだけ飽きさせないような工夫が感じられる。
そして何より、装幀が面白い。使われている色が基本的に「青」一色だけ。フォントやグラフに青を使うにしても濃淡をつけたり、背景に青使用する場合でも目的によって濃淡をつけたり等の工夫で「青」一色とは思えないカラフル(!)な仕上げになっている。
内容については次のステップへ踏み出すと不要になるかも知れないが、この装幀(に対する工夫を想像してみる)だけで手元に置いておきたくなる。



「Statistics Hacks ―統計の基本と世界を測るテクニック
Bruce Frey
鴨澤 眞夫 (監修), 西沢 直木 (翻訳)
オライリー・ジャパン
初版 第一刷 2007/12/26
2520円


「完全独習 統計学入門」を手に取った後、HACKSのフレーズに惹かれて購入。
ハックするというと誤解があるかも。
統計的手法を実運用に適用するにあたっての入門書。サブタイトル通り。
こちらも手元に置いておくことになると思う。
こういうときにはこういう統計的手法を使うとか、間違いやすいポイント、統計学で常識とされているが書籍にはあまり載っていない事柄、アベレージにもいろいろあること(平均値:mean、中央値:median、最頻値:mode)とか。
平均収入や平均貯蓄高といったものが、平均値(正規分布に近い場合に有効)ではなく中央値(分布形がひずんでいる場合に有効)が適切であることが読み取れる。標準偏差が分かるともっとよい。
テストや質問の内容を適切に作るには(信頼性、妥当性の評価)とか、適切だったかどうかを回答から項目分析(難易度指数、識別指数、選択肢分析)を用いて判断するとか。
モンティホール問題にもふれていて(p.152)、よくまとまっていて分かりやすい。
その数学が戦略を決める」にあった乳ガン検診の確率に関する説明だとか(p.146-p.149)。
医学的検査において、検査の敏感度と特異度は二律背反の関係にある。より敏感度の高い検査を実施すると、擬陽性が増える傾向にある。ただ、生死が関係するような深刻なケースでは、こうした結果も許容範囲となる。
「HACK#47すごい偶然の神秘をあばく」では、リンカーン大統領とジョン・F・ケネディ大統領の一致を強調する例を挙げ(p.203)、それに対して「ほぼ無限に存在する」不一致の例をあげることで、
偶然の一致を目にするのは、それを探しているときなのだ
と喝破する(p.205)。
魅力的なタイトルの「HACK#49捏造データを指摘せよ」ではベンフォードの法則を紹介して「虚偽の税務申告を見抜くのに適用してきた」(p.218)などの実例も。

気づいた誤植:p.157の「表5-4」(2箇所)は「表4-4」の間違いだと思う。

原書の雰囲気は読んでないので分からないが、訳文のスタイルがいかにもハッカーが書いてます調で面白い。
本文中に時々出てくる「フランク伯父さん」に関する逸話も、もうご勘弁辟易感が醸し出されていて、本書をそこはかとなくハッカー本的雰囲気とするのに貢献している。訳していて楽しかったのではないだろうか。
しかし、監修(一部訳も)の鴨澤眞夫氏は、日本野人の会CEOって、ナニコレオモシロイ。在沖縄で翻訳か。この人のLife Hacksに興味が湧く。

0 件のコメント:

コメントを投稿

zenback