「数字のホント? ウソ!」
帯には「確率と運命を取り違えていませんか?」と書かれている。パラパラとめくってみると、相関関係と因果関係の問題、天気予報での降水確率の話、確率と期待値などを中心として、数にまつわる雑学まで取り扱っているようだ。まあ、このブログで書いている話ともオーバーラップする部分も多いので、話の種として読んでみた。
ベスト新書 97
数字のホント? ウソ! 武器としての<数のセンス>を磨く
加藤 良平 著 bk1、amazon
まあ、既に知っている話も多かったのだが、降水確率の数字の示す意味について書かれているのを読んで、東京地方の過去の天気予報 で降水確率予報の精度検証の方法を思いついたのも事実。
面白かったのは、ある重大な病気に罹っているかどうかを簡易テストで調べる話。この病気の感染率は500分の1と判明している。簡易テストでは、本当に感染している場合には99%の確率で「疑いあり」、1%の確率で「疑いなし」と出る。また感染していない場合には99%の確率で「疑いなし」、1%の確率で「疑いあり」という結果が出る、というのが前提条件である。
この簡易テストを受けた人の結果が「疑いあり」であった場合、この人が本当にこの病気に罹っている確率は何パーセントだろう? 99%? いや、99%よりは少し小さそうな気もする。。 実は、じっくりと考えれば別にどうということのない問題ではある。しかし、実際にありそうなシチュエーションの割には、直感的にどの程度の値となるかがイメージできる人は少なそうな気がする。。 答えは、後日コメント欄に書き込むことにするので、各自考えてみてはいかがだろう?
もう1つは、ある自然数 N について、2のN乗、Nの100乗、Nの階乗を比べて、大きい順に並べるとどうなるだろうか、という問題。この本には
自然数Nが十分に大きい時、前節で述べたように2のN乗というのは、N自体やNの100乗よりもずっと巨大です。そして3のN乗はもっと巨大です。しかしNの階乗はそれらよりもさらに大きくなるのです。(p.103~104)と書かれている。直感的に「え?」と思うのだが、どうだろう? 実際に計算してみるとすぐわかるのだが、「自然数Nが十分に大きい」というのがキーのようだ。
例えばNが10や100だと、Nの100乗が圧倒的に大きく、次にN階乗、一番小さいのが2のN乗となる。ここまでは直感的にもわかる。しかし、Nを徐々に大きくしていくと、Nが126でN階乗がNの100乗を追い越し、それ以降はN階乗が最大となる。そして、Nが1000になると、2のN乗がNの100乗を追い越し、それ以降はNの100乗が最も小さくなる。丁度1000で追い越すというところがなかなか面白い。なるほど、大きな数であればあるほど100回しか掛け合わさないと、小さな数をコツコツと数多く掛け合わせ続けた数に負けちゃうということだ。
他には、順列や組合せだとか、無限についての比較的わかりやすい説明が続き、後半は数字にまつわる雑学的な話がいろいろと出てくるのだが、正直に言うとあまり興味を引かなかったかもしれない。まあ、ウイルスと人間のサイズの比率が、人間と地球のサイズの比率とほぼ同等の10の7乗程度であるとか、ジャンボ機のエンジンが約10万馬力で鉄腕アトムの出力と同じであるとか、いかにも雑学的な話も読めるので、それはそれで楽しめたけど。。
| 固定リンク
コメント
実際計算してみて驚きました。感染していない人の割合が高いから1%の誤判定率でも大きく効いてくるんですね。
投稿: ESD | 2005/10/18 07:03
正解発表です。
今、仮に10万人の集団を想定します。この病気に感染する確率は1/500ですから、この集団の中で感染している人が200人、残りの99800人は感染していないと考えられます。
全員が簡易テストを受けたとき、感染している200人のうち、198人が「疑いあり」、2人が「疑いなし」と診断されます。また、感染していない99800人のうち、998人が「疑いあり」、98802人が「疑いなし」と診断されます。
結果として、「疑いあり」と診断される人は全部で1196人、そのうち本当に感染している人は198人ですから、「疑いあり」と診断された人が感染している確率は、198/1196、すなわち16.6%となります。
逆に、「疑いなし」と診断されたけど、実は感染している確率は 2/98804となり、0.002%となります。
なお、同様にして計算してみると、「疑いあり」と診断された時に本当に感染している確率は、簡易テストの診断精度が 99.9%だと 66.7%、99.99%だと 95.2%にそれぞれ向上します。逆に90%では、わずか1.9%となります。
また、この病気の感染率が1/500よりも小さくなると、この数字はさらに小さくなります。例えば 1/5000の時には、診断精度が 99%だと 1.9%、99.9%だと 16.6%、99.99%だと 66.7にとなります。
このように、非常に稀な病気を診断する場合には、簡易診断の精度が99%程度であれば、陽性と診断されても、本当にその病気である確率は意外と低いということは知っておいてよさそうです。
それでも、この簡易テストによって感染の疑いのある人を相当に絞り込めます。従って、精密検査が非常に手間暇の掛かる高価なものの場合には、対象者にきちんと事情を説明した上で行うのであれば、1次スクリーニングとしてはこの手の簡易テストも意味があるだろうと思います。
いずれにしても、直感的な理解は必ずしも正しくないことがあるので、きちんと計算してみることが重要ということだと思います。
投稿: tf2 | 2005/10/22 19:26