ティム・ハーフォード「数学をやりませんか」

統計的証拠を扱うときの見当違いな自信が、実務上含意することは明らかであり、心配である

二つ一組の短いテストがある。一つ目は、医師になったと思って、”A”というある特定の癌のスクリーニング検査を患者に薦めるかどうかを考えるのだ。あなたはこの形のスクリーニングが、5年生存率を68%から99%に改善することを発見した(5年生存率は癌が発見されてから患者が5年後に生きている割合)。問題:スクリーニング検査”A”は命を救うのか?

二つ目。今度はあなたは別のスクリーニング検査”B”を考えている。あなたは検査”B”が癌による死を1,000人に2人から1,000人に1.6人に減らすことを発見した。問題:スクリーニング検査”B”は命を救うのか?

二つめの問題の方が簡単だ。スクリーニング検査”B”は疑う余地なく命を救う。正確を期せば、1,000人に0.4人の命を救う。それは多くように思えるかもしれない――そしてもし、その検査が高価だったり、不快な副作用があるならば割に合わないかもしれない――でもそれががんのスクリーニングの本質だ。ほとんどの人は検査対象のがんを患っていないので、ほとんどの人はその検査によって救われ得ないのだ。

スクリーニング検査”A”はどうだろうか?こっちの問題はもっと難しい。数字は素晴らしいように見える。しかし、生存率はスクリーニングプログラムを評価するのには危うい方法なのだ。70歳で死に至る治癒不能のがんを患っている60歳のグループを思い浮かべてみよう。彼らは67歳まではなんの症状もない、そして67歳で診断を受けた時の5年生存率は、残念ながらゼロだ。スクリーニングプログラムを導入しよう、そうすればあなたはずっと容易にがんを発見することができる、62歳で。5年生存率は今や100%だ。だが、スクリーニングは一人の命も救っていない:それは治療不可能な病気の早期の警告を与えてくれるにすぎない。

一般的に、スクリーニングプログラムは生存率によって評価した場合に素晴らしいように見える。なぜなら、スクリーニングの目的はがんをより早期に発見することだからだ。命が救われるか否かは全く別の問題なのだ。

これはずるい質問の組み合わせだって認めなくちゃならない。あなたが医師になっていたなら、この手のことを正しく理解するために、治療のための根拠をどう扱うかを徹底的に訓練してたはずだ。しかし、悪いニュースがある:医師はこの手のことを正しく理解してないんだ。

3月に内科学会の紀要において発表された論文で、関連する臨床経験のある400人以上の医師の集団にこれらの質問が与えられた。82%が、検査”A”が命を救う証拠を提示されたと――そうじゃないのに――考えた。それらの83%がベネフィットは大きいまたはとても大きいと考えた。60%のみが、検査”B”は命を救うと考え、3分の1以下がベネフィットは大きいまたはとても大きいと考えた――それは興味深いことだ、なぜならがんで死ぬコース上にいる人はわずかであることから、その検査は彼らの20%を救うのだ。要するに、医師はがんスクリーニングの統計の数字をまったく理解していない。

これが実務上含意することは明らかであり、心配である。医師は触れることになりそうな証拠を、臨床効果に基づいて解釈する多くの助けを必要としてるようであり、他方、伝染病学者と統計学者は彼らの発見をどのように発表するかを懸命に考える必要があるように思われる。

状況はもっと悪いかもしれない。王立統計学会の“getstats”キャンペーンにおける最近の調査で、国会議員にコインを2回投げた時に表が2回出る可能性を尋ねた。半数以上が正しい答えを出せなかった――不面目な労働党国会議員の4分の3を含めて。

答えはもちろん25%であり、恐ろしいほど基本的なことだ。数学の基礎学力(numeracy)の問題を読み書きの能力(literacy)の問題に言い換えるとすれば、医師の間違いはエリオットの「荒地」についての良質なエッセイを書く力がないことに相当する一方、国会議員の間違いは新聞を読む力がないことにより近い。

王立統計学会は約4分の3の国会議員が数字を扱うのに自信があると言っていると報告していた。この自信は見当違いだ。

Tim Harford Why aren’t we doing the maths?