莎莉‧克拉克(Sally Clark)是英國的事務律師(solicitor),出生於一個普通的英國家庭,父親是資深警官,母親是理髮師。她在1990年嫁給了同樣是法律背景的丈夫Steve Clark,事業和家庭看起來一切都很美好,但不幸的事在不久之後降臨了。

1996年他們的長子誕生,健健康康的男嬰忽然在11個星期大的時候猝死,原本產後憂鬱的莎莉花了很長的時間才從崩潰當中復原。不知是否造化弄人,兩年後莎莉的第二胎在8星期大的時候也忽然猝死。這個時候莎莉不只要面對喪子之痛,緊接著而來的是殺嬰控訴,畢竟兩個小男嬰接連死亡有點離奇。

不過檢察官並沒有具體證據能證明莎莉行兇,而且嬰兒猝死症(SIDS)也可能是此事件的自然因素。為了能夠說服陪審團這不是自然的SIDS,所以他們找來了兒童病理專家羅伊‧梅德爵士(Sir Roy Meadow),向陪審團說明兩個嬰兒接連猝死是多麼不尋常的事情。

梅德爵士的論點是這樣子的,克拉克太太兩位嬰兒都死於SIDS的機率是7千3百萬分之1,因為根據他的研究,英國嬰兒猝死現象發生的比例是8543分之1,所以兩件一起發生的話機率應該只有
    1/(8543 × 8543) = 1/73,000,000
全英國每年有700,000新生兒,所以克拉克家兩位嬰兒都猝死應該是百年難得一見。

看起來陪審團的數學程度可能不太好,儘管缺乏其他具體證據,他們還是接受了梅德的機率算法,認為這種事情自然發生的可能性甚低。於是莎莉‧克拉克最後在1999年被判有罪,處無期徒刑。她在2000年入獄,由於出身警察家庭再加上殺嬰,使她在監獄裡成為大家「特別關注」的對象,更糟的是她的無期徒刑幾乎不可能假釋。

等等,真的應該如此嗎?此案在英國也算是鬧得有點大,不少數學家和統計學家得知判決結果後不禁跳腳。

為什麼呢?因為羅伊‧梅德爵士雖然在兒童病理學方面有兩把刷子,可是他在機率上犯了基本而且嚴重的錯誤。2001年英國皇家統計學會發表聲明說此案是「對於統計的誤用」,1/73,000,000這個數字完全沒道理。

第一個錯誤是很顯而易見的,那就是只有獨立事件的機率才能直接相乘。嬰兒猝死很明顯不是獨立事件,比方說,兩個嬰兒有可能具有共同基因缺陷、暴露在相同環境汙染等等,機率的乘法原理在這裡完全不管用。關於這點,Salford University的數學教授 Ray Hill 在2004年發文指出,以英國的統計資料來看,第一胎猝死將會大幅增加第二胎猝死的可能性,兩者之間有著5~10之間的dependency factor。

第二個錯誤則不那麼明顯,不過卻是常常在法庭辯論上出現,所有甚至有檢察官謬誤(Prosecutor's fallacy)這個名稱。簡單的說,在這個案件裡要討論的機率應該是「每一個嬰兒死於SIDS的可能性」有多小,而是「如果有位嬰兒死去,他的死因是SIDS的可能性」有多小。兩者描述的事情並不相同,用下面這個例子說明比較容易明白。

假如我在夜裡聽到狗吠,想知道狗是不是因陌生人來訪才吠叫,而非迷途的蝙蝠、愛挑釁的野貓或亂飛的昆蟲所引起,那麼下列哪一個統計資料最有用呢?
    a. 過去一百個夜晚,多少夜有陌生人到訪
    b. 過去一百次陌生人到訪當中,多少次狗吠叫
    c. 過去一百次狗吠叫當中,有幾次是陌生人到訪

答案很明顯是c。其中a只能告訴我們陌生人夜裡到訪的可能性,但對於我們感興趣的「狗是不是因陌生人吠叫」,a卻沒辦法透露更多資訊。關於b,假如你養了一隻很神經質的狗,那麼過去一百次陌生人靠近牠的吠叫率可能是100%,但是這也表示狗很容易對任何風吹草動狂吠不已,於是聽到狗叫聲代表陌生人的機率恐怕低很多。

回到克拉克太太的案子上,如果經過仔細對比,我們會發現梅德爵士提供的資訊屬於上述的a,而不是法庭所應該感興趣的c。如果要求取「如果有位嬰兒死了,他的死因是SIDS的可能性」,還得經過一些換算,我們可以這樣表示機率
    S = 一個嬰兒猝死症的事件
    D = 一個嬰兒死亡的事件
    P(S) = 一個嬰兒死於猝死症的機率
    P(D) = 一個嬰兒的死亡率
    P(S|D) = 給定一個死嬰事件,死因是嬰兒猝死症的可能性

注意!法庭上應該要關注的是P(S|D)而不是P(S)。利用貝氏定理,可以寫成
    P(S|D) = P(D|S)P(S) / P(D)
我們知道P(D|S)一定等於1(因為猝死的嬰兒一定死了...),所以P(S|D) = P(S) / P(D),其中P(D)是一個很小的數值,所以P(S|D)應該比P(S)大很多。

更進一步來說,法庭上真正要衡量的是,兩個死去的嬰兒死於自然原因的機率是否遠遠小於謀殺,如果梅德的數據能夠說明這點就成功了,當然他辦不到。根據數學家Hill教授的計算,兩嬰都死於嬰兒猝死症的機率,比起兩嬰都被謀殺的機率還要大上4.5~9倍之多。

還有第三個對案件判決影響比較小、但數學上一樣嚴重的錯誤。事實上男嬰猝死症的可能性比女嬰還要高出一截,由於克拉克家兩個嬰兒都「已知」是男孩,所以猝死發生率不應該套用不考慮性別的1/8543。

雖然以上都沒辦法證明莎莉‧克拉克肯定無罪,但是至少也說明了她離罪證確鑿還很遠,在現代法律無罪推論原則下根本不應該讓她入獄。很無奈的是莎莉最後入獄了,數學家和統計學家的說法並沒辦法救她,直到後來新的病理學報告出爐才讓她獲得平反,這已經是她入獄三年後了。很遺憾的是克拉克太太出獄之後精神狀態一直沒有恢復,人生的最後階段都在酗酒當中度過,在2007年被發現猝死在自家中,經過驗屍確定為酒精中毒,沒有自殺或他殺的跡象。

而機率概念不太好的小兒科權威也倒楣了,由於檢察總長下令重新調查類似案件,發現羅伊‧梅德在多起同類案件中擔任專家證人,並且讓多名婦女在沒有其他具體證據的情況下因為機率入罪。於是梅德因為「重大專業過失」被取消行醫資格。


1) 有關Sally Clark案的報導
http://en.wikipedia.org/wiki/Sally_Clark
http://www.telegraph.co.uk/news/obituaries/1545933/Sally-Clark.html
http://news.bbc.co.uk/2/hi/uk_news/england/essex/7082411.stm

2) Sudden infant death syndrome(SIDS)的介紹
http://en.wikipedia.org/wiki/Sudden_infant_death_syndrome

3) 數學.....
http://en.wikipedia.org/wiki/Bayes%27_theorem
http://en.wikipedia.org/wiki/Prosecutor%27s_fallacy
http://www.cse.salford.ac.uk/profiles/profile.php?profile=R.Hill  (最下方的cot death部分)

novus 發表在 痞客邦 PIXNET 留言(4) 人氣()


留言列表 (4)

發表留言
  • 小豪
  • 看完後滿難過的!

    看到一半,本來以為拿個國家賠償之類的就結束了,沒想到Sally Clark竟因精神狀態無法恢復死於酒精中毒!

    數學不好的人很多,以前常以為數學不好,
    頂多就是一些數學謎題解不出來也就算了。
    可是這個例子就不是那麼簡單了。

    我自己不是學機率,說實話對機率上乘法使用時的意義不是很敏感,要不是有上面的說明,一時之間我可能也看不出有什麼問題!

    數學常被其它領域的學者視為「工具」,有時做為研究用的工具(直接用數學結果,很多學工程的人學過工程數學自以為懂複變、高微,我敢說多數學工程的人都不懂!)或用來解釋事件的工具(例如這篇文章所說)。
    問題是在不清楚理論基礎的情況下,可能不小心誤用了!這個故事中數學誤用的結果太嚴重了!

    對於非數學專業的學者,我想還是應該對自己所需要用到的數學有深刻的瞭解,以免誤用!
  • 1.我對機率的乘法原理比較敏感,是因為以前在網路上常和亂引用數據的人辯論。不過對於檢察官謬誤的感覺就差很多

    2.我們大概算是比較善良的一群。現實當中有太多不務正業的學者,整天拿著自己也一知半解的知識去告訴別人要如何如何

    3.新聞記者也應該多學學機率,不要再亂用數據了

    novus 於 2009/11/03 09:39 回覆

  • 翅膀尿不小豎琴
  • 學到東西了,推用心~
  • 也謝謝你花時間看這麼冗長的文字....

    我以為只有數學家小豪才會感興趣

    novus 於 2009/11/03 09:26 回覆

  • gk
  • 「每一個嬰兒死於SIDS的可能性」
    「如果有位嬰兒死去,他的死因是SIDS的可能性」
    不花腦筋直接看過去的話
    還真的會以為兩者是指同樣的機率呢(慚愧)

  • 其實第一次讀到這個案例的時候,我只有想到非獨立事件不能連乘,還有SIDS可能有所謂的高危險群,但我也沒想到會有這種似是而非的機率。

    這類的謬誤很常見
    我打算再寫一篇專門討論Prosecutor's fallacy

    novus 於 2009/11/03 23:20 回覆

  • 呆呆
  • 不懂數學的法官跟恐龍法官一樣可怕嗎......

    學法律的人邏輯應該都不弱啊,還是被專家的言語迷惑了呢?