貝葉斯定理的定義和例子

貝葉斯定理是用于概率和統(tǒng)計(jì)的數(shù)學(xué)方程式,用于計(jì)算條件概率。換句話說(shuō),它用于基于事件與另一個(gè)事件的關(guān)聯(lián)來(lái)計(jì)算事件的概率。該定理也稱為貝葉斯定律或貝葉斯定律。

歷史

貝葉斯定理以英國(guó)大臣兼統(tǒng)計(jì)學(xué)家托馬斯·貝葉斯牧師的名字命名,貝葉斯定理為其工作“解決機(jī)會(huì)論中的問(wèn)題的論文”制定了一個(gè)等式。在貝葉斯死后,該書稿由理查德·普賴斯(Richard Price)在1763年出版之前進(jìn)行了編輯和更正。將定理稱為貝葉斯-普賴斯定律會(huì)更準(zhǔn)確,因?yàn)槠绽锼沟呢暙I(xiàn)很重要。該方程的現(xiàn)代公式是由法國(guó)數(shù)學(xué)家Pierre-Simon Laplace在1774年設(shè)計(jì)的,他當(dāng)時(shí)并不知道貝葉斯的工作。拉普拉斯被認(rèn)為是負(fù)責(zé)貝葉斯概率發(fā)展的數(shù)學(xué)家。

 

貝葉斯定理的公式

有幾種不同的方法可以為貝葉斯定理編寫公式。最常見(jiàn)的形式是:

P(A ∣ B)= P(B ∣ A)P(A)/ P(B)

其中A和B是兩個(gè)事件,P(B)≠0

P(A ∣ B)是在事件B成立的情況下事件A發(fā)生的條件概率。

P(B∣A)是假設(shè)A為真的事件B發(fā)生的條件概率。

P(A)和P(B)是A和B彼此獨(dú)立出現(xiàn)的概率(邊際概率)。

 

例子

如果您患有花粉癥,您可能希望找到一個(gè)人患類風(fēng)濕性關(guān)節(jié)炎的可能性。在此示例中,“發(fā)生花粉癥”是對(duì)類風(fēng)濕關(guān)節(jié)炎(事件)的測(cè)試。

  • 一個(gè)是事件“患者患有類風(fēng)濕性關(guān)節(jié)炎。” 數(shù)據(jù)表明,診所中10%的患者患有這種類型的關(guān)節(jié)炎。P(A)= 0.10
  • B是測(cè)試“患者有花粉癥”。數(shù)據(jù)表明,診所中有5%的人患有花粉癥。P(B)= 0.05
  • 診所的記錄還顯示,類風(fēng)濕關(guān)節(jié)炎患者中有7%患有花粉癥。換句話說(shuō),考慮到患有類風(fēng)濕性關(guān)節(jié)炎,患者發(fā)生花粉癥的可能性為7%。B∣A = 0.07

將這些值插入定理:

P(A ∣ B)=(0.07 * 0.10)/(0.05)= 0.14

因此,如果患者患有花粉癥,則其患類風(fēng)濕性關(guān)節(jié)炎的機(jī)會(huì)為14%。花粉癥的隨機(jī)患者不太可能患有類風(fēng)濕關(guān)節(jié)炎。

 

敏感性和特異性

貝葉斯定理很好地證明了醫(yī)學(xué)檢驗(yàn)中假陽(yáng)性和假陰性的影響。

  • 靈敏度是真實(shí)的陽(yáng)性率。它是正確識(shí)別的陽(yáng)性比例的一種度量。例如,在妊娠試驗(yàn)中,妊娠試驗(yàn)陽(yáng)性的婦女所占的百分比。敏感的測(cè)試很少會(huì)遺漏“陽(yáng)性”。
  • 特異性是真實(shí)的陰性率。它測(cè)量正確識(shí)別的負(fù)片的比例。例如,在妊娠試驗(yàn)中,妊娠試驗(yàn)陰性的女性中未懷孕的百分比。特定的測(cè)試很少會(huì)出現(xiàn)誤報(bào)。

完美的測(cè)試將是100%敏感和特定的。實(shí)際上,測(cè)試的最小錯(cuò)誤稱為貝葉斯錯(cuò)誤率。

例如,考慮一種靈敏度為99%且特異性為99%的藥物測(cè)試。如果有一半(0.5%)的人使用毒品,那么一個(gè)隨機(jī)檢測(cè)結(jié)果為陽(yáng)性的人實(shí)際上是使用者的概率是多少?

P(A ∣ B)= P(B ∣ A)P(A)/ P(B)

也許改寫為:

P(用戶∣ +)= P(+用戶)P(用戶)/ P(+)

P(用戶+)= P(+用戶)P(用戶)/ [P(+用戶)P(用戶)+ P(+非用戶)P(非用戶)

P(用戶∣ +)=(0.99 * 0.005)/(0.99 * 0.005 + 0.01 * 0.995)

P(用戶∣ +)≈33.2%

只有約33%的時(shí)間隨機(jī)測(cè)試陽(yáng)性的人實(shí)際上是吸毒者。結(jié)論是,即使一個(gè)人對(duì)藥物測(cè)試呈陽(yáng)性反應(yīng),它更可能他們根本使用藥物比他們做的。換句話說(shuō),假陽(yáng)性的數(shù)量大于真陽(yáng)性的數(shù)量。

在現(xiàn)實(shí)世界中,通常要在敏感性和特異性之間做出權(quán)衡,這取決于不要遺漏陽(yáng)性結(jié)果是否更重要,還是將陰性結(jié)果標(biāo)記為陽(yáng)性是否更好。