WFU

2020年9月25日 星期五

二項式分佈與卜瓦松分佈

 

作者:許承越


   photo credit to: unsplash


除了常態分佈以外,兩種常用到的機率分佈方式二項式分佈與卜瓦松分佈,在計算不同的試驗與評估數據上也有很大的幫助,更重要的是現在都有隨手可得的方便計算工具讓我們可以很快得到答案。


二項式分佈 (Binomial Distribution) 


二項式分佈的使用時機包含:
  • 一個大試驗由n個同樣的小試驗組成,而每個小試驗只有兩種結果 (+/-),例如:生存/死亡、成功/失敗、得病/沒病等等。
  • 每個小試驗彼此互相獨立,也就是結果不會互相影響。
  • 每次小試驗中,測試方法所得到的結果,機率是一樣的。
二項式分佈的公式又可以寫成
P(X=x)等於n次試驗中成功x次的機率、n=試驗次數、x=成功次數、p=每次成功的機率、q=每次失敗的機率(因為每次只有成功p和失敗q兩種結果,所以p+q=1,q=1-p)。

(大家有想起高中數學課嗎)

真的要使用的時候,一樣可以使用美國愛荷華州立大學的免費線上計算器。

假設一個城市中,高血壓的人口有25%,那麼隨機從這個城市中抽選20個人,請問其中有6個人有高血壓的機率是多少?

將游標移到6的那欄上,可以得出機率大概是16.8%。很方便吧。

帶一提,二項式分佈在n很大而且p很小的時候,得到的機率會很接近卜瓦松分佈,所以可以用一種方式計算出的機率去預估另外一種方式會得到的機率。但大家可以記得這個結論就好,證明推導我就先跳過。


卜瓦松分佈 (Poisson Distribution)

卜瓦松分佈可以用來評估很罕見的事情,使用時機包括:
  • 發生機率非常小的事情,實際上發生的機率到底有多少。
    • 事件在一段時間內的發生機率非常低。
    • 每段相同時間內的發生機率相同。
  • 當沒有分母可以比較時。
  • 已知事件發生的速率與時間間隔。
  • 需要得知一段時間內事情發生的機率,或是一個特定空間中的物體分佈。
銀河系中行星的分佈、一個城市中因為某極罕見疾病的每年死亡人數等等。卜瓦松分佈的公式如下:


也就是說,假設平均這個工廠平均每年會有1個員工出現汞中毒的現象,那麼半年內出現2個汞中毒員工的機率是多少?
這種簡單的數字還可以勉強用手算,但是如果太複雜的數字的話呢?






將數字帶入結果後得到P大概=7.5%。

這樣子的計算方式,在針對一些罕見疾病的發生機率,以及特殊職業傷害疾病/公安問題的評估有很大的幫助。

其他流行病學與生物統計學筆記:請按這裡