什么是方差分析?
很多時(shí)候,當(dāng)我們研究一個(gè)群體時(shí),我們真的在比較兩個(gè)群體。根據(jù)我們感興趣的這個(gè)小組的參數(shù)和我們處理的條件,有幾種技術(shù)可用。涉及兩個(gè)種群比較的統(tǒng)計(jì)推斷程序通常不能應(yīng)用于三個(gè)或更多種群。為了一次研究?jī)蓚€(gè)以上的人群,我們需要不同類型的統(tǒng)計(jì)工具。方差分析或ANOVA是一種來(lái)自統(tǒng)計(jì)干擾的技術(shù),它允許我們處理幾個(gè)種群。
均值比較
為了了解出現(xiàn)什么問(wèn)題以及為什么我們需要方差分析,我們將考慮一個(gè)例子。假設(shè)我們?cè)噲D確定綠色,紅色,藍(lán)色和橙色M&M糖果的平均重量是否彼此不同。我們將分別說(shuō)明每個(gè)群體的平均權(quán)重,μ,μ,μ和。我們可以多次使用適當(dāng)?shù)募僭O(shè)檢驗(yàn),并檢驗(yàn)C(4,2)或六個(gè)不同的零假設(shè):
- H:μ=μ檢查紅色念珠菌種群的平均重量是否不同于藍(lán)色念珠菌種群的平均重量。
- H:μ=μ檢查藍(lán)色念珠菌種群的平均重量是否不同于綠色念珠菌種群的平均重量。
- H:μ=μ檢查平均值綠色糖果種群的重量不同于橙色糖果種群的平均重量。
- H:μ=μ檢查橙色糖果種群的平均重量是否不同于紅色糖果種群的平均重量。
- H:μ=μ檢查紅色糖果不同于綠色糖果種群的平均重量。
- H:μ=μ檢查藍(lán)色糖果種群的平均重量是否不同于人口的平均重量橙色糖果。
這種分析存在許多問(wèn)題。我們將有六個(gè)p-值。即使我們可以以95%的置信水平進(jìn)行測(cè)試,但我們對(duì)整個(gè)過(guò)程的信心也小于此,因?yàn)楦怕食艘裕?95 x.95 x.95 x.95 x.95大約是.74,或74%的信心水平。因此,I型錯(cuò)誤的可能性增加了。
在更基本的層面上,我們無(wú)法通過(guò)一次比較兩個(gè)參數(shù)來(lái)比較這四個(gè)參數(shù)。紅色和藍(lán)色M&Ms的平均值可能很重要,紅色的平均重量相對(duì)大于藍(lán)色的平均重量。但是,當(dāng)我們考慮所有四種糖果的平均重量時(shí),可能沒(méi)有顯著差異。
方差分析
為了處理我們需要進(jìn)行多重比較的情況,我們使用ANOVA。該測(cè)試允許我們一次考慮幾個(gè)群體的參數(shù),而無(wú)需通過(guò)一次對(duì)兩個(gè)參數(shù)進(jìn)行假設(shè)檢驗(yàn)來(lái)解決我們面臨的一些問(wèn)題。
為了用上面的M&M實(shí)施例進(jìn)行ANOVA,我們將測(cè)試零假設(shè)H:μ=μ=μ=μ。這表明紅色,藍(lán)色和綠色M&Ms的平均權(quán)重之間沒(méi)有差異。另一種假設(shè)是紅色,藍(lán)色,綠色和橙色M&Ms的平均權(quán)重之間存在一些差異。這個(gè)假設(shè)實(shí)際上是幾個(gè)陳述的組合H:
- 紅色念珠菌群體的平均重量不等于藍(lán)色念珠菌群體的平均重量,或
- 藍(lán)色念珠菌群體的平均重量不等于綠色念珠菌群體的平均重量,或
- 綠色糖果種群的平均重量不等于橙色糖果種群的平均重量,或
- 綠色糖果種群的平均重量不等于紅色念珠菌群體的平均重量,或
- 藍(lán)色念珠菌群體的平均重量不等于橙色念珠菌群體的平均重量,或
- 藍(lán)色念珠菌群體的平均重量不等于紅色念珠菌群體的平均重量。
在這個(gè)特定的例子中,為了獲得我們的p值,我們將利用稱為F分布的概率分布。涉及ANOVA F檢驗(yàn)的計(jì)算可以手工完成,但通常用統(tǒng)計(jì)軟件計(jì)算。
廣州科普
多重比較
將ANOVA與其他統(tǒng)計(jì)技術(shù)分開(kāi)的是它用于進(jìn)行多重比較。這在整個(gè)統(tǒng)計(jì)數(shù)據(jù)中都很常見(jiàn),因?yàn)橛泻芏鄷r(shí)候我們想比較兩組以上。通常,總體測(cè)試表明我們正在研究的參數(shù)之間存在某種差異。然后,我們通過(guò)其他一些分析來(lái)確定哪個(gè)參數(shù)不同。