卡方擬合優(yōu)度檢驗(yàn)
卡方擬合優(yōu)度檢驗(yàn)是更一般的卡方檢驗(yàn)的變體。此測試的設(shè)置是一個(gè)可以包含多個(gè)級別的單個(gè)分類變量。通常在這種情況下,我們將為分類變量考慮一個(gè)理論模型。通過這個(gè)模型,我們預(yù)計(jì)一定比例的人口將進(jìn)入這些水平。擬合優(yōu)度檢驗(yàn)決定了我們理論模型中的預(yù)期比例與現(xiàn)實(shí)的匹配程度。
Null and Alternative hypothesis
擬合優(yōu)度檢驗(yàn)的零假設(shè)和替代假設(shè)看起來與我們其他一些假設(shè)檢驗(yàn)不同。其中一個(gè)原因是卡方擬合優(yōu)度檢驗(yàn)是一種非參數(shù)方法。這意味著我們的測試不涉及單個(gè)總體參數(shù)。因此,零假設(shè)并不表示單個(gè)參數(shù)具有某個(gè)值。
我們從n水平的分類變量開始,令p為i水平的人口比例。我們的理論模型對于每個(gè)比例具有q的值。零假設(shè)和替代假設(shè)的陳述如下:
健康小常識圖片
- H:p=q,p=q。p=q
- H:對于至少一個(gè)i,p不等于q。
實(shí)際和預(yù)期計(jì)數(shù)
卡方統(tǒng)計(jì)量的計(jì)算涉及我們簡單隨機(jī)樣本中數(shù)據(jù)的實(shí)際變量計(jì)數(shù)與這些變量的預(yù)期計(jì)數(shù)之間的比較。實(shí)際計(jì)數(shù)直接來自我們的樣本。計(jì)算預(yù)期計(jì)數(shù)的方式取決于我們使用的特定卡方檢驗(yàn)。
對于擬合優(yōu)度測試,我們有一個(gè)理論模型來說明如何對我們的數(shù)據(jù)進(jìn)行比例化。我們只需將這些比例乘以樣本量n即可獲得預(yù)期計(jì)數(shù)。
計(jì)算測試統(tǒng)計(jì)量
擬合優(yōu)度檢驗(yàn)的卡方統(tǒng)計(jì)量是通過比較我們分類變量每個(gè)級別的實(shí)際計(jì)數(shù)和預(yù)期計(jì)數(shù)來確定的。計(jì)算擬合優(yōu)度檢驗(yàn)的卡方統(tǒng)計(jì)量的步驟如下:
- 對于每個(gè)級別,從預(yù)期計(jì)數(shù)中減去觀察到的計(jì)數(shù)。
- 將這些差異中的每一個(gè)平方。
- 將這些平方差異中的每一個(gè)除以相應(yīng)的預(yù)期值。
- 將前一步的所有數(shù)字加在一起。這是我們的卡方統(tǒng)計(jì)量。
如果我們的理論模型與觀測數(shù)據(jù)完全匹配,那么預(yù)期計(jì)數(shù)將顯示與我們變量的觀測計(jì)數(shù)沒有任何偏差。這意味著我們將具有零的卡方統(tǒng)計(jì)量。在任何其他情況下,卡方統(tǒng)計(jì)量將是一個(gè)正數(shù)。
自由度
自由度的數(shù)量不需要困難的計(jì)算。我們需要做的就是從分類變量的等級數(shù)量中減去一個(gè)。這個(gè)數(shù)字將告訴我們應(yīng)該使用哪種無限卡方分布。
87>88>卡方表和P值我們計(jì)算出的卡方統(tǒng)計(jì)量對應(yīng)于具有適當(dāng)自由度數(shù)的卡方分布上的特定位置。假設(shè)零假設(shè)為真,p值確定獲得此極端檢驗(yàn)統(tǒng)計(jì)量的可能性。我們可以使用卡方分布的值表來確定我們假設(shè)檢驗(yàn)的p值。如果我們有可用的統(tǒng)計(jì)軟件,那么這可以用來獲得更好的p值估計(jì)。
決策規(guī)則
我們根據(jù)預(yù)定的顯著性水平?jīng)Q定是否拒絕零假設(shè)。如果我們的p值是小于或等于此重要級別,則我們拒絕零假設(shè)。否則,我們不能拒絕零假設(shè)。