數(shù)學(xué)小知識(shí)大全:置換測試的例子
在統(tǒng)計(jì)中提出一個(gè)始終重要的問題是:“觀察到的結(jié)果是僅由于偶然性,還是具有統(tǒng)計(jì)意義?“一類假設(shè)檢驗(yàn),稱為置換檢驗(yàn),使我們能夠檢驗(yàn)這個(gè)問題。這種測試的概述和步驟是:
- 我們將研究對象分為對照組和實(shí)驗(yàn)組。零假設(shè)是這兩組之間沒有差異。對實(shí)驗(yàn)組進(jìn)行治療??紤]實(shí)驗(yàn)組和觀察組的每一種可能的配置響應(yīng)。
- 根據(jù)我們觀察到的相對于所有潛在實(shí)驗(yàn)組的響應(yīng),計(jì)算p值。
這是一個(gè)排列的輪廓。對于這個(gè)輪廓的肉,我們將花費(fèi)時(shí)間詳細(xì)地研究這種排列測試的一個(gè)制定好的例子。
示例
假設(shè)我們正在研究小鼠。特別是,我們對小鼠完成他們以前從未遇到過的迷宮的速度感興趣。我們希望提供有利于實(shí)驗(yàn)性治療的證據(jù)。目標(biāo)是證明治療組中的小鼠將比未經(jīng)處理的小鼠更快地解決迷宮。
我們從我們的受試者開始:六只小鼠。為方便起見,小鼠將通過字母A,B,C,D,E,F(xiàn)來指代。這些小鼠中的三只將被隨機(jī)選擇用于實(shí)驗(yàn)治療,另外三只被放入對照組,其中受試者接受安慰劑。
接下來,我們將隨機(jī)選擇選擇鼠標(biāo)運(yùn)行迷宮的順序。將記錄所有小鼠完成迷宮所花費(fèi)的時(shí)間,并計(jì)算每組的平均值。
假設(shè)我們的隨機(jī)選擇在實(shí)驗(yàn)組中具有小鼠A,C和E,其他小鼠在安慰劑對照組中。治療后已經(jīng)實(shí)施,我們隨機(jī)選擇鼠標(biāo)穿過迷宮的順序。
每只小鼠的運(yùn)行時(shí)間是:
- 鼠標(biāo)A在10秒內(nèi)跑比賽
- 鼠標(biāo)B在12秒內(nèi)跑比賽
- 鼠標(biāo)C在9秒內(nèi)跑比賽
- 鼠標(biāo)D在11秒內(nèi)跑比賽
- 鼠標(biāo)E在11秒內(nèi)跑比賽
- 鼠標(biāo)F在13秒內(nèi)跑比賽。
實(shí)驗(yàn)組小鼠完成迷宮的平均時(shí)間為10秒。對照組完成迷宮的平均時(shí)間為12秒。
我們可以問幾個(gè)問題。治療真的是平均時(shí)間更快的原因嗎?還是我們在選擇對照組和實(shí)驗(yàn)組時(shí)幸運(yùn)?治療可能沒有效果,我們隨機(jī)選擇較慢的小鼠接受安慰劑,較快的小鼠接受治療。置換測試將有助于回答這些問題。
假設(shè)73,74我們置換測試的假設(shè)是:
- 零假設(shè)是無效的陳述。對于此特定測試,我們有H:治療組之間沒有差異。所有未經(jīng)治療的小鼠運(yùn)行迷宮的平均時(shí)間與所有接受治療的小鼠的平均時(shí)間相同。
- 另一種假設(shè)是我們試圖建立有利于證據(jù)。在這種情況下,我們將得到H:所有接受治療的小鼠的平均時(shí)間將快于未接受治療的所有小鼠的平均時(shí)間。
Permutations
有六只小鼠,實(shí)驗(yàn)組有三個(gè)地方。這意味著可能的實(shí)驗(yàn)組的數(shù)量由組合C(6,3)=6的數(shù)量給出!/(3!3?。?20。其余的人將是對照組的一部分。所以有20種不同的方法可以隨機(jī)選擇個(gè)體ls分為兩組。
將A,C和E分配給實(shí)驗(yàn)組是隨機(jī)完成的。由于有20個(gè)這樣的配置,實(shí)驗(yàn)組中具有A,C和E的特定配置具有1/20=5%發(fā)生的概率。
我們需要確定我們研究中個(gè)體實(shí)驗(yàn)組的所有20種配置。
- 實(shí)驗(yàn)組:A B C和對照組:D E F
- 實(shí)驗(yàn)組:A B D和對照組:C E F
- 實(shí)驗(yàn)組:A B E和對照組:C D F
- 實(shí)驗(yàn)組:A B F和對照組:C D E
- 實(shí)驗(yàn)組:A C D和對照組:B E F
- 實(shí)驗(yàn)組:A C E和對照組:B D F
- 實(shí)驗(yàn)組:A C F和對照組:B D E數(shù)學(xué)小知識(shí)大全
- 實(shí)驗(yàn)組:A D E和對照組:B C F
- 實(shí)驗(yàn)組:A D F和對照組:B C E
- 實(shí)驗(yàn)組:A E F和對照組:B C D
- 實(shí)驗(yàn)組:B C D和對照組:A E F
- 實(shí)驗(yàn)組:B C E和對照組:A D F
- 實(shí)驗(yàn)組:B C F和對照組:A D E
- 實(shí)驗(yàn)組:B D E和對照組:A C F
- 實(shí)驗(yàn)組:B D F和對照組:A C E
- 實(shí)驗(yàn)組:B E F和對照組:A C D
- 實(shí)驗(yàn)組:C D E和對照組:A B F
- 實(shí)驗(yàn)組:C D F和對照組:A B E
- 實(shí)驗(yàn)組:C E F和對照組:A B D
- 實(shí)驗(yàn)組:D E F和對照組:A B C
然后,我們查看實(shí)驗(yàn)組和對照組的每個(gè)配置。我們計(jì)算上面列表中20個(gè)排列中的每一個(gè)的平均值幼兒科普。例如,對于第一個(gè),A,B和C分別具有10,12和9的時(shí)間。這三個(gè)數(shù)字的平均值是10.3333。同樣在第一個(gè)排列中,D,E和F分別具有11,11和13的時(shí)間這平均為11.6666。
在計(jì)算每組的平均值之后,我們計(jì)算這些平均值之間的差異。以下各項(xiàng)對應(yīng)于上面列出的實(shí)驗(yàn)組和對照組之間的差異。
- 安慰劑-治療=1.333333秒
- 安慰劑-治療=0秒
- 安慰劑-治療=0秒
- 安慰劑-治療=-1.333333秒
- 安慰劑-治療=2秒
- 安慰劑-治療=2秒
- 安慰劑-治療=0.6666667秒
- 安慰劑-治療=0.66666667秒
- 安慰劑-治療=-0.6666667秒
- 安慰劑-治療=-0.66666667秒
- 安慰劑-治療=0.6666667秒
- 安慰劑-治療=0.6666667秒
- 安慰劑-治療=-0.6666667秒
- 安慰劑-治療=-0.6666667秒
- 安慰劑-治療=-2秒
- 安慰劑-治療=-2秒
- 安慰劑-治療=1.333333秒
- 安慰劑-治療=0秒
- 安慰劑-治療=0秒
- 安慰劑-治療=-1.333333秒
P-Value
現(xiàn)在我們對上面提到的每個(gè)組的平均值之間的差異進(jìn)行排序。我們還列出了由均值的每個(gè)差異表示的20種不同配置的百分比。例如,20個(gè)中的4個(gè)在對照組和治療組之間沒有差異。這占上述20種配置中的20%。
- -2為10%
- -1.33為10%
- -0.667為20%
- 0為20%
- 0.667為20%
- 1.33為10%
- 2為10%。
在這里,我們將此列表與我們的觀察結(jié)果進(jìn)行比較。我們隨機(jī)選擇用于治療組和對照組的小鼠導(dǎo)致平均dif參考2秒。我們還看到這種差異對應(yīng)于所有可能樣本的10%。結(jié)果是,對于本研究,我們的p值為10%。