什么是抽樣分布
統(tǒng)計(jì)抽樣在統(tǒng)計(jì)中經(jīng)常使用。在這個(gè)過程中,我們的目標(biāo)是確定一些關(guān)于人口的事情。由于種群通常規(guī)模較大,我們通過選擇具有預(yù)定大小的種群子集來形成統(tǒng)計(jì)樣本。通過研究樣本,我們可以使用推論統(tǒng)計(jì)來確定有關(guān)人口的信息。
大小n的統(tǒng)計(jì)樣本涉及從人群中隨機(jī)選擇的n個(gè)人或受試者的單個(gè)組。與統(tǒng)計(jì)樣本的概念密切相關(guān)的是抽樣分布。
采樣分布的起源
當(dāng)我們從給定群體形成多個(gè)相同大小的簡單隨機(jī)樣本時(shí),就會(huì)發(fā)生抽樣分布。這些樣本被認(rèn)為是彼此獨(dú)立的。因此,如果一個(gè)人在一個(gè)樣本中,那么它與下一個(gè)樣本中的可能性相同。
我們?yōu)槊總€(gè)樣本計(jì)算一個(gè)特定的統(tǒng)計(jì)量。這可以是樣本均值,樣本方差或樣本比例。由于統(tǒng)計(jì)量取決于我們擁有的樣本,因此每個(gè)樣本通常會(huì)為感興趣的統(tǒng)計(jì)量產(chǎn)生不同的值。已經(jīng)產(chǎn)生的值的范圍是我們的抽樣分布。
均值的抽樣分布
例如,我們將考慮均值的抽樣分布??傮w的平均值是通常未知的參數(shù)。如果我們選擇大小為100的樣本,則可以通過將所有值加在一起然后除以數(shù)據(jù)點(diǎn)總數(shù)(在這種情況下為100)來輕松計(jì)算此樣本的平均值。一個(gè)大小為100的樣本可以給我們平均值50。另一個(gè)這樣的樣本可能有49的平均值。另外51個(gè)樣本的平均值可能為50.5。
這些樣本均值的分布給了我們一個(gè)抽樣分布ibution。如上所述,我們希望考慮的不僅僅是四種樣本方法。有了更多的樣本意味著我們可以很好地了解樣本分布的形狀英文健康知識(shí)。
為什么我們關(guān)心?
抽樣分布可能看起來相當(dāng)抽象和理論。但是,使用這些會(huì)產(chǎn)生一些非常重要的后果。主要優(yōu)點(diǎn)之一是我們消除了統(tǒng)計(jì)數(shù)據(jù)中存在的可變性。
例如,假設(shè)我們從平均值為μ且標(biāo)準(zhǔn)差為σ的總體開始。標(biāo)準(zhǔn)偏差給我們一個(gè)分布分布的度量。我們將其與通過形成大小n的簡單隨機(jī)樣本獲得的采樣分布進(jìn)行比較。平均值的采樣分布仍將具有μ的平均值,但標(biāo)準(zhǔn)偏差是不同的。采樣分布的標(biāo)準(zhǔn)偏差變?yōu)棣?√n。
因此,我們有以下幾點(diǎn)
- 4的樣本量允許我們具有標(biāo)準(zhǔn)偏差為σ/2的抽樣分布。
- 9的樣本量允許我們具有標(biāo)準(zhǔn)偏差為σ/3的抽樣分布。
- 25的樣本量允許我們具有標(biāo)準(zhǔn)偏差為σ/5的抽樣分布。
- 樣本量為100允許我們具有標(biāo)準(zhǔn)偏差為σ/10的抽樣分布。
在實(shí)踐中
在統(tǒng)計(jì)實(shí)踐中,我們很少形成抽樣分布。取而代之的是,我們將從大小n的簡單隨機(jī)樣本得出的統(tǒng)計(jì)數(shù)據(jù)視為沿著相應(yīng)采樣分布的一個(gè)點(diǎn)。這再次強(qiáng)調(diào)了為什么我們希望擁有相對(duì)較大的樣本量。樣本量越大,我們在統(tǒng)計(jì)數(shù)據(jù)中獲得的變化就越小。
請(qǐng)注意,除了中心和傳播,我們無法就samp的形狀說任何話嶺分布。事實(shí)證明,在一些相當(dāng)廣泛的條件下,中心極限定理可以用來告訴我們關(guān)于抽樣分布形狀的非常驚人的事情。