平均值,中位數(shù)和模式之間的經(jīng)驗(yàn)關(guān)系
在數(shù)據(jù)集中,有各種描述性統(tǒng)計(jì)數(shù)據(jù)。平均值,中位數(shù)和模式都給出了數(shù)據(jù)中心的度量,但是它們以不同的方式計(jì)算:
- 通過(guò)將所有數(shù)據(jù)值加在一起,然后除以值的總數(shù)來(lái)計(jì)算平均值。
- 通過(guò)按升序列出數(shù)據(jù)值,然后在列表中找到中間值來(lái)計(jì)算中位數(shù)。
- 通過(guò)計(jì)算每個(gè)值發(fā)生多少次來(lái)計(jì)算模式。頻率**的值是模式。
從表面上看,這三個(gè)數(shù)字之間似乎沒有聯(lián)系。然而,事實(shí)證明,這些中心指標(biāo)之間存在經(jīng)驗(yàn)關(guān)系。
理論與經(jīng)驗(yàn)
在我們繼續(xù)之前,重要的是要了解我們?cè)谔峒敖?jīng)驗(yàn)關(guān)系時(shí)所說(shuō)的內(nèi)容,并將其與理論研究進(jìn)行對(duì)比。統(tǒng)計(jì)和其他知識(shí)領(lǐng)域的一些結(jié)果可以從理論上的一些先前的陳述中得出。我們從我們所知道的開始,然后使用邏輯,數(shù)學(xué)和演繹推理,看看這在哪里引導(dǎo)我們。結(jié)果是其他已知事實(shí)的直接后果。
與理論相比,是獲取知識(shí)的經(jīng)驗(yàn)方式。我們可以觀察周圍的世界,而不是從已經(jīng)確立的原則推理。從這些觀察中,我們可以對(duì)我們所看到的進(jìn)行解釋。大部分科學(xué)都是以這種方式完成的。實(shí)驗(yàn)給了我們經(jīng)驗(yàn)數(shù)據(jù)。然后目標(biāo)是制定適合所有數(shù)據(jù)的解釋。
經(jīng)驗(yàn)關(guān)系
在統(tǒng)計(jì)中,均值,中位數(shù)和模式之間存在經(jīng)驗(yàn)關(guān)系。無(wú)數(shù)數(shù)據(jù)集的觀察表明,大多數(shù)時(shí)候平均值之間的差異模式是平均值和中位數(shù)之差的三倍。等式中的這種關(guān)系是:
平均模式=3(平均值-中位數(shù))。
示例
要了解上述與現(xiàn)實(shí)世界數(shù)據(jù)的關(guān)系,我們來(lái)看看2010年的美國(guó)州人口。以百萬(wàn)計(jì),人口為:加利福尼亞州-36.4,德克薩斯州-23.5,紐約-19.3,佛羅里達(dá)州-18.1,伊利諾伊州-12.8,賓夕法尼亞州-12.4,俄亥俄州-11.5,密歇根州-10.1,格魯吉亞-9.4,北卡羅來(lái)納州-8.9,新澤西州社區(qū)開展健康知識(shí)講座-8.7,弗吉尼亞州-7.6,馬薩諸塞州-6.4,華盛頓州-6.4,印第安納州-6.3,亞利桑那州-6.2,田納西州-6.0,密蘇里州-5.8,馬里蘭州-5.6,威斯康星州-5.6,明尼蘇達(dá)州-5.2,科羅拉多州-4.8,阿拉巴馬州-4.6,南卡羅來(lái)納州-4.3,路易斯安那州-4.3,肯塔基州-4.2,俄勒岡州-3.7,俄克拉荷馬州-3.6,康涅狄格州-3.5,愛荷華州-3.0,密西西比州-2.9,阿肯色州-2.8,堪薩斯州-2.8,猶他州-2.6,內(nèi)華達(dá)州-2.5,新墨西哥州-2.0,西弗吉尼亞州-1.8,內(nèi)布拉斯加州-1.8,愛達(dá)荷州-1.5,緬因州-1.3,新罕布什爾州-1.3,夏威夷-1.3,羅德島-1.1,蒙大拿州-.9,特拉華州-.9,南達(dá)科他州-.8,阿拉斯加-.7,北達(dá)科他州-.6,佛蒙特州-.6,懷俄明州-.5
平均人口為600萬(wàn)。中位人口為425萬(wàn)。該模式是130萬(wàn)?,F(xiàn)在我們將計(jì)算出與上述差異:
- 平均模式=600萬(wàn)–130萬(wàn)=470萬(wàn)。
- 3(平均中位數(shù))=3(600萬(wàn)–425萬(wàn))=3(175萬(wàn))=525萬(wàn)。
雖然這兩個(gè)差異數(shù)字不完全匹配,但它們彼此相對(duì)接近。
應(yīng)用程序
上述公式有幾個(gè)應(yīng)用程序。假設(shè)我們沒有數(shù)據(jù)值列表,但知道平均值,中位數(shù)或模式中的任何兩個(gè)。上述公式可用于估算第三個(gè)未知數(shù)量。
例如,如果我們知道我們的平均值是10,那么一個(gè)月de of 4,我們的數(shù)據(jù)集的中位數(shù)是多少?由于平均模式=3(平均值-中位數(shù)),我們可以說(shuō)10-4=3(10中位數(shù))。通過(guò)一些代數(shù),我們看到2=(10中位數(shù)),因此我們數(shù)據(jù)的中位數(shù)為8。
上述公式的另一個(gè)應(yīng)用是計(jì)算偏度。由于偏度測(cè)量平均值和模式之間的差異,我們可以計(jì)算3(平均值-模式)。為了使這個(gè)數(shù)量無(wú)量綱,我們可以將其除以標(biāo)準(zhǔn)偏差,給出一種計(jì)算偏度的替代方法,而不是使用統(tǒng)計(jì)中的矩。
注意事項(xiàng)
如上所述,以上不是確切的關(guān)系。相反,這是一個(gè)很好的經(jīng)驗(yàn)法則,類似于范圍規(guī)則,它在標(biāo)準(zhǔn)偏差和范圍之間建立了近似的聯(lián)系。平均值,中位數(shù)和模式可能不完全符合上述經(jīng)驗(yàn)關(guān)系,但很有可能它會(huì)相當(dāng)接近。