了解統(tǒng)計中的四分位間距

四分位間距(IQR)是第一個四分位數(shù)和第三個四分位數(shù)之間的差異。這個公式是:

IQR=Q-Q

對一組數(shù)據(jù)的可變性有許多測量。范圍和標(biāo)準(zhǔn)差都告訴我們?nèi)绾畏稚⑽覀兊臄?shù)據(jù)。這些描述性統(tǒng)計數(shù)據(jù)的問題在于它們對異常值非常敏感。四分位間距是對異常值存在更具抵抗力的數(shù)據(jù)集擴(kuò)展的度量。

教育資源網(wǎng)_1

四分位間距的定義

如上所述,四分位間距建立在其他統(tǒng)計數(shù)據(jù)的計算基礎(chǔ)上。在確定四分位間距之前,我們首先需要知道第一個四分位數(shù)和第三個四分位數(shù)的值。(當(dāng)然,第一和第三四分位數(shù)取決于中位數(shù)的值)。

一旦我們確定了第一和第三四分位數(shù)的值,四分位數(shù)范圍很容易計算。我們要做的就是從第三四分位數(shù)中減去第一個四分位數(shù)。這解釋了這個統(tǒng)計量使用術(shù)語四分位間距。

示例

為了看到計算四分位間距的例子,我們將考慮一組數(shù)據(jù):2,3,3,4,5,6,6,7,8,8,9。這組數(shù)據(jù)的五個數(shù)字摘要是:

  • 最小值2
  • 第一個四分位數(shù)3.5
  • 中位數(shù)6
  • 第三個四分位數(shù)8
  • **值9

因此,我們看到四分位間距為8–3.5=4.5。

The Significance of The Interquartile Range

該范圍使我們能夠衡量整個數(shù)據(jù)集的分布情況。四分位數(shù)范圍告訴我們第一和第三四分位數(shù)相距多遠(yuǎn),表明我們的數(shù)據(jù)集的中間50養(yǎng)生小常識大全%是如何分布的。

抵抗異常值

使用四分位間距而不是測量數(shù)據(jù)集擴(kuò)展范圍的主要優(yōu)點是四分位間距對異常值不敏感。為了看到這一點,我們將看看一個例子。

從上面的數(shù)據(jù)集中,我們的四分位間距為3.5,范圍為9-2=7,標(biāo)準(zhǔn)差為2.34。如果我們用100的極端異常值替換**值9,則標(biāo)準(zhǔn)偏差變?yōu)?7.37,范圍為98。即使我們的這些值發(fā)生了相當(dāng)劇烈的變化,第一和第三四分位數(shù)也不受影響,因此四分位數(shù)范圍不會改變。

使用四分位間距

除了作為對數(shù)據(jù)集傳播的不太敏感的度量之外,四分位間距還有另一個重要用途。由于其對異常值的抵抗力,四分位間距可用于識別值何時為異常值。

四分位間距規(guī)則是通知我們是否有輕微或強(qiáng)烈的異常值。為了尋找異常值,我們必須看到第一個四分位數(shù)以下或第三個四分位數(shù)以上。我們應(yīng)該走多遠(yuǎn)取決于四分位間距的值。