什么是殘差?
線性回歸是一種統(tǒng)計(jì)工具,用于確定直線擬合一組配對(duì)數(shù)據(jù)的程度。最適合該數(shù)據(jù)的直線稱為最小二乘回歸線。該線可以多種方式使用。其中一個(gè)用途是估計(jì)解釋變量給定值的響應(yīng)變量的值。與這個(gè)想法有關(guān)的是剩余的。
通過(guò)執(zhí)行減法獲得殘差。我們必須做的就是從特定x的y的觀測(cè)值中減去y的預(yù)測(cè)值。結(jié)果稱為殘差。
16殘差公式17 18
殘差公式很簡(jiǎn)單:
剩余觀測(cè)值24 y 25-預(yù)測(cè)值26 y 27
重要的是要注意,預(yù)測(cè)值來(lái)自我們的回歸線。觀察值來(lái)自我們的數(shù)據(jù)集。
示例
我們將通過(guò)使用一個(gè)例子來(lái)說(shuō)明這個(gè)公式的使用。假設(shè)我們得到了以下一組配對(duì)數(shù)據(jù):
(1,2),(2,3),(3,7),(3,6),(4,9),(5,9)
通過(guò)使用軟件,我們可以看到最小二乘回歸線是y=2x。我們將使用它來(lái)預(yù)測(cè)x的每個(gè)值的值。
例如,當(dāng)x=5時(shí),我們看到2(5)=10。這給了我們沿著回歸線的點(diǎn),x坐標(biāo)為5。
為了計(jì)算x=5點(diǎn)處的殘差,我們從觀測(cè)值中減去預(yù)測(cè)值。由于我們數(shù)據(jù)點(diǎn)的y坐標(biāo)為9,因此殘差為9–10=-1。
在下表中,我們將看到如何計(jì)算此數(shù)據(jù)集的所有殘差:
X | 92>觀察y94>Predicted y 95>剩余 | ||
1 | 2 | 2 | 0 |
2 | 112 3 1134 | -1 | |
3 | 7 | 6 | 1 |
3 | 6 | 6 | 136 0 137|
4 | 9 | 8 | 1 |
5 | 9 | 10 | -1 |
殘差特征
現(xiàn)在我們已經(jīng)看到了一個(gè)示例,需要注意殘差的一些特征:
- 殘差對(duì)于落在回歸線以上的點(diǎn)是正的。
- 對(duì)于落在回歸線以下的點(diǎn),殘差是負(fù)的。
- 對(duì)于完全沿著回歸線落下的點(diǎn),殘差為零。
- 殘差的**值越大,點(diǎn)越遠(yuǎn)離回歸行。
- 所有殘差的總和應(yīng)為零。實(shí)際上,這個(gè)總和有時(shí)并不完全為零。造成這種差異的原因是折衷錯(cuò)誤可能會(huì)累積。
殘差的使用
殘差有幾種用途。一個(gè)用途是幫助我們確定我們是否有一個(gè)具有整體線性趨勢(shì)的數(shù)據(jù)集,或者我們是否應(yīng)該考慮不同的模型。其原因是殘差有助于放大我們數(shù)據(jù)中的大班健康知識(shí)任何非線性模式。通過(guò)查看散點(diǎn)圖可能難以看到的內(nèi)容可以通過(guò)檢查殘差和相應(yīng)的殘差圖更容易地觀察到。
考慮殘差的另一個(gè)原因是檢查是否滿足線性回歸推斷的條件。在驗(yàn)證線性趨勢(shì)(通過(guò)檢查殘差)之后,我們還檢查殘差的分布。為了能夠執(zhí)行回歸推斷,我們希望關(guān)于回歸線的殘差近似正態(tài)分布。直方圖或stemplot殘差將有助于驗(yàn)證是否滿足此條件。