什么是分類變量的雙向表?

統(tǒng)計的目標之一是以有意義的方式排列數(shù)據。雙向表是組織特定類型配對數(shù)據的重要方式。與統(tǒng)計中任何圖表或表格的構建一樣,了解非常重要我們正在處理的變量類型。如果我們有定量數(shù)據,則應使用直方圖或莖葉圖等圖形。如果我們有分類數(shù)據,那么條形圖或餅圖是合適的。

使用配對數(shù)據時,我們必須小心。配對定量數(shù)據存在散點圖,但配對分類數(shù)據有什么樣的圖?每當我們有兩個分類變量時,我們應該使用一個雙向表。

雙向表的描述

首先,我們回想起分類數(shù)據與特征或類別有關。它不是定量的,也沒有數(shù)值。

雙向表涉及列出兩個分類變量的所有值或級別。其中一個變量的所有值都列在垂直列中。其他變量的值沿水平行列出。如果第一個變量具有m值而第二個變量具有n值,則表中總共有mn個條目。這些條目中的每一個對應于兩個變量中的每一個的特定值。

沿著每一行和每一列,條目是總計的。這些總數(shù)在確定邊際分布和條件分布時很重要。當我們進行卡方檢驗獨立性時,這些總數(shù)也很重要。

雙向表的示例

例如,我們將考慮一種情況,在這種情況下,我們將查看大學統(tǒng)計課程的幾個部分。我們想要構建一個雙向表格來確定課程中男性和女性之間存在哪些差異(如果有的話)。到為此,我們計算每個性別成員獲得的每個字母等級的數(shù)量。

教育資源網_1

我們注意到,第一個分類變量是性別變量,在男性和女性的研究中有兩個可能的值。第二個分類變量是字母等級的變量,A,B,C,D和F給出了五個值。這意味著我們將有一個雙向表,其中有2 x 5=10個條目,加上一個額外的行和一個額外的列,將需要列出行和列總數(shù)。

我們的調查顯示:

  • 50名男性獲得A,60名女性獲得A.
  • 60名男性獲得B,80名女性獲得B.
  • 100名男性獲得C,50名女性獲得C.
  • 40名男性獲得D,50名女性獲得D.
  • 30名男性獲得F,20名女性獲得F.

此信息輸入下面的雙向表格。每行的總數(shù)告訴我們每種等級的收入是多少。列總數(shù)告訴我們男性人數(shù)和女性人數(shù)。

雙向表的重要性

當我們有兩個分類變量時,雙向表有助于組織我們的數(shù)據。該表可用于幫助我們比較數(shù)據中的兩個不同組。例如,我們可以考慮統(tǒng)計課程中男性的相對表現(xiàn)與課程中女性的表現(xiàn)。

下一步

在形成雙向表格后,下一步可能是統(tǒng)計分析數(shù)據。我們可能會問研究中的變量是否相互獨立。為了回答這個問題,我們可以使用卡方檢驗在雙向表格上。

年級和性別雙向表

114 A 115120 110 121134 C 135140 150 141144 D 145150 90 151154 F 155
Male總計
5060
B6080140
10050
4050
302050
總計280260540

科普小知識大全