【卡方列联表怎么算】在统计学中,卡方列联表(Chi-square Contingency Table)是一种用于分析两个分类变量之间是否存在关联性的工具。通过构建一个二维的列联表,我们可以利用卡方检验来判断这两个变量是否独立。
一、卡方列联表的基本概念
卡方列联表是将两个或多个分类变量的数据按行和列进行交叉分组后形成的表格。例如,研究性别(男/女)与是否喜欢某项运动(喜欢/不喜欢)之间的关系,就可以形成一个2×2的列联表。
二、卡方检验的步骤
1. 建立列联表:将数据按照两个变量的类别进行分类,并计算每个单元格的频数。
2. 计算期望频数:根据行和列的总频数,计算每个单元格的期望频数。
3. 计算卡方统计量:使用公式 $ \chi^2 = \sum \frac{(O - E)^2}{E} $,其中 O 是观察频数,E 是期望频数。
4. 确定自由度和显著性水平:自由度为 (行数 - 1) × (列数 - 1),并根据显著性水平(如0.05)查卡方分布表。
5. 做出结论:比较卡方值与临界值,决定是否拒绝原假设。
三、卡方列联表计算示例
以下是一个简单的2×2列联表示例:
| 喜欢运动 | 不喜欢运动 | 合计 | |
| 男性 | 30 | 20 | 50 |
| 女性 | 25 | 25 | 50 |
| 合计 | 55 | 45 | 100 |
步骤1:计算期望频数
期望频数公式为:
$$ E_{ij} = \frac{(\text{第i行合计}) \times (\text{第j列合计})}{\text{总样本数}} $$
- 男性喜欢运动的期望频数:$ \frac{50 \times 55}{100} = 27.5 $
- 男性不喜欢运动的期望频数:$ \frac{50 \times 45}{100} = 22.5 $
- 女性喜欢运动的期望频数:$ \frac{50 \times 55}{100} = 27.5 $
- 女性不喜欢运动的期望频数:$ \frac{50 \times 45}{100} = 22.5 $
步骤2:计算卡方值
$$
\chi^2 = \frac{(30 - 27.5)^2}{27.5} + \frac{(20 - 22.5)^2}{22.5} + \frac{(25 - 27.5)^2}{27.5} + \frac{(25 - 22.5)^2}{22.5}
$$
$$
= \frac{6.25}{27.5} + \frac{6.25}{22.5} + \frac{6.25}{27.5} + \frac{6.25}{22.5}
$$
$$
= 0.227 + 0.278 + 0.227 + 0.278 = 1.01
$$
步骤3:判断结果
自由度为 (2-1) × (2-1) = 1,查卡方分布表,当 α=0.05 时,临界值为 3.841。由于计算出的卡方值(1.01)小于临界值,因此不能拒绝原假设,即性别与是否喜欢运动无显著关联。
四、总结
| 步骤 | 内容 |
| 1 | 构建列联表,记录观察频数 |
| 2 | 计算每个单元格的期望频数 |
| 3 | 使用卡方公式计算卡方值 |
| 4 | 确定自由度并查找临界值 |
| 5 | 根据卡方值与临界值判断是否拒绝原假设 |
通过以上步骤,可以系统地完成卡方列联表的计算与分析,从而判断两个分类变量之间是否存在统计上的显著关联。


