Find More Calculator☟

历史背景

相关系数,也称为皮尔逊相关系数 (r),由卡尔·皮尔逊在20世纪初提出。这个统计量有助于确定两个变量之间线性关系的强度和方向。此后,它已成为统计学、经济学、心理学和自然科学等领域探索数据集之间关系的基石。

计算公式

皮尔逊相关系数 (r) 的计算公式为:

\[

r = \frac{n(\sum XY) - (\sum X)(\sum Y)}{\sqrt{[n\sum X^2 - (\sum X)^2][n\sum Y^2 - (\sum Y)^2]}}

\]

其中:

\(n\) 为数据点的个数

\(X\) 和 \(Y\) 为两组数据中的各个数据点

示例计算

给定值:

X: 1, 2, 3, 4

Y: 4, 5, 6, 7

步骤 1:计算总和和乘积:

\(\sum X = 1 + 2 + 3 + 4 = 10\)

\(\sum Y = 4 + 5 + 6 + 7 = 22\)

\(\sum XY = (1 \times 4) + (2 \times 5) + (3 \times 6) + (4 \times 7) = 60\)

\(\sum X^2 = 1^2 + 2^2 + 3^2 + 4^2 = 30\)

\(\sum Y^2 = 4^2 + 5^2 + 6^2 + 7^2 = 126\)

步骤 2:将这些值代入公式:

\[

r = \frac{4 \times 60 - 10 \times 22}{\sqrt{[4 \times 30 - 10^2] [4 \times 126 - 22^2]}}

\]

\[

r = \frac{240 - 220}{\sqrt{(120 - 100)(504 - 484)}} = \frac{20}{\sqrt{20 \times 20}} = \frac{20}{20} = 1

\]

相关系数 \(r\) 为 1,表明存在完全正线性关系。

重要性和应用场景

相关系数在统计分析中对于理解两个变量之间的关系至关重要。它有助于各种场景,例如:

预测经济趋势(例如,利率与通货膨胀之间的关系)

评估营销活动的效果(例如,销售额与广告支出)

研究自然现象(例如,温度与植物生长)

常见问题

相关系数表示什么?

相关系数表示两个变量之间线性关系的强度和方向。值范围从 -1(完全负相关)到 +1(完全正相关)。值为 0 表示没有相关性。

相关性是否意味着因果关系?

否,相关性并不意味着因果关系。它只衡量关联的强度,而不是一个变量是否导致另一个变量。

如果相关系数为零会怎样?

相关系数为零表明变量之间不存在线性关系。但是,仍然可能存在非线性关系。

皮尔逊相关系数的局限性是什么?

皮尔逊相关系数仅测量线性关系,并且可能对异常值敏感。对于非线性关系,其他相关性度量,如斯皮尔曼等级相关系数,可能更合适。