设 (X,Y) 为二维随机变量, 数学期望 E(X),E(Y) 存在, E((X−EX)(Y−EY)) 称为 X 与 Y 的协方差, 记为 Cov(X,Y).
Cov(X,Y)=E(XY)−E(X)E(Y)
若 X 和 Y 独立, 则 Cov(X,Y)=0.
定理 若随机变量 X,Y 的方差存在, 则 D(X+Y)=DX+DY+2Cov(X,Y).
- X 的数学期望 EX 存在, a 为常数, 则 Cov(X,a)=0.
- X,Y 的期望 EX,EY 都存在, 则 Cov(X,Y)=Cov(Y,X).
- X 的期望和方差都存在, 则 Cov(X,X)=D(X).
- X,Y 的期望 EX,EY 都存在, a,b 为常数, 则 Cov(aX,bY)=abCov(X,Y).
- X1,X2,Y 的期望均存在, 则 Cov(X1+X2,Y)=Cov(X1,Y)Cov(X2,Y).
设 X,Y 的期望方差都存在, DX>0,DY>0, 则 [Cov(X,Y)]2≤DXDY.
相关系数
消除度量单位对协方差的影响, 将 X,Y 标准化之后再求协方差, 称为相关系数.
X∗=D(C)X−E(X)
Y∗=D(Y)Y−E(Y)
ρXY=Cov(X∗,Y∗)=D(X)D(Y)Cov(X,Y)
定义 若 ρXY=0, 则称 X,Y 不相关, 若 ρXY>0, 则 X,Y 正相关, 若 ρXY<0, 则 X,Y 负相关. 若 ρXY=1, 则 X,Y 完全正相关, 若 ρXY=−1, 则 X,Y 完全负相关.
指向原始笔记的链接