什么是期望值、方差和协方差?

2024-04-30 04:39

1. 什么是期望值、方差和协方差?

1.什么是数学期望?数学期望亦称期望、期望值等。在概率论和统计学中,一个离散型随机变量的期望值是试验中每一次可能出现的结果的概率乘以其结果的总和。这是什么意思呢?假如我们来玩一个游戏,一共52张牌,其中有4个A。我们1元钱赌一把,如果你抽中了A,那么我给你10元钱,否则你的1元钱就输给我了。在这个游戏中,抽中的概率是113(452)113(452),结果是赢10元钱;抽不中概率是12131213,结果是亏1元钱。那么你赢的概率,也就是期望值是−213−213。这样,你玩了很多把之后,一算账,发现平均每把会亏−213 −213元。一般在竞赛中,若X是一个离散型的随机变量,可能值为x1,x2x1,x2……,对应概率为p1,p2p1,p2……,概率和为1,那么期望值E(X)=∑ipixiE(X)=∑ipix

对于数学期望,我们还应该明确一些知识点:
(1)期望的“线性”性质。对于所有满足条件的离散型的随机变量X,Y和常量a,b,有:E(aX+bY)=aE(x)+bE(y)E(aX+bY)=aE(x)+bE(y);类似的,我们还有E(XY)=E(X)+E(Y)E(XY)=E(X)+E(Y)。
(2)全概率公式 假设{Bn∣n=1,2,3,...Bn∣n=1,2,3,...}是一个“概率空间有限或可数无限”的分割,且集合BnBn是一个“可数集合”,则对于任意事件A有:P(A)=∑nP(A∣Bn)P(Bn)P(A)=∑nP(A∣Bn)P(Bn)(3)全期望公式 E(Y)=E(E(Y∣X))=∑iP(X=xi)E(Y∣X=xi)

2.方差(variance):方差是衡量在期望μ=E(X)μ=E(X)(均值)附近震荡程度的量可用下式计算Var(X)=E(X−μ)2Var(X)=E(X−μ)2
一个等价的公式是:Var(X)=E(X2)−E2(X)Var(X)=E(X2)−E2(X)
方差的性质:(1) Var(X)≥0Var(X)≥0,Var(c)=0Var(c)=0,指常数没有震荡。(2) Var(cX)=c2Var(X)Var(cX)=c2Var(X) 此公式提供了改善震荡的一个方法那就是将随机变量取值进行伸缩。(3) Var(X+c)=Var(X)Var(X+c)=Var(X),对所有随进变量取值进行平移不改变震荡程度。(4) 独立的随机变量之和的方差等于方差的和(Remark:均值的这个性质不要求随机变量独立)Var(X+Y)=Var(X)+Var(Y)Var(X+Y)=Var(X)+Var(Y)

Proof:Var(X+Y)=E(X2+Y2+2XY)−E2(X)−E2(Y)−2E(X)E(Y)Var(X+Y)=E(X2+Y2+2XY)−E2(X)−E2(Y)−2E(X)E(Y)因为X,YX,Y互相独立E(XY)=E(X)E(Y)E(XY)=E(X)E(Y)代入上式便得Var(X+Y)=Var(X)+Var(Y)Var(X+Y)=Var(X)+Var(Y)从证明过程看独立条件必不可少。由于方差是由期望定义的,所以方差的一切性质可由期望导出,可见期望的概念要比方差重要。

什么是期望值、方差和协方差?

2. 怎样算协方差的值和区间

协方差计算式为COV(X,Y)=E(XY)-E(X)E(Y)。这里的E[X]代表变量X的期。
协方差用于表示变量间的相互关系,变量间的相互关系一般有三种:正相关,负相关和不相关。
正相关:假设有两个变量x和y,若x越大y越大;x越小y越小则x和y为正相关。
负相关:假设有两个变量x和y,若x越大y越小;x越小y越大则x和y为负相关。
不相关:假设有两个变量x和y,若x和y变化无关联则x和y为负相关。

协方差在农业上的应用:
农业科学实验中,经常会出现可以控制的质量因子和不可以控制的数量因子同时影响实验结果的情况,这时就需要采用协方差分析的统计处理方法,将质量因子与数量因子(也称协变量)综合起来加以考虑。
比如,要研究3种肥料对苹果产量的实际效应,而各棵苹果树头年的“基础产量”不一致,但对试验结果又有一定的影响。要消除这一因素带来的影响,就需将各棵苹果树第1年年产量这一因素作为协变量进行协方差分析,才能得到正确的实验结果。
以上内容参考:百度百科-协方差