相关系数r
1 皮尔逊相关系数(Pearson Correlation Coefficient)
皮尔逊相关系数广泛用于度量两个变量之间的相关程度,其值介于-1与1之间。
两个变量之间的皮尔逊相关系数定义为两个变量之间的协方差和标准差的商:
上式定义了总体相关系数,常用希腊小写字母 作为代表符号。估算样本的协方差和标准差,可得到皮尔逊相关系数,常用英文小写字母 代表:
2 决定系数:R平方值
决定系数(coefficient of determination),有的教材上翻译为判定系数,也称为拟合优度。是相关系数的平方。表示可根据自变量的变异来解释因变量的变异部分。
如某学生在某智力量表上所得的 IQ 分与其学业成绩的相关系数 r=0.66,则决定系数 R^2=0.4356,即该生学业成绩约有 44%可由该智力量表所测的智力部分来说明或决定。
R平方值为0.8,则表示回归关系可以解释80%的变异。
2.1 简单线性回归:
相关系数的平方
2.2 多元线性回归:
表达式:R2=SSR/SST=1-SSE/SST
其中:SST=SSR+SSE,SST (total sum of squares)为总平方和,SSR (regression sum of squares)为回归平方和,SSE (ERROR sum of squares) 为残差平方和。
3 R平方也有局限性
当我们人为的向系统中添加过多的自变量,SSE会减少,从而R^2变大。因此我们采用校正R方,惩罚了过多无意义的自变量,R平方的修正方法:
n是样本总数,p是预测个数。
相关阅读
一、线性回归的决定系数(也称为判定系数,拟合优度) 相关系数是R哈~~~就是决定系数的开方! 正如题所说决定系数是来衡量回归的好坏,换
在做机器学习的过程中经常会有矩阵的相关运算,这里就比较典型的协方差和矩阵的相关系数做个自我的理解记录。 1.协方差 如果两个
假定表型值由均值+育种值+残差 yi=μ+ai+ϵi y_i = \mu + a_i + \epsilon_iyi=μ+ai+ϵi表型值 VS 育种值 他们之间的相