必威体育Betway必威体育官网
当前位置:首页 > IT技术

sklearn.linear_model.LinearRegression

时间:2019-10-01 05:13:22来源:IT技术作者:seo实验室小编阅读:67次「手机版」
 

linearregression

最小二乘法线性回归:sklearn.linear_model.Linearregression(fit_intercept=True, normalize=False,copy_X=True, n_jobs=1)

主要参数说明:

fit_intercept:布尔型,默认为True,若参数值为True时,代表训练模型需要加一个截距项;若参数为False时,代表模型无需加截距项。

normalize:布尔型,默认为False,若fit_intercept参数设置False时,normalize参数无需设置;若normalize设置为True时,则输入的样本数据将(X-X均值)/||X||;若设置normalize=False时,在训练模型前, 可以使用sklearn.preprocessing.Standardscaler进行标准化处理。

属性:

coef_:回归系数(斜率)

intercept_:截距项

主要方法:

①fit(X, y, sample_weight=None)

②predict(X)

③score(X, y, sample_weight=None),其结果等于1-(((y_true - y_pred) **2).sum() / ((y_true - y_true.mean()) ** 2).sum())

利用sklearn自带的糖尿病数据集,建立最简单的一元回归模型

In [1]: import numpy as np
   ...: from sklearn import datasets , linear_model
   ...: from sklearn.metrics import mean_squared_ERROR , r2_score
   ...: from sklearn.model_selection import train_test_split
   ...: #加载糖尿病数据集
   ...: diabetes = datasets.load_diabetes()
   ...: X = diabetes.data[:,np.newaxis ,2] #diabetes.data[:,2].reshape(diabetes
   ...: .data[:,2].size,1)
   ...: y = diabetes.target
   ...: X_train , X_test , y_train ,y_test = train_test_split(X,y,test_size=0.2
   ...: ,random_state=42)
   ...: LR = linear_model.LinearRegression()
   ...: LR.fit(X_train,y_train)
   ...: print('intercept_:%.3f' % LR.intercept_)
   ...: print('coef_:%.3f' % LR.coef_)
   ...: print('Mean squared error: %.3f' % mean_squared_error(y_test,LR.predict
   ...: (X_test)))##((y_test-LR.predict(X_test))**2).mean()
   ...: print('Variance score: %.3f' % r2_score(y_test,LR.predict(X_test)))#1-(
   ...: (y_test-LR.predict(X_test))**2).sum()/((y_test - y_test.mean())**2).sum
   ...: ()
   ...: print('score: %.3f' % LR.score(X_test,y_test))
   ...: plt.scatter(X_test , y_test ,color ='green')
   ...: plt.plot(X_test ,LR.predict(X_test) ,color='red',linewidth =3)
   ...: plt.show()
   ...:
intercept_:152.003
coef_:998.578
Mean squared error: 4061.826
Variance score: 0.233
score: 0.233
效果如下:

相关阅读

sklearn中predict_proba用法(注意和predict的区别)

predict_proba返回的是一个 n 行 k 列的数组, 第 i 行 第 j 列上的数值是模型预测 第 i 个预测样本为某个标签的概率,并且每一行的

sklearn中Logistics Regression的coef_和intercept_的

使用sklearn库可以很方便的实现各种基本的机器学习算法,例如今天说的逻辑斯谛回归(Logistic Regression),我在实现完之后,可能陷入代码

LinearRegression

线性回归 f(x) = wx + b 这个函数的导数就是3, 斜率 代表增长率 import numpy as np import matplotlib.pyplot as plt x

分享到:

栏目导航

推荐阅读

热门阅读