Python学习笔记-3群18组-杜杜狼-2017.8.14

Lesson 17 多重线性回归 (Multiple Linear Regression)

研究一个因变量与多个自变量间线性关系的方法
多元线性回归模型的一般形式为

y = β01x12x2+…+βnxn+e
y:因变量
xn:自变量
β0:常数项
βn:偏回归系数(regression coefficient)
e: 随机误差

多重线性回归分析步骤与简单线性回归一致

#Step1: 绘制多个变量两两之间散点图
scatter_matrix(
    data[["店铺的面积", "距离最近的车站", "月营业额"]], 
    figsize=(10, 10), diagonal='kde'
)

#计算相关系数,确定用线性回归
data[["店铺的面积", "距离最近的车站", "月营业额"]].corr()

x = data[["店铺的面积", "距离最近的车站"]]
y = data[["月营业额"]]

from sklearn.linear_model import LinearRegression
#建模(估计模型参数,建立回归模型,利用最小二乘法)
lrModel = LinearRegression()
#训练模型
lrModel.fit(x, y)
#评分(调整判定系数)
lrModel.score(x, y)
#预测
lrModel.predict([10, 110])

lrModel.predict([[10, 110],[20, 110]])

#查看参数
lrModel.coef_

API
矩阵数据绘制散点图

pandas.tools.plotting.scatter_matrix(matrix, figsize, diagonal)
#matrix: 矩阵
#figsize: 图形大小
#diagonal: 对角线填充,kde为直方图,一般绘制出来是正态分布

Lesson 18 一元非线性回归(Univariate Nonlinear Regression)

在回归分析中,只包括一个自变量和一个因变量,且二者关系可用一条曲线近似表示,则称为一元非线性回归分析

y = anxn + an-1xn-1 + ... + a1x1 + a0x0

求解过程

#通过scatter_matrix绘制两两自变量和因变量组合的散点图
from pandas.tools.plotting import scatter_matrix;

scatter_matrix(
    data[["等级", "资源"]], 
    alpha=0.8, figsize=(10, 10), diagonal='kde'
)

#观察发现与一元二次方程的图形走势一致,绘画出一元二次方程散点图
import numpy;
x_ = numpy.arange(-10, 10, 0.01);
y_ = x_**2

from matplotlib import pyplot as plt;

plt.figure();
plt.title('等级与资源')
plt.xlabel('等级')
plt.ylabel('资源')
plt.grid(True)
plt.plot(x_, y_, 'k.')
plt.show()

#引入线性回归
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import PolynomialFeatures

x

#一元二次方程自变量转成二元一次方程自变量
pf = PolynomialFeatures(degree=2)
x_2_fit = pf.fit_transform(x)

x_2_fit

#按照一元线性回归求解
lrModel = LinearRegression()
lrModel.fit(x_2_fit, y)

lrModel.score(x_2_fit, y)

#Attention: predict时,也需要将一元N次数据转成多元一次数据
x_2_predict = pf.fit_transform([[21], [22], [23]])
lrModel.predict(x_2_predict)

重点API:一元N次方程,转多元线性方程:

pf = sklearn.preprocessing.PolynomialFeatures(degree=2)
# degree: 回归方程的次数

#转化方法
x_2_fit = pf.fit_transform(x)
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,456评论 5 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,370评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,337评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,583评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,596评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,572评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,936评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,595评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,850评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,601评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,685评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,371评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,951评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,934评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,167评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,636评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,411评论 2 342

推荐阅读更多精彩内容