[关闭]
@helen- 2019-04-29T07:31:32.000000Z 字数 394 阅读 651

机器学习5 线性回归

研究生学习 机器学习 监督学习


统计量

集中趋势的衡量
1.均值(mean)
2.中位数(median)
3.众数(mode)

离散程度的衡量
1. 方差
2. 标准差 (方差的开方)


回归问题 : Y变量为连续数值型(continuous numerical) 房价 人数 降雨量
分类问题 : Y变量为类别型(categorical) 颜色类别 电脑品牌 有无信誉

简单线性回归:一个自变量(x)和一个因变量(y),关系用一条直线来模拟.
多远回归分析:**(multiple regression) 两个以上的自变量

回归模型: 描述y和x以及偏差error之间的关系的方程
y=β0+β1x+Σ (Σ 偏差,β 参数)

估计线性方程: y=b0+b1x

拟合一条直线
因变量y 满足min Σ(yi-y^i)²
即: 使得sum of squares 最小

x_ x的均值
y_ y的均值

b1=Σ(xi-x_)(yi-y_)/Σ(xi-x_)² b0=y_ - b1x_

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注