@helen-
2019-04-29T07:31:32.000000Z
字数 394
阅读 651
研究生学习
机器学习
监督学习
集中趋势的衡量
1.均值(mean)
2.中位数(median)
3.众数(mode)
离散程度的衡量
1. 方差
2. 标准差 (方差的开方)
回归问题 : Y变量为连续数值型(continuous numerical) 房价 人数 降雨量
分类问题 : Y变量为类别型(categorical) 颜色类别 电脑品牌 有无信誉
简单线性回归:一个自变量(x)和一个因变量(y),关系用一条直线来模拟.
多远回归分析:**(multiple regression) 两个以上的自变量
回归模型: 描述y和x以及偏差error之间的关系的方程
y=β0+β1x+Σ (Σ 偏差,β 参数)
估计线性方程: y=b0+b1x
拟合一条直线
因变量y 满足min Σ(yi-y^i)²
即: 使得sum of squares 最小
x_ x的均值
y_ y的均值