@FE40536 2019-06-22T08:58:08.000000Z 字数 2052 阅读 1017

吴恩达机器学习006分类问题

octave 算法 机器学习

吴恩达机器学习006分类问题

分类

首先从最简单地分类开始即只有两种情况地分类 $y\in \{0,1\}$ ，0被叫做负类，1被叫做正类。
我们已经学过了线性回归算法，假设在分类问题运用线性回归算法，我们可以设置阈值来进行分类。

但是如果现在再添加一个比较远地样本进去，显然该样本应该是被判为恶性肿瘤，但是拟合曲线这时更新后会对原来0.5阈值地地方产生不准确的预测，所以线性回归算法不太适合用来处理分类问题。

假设陈述

对于分类问题，我们希望分类器输出的值在[0,1]之间，于是我们将假设函数设置成新的形式(Sigmoid function/Logistic function).

$h_\theta(x)={1 \over 1+e^{-\theta^Tx} }$
函数图像大致如下

对于假设函数地输出，可以用如下方程解释

$P(y=0|x;\theta)=1-P(y=1|x;\theta)$

决策界限

从图中我们可以看出，只要θ^Tx>0，那么y就被判断为1，反之小于0，那么y就被判断为0.

假定了θ参数后， $-3+x_1+x_2\ge0$ 就是 $\theta^Tx\ge0$ 此时 $x_1+x_2\ge3$ 可以拟合出一条直线将坐标系分成两部分，这条线就叫做决策边界。

通过改变训练集的形式我们可以得到更加复杂的决策边界。

代价函数

对于一个逻辑回归问题，我们应该如何选择参数，接下来将讨论这个问题。

假设我们任然用线性回归的代价函数来解决分类问题，那将会得到一个非凸函数，从而导致梯度下降不能落在全局最小值。

所以我们重新定义了一个新的适用于逻辑回归的代价函数

$Cost(h_\theta(x),y)=\begin{cases} -log(h_\theta(x))&if&y=1 \\-log(1-h_\theta(x))&if&y=0 \end{cases}$

假设假设函数输出值为1，那么对于y=1的情况来说，代价函数值就是0，我们不需要做任何事来使这个事情成立，因为它已经不需要代价了；但是要是假设函数的输出无限接近于0，这时代价函数的值就趋近于无穷大，我们将要用无穷大的代价来让这个事件成立，举例说就是当假设函数输出为1时就是对病人说肿瘤是恶性的，而且这是板上钉钉的事情了，对于输出为0时，你还对病人说你的肿瘤是恶性的，但实际上你需要花无穷大的代价才能让这件事情成真
。

对于y=0的情况就不详细描述了，道理是一样的。

简化代价函数与梯度下降

对于如下两个函数，我们可以作简化处理：

$J(\theta)={1 \over m}\sum^m_{i=1}Cost(h_\theta(x^{(i)},y^{(i)}))$

$Cost(h_\theta(x),y)=\begin{cases} -log(h_\theta(x))&if&y=1 \\-log(1-h_\theta(x))&if&y=0 \end{cases}$

对于

$Cost(h_\theta(x),y)=\begin{cases} -log(h_\theta(x))&if&y=1 \\-log(1-h_\theta(x))&if&y=0 \end{cases}$

可以写成如下形式：

$Cost(h_\theta(x),y)=-ylog(h_\theta(x))-(1-y)log(1-h_\theta(x))$

将Cost函数带入J函数

$J(\theta)=-{1 \over m}[\sum^m_{i=1}y^{(i)}logh_\theta(x^{(i)})+(1-y^{(i)})log(1-h_\theta(x^{(i)}))]$

为了得到代价函数的最小值 $\min_\theta J(\theta)$
同样的进行梯度下降：

$\theta_j:=\theta_j-\alpha\sum^m_{i=1}(h_\theta(x^{(i)})-y^{(i)})x_j^{(i)}$
这里形式虽然和线性回归的梯度下降一样，但是h_θ代表的是

$h_\theta(x)={1 \over 1+e^{-\theta^Tx}}$

高级优化

一些高级优化算法

共轭梯度法
BFGS
L-BFGS

% 代价函数 
function [jVal,gradient]=costFunction(theta)
    jVal=(theta(1)-5)^2+(theta(2)-5)^2;
    gradient=zeros(2,1);
    gradient(1)=2*(theta(1)-5);
    gradient(2)=2*(theta(2)-5);
>> options = optimset('GradObj','on','MaxIter','100');
>> initialTheta=zeros(2,1);
>> [optTheta, functionVal, exitFlag]=fminunc(@costFuntion,initialTheta,options)

多元分类：一对多

对于多类别分类问题，可以将数据集分成两两一组，用训练集多次训练

吴恩达机器学习006分类问题

分类

假设陈述

决策界限

代价函数

简化代价函数与梯度下降

高级优化

多元分类：一对多

内容目录