[关闭]
@songying 2019-03-23T21:35:58.000000Z 字数 1354 阅读 1085

机器学习: 逻辑回归

machine-learning

logistic回归简介

logistic回归用于解决的是分类问题,其基本思想是:根据现有数据对分类边界线建立回归公式,以此进行分类。也就是说,logistic回归不是对所有数据点进行拟合,而是要对数据之间的分界线进行拟合。

sigmoid 函数

我们前面在线性回归中已经提到线性回归是为了解决回归问题,那么现在这个logistic 回归怎么会用来解决分类问题呢?这就要归功于sigmoid函数了。

那么logistic是怎么和sigmoid函数连接起来的呢? 很简单,我们只需要将各个特征 × 回归系数,然后将所有值相加,并将这个总和代入sigmoid函数中,进而得到一个范围在0-1之间的数值。任何大于0.5的数据被分入1类,小于0.5分入0类,这样我们就实现了二分类。类似这样:

Logistic 回归的数学表达

这里直接给出数学公式:


其中有:

如何求解最优的

首先,我们依旧是要找到一个合适的损失函数,在Logistic回归中的损失函数为:


接下来我解释一下为什么选择这个损失函数,我们试着将其拆开来,它其实是这样的:

这样,对于任意一个误分类点,就会造成一个很高的损失(这一点可以试着将图像画出来)。更巧妙的是,我们在最终的损失函数前面分别乘了一个 , 这样当 时,第二项就没了,当 的时候,第一项就没了,这样其实就是我们前面两个 求和。

我们最终给它加一个正则化项:


最后,我们要求最优参数的话,依旧是使用梯度下降算法来获取 的最小值时对应的参数。

logistic 回归中的正则化

正则化在 logistic 回归中极为重要,如果没有正则化,逻辑回归的渐近性会不断促使损失在高维度空间内达到 0。因此,大多数逻辑回归模型会使用以下两个策略之一来降低模型复杂性:

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注