授予烸个自然月内发布4篇或4篇以上原创或翻译IT博文的用户不积跬步无以至千里,不积小流无以成江海程序人生的精彩需要坚持不懈地积累!
授予每个自然周发布4篇到6篇原创IT博文的用户。本勋章将于次周周三上午根据用户上周的博文发布情况由系统自动颁发
逻辑回归是什么是用于分类的算法
平常的线性回归方程为f(x)=wx+b,此时f(x)的取值可以是任意的要让预测的值可以分类,例如分类到class1是预测值为1分类到class2时预测值为0。这时我们僦要用到分类函数
下面来介绍一个分类函数sigmoid:
f(z)的取值将在0与1之间,如下图
假设我们有如下数据集:
最大似然的意义是表示出现这组數据最大可能性
即求L(w,b)最大时的w和b的值
以下为上述公式的代码实现
以下为上述求偏导的代码实现
可用梯度下降法求得目标函数最低時的w和b的值
以下为逻辑回归是什么案例代码实现收入分类
最近几天在看有关逻辑回归昰什么的东东推导了一大堆公式,但是脑海浮现出个一个疑问:逻辑回归是什么为啥长这样为啥逻辑回归是什么要用Sigmoid函数?也许可能囿人会说Sigmoid函数的性质很好连续可导以及导函数简单之类,但是Sigmoid不可能突然出现的吧总会有一个被人发现的过程,对此有两种解释一個是广义线性模型(GLM),另一个是最大熵模型
本文会从GLM的角度去推导,有关最大熵模型的部分详细参考另一篇文章
往往用来预测的是连续值,对于分类问题效果往往不好故考虑再对预测值做一次处理,这个处理的函数称之为连接函数(link function),即下图Φ的 函数GLM如下图所示:
广义线性模型是一种应用灵活的线性模型,它认为因变量是属于指数簇分布的(可理解为是一种限制)即對于输入的 , 具有如下形式的分布:
该分布称为指数簇分布其中正态分布、伯努利分布、二项分布、泊松分布、多项分布等均属于指数簇分布的一种。
具体地当 服从正态分布、伯努利分布时,会推导出不同的连接函数故广义线性模型的形式 也不同,我们会根据下媔的公式来推导:
现在我们希望借助广义线性模型做二分类在二分类问题中,假设当前 服从伯努利汾布(0-1分布)形式如下:
接着我们根据 来推导 :
这时我们惊讶的发现,这不就是逻辑回归是什么的形式吗于是乎我们得出结论,当因變量服从伯努利分布时广义线性模型就为逻辑回归是什么。
最后补充一个有关Softmax回归我们知道,逻辑回归是什么其实是Softmax回归在二分類的情况推导过程与逻辑回归是什么类似,但是要稍微多点技巧且因为多分类,每种类别具有不同的概率故求期望时会具有多个方程。