欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 科技 > 能源 > 讲清逻辑回归算法,剖析其作为广义线性模型的原因

讲清逻辑回归算法,剖析其作为广义线性模型的原因

2025/2/6 23:28:32 来源:https://blog.csdn.net/ALISHENGYA/article/details/145432168  浏览:    关键词:讲清逻辑回归算法,剖析其作为广义线性模型的原因

1、逻辑回归算法介绍

逻辑回归(Logistic Regression)是一种广义线性回归分析模型。虽然名字里带有“回归”两字,但其实是分类模型,常用于二分类。既然逻辑回归模型是分类模型,为什么名字里会含有“回归”二字呢?这是因为其算法原理同样涉及线性回归模型中的线性回归方程。线性回归方程是用于预测连续变量的,其y的取值范围为(−∞,+∞),而逻辑回归模型是用于预测类别的,例如,用逻辑回归模型预测一个人是否会违约、客户是否会流失,在本质上预测的是一个人是否违约、是否流失的概率,而概率的取值范围是0~1,因此不能直接用线性回归方程来预测概率。

☀什么是连续型变量?

连续型变量是指在一定范围内可以取无限多个可能值的数据类型。这些值通常可以是任意小数,且在理论上没有间隔。例如,时间、温度、长度、重量等都是典型的连续型数据,因为它们可以在某个区间内无限细分。

关键特点:

①无限可分:在任意两个值之间,存在无数个中间值。

②小数可能性:可以精确到小数点后多位(如身高1.75米、温度36.8°C)。

③测量精度:实际应用中可能受限于测量工具,但理论上连续。

连续型与离散型数值的对比

特征

连续型数值

离散型数值

取值范围

无限细分(如0.1, 0.01, ...)

有限且可数(如1, 2, 3)

例子

温度、时间、价格、身高

人数、商品数量、考试题数

统计方法

线性回归、相关分析

计数模型(泊松回归)、卡方检验

那么,想将线性回归应用到分类问题中该怎么办呢?也就是如何把一个取值范围是(−∞,+∞)的回归方程变为取值范围是(0,1)的内容呢?

假设y=3,通过Sigmoid函数转换后,f(y)=1/(1+e^−3)=0.95,就可以作为一个概率值使用了。

Sigmoid函数的曲线如下图所示,从图上可知,当y值趋向负无穷(−∞)时,f(y)的值趋向于0;当y值趋向正无穷(+∞)时,f(y)的值趋向于1,且函数的值域为(0,1)。这样,就将线性回归中

得到的取值范围为(−∞,+∞)的值,变成了取值范围为(0,1)之间的概率值。

将线性回归函数结果y放到Sigmoid函数中去,就构造了逻辑回归函数,函数表达式为:

逻辑回归模型本质就是将线性回归模型通过Sigmoid函数进行了一个非线性转换,将线性回归的结果(−∞,+∞)转换到一个介于0~1之间的概率值。逻辑回归带有“回归”却是分类问题就是因为Sigmoid函数,Sigmoid函数将数据压缩到[0, 1]之间,并经过一个重要的点(0, 0.5)。这样,可以将 0.5作为阈值,当值大于0.5作为一类,而小于0.5作为另一类。

2、为什么说逻辑回归是广义的线性模型

(1)公式角度

在Sigmoid函数的两边乘以(1+e^−y),则等式转换为:

整理可以得到:

等式两边同时取对数,整理可以得到:

把f(y)看成某个事件发生的概率,那么这个事件不发生的概率就是1−f(y),两者的比值称为比值比(Odds Ratio)。令f(y)=P,则可以得到逻辑回归模型的另一种表示方法,公式如下:

方程式的左边是对数比值比,右边是线性方回归。从这个角度看,逻辑回归就是广义的线性模型。

(2)核心要素和对应关系的角度

①广义线性模型(GLM)的核心要素

☛随机成分:响应变量Y服从指数分布族(如正态分布、二项分布、泊松分布等)。

☛系统成分:线性预测器

☛链接函数:将线性预测器η与响应变量的期望值连接起来。

②逻辑回归与GLM的对应关系

☛随机成分:伯努利分布

逻辑回归用于二分类问题(如成功/失败),响应变量服从伯努利分布,伯努利分布属于指数分布族,满足GLM对随机成分的要求。

☛链接函数:Logit函数

逻辑回归使用Logit函数作为链接函数,将线性预测器的值η映射到概率p,这一步骤将线性预测器的范围(−∞,+∞)转换为概率区间[0,1]

☛系统成分:线性预测器

与线性回归类似,逻辑回归的线性预测器是特征变量的线性组合:

至此,逻辑回归模型及其为什么是广义线性模型已学习完,下次学习其实现原理及应用场景。

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com