欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 汽车 > 维修 > 二分类交叉熵损失

二分类交叉熵损失

2025/4/11 15:39:16 来源:https://blog.csdn.net/yes666666/article/details/146985348  浏览:    关键词:二分类交叉熵损失

二分类交叉熵损失(Binary Cross-Entropy Loss)是用于二分类问题的常见损失函数。它衡量的是模型输出的预测概率分布与真实标签之间的差异。


1 二分类问题

在二分类问题中,每个样本的目标输出是 0 或 1,表示样本属于某一类或另一类。例如,假设我们有一个分类任务,模型的输出是某个样本属于类别 1 的概率 :\hat{y},而类别 0 的概率就是 1 - \hat{y}

2. 交叉熵损失公式

对于一个单独的样本,二分类交叉熵损失可以表示为:

L(y, \hat{y}) = -[y \cdot \log(\hat{y}) + (1 - y) \cdot \log(1 - \hat{y})]

其中:

y是真实标签,取值为 0 或 1。

\hat{y}是模型预测的类别 1 的概率,通常通过 Sigmoid 函数计算得到,输出的值在 [0, 1] 之间。

3. 损失函数解释

  • 如果真实标签 y=1,则损失函数变为L(y, \hat{y}) = -\log(\hat{y}),即当预测的概率 \hat{y}越接近 1 时,损失越小,越接近 0 时,损失越大。

  • 如果真实标签 y=0,则损失函数变为L(y, \hat{y}) = -\log(1 - \hat{y}),即当预测的概率 \hat{y}越接近 0 时,损失越小,越接近 1 时,损失越大。

因此,二分类交叉熵损失的目标是:

  • 如果真实标签是 1,模型要尽量预测一个接近 1 的概率。

  • 如果真实标签是 0,模型要尽量预测一个接近 0 的概率。

4. 平均损失

对于多个样本,我们通常计算平均损失:

L = \frac{1}{N} \sum_{i=1}^{N} \left[ - y_i \log(y_i) - (1 - y_i) \log(1 - y_i) \right]

其中 N= 是样本的数量,y_i是第 iii 个样本的真实标签,\hat{y}_i是第 i个样本的预测概率。

5. Sigmoid函数与交叉熵

在二分类中,通常我们先通过 Sigmoid 函数将模型的输出(通常是一个实数)转换为概率值 \hat{y}。Sigmoid函数的公式如下:

\hat{y} = \sigma(z) = \frac{1}{1 + e^{-z}}

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

热搜词