欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 房产 > 家装 > 线性可分支持向量机的原理推导 线性分隔超平面关于任意样本点 (x_i,y_i)的几何间隔 公式解析

线性可分支持向量机的原理推导 线性分隔超平面关于任意样本点 (x_i,y_i)的几何间隔 公式解析

2024/10/23 1:23:20 来源:https://blog.csdn.net/u013172930/article/details/143029448  浏览:    关键词:线性可分支持向量机的原理推导 线性分隔超平面关于任意样本点 (x_i,y_i)的几何间隔 公式解析

本文是将文章《线性可分支持向量机的原理推导》中的公式单独拿出来做一个详细的解析,便于初学者更好的理解。


公式 9-3 进一步明确了如何计算分类间隔的大小,公式形式如下:
d i = y i w T x i + b ∥ w ∥ d_i = y_i \frac{\mathbf{w}^T \mathbf{x}_i + b}{\|\mathbf{w}\|} di=yiwwTxi+b

1. 公式 9-3 的含义

公式 9-3 表达的是样本点 ( x i , y i ) (\mathbf{x}_i, y_i) (xi,yi) 到超平面的距离 d i d_i di,具体地说,它给出了没有符号的距离,也就是样本点到分类超平面的几何间隔。几何间隔与之前公式 9-1 提到的带符号的距离不同,它只关注点到平面的绝对距离,不关心分类的正负方向。

含义拆解:
  • d i d_i di 是第 i i i 个样本点 x i \mathbf{x}_i xi 到超平面的几何间隔
  • y i y_i yi 是样本点的标签(+1 或 -1),这个标签在这里用来保证超平面两侧的点符号一致,起到方向性作用。
  • w T x i + b \mathbf{w}^T \mathbf{x}_i + b wTxi+b 是样本点到超平面的距离函数(在分类函数中已经出现过),但这里表示为带符号的距离。
  • ∥ w ∥ \|\mathbf{w}\| w 是超平面的法向量 w \mathbf{w} w 的范数(即向量的长度),表示法向量的规模,用于标准化距离。

2. 几何间隔的推导

公式 9-3 是如何从之前的带符号距离(公式 9-1)推导出来的呢?

带符号距离(公式 9-1 回顾):

我们在公式 9-1 中定义了样本点的带符号距离:
d i = y i ( w T x i + b ) d_i = y_i (\mathbf{w}^T \mathbf{x}_i + b) di=yi(wTxi+b)

这个公式定义了样本点 x i \mathbf{x}_i xi 在分类函数中的值 w T x i + b \mathbf{w}^T \mathbf{x}_i + b wTxi+b,并通过 y i y_i yi 来确保该距离的符号符合样本点的真实分类。

转换为几何间隔:

在公式 9-3 中,我们希望得到几何间隔,也就是样本点到超平面的实际物理距离。要做到这一点,我们需要考虑分类超平面的法向量的大小。

几何间隔的公式为:
d i = ∣ w T x i + b ∣ ∥ w ∥ d_i = \frac{| \mathbf{w}^T \mathbf{x}_i + b |}{\|\mathbf{w}\|} di=wwTxi+b

该公式表示距离是超平面法向量 w \mathbf{w} w 投影到样本点 x i \mathbf{x}_i xi 上的值,然后用法向量的大小 ∥ w ∥ \|\mathbf{w}\| w 进行归一化。

  • 为什么要归一化?:因为 w \mathbf{w} w 可以通过缩放变大或变小,而几何间隔应该与 w \mathbf{w} w 的缩放无关。通过除以 ∥ w ∥ \|\mathbf{w}\| w,我们消除了法向量的影响,使得这个公式只表示到超平面的实际距离。

通过加入 y i y_i yi,公式 9-3 确保了几何间隔的符号(用于分类方向一致性),并且引入了超平面的法向量归一化,得到了真实的几何间隔。

3. 公式 9-3 的作用

公式 9-3 明确了一个关键点:几何间隔是带符号的距离除以超平面法向量的大小。它揭示了样本点与超平面之间的实际物理距离,反映了分类的置信度。

几何间隔越大,意味着样本点离超平面越远,分类的置信度也就越高。因此,支持向量机的核心思想之一就是最大化最小几何间隔,确保最难分类的样本(即支持向量)与超平面有足够大的距离。

4. 几何间隔与法向量的关系

d i = y i w T x i + b ∥ w ∥ d_i = y_i \frac{\mathbf{w}^T \mathbf{x}_i + b}{\|\mathbf{w}\|} di=yiwwTxi+b

这个公式表明:

  • 几何间隔不仅与样本点的位置相关(通过 x i \mathbf{x}_i xi b b b),还与超平面的法向量大小 ∥ w ∥ \|\mathbf{w}\| w 有关。
  • 如果我们不除以 ∥ w ∥ \|\mathbf{w}\| w,那么法向量的缩放会直接影响带符号距离,使得距离不能准确反映样本与超平面之间的真实物理距离。因此,通过除以 ∥ w ∥ \|\mathbf{w}\| w 进行归一化,我们可以得到一个真正代表物理距离的几何间隔。

5. 总结

公式 9-3 给出了几何间隔的表达式,即每个样本点到分类超平面的真实距离。它是通过带符号距离归一化法向量大小得到的,反映了分类的置信度。支持向量机通过最大化这些几何间隔,确保超平面能够最大化区分不同类别的样本。

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com