欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 健康 > 养生 > 核方法总结(三)———核主成分(kernel PCA)学习笔记

核方法总结(三)———核主成分(kernel PCA)学习笔记

2024/10/25 20:25:40 来源:https://blog.csdn.net/reept/article/details/139898336  浏览:    关键词:核方法总结(三)———核主成分(kernel PCA)学习笔记

一、核主成分

    1.1 和PCA的区别

         PCA (主成分分析)对应一个线性高斯模型(参考书的第二章),其基本假设是数据由一个符合正态分布的隐变量通过一个线性映射得到,因此可很好描述符合高斯分布的数据。然而在很多实际应用中数据的正态性不能保证,这时用PCA建模通常会产生较大偏差。这时可以设计一个合理的非线性映射,将原始数据映射到特征空间,使数据在该空间的映射具有高斯性,在这个基础可进行有效的PCA建模。即通过核函数间接映射到特征空间再间接进行建模,所以称为核主成分分析;

       1.2 推导过程

         定义原始数据空间样本为\left \{ x_{n} \right \},非线性映射为\phi \left ( x \right ),且在原始空间和特征空间满足如下归一化条件。

           \sum _{n}{x_{n}} = 0 \sum _{n}{\phi (x_{n})} = 0   1------(1)

      在映射空间的协方差矩阵可写作:

  1----(2)

上式中,假设\phi \left ( x_{n} \right )有m维,则\phi \left ( x_{n} \right )\phi \left ( x_{n} \right )^{T}有m*m维。其中,在特征空间中求主成分v等价于求S^{\phi }的特征向量:

S^{\phi }v = \lambda v   1----(3)

整理以上两式可得:

1-----(4)

其中:\alpha = \frac{1}{N\mu }\Phi ^{T}\nu , 是一个N维向量,其中每一维对应一个数据点与特征向量v的内积,同时,上式说明在特征空间的特征向量v由所有数据样本的向量加权平均得到,权重为\alpha,转化为对偶问题。将 v = \Phi \alpha 代回式 1 ----(4)  :

                                1----(5)、1-----(6)、1----(7)

其中 K为gram阵, 上式1—(7)右项左移,可以看出K选择合适的核函数,会使K不等于空矩阵,因而可以推出:

K\alpha = \lambda N\alpha   1——(8) 为1——(7)式的必要条件

考虑特征向量v应满足v^{T}v =1 ,而 v=\Phi \alpha,有:

1-----(9)

将1---(8)式左乘\alpha ^{T}并代入上式,有:

\lambda N\alpha ^{T}\alpha =1   1----(10)

    \alpha可以通过下式求解:

   1------(11)

    上式求解特征向量的方法是,求解左式的特征向量,再取\alpha =  \alpha \sqrt{\frac{1}{\lambda N}} 就可以求得满足约束的特征向量。解出\alpha后,即可基于1—(4)式得到在特征空间的主成分向量。和标准PCA类似,我们可以求得多个主成分,组成主成分向量集{v_{i}}。

    基于{v_{i}}可对任意测试样本x降维,且等价于在特征空间中计算\phi \left ( x_{} \right )在各个主成分v_{i}上的投影,计算如下:

   1———(12)

上式 \alpha _{i,n} 表示特征向量v_{i}对应的权重的第n维(n=1.....N)。

        虽然我们的目的是在特征空间进行主成分提取并给予得到的主成分对数据进行降为,但不需要在特征空间进行操作,所有计算都在原始空间中以核函数方式进行,计算得到的结果等价于在特征空间中进行。这使得可以在非常复杂的特征空间中对数据进行PCA建模,从而解决了原始数据的非高斯化问题,使PCA具有灵活性和可扩展性。

二、总结

      本文是学习《机器学习导论》(清华大学出版社,中文版,王东,2021年)的摘录总结或笔记。

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com