欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 文旅 > 手游 > AI-人工智能-基于LC-MS/MS分子网络深度分析的天然产物成分解析的新策略

AI-人工智能-基于LC-MS/MS分子网络深度分析的天然产物成分解析的新策略

2025/4/18 3:00:16 来源:https://blog.csdn.net/itwangyang520/article/details/147075384  浏览:    关键词:AI-人工智能-基于LC-MS/MS分子网络深度分析的天然产物成分解析的新策略

Anal Chem∣张卫东教授团队开发基于LC-MS/MS分子网络深度分析的天然产物成分解析的新策略

2024年9月23日,海军军医大学张卫东教授团队在Analytical Chemistry(IF=6.7)上发表了题为“In-Depth Analysis of Molecular Network Based on Liquid Chromatography Coupled with Tandem Mass Spectrometry in Natural Products: Importance of Redundant Nodes Discovery”的文章,通过对不同结构类型的天然产物进行分子网络深度分析,发现除了已知和未知化合物节点外,还存在三种冗余节点:其它加合离子、同位素及源内裂解节点。此外,还探讨了这些冗余节点的形成原因并进行了实验验证,强调了分子网络深度分析的必要性。我们期望分子网络深度分析能够应用于各种复杂样品的LC-MS/MS分子网络中,例如发现天然产物中的新活性成分和代谢组学的生物标记物,为天然产物药效物质基础和靶点研究提供强大的分析基础。

Image

摘要

复杂体系中天然产物的鉴定是天然产物研究的主要瓶颈。液相色谱-串联质谱(LC-MS/MS)已成为天然产物高通量表征的主要工具。LC-MS/MS产生的大量数据集对数据处理和解释提出了挑战,而LC-MS/MS分子网络(MN)是分析大型MS/MS数据集最突出的工具之一,广泛用于未知化合物的快速分类、鉴定和结构推测。然而,大量冗余节点的存在会导致假阳性结果。为解决此问题,我们提出了分子网络深度分析的概念。本研究对天然产物中常见的五种结构皂苷、甾体、黄酮、生物碱和酚酸的分子网络簇进行深度分析,揭示了除正常节点外还存在冗余节点(包括其他加合离子、同位素和源内裂解),这可能导致假阳性结果。此外,通过对不同冗余节点产生的原因进行了讨论和实验验证,发现通过优化实验条件和基于特征的分子网络(FBMN)可以减少冗余节点的影响。而且,离子鉴定分子网络(IIMN)可以快速发现和筛选冗余节点,简化分子网络深度分析并提高结构相关分子的网络连通性。最后,以7种天然产物组成的现代中药复方-麝香保心丸为例,为复杂系统的综合表征中分子网络深度分析提供指导。本研究强调了分子网络深度分析对于更好地理解和利用复杂系统中的MS/MS数据的重要性,通过筛选和过滤冗余节点降低鉴定的假阳性率。

1.图文摘要

Image

图1 冗余节点发现的图文摘要

2.分子网络深度分析流程

分子网络的深度分析流程主要包括以下几个步骤:

(1) MN文件的准备:GNPS使用Cytoscape V3.9.1打开并编辑MN文件,对目标簇节点进行逐一分析。

(2) 已知节点的识别:将所有节点与公共数据库以及自建数据库进行匹配并手动检查所匹配结果的准确性,以标识MN中所有已知节点。

(3) 冗余节点的筛选:分析上述已知节点的邻近节点,并依据原始数据中保留时间、一级和二级谱图来筛选其他加合离子、同位素及源内裂解冗余节点。

(4) 冗余节点的剔除:将上述冗余节点进行剔除,并将其在分子网络中网络关系转移至对应的正常节点上从而得到干净的网络。

(5) 未知节点的结构推测:根据已知节点对与其相连的未知节点的结构进行推测

通过上述步骤,可以实现对分子网络的全面分析和准确注释。

3.冗余节点的发现

3.1其他加合离子冗余节点

图2A展示了人参中人参皂苷MN,数据库匹配结果中显示16个红色节点为已知化合物,且有27个未表征节点。特别地,一些未表征节点代表同一化合物的其它加合离子节点。例如,红色已知节点#1123与四个黄色节点相连。这些黄色节点在节点#1123对应的一级谱图中出现,与节点#1123的保留时间及峰形相似,且它们的一级谱图相似。因此,可以通过保留时间、一级和二级谱图来发现其他加合离子节点。

3.2同位素冗余节点

继续对人参皂苷 MN 进行分析时,发现了节点 #1123 的同位素节点#1126。该节点与#1123具有关联性,表现出以下特征:#1126位于#1123的一级谱图同位素分布区域,它们的提取离子色谱图的保留时间和峰形一致,#1126的二级谱图符合#1123的同位素特征。因此,我们同样可以通过保留时间、一级和二级谱图来发现同位素节点。

Image

图2 其它加合离子和同位素冗余节点的特征

3.3源内裂解冗余节点

在蟾酥中甾体MN簇分析中,观察到红色节点附近存在一些灰色节点,这些节点与数据库不匹配且结构上无法推断。未表征的灰色节点代表一类由于源内裂解(ISF)产生的新冗余节点,主要表现为两种方式:一个节点生成多个节点和多个节点生成一个节点。例如,节点#417附近的节点#399、#381和#363的保留时间与节点#417相同,并且它们的特征离子在节点#417的一级谱图中可见,表明这些节点是节点#417的ISF节点。此外,另一种具有不同特征的ISF节点也被识别。节点#383的提取离子色谱图显示多个峰,其中特征离子m/z 383的响应较低,而基峰由较高分子量的离子组成。与节点#383对应的节点#401、#425和#443的提取离子色谱图在不同保留时间上重合,这些节点的二级谱图中均在m/z 383处显示显著碎片离子。因此,ISF节点的存在需要通过保留时间、一级和二级谱图进行验证,同时结合正负离子数据进一步确认。

Image

图3 源内裂解冗余节点的特征

3.4实验和公共数据集中冗余节点现象

在实验数据集中,我们观察到中药不同结构类型的化合物分子网络普遍存在冗余节点现象。除附子样品的生物碱分子网络外,其余四种类型的冗余节点占总节点的约一半。为验证这一现象的普遍性,我们随机选取了GNPS公共数据集中Thermo Scientific、Bruker、Agilent、Waters和AB SCIEX等公司的一个串联质谱数据集进行深入分析。结果显示,其它公司的公共数据集中同样存在冗余节点,这一问题亟需引起高度重视(图4)

Image

图4 实验和公共数据集中冗余节点现象

4.冗余节点产生的原因

4.1其他加合离子节点的原因探讨

图5A显示黄酮MN簇和皂苷MN簇的其他加合离子节点数量显著高于其他天然产物。因此为了解释这一现象,分析具有最多其他加合离子节点的黄酮MN簇,结果表明其他加合离子节点数量与丰度呈部分正相关。但是尽管节点#513的丰度较高,却未观察到它的其他加合离子节点。通过比较这些黄酮化合物结构,发现相较于节点#853和#867,节点#883在C7位置多一个羟基,从而产生了更多的其他加合离子节点。这表明羟基数量可能影响不同加合离子形成。而节点#513羟基最少,且只有一条糖链,这也可能是其未产生其他加合离子节点的原因。综上所述,其它加合离子节点的生成可能与化合物的丰度和结构紧密相关(图5)。

4.2同位素节点的原因

在图4A中,冗余节点中同位素节点数量最少,但每类化合物MN中均包含一些同位素节点。以人参皂苷MN簇为例,对同位素节点产生的原因进行探讨。结果发现同位素作为冗余节点的出现通常是由于样品浓度较高,导致MS/MS检测到同位素离子。化合物的分子式影响其同位素比率,较大分子量的化合物通常具有较高的比率。为解决此问题,优化样品浓度和调整质谱设置可以显著减少冗余同位素的出现。预处理软件和FBMN在区分同位素信号与真实分析物方面也发挥着重要作用(图5)

Image

图5其它加和离子和同位素节点产生原因

4.3 ISF节点的原因

在复杂样品分析中,ISF节点是重要的冗余节点,它们可能源自真实化合物的碎片,导致对同系物的错误识别。研究表明,ISF节点的产生与化合物结构紧密相关,尤其是在甾体化合物中,正模式下ISF节点数量最多。通过优化质谱参数,如毛细管电压、锥孔电压和去溶剂化温度,可以减少源内碎片的生成。例如,在分析Hellebrigenin时发现,毛细管电压和锥孔电压对特定碎片(如[M+H-H2O]+ m/z 399.2171)的相对丰度影响较小,但降低去溶剂化温度显著降低了该碎片的丰度,显示温度对源内裂解有重要影响。进一步比较显示,在不同的毛细管和锥孔电压下,ISF节点与正常节点的数量变化不大,但随着去溶剂化温度降低,ISF节点数量显著减少。然而,温度过低也会导致正常节点数量下降。因此,优化去溶剂化温度可以有效最小化ISF节点,同时维持正常节点数量。总之,尽管优化质谱参数能改善ISF节点情况,但由于结构和质谱本身的限制,ISF节点无法完全避免,需结合保留时间、MS/MS光谱及正负离子交叉验证(图6)。

Image

图6源内裂解节点产生原因

5.冗余节点的优化

5.1 FBMN对冗余节点的优化

成熟的数据预处理工具通过FBMN与GNPS平台相连,可以有效地过滤冗余离子,这显示出FBMN解决冗余节点问题的潜力。为了验证FBMN是否可以对冗余节点进行了优化,以人参、淫羊藿和蟾酥的HRMS/MS数据集的MN和FBMN结果进行比较。FBMN显著增加了正常节点的数量,主要因其能够有效区分具有不同保留时间的异构体节点。此外,FBMN避免了同位素节点,并在一定程度上优化了其他加合离子节点。然而,某些化合物的不可预测加合离子使得FBMN无法完全避免其他加合离子节点,需进一步分析。尽管FBMN在处理同位素和其他加合离子节点方面表现良好,但它未能有效优化ISF节点,反而产生了更多ISF节点。总之,FBMN在减少冗余节点方面表现出色,但在ISF节点处理上仍需改进(图7)。

5.2 IIMN在冗余节点发现中的应用

最近,GNPS平台引入的IIMN集成了色谱峰形相关性,允许用户定制加合物和源内修饰,以连接同一分子的不同节点。这一创新或许可以有助于在冗余节点发现中提高结构相关分子的网络连通性。通过使用含有最多ISF节点的蟾酥数据集进行分析发现,IIMN能够快速识别同一分子的多种加合物和ISF节点。但尽管超过一半的节点通过IIMN被检测出来,但一些特征节点仍需手动修订。此外,预先确定与样品类型相关的目标化合物及其可能的加合离子,有助于提高离子识别的准确性。总的来说,IIMN简化了冗余节点的发现,提升了网络分析的效率,但仍需要针对未被识别的特征节点进行深度研究(图7)。

Image

图7 FBMN及IIMN在冗余节点发现中的应用

6.分子网络深度分析在SBP中的应用

近年来,传统中医药因其在医疗保健方面的潜力而受到越来越多的关注,尤其是中药复方,这些配方通常由多种草药和植物性药物组成,已被用于治疗各种疾病并显示出良好的临床效果。然而,它们的具体药理机制尚不明确,因此对中药配方的多成分药物进行深入分析显得尤为重要。麝香保心丸(SBP)是一种广泛应用于冠心病及相关疾病的中成药,但其活性成分仍不清楚。

为了解决这一问题,本研究通过将SBP的质谱数据导入GNPS平台,以获取原始的分子网络数据,并利用该数据对SBP的化学成分进行深入分析。研究结果显示,在SBP的正负模式MN簇中,超过一半的节点被识别为冗余节点。传统的MN分析方法仅能注释已知节点与一些常见加合离子节点,导致许多节点可能被错误鉴定。最终,通过去除冗余节点并将其网络关系转移至正常节点,形成了一个干净的网络,用于未知物的结构预测。

对于未知节点的分析表明,正模式下主要是酰基精氨酸,负模式下主要是皂苷。通过比较未知节点与已知节点之间的分子量差异,研究识别出多个新的酰基精氨酸衍生物。此外,从皂苷的MN中也推测出两个未知节点的可能结构,通过分析其MS/MS光谱及碎片离子的生成情况,将其推测为人参皂苷的衍生物。

最终,本研究识别出了16种潜在的未知化合物,其中包括6种皂苷和10种酰基精氨酸,为进一步研究SBP的药效物质基础提供了重要的数据支持。这一成果不仅有助于理解中药配方的复杂性,也为未来中药的研发和临床应用奠定了基础(图8)。

Image

图8 分子网络深度分析在麝香保心丸成分表征中的应用

7.结论

本研究首次提出了分子网络深度分析的概念,发现分子网络分析中存在其它加合离子、同位素和源内裂解三种冗余节点。此外,总结了不同冗余节点的特点并讨论了这些冗余节点产生的原因,为其它冗余节点优化研究提供研究基础。分子网络深度分析是一种根据不同冗余节点的特点,对分子网络中的冗余节点进行快速过滤和筛选的方法,从而产生只包含已知节点和未知节点的干净分子网络,更容易对未知节点进行表征,大大提高分子网络分析的效率和准确性。

参考文献

Zhang Y, Liao J, Le W, Zhang W, Wu G. In-Depth Analysis of Molecular Network Based on Liquid Chromatography Coupled with Tandem Mass Spectrometry in Natural Products: Importance of Redundant Nodes Discovery. Anal Chem. 2024 Sep 23. doi: 10.1021/acs.analchem.4c02230. Epub ahead of print. PMID: 39311834.

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

热搜词