评估 BRCA1/2 分子状态已成为乳腺癌患者治疗的标准操作。例如聚合酶抑制剂(PARPi)的开发和临床应用,PARPi 是肿瘤学家新疗法中的关键方式。已发现 PARPi 可改善携带 BRCA1/2 种系或体细胞突变的乳腺癌患者的临床结局,提高患者生存率和生活质量。因此,目前全球指南强烈建议对所有患者进行 BRCA1/2 检测。快速可靠地对 BRCA1/2 种系或体细胞突变进行基因筛查,对于确定哪些患者最有可能从这些治疗中获益至关重要。
基于ONT数据的乳腺癌BRCA1和BRCA2变异检测
使用了两个参考基因组样本数据集(NA12878 和 NA24385),以及 “瓶中基因组”(GIAB)提供的高可信度变异调用集,以乳腺癌中经常发生突变的 BRCA1 和 BRCA2 基因分析为例,对**六种变异检测工具(Human-SNP-wf - 变异检测流程 - 使用Clair3、Clair3、Clair、NanoCaller、Longshot 和 Medaka)**的性能进行评估。使用 Hap.py 工具,通过准确率、召回率和 F1 值评估工具的检测结果。
1. ONT参考样本数据
使用两个公开可用的人类参考样本 HG001(NA12878)和 HG002(NA24385)的长读长数据集,一般用于探索纳米孔序列数据的特性、性能评估和重复实验、工具和方法开发。HG002 细胞系在当前(PrecisionFDA Truth Challenge V2)竞赛中被用作 “已知” 样本。验证流程性能,尤其是变异检测工具性能的方法称为 “基准测试”,即使用参考样本的 DNA 进行测序并进行整个流程分析,或者使用公共存储库中该参考样本的数据进行数据分析,这是全球基因组学与健康联盟(GA4GH)推荐的方法。
纳米孔测序数据已存放在公开可访问的数据库中,网址:https://www.ncbi.nlm.nih.gov/sra/PRJNA865100
# sra-tools工具下载数据并解压为fq.gz
prefetch SRR20747220fastq-dump --split-files --gzip SRR20747220.sra
2. 变异检测软件github
Clair: 是 “Clairvoyant” 的后续工具, 新版本Clair3,是一种利用单分子测序数据快速准确检测胚系小变异的工具,结合了两类关键方法的优点:堆积调用(pile-up calling),能快速处理大多数变