Menu
2020年08月11日  |  人类遗传学研究

在 PrecisionFDA 挑战赛中,PacBio HiFi reads 战胜了短读长测序和有噪声的长读长测序

最近举办的 PrecisionFDA Truth Challenge V2 挑战赛评估了人类基因组中变异检出的方法,PacBio HiFi reads 在各种类型(全基因组,特别是在难以定位的区域以及主要组织相容性复合物中)中均能提供最高查准率和查全率(图 1)。

该挑战赛共设有 64 个参赛条目  17 个使用 PacBio HiFi reads,24 个使用 Illumina reads,3 个使用 Oxford Nanopore reads,20 个使用多种技术。 整体 26 个最为精确的数据集中有 25 个采用 PacBio HiFi reads(12 个仅采用 PacBio,13 个采用多技术),并且包揽赛事了的前 12 名(3 个仅采用 PacBio,9 个采用多技术)。 

Google DeepVariant 提交的一份使用 HiFi reads 完成的参赛结果在任一单技术数据集中都实现了最高的全基因组准确度,与 GATK+Illumina reads 的常用组合相比,检测单核苷酸变异 (SNV) 和插入缺失的性能更佳,总误差减少了 5.8 倍(图 2 

此次的挑战赛有助于评估人类基因组中难以触及区域的变异检出  直到最近瓶中基因组 (GIAB) 基准仍未能达到测量人类基因组中最难以读取的 12% 范围(其中包括许多医学相关基因)内的变异检出所需的准确度

为了解决这个问题,GIAB 为其中一个参比样品 HG002 发布了扩展标准 (v4),该标准覆盖了额外 6.3% 的基因组  GIAB 随后为另外两个样本 HG003 和 HG004 开发了扩展标准。  在这些标准发布之前,针对当前可用的变异检出技术开展了一项新的 PrecisionFDA 挑战赛,旨在对这些技术进行评估 

挑战样本为 HG002、HG003 和 HG004,参赛者包括 Illumina NovaSeq 的短读长、来自 Sequel II 系统的 PacBio HiFi reads,以及来自 Oxford Nanopore PromethION 的长读长  参赛者应邀提交对 HG003 和 HG004 的检测结果,然后针对这些样本尚未发布的“真实”变异检出进行评估 参赛者们测量了全基因组、难以比对的区域和主要组织相容性复合体 (MHC) 中的 SNV 和插入缺失的变异检出准确度 

兼具精确 (99.8%) 和读长 (15-20 kb) 优势的 HiFi reads 实现了最佳的整体性能  HiFi reads 将其具有的准确度优势转化为精确的变异检出能力,并通过读长提高了对基因组难以读取区域的可识别能力。 

变异检出软件的发展也同等重要,包括 DeepVariant(有关最新版本,请参阅 Google Ai 博客)和)和 DNAscope,以更好地模拟 HiFi reads 的特性和利用 HiFi reads 提供的长片段信息

仅采用 HiFi reads 的 DeepVariant 在 SNV 检出方面的查准率和查全率可达 99.9%,在插入缺失方面可达 99.4%。  相比之下,采用 Illumina reads 技术的 DeepVariant 检出的 SNV 错误多 4.2 倍,但插入缺失错误少 1.5 倍。  最佳的 Oxford Nanopore 数据集的 SNV 检出错误多 3.8 倍,插入缺失错误多 58.2 倍(图 2 

PrecisionFDA 比赛是评估变异检出方法的重要机会,它展示了 HiFi reads 如何提供更为全面且精确的变异检测。  通过参加此次比赛,我们很荣幸能够了解到研究人员如何应用这种能力来寻找新的疾病基因,并解决其他方法无法诊断的罕见疾病病例 

Figure 2.

变异检出性能,HG003。 总错误 – SNV 和插入缺失假阳性 (FP) 和假阴性(FN)的总和在来自 35 倍 PacBio HiFi reads 覆盖率的 DeepVariant 数据集中(Sequel II 系统,2.0 版本测序试剂);来自 35 倍 Illumina NovaSeqDeepVariant 数据集;来自 35 倍 Illumina NovaSeq 的 GATK 4 数据集;以及来自 60 倍 ONT PromethION R9.4.1 的 PEPPER-DeepVariant 数据集  使用 hap.py 对照 PrecisionFDA Truth Challenge V2 挑战赛所用“瓶中基因组”小型变异基准 v4.2 测量性能  PacBio HiFi DeepVariant 数据集在挑战赛的所有单一技术数据集中的总体错误最少。 

 

咨询专家

如果您有疑问、需要查看订单状态或想要购买仪器,我们随时乐意提供帮助。

姓名(Required)
这个字段是用于验证目的,应该保持不变。

在本网页上注册,即表示您同意,并同意 PacBio 根据我们的隐私政策收集和使用该信息.