迄今为止,已有数百篇文章描述了用于微生物、真菌、植物、动物和人类基因组 De Novo 组装的 PacBio HiFi 测序,而科学界也通过多次基准比较验证了 PacBio HiFi 测序的一流性能。 在 Chen-Guang Liu 博士、Zhuo Wang 博士及其合作者近期开展的另一项题为“ 对酵母基因组长读长测序、组装工具和打磨工具的基准测试” 的技术比较研究中,研究人员利用目前广泛使用的酿酒酵母 (SC) 菌株 S288C 以及另外两种工业用酵母菌株对 PacBio HiFi 和 Oxford Nanopore Technologies 测序和组装工具进行了非常详细的评估。
研究人员得出结论:这两种技术建议使用的最佳测序深度明显不同:
“对于酵母等真菌的高质量基因组构建,ONT 的测序深度应不低于 80X……HiFi 数据的测序深度应不低于 20X”
尽管 HiFi 数据集的覆盖度低了四倍,但作者观察发现,基于 HiFi 测序的组装依然远优于更高深度的 ONT 组装。他们指出:
- “我们使用 HiFi reads 构建出了最佳组装”
- “HiFi 数据所得组装中的 contig 数量低于 ONT 数据”
- “HiFi 所得组装中的 BUSCO 的 N50 和完整基因数略高于 ONT,这表明 HiFi reads 的基因组质量与 ONT 相比有了整体提升”
- “与 ONT 相比,基于 HiFi 数据的基因组构建消耗的计算资源较少”,“在深度相同的情况下,HiFi 数据集的 CPU 时间和内存使用量小于 ONT 数据集”
“在这两个菌株中,HiFi 数据获得了 N50 最高的基因组。 并且,两个 HiFi 流程在 SC 组装上的完整基因数量明显多于 ONT 流程。”
而且,所需的起始数据量减少了四倍。 因此,我们需要注意,基础测序技术的质量不同,某个项目所需的数据量可能就会大不相同。 PacBio HiFi reads 具有最准确、最完整的序列信息内容(现在还 包括甲基化),其所需的数据和计算资源通常比其他技术要少得多,因此,这种技术的总体项目成本最低,但却能始终提供一流的结果和生物学见解。