2021年06月03日  |  人类遗传学研究

迎来基因组学里程碑——第一个完整的人类基因组

这是一个让我们为之努力了三十年的时刻:第一个完整的人类基因组组装完成!
读到这里,您肯定会有一种似曾相识的感觉。毕竟,人类基因组参考已于 2000 年、2001 年和 2003 年宣告“完成”。但是,自那以后使用过人类参考基因组的任何科学家都知道,其实根本不存在经过完全测序的人类基因组。直到今天,这个目标终于达成。

HiFi 测序带来了第一个人类基因组完整序列

端粒到端粒 (T2T) 联盟是一个由来自美国国家人类基因组研究所和其他数十家机构的科学家组成的大型团队。近期,该联盟发布了一篇名为“人类基因组完整序列”的预印本论文。主要作者 Sergey Nurk、Sergey Koren、Arang Rhie 和 Mikko Rautiainen,以及通讯作者 Evan Eichler、Karen Miga 和 Adam Phillippy 以及众多合作者克服了缺口和错误,共同提供了所谓的“首个真正完整的人类参考基因组。”

HiFi 测序带来了第一个人类基因组完整序列

这项重大成果结合了多项前沿技术(包括 PacBio 的 HiFi 测序),生成了一个基于完整葡萄胎 (CHM13) 的无缺口、完整单倍体人类基因组组装。他们的目标是创建一种包含全面、可靠的基因组数据的新资源,避免最新的 GRCh38 参考组装中仍然存在的缺口和错误。Nurk 等人在报告中表示:“由此产生的 T2T-CHM13 参考组装消除了一个存在了 20 年的障碍,这个障碍隐藏了基于序列的分析产生的基因组之中的 8%,包含所有着丝粒区域和五个人类染色体的整个短臂。”

HiFi 测序不熟悉?——了解这种全新测序技术

这个新的参考基因组“包含所有 22 个常染色体和 X 染色体的无缺口组装,纠正了许多错误,并且加入了近 2 亿 bp 的新序列,其中包含 2226 个旁系同源基因拷贝,其中 115 个预计为蛋白质编码,”作者补充道,这是“自人类参考基因组首次发布以来实现的最大改进”。

GRCh38 人类基因组组装与 T2T-CHM13 人类基因组组装的对比(Nurk 等人2021)。

HiFi 测序是实现这一成就的关键。科学家们指出,HiFi 测序的特点是“20 kbp 的 read 长度和 99.9% 的中位准确率,可达到前所未有的组装准确率,而且仅需对标准组装方法进行相对较小的调整。……HiFi 测序擅长区分存在细微差异的重复序列拷贝或单倍型。

HiFi 测序消除了技术障碍

T2T-CHM13 组装以直接从 HiFi read 构建的高分辨率组装串图为基础(Nurk 等人2021)。

最初,该团队采用的策略是使用嘈杂的基于超长纳米孔的 read 来构建组装骨架,然后再使用其他平台对其进行打磨。但是,他们随后就改用了准确的长 HiFi read。他们表示:“我们改用了一种新策略,利用 HiFi read 的准确率和长度来组装高度重复的着丝粒卫星阵列和密切相关的片段重复。”这种组装以从 HiFi read 构建的串图为基础,平均共识准确率在 Q67 与 Q73 之间,“远远超越了‘已完成’序列的原始 Q40 定义,”作者补充道。

科学家们建议,将在不久以后添加 Y 染色体序列的新组装应当代替 GRCh38 参考基因组,应用于“所有需要线性参考序列的研究”。他们还指出:与其前身相比,该组装“更完整、更具代表性、更准确”,而且“大大增加了人类基因组中已知基因和重复序列的数量”。
该团队还指出,与 GRCh38 参考基因组相比,使用新参考基因组对短 read 公共数据集(如“千人基因组计划”)进行再分析可实现改进,而且,鉴于参考基因组更加完整,他们预计会发现新的表型关联。

HiFi 测序助力基因组发现的下一个阶段

作者表示:“人类基因组的完整端粒到端粒组装标志着基因组学的新时代已经到来,基因组的任何区域都触手可及。”

“将高度准确的长读长测序与定制算法相结合有望实现单个单倍型的从头组装和复杂结构变异的序列级分辨率。要想实现这个目标,就需要按照人类泛基因组参考联盟的计划,对二倍体人类基因组进行常规、完整的从头组装。”

最后,根据该团队的报告,他们预计,高度准确的长读长测序将实现“对高质量、完整的参考单倍型的收集,这将使该领域不再使用单一的线性参考基因组,改用能够全面捕获人类遗传变异多样性的参考泛基因组。”“在理想的情况下,可以按照此处的质量标准组装每个基因组,因为通过短读长重测序方法恢复的小变异仅为全部基因组变异的一小部分。”


如何开始对各种基因组进行 HiFi 测序

深入了解我们的全基因组测序应用

PacBio 科学家为您解答有关 HiFi 测序的问题。

咨询专家

如果您有疑问、需要查看订单状态或想要购买仪器,我们随时乐意提供帮助。

姓名(Required)
这个字段是用于验证目的,应该保持不变。

在本网页上注册,即表示您同意,并同意 PacBio 根据我们的隐私政策收集和使用该信息.