在 ALS 冰桶挑战席卷全球七年后,探索散发性肌萎缩侧索硬化症的步伐已大大加快,资助相关研究的捐款金额已超 1.15 亿美元,这些研究已识别出与家族性和散发性神经退行性疾病病例均有关的多个基因。
社会活动让人们对这种疾病有了一些必要认识,而同时仍有其他挑战需要克服——其中一项挑战可以通过长读长测序来解决。
正如一项新的交互式案例研究中所详述,PacBio SMRT 测序技术正在帮助 University of Washington(华盛顿大学)的研究人员揭示与 ALS 和其他疾病相关的关键基因的重复区域。
“在过去二十年,我们主要通过 GWAS 研究,在识别 ALS 相关基因和基因位点方面取得了长足的进步。”医学遗传学助理教授 Paul Valdmanis 说道。
“我们正处于一个激动人心的时期,可以利用各种新技术来识别新的风险因素。 特别是通过单细胞测序和长读长测序,能识别出一些以前隐藏的或用短读长测序难以触及的区域。”
开始寻找答案
串联重复序列(和可变数量串联重复序列,VNTR)是在一个基因内重复多次的 DNA 片段,重复几次到一百多次不等。 有时,这些重复序列会扩增成很长的序列,这些扩增的重复序列与许多疾病有关,其中 40 种与神经系统疾病有关。
关于这些重复序列,以下问题仍待解答:
● 它们如何从具有 4 个或 5 个 CAG 的短重复序列拷贝,扩增到超过 60 个碱基对的等位基因?
● 重复序列出现的位置是否会有所不同——基因的开始、中间或结尾?
● 这些重复序列的内部序列在疾病发病机制中起到了什么作用?
为了寻找答案,Valdmanis 和博士后研究员 Meredith Course 从一个出现多起 ALS 病例的多代家族着手,探索其背后隐藏的相关机制。 该家族许多成员都患有与该疾病相关基因 (FUS) 的变异,但并非所有人都表现出症状。 原因为何? 是否存在影响发病机制的其他遗传修饰因子?
Valdmanis 实验室采用老式连锁研究方法,在 18 号染色体上识别出一个似乎也发挥了作用的区域。 受 ALS 影响的所有家族成员在该区域内都有一个 4 兆碱基的 DNA 片段。 因此,他们查看了该区域内部是否存在其他风险因素。 然后,他们使用 HiFi 测序技术作为放大镜,对该区域进行了更详细的检测。
寻找根源
通过 HiFi 测序,研究人员在 WDR7 基因中确定了一个 69 bp VNTR,发现该 VNTR 在 ALS 患者中富集。 参考基因组有大约 6 个这种重复序列的拷贝,但 ALS 家族中的每个个体都有超过 30 个拷贝。
此外,研究人员还进行了多重条码测序,在来自不同地理区域的 288 位个体中解析了 WDR7 重复序列的完整内部结构,发现了重复序列长度和内部核苷酸组成的显著差异。 69 bp 重复基序中的一些在某些地理群体中特异性存在或不存在。
他们构建了谱图以帮助可视化数据,并开始关注新出现的模式。 “每次我们查看这个重复序列,都可以了解到更多信息,”Valdmanis 说。
他们能够识别与重复序列扩增动力学相关的特征、重复序列扩增对 ALS 敏感性的机制后果以及地理上不同的人群中的重复序列结构。
对来自人类基因组计划的 15 份样本进行了长读长定相测序,进一步研究表明,WDR7 基因在其串联重复序列长度的极端可变性方面并不是唯一的。 他们探索了许多其他基因,包括 NWD2、VPS53、SLC22A1 和 ART,并且发现了各种类型的重复序列。
“我们真的相信串联重复序列的长读长测序可以提供大量关于人类进化事件以及神经退行性疾病风险因素的信息。 此外,我们也相信,VNTR 的扩增不仅可以代表 ALS 的新型疾病风险因素,还可以代表其他神经退行性疾病。”
Read our newest groundbreaking case study to learn more: ‘SMRT 测序如何帮助华盛顿大学的研究人员揭示与 ALS 相关的串联重复序列’