关键词搜索
顶部横幅广告

全球最大人类泛基因组建成,发现13%未知序列

【金色港湾资讯网为您推荐阅读】

一项最新研究,发表于《自然》杂志,其表明传统人类基因组参考序列,遗漏了约13%的未知序列,此发现正颠覆医学界,对遗传疾病的认知起点。西湖大学杨剑教授团队,联合国内外合作者,在4月1日公布的成果里,构建了全球规模最大的人类泛基因组图谱,为精准医疗提供关键导航工具。

标准基因组地图存在大量盲区

自二零零三年人类基因组计划完成之后,全球科研界长久以来依靠单一参考基因组当作研究标准,这一“标准地图”主要是依据少数个体样本构建而成的。北京协和医学院遗传学领域专家表明,因为个体之间有着明显的遗传差异,单一参考基因组难以涵盖不同人群的基因特征,致使大量罕见病的诊断走入了困境。据相关统计显示,超过百分之八十的罕见病患者在常规基因检测当中无法得到明确的诊断结果,其中有相当一部分比例与参考基因组信息不全面直接存在关联。

长期以来,传统泛基因组研究一直被高额的三代测序成本所限制,已开展的相关研究,样本量大多集中于几十人至百人这一区间之内。这样的小样本量研究,很难全面呈现人类遗传多样性,尤其是在对低频变异以及复杂结构变异进行分析时,明显显得力不从心。就拿非洲人群来说,其遗传多样性远远超过其他大洲,然而在现有的参考基因组里,代表性严重欠缺,进而导致全球范围内出现基因检测偏差。

混合测序策略破解成本难题

杨剑团队以创新之姿开发出基于泛基因组的联合组装方法,此方法简称为PIGA,它采用的是二代与三代测序相结合的那种混合策略。其二代测序技术起着保障序列准确性的作用,三代测序技术承担着搭建基因组骨架的职责,这两者协同开展工作,既让测序质量得到了提升,还使成本显著降低了。研究团队透露,和传统三代测序方案相比较而言,PIGA方法致使单个基因组的测序成本下降幅度超过70%。

依靠这一技术上的突破,团队成功搭建了泛基因组,这个泛基因组包含1116个二倍体基因组,覆盖了来自全球多个主要人群的遗传样本。经过严格的验证,以该方法建设的基因组错误率仅仅是五万分之一,达到了高质量基因组组装的标准。这样大规模的样本数量让研究人员能够精确估计复杂变异在人群中的真实频率,而这是以往百人规模的研究无法达成的目标。

全球最大人类泛基因组建成,发现13%未知序列(图1)

未知序列中隐藏功能元件

在大规模比对分析之后,研究团队发现,传统参考基因组遗忘了超出有4亿碱基对的未知序列,这一数量等同于人类基因组总规模的13%。其中,这数据远远超过科学界之前的普遍预估,表明人类基因图谱还有大量空白区域等着填补。在这些新发现的序列当中,研究人员确认出2620万碱基对具备明确功能特征的区域,涵盖蛋白质编码基因以及调控元件。

这些新被发现的功能元件绝非“垃圾DNA”,而是有能力指导蛋白质合成且调控基因表达的关键序列。拿调控基因来说,它们好似基因表达的“音量开关”,决定特定基因在何时发挥作用,在何地施展效能,以及以怎样的强度产生影响。杨剑教授作出解释,这些序列要是缺失了,就可能致使研究人员对疾病相关变异做出错误判断,甚至会完全错过关键的致病突变。

复杂变异图谱精确到单碱基

研究团队同步绘制出了迄今最为详尽的人类遗传变异图谱,此图谱涵盖了3540万个小变异,其中包含单核苷酸变异以及短插入缺失。更为重要的是,研究人员把大量难以检测的结构变异、串联重复序列和嵌套变异等复杂遗传变异成功地破译出来了。这类以往因技术限制而长时间被忽视的复杂变异,恰恰和多种复杂疾病的产生发展紧密相关。

在那个图谱里头,团队精准地定位了3256个,能够对基因表达起到调控作用的关键复杂变异,而这些变异被称作表达数量性状位点。临床遗传学方面的专家表明,这些调控方面的变异,在疾病发生过程里所起的作用,常常要比蛋白质编码变异更为微妙,就好比某些自身免疫病以及神经发育障碍,就和调控区变异有着紧密的关联。这项成果给疾病遗传诊断提供了全新的分子标记物,有希望把罕见病的诊断率提高15%至20%。

大规模泛基因组赋能罕见病诊疗

全球最大人类泛基因组建成,发现13%未知序列(图2)

杨剑教授于成果发布会上着重表明,数额极大的样本量所构成的泛基因组能够极为显著地赋予罕见病诊断以强大能力,特别是针对那些先前未曾知晓的复杂变异情况。唯有样本量充足庞大,才能够精确估量某个复杂变异在人群里的出现频率,借此分辨出无害的多态性以及确切的致病突变。当下,该研究团队已经同国内诸多三甲医院展开合作,把这一泛基因组图谱运用到疑难病例的再次分析过程中。

举个例子是脊髓性肌萎缩症,这个病呐关键的致病基因是SMN1,可在它的附近呢存在着高度同源的假基因SMN2,传统的短读长测序很难精准地区分这两个。借助利用PIGA方法构建而成的泛基因组,研究人员得以清楚地解析这类复杂的基因组区域的结构变异,极大地提高了诊断的准确性。这种方法不但适用于人类基因组的研究,还能够推广到其他物种的泛基因组构建,为农业育种以及生态保护提供技术方面的支撑的说。

新范式推动精准医疗落地

杨剑在采访中表示,这项研究极大地深化了我们对复杂遗传变异及其功能的认知,它彰显了基于大规模基因组组装的分析方法在填补传统测序研究空白方面的巨大潜力。《自然》杂志同期配发的评论文章指出,该研究为人类健康研究和其他物种泛基因组研究提供了可复制的新范式,标志着基因组学进入大规模高质量组装时代。

需要予以关注的是,研究团队已经把构建而成的泛基因组数据以及变异图谱予以公开共享了,可供全球范围之内的科研人员以及临床医生免费去使用。有多位国内的遗传学专家纷纷呼吁呢,应当尽快把这一成果转化成为临床检测标准,尤其是在产前诊断以及新生儿遗传病筛查这些领域率先去应用。随着测序成本不断下降,基于泛基因组的个体化分析有希望在未来三到五年的时间里进入常规临床实践。

见到这般情形,你会不会觉得,国家理应如同往昔开启人类基因组计划那般,迅速立项去构建“中国人群泛基因组图谱”这一工程呢?欢迎于评论区讲出你的看法,别忘掉点赞并且转发出去,以便让更多的人目睹这项具有突破性的迈进。

分享更多
3
0
加载中~

您可能还会对下面的文章感兴趣:

底部横幅广告