人类基因序列从2001年开始由6国科学家共同参与,至今已经有22年的时间,科学家经过这么长时间的研究破译人类基因的组成部分,截止目前人类完整的基因组终于首次破译成功,这将对人类的生长发育和疾病有一个更深层次的了解,是一大进步。
历时22年,研究人员终于从头到尾破译了完整的人类基因组序列。被誉为生命科学“登月计划”的人类基因组测序再次取得重大进展:国际科学团队端粒到端粒联盟(T2T)发表了第一个完整的、无间隙的人类基因组序列,首次揭示了高度相同的节段重复基因组区域及其在人类基因组中的变异。这是对标准人类参考基因组,即2013年发布的参考基因组序列(GRCh38)的“重大升级”。当地时间31日,《科学》杂志连发6篇论文报告这一成就。
2001年2月12日,由6国科学家共同参与的国际人类基因组计划首次公布人类基因组图谱及初步分析结果;2003年4月15日,公布了人类基因组序列草图。然而,由于技术限制,当初的人类基因组计划留下了大约8%的“空白”间隙。这部分很难被测序,由高度重复、复杂的DNA块组成,其中包含功能基因以及位于染色体中间和末端的着丝粒和端粒。实际上,核心的挑战在于,基因组的某些区域反复重复相同的碱基。重复的区域包括着丝粒和核糖体DNA等,过去无法按照正确的顺序组装一些被切碎的片段。这就像拥有相同的拼图碎片一样,科学家们不知道哪块碎片在哪里,因此基因组图中留下了很大的空白。
如今,研究人员通过新的纳米机器设备与核心技术,实现了新的无间隙版本T2T-CHM13,由30.55亿个碱基对和19969个蛋白质编码基因组成。增加了近2亿个碱基对的新DNA序列,包括99个可能编码蛋白质的基因和其中近2000个需要进一步研究的候选基因。
一直到2020年夏天,该团队已经拼上了两条染色体。最终,通过长时间的研究与团队合作,该团队成功实现了对每个染色体进行了测序,包含了编码用于制造核糖体的RNA的基因的多个拷贝,总共400个。2021年6月,这份研究成果首次发表在预印版平台bioRxiv上。经过同行评议等,如今一系列论文登上了《Science》(科学)杂志。今天,新的基因组序列研究成果,是科研人员必不可少的第一步,也是实现商业化的重要一步。