
文章图片

文章图片

一个世纪前 , 科学家们知道基因分布在 23 对染色体上 , 但直到现在我们才拥有完整、无缝的人类基因组草图 。 但是 , 这是什么意思?在人类基因组序列草图被大张旗鼓地公布几十年后 , 一个由 99 名科学家组成的团队终于破译了整个事情 。 他们在以前的版本中填补了巨大的空白并纠正了一长串错误 , 让我们对我们的DNA有了新的认识 。 最近几周 , 该联盟在网上发布了六篇描述完整基因组的论文 。 科学家们说 , 这些来之不易的数据 , 现在正在由科学期刊审查 , 将使科学家们更深入地了解 DNA 如何影响疾病风险 , 以及细胞如何将其保持在整齐有序的染色体中 , 而不是分子缠结中 。
例如 , 研究人员发现了 100 多个可能具有功能的新基因 , 并确定了数百万种人与人之间的遗传变异 。 其中一些差异可能在疾病中起作用 。 对于参与该团队的加州大学伯克利分校的博士后研究员 Nicolas Altemose 来说 , 完整的人类基因组视图感觉就像来自新视野号太空探测器的冥王星特写照片 。 他说:“你可以看到每一个陨石坑 , 你可以看到每一种颜色 , 这些都是我们以前只了解最模糊的东西 。 这简直是一个绝对的梦想成真 。 ”未参与该项目的专家表示 , 这将使科学家能够更详细地探索人类基因组 。 原本只是空白的大块基因组现在已被如此清晰地破译 , 科学家们可以开始认真研究它们 。 一个世纪前 , 科学家们知道基因分布在 23 对染色体上 , 但这些奇怪的、蠕虫状的微观结构在很大程度上仍然是个谜 。 到 1970 年 , 科学家们已经获得了精确定位几个人类基因并解码其序列的能力 , 但他们的工具非常简陋 , 以至于寻找一个基因可能会占用整个职业生涯 。
【美国科学家终于完成了人类基因组的起草工作】
到 20 世纪末 , 一个国际遗传学家网络决定尝试对我们染色体中的所有 DNA 进行测序 。 考虑到要测序的工作量 , 人类基因组计划是一项大胆的任务 。 科学家们知道 , 我们细胞中的双链 DNA 包含大约 30 亿对字母 , 一个足以填满数百本书的文本 。 当该团队开始工作时 , 科学家们可以使用的最好的技术是对仅几十个“字母”或碱基的 DNA 片段进行测序 。 留给研究人员将它们拼凑起来 , 就像一个巨大的拼图游戏的碎片一样 。 为了组装拼图 , 他们寻找末端相同的片段 , 这意味着它们来自基因组的重叠部分 。 他们花了数年时间将测序片段逐渐组装成更大的片段 。 白宫在 2000 年宣布 , 科学家们已经完成了人类基因组的初稿 , 并于次年公布了该项目的详细信息 。 但是很长一段基因组仍然未知 , 而科学家们则努力找出数百万其他碱基的归属 。
事实证明 , 基因组是一个很难从小块拼凑起来的难题 。 我们的许多基因以多个副本的形式存在 , 彼此几乎相同 。 有时不同的副本执行不同的工作 。 其他拷贝 , 被称为假基因 , 被突变禁用 。 来自一个基因的一小段 DNA 可能同样适合其他基因 。 基因只占基因组的一小部分 。 其余的可能更令人费解 。 大部分基因组由类似病毒的 DNA 片段组成 , 这些片段的存在主要是为了制造自己的新副本 , 然后重新插入基因组 。 在 2000 年代初期 , 科学家们在将基因组拼图从小块拼凑起来方面做得更好 。 他们制造了更多片段 , 更准确地阅读它们 , 并开发了新的计算机程序将它们组装成更大的基因组块 。 研究人员会定期公布最新、最好的人类基因组草图 , 称为参考基因组 。 科学家们使用参考基因组作为他们自己测序工作的指南 。 例如 , 临床遗传学家将通过将患者的基因与参考基因组进行比较来分类引起疾病的突变 。 最新的参考基因组于 2013 年问世 。 它比初稿好很多 , 但距离完成还有很长的路要走;其中百分之八是空白的 。
约翰霍普金斯大学的计算生物学家 Michael Schatz 说:“基本上有一条完整的人类染色体丢失了 。 ”
2019 年 , 两位科学家 , 马里兰州美国国家人类基因组研究所的计算生物学家 Adam Phillippy 和加州大学圣克鲁斯分校的遗传学家 Karen Miga成立了端粒到端粒联盟来完成基因组 。 菲利普承认 , 他进行如此大胆的项目的部分动机是缺少的空白让他很恼火 。 他说:“他们真的在烦我 。 你拿一个美丽的风景拼图 , 拿出一百块来看看 , 这对完美主义者来说很麻烦 。 ”他们在基因组中发现了超过 200 万个人们不同的新点菲利普和米加号召科学家加入他们的行列 , 共同完成这个谜题 。 他们最终有 99 人直接致力于对人类基因组进行测序 , 还有数十人参与以理解数据 。 研究人员在大流行期间远程工作 , 通过消息传递应用程序 Slack 协调他们的工作 。 米加说:“这是一个令人惊讶的好蚁群 。 ”该联盟利用了可以读取长达数万个碱基的 DNA 片段的新机器 。 研究人员还发明了一些技术来找出特别神秘的重复序列在基因组中的位置 。 总而言之 , 科学家们在参考基因组中添加或固定了超过 2 亿个碱基对 。 他们现在可以自信地说 , 人类基因组长有 30.5 亿个碱基对 。
推荐阅读
- 南极花草疯长,但这肯定不是好事!权威专家:气候真的在变暖了
- 流沙吞人,营救会将人扯两半吗?流沙真的可怕吗?科学家给出答案
- 漫威的“丧尸宇宙”原著中其实要更惨烈一些?连吞叔都没放过!
- 引力波到底是怎么产生的?科学界认为,宇宙中有三种天体能触发它
- 时间真的可以膨胀!时间膨胀现象已得到科学家的证实
- 将一粒沙子放大无数倍,会看到什么呢?仿佛进去另一个宇宙
- 爱因斯坦预言,这种昆虫灭亡后,人类将只剩4年光阴!是真的吗?
- 恐龙食物被发现!我国科学家证实翼龙食团的存在,网友:会涨价吗
- 黯淡太阳悖论: 年轻太阳很冷, 地球本该冻成冰墩墩, 可生命还是出现