中国科学家揭示蛋白结合靶序列的新机制


中国科学家揭示蛋白结合靶序列的新机制


文章图片


中国科学家揭示蛋白结合靶序列的新机制


文章图片


中国科学家揭示蛋白结合靶序列的新机制


文章图片


中国科学家揭示蛋白结合靶序列的新机制



挑战常规 , 是科学家的使命之一 。 近日 , 中国科学家毛冠中以共同作者身份发表在Science上的新论文 , 揭示DNA结合蛋白得以高效结合DNA靶序列的新机制 。

图|毛冠中(来源:毛冠中)
他表示:“该研究得出的实验结果和数学模型 , 挑战了一直以来教科书所描述的蛋白在基因调控过程中精确寻找并结合在基因组特定区域的机制 。 尽管DNA序列是蛋白搜索和蛋白结合的决定性因素 , 但并非因为特定序列而导致蛋白单次紧密结合的时间更长、以及脱离速度更缓慢 , 而是因为特定序列更容易被再次结合 。 ”
1月27日 , 相关论文以《DNA结合中的序列特异性主要受缔合控制》(SequencespecificityinDNAbindingismainlygovernedbyassociation)为题 , 发表在Science上[1


图|相关论文(来源:Science)
该论文的研究意义在于 , 针对转录调控的数百种蛋白运作机理 , 该成果提出了新的方向 。 这些蛋白直接关系到癌症研究、基于转录调控的新型药物的筛选和开发、遗传病早期发现与治疗、以及农作物性状调整与病虫害抵抗等 。
“人生苦短 , 而蛋白质尤甚”
研究中 , 毛冠中通过对微观尺度上的单分子DNA进行观察与动力学测算 , 结合蛋白质微阵列批量验证 , 获悉了以往用宏观生化手段无法观察到的分子缔合与脱离的动力学细节 。
基因组本身包含巨量的信息 , 其中的DNA序列长度非常可观 。 毛冠中指出 , 纳米级的碱基对组成的单个人体细胞DNA链总长度能达快一米 , 而人体全部DNA连接起来并把其拉直 , 甚至可以超出太阳系的范围 。 相比之下 , 这也为数并不算太多的DNA结合与搜索功能蛋白提出了巨大难题 。

(来源:Science)
人生苦短 , 而蛋白质尤甚 , 在一个堪比图书馆容量的信息库里 , 通常只有几个到十几个碱基对长度的单一指定信息片段 , 可以决定某项生理功能的激活或关闭 , 而且给予对应结合蛋白的搜索时间极其有限(微秒到数分钟) 。 如果想精确分辨每一个碱基对和它的周边组合 , 即使是996、007也永远无法完成工作 。 因此 , 必须选择更有效和更有弹性的搜索方式 。
这一方式的寻找要从2020年说起 , 毛冠中与所在实验室曾在Nature发表了一篇题为《目标搜索过程中的DNA表面探测与操纵基因片段跨越》(DNAsurfaceexplorationandoperatorbypassingduringtargetsearch)的论文[2

在那项研究中 , 他使用单分子观测手段 , 观察到了DNA结合蛋白LacI在序列搜索中的微观往复运动与跳跃 , 并测量出LacI可以略过任意一段DNA序列的概率 。
LacI以相当“粗糙”的方式搜索目标区域 , 并以此达到较高的搜索速度 , 但这样做的弊端是 , LacI以较高频率略过其原本目标区域 , 而无法做到每次遇到目标区域就精准结合 。 不过这样并不会降低总体的结合效率 , 因为LacI在搜寻过程中总是不断冗复访问同样的区域 。

(来源:Science)
解决问题的同时又提出了新问题 , 既然DNA序列的具体排列决定了它们是否会成为DNA结合蛋白的目标位点 , 那么在高速搜索时 , 那些与目标位点相似的序列 , 是否会成为“迷惑”蛋白的假靶子?从而导致蛋白长时间结合在序列相似的非目标区域?
毕竟在数以百万甚至更多的碱基对排列中 , 这是无法回避的问题 。
以往研究中 , 科学家在宏观动力学观察中发现 , 蛋白在其目标位点停留结合的时间 , 远长于任意非目标序列 , 因此得出结论 , DNA的具体排序决定了解离速率常数(koff) 。
但在毛冠中的最新论文中 , 他通过单分子共定位观测与计算发现:在微观尺度上 , 蛋白质与DNA的结合时间 , 并不会因为序列改变而改变 。 无论目标位点与否 , 结合上去的LacI蛋白都会迅速解离、并继续高速且往复的运动 。
那么特异性结合究竟如何实现的?一个简单的数学假设提出了挑战现有教科书理论的反直觉结论 , 但毛冠中了解缺乏坚实实验数据支持的假设模型是难以获取广泛认可的 。 于是通过观测结合速率 , 他发现蛋白在目标序列区域 , 有着远高于其他区域的结合效率 。 也就是说 , 虽然DNA结合蛋白会像在任意序列上那样快速解离目标序列 , 但却能在高速往复搜索运动时 , 轻易地再次结合在目标序列上 , 这在宏观测量上的直观体现就是长时间的特异性结合 。

推荐阅读