题记:这又是一个生物学领域的问题。重要性不言而喻,现在关于基因方面的研究会直接影响人类生活本身,你想想看,人和一头猪的基因个数几乎没有多大差别,但为什么人和猪的差别却这么大尼?现在我们就来扒这个问题。
3. 为什么人类的基因如此之少?Why Do Humans Have So Few Genes?
为了理解这个问题,咱首先得科普一下基因,如果你恰巧是个专业人士,就直接忽视概念,直接进入到第二段。
我们每一个人都是由几十万亿个细胞构成,而这一切却都开始于一个很小的细胞(几十个微米大小),都是从那个细胞逐渐分化发育而来。我们大家都很清楚自己长成什么样儿是爹妈给的,不是自己能控制得了的事情,你之所以发育成为一个帅哥的模样而不会长成猪头的形象那是因为那个细胞里有控制你发育成长的固有信息,这个信息不在别处就在细胞内的基因里,那基因到底是个啥?按通常的套路来讲,是这样的:人体细胞里有个细胞核,细胞核里有一种形态呈丝状的染色体(就是它很容易被染色,地球人都知道人体细胞核内有23对染色体,其中最后一对长的形状为XY和XX的染色体决定了你是男还是女的人生角色),而这些染色体主要由两种物质组成:DNA(脱氧核糖核酸的英文缩写)和蛋白质。看上面来自维基百科的图1,你把这个DNA拉开放大你会发现它是一个具有双螺旋结构的聚合物分子链。在这个长长的分子链条上根据控制生物个体的不同性状可以把这个链分割成一段一段的片段,这每一段就称为一个基因(顺便复习一下外显子和内含子的概念)。所以一段具有某种功能性的DNA序列组成了基本的遗传单位:基因。右图是一个基因的片段,我们可以看到双螺旋骨架(2个多纳米宽)中分布着密码一样排列着的碱基对序列,这里就保存着不同生物体到底长成什么样的信息,这些不同的基因通过其控制合成的蛋白质去表达它所控制的生物体的某种性状。那么对人类而言这种不同基因的数目,就构成了本问题所要表达的意思:为什么人类的基因个数这么少?
大约在公元1990年底,科学家面对人类基因中30亿个碱基对组成的核苷酸序列,满怀期待地开始了所谓的人类基因组计划。这个计划被认为是一项规模宏大的跨国跨学科的系统工程。截止到2005年,人类基因组计划的测序工作基本完成,但结果却大大出乎人们的预料,当初认为支配人类这么复杂机体功能的基因数目应该至少需要10万个,但结果是人类只有2.5万个基因,而这个数目和一种芥草(见下左图,这是第一个得到基因序列的草本植物)的数目相当,而稍微多于一种长约1毫米的线虫的基因数目(下图)!
这个奇怪而令人“失望”的结果让基因科学家们认识到,其实基因的表达过程并非像人们想象的那样简单:一种基因就对应一种蛋白质的合成,而真实的情况是许多基因可以合成不只一种以上的蛋白质,甚至这些的不同的基因可能还会通过相互组合生成更多种类型的蛋白质。在基因密码破解的过程中,并非只有基因本身是决定性的,染色体中那些调节蛋白以及RNA和DNA中那些没有编码的片段是和基因一起来共同决定在什么时候、在什么位置上对基因进行表达,甚至染色体本身的化学成分和结构变化都会参与到基因的蛋白质表达过程中来。所以现在的问题变成了:这些所有的因素到底怎样互相配合、协同工作去完成对基因中信息的表达?这似乎成了今天生物学家面临的挑战之一。
在过去的若干年里头,一个被称为可选择性剪切的基因表达过程的发现似乎可以解释为什么很少的基因信息可以制造出多种不同的蛋白质。看看上图就一目了然,DNA链上的密码,首先要被RNA复制出来,图中带颜色的段落是一个个基因中的外显子(就是有编码的部分)。选择性剪切(alternative splicing)就是RNA可以通过缩减内含子把不同的外显子组合起来形成不同的信使RNA(mRNA),然后在不同的mRNA的控制下合成不同的蛋白质分子。这种对不同基因外显子的不同缩并组合会在不同的时间被激活,从而产生不同的蛋白质分子。选择性基因表达过程不同于直接的常规表达,开始被认为是种稀有的偶然过程,但后来发现其几乎占了基因表达的一半(有些人认为基因信息的表达全都是选择性剪切的模式)。无论如何这似乎可以解释人体这么少的基因为什么可以合成成千上万种不同的蛋白质。但问题又出现了,那就是在特定的时候基因转录过程中mRNA怎么决定如何组合,是随机选择的还是存在某种选择性开启或关闭的机制?答案当然是存在开启和关闭(激活和抑制状态)的机制,但问题是How?
虽然大家都知道每一段基因的表达过程一定是在成百上千的单元相互配合才能完成的,但这项看似简单的集体活动要在分子层次有秩序地进行并不是一件简单的事情,或者某段基因信息的表达如何在特定的时候在基因剪切中关闭或开启?研究人员发现某些蛋白质可以间接承担关闭或开启某段基因的工作,比如它可以在DNA上通过增加乙酰基或甲基组来达到关闭或开启基因表达的目的。而另一类被称为转录因子的蛋白质则可以直接和基因相互作用,这些蛋白通过直接的分子间相互作用可以准确定位结合在基因的某个位置,从而控制该基因的表达或不表达,当然这还是无法说明这些复杂的操控方式在怎样的协同配合中有序进行!
然而在充满环境热噪声的微观环境中,分子水平的结构都会做永无停歇的无规则的热运动,包括分子的抖动和组成分子链或原子的振动,因此在这样的环境下如何进行有序的基因信息的转录工作是一项让人不可想象的事情。首先第一个要解决的问题是怎么让基因或染色质保持稳定的结构和某种形状以便基因表达的顺利进行。如上图所示(从左到右是不断放大的结构),我们可以看到细胞染色体宏观呈现X(或Y)形状,这个形状为什么不会因为染色体剧烈无规则的热运动而散掉?放大染色体,会发现组成染色体的各级分子结构(如上图所示),这些相对固定的结构都不会因为剧烈的热运动而变得松散,这些结构的保持不仅仅是因为分子间的所谓范德瓦尔斯力的作用,主要是得益于结构蛋白的骨架作用。在过去的十几年期间,研究人员开始逐渐认识到这种骨架作用的染色质蛋白和RNA在基因表达中的重要作用。染色质蛋白其实对DNA来说起到了封装的作用,它让染色体保持非常规则螺旋状结构。通过适当改变染色体的结构,可以让基因的不同部分暴露在基因转录过程里,从而实现不同部分信息的依次表达。
另一方面,基因在表达中会和RNA同步振动,也就是会随着RNA的节奏进行协同动作。一个非常小(小于30个基片组成)的小RNA分子(非编码的RNA)可以和其他的协调基因一起共同行动,这种奇怪的现象使得很多热衷于研究信使RNA或大分子RNA的研究人员开始把兴趣转向研究小的RNA分子,包括MicroRNA和snRNA等等。这些RNA的变种在基因表达中可以通过关闭或打开某种状态来改变基因的表达过程,从而实现基因信息指挥下生成不同的蛋白质而产生细胞的分化和不同组织的形成,但其中的机制目前还不十分清楚。
由此可见,基因信息的不同表达会形成不同的蛋白质从而形成不同的组织器官本身是一件非常复杂的过程,人类通过基因组计划在对生物的体基因的分析和分类的过程中虽然没有弄清楚基因选择剪切表达的细节过程,但已经基本定位了基因的调控区域并深入揭示了基因剪切表达的演化过程。通过对老鼠基因调控区的切除或添加,科研人员可以以此来调控RNA,从而来研究调控区的工作机制,当然目前无论实验和计算机模拟上都远远没有解决一个核心的问题,那就是:发源于同一段基因载体分子的我们是如何形成一个复杂个体的,也就是说存在于染色体中的我们人体的基因片段,在表达过程中不同的生物分子(如不同的RNA、蛋白质等等)是如何协同工作,形成成千上万不同的蛋白质,从而最终形成我们身体内不同的组织和器官,继而形成了我们的整体?(ELIZABETH PENNISI)
出处:https://blog.sciencenet.cn/blog-318012-887073.html
文章评论