基因定位

来自医学百科

基因定位(mapping),基因所属连锁群或染色体以及基因在染色体上的位置的测定。它是遗传学研究中的一项基本工作;至于一个基因内部的突变位点的测定则一般称为基因精细结构分析。染色体基因定位方法多数也适用于染色体外遗传研究中的基因定位。

基因定位是遗传学研究中的重要环节。在遗传学的早期研究中并未发现果蝇生物的基因在染色体上的位置和生理功能有什么关系。但以后发现一些有类似表型效应的基因是紧密连锁的。例如1945年E.B.刘易斯在果蝇中发现与中胸发育有关的几个基因相邻接,构成一个复合座位或称基因复合体拟等位基因系列;1960年J.莫诺和F.雅各布报道大肠杆菌的与乳糖发酵有关的几个基因紧密连锁,构成一个操纵子。可见基因的位置并不是和它们的功能完全无关的,因此基因定位有助于了解基因的功能。此外,测定了某一基因在某一染色体上的位置以后,便可以用这一基因作为所属染色体或其一部分的标记,追踪并研究染色体的行为。例如通过分析大肠杆菌的接合过程中各个标记基因受体菌株中出现的先后次序,就有助于了解接合过程中染色体的行为(见细菌接合);在许多生物中根据杂交子代中各个标记基因的组合,可以研究染色体干涉、染色单体干涉和染色体畸变;在育种工作中也经常通过标记基因来识别染色体的替换。1913年C.B.布里奇斯首先在果蝇中通过 X染色体的不离开现象证实了白眼基因(white,w)是在X染色体上。同年A.H.斯特蒂文特根据两个基因之间的距离愈远则交换频率愈高这一假设,首先在果蝇中进行了基因定位工作。

基因所属连锁群或染色体的测定

系谱分析法  在早期的人类遗传学研究中,基因所属染色体的测定一般都通过系谱分析进行。由于女子有两个X染色体,男子有一个X染色体和一个Y染色体,Y染色体上不存在和 X染色体相应的等位基因(也就是说对于 X连锁基因来讲,男子是半合体)。因此男性患者的X连锁致病基因必然来自母亲,以后又必定传给女儿。这种遗传方式称为交叉遗传。如果在一个家系中外祖父是某种疾病的患者,母亲的表型是正常的,外孙中有半数是患者,就可以判断有关的隐性致病基因是在 X染色体上。色盲基因便是1911年通过系谱分析最早发现的人的性连锁基因。位置在X染色体上的性连锁基因称为X连锁基因。常染色体遗传也有它自己的系谱特点(见人类遗传性疾病)。根据系谱分析一般只能够判断基因属于性染色体常染色体,可是不能判断究竟属于哪一个常染色体。

非整倍体测交法  非整倍体测交法可以用来测定基因属于哪一个常染色体。用常染色体隐性突变型纯合体(a/a)和野生型二倍体(+/+)杂交,再用子一代杂合体(a/+)和隐性亲本回交,在它们的子代中表型是野生型的和表型是突变型的各占50%(见孟德尔定律)。

杂交  a/a  ×  +/+

回交     a/+   ×   a/a

回交子代   a/a      a/+

突变型     野生型

比例     1   ∶    1

如果常染色体隐性突变型纯合体和某一染色体的野生型三体 (+/+/+)品系(见染色体畸变)杂交,子一代中的三体个体再和隐性亲本回交,在它们的子代中野生型和突变型之比是5∶1而不是1∶1。

如果常染色体隐性突变型纯合体和某一染色体的野生型单体品系 (+)杂交,在子一代中就出现50%的突变型个体,而不是100%的野生型。

杂交   a/a  ×   +

子一代  a/+  ∶   a

野生型    突变型

比例   1   ∶   1

根据上述三种不同的杂交结果,可见只要具备相当于每一染色体的一系列三体和单体品系,便能从杂交子代的突变型和野生型的比数中判断任何一个突变基因所属的染色体。小麦多倍体植物,多倍体植物增加或减少一个染色体不会使它的生活力受到严重的影响,因此容易建立整套三体或单体品系,使基因定位工作得以顺利进行。除了小麦等植物以外,这一方法也用在酵母菌的遗传学研究中。

四分体分析法  由于子囊菌减数分裂所形成的四分体包被在一个子囊里,所以判断两个基因是否连锁,只需计算出各种类型的四分体数(即子囊数)。如果其中一个基因所属的连锁群已经知道,便很容易测定另一基因是否属于同一连锁群。

四分体有三种,即亲代二型(PD)、非亲代二型(NPD)和四型 (T)。如果有关的两个基因是连锁的,即PD是不交换或二线双交换的结果,NPD是四线双交换的结果,T是单交换或三线双交换的结果(见连锁和交换)。如果有关的两个基因是不连锁的,那么双基因杂交子代中所出现的四分体类型要看这两个基因各自和着丝粒之间是否发生交换而定。

根据这些关系,可以得到这样的规律:在双基因杂交子代的四分体类型中如果PD数大大地超出 NPD数而且T多而NPD少,那么这两个基因是连锁的,如果PD数和NPD数接近而且T少而NPD多,那么是不连锁的,一般把NPD/T的比值大于或小于1/4作为判断的标准。

连锁群法 

利用近着丝粒距离基因的定位法

如果某一染色体上有一个离着丝粒距离较近的已知基因,另外有一个基因同样离着丝粒很近,可是不知道它是否属于同一染色体。把这样两个突变型品系进行杂交,如果这两个基因属于同一染色体,它们之间的重组频率不应超过两者的着丝粒距离之和;如果它们不属于同一染色体,那么它们的重组频率应是50%(见连锁和交换)。由于这两个基因与着丝粒距离都是较近的,所以增加了这一判断的可靠性。用这一方法曾测得粗糙脉孢菌的连锁群数是7。

同线法

如果一个细胞得到或丢失一条染色体则将同时得到或失去这条染色体上的全部基因。如果其中某些基因是已知的,而另一连锁关系未知的基因恰恰和上述基因同时得到或失去,便可以判定后一基因和前一基因属于同一连锁群。

这一原理曾广泛应用于人的基因定位。仙台病毒聚乙二醇能促使人的体细胞啮齿类动物的体细胞相融合(见体细胞遗传学),融合细胞在有丝分裂过程中随机地丢失人的染色体。通过细胞学观察,特别是应用显带染色(见核型)方法,可以选出具有某个或某几个人染色体的融合细胞株,再经组织培养并测定其中是否出现待测基因的表型就可以判断待测基因所属的染色体。

假定有五个人-鼠融合细胞株 A、B、C、D、E,它们分别保留有人染色体1、2、3中的这一个或那一个,例如细胞株A保留染色体2,细胞株D保留1、2、3这三个染色体等。分别测定甲、乙、丙、丁四种表型,如某种酶的活性或某种抗原的存在与否等。已经知道这些特性都是小鼠细胞所没有的,从表2的结果可以看到任何一个细胞株只要测得(或不能测得)甲这一性状时必然同时可以测得(或不能测得)丙这一性状。这一结果说明这两种酶或抗原蛋白的基因属于同一染色体。其次可以看到任何一个细胞株凡是保留染色体 2的必然出现上述性状,可见上述两个基因都在人的2号染色体上。

单元化定位法

在构窠曲霉这一类真菌的准性生殖过程中,杂合二倍体细胞在有丝分裂时常随机地丢失它的染色体。染色体在多次有丝分裂过程中逐条丢失而使二倍体细胞终于转变为单倍体细胞的过程称为单元化。如果一对染色体中带有显性野生型基因染色体丢失了,那么同源染色体隐性基因的性状便得以表现。此外,通过体细胞交换也可以从杂合二倍体得到表现隐性性状的子代细胞。不过一次体细胞交换只能导致着丝粒一侧的隐性基因的性状得以表现,而同一染色体同时发生两次交换的概率极低,因此假如一个染色体的着丝粒两侧的隐性基因的性状都在一个子代细胞中表现,那就说明这是带有显性基因的染色体丢失的结果。另一个待测的隐性突变型如果同时得以表现,这就是它和已知基因有连锁关系的证据。

利用染色体易位的基因定位 

直接观察法

易位(见染色体畸变)使染色体上的基因改变连锁关系,所以易位可以用来进行基因定位。如果易位所涉及的染色体是可以被识别的,那就更有利于定位工作。如果在遗传学分析中发现某两个连锁群的连锁关系都发生了改变,同时在显微镜下又可以辨认出有两个染色体发生了相互易位,那么就可以知道两个连锁群和两个染色体的对应关系。例如遗传学分析的结果说明小鼠品系 T1380的相互易位涉及连锁群LGⅡ和LGⅨ。品系RB163H的相互易位涉及连锁群LGⅡ和LGⅫ。细胞学观察说明前者涉及染色体 9和17,后者涉及染色体9和19,因此知道连锁群 LGⅡ属于染色体9,连锁群LGⅨ属于染色体17,连锁群 LGⅫ属于染色体19。

某些生物的染色体具有天然的标记,例如果蝇的唾腺染色体具有容易辨认的横纹玉米的染色体有容易辨认的巨大的染色粒,所以通过直接的细胞学观察就可以辨认出易位所涉及的染色体,但是对于染色体数较多而又没有天然标记的生物,就需用显带技术鉴定染色体的易位。上述小鼠的连锁群所属的染色体便是应用显带技术鉴定的(见核型)。

假连锁法

相互易位杂合体只有在减数分裂过程中通过交互离开所形成的平衡配子才能够存活,并使非同源染色体上的基因显示假连锁现象(见染色体畸变)。所以把带有属于已知染色体的标记基因的相互易位品系作为测交品系和一个突变型品系杂交,如果发现这一突变基因经常和标记基因的野生型等位基因相连锁,就可以判定突变基因一定在相互易位的两个染色体中的一个上面。例如在粗糙脉孢菌中有一个品系(图1),它的第 Ⅰ染色体上带有白色分生孢子基因(albino,al),第Ⅳ 染色体上带有温度敏感的蔓延菌落基因(colonial temperature sensitive,cot),第Ⅵ染色体上带有黄色分生孢子基因(yellow conidia,ylo),同时它还是染色体Ⅰ-Ⅱ、Ⅳ-Ⅴ和Ⅲ-Ⅵ相互易位品系。用它作为测试菌株和任何一个突变型菌株进行杂交,就可以通过一次杂交大致上测得这一突变型所属的染色体。例如具有这一突变性状的杂交子代菌株总是菌丝蔓延的,就知道它的突变基因属于染色体Ⅳ或Ⅴ。又假如这个突变型和al、cot和ylo都没有连锁关系,那么由于粗糙脉孢菌只有7个染色体,就可以推测这一突变基因在染色体Ⅶ上。

基因在染色体上的位置的测定

根据重组频率的基因定位  同一染色体上两个基因之间的距离愈远,则发生交换的机会愈多,杂交子代中重组体也就愈多。所以测定杂交子代中重组体的多少,就可以知道有关的基因的距离,这是最基本的基因定位方法。A.H.斯特蒂文特把杂交子代中出现 1%重组体的两个基因之间的距离定为一个图距单位,后来又有人称之为一个分摩,用来纪念首先提出交换概念的T.H.摩尔根。同一原理也适用于单倍体微生物的基因定位。

三点测验

在包括两对基因的杂交中,一次杂交可以测定两个基因之间的距离,通过三次杂交便可以测定三个基因的排列顺序和距离。但是在包括三对基因的一次杂交中,便可以测定三个基因的排列顺序和距离,这就是1913年由斯特蒂文特首创的三点测验方法。例如黑腹果蝇的X染色体上有黄体基因(yellow body,y;野生型灰体,y+)、白眼基因(white eye, w;野生型红眼,w+)和短翅基因 (miniature wing,m;野生型长翅,m+)。将黄体、白眼、短翅雌和野生型雄蝇 (y+w+m+ 即+++)杂交,将得到的雌性杂合体 再和雄性子代ywm杂交,得到子二代个体(表3)。

从表中的数值求得:

基因y和w之间的重组频率=1.3%

基因w和m之间的重组频率=32.8%

基因y和m之间的重组频率

因此这三个基因在染色体上的相对位置如图2。三点测验或者包括更多的基因的杂交还可以用来研究交叉干涉、染色单体干涉等现象。

着丝粒距离法

一个基因与它所属染色体的着丝粒之间的距离称为着丝粒距离。在不同的生物中,可用不同的方法测定着丝粒距离。在粗糙脉孢菌中,着丝粒和基因之间的距离可以根据子囊中子囊孢子的排列顺序来测定,这是1932年美国微生物遗传学家 CC.林德格伦所首创的方法。在同一染色体上两个基因的着丝粒距离都被测定后,这两个基因之间的距离就可以断定为两者之和或者两者之差。

子囊的排列方式有 6种,AAaa和aaAA这两种称为第一次分裂分离,AaAa、aAaA、AaaA、aAAa这四种称为第二次分裂分离。前者基因A(a)和着丝粒之间没有发生交换,后者A(a)和着丝粒之间发生了交换。

所以某一基因和着丝粒之间交换频率愈高,第二次分裂分离子囊愈多。由于每次交换导致半数染色单体成为重组类型,所以

高等植物如小麦和棉花中,可以利用衍生的端着丝粒染色体进行着丝粒距离测定。例如某一雄性亲本除了有一个正常的具中央着丝粒的染色体以外,还有一个由它的同源染色体衍生来的端着丝粒染色体。如果在正常染色体上有一个待测着丝粒距离的隐性基因,在端着丝粒染色体上有野生型的等位基因,带有端着丝粒染色体的花粉缺少一条染色体臂,使它不能顺利受精,因此大部分受精的配子都带有隐性基因,即带有正常的染色体。只有待测基因和端着丝粒染色体基因之间发生了一次交换,才能得到具有显性野生型基因的配子。因此由这样的雄性亲本和纯合隐性的雌性亲本杂交子代中出现的野生型个体数便可推知交换发生的频率,从而求得隐性基因的着丝粒距离。

体细胞交换法

三点测验和着丝粒距离法中所测定的都是发生在减数分裂中的染色体交换。1936年美国遗传学家C.斯特恩在果蝇中发现体细胞在有丝分裂过程中也可以发生染色体交换(见连锁和交换)。

50年代中G.蓬泰科尔沃等在研究构窠曲霉时发展起来一种利用体细胞交换的系统的基因定位方法。在进行有丝分裂的杂合二倍体细胞中,体细胞交换会导致在子代体细胞中出现隐性基因的纯合体,这一过程称为纯合化。

如果某一个二倍体细胞的某一染色体臂上有若干个基因都呈杂合状态,那么就可根据子代体细胞各个基因纯合化的频率推知它们的相对位置。交换只使比交换位置更远离着丝粒的隐性基因纯合化,所以某个基因纯合化的频率愈高,它离着丝粒的距离就愈远(图3)。

由于体细胞交换频率远远低于减数分裂过程中的交换频率,所以这一方法一般只用于不进行有性生殖的生物如某些真菌等的基因定位。这一方法也曾在衣藻中用来进行叶绿体基因的定位。

根据所测基因在某一已知染色体区段中是否存在的 基因定位  如果染色体的某一区段的位置是已知的,而且测得某一基因的位置在这一区段中,那么这一基因的位置也就被测定了。

缺失定位法

一个细胞中的两个同源染色体中的一个上有一个突变基因,另一染色体上有一小段已知范围的缺失,如果这一突变基因的位置在缺失范围内,便不可能通过重组而得到野生型重组体;如果突变基因不在缺失范围内,那么就可以得到野生型重组体。利用一系列已知缺失位置和范围的缺失突变型,便能测定突变型基因的位置。

标记获救法

这是一种结合物理图谱制作和遗传学分析的基因定位方法,它适用于病毒等基因组较小的生物。以大肠杆菌噬菌体ΦX174为例,把野生型噬菌体的双链复制型 DNA分子限制性内切酶HindⅡ切为13个片段,把每种片段和突变型 amg的DNA单链在使DNA分子变性并复性的条件下混合保温,然后用各个样品分别转化受体细菌。如果在某一样品处理后的受体细菌中出现了大量的野生型噬菌体,于是就说明这一样品中的HindⅡ片段包含着amg的相应的野生型基因,由于13个HindⅡ片段的位置在物理图谱中全部都是已知的,因此便可以推知amg基因在染色体上的相应位置。用这一方法在ΦX174的环状的染色体图上已经测定了至少19个基因的位置。

根据并发事件的基因定位  位置邻近的基因表现某些相关的行为,所以从这些行为可以推测基因的连锁关系。

共转导法

每一种转导噬菌体有一定的大小,只能携带一定长度的供体细菌的 DNA。例如大肠杆菌噬菌体PI的头部中只能包装大约分子量为5.8×107的DNA,大肠杆菌的染色体DNA的分子量是2.5×109,所以PI所能包装的 DNA至多相当于大肠杆菌的遗传学图上相距两分钟这样一段DNA分子。如果两个基因能同时被转导,这两个基因之间的距离必然较近,而且距离愈近则共转导频率愈高,因此可以由共转导的频率来推算基因间的距离。

其中 d是以分钟计算的供体大肠杆菌两个基因之间的距离,L是以分钟计算的转导DNA的长度,取为两分钟。大肠杆菌遗传学图的大部分位置上的基因都曾用共转导方法定位,这样得来的遗传学图比用中断杂交方法或重组方法测得的图更为精确(见细菌接合)。

共缺失法

缺失带来和基因突变相同的表型。由一次缺失所造成的突变只涉及相邻接的基因,因此可以从缺失所带来的基因突变的分析来测定一些基因的相对位置,这一方法被广泛应用于酵母菌的线粒体基因的定位(见染色体外遗传)。

根据基因行为的定位  基因的某些行为可以反映它们的位置。在细菌接合过程中“雄性”细菌的染色体基因按先后顺序转移到“雌性”细菌中。一些基因组较小的病毒,整个基因组往往作为一个单位转录。因此接合过程中基因转移的先后、转录过程中转录的先后或DNA复制的先后都可以在某些特殊的生物中用来作为基因定位的手段。

中断杂交法

细菌接合

转录定位法

许多 RNA病毒的整个基因组往往作为一个单位转录。随着转录的进行,由基因组上各个基因所编码的蛋白质也依序在寄主细胞中出现。当寄主细胞被紫外线照射使本身的蛋白质合成受到抑制时,病毒蛋白的出现更为明显。紫外线照射也起着抑制病毒基因组的转录的作用。紫外线在 RNA分子的某一部位造成损伤后,损伤的部位和它后面的基因的转录都将受到影响,损伤部位以前的基因的转录则不受影响。因为转录沿负链RNA的3′端向5′端进行,所以愈是接近3′端的基因的转录和由它编码的蛋白质在寄主细胞中的合成受到紫外线损伤的影响愈小,而愈是接近 5′端的基因和相应的蛋白质的合成愈容易为紫外线照射所抑制。因此只要先用相同剂量的紫外线照射待测病毒,然后再测出寄主细胞中该病毒编码的各种蛋白质的产量,便可以推知该病毒各个基因的位置。

测定绝对位置的基因定位 

细胞学图

通过种种方法可以测得基因之间的距离,但图距并不表示绝对长度,而且在不同的生物中同一图距代表不同的实际长度。通过细胞遗传学的方法可以测定基因的实际位置,这样绘制的基因位置图称为细胞学图,而通过一般遗传学方法绘制的图则称为遗传学图。

在杂合的二倍体生物中,由于显性的野生型基因的存在,隐性的突变基因得不到表现。如果带有野生型基因的这一染色体发生了一个缺失,而缺失部分又正好包括这一野生型基因,那么同源染色体上相应的隐性基因的突变性状便得以表现(见染色体畸变)。果蝇具有便于观察染色体细微结构的唾腺染色体,它上面的横纹缺失可以在光学显微镜下识别。通过一系列的杂交,可以得到某一隐性突变基因和一系列的缺失染色体组合在一起的果蝇,对于这些杂合体果蝇进行染色体分析和性状观察,便可以判断某隐性突变基因在染色体上的真实位置。

从果蝇的X染色体上包括白色复眼(white eye,w)和小糙眼(facet,fa)区域的分析结果(图4)可以看到凡是缺失3C7这一横纹的杂合体都呈现小糙眼突变型性状,说明fa基因位置在唾腺染色体的3C7横纹处。

物理图谱

原核生物 DNA分子上缺乏天然的容易识别的标记,可用限制图谱和部分变性图的测定来弥补这一不足。

各种限制性核酸内切酶具有各自的识别顺序。这些识别顺序可以作为DNA部位的标记,用不同的限制酶处理同一DNA分子,通过对酶切产生的DNA片段的大小和位置的分析,可以绘制出某一 DNA分子的限制图谱。此外,每一个DNA分子上富含A∶T碱基对和富含 G嗈C碱基对的区域的分布各不相同。富含A∶T碱基对的区域比富含G嗈C碱基对的区域更易变性。所以在严格控制的变性条件下每一种 DNA分子具有变性环的特定分布形式,构成部分变性图。

分子杂交

分子杂交和体细胞遗传学相结合的方法也可以用来测定人的基因的绝对位置。用体细胞遗传学方法,可以得到只含有某一条人类染色体的人-仓鼠杂种细胞克隆。然后可以进一步取得这一人类染色体发生各种缺失的克隆。把从这一系列缺失克隆中提取出来的 DNA吸附在硝酸纤维素滤膜上。再把人的基因文库中的各个基因的 DNA片段用32P标记制成探针,然后用探针分别与膜上吸附的 DNA进行分子杂交测验,能杂交者表示它的缺失部分不包括这一基因。再结合染色体显带技术便可以测定这一基因在染色体上的绝对位置。缺失克隆的数目愈多,测定的位置就愈精确。

基因精细结构分析

重组频率定位法  原理和在高等动植物中用杂交子代中重组频率的高低来计算两个基因间的距离没有不同。不过在微生物中一个菌落或一个噬菌斑代表一个个体,因而便于通过大量的杂交子代的观察来进行精细结构分析;而且往往采用选择性培养方法淘汰没有发生重组的亲本,使分析的效率和精密度进一步提高。不过精细结构的重组频率容易受到突变位置本身的影响,这就是标记影响。

缺失定位法  原理和基因的缺失定位相同,不过需要具备种类更多而差别更为细微的缺失菌株。在大肠杆菌的 T4噬菌体中曾经获得一系列快速溶菌突变型rⅡ基因部分缺失突变型,利用这些突变型可以迅速测定任何一个 rⅡ点突变在rⅡ基因中的位置。图5中的每一编号标明的横线表示一个缺失突变型的缺失范围。定位分两步进行,首先测定大的范围,然后测定精确的位置。例如有一个点突变型和缺失突变型 A105和638能发生重组而和其余五个不发生重组,就可知它的位置在区域A5中,然后进一步利用A5中三个缺失突变型1605、1589、PB230进行更精确的定位(图5)。可见只要有足够多的缺失突变型,就可使位置测定得十分精确。这一方法在实际操作上很简单,因为只要观察有没有噬菌斑出现,而无须计算噬菌斑的数目。

共转导定位法  原理和基因的共转导定位也没有不同。共转导的精确性较好,而且所需要的只是一个转导噬菌体菌株,所以应用较广,尤期适用于测定一系列属于同一基因的点突变的相对位置。

体细胞重组定位法  原理相同于基因纯合化的定位方法。由于体细胞交换发生得较少,所以常用 X射线处理杂合体使之发生更多的体细胞交换。

基因转变的梯度定位法  一个基因内部的各个点突变的基因转变常呈梯度现象,即在这基因的一端发生基因转变的频率最高,在另一端则最低,在两端之间存在着一个转变频率的梯度。对于任何一个未知位置的点突变,可以通过基因转变频率的测定进行精细结构定位。这一方法的应用限于一次减数分裂产物包被在一个囊里面的子囊菌,而且限于影响子囊孢子颜色和形状的基因。

小结

基因定位既是遗传学研究的基本方法,又随着遗传学研究的不断深入而出现新的方法。长期以来基因定位工作离不开杂交试验,也离不开突变基因,但自从开展了分子遗传学的研究以后,便出现了不必通过杂交也不依赖于突变基因的基因定位方法,例如分子杂交定位等方法。可以预见,随着研究工作的深入,必将出现更为精确的基因定位方法。

参看