DOI QR코드

DOI QR Code

An Overview for Molecular Markers in Plants

식물에서 분자 마커의 동향

  • Huh, Man Kyu (Department of Molecular Biology, Dong-eui University)
  • 허만규 (동의대학교 분자생물학과)
  • Received : 2015.06.29
  • Accepted : 2015.07.22
  • Published : 2015.07.30

Abstract

A molecular marker is a molecule contained within a sample taken from an organism or other matter. The development of molecular techniques for genetic analysis has led to a great contribution to our knowledge of plant genetics and our understanding of the structure and behavior of various genomes in plants. Recently, functional molecular markers have been developed to detect the presence of major genes from the analysis of pedigreed data in absence of molecular information. DNA markers have developed into many systems based on different polymorphism-detecting techniques or methods such as RFLP, AFLP, RAPD, SSR, SNP, etc. A new class of very useful DNA markers called genic molecular markers utilizing the ever-increasing archives of gene sequence information being accumulated under the EST sequencing projects on a large number of plant species. Functional markers are derived from polymorphic sequences, and are more likely to be involved in phenotypic trait variation. Based on this conceptual framework, the marker systems discussed below are all (gene)-targeted markers, which have the potential to become functional. These markers being part of the cDNA/EST-sequences, are expected to represent the functional component of the genome i.e., gene(s), in contrast to all other random DNA based markers that are developed/generated from the anonymous genomic DNA sequences/domains irrespective of their genic content/information. Especially I sited Poczai et al’ reviews, advances in plant gene-targeted and functional markers. Their reviews may be some useful information to study molecular markers in plants.

분자 마커는 유기체에서 다른 유기체와 분자적 수준에서 식별하는 마커이다. 유전적 분석을 위한 분자 마커의 발달은 식물 유전학, 다양한 구조와 가능을 이해하는데 기여하였다. DNA 마커는 임의유전자 증폭에서 다형성을 탐지하는 기법이나 방법(예를 들면 서든 블로팅, 핵산 교잡법, PCR을 이용한 중합효소 연쇄 증폭 반응, DNA 서열화)으로 RFLP, AFLP, RAPD, SSR, SNP 등을 이용하였고 현재에도 이용하고 있다. 최근 기능성 유전자를 이용한 기능성 마커가 각광을 받고 있다. 기능성 마커는 다형성 서열에서 유래한 것으로 표현형 변이를 내포하고 있다. 이런 개념에서 출발한 기능성 마커는 모든 유전자를 타깃으로 할 수 있으나 식물에서는 P450, 튜블린 형성 유전자의 다형성(TBPs), 전이요소 마커(TEMs), 병원균 저항성 유전자 마커(RGMs), RNA를 기반으로 한 마커(RBMs) 등이 널리 이용되고 있다. 본 연구는 Poczai 등의 총설을 기반으로 구성하였다. 식물에서 이런 분자 마커의 이용은 식물의 분화, 진화, 생리적 기능성 유전자의 변화 등 생물학 전반에 관한 정보 획득에 도움을 될 것이다.

Keywords

서 론

분자 마커는 분자수준에서 두 개체간 구별해 낼 수 있는 마커 시스템이다. 1970년대 초반부터 여러 분자 마커가 개발되어 분류군간 식별, 유전자 빈도를 활용한 집단유전학 연구, 생물 종 다양성 연구, 생물체 내 유전자의 특성과 기능을 규명하는 분야 등으로 그 적용분야를 확대하고 있다. 초창기에는 단백질이 분자 마커로 이용되었는데 특히 생화학적 마커로 아이소자임(isozyme 또는 isoenzyme)이 널리 이용되었다. 효소는 유전자의 산물로 전기영동 시스템에서 분자의 전하와 크기에 따라 밴드를 나타내어 이를 탐지할 수 있었다. 그러나 발현량이 너무 적고 조직 또는 발생단계에 따라 발현 차이가 있어 한계가 있었다. 이런 문제점을 극복하기 위해 유전체 내 안정된 구조를 가진 DNA 관련 마커들이 등장하게 되었다 [25].

DNA 마커로는 random amplified polymorphic DNA (RAPD), inter-simple sequence repeat (ISSR), amplified fragment length polymorphism (AFLP) 등이 효시로 널리 사용되기 시작하였다[25, 29, 31]. 이런 마커는 비용이 적게 들며, 간편하고, 시발체에 대한 정보가 불필요하고, 그럼에도 불구하고 많은 정보를 주어 다형성 탐지, 종간 구분, 진화계통도 정립 등 크게 기여하였다. 2000년에 접어들어 기능성 유전체 연구의 중요성이 증대됨에 따라 임의 증폭 마커에서 기능성 유전자 마커로 옮겨가기 시작하였다. 따라서 유전자를 타깃으로 하는 분자 마커들이 개발되기 시작하였는데 sequence related amplified polymorphism (SRAP), target region amplification polymorphism (TRAP), conserved region amplification polymorphism (CoRAP), start codon targeted polymorphism (SCoT), conserved DNA-derived polymorphism (CDDP) 등이 있다[7, 8, 13, 19, 26]. 이런 분자 마커 하나가 모든 경우에 적용되지는 못하므로 여러 마커를 조합하여 사용하기도 한다. 다음은 Poczai 등[22]의 Advances in plant gene-targeted and functional markers: a review 논문을 중심으로 식물에서 분자 마커를 소개한다.

 

본 론

임의 증폭 DNA 마커

Arbitrarily amplified DNA markers (AADs)에 앞서 개발된 마커로 제한효소 절편길이 다형성 (restriction fragment length polymorphism, RFLP)가 있다. 이 마커는 상동 DNA분자를 같은 제한효소로 처리하면 제한효소 자리가 다름 염기로 되어 절단 부위가 다르거나 절단 자리 중간에 염기의 삽입, 결실, 중복 등으로 길이가 다르게 나올 수도 있는 점을 이용한 것이다. 이 마커는 DNA서열의 다형성을 알아내는 유전자 표지자로도 쓰이는데 그 이유는 한 대립인자의 제한효소자리에는 염기가 정상이어서 잘릴 수 있지만, 다른 대립인자는 서열이 바뀌게 되어 잘리지 않게 되기 때문이다. 절단된 DNA 분절은 전기영동을 통해서 확인할 수 있다. 제한효소 절편길이 다형성은 유전체 지도의 작성에 중요했을 뿐만 아니라, 질병의 유전자 검사, 지문 확인, 친자확인 등에 사용되는 기술이다.

PCR과 관계있는 마커로 RAPD, ISSR, ADP, SSR 등이 있다. 이들 마커는 single-locus 방법으로 분석된다. RAPD (Random Amplified Polymorphic DNA Polymerase Chain Reaction)는 Williams 등[29]에 의해서 처음 보고 되었다. 이 마커는 생물학 전반에 걸쳐 크게 기여하였으나 일부 재현성 문제가 끊임없이 제기되어 다른 분자적 마커로 대체되고 있으나 편리함 등으로 현재에도 사용되고 있다. RAPD는 DNA 염기상의 점 돌연변이(point mutation) 또는 재배치의 결과로 나타난다. RAPD는 우성 마커(marker)로서 환경이나 식물의 발달단계에 덜 민감하므로 약간의 재현성이 문제를 안고 있지만 그 기법이 매우 간편하여 종간동정이나 속(Genus)이나 과(Family) 수준이상의 상위 분류군에서는 확실히 우수한 마커이다.

Amplified restriction fragment polymorphism (AFLP)는 fingerprinting genomic DNA의 일종으로 Vos 등[25]에 의해 개발 되어 1997년부터 본격적으로 이 기법을 이용한 논문이 보고되고 있다[14]. DNA 절편 다형 기법으로 RAPD와 RFLP 방법을 결합시킨 것이다. 즉 DNA 일부를 증폭시켜 그 DNA는 제한효소로 절단한다. 이중가닥 DNA adapter는 주형 DNA 끝에다 붙인다. adaptor서열과 인접 restriction site 는 증폭에 쓰인다. 그리고 선택된 핵산은 분절로 신장시 PCR Primer 3’end 에 부착시킨다. 증폭된 제한효소 분절을 전기영동으로 분리한다(Fig. 1).

Fig. 1.AFLP fingerprint for nucleotide sequences of AmR1 clone [14]. SAmR1-F and SAmR1-R primer sequences for a SCAR marker are underlined.

RFLP (restriction fragment length polymorphism)는 1980년 Bostein 등[3]이 개발하였다. 이 방법은 제한효소로 절단하였을 때 절단되는 부위의 길이가 차이가 나는 것을 이용한 것이다. 식물체 유전체에서 단일 염기쌍의 변이는 상당히 빈번하여 많은 다형성을 얻을 수 있다. 이런 점 돌연변이는 제한효소가 인지하는 염기서열에 발생하여 제한효소의 인지부위가 새로 생성되거나 또는 현존하는 제한효소 인지부위가 소실되어 제한효소에 의한 DNA의 절편양상이 달라지고 이것은 전기영동을 통하여 쉽게 감지될 수 있는 것이다.

한편 minisatellite fingerprints and microsatellites 또는 simple sequence repeats (SSR)은 직렬 반복되는 DNA motifs에 관한 서열을 시발체로 증폭하는 것이다[12]. intersimple sequence repeat (ISSR)는 microsatellite loci들의 반복 서열부위를 증폭하는 것으로 SSR과 유사하다.

이런 마커들의 단점은 분절 크기가 동일하면 같은 지점에 하나로 나타난다는 점, 같은 거리로 이동한 밴드가 orthologous보다 paralogous, 밴드 중첩, heteroplux 형성, 독립된 locus의 밴드들이 한 lane으로 이동하여 발생하는 문제점, 공우성 또는 nested priming일 경우 한 개 이상의 밴드를 형성한다는 점, 오독 등이 있다. 이런 각 마커들은 단점을 극복하기 위해 여러 대안을 강구하고 있다. 현재에도 AADs에 의한 방법은 간편성 등으로 널리 이용되고 있다(Fig. 2).

Fig. 2.Percentages of studies utilizing different types of molecular markers. The chart was based on an informal literature search performed with Google Scholar on 22.08.2012 resulting in 1032570 hits and modified on Poczai et al’ reviews [22]. Abbreviations are according to acronyms found in the text: AAD–Arbitrarily amplified DNA markers, including AFLP, ISSR, RAPD, and other modified but similar methods mentioned in the text; CDM – conserved DNA based markers, including CDDP, PBA, TBP, ITP (all modified methods are cited in the text); TEM – transposable element based markers including IRAP, REMAP, ISAP, iPBS and SSAP. RGM – resistance-gene based markers (RGAP), NBS profiling; RBM – RNA-based markers, iSNAP, EST- and cDNA- based markers; TFM – targeted fingerprinting markers (DALP, PAAP, SRAP, TRAP, CoRAP and SCoT).

유전자를 타깃으로 하는 기능성 마커

유전자 타깃 마커(gene-targeted and functional markers, GTMs 또는 FMs)는 임의 우성 마커(AADs)와 기능성 또는 유전자 타깃 마커의 중요한 차이는 발생시키는 방법을 취한다. 일반적으로 분자 마커는 다양한 길이 변이를 가진 시발체로 다형성을 보이는 어떤 DNA의 가닥 또는 타깃 DNA에서 유도된다. 그런데 중립성 마커를 이용하는 경우 대부분 단순 재조합에 의한 것은 효력이 없게 된다. 즉, non-target의 증폭물은 유전체의 전사부위 또는 비전사부위이며 기능의 정보 없이는 증폭될 수 있다. 구조와 기능 유전체 연구 프로젝트가 감자(Solanum tuberosum L.), 콩(Glycine max (L.) Merr.), 독보리(Lolium perenne L.), 옥수수(Zea mays L.) 등 여러 식물 종에서 연구되었다. 이들 식물에서 표현형 변이에 영향을 미치는 유전자 내 다형성 자리로부터 유도된 타깃 마커가 계통학적 발달에 대한 추가적인 정보를 얻게 되었다. 유전자 타깃 마커(gene-targeted markers, GTM)와 기능성 마커(functional markers, FM)는 차이가 있는데 모든 GTM은 표현형 형질 변이에 포함하는 것은 아니기 때문에 기능성이 될 수 없다. GTM 발현된 서열 tag의 미전사부위 tag가 될 수 있다. FM은 다형성 서열로부터 유도되고 표현형 형질 변이에 포함될 수 있다. 이런 개념에 근거하여 마커 시스템은 기능성이 될 수 있는 잠정성을 띠며 최근 새로운 마커들이 속속 개발되고 있다(Table 1).

Table 1.Summary table of marker systems and groups by Poczai et al. [22]

Conserved DNA and gene family based markers (CDMs)

연구목적에 따라 다르겠지만 비기능성 마커보다 기능성 마커가 선호된다. 비기능성 마커도 많이 적용되고 있는데 SSR에 근거한 재배종 동정과 분류학에서 비기능성 엽록체 DNA의 이용을 그 예로 들 수 있다. 느리게 진화하는 DNA 부위나 SSR같이 빠르게 진화하는 것이 문제가 될 때 마커에 근거한 보존된 DNA나 유전자 family는 좋은 선택이 될 수 있다. 이런 family에 속하는 마커는 gene-targeted markers (GTMs)의 특별한 그룹으로 식물 유전자나 gene family에서 분포가 다른 exon-intron구조의 길이 다형을 이용한 것이다. 이런 기법은 타깃 유전자(family)의 임의 분포로부터 얻은 multi-locus 마커를 얻을 수 있는데 길이 변이도 있고 기능과 표현형에 관련된 기능 정보도 얻을 수 있다. 식물 유전체에는 많은 유전자-family가 있어 다음에 기술되는 여러 타깃에 관한 방법이 고안되어 있다.

Conserved DNA-derived polymorphism (CDDP)

보존 유전자, 이상적으로는 유전자 family가 되겠지만 식물 유전체에 많은 복사본이 존재한다. Collard와 Mackill [7]이 고안한 것으로 짧은 시발체로 복사본을 증폭할 수 있다. 특징적인 식물 유전자의 기능성 도메인은 생식질 유전적 다양성, 유전자 지도, 형질 특성을 나타내는 정보적 밴드 양상을 얻을 수 있다. 잘 보존된 일반적인 기능성 유전자, 예를 들면 호메오박스(KNOX), 오옥신 결합 단백질(ABPI)을 암호화하고 있는 유전자를 증폭하기 위해 특별한 시발체가 디자인되어있다. 식물 유전체에서 많은 보존된 유전자 부위와 유전자 family는 이런 기법을 통해 추적할 수 있다. CDDP는 식물 표현형과 관련된 기능성 마커(FM)로 쉽게 작동할 수 있다. 보존된 DNA 부위는 같은 증폭이 시작되는 자리를 공유하지만 유전체의 분포에 따라 차이가 있어 길이 다형을 쉽게 탐지할 수 있다. 이런 기법은 높은 annealing온도를 가진 하나의 긴 시발체(15~19 bp) 증폭이 가능하며 재현성이 높다.

Cytochrome P450 based analogues (PBA)

Yamanaka 등이 개발한 기법으로 치토크롬 P450 based analog(PBA) 마커로 역시 잘 보전되어 있고 식물 유전체 family에 널리 내재되어 있어 다형성 추구에 쓰인다(Fig. 3). P450 효소들은 식물뿐만 아니라 박테리아, 심지어 동물에서도 발견되어 자연계의 거의 모든 생물종에 발견되며 대략 45,000~60,000 Da 정도의 분자량을 갖는 heme-containing protein이다. 이 효소는 배발생, 2차 대사물 합성에 중요한 기능을 수행함으로 기능성 연구에 널리 쓰인다. 모델식물인 애기장대, Arabidopsis thaliana (L.) Heynh에서 Cyt P450 유전자 유래 시발체가 디자인되어 유전적 마커로 널리 쓰이고 있다.

Fig. 3.Schematic representation of conserved DNA and gene family based markers by Poczai et al. [22]. Boxes represent exons and solid black lines introns, while intergenic regions are indicated by dashed lines. Arrows are primers used for amplification in each technique. A) The cytochrome P450 Based Analogue (PBA) marker system is based on the amplification of Cyt P450 regions in plants with universal primers designed in CYP or heme-binding sites. B) Representation of the transcribed region of a typical plant β-tubulin gene, showing specific amplification with TBP (red arrows), cTBP (black arrows) and hTBP (green arrows). C) Outline of intron-targeting markers with primers flanking the exon regions.

Tubulin based polymorphism (TBP)

식물에서 튜블린 합성은 α와 β-튜블린 유전자 family에 근거한 것으로 마이크로튜브 형성에 관여하는 2개의 폴리펩티드 블록을 암호화하는 유전자이다. 식물에서 β-튜블린 유전자는 전형적인 보존 서열로 2개의 인트론이 삽입되어 있는데 옥수수에서는 그 중 두 번째 인터론이 결실되어 있다. 이들 인트론은 식물에서 튜블린 유전자 발현에 중요한 역할을 한다. 이들 부위에서 다형성은 유전적 다양성, 육종에서 품종 간 식별, 진핵생물의 진화에도 중요하다. Tubulin Based Polymorphism(TBP)는 인트론에서 길이 다형성을 보이며 132 아미노산을 가진 β-튜블린 exon의 보존 부위를 증폭하는 시발체가 디자인되어 있다. 식물에서 β-튜블린에 대한 마커는 Bardini 등[2]이 개발하였다.

Intron-targeting polymorphism (ITP)

인트론은 moderate 서열 진화에 기인하여 다형성의 원천으로 오랫동안 간주되어 왔으며 유전자 지도 작성에도 사용되어 왔다. 인트론 내 삽입-결실 (indel)은 많은 식물 분류군에서 중요한 유전적 마커이다. 기본적인 접근은 Weining와 Langridge[28]에 의해 기술된 것처럼 intron-targeting (IT)와 intron splice junction (ISJ) 시발체를 사용한다. 인트론 길이 다형성의 초기 연구는 α-amylase 유전자 family에서 이루어졌다.

보존 DNA 근거한 마커의 이용과 한계

분자 마커의 적용에 있어 선택 기준은 속도, 비용, 재현성, 얻어지는 양과 질(정보) 등이다. 이런 관점에서 보면 AAD 마커가 매우 유용하다.

디자인 된 시발체로 증폭된 보존 서열의 크기는 높은 변이가 있다. 따라서 낮은 분류군 수준에서 동정에 유익하다. 보존된 DNA 마커는 종간 다양도 측정과 종내/종간 변이를 탐지할 수 있다. 멘델 법칙에 따라고 집단 연구에도 좋다. 또한 보존된 DNA 마커는 재현성과 신뢰성이 높고 시발체에 대한 정보가 불필요하며 universal 시발체가 있어 다른 종에도 사용할 수 있다.

유전자좌위 특이성 관점에서 보존된 DNA에 근거한 시발체를 사용하여 PCR산물로부터 얻은 결과는 타깃 유전자의 증폭뿐만 아니라 조사한 유전자 family의 상동성이 있음을 알게 되었다. 이에 대한 연구로 Galasso 등[10]은 수많은 TBP분절을 클론하였고, Cernák 등[6]은 제한효소 절단으로 타깃 인트론의 증폭물을 얻었고, Yamanaka 등[30]은 PBA마커로 식물 P450 유전자의 연관성을 연구하였다. 이런 연구들은 CDDP 마커로는 얻을 수 없다. 특히 큰 유전자-family를 타깃으로 할 경우 이런 결과들은 매우 유용하다. 밴드의 homology가 핵심적일 때 문제가 있지만 타깃 또는 예상된 유전자에 관한 다른 분절은 기능성 마커 연구에 여전히 유용하다.

유전적 변이의 한계로 보전 DNA의 단점은 inbred 식물에서 변이의 탐지를 기대할 수 없다. 이 기법이 다른 유전자나 유전자 family에는 적합해도 제한된 유전적 다양도에 근거한 재배종 등에는 적용하기 어려워 기법의 확산에 병목을 가져왔다. 또 다른 단점으로는 일부 마커는 타깃 유전자 또는 관련된 부위에 정확하게 일치하지 않는다는 점이다. 이를 타개하는 방법으로 PBAs같이 높은 변이를 지닌 부위를 선택하면 된다.

증폭물의 분리 문제로 유전자 부위에 따라 밴드 양상이 높은 변이를 가지면 많은 PCR생성물로 인해 정확한 크기를 탐지하기 어렵다. 이는 다형성 밴드는 유사한 조건이면 증폭이 되기 때문이다. 따라서 PCR조건이 중요시된다. 또한 hetero-duplex에서 생성된 증폭물도 문제가 된다. 이런 예는 감자에서 Cat-In2 대립유전자 좌위가 Ry-sto 유전자에 연관되어 있어 heteroduplex가 발생한 경우에서 찾을 수 있다.

Transposable element based markers (TEMs)

Barbara McClintock [20]가 발견한 전이요소(transposable elements, TE)는 유전체의 위치를 변경시킨다. TE의 특성에 근거하여 두 부류로 나눌 수 있는데 Class I (retrotransposons)은 흔히 ‘copy-and -paste’요소라 부르며 Class II (DNA transposons)는 ‘cut-and-paste’ 요소라 부른다. Class I요소는 RNA를 매개로 새로운 복사본을 만들지만 Class II 요소는 RNA가 불필요하며 유전체 내 다른 자리로 이동한다. 진핵세포에서 miniature inverted repeat transposable elements (MITEs) 같은 많은 TE를 발견하였다. 특히 Class I는 시발체의 디자인과 관련하여 특이적 특징이 있어 훌륭한 분자 마커로 이용되고 있다. 그 예로 long terminal repeats (LTRs)은 단백질을 암호화하고 있지 않은 전사를 위한 프로모터와 종결자로 시발체로 좋은 부위를 제공한다(Fig. 4).

Fig. 4.Structure of a plant Ty1-copia retrotransposon, which contains two long terminal repeat (LTR) elements at either end (red boxes) surrounded by short inverted repeats (black arrows) by Poczai et al. [22]. The LTRs contain elements U3, R and U5 for transcription initiation and termination. The primer binding site (PBS) and polypurine tract (PPT) are priming sites for reverse transcription (solid black lines). The PBS also matches a limited set of tRNAs. The universal 5’TG end and the CA 3’ terminus adjacent to the PBS are shown as small black boxes. The internal domain consists of gag and pol regions. The gag region encodes capsid-like proteins (CP) and has a nucleic acid binding moiety (NA). The pol region encodes protease (PR), integrase (INT), reverse transcriptase (RT) and RNase-H.

Inter-retrotransposon amplified polymorphism (IRAP)

IRAP와 REMAP는 전이요소에 근거한 마커로 Kalendar 등[16]이 DNA지문을 위해 고안하였다. 이 두 마커가 지향하는 타깃은 retrotransposon으로 약 100~500 bp의 변이부를 가진 long terminal repeats (LTRs)을 포함하고 있다. IRAP는 두 LTR 서열 사이의 DNA 분절을 증폭한다.

Retrotransposon-microsatellite amplified polymorphism (REMAP)

REMAP는 simple sequence repeat (SSR)와 LTR 서열 사이를 증폭한다. 특별히 디자인된 시발체가 쓰이는데 예를 들면 (CA)n, (GA)n 같은 단순 반복서열에 5’ 또는 3’ 말단에 C(CA)n, (GA)nG 등을 추가한다. 이 마커는 ISSR의 변형으로 anchor된 ISSR에 IPAP 시발체가 연결되어 있다. IRAP와 REMAP는 독자적으로 또는 연합하여 사용한다.

Inter-SINE amplified polymorphism (ISAP)

Seibt 등[23]이 고안한 마커로 LTR 모티브가 결여된 retrotransposon에 근거하고 있다. 최근 감자에 디자인된 short interspersed element (SINE)로 6500 복사본을 발견하였다. ISAP는 인접한 SINE 요소 사이의 서열을 증폭한다. 재현성이 높고, 상동성이 있고, 높은 특이성이 있으나 식물 유전학에서는 아직 널리 사용되지 못하고 있다.

Inter-primer binding site (iPBS) amplification

분자 마커로 retrotransposon을 이용하기 위해서는 제한 요소 중의 하나는 LTR서열을 알아야 한다는 점이다. 선행 정보가 없다면 LTR을 클론하고 서열화해야 한다. Kalendar 등[15]이 고안한 inter-primer binding site (iPBS)는 이런 단점을 보완하기 위한 것인데 retrotransposon의 PBS자리를 이용한다. 12~18 bp의 변이가 있는 시발체를 사용한다.

Retrotransposon-based sequence-specific amplification polymorphism (SSAP)

Waugh 등[27]이 고안한 마커로 amplified fragment length polymorphism (AFLP)와 비슷하다. Transposon과 host genome 사이를 연결하는 시발체를 사용하여 retrotransposon 삽입자리를 밴드 양상으로 전환시킨다. AFLP에서는 증폭부위에 대한 예비지식이 불필요한 반면 SSAP에서는 서전에 transposon 서열지식이 필요하다.

분자 마커로서 전이요소의 활용 측면으로 retrotransposon은 연속적 전사, 역전사, 새로운 cDNA 삽입이 반복된 것으로 레트로바이러스와 유사하다. 이런 retrotransposon의 구조와 반복 전략은 마커 발달의 장점이 된다.

풍부도와 복사 수의 측면에서 retrotransposon은 유전체 내 이질성이 높은 집단이며 염색체에 광범위 분포한다. LTR retrotransposons의 경우 옥수수 유전체의 25%나 차지한다. 대부분 식물 유전체에 LTR retrotransposons이 풍부하며 유전체의 복잡성과 연계되어 있는데 애기장대는 유전체가 작아 LTR retrotransposons도 5% 이내이다. 이런 현상은 AADs의 경우도 유사한데 배수체 같이 유전체의 복잡성이 증가하면 LTR도 많다.

전이요소의 삽입은 다형성을 증가시킨다. 전이요소는 유전체의 진정염색질에 널리 분포하여 표현형과 연관되어 있다. 더욱이 많은 전이요소 마커는 공우성이다. 그런데 집단유전학에서는 유용하지만 다형성 본질에 대해 설명하기가 어렵고 불확실성이 남아있다. 특이 밴드 양상에서 차이가 retrotransposon의 유무에 기인한 것이지만 삽입이나 제한효소절단자리의 상실 등 다른 기작일 수 있다는 문제점이 제기되기도 한다. 다행이 분석법이 점점 개량되고 있다. 전이요소 마커의 중요한 특성으로 homoplasy가 거의 없다는 점이며 공통조상에서 유도된 특성이 거의 불변이나 동일하지는 않다.

저항성 유전자에 근거한 마커

저항성 유전자에 근거한 마커(resistance-gene based markers, RGMs)는 식물 방어 기작에 관여하는 특별한 유전자를 타깃으로 하는 독특한 그룹이다. 식물은 자신을 보호하기 위해 능동적, 수동적 방어기작을 발달시켜왔다. 식물은 pathogen and pattern resistance receptors (PPRs)와 저항성 단백질(R proteins)을 보통 가지고 있다. PPRs는 미생물과 병원균과 관련된 분자 양상을 인식하고 R-단백질은 무발병성 인자를 인식한다. R-단백질과 추정되는 R-유전자에 대해 분자마커로 만든다[24].

Resistance-gene analog polymorphism (RGAP)

RGAP는 유전체 DNA를 절단하지 않고 PCR에 주형으로 사용한다[18]. 병원체에 저항을 나타내는 보존된 R-유전자와 RGA을 스크린 하기 위해 시발체로 증폭한다. R-유전자 도메인으로 생물 다양성 연구에도 유용하다.

Nucleotide-binding site (NBS) profiling

Linden 등이 개발한 NBS는 R-유전자와 RGAs에 대해 보존된 NBS 부위를 스크린 하여 증폭하는 방법인데 감자, 토마토, 귀리, 상추 같은 여러 식물에 적용되었다. 증폭 산물은 아가로스 젤로는 부적합하여 폴리 아크릴 아마이드 젤로 분리한다.

저항성 유전자에 근거한 마커의 장점

저항성 유전자에 근거한 기법은 기능성 유전자와 연계되어 있어 여러 장점이 있다. R-유전자와 RGA 관련 부위를 증폭한 밴드의 약 90%는 특별한 분절이다. 낮은 RGA 증폭 비율을 가진 시발체를 사용하면 서열 보존이 높은 NBS도메인 바깥 서열을 얻을 수 있다. NBS도메인 내에서는 서열 보존이 높은 반면 다른 RGA 사이 부위는 서열 보존이 낮다. 저항성 유전자 분절은 amplified polymorphic sequence (CAPS)와 sequence-characterized amplified region (SCAR) 마커로도 사용할 수 있다.

계통학적 요구에 중요한 사항으로 공통 조상이 공유하는 동질성 특성이 있다. 상동성 분자는 병렬상동 유전자(Orthologous gene)와 직렬상동 유전자(Paralogous gene)가 있다. 병렬상동 유전자는 어떤 다른 분류군에서 발견되는 상동인 유전자로 종분화 과정에서 진화적으로 같은 조상에서 유래한 유전자들을 말한다. 직렬상동 유전자는 동일한 종 내에서 발견되는 상동인 유전자이며 주로 유전자 중복으로 일어난다. 상동성은 종내 종간에 오독 등 여러 문제를 야기시킨다. R-유전자에서 유전적 재조합으로 많은 변이가 생긴다. 상동성은 AFLP, RAPD 등으로 분석할 수 있다.

저항성 유전자의 진화는 도태에 관련 있는데 기능성 서열은 도태에 놓여있다. 식물은 동물처럼 면역에 근거한 순환계가 없다. 따라서 개인 세포에 의존한다. 면역은 특이 구조를 가진 한 개의 R-유전자에 종종 의존한다. 이런 유전자는 도태 하에 있기 때문에 계통 분석 결과에 영향을 줄 수 있다. 계통분석 결과 유전자의 다른 부위가 일생 동안에 다른 비율로 진화한다는 것을 의미한다. 어떤 부위는 높은 변이성을 나타내어 상동성 및 비상동성 돌연변이를 가진다. DNA 지문에 근거에 의하면 저항성 유전자는 많은 저항성 유전자 중에서 진화를 통해 선택된 것이다. 감자에서 NBS-profiling 계통도 분석을 실시하면 분해능이 낮다. 이는 짧은 시기에 걸쳐 진화한 종끼리 광범위한 종간 교잡이 이루어져 서열 차이가 거의 없다고 볼 수 있다. 따라서 R-유전자 진화와 종진화가 연계되어 있으며 밴드 양상이 진정한 계통도를 반영하는 것이다. 다른 도태를 가진 R-유전자는 비교적 낮은 빈도로 특이 profile을 반영할 수 있으며 적은 밴드의 수는 계통도에 거의 영향이 없다. 어떤 종에서는 1개 저항성 유전자가 어떤 시기에 종의 생존에 매우 중요할 수 있다. 진화 시간의 규모에서 단시간 식물병균의 확산처럼 생존을 위한 저항성 유전자가 빠르게 확산되기도 한다. Wang 등[26]에 의하면 도태압의 특별한 효과가 짧은 시간 규모에서 탐지되어다. 따라서 많은 마커가 계통적 분석에 이용되어야 이런 문제가 희석될 수 있다.

RNA에 근거한 마커

RNA에 근거한 마커(RNA-based markers, RBMs)는 발현에 대한 정보를 획득하는데 역점을 둔다. 예를 들면 어떤 스트레스 요인에 대한 식물세포의 생물학적 반응은 유전자 발현 조절에 좌우된다. 이 과정을 이해하기 위해 많은 방법이 시도되었으며 PCR을 이용한 마커가 발달되었다. 지문 마커는 일부 분절을 증폭하는 것으로 DNA뿐만 아니라 RNA에서도 유도되었다. 최근에 전사/발현 부위로부터 마커가 개발되었고 cDNA, ESTs를 이용한다.

Inter small RNA polymorphism (iSNAP)

내인성 비암호화 소형 RNA는 20~24개 핵산으로 구성되어 있으며, 진핵세포 유전체에 널리 퍼져있으며, 중요한 조절작용을 하며 분자마커로 이용된다. 소형 RNA의 측면 서열은 잘 보존되어 PCR을 위한 시발체로 이용된다. Gui 등[11]이 고안한 iSNAP도 이런 특정을 지니고 있어 측면 서열을 시발체로 길이에 따른 다형을 탐색할 수 있다.

cDNA-AFLP

Bachem 등[1]이 개발한 분자 마커로 4단계로 이루어져 있다. 첫째는 RNA를 추출하여 cDNA로 만드는 단계이고, 둘째 단계에서는 AFLP와 유사하게 제한효소로 절단하여 어댑터를 부착한다. 셋째 단계는 예비 증폭이고 넷째는 선택적 증폭이다. 은-염색법으로 밴드를 염색하고 폴리아크릴 젤로 분리한다. 종 동정에 유용하며 다양한 스트레스에 각기 다른 유전자 발현이 소량의 전사물이라도 탐지가 가능하다.

cDNA-RFLP

Bryan 등[5]이 연구한 것으로 cDNA 클론을 직접 RFLP 분석을 위한 probe로 이용한다. 이 마커는 특이 PCR 마커로 전환될 수 있다. 유전체 특이 증폭물은 유전자 타깃 또는 진단에 쓰인다. Probe를 변경하는 것은 기본이다. 해바라기, 밀 등에서 많이 연구되었다.

EST-SSR

cDNA 서열의 장점은 많은 정보를 제공해준다. Expressed sequence tags (ESTs)는 짧은 전사 서열로 한 방향을 읽으며 유전체 발현 분석에 유용하다. cDNA로 전환되면 두 방향으로 읽을 수 있어 5’, 3’ ESTs를 생성한다. 후자는 미전사부위 (untranslated regions, UTRs)내에, 전자는 단백질 암호와 연계되어 있다. ESTs의 증가는 microsatellite 또는 simple sequence repeat (SSR)의 발달을 촉진시켰다. 기술적으로 EST-SSR는 증폭이나 결실에서 SSR과 크게 다르지 않다. 큰 차이는 시발체 구성과 시발체의 위치이다. EST-SSR는 유전체의 전사 부위를 탐색하여 silico기법으로 직접 서열을 얻는다. 이 마커는 밀에서 많이 연구되었다[17].

RNA 마커의 장점

유전체의 전사부위를 특성으로 알아내기 위해 식물 유전적 프로그램이 많은 ESTs를 생성해냈다. 이런 목적으로 개발된 마커들은 발생, 식물 스트레스 반응의 분석에 사용되었다. 새로운 마커를 개발하여 유전체의 발현부위의 접근에 도움이 되고 정보, 알고리즘을 이해하게 된다. cDNA 또는 EST 유도마커는 많은 서열 프로젝트에 기여하였다. 한편 자연집단에서 변이는 도태일 수 있기에 시발체 구성에 유의하여야 한다.

타깃-지문 마커

유전체 요소의 지식 증가에 힘입어 새로운 마커 family 등장하였는데 targeted fingerprinting markers (TFMs)도 그 중의 하나이다. 이 마커는 multi-locus 마커로 반임의성이며 유전체의 다양한 부위에 타깃방식으로 증폭되며 어떤 유전자의 다형 또는 기능을 가진 관련 유전자 부위를 대상으로 한다. 이 마커 시스템은 표현형 특성 변이에 포함된 지문을 만들 필요는 없다. 연결 요소(프로모터 또는 개시코돈 같은 것)를 시발체에 부착하여 타깃으로 하는 유전자 부위를 증폭한다. 이 마커는 유전체에 널리 분포되어 있고 재현성이 좋아 기존의 AADs를 대체할 수 있다.

Direct amplification of length polymorphisms (DALP)

Desmarais 등[9]이 개발하였으며 AAD와 유사하지만 높은 다형성과 분해능을 나타내고 직접 서열화할 수 있다. DNA 분절로부터 서열 정보를 얻을 수 있고 예비 서열 정보는 불필요하다. PCR은 보편성이 있는 ‘M13 – 40 USP’ 시발체를 사용하는데 핵심 부위의 핵산이다. 이 시발체의 3’-말단에 염기를 부가할 수 있다. 이 기법은 긴 서열(19~21)을 가진 RAPD라고 생각할 수 있다.

Promoter anchored amplified polymorphism (PAAP)

RAPD에 덧붙여 보존된 프로모터 서열을 시발체로 증폭하는 방법이다. 즉 시발체 구성을 위해 특정 유전자 근처에 있는 유전자 발현을 촉진하는 프로모터 부위를 이용한다. 따라서 분석하고자 하는 유기체의 유전체 프로모터 요소를 결정할 수 있어 전사 시작점 전사의 특수성과 비율의 변경을 탐색하는데 사용된다. 프로모터 서열의 유전자 특이 구조는 높은 다양성이 있고, 많은 짧은 모티프가 있고, 전사에서 단백질이 인식하는 자리이다. 이 마커는 길이 다형성을 유발하는 tag에 적합하고 RAPD 시발체와 연계하여 PAAP-RAPD를 생성할 수 있다[21].

Sequence-related amplified polymorphism (SRAP)

타깃으로 하는 짧은 인지자리를 시발체로 하여 PCR을 통해 많은 다형성을 탐지할 수 있다. Region amplified polymorphic (RAP)은 임의 시발체를 사용하나 RAPD와 다르다. 세가지 주요 기법이 있는데 그 중 하나는 sequence-related amplified polymorphism (SRAP)으로 RAPD보다 긴 시발체 (17~21)를 사용한다[19]. 전후 시발체는 5’ 와 3’에 각각 GC와 AT가 풍부하게 배치한다. 이것은 GC가 풍부한 코돈과 3’UTRs 는 AT가 풍부한 것을 겨냥한 것이다.

Targeted region amplified polymorphism (TRAP)

두 번째 기법으로 TRAP는 SRAP와 유사한 사전에 서열정보를 알아야 한다. PCR조건은 SRAP와 유사하다. PCR 반응은 고정된 것에 임의 SRAP 시발체를 붙여 사용하는데 즉, 선택된 핵산, 특정 서열, AT- 혹은 GC-motif를 사용한다. 고정된 사열은 발현된 서열꼬리표 유전자의 것이다.

Conserved region amplification polymorphism (CoRAP)

이 마커도 고정된 것과 임의 시발체를 사용한다. TRAP와 유사하나 고정된 시발체가 직접 타깃으로 하는 ESTs이며 임의 시발체에서 다른 점은 다른 핵심 서열 모티프(CACGC)를 사용하는 것인데 이 서열은 식물 유전체 인트론에서 보통 발견된다.

Start codon targeted (SCoT) polymorphism

이 마커는 Collard와 Mackill [8]이 개발한 것으로 식물 유전체의 ATG 전사 개시 코돈 주변의 보전된 짧은 서열을 관찰하는 것이다. 이 방법에서는 시발체를 하나만 사용한다. SCoT는 재현성이 있고 우성이나 공우성 마커도 사용할 수 있다. 유전적 다양성 연구에 많이 쓰인다.

 

결 론

식물학에서 종간 구별이나 품종 간 식별을 위해 발달해온 분자 마커는 이제 그 영역을 넓혀 기능성 유전자의 다형성, 표현형 변이, 질병과의 관계 등 여러 방면에 쓰이고 있다. 제한효소의 절단법, PCR을 이용한 유전자 증폭, 전기영동을 이용한 증폭 산물의 분리, 증폭물의 추출하여 서열화 기법에 힘입어 많은 마커들이 개발되었고 개발되고 있다. 이런 마커들은 나름대로 장단점을 가지고 있어 하나의 마커보다 여러 마커를 이용하여 타깃으로 하는 유전자의 특성을 이해하기 위해 사용하는 것이 좋을 것으로 사료된다.

References

  1. Bachem, C. W., van der Hoeven, R. S., de Bruijn, S. M., Vreugdenhil, D., Zabeau, M. and Visser, R. G. 1996. Visualization of differential gene expression using a novel method of RNA fingerprinting based on AFLP: analysis of gene expression during potato tuber development. Plant J. 9, 745-753. https://doi.org/10.1046/j.1365-313X.1996.9050745.x
  2. Bardini, M., Lee, D., Donini, P. and Mariani, A. 2004. Tubulin-based polymorphism (TBP): a new tool, based on functionally relevant sequences, to assess genetic diversity in plant species. Genome 291, 281-291.
  3. Bostein, D., White, R. L., Skolnick, M. and Davis, R. W. 1980. Construction of a genetic linkage map in man using restriction fragment length polymorphisms. Am. J. Hum. Genet. 32, 314-331.
  4. Breviario, D., Baird, W. V., Sangoi, S., Hilu, K., Blumetti, P. and Gianì, S. 2007. Polymorphism and resolution in targeted fingerprinting with combined β-tubulin introns. Mol. Breeding 20, 249-259. https://doi.org/10.1007/s11032-007-9087-9
  5. Bryan, G. J., Stephenson, P., Collins, A., Kirby, J., Smith, J. B. and Gale, M. D. 1999. Low levels of DNA sequence variation among adapted genotypes of hexaploid wheat. Theor. Appl. Genet. 99, 192-198. https://doi.org/10.1007/s001220051224
  6. Cernák, I., Taller, J., Wolf, I., Fehér, E., Babinszky, G., Alföldi, Z., Csanádi, G. and Polgár, Z. 2008. Analysis of the applicability of molecular markers linked to the PVY extreme resistance gene Rysto, and the identification of new markers. Acta Biol. Hun. 59, 195-203. https://doi.org/10.1556/ABiol.59.2008.2.6
  7. Collard, B. C. Y. and Mackill, D. J. 2009a. Conserved DNA-derived polymorphism (CDDP): a simple and novel method for generating DNA markers in plants. Plant Mol. Biol. Rep. 27, 558-562. https://doi.org/10.1007/s11105-009-0118-z
  8. Collard, B. C. Y. and Mackill, D. J. 2009b. Start codon targeted (SCoT) polymorphism: a simple, novel DNA marker technique for generating gene-targeted markers in plants. Plant Mol. Biol. Rep. 27, 86-93. https://doi.org/10.1007/s11105-008-0060-5
  9. Desmarais, E., Lanneluc, I. and Lagnel, J. 1998. Direct amplification of length polymorphisms (DALP), or how to get and characterize new genetic markers in many species. Nucleic Acids Res. 26, 1458-1465. https://doi.org/10.1093/nar/26.6.1458
  10. Galasso, I., Manca, A., Braglia, L., Martinelli, T., Morello, L. and Breviario, D. 2010. h-TBP: an approach based on intron-length polymorphism for the rapid isolation and characterization of the multiple members of the β-tubulin gene family in Camelina sativa (L.) Crantz. Mol. Breeding 28, 635-645.
  11. Gui, Y., Yan, G., Bo, S., Tong, Z., Wang, Y., Xiao, B., Lu, X., Li, Y., Wu, W. and Fan, L. 2011. iSNAP: a small RNA-based molecular marker technique. Plant Breeding 130, 515-520. https://doi.org/10.1111/j.1439-0523.2011.01872.x
  12. Hamada, H. M., Petrino, M. G. and Kakunaga, T. 1982. A novel repeated element with Z-DNA forming potential is widely found in evolutionarily diverse eukaryotic genomes. Proc. Natl. Acad. Sci. USA 79, 6465-6469. https://doi.org/10.1073/pnas.79.21.6465
  13. Hu, J. and Vick, B. B. A. 2003. Target region amplification polymorphism: a novel marker technique for plant genotyping. Plant Mol. Biol. Rep. 21, 289-294. https://doi.org/10.1007/BF02772804
  14. Huh, M. K., Bang, K. H. and Choi, J. S. 2007. Identification of Atractylodes japonica and A. macrocephala by AFLP and SCAR Markers. Horti. Environ. Biotech. 47, 201-205.
  15. Kalendar, R., Antonius, K., Smýkal, P. and Schulman, A. H. 2010. iPBS: a universal method for DNA fingerprinting and retrotransposon isolation. Theor. Appl. Genet. 121, ㅊ. https://doi.org/10.1007/s00122-010-1398-2
  16. Kalendar, R., Grob, T., Regina, M., Suoniemi, A. and Schulman, A. 1999. IRAP and REMAP: two new retrotransposon-based DNA fingerprinting techniques. Theor. Appl. Genet. 98, 704-711. https://doi.org/10.1007/s001220051124
  17. Kantety, R. V., La Rota, M., Matthews, D. E. and Sorrells, M. E. 2002. Data mining for simple sequence repeats in expressed sequence tags from barley, maize, rice, sorghum and wheat. Plant Mol. Biol. 48, 501-510. https://doi.org/10.1023/A:1014875206165
  18. Leister, D., Ballvora, A., Salamini, F. and Gebhardt, C. 1996. A PCR-based approach for isolating pathogen resistance genes from potato with potential for wide application in plants. Nat. Genet. 14, 421-429. https://doi.org/10.1038/ng1296-421
  19. Li, G. and Quiros, C. F. 2001. Sequence-related amplified polymorphism (SRAP), a new marker system based on a simple PCR reaction: its application to mapping and gene tagging in Brassica. Theor. Appl. Genet. 103, 455-461. https://doi.org/10.1007/s001220100570
  20. McClintock, B. 1950. The origin and behavior of mutable loci in maize. PNAS 36, 344-355. https://doi.org/10.1073/pnas.36.6.344
  21. Pang, M., Percy, R. G., Hughs, E. and Zhang, J. 2008. Promoter anchored amplified polymorphism based on random amplified polymorphic DNA (PAAPRAPD) in cotton. Euphytica 167, 281-291.
  22. Poczai, P., Verga, I., Laos, M., Cseh, A., Bell, N., Valkonen, J. PT. and Hyvonen, J. 2013. Advances in plant gene-targeted and functional markers: a review. Plant Methods 9, 6. https://doi.org/10.1186/1746-4811-9-6
  23. Seibt, K. M., Wenke, T., Wollrab, C., Junghans, H., Muders, K., Dehmer, K. J., Diekmann, K. and Schmidt, T. 2012. Development and application of SINE-based markers for genotyping of potato varieties. Theor. Appl. Genet. 125, 185-196. https://doi.org/10.1007/s00122-012-1825-7
  24. Van der Linden, C. G., Wouters, D. C. A. E., Mihalka, V., Kochieva, E. Z., Smulders, M. J. M. and Vosman, B. 2004. Efficient targeting of plant disease resistance loci using NBS profiling. Theor. Appl. Genet. 109, 384-393. https://doi.org/10.1007/s00122-004-1642-8
  25. Vos, P., Hogers, R., Bleeker, M., Reijans, M., Van De Lee, T., Hornes, M., Frijters, A., Pot, J., Peleman, J., Kuiper, M. and Zabeau, M. 1995. AFLP: a new technique for DNA fingerprinting. Nucleic Acids Res. 23, 4407-4414. https://doi.org/10.1093/nar/23.21.4407
  26. Wang, Q., Zhang, B. and Lu, Q. 2009. Conserved region amplificationpolymorphism (CoRAP), a novel marker technique for plant genotyping in Salvia miltiorrhiza. Plant Mol. Biol. Rep. 27, 139-143. https://doi.org/10.1007/s11105-008-0065-0
  27. Waugh, R., McLean, K., Flavell, A. J., Pearce, S. R., Kumar, A., Thomas, B. B. and Powell, W. 1997. Genetic distribution of Bare-1-like retrotransposable elements in the barley genome revealed by sequence-specific amplification polymorphisms (S-SAP). Mol. Gen. Genet. 253, 687-694. https://doi.org/10.1007/s004380050372
  28. Weining, S. and Langridge, P. 1991. Identification and mapping of polymorphisms in cereals based on the polymerase chain reaction. Theor. Appl. Genet. 82, 209-216.
  29. Williams, J. G. K., Kubelik, A. R., Livak, K. J., Rafalski, J. A. and Tingey, S. V. 1990. DNA polymorphism’s amplified by arbitrary primers are useful as genetic markers. Nucleic Acids Res. 18, 6531-6535. https://doi.org/10.1093/nar/18.22.6531
  30. Yamanaka, S., Suzuki, E., Tanaka, M., Takeda, Y., Watanabe, J. A. and Watanabe, K. N. 2003. Assessment of cytochrome P450 sequences offers a useful tool for determining genetic diversity in higher plant species. Theor. Appl. Genet. 108, 1-9. https://doi.org/10.1007/s00122-003-1403-0
  31. Zietkiewicz, E., Rafalski, A. and Labuda, D. 1994. Genome fingerprinting by simple sequence repeat (SSR)-anchored polymerase chain reaction amplification. Genomics 20, 176-183. https://doi.org/10.1006/geno.1994.1151