• 제목/요약/키워드: Genomic Sequence

검색결과 896건 처리시간 0.022초

Sequential Polyadenylation to Enable Alternative mRNA 3' End Formation

  • Yajing Hao;Ting Cai;Chang Liu;Xuan Zhang;Xiang-Dong Fu
    • Molecules and Cells
    • /
    • 제46권1호
    • /
    • pp.57-64
    • /
    • 2023
  • In eukaryotic cells, a key RNA processing step to generate mature mRNA is the coupled reaction for cleavage and polyadenylation (CPA) at the 3' end of individual transcripts. Many transcripts are alternatively polyadenylated (APA) to produce mRNAs with different 3' ends that may either alter protein coding sequence (CDS-APA) or create different lengths of 3'UTR (tandem-APA). As the CPA reaction is intimately associated with transcriptional termination, it has been widely assumed that APA is regulated cotranscriptionally. Isoforms terminated at different regions may have distinct RNA stability under different conditions, thus altering the ratio of APA isoforms. Such differential impacts on different isoforms have been considered as post-transcriptional APA, but strictly speaking, this can only be considered "apparent" APA, as the choice is not made during the CPA reaction. Interestingly, a recent study reveals sequential APA as a new mechanism for post-transcriptional APA. This minireview will focus on this new mechanism to provide insights into various documented regulatory paradigms.

An Integrated Genomic Resource Based on Korean Cattle (Hanwoo) Transcripts

  • Lim, Da-Jeong;Cho, Yong-Min;Lee, Seung-Hwan;Sung, Sam-Sun;Nam, Jung-Rye;Yoon, Du-Hak;Shin, Youn-Hee;Park, Hye-Sun;Kim, Hee-Bal
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제23권11호
    • /
    • pp.1399-1404
    • /
    • 2010
  • We have created a Bovine Genome Database, an integrated genomic resource for Bos taurus, by merging bovine data from various databases and our own data. We produced 55,213 Korean cattle (Hanwoo) ESTs from cDNA libraries from three tissues. We concentrated on genomic information based on Hanwoo transcripts and provided user-friendly search interfaces within the Bovine Genome Database. The genome browser supported alignment results for the various types of data: Hanwoo EST, consensus sequence, human gene, and predicted bovine genes. The database also provides transcript data information, gene annotation, genomic location, sequence and tissue distribution. Users can also explore bovine disease genes based on comparative mapping of homologous genes and can conduct searches centered on genes within user-selected quantitative trait loci (QTL) regions. The Bovine Genome Database can be accessed at http://bgd.nabc.go.kr.

16S-23S rRNA Intergenic Spacer Region을 이용한 Vibrio ichthyoenteri Species-specific Primer 개발 (Use of 16S-23S rRNA Intergenic Spacer Region for Species-specific Primer Developed of Vibrio Ichthyoenteri)

  • 문영건;허문수
    • 미생물학회지
    • /
    • 제41권2호
    • /
    • pp.117-124
    • /
    • 2005
  • Rotifer와 병든 넙치 자어로부터 분리된 2개의 균주는 표현형적인 특성 확인 결과 Vibrio ichthyoenteri로 확인이 되었다. V. ichthyoenteri를 검출하기 위래 고감도 PCR 방법 개발을 하기 위래 V. ichthyoenteri 16S-23S rRNA intergenic spacer region(ISR)을 분석하였고, V. ichthyoenteri중 특이적 primer를 개발하였다. V. ichthyoenteri 의 ISR를 분석한 결과 1개의 다형성 ISR type서열을 포함하고 있었다. ISR서열은 길이는 348bp이며 tRNA gene을 가지고 있지 않았다. 이 서열을 가지고 이미 알려진 다른 Vibrio 종의 ISR 서열과 mutiple alignment를 수행한 결과 여러 영역에서 높은 가변성을 나타내어 가변 부위를 표적으로 하여 V. ichthyoenteri를 검출하기 위한 종 특이적 primer를 제작하였다. 제작된 primer의 특이성을 확인하기 위해 Vibrio 표준균주 19종의 genomic DNA와 분리균주 18 group에 genomic DNA 그리고 V. ichthyoenteri와 가장 유사한 서열을 가지고 있다고 알려진 Vibrio 종의 genomic DNA를 가지고 시험하였다. 그 결과 본 연구에서 제작된 종 특이적 primer를가지고 PCR 반응을 하면 V. ichthyoenteri를 검출 할 수가 있다.

Comparative Genomic Analysis of Lactobacillus rhamnosus BFE5264, a Probiotic Strain Isolated from Traditional Maasai Fermented Milk

  • Jeong, Haeyoung;Choi, Sanghaeng;Park, Gun-Seok;Ji, Yosep;Park, Soyoung;Holzapfel, Wilhelm Heinrich;Mathara, Julius Maina;Kang, Jihee
    • 한국미생물·생명공학회지
    • /
    • 제47권1호
    • /
    • pp.25-33
    • /
    • 2019
  • Lactobacillus rhamnosus BFE5264, isolated from a Maasai fermented milk product ("kule naoto"), was previously shown to exhibit bile acid resistance, cholesterol assimilation, and adhesion to HT29-MTX cells in vitro. In this study, we re-annotated and analyzed the previously reported complete genome sequence of strain BFE5264. The genome consists of a circular chromosome of 3,086,152 bp and a putative plasmid, which is the largest one identified among L. rhamnosus strains. Among the 2,883 predicted protein-coding genes, those with carbohydrate-related functions were the most abundant. Genome analysis of strain BFE5264 revealed two consecutive CRISPR regions and no known virulence factors or antimicrobial resistance genes. In addition, previously known highly variable regions in the genomes of L. rhamnosus strains were also evident in strain BFE5264. Pairwise comparison with the most studied probiotic strain L. rhamnosus GG revealed strain BFE5264-specific deletions, probably due to insertion sequence-mediated recombination. The latter was associated with loss of the spaCBA pilin gene cluster and exopolysaccharide biosynthetic genes. Comparative genomic analysis of the sequences from all available L. rhamnosus strains revealed that they were clustered into two groups, being within the same species boundary based on the average nucleotide identities. Strain BFE5264 had a sister group relationship with the group that contained strain GG, but neither ANI-based hierarchical clustering nor core-gene-based phylogenetic tree construction showed a clear distinctive pattern associated with the isolation source, implying that the genotype alone cannot account for their ecological niches. These results provide insights into the probiotic mechanisms of strain BFE5264 at the genomic level.

수박 시판 품종의 식별을 위한 Genomic과 Expressed Sequence Tag (EST)에서 유래된 Microsatellite Marker의 이용 (Use of Microsatellite Markers Derived from Genomic and Expressed Sequence Tag (EST) Data to Identify Commercial Watermelon Cultivars)

  • 권용삼;홍지화;김두현;김도훈
    • 원예과학기술지
    • /
    • 제33권5호
    • /
    • pp.737-750
    • /
    • 2015
  • 국내에서 시판되고 있는 수박 102 품종에 대한 DNA 프로 파일 데이터베이스를 구축하기 위하여 genomic microsatellite(gMS)와 expressed sequence tag(EST) microsatellite(eMS) 마커의 다형성 정도의 비교와 유전적 연관성 분석을 통한 품종식별력 검정 등에 대한 일련의 연구를 수행하였다. 수박 gMS 마커를 이용하여 국내에서 시판되고 있는 수박 102 품종을 검정하였을 때 마커당 3.63개의 평균 대립유전자가 검출되었으며, 평균 PIC 값은 0.479로 나타났다. 이에 반해 eMS 마커는 평균 대립유전자의 수가 2.50개, PIC 값이 0.425로 나타나 gMS 마커보다 다형성 정도가 낮게 나타났다. gMS와 eMS 및 이들 두 종류의 마커를 병합하여 작성된 계통도는 microsatellite 마커의 다형성에 따라 수박 102개 품종을 6-8개의 그룹으로 구분하였고 대부분의 품종의 식별이 가능하였다. 3가지 마커 유형에 따라 작성된 계통도를 Mantel test에 의해 상관 정도를 분석하였을 때 높은 상관($r{\geq}0.80$)을 나타내었다. 따라서 본 연구에 활용된 microsatellite 마커는 수박 유전자원의 특성평가, 순도검정 및 품종의 지문화 작업의 수단으로 유용하게 활용될 수 있을 것이다.

리블로스 1,5- 이인산 탄산화효소 유전자의 분리 및 특성규명 (Isolation of a Rice Genomic Clone Encoding Ribulose-1,5-bisphosphate Carboxylase)

  • 박성순;김희진;김정호;김한집;이종섭;이광응;최양도
    • Applied Biological Chemistry
    • /
    • 제37권5호
    • /
    • pp.361-369
    • /
    • 1994
  • Ribulose-1,5-bisphosphate carboxylase small subunit(rbcS)의 광유도 발현과 엽록체로의 단백질 이동 메카니즘을 연구하기 위해 벼의 게놈으로부터 rbcS 유전자를 분리하여(GrbcS) 그의 염기서열을 결정하였다. GrbcS의 유전자 염기서열 결정 결과, 단백질 암호부위는 한 개의 intron과 두 개의 exon으로 이루어져 있고 이들은 47개의 transit peptide를 포함하는 175개의 아미노산을 암호화하는 것으로 밝혀졌다. GrbcS의 이러한 구조적인 성질은 다른 단자엽 식물의 그것과 비교적 일치하고 genomic Southern blot analysis 결과 rbcS 유전자는 벼의 게놈상에 상대적으로 적은 규모의 multigene family로 존재한다는 것이 밝혀졌다. GrbcS의 유전자 염기서열과 그로부터 유추된 아미노산의 염기서열은 벼로부터 분리된 다른 rbcS와 매우 유사함을 보였고 다른 식물체로부터 분리된 그것과도 높은 유사성을 보였다. GrbcS의 5’ 앞쪽 부분에는 G-box, 3AF1-binding site, GATA site와 같은 광유도 발현 유전자에 공통적으로 존재하는 염기서열을 지니고 있었다.

  • PDF

소 Adipocyte Differentiation Related Protein (ADRP) 유전자의 Genomic Organization 및 Promoter Region의 특성 규명 (Genomic Organization and Characterization of the Promoter Region of Bovine ADRP (Adipocyte Different Related Protein) Gene)

  • 장요순;윤두학;김태헌;정일정;조진기
    • Journal of Animal Science and Technology
    • /
    • 제45권2호
    • /
    • pp.169-182
    • /
    • 2003
  • ADRP 유전자가 24개월령 한우 등심조직에서 발현량이 급격히 증가하여 30개월령 등심조직에서는 발현량이 다소 감소하는 발현양상 분석결과로부터 이전 연구에서는 ADRP 유전자를 한우 성장단계 특이발현 유전자로 선정하였다. 본 연구에서는 ADRP 유전자의 발현조절 기작을 분석하기 위하여 promoter 영역을 포함하는 ADRP 유전자 전체영역을 cloning하였으며, 구조를 분석하고 promoter의 특성을 조사하였다. 한우 ADRP cDNA 단편을 probe로 합성하여 Southern blot 분석을 실시한 결과로부터 ADRP 유전자가 한우 genome 상에서 single copy로 존재하고 크기는 대략 12 kb에 해당하는 것을 확인하였다. Genomic DNA library screening을 실시하여 promoter 영역을 포함하는 ADRP 전체 유전자에 해당하는 clone을 확보하고 HwADRPg-1으로 명명한 후, 염기서열을 결정하고 분석하였다. 한우 ADRP 유전자, HwADRPg-1은 8개의 exon과 7개의 intron으로 구성되어 있으며 모든 exon-intron 경계는 GT/AG 원칙을 따르고 있었고, coding 영역은 7,633 bp로서 6개의 intron에 의해 7개의 exon으로 나누어져 있었다. HwADRPg-1의 promoter 영역에서는 TATAA box는 발견되지 않았으며, -70 위치에 근육 특이적 transcription activator인 Myo G 서열이 존재하였고, -629 위치에는 지방세포의 분화를 유도하는 것으로 알려진 C/EBP (CCAAT/enhancer binding protein) 서열이 존재하였다. HwADRPg-1의 조절영역에 있는 Myo G factor가 근육조직에서 ADRP 유전자가 발현될 수 있도록 하며, 근육의 발달정도를 신호로써 감지하여 근육조직에서 성장단계에 따른 ADRP 유전자의 발현량을 조절할 것으로 추정되고, 다른 종류의 지방세포 특이적인 전사인자 및 지방세포의 분화정도를 신호로 인식하는 전사단계 조절인자를 조사하기 위하여 promoter 영역의 추가분석이 이루어져야 할 것으로 사료된다.

Protein Sequence Search based on N-gram Indexing

  • Hwang, Mi-Nyeong;Kim, Jin-Suk
    • Bioinformatics and Biosystems
    • /
    • 제1권1호
    • /
    • pp.46-50
    • /
    • 2006
  • According to the advancement of experimental techniques in molecular biology, genomic and protein sequence databases are increasing in size exponentially, and mean sequence lengths are also increasing. Because the sizes of these databases become larger, it is difficult to search similar sequences in biological databases with significant homologies to a query sequence. In this paper, we present the N-gram indexing method to retrieve similar sequences fast, precisely and comparably. This method regards a protein sequence as a text written in language of 20 amino acid codes, adapts N-gram tokens of fixed-length as its indexing scheme for sequence strings. After such tokens are indexed for all the sequences in the database, sequences can be searched with information retrieval algorithms. Using this new method, we have developed a protein sequence search system named as ProSeS (PROtein Sequence Search). ProSeS is a protein sequence analysis system which provides overall analysis results such as similar sequences with significant homologies, predicted subcellular locations of the query sequence, and major keywords extracted from annotations of similar sequences. We show experimentally that the N-gram indexing approach saves the retrieval time significantly, and that it is as accurate as current popular search tool BLAST.

  • PDF

Simple Sequence Repeat (SSR) and GC Distribution in the Arabidopsis thaliana Genome

  • Mortimer Jennifer C;Batley Jacqueline;Love Christopher G;Logan Erica;Edwards David
    • Journal of Plant Biotechnology
    • /
    • 제7권1호
    • /
    • pp.17-25
    • /
    • 2005
  • We have mined each of the five A. thaliana chromosomes for the presence of simple sequence repeats (SSRs) and developed custom perl scripts to examine their distribution and abundance in relation to genomic position, local G/C content and location within and around transcribed sequences. The distribution of repeats and G/C content with respect to genomic regions (exons, UTRs, introns, intergenic regions and proximity to expressed genes) are shown. SSRs show a non-random distribution across the genome and a strong association within and around transcribed sequences, while G/C density is associated specifically with the coding portions of transcribed sequences. SSR motif repeat number shows a high degree of variation for each SSR type and a high degree of motif sequence bias reflecting local genome sequence composition. PCR primers suitable for the amplification of identified SSRs have been designed where possible, and are available for further studies.

Comparative Genomics Study of Interferon-$\alpha$ Receptor-1 in Humans and Chimpanzees

  • Kim, Il-Chul;Chi, Seung-Wook;Kim, Dae-Won;Choi, Sang-Haeng;Chae, Sung-Hwa;Park, Hong-Seog
    • Genomics & Informatics
    • /
    • 제3권4호
    • /
    • pp.142-148
    • /
    • 2005
  • The immune response-related genes have been suggested to be the most favorable genes for positive selection during evolution. Comparing the entire DNA sequence of chimpanzee chromosome 22 (PTR22) with human chromosome 21 (HSA21), we have identified 15 orthologs having indel in their coding sequences. Among them, interferon-${\alpha}$ receptor-1 gene (IFNAR1), an immuneresponse-related gene, is subjected to comparative genomic analysis. Chimpanzee IFNAR1 showed the same genomic structure as human IFNAR1 (11 exons and 10 introns) except the 3 bp insertion in exon 4. The sequence alignment of IFNAR1 coding sequence indicated that 'ISPP' amino acid sequence motif is highly conserved in chimpanzee and other animals including mouse and chicken. However, the human IFNAR1 shows that one proline residue is missing in the sequence motif. The homology modeling of the IFNAR1 structures suggests that the proline deletion in human IFNAR1 leads to the formation of the following ${\alpha}$-helix, whereas two sequential prolines in chimpanzee IFNAR1 inhibit it. As a result, human IFNAR1 may adopt a characteristic structure distinct from chimpanzee IFNAR1. This human specific trait could contribute to specific immune response in the most optimized manner for humans. Further molecular biological studies on the IFNAR1 will help us to gain insights into the molecular implication of species-specific host-pathogen interaction in primate evolution.