• 제목/요약/키워드: 다중 서열 정렬

검색결과 24건 처리시간 0.03초

순차 패턴 마이닝 기법을 이용한 단백질 서열 분류 (Classification of Protein Sequence Using Sequential Pattern Mining)

  • 정광호;김진수;최성용;한승진;이정현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.298-300
    • /
    • 2004
  • 기존의 생물정보학 연구는 전체 서열들의 매칭을 통한 상동성 연구에 중점을 두고 진행되어 왔다 최근에 서열 데이터베이스의 급격한 증가와 게놈 정보가 축적됨에 따라 서열로부터 다양한 정보를 얻기 위해 서열 데이터 분석에 마이닝 기법을 접목시키고자 하는 다양한 기술들이 제안되고 있다. 단백질과 DNA의 서열 비교는 생물정보학의 기본 작업 기운데 하나이다. 신속하고 자동화 된 서열 비교 능력은 새로운 서열에 대한 기능 판별 및 분석 등 모든 작업을 용이하게 한다 본 논문에서는 동종의 단백질 서열들을 다중 정렬하여 일치하는 구간을 찾아내고, 그 구간에서 아미노산 코드와 위치정보를 이용해 동종 서열들 간의 특정한 패턴 규칙을 찾아내고, 새로운 서열에서 어떤 서열 필턴 특징이 발생하는지를 찾아냄으로써 서얼을 분류하는 방법을 제안한다.

  • PDF

Sphingomonas chungbukensis DJ77에서 Sphingosine Kinase를 암호화하는 spk 유전자의 동정과 대장균에서의 발현 (Identification of the spk Gene Encoding Sphingosine Kinase in Sphingomonas chungbukensis DJ77 and Its Expression in Escherichia coli)

  • 이수리;엄현주;김영창
    • 미생물학회지
    • /
    • 제41권2호
    • /
    • pp.93-98
    • /
    • 2005
  • Sphingomonas chungbukensis DJ77의 유전체 서열분식 과정에서 969개의 nucleotide로 구성된 sphingosine kinase 유전자를 동정하였다. 이 sphingosine kinase 단백질의 아미노산 서열은 Zymomonas mobilis subsp. mobilis ZM4의 sphingosine kinase 아미노산 서열과 $55\%$의 상동성을 보였다. 또한 다중서열정렬을 통해 각각 진핵세포의 sphingosine kinase의 C2, C3, C5 domain에 속하는 3개의 conserved sequence를 발견하였다. 그 중 하나는 sphingosine kinase에서 ATP-binding site일 것으로 예상되어지는nucleotide-binding motif(GGDG)였고 나머지 둘은 아직 기능이 알려지지 않은 conserved sequences 였다. 이러한 다중서열정렬을 바탕으로 계통수를 그려본 결과, S. chungbukensis DJ77의 sphingosine kinase (SPK)는 COG1597 그룹과 유사했으며, COG1597 내에서 동일종의 diacylglycerol kinase와는 서로 다른 그룹에 속하는 것으로 나타났다. 재조합 SPK는 이종(異種)세포인 Escherichia coli내에서 성공적으로 과발현 되었으나, 세포 내에서 불용성 복합체(inclusion body)를 형성하였다.

미생물 다양성 분석을 위한 웹 기반의 생물정보도구 개발 (Web-based Research Assistant Tools for Analysis of Microbial Diversity)

  • 강병철;김현진;박준형;박희경;김철민
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2004년도 춘계학술대회 학술발표 논문집 제14권 제1호
    • /
    • pp.93-96
    • /
    • 2004
  • 생태학, 환경공학, 임상진단 둥 여러 생물학 분야에서 미생물의 다양성 연구의 중요성이 대두되고 그 연구가 점증하고 있다. 특히 16S rRNA를 분자지표로한 DNA 염기서열 분석방법이 널리 사용되고 있다. 본 논문에서는 16S rRNA의 염기서열 분석과정을 각 단계별로 자동화하고, 생물학자들의 결과 판단이나 사용상의 편의를 도모하기 위하여 웹기반의 미생물 다양성 분석 어플리케이션을 개발하였다. 개발을 위하여 단계별 자동화 및 인터페이스 개발에 적합한 폴더 프로세스-필터 모델을 고안하고 적용하였다. 제공되는 생물정보분석도구는 서열입력, 서열방향교정, 다중서열정렬 및 가시화, 서열동정 등의 분석등이 있으며, 각 결과는 계통분류도구와 호환가능하도록 하였다. 또한 신생아의 장내 세균총에 대한 분석을 수행하여 개발된 도구의 유용성을 확인하였다. 개발된 웹 에플리케이션은 리눅스 시스템 상에서 Perl 과 CGI를 이용하였으며, http: //home.pusan.ac.kr/~genome/tools/rat.htm으로 접속하여 사용할 수 있다.

  • PDF

다중서열정렬의 유사도 매칭을 이용한 순서기반 침입탐지 (Sequence based Intrusion Detection using Similarity Matching of the Multiple Sequence Alignments)

  • 김용민
    • 정보보호학회논문지
    • /
    • 제16권1호
    • /
    • pp.115-122
    • /
    • 2006
  • 대부분의 침입탐지 방법은 알려진 침입 정보를 축적하고 임의의 행위 데이터에 대해 침입 여부를 결정하는 오용행위 탐지의 방법에 기반하고 있다. 그러나 생성된 공격행위 패턴은 새로운 공격 및 변형된 공격행위에 대응하는 방법에 어려움이 있다. 현실적으로 비정상행위 탐지기법의 높은 오탐을 고려하면, 대용량 순서기반 침입패턴은 알려진 공격에 대한 탐지와 함께 침입패턴의 유사도를 측정하는 방법의 보완을 통해 변형된 공격 및 새로운 공격에 대한 탐지의 가능성을 높이는 대책이 요구된다. 본 논문에서는 순서기반 침입패턴의 유사성 매칭을 위해 다중서열정렬 기법을 적용하는 방법을 제안한다. 그 기법은 침입패턴 서열의 통계적 분석을 가능하게 하고 구현이 용이하며, 서열 크기의 변경에 따라 공격에 대한 탐지 경보 및 오탐의 수를 줄이는 결과를 보였다.

미생물 다양성 분석을 위한 웹기반의 생물정보도구 개발 (Web-based Research Assistant Tools for Analysis of Microbial Diversity)

  • 강병철;김현진;박준형;박희경;김철민
    • 한국지능시스템학회논문지
    • /
    • 제14권5호
    • /
    • pp.545-550
    • /
    • 2004
  • 생태학, 환경공학, 임상진단 등 생물학 분야에서 미생물의 다양성 연구의 중요성이 대두되고 그 연구가 점증하고 있다. 특히 16S rRNA를 분자지표로한 DNA 염기서열 분석방법이 널리 사용되고 있다. 본 논문에서는 16S rRNA의 염기서열 분석과정을 각 단계별로 자동화하고, 생물학자들의 결과 판단이나 사용상의 편의를 도모하기 위하여 웹기반의 미생물 다양성 분석 어플리케이션을 개발하였다. 이를 위하여 단계별 자동화 및 인터페이스 개발에 적합한 폴더-프로세스-필터 모델을 고안하고 적용하였다. 제공되는 생물정보분석도구는 서열입력, 서열방향교정, 다중서열정렬 및 가시화, 서열동정 등의 분석이 있으며, 각 결과는 계통분류도구와 호환 가능하도록 하였다. 또한 신생아의 장내 세균총에 대한 분석을 수행하여 개발된 도구의 유용성을 확인하였다. 개발된 웹 어플리케이션은 리눅스 시스템 상에서 Perl 과 CGI를 이용하였으며, http://home.pusan.ac.kr/~genome/tools/rat.htm으로 접속하여 사용할 수 있다.

베이지안 네트워크 기반의 변형된 침입 패턴 분류 기법 (Modificated Intrusion Pattern Classification Technique based on Bayesian Network)

  • 차병래;박경우;서재현
    • 인터넷정보학회논문지
    • /
    • 제4권2호
    • /
    • pp.69-80
    • /
    • 2003
  • 프로그램 행위 침입 탐지 기법은 데몬 프로그램이나 루트 권한으로 실행되는 프로그램이 발생시키는 시스템 호출들을 분석하고 프로파일을 구축하여 변형된 공격을 효과적으로 탐지한다. 본 논문에서는 베이지안 네트워크와 다중 서열 정렬을 이용하여 여러 프로세스의 시스템 호출간의 관계를 표현하고, 프로그램 행위를 모델링하여 변형된 이상 침입 행위를 분류함으로써 이상행위를 탐지한다. 제안한 기법을 UNM 데이터를 이용한 시뮬레이션을 수행하였다.

  • PDF

쇠무릎(Achyranthes japonica Nakai)으로부터 Ecdysteroid 생합성에 관련된 유전자의 분리 (Isolation of Genes Involved in Ecdysteroids Biosynthesis from Achyranthes japonica Nakai)

  • 부경환;김소미;진성범;채현병;이도승;김대운;조문제;류기중
    • Applied Biological Chemistry
    • /
    • 제44권3호
    • /
    • pp.153-161
    • /
    • 2001
  • Ecdysteroid 생합성에 관련된 식물 유전자를 분리할 목적으로 ecdysteroid 생성능이 확인된 쇠무릎(Achyranthes japonica Nakai)으로부터 RNA를 분리하고, ecdysteroid 생합성에 관여한다고 알려진 cytochrome P45O family 유전자 4개와 곤충의 ecdysone 20-hydroxylase 유전자의 다중정렬 분석결과를 토대로 상동성이 높은 부위의 염기서열에 상응하는 degenerate primer를 사용하여 RT-PCR을 행하고, 고유한 염기서열을 가진 partical cDNA clone 14개를 선발했다. 기존에 ecdysteroid 생합성에 관여한다고 알려진 cytochrome P450 family 유전자들과의 염기 및 아미노산 서열의 상동성을 분석한 결과, 선발된 cDNA 중 6개가 cytochrome P45O fumily 유전자들과 상동성이 있는 것으로 나타났다. 이 중에서 4개의 clone은 곤충의 ecdysone 20-hydroxylase 유전자와도 상동성이 높아 ecdysteroid 생합성에 관련된 유전자로 추정되었다.

  • PDF

다중 관계 그래프를 이용한 유전체 보존영역의 계층적 시각화와 개략적 전사 annotation 도구 (Rough Computational Annotation and Hierarchical Conserved Area Viewing Tool for Genomes Using Multiple Relation Graph.)

  • 이도훈
    • 생명과학회지
    • /
    • 제18권4호
    • /
    • pp.565-571
    • /
    • 2008
  • 생물정보학의 발전으로 다양한 형태의 생물정보가 컴퓨터 프로그램에 의해 양산되고 있다. 단순한 서열간의 비교나 작은 규모의 자료를 처리하기 보다는 다각화된 정보와 대규모의 생물정보를 취급하고 있다. 그 중에서 시각화와 annotation를 위한 도구개발은 지난 10년간 많은 연구가 되고 있는 분야이다. 그럼에도 일반화된 도구 개발은 생물정보의 다양성과 사용자 요구의 다양화로 인해 매우 어렵다. 본 논문에서는 유전체간 알려진 정보와 다중 관계 그래프를 이용하여 이를 annotation하고 시각화하는 GenoVA 시스템을 제안한다. 다중 정렬을 위한 몇 개의 프로그램이 존재하지만 그 방법들이 서열내의 복잡성 때문에 많은 정보가 누락된다. 따라서 제안된 방법에서는 pairwise alignment를 확장하여 모든 유전체간 비교를 통해 연관성 도출한다. 유전체간 보존되는 영역의 빈도수와 BLAST 점수가 높은 것을 블록노드라 하고 이들 간의 연관관계를 다중 관계 그래프로 표현하였다. 또한 GenoVA는 알려진 정보, COG, 유전자를 시각화하고 다중 관계 그래프의 한 영역을 중심으로 클러스터링된 경로를 계층적으로 보여주었다. 이때 누락되거나 알려지지 않은 유전자나 다른 annotation정보 추출할 수 있다. 본 논문의 실험을 위해 열 개의 박테리아 유전체가 사용되었고 시각화와 annotation을 위한 자료로 활용하였다. GenoVA는 새로운 유전체에 대한 개략적이고 전산적 annotation을 직관적이고 편리하게 제공한다.

둥굴레속 식물의 18S rDNA 염기서열의 특성 (Characterization of 18S rDNA in Polygonatum spp. Collections)

  • 윤종선;김익환;박재성;이철희;홍의연;윤태;정승근
    • 한국약용작물학회지
    • /
    • 제14권3호
    • /
    • pp.178-182
    • /
    • 2006
  • 둥굴레 유전자원의 유연관계를 위한 기초 자료를 얻고자 둥굴레속 식물 수집종 10종에서 18S ribosomal RNA를 암호화하는 18S rDNA 영역의 염기서열을 결정하고 그 특성을 분석한 결과를 요약하면 다음과 같다. 둥굴레속 10종의 18S rDNA 영역 전체의 길이는 $913{\sim}914bp$로 비슷하였으나, 총 8개 지점에서 염기의 치환 및 결실에 의한 변이가 발생하였다. 전위는 $T{\rightarrow}C$전위가 4개 지점에서 발생하였고, $A{\rightarrow}G$ 전위가 1개 지점에서 발생하였으며, 전좌는 $C{\rightarrow}A$ 전좌가 1개 지점에서 발생하여 전위가 전좌보다 5배 만큼 발생하였다. 결실은 2개 지점에서 발생하였다. 18S rDNA의 염기의 조성은 adenine $23.09{\sim}23.33%$, guanine $23.33{\sim}23.52%$, thymine $25.60{\sim}25.85%$, cytosine $27.38{\sim}27.79%$로 pyrimidine계가 purine계보다 많았다. 18S rDNA의 A + T 함량은 $48.80{\sim}49.18%$로 평균 48.99%였고, G+C 함량은 $50.82{\sim}51.20%$로 평균51.01%였다. 다중 정렬에 의해 염기서열을 비교한 결과 $99.7{\sim}100%$ 일치하여 종간에 차이가 적었다.

바이오인포매틱스 기법을 활용한 SARS 코로나바이러스의 유전정보 연구 (A Study on the Genomic Patterns of SARS coronavirus using Bioinformtaics Techniques)

  • 안인성;정병진;손현석
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2007년도 추계 종합학술대회 논문집
    • /
    • pp.522-526
    • /
    • 2007
  • 중중급성호흡기증후군(SARS, Severe Acute Respiratory Syndrome)은 전 세계적으로 알려진 바가 없었던 신종 급성 전염성 질환으로써, 2003년 아시아로부터 북미와 유럽지역까지 빠른 속도로 전파되어 나간 이후로부터 많은 과학자들의 연구의 대상이 되어오고 있다. 계통발생학적인 관점에서 SARS 바이러스는 Coronavirus 속에 속하는 것으로 알려져 있으나, 전체적인 유전정보 면에서는 다른 코로나바이러스들에 비하여 진화상으로 보존된 부분들이 현저하게 적은 경향을 나타낸다. 자연계에서의 SARS 코로나바이러스(SARS-CoV)의 숙주생물종에 대해서는 아직까지도 명확히 알려지지 않고 있다. 본 연구에서는 SARS-CoV의 유전서열들을 대상으로 다중서열정렬법, 계통발생학적 분석기법 및 다변량 통계분석법 등과 같은 바이오인포매틱스 분석기법들을 활용하여 이 바이러스의 유전정보 패턴을 분석하였다. Relative synonymous codon usage(RSCU)값을 포함하는 여러 유전정보 파라미터들은 Coronavirus와 Lentivirus 속과 Orthomyxoviridae과로부터 수집된 총 30,305개의 암호화 서열들로부터 계산이 되었으며 이 모든 계산은 KISTI 슈퍼컴퓨팅센터의 SMP 클러스터 상에서 수행되었다. 분석 결과, SARS-CoV는 feline 코로나바이러스와 매우 유사한 RSCU 패턴을 나타내었는데, 이것은 기존에 보고되었던 혈청학적인 연구결과와 일치하는 결과였다. 또한 SARS-CoV와 human immunodeficiency virus 및 influenza A virus는 공통적으로 각각이 속한 속이나 과내에서 상대적으로 낮은 RSCU bias를 나타내어서 이와 같은 현상이 이들 바이러스들이 종 간 장벽을 뛰어넘어 전파되는 과정에 영향을 미쳤을 가능성을 시사하였다. 결론적으로 이와 같은 바이오인포매틱스 분석기법들을 활용한 대용량의 유전정보 분석은 유전체 역학 연구에 효과적으로 사용될 수 있을 것으로 기대된다.

  • PDF