• 제목/요약/키워드: 서열 유사성

검색결과 468건 처리시간 0.03초

정규화된 지역 정렬 알고리즘을 적용한 다중 지역 정렬 알고리즘 (An Algorithm for multiple local alignment with Normalized Local Alignment Algorithm)

  • 장석봉;이계성
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (중)
    • /
    • pp.1019-1022
    • /
    • 2003
  • 두 서열을 비교하여 유사성(similarity)이나 상동성(homology)를 찾기 위한 서열 정렬 방법 중에서 지역 정렬에 많이 사용되는 Smith-Waterman 알고리즘의 제한점인 Mosaic effect와 Shadow effect를 극복하기 위한 효율적인 방법을 살펴보고, 하나의 최대 값이 아닌 다수개의 최대 값을 찾아 다수개를 정렬함으로써 서열내에 존재 할 수 있는 다수개의 지역 정렬을 찾고 Normalized sequence alignment 알고리즘을 이용하여 서열 정렬된 결과들의 우선 순위를 매겨본다.

  • PDF

돼지와 사람의 설사유발 칼리시 바이러서의 염기서열 비교

  • 김현진;조경오;조호성;강성귀;박남용
    • 한국수의병리학회:학술대회논문집
    • /
    • 한국수의병리학회 2002년도 추계학술대회초록집
    • /
    • pp.140-140
    • /
    • 2002
  • 돼지 설사유발 칼리시 바이러스 (Porcine enteric calicivirus: PECV)는 자돈에서 설사를 일으키지만, 사람에서도 위장염을 일으키는 원인체인 Sapporo-like calicivirus와 형태학적으로나 유전학적으로 유사하다고 이미 알려졌다. 본 연구는 국내에서 발생하고 있는 PECV의 RNA dependent RNA polymerase (RDRP) 부위와 capsid 부위 염기서열과 아미노산 서열을 기존에 보고되었던 것과 비교하여 분류하였다. 연구 결과 국내 분리주는 기존의 PECV RDRP 부위 (염기서열: 90%, 아미노산: 97%) 와 유사성이 아주 높았으며 capsid 부위(염기서열: 83%, 아미노산: 81%)는 다소 낮았다. 또한 이 바이러스는 모든 칼리시 바이러스의 RDRP 부위에 특이적으로 존재하는 GLPSG와 YGDD 아미노산 배열이 존재하였으며 capsid 부위에서는 국내에서 발생한 PECV 에서만 "TAA" 염기서열이 삽입되어 있었다. 본 연구를 통하여 국내에서 발생한 PECV는 porcine sapporo-like calicivirus와 유사하며 그 외 caliciviridae과인 Norwalk-like virus, Vesivirus, Lagovirus와는 상이하다는 것이 규명되었다.

  • PDF

워크플로우 환경에서의 대규모 서열 유사성 검색 웹 서비스에 관한 연구 (A Study on Web Services for Sequence Similarity search in the Workflow Environment)

  • 정진영
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권6호
    • /
    • pp.41-49
    • /
    • 2008
  • 최근 생물정보학에서의 워크플로우 관리 도구를 이용한 생명 현상에 대한 연구가 활발하게 진행되고 있다. 워크플로우 관리 도구는 서비스의 재사용과 공유를 통해 연구자들이 서로 협업할 수 있는 기반으로 MyGrid 프로젝트의 Taverna를 비롯하여 Kepler, BioWMS 등의 다양한 워크플로우 관리 도구들이 오픈소스로 개발되어 사용 되고 있다. 이러한 워크플로우 관리 도구는 공간적으로 떨어진 서로 다른 서비스들을 웹 서비스 기술을 기반으로 하나의 작업공간에서 연구 과정을 모델링하고 자동화 할 수 있도록 해준다. 생물정보학에서 사용되는 많은 도구와 데이터베이스들이 웹 서비스 형태로 제공되어 워크플로우 관리 도구에서 사용되고 있다. 이러한 상황에서 생물정보학에서 기본으로 사용되는 서열 유사성 검색에 대한 웹 서비스의 개발과 안정적인 서비스 제공은 생물정보학 분야에서 필수적이라 할 수 있다. 본 논문에서는 리눅스 클러스터를 기반으로 생물학 서열 데이터의 유사성 검색 속도를 향상시키는 한편, 이를 웹 서비스 형태로 개발하여 워크플로우 관리 도구와의 연동하여 단시간에 서열 유사성 검색을 가능하게 하였다.

  • PDF

Bradyrhizobium sp. SNU001의 nodD와 nodA의 염기서열 (Nucleotide Sequences of nodD and nodA from Bradyrhizobium sp. SNU001)

  • 나영순;심웅섭;안정선
    • 미생물학회지
    • /
    • 제31권3호
    • /
    • pp.189-196
    • /
    • 1993
  • 대두(Glycine max) 뿌리혹의 질소고정 공생균주 Bradyhizobium sp. SNU001 의 nod D 와 nodA 의 염기서열을 결정하였다. 총 314개의 아미노산을 암호화하는 nod D 의 open reading frame (ORF) 은 942bp 로 B. japonicum USDA110 의 nodD1 과 99.4% 의 유사성을 보여주었으며, 총 210개의 아미노산을 암호화하고 콩과식물의 Bradyrhizobium 에서는 처음으로 염기서열이 결정된 nodA 의 ORF 는 630bp 로 B. sp. (Parasponia) 의 nodA 와 81.5% 의 유사성을 보여주었다. nodYAB 오페론과 nodD 상류에서는 9bp의 반복서열을 각각 4번, 2번 가지는 보존적인 nodbox 가 발견되었으며 nodD 의 상류에서는 A, T-rich 서열도 존재하였다.

  • PDF

유전체 서열의 정렬 기법을 이용한 소스 코드 표절 검사 (Applying Genomic Sequence Alignment Methodology for Source Codes Plagiarism Detection)

  • 강은미;황미녕;조환규
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제9권3호
    • /
    • pp.352-367
    • /
    • 2003
  • 일반적인 컴퓨터 프로그램의 구성적, 구문적 특징은 소스 코드로부터 추출한 키워드들의 서열로 나타낼 수 있다. 따라서 추출한 키워드의 서열을 비교하면 두 프로그램의 유사성과 상이점에 대해서 잘 파악할 수 있다. 서열의 유사성을 측정하는 여러 가지 방법은 생물학적 유전자 서열을 다루는 생물정보학에서 활발한 연구가 이루어져왔다. 본 논문에서 우리는 두 프로그램간의 유사성을 측정하고 서열 정렬 방법을 이용하여 부분 표절 검출을 하는 새로운 방법을 제안한다. 제시한 방법의 성능을 평가하기 위해서, 2001년 자료구조 수업에 참석한 수강생들이 제출한 프로그램을 실험 데이타로 사용하여 표절을 검사하였다. 실험결과는 제안된 기법이 표절 검사에 있어 가장 널리 사용되는 지문법(fingerprint)보다 더 효과적임을 보여 주었다.

As계의 오이 모자이크 바이러스 RNA4의 염기서열 결정 (Determination of Nucleotide Sequences of cDNA from Cucumber Mosaic Virus-As RNA4)

  • 김상현;박원목;이세영;박영인
    • 한국식물병리학회지
    • /
    • 제12권2호
    • /
    • pp.176-181
    • /
    • 1996
  • Aster yomena로부터 분리한 오이 모자이크 바이러스(cucumber mosaic virus) (CMV-As)의 RNA4로부터 완전한 길이의 cDNA를 합성하고 그 전체적인 염기서열(1,043 nt`s)을 결정하였다. CMV-As RNA4는 73개의 염기로 구성된 5`말단의 leader 부위, 657개의 염기로 구성된 외피단백질(coat protein) 유전자 부위 및 312개의 염기로 구성된 3` 말단의 비번역 부위로 구성되어 있음을 확인하였다. 외피단백질 유전자 부위의 염기서열을 다른 계통의 CMV와 비교해 볼 때 그 염기서열이 보전적으로 존재하고 있으나 그 외의 부분은 다양함을 확인하였다. 특히 3` 말단부위의 61개의 염기로 구성된 부위(959-1019)는 다른 계통의 CMV에서는 상당히 유사하지만 CMV-As도 다른 CMV처럼 tRNA와 유사한 구조를 역시 형성함을 확인하였다. CMV-As의 RNA4 염기서열을 다른 계통의 CMV와 비교할 때 CMV-I17F와 가장 유사하였으며(91.9%) S형의 CMV-M과는 가장 낮은 동일성을 보였다(71.1%). 외와 같은 염기성열의 비교 결과와 EcoRI 제한효소 인식부위의 존재로 미루어 CMV-As는 WT형으로 분류된다.

  • PDF

재귀적 지역정렬을 이용한 프로그램 표절 탐색 (Source code Plagiarism Detection with Recursive Local Alignments)

  • 전명재;이평준;조환규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (A)
    • /
    • pp.946-948
    • /
    • 2004
  • 지역정렬(local alignment)과 전체정렬(global alignment)로 대표되는 정렬 문제는 전산학 분야의 전형적인 문제로, 두 서열의 전체적인 또는 부문적인 유사성(similarity)을 찾아 주기 위한 방법이다. 특히 정렬은 두 문자열에서 유사하게 나타나는 유사 서브스트링을 찾아내는 문제라든가 근래의 생물정보학에서 두 DNA시퀀스간의 유사도를 판별하는 문제 등에서 매우 중요란 기법이다. 본 논문에서는 두 서열들을 유사하게 매칭 시켜 주는 기존의 정렬 방법을 응용, 변형하여 C, C++. JAVA등으로 짜여진 프로그램 소스들의 유사도를 측정하는 방법을 제시하였다. 실제로 이런 프로그램 소스의 표절은 대학교육 수업과정 등에서 빈번하게 발생되는 문제점으로서 본 논문에서는 프로그램 소스표절을 검사, 탐지할 수 있는 방법론 및 구체적인 프로그램과 그 결과를 제시하고 있다. 아울러 두 프로그램간의 유사성을 비교하기 위해 기존의 지역정렬 방법을 보다 효율적으로 적절히 변형시키는 방법을 제시하고 있다.

  • PDF

단백질 서열과 텍스트 정보 기반 오토마타 종 분류기 (Automata Species Classifier based on Protein Sequences and Text Information)

  • 박준형;이현정;양지훈;김선호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (B)
    • /
    • pp.9-14
    • /
    • 2007
  • 단백질 분류는 현대 생물학의 큰 도전과제이다. 현재 여러 단체에 의해 잘 관리되는 상세한 주석이 달린 많은 양의 단백질 정보들이 존재한다. 이러한 데이터베이스의 덕분으로 다양한 물리 화학적 특성과 주석들에 기반하고 있는 분류 기법들이 연구되고 있다. 특히 아미노산들로 이루어진 단백질 서열이 해당 단백질의 분류에 중요한 역할을 하는 진화적 기록들의 단서가 되기 때문에 단백질 서열들에 대한 연구가 활성화되고 있다. 비록 단백질 서열이 단백질 분류 문제의 중요한 특징이 된다고 해도 단순한 단백질 서열만으론 해당 단백질에 대한 충분한 정보를 얻을 수 없으며, 타 종 간에도 기능상 유사성 때문에 서로 비슷하게 판별될 수 있다. 이러한 문제점에 착안해서 우리는 오토마타 종 분류기라고 부르는 새로운 시스템적인 종 분류 접근 방법을 제안한다. 이 시스템의 클러스터링과 종 분류 판별 성능에 대한 평가 실험을 수행해본 결과 상대적으로 좋은 성능을 얻을 수 있었다.

  • PDF

Streptomyces coelicolor A3(2)에서 hrdA유사 Sigma 인자 유전자의 클로닝 (Cloning of hadA-like Sigma Factor Gene from Streptomyces coelicolor A3(2))

  • 한지숙;조은정;노정혜
    • 미생물학회지
    • /
    • 제32권4호
    • /
    • pp.264-270
    • /
    • 1994
  • 세균의 RNA 중합효소에서 여러 ${\sigma}$ 인자들 간에 보존된 아미노산 서열중 2.3 부위와 4.2 부위의 아미노산 서열로부터 유 n하여 두가지의 PCR primer를 제작하였다. 이들을 이용하여 PCR을 수행하였을 때, E. coli와 Streptomyces coelicolor의 DNA로부터 예상되었던 480 bp 정도의 DNA가 증폭되는 것을 관찰하였다. E. coli DNA에서 증폭된 DNA를 클로닝하여 염기서열을 결정한 결과 E. coli의 rpoS 유전자로부터 유래하였음을 알았다. 이를 탐침으로 S. coelicolor에서 genomic DNA hybridization을 수행하였을 때, PvuII 절편 두가지 (3.5 kb, 2.0 kb) 와 SalI 절편 두가지(3.4kb, 1.5 kb)에 탐침이 결합하는 것을 관찰하였다. 3.5 kb의 pvuII 절편을 sublibrary로부터 클로닝하고, 탐침이 결합하는 1.0kb의 BamHI/HincII 절편의 염기서열을 분석하였다. 부분적으로 결정된 염기서열을 BLAST 프로그램을 이용하여 GenBank와 EMBL, PDB 등의 data library의 유전자들과 비교하여 본 결과Streptomyces속의 ${\sigma}$인자들을 비롯한 Synechococcus종, Anabaena종, Pseudomonas aeruginosa, Stigmatella aurantica 등의 주된 ${\sigma}$ 인자와 높은 유사성을 보였다. 현재까지 1.2 부위와 4 부위에 해당하는 부분의 염기서열을 결정하였는데, 이 부분은 S. coelicolor에서 알려진 다섯가지의 ${\sigma}$ 인자 유전자 중 hrdA와 가장 높은 유사성을 보이며, 아미노산의 유사성이 1.2부위에서는 88%, 4 부위에서는 75%인 것으로 나타났다.

  • PDF