• Title/Summary/Keyword: 서열검색

Search Result 173, Processing Time 0.024 seconds

Design and Implementation of Personalized Sequence BLAST System (전용 서열블라스트 시스템 설계 및 구현)

  • Young-Sang Choi;Han-Suk Choi
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2008.11a
    • /
    • pp.364-366
    • /
    • 2008
  • 본 논문에서는 지놈 연구에서 반드시 필요한 유전체 서열정보의 상동성 검색을 위해 해외 데이터베이스에만 의존하고 있는 국내 지놈 연구자들에게 더욱 빠르고 쉽게 접근할 수 있는 서열블라스트를 만들 수 있는 방법을 제공함으로써 국내 지놈연구에 도움이되고자 특정 종류의 유전자정보 만을 모아놓은 지놈 서열블라스트 시스템을 설계하고 구현하는 방법을 제시하였다. 이 시스템을 활용하면 많은 생물 지놈 연구자들의 연구시간을 획기적으로 단축할 수 있을 것이다.

Performance Improvement of BLAST using Grid Computing and Implementation of Genome Sequence Analysis System (그리드 컴퓨팅을 이용한 BLAST 성능개선 및 유전체 서열분석 시스템 구현)

  • Kim, Dong-Wook;Choi, Han-Suk
    • The Journal of the Korea Contents Association
    • /
    • v.10 no.7
    • /
    • pp.81-87
    • /
    • 2010
  • This paper proposes a G-BLAST(BLAST using Grid Computing) system, an integrated software package for BLAST searches operated in heterogeneous distributed environment. G-BLAST employed 'database splicing' method to improve the performance of BLAST searches using exists computing resources. G-BLAST is a basic local alignment search tool of DNA Sequence using grid computing in heterogeneous distributed environment. The G-BLAST improved the existing BLAST search performance in gene sequence analysis. Also G-BLAST implemented the pipeline and data management method for users to easily manage and analyze the BLAST search results. The proposed G-BLAST system has been confirmed the speed and efficiency of BLAST search performance in heterogeneous distributed computing.

Nucleotide Sequence and Secondary Structure of 16S rRNA from Sphingomonas chungbukensis DJ77 (Sphingomonas chungbukensis DJ77의 16S rRNA 염기서열과 이차구조)

  • Lee Kwan-Young;Kwon Hae-Ryong;Lee Won-Ho;Kim Young-Chang
    • Korean Journal of Microbiology
    • /
    • v.41 no.2
    • /
    • pp.125-128
    • /
    • 2005
  • A 16S ribosomal RNA gene from S. chungbukensis DJ77 has been sequenced. This sequence had a length of 1,502 bp and was extended for 29 bp at 5' and for 37 bp at 3' from the partial sequence (1,435 bp) registered in 2000 year. Besides, 1 bp was newly added near to the 3' end. We made the secondary structure of the 16S rRNA based on E. coli model and found four specific regions. We found constant and variable regions in genus Sphingomonas as the result of multiple alignment of 16S rRNA gene sequences from Sphingomonas spp. and S. chungbukensis DJ77. We found a stem loop structure in S. chungbukensis DJ77, which was only discovered in C. jejuni to date. It showed the structural agreement despite the difference of the sequences from the both organisms. Finally, S. chungbukensis DJ77 belonged to cluster II (Sphingobium) group, after the classification using phylogenetic analysis and nucleotide signature analysis.

Prediction of ORFs in Metagenome by Using Cis-acting Transcriptional and Translational Factors (메타게놈 서열에 존재하는 보존적인 전사와 번역 인자를 이용한 ORF 예측)

  • Cheong, Dea-Eun;Kim, Geun-Joong
    • KSBB Journal
    • /
    • v.25 no.5
    • /
    • pp.490-496
    • /
    • 2010
  • As sequencing technologies are steadily improving, massive sequence data have been accumulated in public databases. Thereby, programs based on various algorithms are developed to mine useful information, such as genes, operons and regulatory factors,from these sequences. However, despite its usefulness in a wide range of applications, comprehensive analyses of metagenome using these programs have some drawbacks, thereby yielding inaccurate or complex results. We here provide a possibility of signature sequences (cis-acting transcriptional and translational factors of metagenome) as a hallmark of ORFs finding from metagenome.

Image Search Algorithm with Tile Alignment (타일 정렬을 이용한 이미지 검색 알고리즘)

  • 박웅;전호윤;신종우;전명재;조환규
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.712-714
    • /
    • 2004
  • 인터넷상의 대부분 이미지 검색엔진들은 이미지의 실제 내용보다는 이미지 파일명이나 부가적인 색인과 같은 문자 정보에 의존하여 이미지 검색을 하고 있다. 한편 이미지의 색상 정보를 비교에 사용하는 RGB 히스토그램 방법은 수행시간은 짧지만 형태는 고려하지 않기 때문에 높은 정확도는 기대하기 어렵다. 본 논문에서는 이미지의 실제 내용을 비교하여 비정형의 복잡한 물체를 검색하는 새로운 이미지 검색 알고리즘을 제안한다. 제안하는 알고리즘은 이미지의 색상과 형태 정보를 담은 타일 서열을 local alignment 알고리즘으로 정렬하여 이미지 검색을 한다 비정형 물체인 음식 사진을 사용한 실험에서 기존의 방법 RGB 히스토그램을 이용한 방법보다 월등히 향상된 정확도를 나타내었다.

  • PDF

Design of Web-based Phylogentic Tree Inference System Using DataBase (데이터 베이스를 이용한 웹 기반 계통수 추론 시스템 설계)

  • Kim, Shin-Suck;Hwang, Bu-Hyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.10a
    • /
    • pp.121-124
    • /
    • 2001
  • 계통수는 특정 객체의 분류 즉 특정 객체로부터 추출한 염기서열을 이용하여 그 객체의 소속 분류 집단을 결정하기 위해서 사용될 수 있다. 만약 특정지역에서 획득한 토끼의 종을 구분하기 위해서 이미 분류된 토끼의 염기서열들을 가지고 염기서열들과의 관계를 표현하는 계통수를 제작함으로써, 객체를 분류 할 수 있다. 계통수 제작은 기존의 계통수 제작 도구들(MEGA등)이 사용되지만, 이러한 계통수 제작 도구는 객체의 어떤 특성에 의해서 종이 나뉘어지는 가는 예측 할 수 없다. 계통수 제작에 이용되는 염기서열 데이터는 기존의 염기서열 데이터 베이스들(EMBL, GenBank, DDBJ)에서 인터넷을 이용하여 찾을 수 있지만, 계통생물학을 위해 누적된 데이터가 아니므로, 계통수 제작을 위해서는 사용이 제한적이다. 또 계통수 제작 도구을 사용하기 위해서는 자신이 관련 염기서열 데이터를 수집하여야 한다. 본 논문은 웹기반 계통수 추론 시스템을 제시한다. 본 시스템은 염기서열 데이터를 검색하여, 계통 분류 즉 계통수 제작을 위한 데이터로 저장하고, 이를 이용하여 계통수를 그릴 수 있다. 또한 이렇게 저장된 데이터는 데이터 마이닝 분류 기법을 사용하여, 각 객체 분류 집단을 모델링하며, 분류 속성을 예측할 수 있다.

  • PDF

Modelling of three Dimensional Structure in Protein based on Spatial Object Model (공간객체 모델 기반 단백질 3차 구조 모델링)

  • Han, Yu;Park, Seng-Hee;Lee, Sun-Hee;Ryu, Keun-Ho
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.73-75
    • /
    • 2002
  • PDB에서 제공하는 단백질 3차원 고분자결정 구조에 대한 플랫파일은 인자들의 좌표, 서열정보, 실험정보 및 참조 정보가 포함된다. 이러한 정보를 포함하고 있는 플랫파일로부터 필수적인 구조정보 및 서열정보 등의 효율적인 검색을 위해서는 이러한 데이터를 추출하여 데이터베이스 구축이 요구되며 이 때 단백질 구조 및 서열 정보와 실험 및 탐조 정보의 관계에 대한 모델링이 중요하다. 따라서 이 논문에서는 PDB에서 제공하는 플랫파일들의 엔트리들을 분석하고 3차원 공간 객체의 기하적 특성을 갖는 단백질 3차 구조를 공간객체로 표현하고 공간객체 모델을 적용하여 모델링한다. 이렇게 함으로써 단백질 3차 구조 분자를 구성하는 인자 및 구조 정보 검색이 가능하며 위상 및 기하 연산자글 이용하여 단백질 구조 분석에 활용할 수 있다.

  • PDF

Method of Image Similarity Analysis Using Sequence Alignment of Colors (색상 서열 비교를 통한 영상의 유사도 분석 기법)

  • Jung, In-Joon;Woo, Gyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.04a
    • /
    • pp.426-429
    • /
    • 2011
  • 영상처리를 이용한 영상간의 유사도 비교 기법은 영상의 검색 및 영상의 자동 인식 등을 위한 연구로 최근 각광받고 있다. 최근 영상 처리 기법은 화소의 질적 향상 및 처리시간 최적화, 효율적인 특정 요소의 추출 등 다양한 방법으로 시도되고 있다. 특히, 영상의 유사도 비교는 유사 영상 검색과 같은 경우에 많이 쓰인다. 영상의 유사도를 비교하기 위한 기법으로는 영상 데이터의 특징에 따라 대상 영역을 여러 영역으로 나누는 영역분할 기법과 군집화, 퍼지, 유전자 알고리즘 등이 있다. 본 논문에서는 영상을 HSV 색공간으로 변환한 후 색상 값에 대하여 전역 정렬 기법을 사용하는 유사도 측정 방법을 제시한다. 전역 정렬 기법은 유전자 서열 비교 기법 중 하나로서 두 유전체의 유사도를 측정하는데 사용된다. 유사도 측정 효율을 높이기 위해 색상 값을 8단계로 양자화하여 영상의 서열을 생성하였다. 실험결과 제시한 방법을 영상 회전이나 대칭, 글자 삽입 등의 간단한 연산에 크게 영향을 받지 않는 것으로 드러났다.

RCA-mer: A Web-Based Program Searching for Primer Candidates (핵산증폭용 특정 길이의 Primer 검색 프로그램)

  • Cho, Young-Hoon;Park, Kie-Jung;Lee, Dae-Sang
    • Korean Journal of Microbiology
    • /
    • v.44 no.2
    • /
    • pp.164-167
    • /
    • 2008
  • Recently, rolling circle amplification (RCA) technique has been widely focused in the field of gene amplification just like PCR method. We have developed RCA-mer, which is a web-based program searching for primer candidates from a given sequence. It can be applied to find primer lists in DNA amplification experiment based on RCA method. The RCA-mer compares 8-mer primer lists with user's input sequence such as vector, mitochondria, and microbial genome sequence. After calculating 8-mers existences in a given sequence, it displays matched and no-matched primer lists with their GC-contents. In addition to it, RCA-mer can search the existence of 8-mer primer lists in two sequences whether they are co-existed or not. Users can apply candidate primer lists to their researches which use RCA techniques.

A Methodology of the Information Retrieval System Using Fuzzy Connection Matrix and Document Connectivity Order (색인어 퍼지 관계와 서열기법을 이용한 정보 검색 방법론)

  • Kim, Chul;Lee, Seung-Chai;Kim, Byung-Ki
    • The Transactions of the Korea Information Processing Society
    • /
    • v.3 no.5
    • /
    • pp.1160-1169
    • /
    • 1996
  • In this study, an experiment of information retrieval using fuzzy connection matrix of keywords was conducted. A query for retrieval was constructed from each keyword and Boolean operator such as AND, OR, NOT. In a workstation environment, the performance of the fuzzy retrieval system was proved to be considerably effective than that of the system using the crisp set theory. And both recall ratio and precision ratio showed that the proposed technique would be a possible alternative in future information retrieval. Some special features of this experimental system were ; ranking the results in the order of connectivity, making the retrieval results correspond flexibly by changing the threshold value, trying to accord the retrieval process with the retrieval semantics by treating the averse-connectivity (fuzzy value) as a semantic approximation between kewords.

  • PDF