• 제목/요약/키워드: Sequence similarity

검색결과 1,022건 처리시간 0.022초

Cloning and Sequencing of the ${\alpha}-1{\rightarrow}6$ Dextransurcrase Gene from Leuconostoc mensenteroides B-742CB

  • Kim, Ho-Sang;Kim, Do-Man;Ryu, Hwa-Ja;Robyt, John-F.
    • Journal of Microbiology and Biotechnology
    • /
    • 제10권4호
    • /
    • pp.559-563
    • /
    • 2000
  • A dextransucrase gene (dsrB742) that expresses a dextransucrase to synthesize mostly ${\alpha}-1{\rightarrow}6$ linked dextran with a low amount (3-5%) of ${\alpha}-1{\rightarrow}3$ branching was cloned and sequenced from Leuconostoc mesenteroides B-742CB. The 6.1-kb PstI fragments were ligated with pGEM-3Zf(-) and transformed into E. coli $DH5{\alpha}$. The recombinant clone (pDSRB742) synthesized dextran on an agar plate containing 2% (w/v) sucrose. The dextran synthesized was hydrolyzed with Penicillium endo-dextranase. The hydrolyzate was composed of glucose, isomaltose, isomaltotriose, and branced pentasaccharide. The nucleotide sequence of dsrB742 showed one open reading frame (ORF) composed of 4,524 bp encoding dextrasnsucrase. The deduced amino acid sequence revealed a calculated molecular mass of 168.6 kDa. It also showed an activity band of 184 kKa on a non-denaturing SDS-PAGE (10%). The amino acid sequence of DSRB742 exhibited a 50% similarity with DSRA from L. mesenteroides B-1299, a 70% similarity with DSRS from L. mesenteroides B-512 (F, FMCM) and a 45-56% similarity with Streptococcal GTFs.

  • PDF

유전체 서열의 정렬 기법을 이용한 소스 코드 표절 검사 (Applying Genomic Sequence Alignment Methodology for Source Codes Plagiarism Detection)

  • 강은미;황미녕;조환규
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제9권3호
    • /
    • pp.352-367
    • /
    • 2003
  • 일반적인 컴퓨터 프로그램의 구성적, 구문적 특징은 소스 코드로부터 추출한 키워드들의 서열로 나타낼 수 있다. 따라서 추출한 키워드의 서열을 비교하면 두 프로그램의 유사성과 상이점에 대해서 잘 파악할 수 있다. 서열의 유사성을 측정하는 여러 가지 방법은 생물학적 유전자 서열을 다루는 생물정보학에서 활발한 연구가 이루어져왔다. 본 논문에서 우리는 두 프로그램간의 유사성을 측정하고 서열 정렬 방법을 이용하여 부분 표절 검출을 하는 새로운 방법을 제안한다. 제시한 방법의 성능을 평가하기 위해서, 2001년 자료구조 수업에 참석한 수강생들이 제출한 프로그램을 실험 데이타로 사용하여 표절을 검사하였다. 실험결과는 제안된 기법이 표절 검사에 있어 가장 널리 사용되는 지문법(fingerprint)보다 더 효과적임을 보여 주었다.

비디오 검색 시스템을 위한 데이터 시퀀스 패턴 유사성 검색 (Pattern Similarity Retrieval of Data Sequences for Video Retrieval System)

  • 이석룡
    • 정보처리학회논문지D
    • /
    • 제13D권3호
    • /
    • pp.347-356
    • /
    • 2006
  • 비디오 스트림은 다차원 공간에서 데이터 포인트의 시퀀스로 표현될 수 있다. 본 논문에서는 시퀀스 내의 데이터 포인트들의 값들의 근사치에 대한 정보와 시퀀스 내의 포인트들의 방향성에 대한 정보를 내포하고 있는 트랜드 벡터(trend vector)에 대한 소개와 이 벡터를 이용하여 데이터 시퀀스를 위한 유사 패턴 검색 기법을 제안한다. 시퀀스는 복수 개의 세그먼트로 분할되며 각 세그먼트는 트랜드 벡터로 표현된다. 질의처리는 시퀀스 내의 각각의 포인트들에 대하여 수행되는 대신, 트랜드 벡터들에 대하여 처리된다. 제안한 기법은 이 벡터를 사용하여 질의와 무관한 데이터 시퀀스들을 데이터베이스로부터 여과하고 질의 시퀀스와 유사한 시퀀스들을 검색하도록 설계되었다. 제안한 기법을 검증하기 위하여 비디오 스트림과 가상으로 생성된 데이터에 관하여 실험을 수행하였으며, 실험 결과 제안한 기법의 정밀도(precision)는 기존의 방법에 비하여 2.1배까지 향상되었으며 처리시간은 45%까지 감소되었음을 보여주고 있다.

Content similarity matching for video sequence identification

  • Kim, Sang-Hyun
    • International Journal of Contents
    • /
    • 제6권3호
    • /
    • pp.5-9
    • /
    • 2010
  • To manage large database system with video, effective video indexing and retrieval are required. A large number of video retrieval algorithms have been presented for frame-wise user query or video content query, whereas a few video identification algorithms have been proposed for video sequence query. In this paper, we propose an effective video identification algorithm for video sequence query that employs the Cauchy function of histograms between successive frames and the modified Hausdorff distance. To effectively match the video sequences with a low computational load, we make use of the key frames extracted by the cumulative Cauchy function and compare the set of key frames using the modified Hausdorff distance. Experimental results with several color video sequences show that the proposed algorithm for video identification yields remarkably higher performance than conventional algorithms such as Euclidean metric, and directed divergence methods.

Sequence analysis of the schizosaccharomycs pombe homologue of the CDC3 gene in saccharomyces cerevisiae

  • Kim, Hyong-Bai
    • Journal of Microbiology
    • /
    • 제33권4호
    • /
    • pp.350-354
    • /
    • 1995
  • Saccharomyces cervisiae has a highly ordered ring of filaments that lies just inside the cytoplasmic membrane in the region of the mother-bud neck. Mutants defective in any one of the our cell division cycle genes (CDC3, CDC10, CDC11, CDC12) fail to form these filaments and exhibit a pleiotropic phenotype that includes failure to complete cytokinesis and abnormal bud growth. However, the role of the filament is not clear. In order to find out the role of filament, the similar gene in S pombe (called cdc103$\^$+) to the CDC3 was cloned and sequenced. Here I report the sequence analysis of the cdc103$\^$+/ ) to the CDC3 was cloned and sequenced. Here I report the sequence analysis of the cdc103$\^$+/. Comparison of the predicted amino acid sequences of cdc103$\^$+/ and CDC3 revealed that they share significant similarity (43% identity and 56% identity or similarity) to each other.

  • PDF

NBLAST: a graphical user interface-based two-way BLAST software with a dot plot viewer

  • Choi, Beom-Soon;Choi, Seon Kang;Kim, Nam-Soo;Choi, Ik-Young
    • Genomics & Informatics
    • /
    • 제20권3호
    • /
    • pp.36.1-36.6
    • /
    • 2022
  • BLAST, a basic bioinformatics tool for searching local sequence similarity, has been one of the most widely used bioinformatics programs since its introduction in 1990. Users generally use the web-based NCBI-BLAST program for BLAST analysis. However, users with large sequence data are often faced with a problem of upload size limitation while using the web-based BLAST program. This proves inconvenient as scientists often want to run BLAST on their own data, such as transcriptome or whole genome sequences. To overcome this issue, we developed NBLAST, a graphical user interface-based BLAST program that employs a two-way system, allowing the use of input sequences either as "query" or "target" in the BLAST analysis. NBLAST is also equipped with a dot plot viewer, thus allowing researchers to create custom database for BLAST and run a dot plot similarity analysis within a single program. It is available to access to the NBLAST with http://nbitglobal.com/nblast.

계산속도 및 정확도의 적응적 제어가 가능한 다단계 문서 비교 시스템 (Multi-Level Sequence Alignment : An Adaptive Control Method Between Speed and Accuracy for Document Comparison)

  • 서종규;탁해성;조환규
    • 정보과학회 논문지
    • /
    • 제41권9호
    • /
    • pp.728-743
    • /
    • 2014
  • 유사한 문서를 비교하는 방법으로는 지문법과 서열 정렬법이 널리 알려져 있다. 지문법은 계산속도가 빠른 대신 정확도가 떨어지며, 서열정렬법은 계산속도가 느린 대신 정확도가 높다. 다단계 정렬은 두 방법의 비중을 조절하여 문서 유사도를 비교할 수 있는 새로운 방법의 문서 유사도 측정 방법으로, 각 방법의 장점을 얻으면서 동시에 단점을 보완하도록 고안되었다. 특히 두 비교 방법의 비중을 "블록크기"라는 단일 변수를 이용하여 조절할 수 있도록 한 것이 제안 시스템의 핵심이다. 다단계 정렬은 문서를 일정한 길이의 블록으로 나누어 지문을 추출하고 블록간의 유사도를 계산한 다음 그 결과를 서열정렬법으로 다시 한 번 탐색하는 과정을 거친다. 이때 문서가 분할되는 과정에서 유사구간이 두 개 이상의 블록으로 나누어지는 현상이 발생하기도 한다. 이 논문에서는 다단계 정렬방법에 대해 설명하고, 유사도 비교 성능 개선을 위한 단편화 제거 기법과 휴리스틱 비교법에 대해 설명하고 실험적으로 그 결과를 보인다.

Nrf2 and Keap1 Regulation of Antioxidant and Phase II Enzyme Genes

  • Yamamoto, M.
    • 한국독성학회:학술대회논문집
    • /
    • 한국독성학회 2002년도 Current Trends in Toxicological Sciences
    • /
    • pp.24-42
    • /
    • 2002
  • Antioxidant responsive element (ARE) mediates the transcriptional activation of the genes encoding phase II drug metabolizing enzymes and antioxidative stress genes. The ARE consensus sequence shows high similarity to NF-E2 binding sequence, a cisacting erythroid gene regulatory element.(omitted)

  • PDF

정적 주요 경로 API 시퀀스를 이용한 소프트웨어 유사성 검사 (Detecting Software Similarity Using API Sequences on Static Major Paths)

  • 박성수;한환수
    • 정보과학회 논문지
    • /
    • 제41권12호
    • /
    • pp.1007-1012
    • /
    • 2014
  • 소스코드가 없이 실행코드만으로 소프트웨어 간의 유사성을 비교하기위해 소프트웨어 버스마크를 이용한다. 소프트웨어 버스마크란 그 소프트웨어만의 고유한 특징으로 소프트웨어 식별에 사용된다. 본 논문에서는 정적 주요경로 상의 API 함수 시퀀스를 이용하여 소프트웨어 간의 유사성을 산정하는 방법을 제시한다. 바이너리코드에서 소프트웨어의 특성이 뚜렷하게 나타나는 API 함수만을 사용하여 소프트웨어 유사성 검사의 신뢰성을 높이고, 정적 분석 기법에 동적 분석 기법의 특징을 적용하여 강인성을 높이는 방법을 모색하였다. 정적 분석으로 바이너리코드의 주요경로를 추출하고, API 함수 시퀀스 간의 효과적인 유사성 측정을 위해 서열정렬 알고리즘인 Smith-Waterman 알고리즘을 이용한 유사성 척도를 제안한다. 버스마크의 신뢰성을 평가하기 위하여 같은 프로그램의 여러 버전을 대상으로 실험하였고, 강인성을 평가하기 위해 오픈소스 소프트웨어의 소스코드를 다양한 컴파일환경으로 바꾸어 실험하였다.

효율적인 비디오 시퀀스 정합 알고리즘 (An Efficient Video Sequence Matching Algorithm)

  • 김상현;박래홍
    • 대한전자공학회논문지SP
    • /
    • 제41권5호
    • /
    • pp.45-52
    • /
    • 2004
  • 디지털 미디어의 증가로 비디오 시퀀스를 효율적으로 정합하기 위한 다양한 알고리즘이 제안되었다 기존의 비디오 검색 알고리즘에서는 주로 프레임 단위의 질의에 관한 검색 알고리즘이 연구되었으나 비디오 시퀀스 단위의 질의에 관한 정합 알고리즘 연구는 미진하였다. 본 논문에서는 비디오 시퀀스 질의에 관한 효율적인 비디오 색인과 검색 알고리즘을 제안한다. 시퀀스 정합의 정확도와 성능 향상을 위하여 연속되는 프레임의 히스토그램간의 유사도 함수로 커쉬함수를 사용하였으며 기존의 방법에 비해 높은 성능을 나타내었다. 비디오 샷들로부터 추출된 키프레임들은 샷묶음 뿐만 아니라 비디오 시퀀스 정합이나 브라우징에도 사용되며 여기서 키프레임은 이전 프레임들과 중요한 차이를 보이는 프레임을 나타낸다. 몇가지 키프레임 알고리즘이 제안되었고 적절한 유사도 측정을 통해 샷경계 검출과 유사한 방법으로 키프레임 추출이 가능하다. 본 논문에서는 누적된 커쉬함수를 사용하여 효과적으로 키프레임을 추출하는 알고리즘을 제안하고 기존의 방법들과의 성능을 비교한다. 비디오 시퀀스 정합은 키프레임간의 유사도 측정에 의해 수행될 수 있다 본 논문에서는 추출된 키프레임의 정합 효율을 향상 시키기 위하여 커쉬함수와 하우스도르프 거리를 사용하였다. 몇가지 실험 영상을 이용한 실험결과 제안한 방법은 기존의 방법에 비해적은 계산량으로 높은 정합 성능을 보였다.