• Title/Summary/Keyword: 증가 부분서열

Search Result 37, Processing Time 0.027 seconds

Linear-time algorithms for computing a maximal increasing subsequence (극대 증가 부분서열을 찾는 선형 알고리즘)

  • Joong Chae Na
    • Smart Media Journal
    • /
    • v.12 no.6
    • /
    • pp.9-14
    • /
    • 2023
  • The longest increasing subsequence is a fundamental problem which has been studied for a long time in computer science. In this paper, we consider the maximal increasing subsequence problem where the constraint is released from the longest to the maximal. For two kinds of increasing (monotone increasing and strictly increasing), we propose linear-time algorithms computing a maximal increasing subsequence of an input sequence from an alphabet Σ. Our algorithm for computing a maximal monotone increasing subsequence requires O(1) space and our algorithm for computing a maximal strictly increasing subsequence requires O(|Σ|) space.

Scaled Sub-image Retrieval Approach using Alignment of Sub-Sequence (부분 서열 정렬을 이용한 확대축소 부분 영상 검색 기법)

  • Kim, JunHo;Jang, WonAng;Yang, IkSuk;Lee, DoHoon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.11a
    • /
    • pp.512-515
    • /
    • 2012
  • 부분 영상 검색은 질의 영상을 입력으로 사용해서 질의 영상을 부분 영상으로 포함하는 대상 영상을 찾아낸다. 본 논문에서는 부분 영상 검색에 생물정보학에서 사용하는 정렬(Alignment)을 이용한다. 생물정보학에서는 두 DNA 서열 간에 유사도를 비교하고 시각화하는 방법으로 점 행렬을 널리 사용한다. 두 영상을 정렬하기 위해서 먼저 질의 영상과 대상 영상을 일차원 명암도 영상 서열로 변환하고 정렬하여 부분 영상 후보 영역을 찾는다. 이전 연구[1]에서 정렬하는 방법은 두 서열의 길이의 곱만큼의 메모리 공간이 필요하므로 두 서열의 길이가 길어지면 필요한 메모리 공간이 선형적으로 증가했다. 본 논문에서는 영상 데이터의 특성을 이용해서 부분 서열 정렬로 필요한 메모리 공간을 줄였고 부가적인 효과로 처리시간이 감소하고 정확도가 상향되었다.

Protein Secondary Structure System Design Using Clustering Protein Database and Data Distribution Scheme (클러스터링 단백질 데이터베이스와 데이터 분산 기법을 적용한 단백질 이차구조예측 시스템 설계)

  • 이수진;김재훈;정진원;이원태
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04a
    • /
    • pp.82-84
    • /
    • 2003
  • 생물학 데이터베이스의 크기가 점점 증가함에 따라 데이터베이스를 사용하여 서열을 정렬할 경우 많은 처리시간이 필요하게 되었다. 단백질 이차구조예측 시스템에서 단백질 서열 데이터베이스를 이용해 사용자의 서열들을 정렬하는 부분에서도 많은 처리 시간을 요구한다. 본 논문에서는 단백질 데이터베이스를 비슷한 크기로 나눠 여러 노드에서 서열 정렬을 분산 처리하여 처리율을 높이고자 했다. 또한, ClustalW에서 서열들의 관계에 따라 다양한 BLOSUM을 사용하여 정렬의 정확도를 높이는 휴리스틱 전략을 적용하기 위해 기존의 데이터베이스를 클러스터링 하였다. 클러스터링된 데이터베이스의 대표서열과 사용자 서열의 거리를 비교하여 적합한 BLOSUM을 선택하여 보다 정확한 서열 정렬을 통해 단백질 이차구조예측의 정확도를 높이게 될 것이다. 본 논문에서는 대용량의 단백질 데이터베이스를 여러 노드를 사용하여 병렬 클러스터링하여 이를 이차구조예측 시스템에 적용하여 처리율과 정확도를 높이고자 하였다.

  • PDF

Improvement of SNPs detection efficient by reuse of sequences in Genotyping By Sequencing technology (유전체 서열 재사용을 이용한 Genotyping By Sequencing 기술의 단일 염기 다형성 탐지 효율 개선)

  • Baek, Jeong-Ho;Kim, Do-Wan;Kim, Junah;Lee, Tae-Ho
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.19 no.10
    • /
    • pp.2491-2499
    • /
    • 2015
  • Recently, the most popular technique to determine the Genotype, genetic features of individual organisms, is the GBS based on SNP from sequences determined by NGS. As analyzing the sequences by the GBS, TASSEL is the most used program to identify the genotypes. But, TASSEL has limitation that it uses only the partial sequences that is obtained by NGS. We tried to improve the efficiency in use of the sequences in order to solve the limitation. So, we constructed new data sets by quality checking, filtering the unused sequences with error rate below 0.1% and clipping the sequences considering the location of barcode and enzyme. As a result, approximately over 17% of the SNP detection efficiency was increased. In this paper, we suggest the method and the applied programs in order to detect more SNPs by using the disused sequences.

A Local Alignment Algorithm using Normalization by Functions (함수에 의한 정규화를 이용한 local alignment 알고리즘)

  • Lee, Sun-Ho;Park, Kun-Soo
    • Journal of KIISE:Computer Systems and Theory
    • /
    • v.34 no.5_6
    • /
    • pp.187-194
    • /
    • 2007
  • A local alignment algorithm does comparing two strings and finding a substring pair with size l and similarity s. To find a pair with both sufficient size and high similarity, existing normalization approaches maximize the ratio of the similarity to the size. In this paper, we introduce normalization by functions that maximizes f(s)/g(l), where f and g are non-decreasing functions. These functions, f and g, are determined by experiments comparing DNA sequences. In the experiments, our normalization by functions finds appropriate local alignments. For the previous algorithm, which evaluates the similarity by using the longest common subsequence, we show that the algorithm can also maximize the score normalized by functions, f(s)/g(l) without loss of time.

The Binding of 5-Iodopyrimidines by Human serum albumin (5-Iodopyrimidines와 Human serum albumin과의 결합(結合))

  • Lee, Jong-Jin
    • Applied Biological Chemistry
    • /
    • v.1
    • /
    • pp.48-54
    • /
    • 1960
  • Studing the binding of the 5-Iodopyrimdines by human serum albumin we obtained the following conclusions; 1. The more strong electron donating groups in the molecule of 5-Iodopyrimidines, the larger the binding force with human serum albumin. This trend seems to be attributed by increase of polarization of the electron donating groups in 5-Iodopyrimidines molecule. 2. The binding force of 5-Iodopyrimidines by human serum albumin is increased with the pH increasing could be occurred the configurational changes of human albumin molecule, and this new binding sites of human serum albumin molecule would form the intermolecular complex with 5-Iodopyrimidines molecule more strongly.

  • PDF

An Efficient Algorithm for Similarity Search in Large Biosequence Database (대용량 유전체를 위한 효율적인 유사성 검색 알고리즘)

  • Jeong, In-Seon;Park, Kyoung-Wook;Lim, Hyeong-Seok
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • v.9 no.2
    • /
    • pp.1073-1076
    • /
    • 2005
  • Since the size of biosequence database grows exponentially every year, it becomes impractical to use Smith-Waterman algorithm for exact sequence similarity search. For fast sequence similarity search, researchers have been proposed heuristic methods that use the frequency of characters in subsequences. These methods have the defect that different sequences are treated as the same sequence. Because of using only the frequency of characters, the accuracy of these methods are lower than Smith-Waterman algorithm. In this paper, we propose an algorithm which processes query efficiently by indexing the frequency of characters including the positional information of characters in subsequences. The experiments show that our algorithm improve the accuracy of sequence similarity search approximately 5${\sim}$20% than heuristic algorithms using only the frequency of characters.

  • PDF

대두단백질 가수분해물의 쓴맛 펩타이드 구조와 특징

  • Lee, Cheol-Ho
    • Proceedings of the Korean Society of Life Science Conference
    • /
    • 2001.06a
    • /
    • pp.3-41
    • /
    • 2001
  • 단백질의 부분 가수분해는 산성 음료에서의 용해도 증가, 환자들의 소화력과 알러지 내성의 개선, 다른 기능적 특성의 개발 등을 위하여 식품산업에 널리 이용되고 있다. 그러나 우유 단백질이나 대두 단백질과 같은 몇 가지 단백질들은 가수분해에 의하여 강한 쓴맛을 형성한다, 단백질 가수분해물의 쓴맛에 관한 연구는 1950년대 초에 시작되었으며, 여러 가지 원료로부터 쓴맛물질이 분리되었다. 이들 단백질 가수분해물의 쓴맛 물질은 올리고펩타이드로 알려져 있으며, 펩타이드 분자를 구성하는 소수성 아미노산의 존재와 밀접한 관계가 있는 것으로 보고되고 있다. 본 연구에서는 최근에 발달된 분석기술과 생명공학적 기법으로 E. coli에서 생산한 콩 단백질 단일 subunit를 이용하여 효소적 가수분해물의 분자구조를 확인하고자 하였다. 탈지대두박으로부터 115 glycinin와 E.coli떼서 발현된 proglycinin을 각각 90%, 97%의 정제도로 분리하여 이들 단백질을 trypsin으로 각각 가수분해하였다. 115 glycinin은 효소/기질 비 3%에서 4시간 가수분해에 의해 $14.0{\times}10^{-5}$ M quinine-HCI equivalent의 강한 쓴맛을 나타내었으며, 12%의 가수분해도(DH)를 나타내었다. 대두 단백질의 쓴맛 성분을 확인 위하여 이미 아미노산 서열이 밝혀진 11S glycinin과 proglycinin 가수분해물에서 GP-HPLC, $C_{18}$ RP-HPLC 등을 통하여 쓴맛 peptide들을 분리하였다. 각각의 분획은 다시 21개의 peptide로 분리되어 그 서열이 결정되었으며 이중 RP와 GI는 이미 알려진 쓴맛 dipeptide였고, LAGNQEQE, SAEFG, NALPE, KLHENIAR, GMIYPG 등이 주된 쓴맛 Peptide로 확인되었다. 이들은 11S glycinin의 5개의 subunit 중에서 그 위치가 확인되었다. Proglycinin 가수분해물에서도 11S glycinin과 같은 방법으로 7개의 쓴맛 peptide가 분리되었다. 이들은 $A_{1a}B_{1b}$의 아미노산 서열 중에서 37-42, 103-110, 164-167, 323-327, 367-373의 위치에 분포하고 있었으며, NALKPD, IYPGCPST, SlDT, HNIGQT, NAMFVPH의 서열을 나타내었다. 분리된 쓴맛 peptide 중에서 가장 쓴 두 분회의 peptide를 합성하여 관능 검사한 결과, NALPE는 매우 쓴맛을 내는 peptide로 확인되었다.

  • PDF

Organic acid production and phosphate solubilization by Enterobacter intermedium 60-2G (Enterobacter intermedium 60- 2G의 유기산 생성과 불용성인의 가용화)

  • Kim, Kil-Yong;Hwangbo, Hoon;Kim, Yong-Woong;Kim, Hyo-Jeong;Park, Keun-Hyung;Kim, Young-Cheol;Seong, Ki-Young
    • Korean Journal of Soil Science and Fertilizer
    • /
    • v.35 no.1
    • /
    • pp.59-67
    • /
    • 2002
  • A phosphate solubilizing bacterium. strain 60-2G, possessing a strong ability to solubilize insoluble phosphate was isolated from the rhizosphere of grass. On the basis of GC-FAME profile, carbon utilization pattern, and the DNA sequence of a conserved partial 16S rRNA gene, the 60-2G was identified as Enterobacter intermedium. The analysis by HPLC revealed that the strain 60-2G produced mainly gluconic and 2-ketogluconic acids with small amounts of lactic acid in broth culture medium containing hydroxyapatite. During the incubation period of the strain 60-2G in broth culture, pH of the medium decreased upto 3.8 while the soluble phosphate concentration increased. The reversed correlation between pH and soluble phosphate concentration indicated that the solubility of P was due to the produced organic acids. The sequence homology of the deduced amino acids suggested that E. intermedium 60-2G synthesized PQQ which is essential for the oxidation of glucose by glucose dehydrogenase.

Suppression of Thrombospondin-1 Expression by PMA in the Porcine Aortic Endothelial Cells (정상 돼지 대동맥 내피세포에서 PMA에 의한 thrombospondin-1 발현 억제)

  • Chang, Seo-Yoon;Kang, Jung-Hoon;Hong, Kyong-Ja
    • Journal of Life Science
    • /
    • v.14 no.1
    • /
    • pp.154-162
    • /
    • 2004
  • Thrombospondin-1 (TSP-1), a negative regulator in tumor growth and angiogenesis, is cell-type specifically regulated and at transcriptional level by external stimuli. Previously, we found that phorbol 12-myristate 13-acetate (PMA) suppressed TSP-1 expression in porcine aortic endothelial (PAE) cell, but enhanced in hepatoma cell line, Hep 3B cell. A region between -767 and -723 on the tsp-1 promoter was defined as a responsive site to the suppression in PAE cell. eased on the previous results, the molecular mechanism of TSP-1 expression was determined by characterizing interactions between cis-elements and trans-factors using three overlapped oligonucleotide probes, oligo a-1 (from -767 to -738), a-2 (-759 to -730) and a-3 (-752 to -723). The results from electromobility shift assay showed that PMA-induced suppression of TSP-1 transcription in PAE cell might be caused via a negative regulator binding to the region from -752 to -730 and additionally generated by lacking two positive regulators binding to the sites from -767 to -760 and from -752 to -730. Especially, PMA enhanced the binding ability of the negative regulator to the site from -752 to -730 in PAE cell, but anti-c-Jun did not affected its binding ability.