• 제목/요약/키워드: 증가 부분서열

검색결과 37건 처리시간 0.029초

극대 증가 부분서열을 찾는 선형 알고리즘 (Linear-time algorithms for computing a maximal increasing subsequence)

  • 나중채
    • 스마트미디어저널
    • /
    • 제12권6호
    • /
    • pp.9-14
    • /
    • 2023
  • 최장 증가 부분서열(longest increasing subsequence)은 컴퓨터 과학 분야에서 오랫동안 연구되어온 주요 문제이다. 본 논문에서는 최장 조건을 극대로 완화한 극대 증가 부분서열(maximal increasing subsequence) 문제를 고려한다. 본 논문에서는 두 가지 버전의 증가 개념(단조증가, 순증가)에 대해, 알파벳 Σ 에 대한 서열의 극대 증가 부분서열을 구하는 선형시간 알고리즘을 제안한다. 극대 단조증가 부분서열을 구하는 알고리즘은 O(1) 공간을 사용하고, 극대 순증가 부분서열을 구하는 알고리즘은 O(|Σ|) 공간을 사용한다.

부분 서열 정렬을 이용한 확대축소 부분 영상 검색 기법 (Scaled Sub-image Retrieval Approach using Alignment of Sub-Sequence)

  • 김준호;장원앙;양익석;이도훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.512-515
    • /
    • 2012
  • 부분 영상 검색은 질의 영상을 입력으로 사용해서 질의 영상을 부분 영상으로 포함하는 대상 영상을 찾아낸다. 본 논문에서는 부분 영상 검색에 생물정보학에서 사용하는 정렬(Alignment)을 이용한다. 생물정보학에서는 두 DNA 서열 간에 유사도를 비교하고 시각화하는 방법으로 점 행렬을 널리 사용한다. 두 영상을 정렬하기 위해서 먼저 질의 영상과 대상 영상을 일차원 명암도 영상 서열로 변환하고 정렬하여 부분 영상 후보 영역을 찾는다. 이전 연구[1]에서 정렬하는 방법은 두 서열의 길이의 곱만큼의 메모리 공간이 필요하므로 두 서열의 길이가 길어지면 필요한 메모리 공간이 선형적으로 증가했다. 본 논문에서는 영상 데이터의 특성을 이용해서 부분 서열 정렬로 필요한 메모리 공간을 줄였고 부가적인 효과로 처리시간이 감소하고 정확도가 상향되었다.

클러스터링 단백질 데이터베이스와 데이터 분산 기법을 적용한 단백질 이차구조예측 시스템 설계 (Protein Secondary Structure System Design Using Clustering Protein Database and Data Distribution Scheme)

  • 이수진;김재훈;정진원;이원태
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.82-84
    • /
    • 2003
  • 생물학 데이터베이스의 크기가 점점 증가함에 따라 데이터베이스를 사용하여 서열을 정렬할 경우 많은 처리시간이 필요하게 되었다. 단백질 이차구조예측 시스템에서 단백질 서열 데이터베이스를 이용해 사용자의 서열들을 정렬하는 부분에서도 많은 처리 시간을 요구한다. 본 논문에서는 단백질 데이터베이스를 비슷한 크기로 나눠 여러 노드에서 서열 정렬을 분산 처리하여 처리율을 높이고자 했다. 또한, ClustalW에서 서열들의 관계에 따라 다양한 BLOSUM을 사용하여 정렬의 정확도를 높이는 휴리스틱 전략을 적용하기 위해 기존의 데이터베이스를 클러스터링 하였다. 클러스터링된 데이터베이스의 대표서열과 사용자 서열의 거리를 비교하여 적합한 BLOSUM을 선택하여 보다 정확한 서열 정렬을 통해 단백질 이차구조예측의 정확도를 높이게 될 것이다. 본 논문에서는 대용량의 단백질 데이터베이스를 여러 노드를 사용하여 병렬 클러스터링하여 이를 이차구조예측 시스템에 적용하여 처리율과 정확도를 높이고자 하였다.

  • PDF

유전체 서열 재사용을 이용한 Genotyping By Sequencing 기술의 단일 염기 다형성 탐지 효율 개선 (Improvement of SNPs detection efficient by reuse of sequences in Genotyping By Sequencing technology)

  • 백정호;김도완;김준아;이태호
    • 한국정보통신학회논문지
    • /
    • 제19권10호
    • /
    • pp.2491-2499
    • /
    • 2015
  • 개별 생물의 유전적 특성인 유전형 정보를 얻기 위한 개발된 기법들 중 현재 가장 많이 사용되고 있는 것은 차세대 염기서열결정을 통해 얻어진 서열을 분석하여 단일핵산염기다형현상 기반의 유전형 정보를 얻어내는GBS 방법이다. 현재 TASSEL은 GBS방법을 통해 얻어진 서열을 분석하여 시료의 유전형을 측정하기 위해 가장 많이 사용되고 있는 프로그램 중 하나이다. 그러나 TASSEL은 염기서열결정을 통해 얻어진 서열 중 일부만을 사용하는 한계가 존재한다. 우리는 이러한 한계를 극복하기 위한 효율성 개선에 대한 연구를 시작하였다. 효율성 개선을 위해 TASSEL에서 사용후 버려지는 서열의 퀄리티를 체크하여 에러율 0.1% 이하인 데이터를 확인 한 후 퀄리티가 에러율을 충족하는 부분의 서열들을 필터링 한다. 그리고 마지막으로 바코드와 제한 효소의 부분을 확인하여 길이에 따라 서열을 잘라내어 새로운 데이터 셋으로 생성하는 구조를 반복하는 알고리즘으로 구현 하였으며, 약 17% 이상의 SNP 탐지효율성 증가함을 확인 하였다. 본 논문에서는 이와 같이 유전형 연구에서 사용되지 않는 유전체 염기서열들을 사용하여 더 많은 숫자의 단일 염기 다형성을 탐지하는 방법과 구현된 프로그램을 제시한다.

함수에 의한 정규화를 이용한 local alignment 알고리즘 (A Local Alignment Algorithm using Normalization by Functions)

  • 이선호;박근수
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제34권5_6호
    • /
    • pp.187-194
    • /
    • 2007
  • Local alignment 알고리즘은 두 문자열을 비교하여 크기가 l, 유사도 점수가 s인 부분 문자열쌍을 찾는다. 크기가 충분히 크고 유사도 점수도 높은 부분 문자열 쌍을 찾기 위해 단위 길이당 유사도 점수 s/l을 최대화하는 정규화 방법이 제안되어있다. 본 논문에서는 증가함수 f, g를 도입하여 f(s)/g(l)을 최대화하는, 함수에 의한 정규화 방법을 제시한다. 여기서 함수 f, g는 DNA 서열을 비교하는 실험을 통해 정한다. 이러한 실험에서 함수에 의한 정규화 방법이 좋은 local alignment를 찾는다. 또한 유사도 점수의 기준으로 longest common subsequence를 채택한 경우, 기존의 정규화 알고리즘을 이용하면 별다른 시간 손실 없이 함수에 의해 정규화된 점수 f(s)/g(l)을 최대화 할 수 있음을 보인다.

5-Iodopyrimidines와 Human serum albumin과의 결합(結合) (The Binding of 5-Iodopyrimidines by Human serum albumin)

  • 이종진
    • Applied Biological Chemistry
    • /
    • 제1권
    • /
    • pp.48-54
    • /
    • 1960
  • 5-Iodopyrimidines와 Human serum albumin 간(間)의 결합(結合)에 있어 이들의 결합량(結合量)은 첫째 5-Iodopyrimidines 분자내(分子內) Iodine에 대(對)한 Introducing group이 변(變)함에 따라 변(變)하게 된다. 다시 말해서 결합량(結合量)은 5-Iodopyrimidines 분자내(分子內) 보다 강(强)한 electron donating group이 존재(存在) 함에 따라 한층 더 증가하게 된다고 말할 수 있다. 둘째 이들 두 물질간(物質間)의 결합량(結合量)은 또한 PH 증가에 따라서도 증가한다고 말할 수 있는데 이는 PH 증가에 따라 Human serum albumin 분자자체내(分子自體內)의 Configuration이 변(變)하게 됨으로서 분자내(分子內) electrostatic repulsion에 의(依)한 새로운 결합부분(結合部分)이 증가될 것이며, 이 부분(部分)에서의 복합체(復合體)를 형성(形成)함에 기인(基因)한다고 생각된다. 이러한 실험적(實驗的) 결과(結果)를 토대로 하여 5-Iodopyrimidines가 antithyroid action과 어떠한 관계(關係)를 갖고 있는가의 실험(實驗)을 함으로서 결합량(結合量)에 따른 antithyroid activity 서열(序列)을 결정(決定)할 수도 있을 것이다.

  • PDF

대용량 유전체를 위한 효율적인 유사성 검색 알고리즘 (An Efficient Algorithm for Similarity Search in Large Biosequence Database)

  • 정인선;박경욱;임형석
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 추계종합학술대회
    • /
    • pp.1073-1076
    • /
    • 2005
  • 유전자 데이터베이스의 크기는 매년 기하급수적으로 증가하기 때문에 기존의 Smith-Waterman 알고리즘으로 정확한 서열의 유사성을 검색하는 것은 비효율적이다. 따라서 빠른 유사성 검색을 위해 데이터베이스에 저장된 문자열에 대해 특정 길이의 모든 부분문자열에 나타나는 문자의 출현 빈도를 이용한 휴리스틱 방법들이 제안되었다. 그러나 이 방법은 문자의 출현 빈도만을 사용하므로 서로 다른 서열을 같은 서열로 취급하는 단점이 있어 정화도가 Smith-Waterman 알고리즘에 비해 현저히 떨어진다. 본 논문에서는 문자가 부분문자열에 나타나는 위치 정보를 포함하여 문자의 출현빈도를 색인함으로써 질의 처리를 효율적으로 수행하는 알고리즘을 제안한다. 실험결과 제안된 알고리즘은문자 빈도만을 사용하는 휴리스틱 알고리즘들에 비해 5${\sim}$20%정도 정확성이 향상되었다.

  • PDF

대두단백질 가수분해물의 쓴맛 펩타이드 구조와 특징

  • 이철호
    • 한국생명과학회:학술대회논문집
    • /
    • 한국생명과학회 2001년도 제32회 학술심포지움
    • /
    • pp.3-41
    • /
    • 2001
  • 단백질의 부분 가수분해는 산성 음료에서의 용해도 증가, 환자들의 소화력과 알러지 내성의 개선, 다른 기능적 특성의 개발 등을 위하여 식품산업에 널리 이용되고 있다. 그러나 우유 단백질이나 대두 단백질과 같은 몇 가지 단백질들은 가수분해에 의하여 강한 쓴맛을 형성한다, 단백질 가수분해물의 쓴맛에 관한 연구는 1950년대 초에 시작되었으며, 여러 가지 원료로부터 쓴맛물질이 분리되었다. 이들 단백질 가수분해물의 쓴맛 물질은 올리고펩타이드로 알려져 있으며, 펩타이드 분자를 구성하는 소수성 아미노산의 존재와 밀접한 관계가 있는 것으로 보고되고 있다. 본 연구에서는 최근에 발달된 분석기술과 생명공학적 기법으로 E. coli에서 생산한 콩 단백질 단일 subunit를 이용하여 효소적 가수분해물의 분자구조를 확인하고자 하였다. 탈지대두박으로부터 115 glycinin와 E.coli떼서 발현된 proglycinin을 각각 90%, 97%의 정제도로 분리하여 이들 단백질을 trypsin으로 각각 가수분해하였다. 115 glycinin은 효소/기질 비 3%에서 4시간 가수분해에 의해 $14.0{\times}10^{-5}$ M quinine-HCI equivalent의 강한 쓴맛을 나타내었으며, 12%의 가수분해도(DH)를 나타내었다. 대두 단백질의 쓴맛 성분을 확인 위하여 이미 아미노산 서열이 밝혀진 11S glycinin과 proglycinin 가수분해물에서 GP-HPLC, $C_{18}$ RP-HPLC 등을 통하여 쓴맛 peptide들을 분리하였다. 각각의 분획은 다시 21개의 peptide로 분리되어 그 서열이 결정되었으며 이중 RP와 GI는 이미 알려진 쓴맛 dipeptide였고, LAGNQEQE, SAEFG, NALPE, KLHENIAR, GMIYPG 등이 주된 쓴맛 Peptide로 확인되었다. 이들은 11S glycinin의 5개의 subunit 중에서 그 위치가 확인되었다. Proglycinin 가수분해물에서도 11S glycinin과 같은 방법으로 7개의 쓴맛 peptide가 분리되었다. 이들은 $A_{1a}B_{1b}$의 아미노산 서열 중에서 37-42, 103-110, 164-167, 323-327, 367-373의 위치에 분포하고 있었으며, NALKPD, IYPGCPST, SlDT, HNIGQT, NAMFVPH의 서열을 나타내었다. 분리된 쓴맛 peptide 중에서 가장 쓴 두 분회의 peptide를 합성하여 관능 검사한 결과, NALPE는 매우 쓴맛을 내는 peptide로 확인되었다.

  • PDF

Enterobacter intermedium 60- 2G의 유기산 생성과 불용성인의 가용화 (Organic acid production and phosphate solubilization by Enterobacter intermedium 60-2G)

  • 김길용;황보훈;김용웅;김효정;박근형;김영철;성기영
    • 한국토양비료학회지
    • /
    • 제35권1호
    • /
    • pp.59-67
    • /
    • 2002
  • 강한 인산 가용력을 가진 인산 용해 세균인 균주 60-2G를 잔디의 근권에서 분리하였다. GC-FAME구조와 탄소이용형태 및 16S rRNA의 부분 염기서열 분석을 통해 균주 60-2G는 Enterobacter intermedium으로 동정되었다. Hydroxyapatite를 첨가한 배지와 생장 시킨 균주 60-2G는 gluconic acid 와 2-ketogluconic acid 및 소량의 lactic acid를 생성하였다. 균주 60-2G의 생장 기간동안 배지의 pH는 3.8 까지 낮아지는 반면에 배지의 유효 인산 농도는 증가하였다. 배지의 낮은 pH와 유효인산농도의 증가는 역 상관관계이며, 이는 균주 60-2G가 생성하는 유기산에 의한 영향이다. E. intermedium 60-2G 균주는 유기산 생성에 관여하는 glucose dehydrogenase의 co-factor인 PQQ를 생성하였으며, pqq의 부분 염기서열 분석 결과 기존에 보고된 서열과 85% 이상의 상동성을 가지고 있었다.

정상 돼지 대동맥 내피세포에서 PMA에 의한 thrombospondin-1 발현 억제 (Suppression of Thrombospondin-1 Expression by PMA in the Porcine Aortic Endothelial Cells)

  • Chang, Seo-Yoon;Kang, Jung-Hoon;Hong, Kyong-Ja
    • 생명과학회지
    • /
    • 제14권1호
    • /
    • pp.154-162
    • /
    • 2004
  • 암의 성장과 신생혈관 억제인자로 알려진 thrombospondin-1의 생합성은 다양한 외부자극에 대해 전사단계에서 세포 특이적으로 조절된다. 이전의 연구에서 본 연구자들은 PMA가 정상 돼지 대동맥 내피세포(PAE)에서는 TSP-1의 발현을 감소시키는 반면 사람 간암 세포주인 Hep3B에서는 증가시키는 사실을 발견하였다. PMA 처치에 따른 정상 돼지 대동맥 내피세포에서의 TSP-1의 발현 감소현상은 tsp-1 유전자 조절부위의 염기서열 -767과 -723사이에 존재하는 염기서열이 억제 부위임을 밝혀 이러한 결과를 바탕으로 -767에서 -723 염기서열을 서로 부분 중복되도록 세 종류의 올리고 탐식자 (올리고 탐식자 a-1, -767∼-738; 올리고 탐식자 a-2, -759∼-730; 올리고 탐식자 a-3, -752∼723)를 제작하여 -767과 -723 부위의 특정 염기서열과 이에 결합하는 인자를 EMSA을 수행하여 분석하였다. 실험 결과, PMA 처치에 따른 정상 돼지 대동맥 내피세포에서의 TSP-1 감소는 -752에서 -730 사이의 염기서열이 저해 조절인자와 결합함과 더불어 -767에서 -760과 -752에서 -730 사이의 염기서열들에 촉진 조절인자들이 결합하지 못함으로서 기인된다는 실험적 사실을 관찰하였고. 특히, PMA 처치는 정상 돼지 대동맥 내피세포에서 저해 조절인자의 -752에서 -730 부위에 대한 친화력을 향상시켰으며 이러한 친화력은 c-Jun 항체에 의해 영향을 받지 않았다.