• 제목/요약/키워드: 서열정렬

검색결과 105건 처리시간 0.023초

스크립트 파일 기반의 효율적인 웹 공격 탐지 프로파일링 (Efficient Script-File based Profiling for Web Attack Detection)

  • 임종혁;박재철;김동국;노봉남
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (C)
    • /
    • pp.511-514
    • /
    • 2006
  • 비정상행위 탐지를 위한 프로파일 기술은 침임탐지시스템의 성능 향상을 위한 핵심기술로서, 높은 공격 탐지율과 침입탐지시스템의 수행 시간 단축을 위해 반드시 요구되는 기술이다. 최근 인터넷의 보급과 활성화로 웹 어플리케이션 보안을 위한 연구가 활발히 진행되고 있으나, 웹 애플리케이션의 개발 언어와 공격 특성을 반영하지 못해 그 효율성이 저하되고 있다. 본 논문에서는 웹 공격 탐지를 위해 연구 되었던 서열정렬 알고리즘을 이용한 웹 공격 탐지의 성능 개선을 위하여 웹 애플리케이션 개발에 주로 사용되는 스크립트파일을 기반으로 한 프로파일 방법을 제안하고 실험 결과를 기술하였다.

  • PDF

선형 시간 접미사 배열 생성 알고리즘들의 비교 (Comparison of Linear Time Suffix Array Construction Algorithms)

  • 이성림;박근수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.496-498
    • /
    • 2003
  • 접미사 배열은 긴 문자열에 대해 효율적인 문자열 검색을 가능하게 하는 자료구조이다. 접미사 배열은 문자열의 접미사들의 사전식 정렬순서를 배열로 저장한다. 비슷한 효과를 가진 접미사 트리에 비해서 접미사 배열은 저장 공간을 적게 차지하기 때문에 생명정보과학의 염기 서열 등 큰 크기의 문자열의 처리에 더욱 유리하다. 본 논문에서는 2003년에 발표된 Ko-Aluru, K$\square$rkk$\square$inen-Sanders 및 기존의 Manber-Myers 등 세 개의 접미사 배열 생성 알고리즘들의 염기 서열 입력 자료에 대한 실행 시간 및 기억 장치 사용량을 실험을 통해 비교한다. 특히 Ko-Aluru와 K$\square$rkk$\square$inen-Sanders 알고리즘은 실행 시간 및 저장 공간의 이론적인 복잡도가 O(n)으로 동일하기 때문에 실험을 통해서 계산 복잡도에 숨어있는 상수를 비교한다. 실험 결과 K$\square$rkk$\square$inen-Sanders 알고리즘이 가장 효율적임을 보인다.

  • PDF

생물정보학에서 사용자 그룹핑 기법을 이용한 서열 정렬 방법 (Sequence Alignment Scheme Using User Grouping for Bioinformatics)

  • 김민준;김재훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (A)
    • /
    • pp.13-15
    • /
    • 2002
  • 생물정보학 관련 프로그램들은 대부분 인터넷을 통해서 많은 생물학자, 생화학자 들에게 생물 정보 검색 및 처리 서비스를 제공한다. 이런 서비스를 제공하는 많은 프로그램들은 데이터베이스로부터 유전자 등의 데이터를 검색하고 처리한다. 이때 각각 클라이언트의 요청마다 매번 데이터베이스의 검색을 수행한다면 많은 시간이 걸리게 된다. 또한 서버에 과부하를 초래하여 응답시간이 길어질 수 있다. 본 논문에서는 서버의 과부하와 응답시간을 줄이기 위해 사용자의 요청을 그룹화하여 일정 시간 간격으로 일괄 처리하는 방법을 제안한다.

  • PDF

단백질 2차 구조를 이용한 유사 GPCR 검출에 관한 연구 (A Study on the Detection of Similarity GPCRs by using protein Secondary structure)

  • 구자효;한찬명;윤영우
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권1호
    • /
    • pp.73-80
    • /
    • 2009
  • GPCR(Gprotein-coupled receptors) 패밀리(family)는 세포막 단백질로서, 외부 신호를 세포막을 경유하여 세포 내로 전달하는 신호전달 기전에서 중요한 역할을 담당한다. 그러나 GPCR마다 다양하고 복잡한 조절기전을 보이며 매우 특이적인 신호전달 기전을 가지는 것으로 알려져 있다. GPCR의 구조적인 특징과 패밀리 및 서브패밀리 등은 기능별로 잘 알려져 있는데 과거 GPCR을 찾아내는 연구 중에 가장 기본이 되는 일이 주어진 단백질 서열로부터 GPCR을 분류하는 일이다. 이미 발견된 GPCR들을 가지고 수학적인 모델을 이용하여 보다 정확하게 분류하는 연구가 주로 진행되어 왔다. 본 논문에서는 단백질의 기능이 입체적 구조에 의해 결정되는 점에 착안하여 두 GPCR의 아미노산 서열의 유사도가 낮은 경우에 그 2차 구조의 서열을 비교함으로써 기존의 발견된 GPCR의 데이터베이스에서 동일한 기능을 가졌을 것으로 추정되는 미지의 GPCR을 검출하는 방법을 제안한다.

부분표절구간 검출을 위한 질의문서의 분할 및 탐색 기법 (A Fragmentation and Search Method of Query Document for Partially Plagiarized Section Detection)

  • 옥창석;서종규;조환규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.586-589
    • /
    • 2012
  • 표절과 관련된 이슈가 주목받고 있는 상황에서 표절을 검출하는 방법에 대한 연구가 활발히 진행되고 있다. 일반적으로 표절구간 검출을 위해 복잡한 자연어처리와 같은 의미론적 접근방법이 아닌 비교적 단순한 어휘기반의 문자열 처리 방법을 사용한다. 대표적인 방법으로는 지문법 (Fingerprinting)과 서열정렬 (Sequence alignment) 등이 있다. 하지만 이 방법들을 이용하여 대용량 문서에 대한 표절검사를 수행하기에는 시공간적 복잡도의 문제가 발생한다. 본 논문에서는 이러한 단점을 극복하기 위해 NGS (Next Generation Sequencing)에서 사용하는 BWT (Burrows-Wheeler Transform)[1]를 이용한 탐색방법을 응용한다. 또한 부분표절구간을 검출하고 정확도를 향상시키기 위해 질의문서를 분할하여 작은 조각으로 만든 뒤, 조각들에 대한 질의탐색을 수행한다. 본 논문에서는 질의문서를 분할하는 두 가지 방법을 소개한다. 두 가지 방법은 k-mer analysis를 이용한 방법과 random-split analysis를 이용한 방법으로, 각 방법의 장단점을 실험을 통해 분석하고 실제 부분표절구간의 검출 정확도를 측정하였다.

서열 정렬 알고리즘을 이용한 주가 패턴 탐색 시스템 개발 (Developing Stock Pattern Searching System using Sequence Alignment Algorithm)

  • 김형준;조환규
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제37권6호
    • /
    • pp.354-367
    • /
    • 2010
  • 시계열 데이터에서 패턴을 분석하는 기법은 많은 발전이 이루어져 오고 있다. 그러나 주식시장의 경우 시계열 데이터임에도 불구하고 패턴 분석 및 예측은 많은 연구가 이루어지지 않고 있으며 예측도가 매우 낮다. 그 이유는 주가의 등락 자체가 본질적으로 무작위하다고 하면 어떠한 과학적 방법으로도 그 예측은 불가능하다. 본 연구에서는 주가의 등락이 보여주는 무작위성의 정도를 Kolmogorov 복잡도를 이용해 측정하여 그 무작위의 정도와 본 논문에서 제시한 반 전역정렬(semi-global alignment)로 예측할 수 있는 주가의 예측의 정확간의 깊은 상관관계가 있음을 보인다. 이를 위해서 주가지수의 등락을 양자화된 문자열로 변환하고 그 문자열의 Kolmogorov 복잡도를 이용해 주가 변동의 무작위성을 측정하였다. 우리는 KOSPI 주식 데이터 28년 690개의 데이터를 수집하여 이를 실험용 데이터로 사용하여 본 논문에서 제시한 방법의 의미를 평가하였다. 그 결과 Kolmogorov 복잡도가 높은 경우에는 변동 예측이 어려우며, Kolmogorov 복잡도가 낮은 경우에는 주식 변동 예측은 가능하나 3종류의 예측율에 대해서 투자자들이 관심이 많은 등락 예측율은 단기 예측은 12% 이상의 예측율을 보일 수 없으며, 장기 예측의 경우 54%의 예측율로 수렴함을 확인하였다.

생물정보시스템을 이용한 Local Animal BLAST Search System 구축 (Development of Local Animal BLAST Search System Using Bioinformatics Tools)

  • 김병우;이근우;김효선;노승희;이윤호;김시동;전진태;이지웅;조용민;정일정;이정규
    • Bioinformatics and Biosystems
    • /
    • 제1권2호
    • /
    • pp.99-102
    • /
    • 2006
  • BLAST(Basic Local Alignment Search Tool)는 서열 데이터베이스 탐색을 위하여 가장 많이 사용되는 프로그램이다. 전체 서열간의 최적 글로벌 정렬을 수행하는 대신에 지역적 유사성이 있는 부분을 찾아 서열 짝짓기를 수행하는 특징을 갖는다. 일반적인 연구자들은 서열 상동성 검색을 위해 NCBI에 접속하여 웹 브라우저를 통해 온라인으로 BLAST를 수행하게 되는데, 이 경우 사용자 각각의 네트워크 환경이나 입력할 데이터양에 따른 검색속도의 지연 및 제한 등과 같은 여러 문제에 부딪히게 되고, 또한 보안유지가 필요한 서열 데이터의 유출 가능성이 존재한다. 그러므로 대량의 서열 데이터에 대하여 빠르고 안전하게 BLAST 상동성 검색이 가능한 Local BLAST 검색 시스템의 필요성이 증대되고 있다. 본 연구에서는 NCBI의 Genbank에서 공개된 동물의 발현 유전자 단편들(ESTs)에 대한 데이터를 이용하여 소, 돼지, 닭, 등의 경제형질과 연관된 유용 유전자만을 추출하여 이들만으로 구성된 새로운 데이터베이스를 구축하였고, 또한 이들을 사용할 수 있는 새로운 검색시스템을 개발하였다 자체 제작한 Perl script를 사용하여 필요한 데이터를 축종별로 추출 하여 새로운 DB를 구축하였으며 이 속에는 소의 경우 650,046개, 돼지의 경우 368,120개, 닭의 경우 693,005개의 발현 유전자 단편들(ESTs)이 포함된다. 또한 이들 DB 분석이 가능한 Local Animal BLAST Web 검색시스템(http://bioinfo.kohost.net)을 고성능 병렬 PC Cluster 시스템과 연동하도록 자체 구축함으로써 본 시스템이 보다 효율적인 생물정보학 연구수행이 기여할 것으로 기대된다.

  • PDF

태백제비꽃군 ITS DNA 염기서열 분석 (Analysis of ITS DNA Sequences of the Viola albida Complex)

  • 황성수
    • 한국자원식물학회지
    • /
    • 제19권5호
    • /
    • pp.628-633
    • /
    • 2006
  • 태백제비꽃군내 식물들은 동소적으로 생육하면서 단엽에서 장상복엽까지 연속적인 중간형을 나타내어 분류학적 어려움이 있다. 본 연구의 목적은 태백제비꽃, 단풍제비꽃, 남산제비꽃 그리고 각 분류군 사이의 중간형을 잎의 형태에 따라 5 집단으로 구분하고 각 집단별 대표적인 개체를 선별하여 ITS DNA 염기서열을 분석하고 분류학적 어려움을 해결하는데 있다. 정렬된 ITS1, ITS2 그리고 5.8S 지역의 염기서열은 702 bp로 나타났다. 5.8S 지역은 163 bp로 조사된 모든 개체에서 변이가 없었으며, ITS1과 ITS2는 일부 변이가 있어 분산분석, 염기 서열 분기 조사 그리고 분계분석에 이용하였다. 분산분석 결과 조사된 잎 형태별 개체들 간에 차이가 없는 것으로 나타났다. 염기서열 분기 조사 결과, 군외군으로 설정한 낚시제비꽃과 노랑제비꽃의 경우 Kimura 2-parameter distance에서 절대치가 0.05보다 훨씬 높게 나타나서 뚜렷한 차이가 확인되었다. 그러나 군내군 5 개체는 절대치가 모두 매우 낮게 나타나서 염기서열 분기는 종 수준이 아닌 종 이하의 수준으로 판단되었다. 분계분석에서 군외군으로 설정한 2 종은 기저 분계조를 형성하였다. 군내군은 하나의 분계조를 형성하였지만, 부트스트랩이 50% 이하로 나타나 계통학적 의미는 적은 것으로 사료된다.

ITS 염기서열에 의한 한국산 괭이눈속(Chrysosplenium)의 계통학적 연구 (Phylogenetic Study of Korean Chrysosplenium Based on nrDNA ITS Sequences)

  • 한종원;양선규;김현준;장창기;박정미;강신호
    • 한국자원식물학회지
    • /
    • 제24권4호
    • /
    • pp.358-369
    • /
    • 2011
  • 괭이눈속 식물에 대한 계통 유연관계를 알아보기 위하여 핵 rDNA의 internal transcribed spacer(ITS) 지역에 대한 염기서열을 분석하였다. 5.8s를 포함한 ITS 염기서열은 647-653 bp로 그중 219개의 염기에서 유전적 다양성을 나타내었다. 정렬된 염기서열은 bootstrap을 포함한 parsimony 방법과 neighbor-joining 방법을 통하여 계통수를 평가하였다. 그 결과 C. pseudofauriei(선괭이눈)이 군내군의 가장 기부에 분계조를 형성하였고, Ser. Pilosa and Ser. Oppositifolia와 Ser. Alternifolia and Ser. Flagellifera가 높은 bootstrap 값으로 두 개의 분계조를 각각 형성하였다. Neighbor-joining 분석의 결과도 일치하였다. 본 연구결과 핵 rDNA의 ITS 염기서열 분석은 괭이눈속의 계통학적 연구에 유용한 마커로 확인되었으며, 최종적으로 ITS 염기서열과 종자 형태형질을 바탕으로 C. sphaerospermum Maxim. and C. valdepilosum (Ohwi) S.H. Kang & J.W. Han에 대한 분류학적 검토를 하였다.

쇠무릎(Achyranthes japonica Nakai)으로부터 Ecdysteroid 생합성에 관련된 유전자의 분리 (Isolation of Genes Involved in Ecdysteroids Biosynthesis from Achyranthes japonica Nakai)

  • 부경환;김소미;진성범;채현병;이도승;김대운;조문제;류기중
    • Applied Biological Chemistry
    • /
    • 제44권3호
    • /
    • pp.153-161
    • /
    • 2001
  • Ecdysteroid 생합성에 관련된 식물 유전자를 분리할 목적으로 ecdysteroid 생성능이 확인된 쇠무릎(Achyranthes japonica Nakai)으로부터 RNA를 분리하고, ecdysteroid 생합성에 관여한다고 알려진 cytochrome P45O family 유전자 4개와 곤충의 ecdysone 20-hydroxylase 유전자의 다중정렬 분석결과를 토대로 상동성이 높은 부위의 염기서열에 상응하는 degenerate primer를 사용하여 RT-PCR을 행하고, 고유한 염기서열을 가진 partical cDNA clone 14개를 선발했다. 기존에 ecdysteroid 생합성에 관여한다고 알려진 cytochrome P450 family 유전자들과의 염기 및 아미노산 서열의 상동성을 분석한 결과, 선발된 cDNA 중 6개가 cytochrome P45O fumily 유전자들과 상동성이 있는 것으로 나타났다. 이 중에서 4개의 clone은 곤충의 ecdysone 20-hydroxylase 유전자와도 상동성이 높아 ecdysteroid 생합성에 관련된 유전자로 추정되었다.

  • PDF