• 제목/요약/키워드: random walk plot

검색결과 2건 처리시간 0.015초

k-convex hull을 이용한 DNA 염기 배열의 가시화 (DNA Sequence Visualization with k-convex Hull)

  • 김민아;이은정;조환규
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제2권2호
    • /
    • pp.61-68
    • /
    • 1996
  • 본 논문에서는 대용량의 DNA 염기 배열의 정성 정보를 특징짓기 위한 새로운 가시화 방법을 제안한다. DNA 배열은 배열 자체가 방대한 양의 정보를 포함하고 있기 때문에 분석에 많은 어려움이 있다. 우리는 DNA 염기 배열들사이의 상사성 비교를 위해 DNA 염기 배열을 하나의 이미지 도메인으로 변환한다. 프로그램은 random walk plot으로 DNA 염기 배열을 가시화한 후에 k-convex hull로 단순화 시킨다. Random Walk plot은 염기배열을 평면상에 하나의 커브로 표현한다. k-convex hull은 walk plot으로부터 무의미한 부분을 제거함으로서 walk plot을 단순화한다. 이러한 방법은 유전공학자들에게 쉽게 DNA 배열의 특징을 인식하고 분류할 수 있는 직관을 제공한다. 실제 게놈 데이터로 실험한 결과는 논문에서 제안하는 방법이 긴 DNA 염기배열들 사이의 유사성 분석을 위해 좋은 가시화 도구임을 보여준다.

  • PDF

전유전체(Whole gerlome) 서열 분석과 가시화를 위한 워크벤치 개발 (Development of Workbench for Analysis and Visualization of Whole Genome Sequence)

  • 최정현;진희정;김철민;장철훈;조환규
    • 정보처리학회논문지A
    • /
    • 제9A권3호
    • /
    • pp.387-398
    • /
    • 2002
  • 최근 활발한 소단위 게놈 프로젝트의 수행으로 많은 생물체의 유전체 전체 서열이 밝혀짐에 따라서 전유전체(whole genome)를 기본 단위로 하여 개별 유전자나 그에 관련된 기능 연구가 매우 활발히 이루어지고 있다. 전유전체의 염기 서열은 수백만 bp(base pairs)에서 수백억 bp(base pairs) 정도의 대용량 텍스트 데이터이기 때문에 단순한 온라인 문자 일치(on-line string matching) 알고리즘으로 분석하는 것은 매우 비효율적이다. 본 논문에서는 대용량의 유전체 서열을 분석하는데 적합한 자료 구조인 스트링 B-트리를 사용하여 유전체 서열의 분석과 가시화를 위한 워크벤치를 개발한 과정을 소개한다. 본 연구에서 개발한 시스템은 크게 질의문 부분과 가시화 부분으로 나뉘어 진다. 질의문 부분에는 유전체 서열에 특정 서열이 나타나는 부분의 위치와 횟수를 알아보거나 k번 나타나는 서열을 조사하는 것과 같은 기본적인 패턴 검색 부분과 k-mer 분석을 위한 질의어가 다양하게 준비되어 있다. 가시화 부분은 전유전체 서열과 주석(annotation)을 보여주거나, 유전체 분석을 용이하도록 여러 가시화 방법, CGR(Chaos Game Representation), k-mer graph, RWP(Random Walk Plot) 등으로 생물학자들이 쉽게 전체 구조와 특성 파악할 수 있도록 도와준다. 본 논문이 제안하는 분석 시스템은 생물체의 진화적 관계를 밝히고, 염색체 내에 아직 알려지지 않은 새로운 유전자나 기능이 밝혀지지 않은 junk DNA들의 기능 등을 연구하는데 사용할 수 있다.