• 제목/요약/키워드: 서열 관리

검색결과 129건 처리시간 0.023초

실험실 레벨의 유전체 생물학 데이터베이스 관리시스템 구축 (Building a Biological Genomic Database Management System in Laboratory Level)

  • 차효성;정광수;박성희;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.28-30
    • /
    • 2004
  • 대부분의 생물학 실험실에서는 스퀸싱 실험으로 얻어진 서열조각에 대해 어셈블리 과정을 통해 획득된 일치된 서열을 서열 실험파일 형태로 저장한다. 이러한 서열 파일형태로 서열 데이터를 저장하면 사용자의 임의로 서열 정보 수정 및 서열 정보의 중복 등 서열 데이터에 대한 일관성 있고 무결성 있는 저장 관리가 어렵다 또한 이질적 데이터 및 포맷을 통한 다양한 생물학적 분석이 요구된다. 따라서 이 논문에서는 시퀸싱을 통해 생성된 유전체 및 단백질 서열 데이터의 자장관리를 위해 서열 정보의 편집, 저장 및 검색과 서열 파일 포멧 변환을 수행하는 서열 정보관리 시스템의 구현을 목적으로 한다. 서열 저장시 서열 버전의 생성 및 검출을 위해 능동 데이터베이스의 트리거를 이용하여 시스템의 성능을 향상시킨다. 또한 서열정보 분석을 위해 이질적인 서열 포맷간의 포맷 변환은 서열 및 관련된 정보를 XML로 표현하고 포맷간의 매핑정보를 XML의 스타일 언어인 XSL을 적용하여 수행한다. 그러므로 원시 소스 변경시 영향을 적게 받으므로 이질적인 포맷간의 파서를 이용한 포맷 변환 보다 효율적이다.

  • PDF

로컬 서열 정렬과 트리거 기반의 단백질 버전 정보 관리 기법 (A management Technique for Protein Version Information based on Local Sequence Alignment and Trigger)

  • 정광수;박성희;류근호
    • 정보처리학회논문지D
    • /
    • 제12D권1호
    • /
    • pp.51-62
    • /
    • 2005
  • 하나의 아미노산 서열의 기능이 밝혀지면, 그와 유사한 서열 구조를 가지고 있는 서열의 기능도 유추해 낼 수 있다. 또한 기능이 밝혀진 단백질의 아미노산 서열을 변화시키거나 유용한 단백질을 만드는 것도 가능하다. 이 과정에서 하나의 원본 단백질 서열에 대하여 다른 서열 구성을 가지고 있는 여러 가지 단백질 서열이 생겨 날 수 있다. 여기서, 원본 단백질을 변화시켜 만든 단백질 버전 서열과 단백질의 주석정보를 저장 및 관리하는 체계적인 기법이 요구된다. 따라서 이 논문에서는 로컬 서열 정렬 기법을 적용한 단백질 아미노산 서열의 버전관리 기법과 트리거를 적용한 단백질 주석데이터의 이력 관리 기법을 제시하였다. 제안된 기법을 통하여 원본 서열과 버전서열의 유사도 측정 및 버전 관리의 자동화와 저장 공간을 감소시킬 수 있다. 또한 단백질 정보의 이력을 저장하고 서열 변화 정보를 분석하여 돌연변이 연구에 의한 유용한 단백질 개발 및 신약 개발이 가능하다.

BSML 기반 능동 트리거 규칙을 이용한 염기서열정보관리시스템의 구현 (Implementation of an Information Management System for Nucleotide Sequences based on BSML using Active Trigger Rules)

  • 박성희;정광수;류근호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권1호
    • /
    • pp.24-42
    • /
    • 2005
  • 유전체 서열을 포함하는 생물정보는 지속적으로 변화하며 이질적이고 다양하다는 특성을 갖는다. 이러한 생물 정보의 특성을 반영한 관리시스템이 요구되지만 현재 대부분의 기존 생물정보 데이타베이스는 생물 데이타에 대한 저장소로만 이용된다. 따라서 이 논문에서는 생물학 연구실 수준에서 시퀀싱 실험을 통해 생산되거나 다양한 공개용 데이타베이스로부터 수집된 염기 서열 데이타를 파일 포맷 변환, 편집, 저장 및 검색을 수행하는 서열정보관리 시스템을 제시한다. 이질적인 서열 포맷간의 파일 변환을 위하여 XML기반 BSML을 공통 포맷으로 이용한다. 서열 저장관리에서는 동일한 DNA 조각에 대한 서열 구성의 변경정보를 저장하기 위해 서열 버전을 정의하고 능동 트리거 규칙을 이용하여 변경 정보 검출 및 생성 방법을 보여준다. 트리거 기능을 이용하여 서열의 변경 정보를 자동적으로 데이타베이스에서 저장관리 할 수 있음을 보이고 성능을 평가하였다.

XPath 질의 처리를 적용한 단백질 데이터 통합 관리시스템 구축 (Building a Integrated Protein Data Management System Using the XPath Query Process)

  • 차효성;정광수;정영진;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.103-105
    • /
    • 2004
  • 최근 바이오 인포매틱스 분야의 발전에 따라 방대한 양의 유전체 데이터에 대한 연구가 진행되고 있으며, 이러한 데이터를 효율적으로 다루기 위해 다양한 형태의 파일과 데이터베이스들이 사용되고 있다. 하지만 표준화의 미비로 인하여 데이터의 관리 및 변환에 어려움이 많다. 따라서 이 논문에서는 시퀀싱을 통해 생성된 유전체 및 단백질 서열 데이터의 통합 저장 관리를 위해 서열 정보의 편집, 저장 및 검색과 서열 파일 포맷 변환을 수행하는 서열 정보관리 시스템의 구현을 목적으로 한다. 이러한 요구사항을 만족시키기 위해 바이오 인포메틱스 데이터를 다루기 위한 표준으로 BSML(Bioinformatic Sequence Markup Language)을 채택하고 이질적 플랫파일들은 DTD를 기반으로 BSML 스키마로 통합 및 저장한다. 그리고 객체 관계 데이터베이스 특성을 적용하여 XML 문서를 보다 쉽게 저장 관리하고 범위 또는 구조적 질의에 효율적인 XPath 질의 처리를 위한 시스템을 개발하였다.

  • PDF

기능 유전체학을 지원하는 유전자 서열 분석 및 관리시스템 (Gene sequence analysis and management system for supporting functional genomics)

  • 허진석;김현식;진훈;김인철
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2002년도 추계정기학술대회
    • /
    • pp.480-488
    • /
    • 2002
  • 본 논문에서는 하나의 시스템 안에서 효율적인 유전자 데이터의 관리와 다양한 서열 분석작업이 가능한 기능 유전체학을 지원하는 서열 분석 및 관리 시스템인 GWB(Gene WorkBench)를 설계하고 구현하였다. GWB는 로컬 데이터베이스 관리뿐만 아니라 GenBank, EMBL, SWISSPROT와 같은 외부 공공 데이터베이스에 대한 접근 기능도 제공하며, 권한을 가진 내부 이용자와 그렇지 못한 외부 이용자들을 구분하여 일부 유용한 기능들은 외부 사용자들도 이용할 수 있도록 설계되었다. 또 GWB는 유전자에 관한 문헌정보 검색과 관련 유전자 탐색 기능 등 일부 유전자 기능 연구를 지원하는 기능을 제공하고 있다.

  • PDF

웹 기반 고성능 다중서열정렬시스템 설계 및 구현 (A Web-Based High Performance Multiple Sequence Alignment System Design and Implementation)

  • 김태경;김훈기;최치환;정승현;허보경;조완섭
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2010년도 제42차 하계학술발표논문집 18권2호
    • /
    • pp.79-82
    • /
    • 2010
  • 다중서열정렬 알고리즘은 생명정보학 분야에서 서열기반의 계통분류 분석에 가장 많이 사용되며, 가장 대표적인 공개 프로그램은 ClustalW로 사용자가 로컬시스템에 설치하여 이용할 수 있다. 그러나 실제로 사용자들이 ClustalW을 설치한 후, 서열데이터의 준비, 가공, 처리 및 타 시스템과 연동 등과 같은 작업을 하는데 여러 가지 어려움이 있다. 따라서 본 논문에서는 다중서열정렬 작업을 편리하고 빠르게 수행할 수 있는 웹기반의 고성능 다중서열정렬시스템을 제안한다. 제안된 시스템의 특징은, (1) Inter-Query 라우팅 알고리즘을 통해 다수의 PC 자원을 효율적으로 활용하여 계산 성능을 극대화하였으며, (2) 사용자 편의성을 고려한 웹인터페이스의 제공을 통해 개인화된 데이터관리, 실시간 모니터링, 데이터 편집 등을 지원하여 사용자가 손쉽게 서열데이터의 수집, 관리 및 처리할 수 있도록 지원한다.

  • PDF

워크플로우 환경에서의 대규모 서열 유사성 검색 웹 서비스에 관한 연구 (A Study on Web Services for Sequence Similarity search in the Workflow Environment)

  • 정진영
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권6호
    • /
    • pp.41-49
    • /
    • 2008
  • 최근 생물정보학에서의 워크플로우 관리 도구를 이용한 생명 현상에 대한 연구가 활발하게 진행되고 있다. 워크플로우 관리 도구는 서비스의 재사용과 공유를 통해 연구자들이 서로 협업할 수 있는 기반으로 MyGrid 프로젝트의 Taverna를 비롯하여 Kepler, BioWMS 등의 다양한 워크플로우 관리 도구들이 오픈소스로 개발되어 사용 되고 있다. 이러한 워크플로우 관리 도구는 공간적으로 떨어진 서로 다른 서비스들을 웹 서비스 기술을 기반으로 하나의 작업공간에서 연구 과정을 모델링하고 자동화 할 수 있도록 해준다. 생물정보학에서 사용되는 많은 도구와 데이터베이스들이 웹 서비스 형태로 제공되어 워크플로우 관리 도구에서 사용되고 있다. 이러한 상황에서 생물정보학에서 기본으로 사용되는 서열 유사성 검색에 대한 웹 서비스의 개발과 안정적인 서비스 제공은 생물정보학 분야에서 필수적이라 할 수 있다. 본 논문에서는 리눅스 클러스터를 기반으로 생물학 서열 데이터의 유사성 검색 속도를 향상시키는 한편, 이를 웹 서비스 형태로 개발하여 워크플로우 관리 도구와의 연동하여 단시간에 서열 유사성 검색을 가능하게 하였다.

  • PDF

웹 기반의 유전자 서열 분석 및 관리 시스템 (Gene Sequence Analysis and Management System based on web)

  • 허진석;김현식;예형석;진훈;김인철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.166-168
    • /
    • 2002
  • 본 논문에서는 하나의 시스템 안에서 효율적인 유전자 데이터의 관리와 다양한 서열 분석작업이 가능한 왱 기반의 서열 분석 및 관리 시스템인 GWB(Gene Workbench)를 설계하고 구현하였다. GWB는 로컬 데이터베이스 관리뿐만 아니라 GenBank, EMBL, SWISSPROT와 같은 외부 공공 데이터베이스에 대한 접근 기능도 제공하며, 권한을 가진 내부 이용자와 그렇지 못한 외부 이용자들을 구분하여 일부 유용한 기능들은 외부 사용자들도 이용할 수 있도록 설계되었다. 또 GWB는 유전자에 관한 문헌정보 검색과 관련 유전자 탐색 기능 둥 일부 유전자 기능 연구를 지원하는 기능을 제공하고 있다.

  • PDF

차세대 염기서열 분석기법과 생물정보학 (Next Generation Sequencing and Bioinformatics)

  • 김기봉
    • 생명과학회지
    • /
    • 제25권3호
    • /
    • pp.357-367
    • /
    • 2015
  • 매우 빠른 속도로 발전하고 있는 차세대 염기서열 분석 플랫폼과 최신 생물정보학적 분석도구들로 말미암아, 1,000달러 이하의 가격으로 인간 유전체 염기서열을 해독하고자 하는 궁극적인 목표가 조만간 곧 실현될 수 있을 것 같다. 차세대 염기서열 분석 분야의 급속한 기술적 진전은 NGS 데이터의 분석과 관리를 위한 통계적 방법과 생물정보학적 분석도구들에 대한 수요를 꾸준히 증대시키고 있다. NGS 플랫폼이 상용화되어 쓰이기 시작한 초창기부터, NGS 데이터를 분석하고 해석하거나, 가시화 해주는 다수의 응용프로그램이나 도구들이 개발되어 활용되어 왔다. 그러나, NGS 데이터의 엄청난 범람으로 데이터 저장, 데이터 분석 및 관리 등에 있어서 해결해야 할 많은 문제들이 부각되고 있다. NGS 데이터 분석은 단편서열과 참조서열간의 서열정렬, 염기식별, 다형성 발견, 쌍단편 서열이나 비쌍단편 서열 등을 이용한 어셈블리 작업, 구조변이 발견, 유전체 브라우징 등을 본질적으로 포함한다. 본 논문은 주요 차세대 염기서열 결정기술과 NGS 데이터 분석을 위한 생물정보학적 분석도구들에 대해 개관적으로 소개하고자 한다.