• Title/Summary/Keyword: 생물학적 정보

Search Result 668, Processing Time 0.034 seconds

Analysis of Gene-Drug Interactions Using Bayesian Networks (베이지안망을 이용한 유전자와 약물 간 관계 분석)

  • O, Seok-Jun;Hwang, Gyu-Baek;Jang, Jeong-Ho;Jang, Byeong-Tak
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2002.05a
    • /
    • pp.91-97
    • /
    • 2002
  • 최근의 생물학 연구를 위한 기기의 자동화 및 고속화는 생물학 관련 정보량의 급증을 가져오고 있다. 예를 들어, DNA chip에서 얻어지는 마이크로어레이(microarray)는 수천 종류의 유전자의 발현량을 동시에 측정한다. 이러한 기술들은 생물의 세포나 조직에서 일어나는 일련의 다양한 현상을 전체적으로 조망하는 관점에서 관찰할 수 있는 기회를 제공하고 있으며, 이를 통한 생명공학의 전반적인 발전이 기대되고 있다. 따라서 대량의 생물학 관련 정보의 분석이나 데이터 마이닝이 행해지고 있으며 이를 위한 대표적인 기법들로는 각종 클러스터링(clustering) 및 신경망 계열의 모델 등이 있다. 본 논문에서는 확률그래프모델의 하나인 베이지안망(Bayesian network)을 생물정보분석에 이용한다. 구체적으로 유전자 발현패턴과 약물의 활성패턴 및 암 종류 사이의 확률적 관계를 모델링한다. 이러한 모델은 NCI60 dataset(http://discover.nci.nih.gov)에서 베이지안망을 학습함으로써 구성된다. 분석의 대상이 되는 데이터가 sparse하기 때문에 발생하는 어려움들을 해결하기 위한 기법들이 제시되며 학습된 모델에 대한 검증은 이미 생물학적으로 확인되어 있는 사실과의 비교를 통해 이루어진다. 학습된 베이지안망 모델은 각각의 유전자 간, 혹은 유전자와 처리된 약물 간의 실제 생물학적 관계를 다수 표현하며, 이는 제시되는 방법이 생물학적으로 유의미한 가설을 데이터 분석을 통해 효율적으로 생성하는데 유용하게 활용될 수 있음을 보인다.

  • PDF

Data Mining Techniques for Analyzing Promoter Sequences (프로모터 염기서열 분석을 위한 데이터 마이닝 기법)

  • 김정자;이도헌
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2000.10a
    • /
    • pp.328-332
    • /
    • 2000
  • As DNA sequences have been known through the Genome project the techniques for dealing with molecule-level gene information are being made researches briskly. It is also urgent to develop new computer algorithms for making databases and analyzing it efficiently considering the vastness of the information for known sequences. In this respect, this paper studies the association rule search algorithms for finding out the characteristics shown by means of the association between promoter sequences and genes, which is one of the important research areas in molecular biology. This paper treat biological data, while previous search algorithms used transaction data. So, we design a transformed association nile algorithm that covers data types and biological properties. These research results will contribute to reducing the time and the cost for biological experiments by minimizing their candidates.

  • PDF

Data Mining Techniques for Analyzing Promoter Sequences (프로모터 염기서열 분석을 위한 데이터 마이닝 기법)

  • 김정자;이도헌
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.4 no.4
    • /
    • pp.739-744
    • /
    • 2000
  • As DNA sequences have been known through the Genome project the techniques for dealing with molecule-level gene information are being made researches briskly. It is also urgent to develop new computer algorithms for making databases and analyzing it efficiently considering the vastness of the information for known sequences. In this respect, this paper studies the association rule search algorithms for finding out the characteristics shown by means of the association between promoter sequences and genes, which is one of the important research areas in molecular biology. This paper treat biological data, while previous search algorithms used transaction data. So, we design a transformed association rule algorithm that covers data types and biological properties. These research results will contribute to reducing the time and the cost for biological experiments by minimizing their candidates.

  • PDF

Comparison of Efficient Scoring Metrics for Bayesian Network Learning in Biological Domain (생물학적 데이터의 베이지안 네트워크 학습에서의 효과적인 스코어링 척도 비교)

  • Hwang Sung-Chul;Lee Yill-Byung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.05a
    • /
    • pp.357-360
    • /
    • 2006
  • 본 논문에서는 베이지안 네트워크 학습 방법을 이용한 비교적 적은 양의 샘플 데이터에서 현실적인 네트워크 모델 추론을 위한 효율적인 스코어링 척도를 찾는 것을 목표로 하였다. UPSM, CUPSM, DPSM, BDe(Bayesian Dirichlet) 등을 각각 적용시켜본 결과를 통해 어떤 방법이 가장 적은 샘플의 데이터, 특히 생물학적 데이터에적합한지 알아보았다.

  • PDF

Seed를 이용한 마이크로어레이 데이터 클러스터링과 유전자 온틀로지를 이용한 클러스터의 해석

  • 강은미;신미영;정호열;박선희;조환규
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.244-246
    • /
    • 2004
  • 마이크로어레이 칩 실험을 통하여 대량으로 생산되는 유전자 발현 데이터는 여러 가지 클러스터링 방법을 적용하여 분석할 수 있으며, 생성된 클러스터들 또한 여러 가지 방법으로 해석 할 수 있다. 본 논문에서는 기존의 클러스터링 방법들을 응용한 seed클러스터링 방법을 제안하고 생물학적 온톨로지인 Gene Ontology를 기반으로 클러스터를 해석한다. 본 논문에서는 효과적인 유전자 발현 데이터 클러스터링 방법과 생물학적 지식을 바탕으로 클러스터를 해석, 평가하는 방법을 보여 준다.

  • PDF

Biological Pathway Real-time Expansion System (생물학적 패스웨이 실시간 확장 시스템)

  • Choi, Yunsoo;Jeon, Sun-hee;Seo, Dongmin;Yu, Seok Jong
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2015.05a
    • /
    • pp.371-372
    • /
    • 2015
  • 생물학적 패스웨이는 기존 연구 문헌들을 토대로 생의학 분야 전문가들에 의해 수작업으로 구축되기 때문에, 신규 문헌들이 포함하고 있는 최신 정보들이 패스웨이에 적용되는데 많은 시간을 소모하게 된다. 본 논문에서는 텍스트 마이닝 및 정보 추출 기술을 사용하여 구축된 디지털 학술자원인 VSB(Virtual Science Brain) 데이터베이스를 활용하여 실시간으로 생물학적 패스웨이를 확장하는 방법과, 이를 위한 사용자 인터페이스를 소개한다.

  • PDF

Construction of a biological network using recursive adaptive partitioning (재귀적 적응 분할 방식을 사용한 생물학적 네트워크의 구축)

  • Lee, Sunyoung;Lee, Minhyeok;Kang, Yeong Seon;Seok, Junhee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2016.04a
    • /
    • pp.624-626
    • /
    • 2016
  • 본 논문에서는 생물학적 네트워크 구성을 개선하기 위해서 노이즈의 영향으로 상관관계가 명확하게 나타나지 않았던 기존의 방법을 보완할 수 있는 새로운 방법을 제안한다. 제안된 방법은 재귀적응분할 방법으로 상관행렬에서 노이즈의 영향을 줄여 표본간의 상관관계를 명확히 보여 줄 수 있다. 시뮬레이션 결과 네트워크 구성의 오류를 15% 줄여 기존의 방법보다 향상된 결과가 나타났다. 또한, 유전자 발현 데이터를 이용한 실례 연구에서는 원 데이터에 잘 나타나지 않았던 조건별 네트워크 구성이 제안된 방법으로는 잘 분리되어 있는 것을 확인 할 수 있었다. 본 논문에서 제안된 방법은 유전자 발현 데이터 분석 등의 생물학적 네트워크 구성에 활용될 수 있을 것으로 기대한다.

On the Construction of an Object-Oriented Metabolic Pathway Database (대사경로 데이터베이스 구축)

  • 안명상;정태성;조완섭;노동현
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.295-297
    • /
    • 2004
  • 유전자의 생물학적 기능을 밝히고 세포 내 상호작용을 이해하는 것은 post-genome era의 가장 중요한 작업 중 하나이다. 이러한 세포 내 상호작용은 복잡한 생화학적 네트워크를 형성하게 되며 그 중 Metabolic pathway(대사 경로)는 생물 시스템을 이해하는데 가장 중요한 부분을 차지하게 된다. 대사 경로를 분석하기 위하여 분자의 기능 및 생화학적 프로세스에 대한 정보를 데이터베이스에 저장.관리해야하고, 사용자의 다양한 질의에 대하여 관련정보를 검색하여 GUI환경에서 제공해야 한다. 이 논문은 대사 경로 정보를 객체 데이타베이스 형태로 모델링하여 구축하고, 사용자가 관심있는 정보를 SBML형태로 제공하는 대사경로 데이타베이스의 설계 및 구현에 관해 다룬다.

  • PDF