• 제목/요약/키워드: 생물학적 정보

검색결과 668건 처리시간 0.025초

인간 miRNA 전구체 탐색을 위한 계산학적 방법 (Computational Method for Searching Human miRNA Precursors)

  • Nam, Jin-Wu;Joung, Je-Gun;Lee, Wha-Jin;Zhang, Byoung-Tak
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2003년도 제2차 연례학술대회 발표논문집
    • /
    • pp.288-297
    • /
    • 2003
  • 본 논문은 진화 알고리즘(Evolutionary algorithm)의 기법중의 하나인 유전자 프로그래밍(Genetic programming)을 이용하여 miRNA 유전자를 발굴하기 위한 알고리즘을 소개하고 있다 miRNA는 세포내에서 유전자의 전사를 중지시킴으로써 유전자의 발현을 직접적으로 조절하게 되는 작은 RNA 집단 중의 하나이다. 그러므로 miRNA를 유전체 데이터에서 동정해내는 작업은 생물학적으로 상당히 중요하다. 한편 유전체 데이터에서 miRNA를 동정해내는 알고리즘은 생물학적 실험에서의 시간과 비용을 상당히 절감할 수 있으며, 생물학적으로 miRNA를 동정하는 많은 어려움을 덜어주게 된다. 하지만 계산학적으로 miRNA의 동정은 1차 염기서열상의 통계적인 중요도가 부족하여 기존의 유전자 예측 알고리즘을 적용하기에는 어려움이 있다. 따라서 본 연구에서는 miRNA의 염기서열보다는 2차구조에서 더 많은 유사성을 갖는다는 점을 착안하여, 2차구조내에서 공통적인 구조를 찾아내고, 그 정보를 이용하여 miRNA를 동정해내는 방법으로 접근하였다. 이 알고리즘의 성능평가를 위해 우리는 test set을 이용하여 학습된 모델의 특이도(= 34/38)와 민감도(= 38/67)를 계산하였다. 평가결과 본 알고리즘이 기존의 miRNA 예측 프로그램보다 높은 특이도를 갖고 있으며, 유사한 수준의 민감도를 갖고 있음을 보여 주고 있다.

  • PDF

생물학적 서열들에서 빈발한 연속 서열 패턴 마이닝 (Mining Frequent Contiguous Sequence Patterns in Biological Sequences)

  • 강태호;유재수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (B)
    • /
    • pp.27-31
    • /
    • 2007
  • 생물학적 서열 데이터는 크게 DNA 염기 서열과 단백질 아미노산 서열이 있다. 이들 서열은 일반적으로 많은 수의 항목들을 가지고 있어 그 길이가 매우 길다. 생물학적 데이터 서열들에는 보통 빈번하게 발생하는 부분 연속 서열들이 존재하는데 이들 서열들을 찾아내는 것은 다양한 서열 분석에서 유용하게 사용될 수 있다. 이를 위해 초기에는 Apriori 알고리즘을 기반으로 하는 순차패턴 마이닝 알고리즘들을 활용하는 방법들이 많이 제시되었다. 그중 PrefixSpan 알고리즘은 Apriori기반의 가장 효율적인 순차패턴 마이닝 기법이다. 하지만 이 알고리즘은 길이-1인 빈발 패턴들로부터 서열 패턴을 확장해나가는 방식으로 길이가 긴 연속 서열을 포함하는 생물학적 데이터 서열들에 대한 검색방법으로는 적합하지 않다. 최근에는 기존의 PrefixSpan방식을 이용하면서도 반복적인 처리과정을 줄인 MacosVSpan이 제안되었다. 하지만 이 알고리즘 또한 원본 데이터베이스보다 크기가 큰 별도의 프로젝션 데이터베이스를 사용함으로서 많은 비용부담이 발생하고 특히 길이가 긴 서열에 대해서는 더욱 효율적이지 못하다. 이에 본 논문에서 많은 양의 생물학적 데이터 서열들로부터 빈번한 연속서열을 고정길이 확장 트리를 이용하여 효과적으로 찾아내는 방법을 제안한다. 그리고 다양한 환경에서 실험을 통해 제안하는 방식이 MacosVSpan알고리즘에 비해 검색 성능이 우수함을 증명한다.

  • PDF

적조정보시스템 구축의 GIS 데이터베이스화 연구 (Study on a GIS Database of Red Tide Information System)

  • 정종철
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2004년도 GIS/RS 공동 춘계학술대회 논문집
    • /
    • pp.115-115
    • /
    • 2004
  • 본 연구의 목적은 GIS 분석기법에 의해 적조의 공간적인 분포를 분석하고 적조의 발생시기와 기상해양학적인 인자를 GIS 데이터베이스화하는 방안을 제시하는 데 있다. 1995년 남해안과 동해안에 걸쳐서 발생한 적조의 피해는 적조연구의 방향을 새롭게 바꾸었다 연안지역 소규모 만에서 국지적으로 단시간에 발생하고 소멸하던 적조의 피해가 최근에는 2년의 주기성을 가지고 유해성 적조 생물의 장기적인 번성으로 연안양식어장에 큰 피해를 발생시키고 있다. 때문에 적조발생의 해양기상학적 인자를 분석하고, 적조생물의 생물군집과 적조생물의 제거 기술 등 다양한 연구분야에서 적조 연구가 이루어지고 있다. 특히 적조의 발생시 이를 효과적으로 정확하게 적조 발생지역을 관측하기 위한 위성원격탐사를 이용하는 기술의 개발과 항공기 예찰, 선박관측 등의 조사기법이 제시되고 있다. 본 연구에서는 과거에 국내 연안에서 발생한 적조의 발생 범위와 적조 생물, 그리고 기상학적 요소 등을 하나의 지리정보시스템으로 구축하기 위해 각각의 자료를 데이터베이스화하고 빈번한 적조발생의 공간적 분포를 분석하는데 필요한 자료의 구축 방안을 제시하고자 한다.

  • PDF

웹기반 문헌분석 및 생물학적 네트워크 분석시스템 개발 (Web based Text-mining and Biological Network Analysis System)

  • 서동민;조성훈;안광성;유석종;박동일
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2017년도 춘계 종합학술대회 논문집
    • /
    • pp.27-28
    • /
    • 2017
  • 다양한 위상학적 관계(topological relation)를 분석하는 네트워크 분석은 복잡한 데이터에서 숨어있는 특성과 사실을 발견하는 기술로 최근 빅데이터 분야에서 데이터 분석 핵심 기술로 급부상하고 있다. 본 연구에서는 질병연구에 핵심적인 생물학적 네트워크의 생성 및 사용자 친화적인 네트워크 분석시스템을 개발하였다. 개발한 시스템은 PubMed에서 특정 질병과 관련있는 논문 요약 정보를 자동 수집후 텍스트마이닝을 통해 질병 관련 화합물, 유전자 그리고 상호작용 정보를 추출해 생물학적 네트워크를 생성하는 기능을 제공한다. 또한, 연구자가 손쉽게 생성된 네트워크에 대한 검색 및 다차원 분석을 수행할 수 있는 기능을 제공한다. 마지막으로 개발한 시스템의 우수성을 입증하기 위해 크론병(Crohn's Disease)에 대한 적용사례를 소개한다.

  • PDF

생물학적 데이터 서열들에서 빈번한 최대길이 연속 서열 마이닝 (Mining Maximal Frequent Contiguous Sequences in Biological Data Sequences)

  • 강태호;유재수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.645-648
    • /
    • 2006
  • 생물학적 데이터 서열에는 크게 DNA 서열과 단백질 서열이 있다. 이들 서열 데이터들은 여러 데이터베이스에 걸쳐 매우 방대한 양을 가지고 있으며, 각각의 서열은 수백 또는 수천 개의 항목들을 가지고 있어 길이가 매우 길다. 일반적으로 유전적인 변형, 또는 변이로부터 보존된 영역이나 특정 패턴들을 서열 안에 포함하고 있는데 생물학적 서열 데이터에서 보존된 영역이나 패턴들은 계통발생학적 근거로 활용 될 수도 있으며 기능과 밀접한 관계를 가지기도 한다. 따라서 서열들로부터 빈번하게 발생하는 패턴을 발견하고자 하는 알고리즘 개발이 요구되고 있다. 초창기 Apriori 알고리즘을 변형하여 빈발 패턴을 발견하고자 하는 노력들로부터 근래에는 PrefixSpan 트리를 이용하여 효과적으로 성능을 개선하고 있지만 아직까지는 여러 번의 데이터베이스 접근이 요구되고 있어 성능저하가 발생한다. 이에 본 논문에서는 접미사 트리를 변형하여 데이터베이스 접근을 획기적으로 줄이고 많은 서열들로부터 빈번하게 발생하는 연속적인 서열을 효과적으로 발견하는 방법을 제안한다.

  • PDF

식물 생명공학과 생물정보학 (Plant Biotechnology and Bioinformatics)

  • 김정은;백효정;김영철;허철구
    • Journal of Plant Biotechnology
    • /
    • 제33권3호
    • /
    • pp.209-222
    • /
    • 2006
  • 애기 장대와 벼의 전체 게놈 염기서열 분석이 완료되었고, 다량의 EST 데이터가 많은 식물에서 이용 가능하게 되었다. 또한, 방대한 양의 다양한 생물학적 데이터들이 transcriptomics, proteomics, metabolomics와 같은 여러 '-omics' 기술에 의하여 만들어져 왔다. 생물정보학은 이런 방대한 양의 생물학적 데이터로부터 유용한 정보를 얻는데 필수적이고도 매우 중요한 역할을 수행한다. 이 총설에서, 우리는 대량의 데이터를 생성하는 실험적 방법들과, 식물 병 저항성과 분자 육종과 같은 식물 연구분야로의 응용, 그리고 식물 생명공학의 연구 개발에 유용한 생물정보학적 기술과. 인터넷 정보 사이트들을 소개하였다. 우리는 새로운 실험 방법들과 생물정보학적 분석 기술들이 식물 생명공학 발전에 중요하게 기여할 것으로 기대하고 있으며, 생물정보학은 식물 생명공학의 연구 개발에 있어서 결정적인 요소가 될 것이라 생각한다.

생물학적 개체명 사전을 위한 구축 및 관리 도구에 관한 연구 (A Study on Construction and Management Tools for Biological Named Entity Dictionary)

  • 장현철;김태현;이현숙;박수준;박선희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (중)
    • /
    • pp.853-856
    • /
    • 2003
  • 바이오 텍스트 마이닝을 위한 정보 추출의 첫 단계는 생물학적 문헌으로부터의 유전자, 단백질, 세포조직 등과 같은 생물학적 개체명의 인식이다. 생물학적 개체명의 명명법상 특징이 매우 다양하고 저자의 개성에 의해 쉽게 좌우되어 단순히 규칙이나 학습 방법 만으로는 쉽게 개체명들을 인식할 수 없다. 또한, 생물학 관련 문헌에 나오는 가능한 모든 개체명과 이들의 모든 변형을 수록하는 것은 현실적으로 불가능하므로 이를 해결하기 위해 이미 알려진 개체명에 대해서 기본적으로 사전을 탐색하고 알려지지 않은 용어들을 규칙과 통계 기반 방법을 통하여 인식하는 것이 효과적이다. 그러나 만족할 만한 수준의 양질의 사전을 구축하는 것은 쉽지 않을 뿐만 아니라 많은 비용이 소요되며, 어느 순간 만족할 만한 성능을 낼 수 있는 사전을 구축했다. 할지라도 유지 관리 하는 것이 결코 쉬운 일이 아니며 마찬가지로 많은 비용을 필요로 하게 된다. 따라서, 잘 구축된 자원으로부터 필요한 정보를 추출하여 적절한 사전을 자동으로 구축하여 활용하는 방법을 사용할 경우, 사전 구축 및 관리에 드는 많은 비용을 줄이면서도 상당히 효과적인 성능을 얻을 수 있을 것이다. 본 연구에서는 바이오 텍스트 마이닝 엔진을 위한 생물학적 개체명 사전을 자동으로 구축하고 이를 쉽게 관리하도록 하는 도구를 개발하였다.

  • PDF

DNA Microarray 발현정보에 대한 생물학적 정보처리에 관한 연구 (A Study of a Biological Information Processing for DNA Microarray Expression Data)

  • 조영임;정현철
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2007년도 추계학술대회 학술발표 논문집
    • /
    • pp.149-152
    • /
    • 2007
  • 본 논문은 바이오 인포메틱스의 분야를 간단히 소개하고 기능유전체학에서 microarray 실험에 대한 통계적 방법론을 살펴보고자 한다. 또한 DNA chip 설계와 생물학적 특정에 대해 살펴보고 각 분야에서 적용되는 통계적 방법을 연구분석 해보고자 한다.

  • PDF

한국 어류 DB 구축 및 운영체계

  • 이태원
    • 지식정보인프라
    • /
    • 통권10호
    • /
    • pp.56-59
    • /
    • 2002
  • 어류는 분류학자 및 수산 관련 전문학자의 뿐 아니라, 어민, 수산 관련 사업자, 낚시 및 수족관 관련업자들도 깊은 관심을 가지며, 일반인들의 식탁이나 주변에서 접하는 어류에 대한 정보를 알고자 한다. 이렇게 어류는 다양한 계층이 관심을 가져, 국내외에 수많은 어류 DB가 service 중이다. 이러한 DB 가운데 본 보고에서는 생물학적.생태학적 정보를 제공하는 DB를 살펴보고 앞으로의 방향을 제시하였다.

  • PDF

해부학적 구조를 이용한 유전자 정보 통합 기법 (Integration Scheme of Gene Information based on Anatomical Structure)

  • 양기철
    • 디지털융복합연구
    • /
    • 제13권2호
    • /
    • pp.153-158
    • /
    • 2015
  • 생물학자들은 특정 암이나 선천성 질병을 이해하는데 핵심정보를 제공할 수 있는 유전자관련 연구를 진행하고 있다. 하지만 생물학적 실험은 실험당시의 여러 가지 요소나 상황의 차이 또는 해석의 차이에 의해 서로 다른 결과를 생성하기도 한다. 따라서 현존하는 연구 결과들은 서로 상이한 정보를 제공할 수 있다. 유전자 정보의 통합을 통하여 이러한 불일치를 찾을 수 있다. 유전자 정보들이 불일치가 없이 통합 된다면 생물학자들은 어떤 유전자 정보를 알기 위해서 여러 연구 결과를 검토하지 않아도 되어 시간과 노력을 절감할 수 있게 된다. 이를 위하여 본 논문에서는 서로 다른 연구에 의해 구축된 유전자 정보를 하나의 정보로 통합 및 확장하는 기법을 소개한다.