• 제목/요약/키워드: 생물학적 정보

검색결과 668건 처리시간 0.028초

생물학적 모방에 따른 물고기 로봇의 빠른 방향 전환 연구 (A study on the C-shape Sharp Turn of fish robot according to biological mimic)

  • 박진현;이태환;최영규
    • 한국정보통신학회논문지
    • /
    • 제15권12호
    • /
    • pp.2626-2631
    • /
    • 2011
  • CST(C-shape sharp turn)는 물고기가 유영 시 빠른 방향 전환을 위해 물고기 꼬리 부분을 빠르게 C-형태로 구부려 빠르게 방향 전환을 하는 모션을 나타낸다. 그러나 CST와 관련된 모션 궤적 함수는 아직 일반화된 함수가 없다. 본 연구에서는 생물학자들이 실제 물고기의 관측으로부터 나온 순차적인 물고기의 모션 기록을 통하여 CST룰 위한 매우 단순한 모션 함수를 제안하였다. 그리고 이를 모의실험을 통하여 제안된 함수의 유용성을 확인하였다.

Non-negative matrix factorization 을 이용한 마이크로어레이 데이터의 클러스터링 (Clustering gene expression data using Non -Negative matrix factorization)

  • Lee, Min-Young;Cho, Ji-Hoon;Lee, In-Beum
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2004년도 The 3rd Annual Conference for The Korean Society for Bioinformatics Association of Asian Societies for Bioinformatics 2004 Symposium
    • /
    • pp.117-123
    • /
    • 2004
  • 마이크로어레이 (microarray) 기술이 개발된 후로 연관된 유전자 클러스터 (cluster)를 찾는 문제는 깊이 연구되어왔다. 이 문제는 핵심적인 과제 중 하나는 생물학적으로 타당한 클러스터의 수를 결정하는 데 있다. 본 논문은 최적의 클러스터 수를 결정하는 기준을 제시하고, non-negative factorization (NMF)를 이용해 클러스터 centroid의 패턴을 찾는 방법을 제안한다. NMF에 의해 발견된 각각의 패턴은 생물학적 프로세스의 특정 부분으로 해석될 수 있다. NMF는 factor matrix의 entity를 non-negative로 제약 (constraint)하고, 이 제약은 오직 additive combination만 허용하기 때문에 이러한 부분적인 패턴을 찾아낼 수 있다. NMF의 유용성은 이미지 분석과 텍스트 분석에서 이미 입증되어 있다. 본 논문에서 제안한 방법에 의해 위의패턴과 유사한 발현 패턴을 갖는 유전자를 모을 수 있었다. 제안된 방법은 human fibroblast데이터와 yeast cell cycle 데이터에 적용해 성능을 입증하였다.

  • PDF

Gene Set and Pathway Analysis of Microarray Data

  • 김선영
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2006년도 Principles and Practice of Microarray for Biomedical Researchers
    • /
    • pp.20-28
    • /
    • 2006
  • 최근의 microarray 기술의 발달로 인해 점점 더 많은 양의 mRNA 발현 데이터가 쌓여 가고 있다. 이제는 데이터를 만드는 단계보다는 데이터로부터 중요한 생물학적 의미를 끌어내는 것이 더욱 중요한 일이 되었다. micorarray 기술이 처음 도입된 이후로, 많은 앨고리즘과 소프트웨어가 개발되어, 실험자들이 microarray 데이터로부터 생물학적 의미를 끌어내는 작업을 도와주어 왔다. 그런데, 이전의 데이터 마이닝 방법들은 거의 예외 없이 전체 데이터로부터 선택된 몇 십, 몇 백 개의 유전자 리스트로부터 출발한다. 그런데, 이러한 방법 (over-representation analysis, ORA로 줄임)은 몇 가지 한계를 가지고 있어서, 최근에는 전체 데이터로부터 의미 있는 유전자 세트 (gene set)를 찾아내는 방법들이 도입되었다. 본 세미나는 이런 방법들, 줄여서 gene set analysis라 함, 에 사용되는 앨고리즘들과 소프트웨어들을 비교, 검토하고자 한다.

  • PDF

온톨로지를 이용한 단백질 상호작용 네트워크의 개념화 (An Ontology Based Approach for Conceptualizing Protein Interaction Networks)

  • 최재훈;박선희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.787-789
    • /
    • 2003
  • 본 논문에서는 생물체의 세포에 존재하는 방대한 단백질들 사이의 복잡한 상화작용 관계 네트워크를 개념화하기 위한 방법을 제안한다. 일반적으로 하나의 단백질은 세포의 특정한 구성요소로서 몇 개의 생물학적 작용에 참여하며 고유의 분자 기능을 수행하게 된다. 즉, 하나의 상호작용 관계 네트워크에 포함된 각각의 단백질들은 구성요소(Cellular Component), 생물학적 작용(Biological Process), 그리고 분자 기능(Molecular Function) 3가지 특징으로 개념화할 수 있다. 또한, 비슷한 특징으로 개념화되는 단백질들은 서로 클러스터링될 수 있기 때문에 단백질 상호작용 네트워크를 일반적인 의미의 개념 네트워크로 표현할 수 있다. 여기서, 단백질 특징을 개념화하기 위해 사용되는 표준개념과 이 개념들 사이의 관계를 정의하는 유전자 온톨로지(Gene Ontology)가 이용된다.

  • PDF

생물학적으로 의미 있는 특질에 기반한 베이지안 네트웍을 이용한 microRNA의 예측 (cmicroRNA prediction using Bayesian network with biologically relevant feature set)

  • 남진우;박종선;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (A)
    • /
    • pp.53-58
    • /
    • 2006
  • MicroRNA (miRNA)는 약 22 nt의 작은 RNA 조각으로 이루어져 있으며 stem-loop 구조의 precursor 형태에서 최종적으로 만들어 진다. miRNA는 mRNA의 3‘UTR에 상보적으로 결합하여 유전자의 발현을 억제하거나 mRNA의 분해를 촉진한다. miRNA를 동정하기 위한 실험적인 방법은 조직 특이적인 발현, 적은 발현양 때문에 방법상 한계를 가지고 있다. 이러한 한계는 컴퓨터를 이용한 방법으로 어느 정도 해결될 수 있다. 하지만 miRNA의 서열상의 낮은 보존성은 homology를 기반으로 한 예측을 어렵게 한다. 또한 기계학습 방법인 support vector machine (SVM) 이나 naive bayes가 적용되었지만, 생물학적인 의미를 해석할 수 있는 generative model을 제시해 주지 못했다. 본 연구에서는 우수한 miRNA 예측을 보일 뿐만 아니라 학습된 모델로부터 생물학적인 지식을 얻을 수 있는 Bayesian network을 적용한다. 이를 위해서는 생물학적으로 의미 있는 특질들의 선택이 중요하다. 여기서는 position weighted matrix (PWM)과 Markov chain probability (MCP), Loop 크기, Bulge 수, spectrum, free energy profile 등을 특질로서 선택한 후 Information gain의 특질 선택법을 통해 예측에 기여도가 높은 특질 25개 와 27개를 최종적으로 선택하였다. 이로부터 Bayesian network을 학습한 후 miRNA의 예측 성능을 10 fold cross-validation으로 확인하였다. 그 결과 pre-/mature miRNA 각 각에 대한 예측 accuracy가 99.99% 100.00%를 보여, SVM이나 naive bayes 방법보다 높은 결과를 보였으며, 학습된 Bayesian network으로부터 이전 연구 결과와 일치하는 pre-miRNA 상의 의존관계를 분석할 수 있었다.

  • PDF

바이오그리드 컴퓨팅과 생명과학 연구에의 활용 (Bio Grid Computing and Biosciences Research Application)

  • 김태호;김의용;염재범;고원규;곽희철;주현
    • Bioinformatics and Biosystems
    • /
    • 제2권2호
    • /
    • pp.37-45
    • /
    • 2007
  • 생물정보학은 컴퓨터를 이용하여 방대한 양의 생물학적 데이터를 처리하고 그 결과를 분석하는 학문으로서 IT의 고속성장과 맞물려 점차 그 활용도를 넓혀가고 있다. 특히 의학, 생명과학 연구에 사용되는 데이터는 그 종류도 다양하고 크기가 매우 큰 것이 일반적인데, 이의 처리를 위해서는 고속 네트워크가 바탕이 된 그리드-컴퓨팅(Grid-Computing) 기술 접목이 필연적이다. 고속 네트워크 기술의 발전은 슈퍼컴퓨터를 대체해 컴퓨터 풀 내에 분산된 시스템들을 하나로 묶을 수 있는 그리드-컴퓨팅 분야를 선도하고 있다. 최근 생물정보학 분야에서도 이처럼 발전된 고성능 분산 컴퓨팅 기술을 이용하여 데이터의 신속한 처리와 관리의 효율성을 증대시키고 있는 추세이다. 그리드-컴퓨팅 기술은 크게 데이터 가공을 위한 응용 프로그램 개발과 데이터 관리를 위한 데이터베이스 구축으로 구분 지을 수 있다. 전자에 해당하는 생물정보 연구용 프로그램들은 mpiBLAST, ClustalW-MPI와 같은 MSA서열정렬 프로그램들을 꼽을 수 있으며, BioSimGrid, Taverna와 같은 프로젝트는 그리드-데이터베이스 (Grid-Database)기술을 바탕으로 개발되었다. 본 고에서는 미지의 생명현상을 탐구하고 연구하기 위하여 현재까지 개발된 그리드-컴퓨팅 환경과 의생명과학 연구를 위한 응용 프로그램들, 그리고 그리드-데이터베이스 기술 등을 소개한다.

  • PDF

Haplotype 블록 분할을 위한 LD 기반 알고리즘 (LD-based Algorithm for Haplotype Block Partitioning)

  • 나경락;김상준;여상수;김성권
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.331-333
    • /
    • 2004
  • 본 연구는 Haplotype 데이터에서 나타나는 별개의 Haplotype의 수를 최소화하는 블록으로 분할하는 방법을 제안한다. Multi-population case인 Haplotype 데이터를 분석하기 위해 패턴의 개수를 최소한으로 줄이는 볼록 분할 방법은 전산학적인 최적해의 의미를 가지게 되며, 이와 더불어 생물학적인 의미를 가지는 블록 경계를 찾기 위해 |D'| 을 계산하고 LD를 분석하였다 분석된 LD는 블록 분할 알고리즘에서 블록 결정 함수로 사용하였으며, 이에 대한 검정은 X$^2$-test를 통해 이루어졌다. 많은 Sample로 구성된 Haplotype 데이터로부터 평균 패턴의 개수를 최소화하고 긴 블록 길이를 가지는 블록 분할의 결과를 얻었다.

  • PDF

정보 공유를 위한 BSML 기반의 생물학 데이터 변환기 (The Biological Data Converter based on BSML for Sharing Information)

  • 김영억;정광수;정영진;차효성;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.37-39
    • /
    • 2004
  • 현재 생물학 연구실에서 시퀀싱 실험을 통해 생성되거나 또는 공개용 생물 데이터베이스로부터 획득된 유전체 및 단백질 정보는 각각 이질적인 데이터형식을 사용하고 있다. 이 때문에, 생물정보를 분석하여 상호간의 정보를 효율적으로 사용하기 위해서는 공통된 형식의 데이터 표준화작업이 필수적이다. 그리고 이러한 이질적 데이터 형식에 대한 표준화 연구의 미비로 인하여 플랫 파일간의 정보공유에 어려움을 겪고 있다. 따라서, 이 논문에서는 다양한 유전체 및 단백질 정보를 관리.공유하기 위해 이질적인 포맷간의 맵핑 과정을 통하여 BSML(Bioinformatic Sequence Markup Language) 형태로 변환하고, 이를 객체관계형 데이터베이스(Object Relational DataBase)에 저장하는 시스템을 개발하였다. 그리고, 개발된 시스템은 생물정보 데이터의 표준화를 위해 개발된 XML(Extend Markup Language) 기반의 BSML을 이용함으로써 효율적으로 생물학 데이터들 간의 정보를 공유할 수 있으며, 개인 생물학 데이터베이스 구축이나 다양한 생물학적 데이터를 통합 관리하는 시스템에서 유용하게 쓰일 수 있다.

  • PDF

클러스터링 기법을 통한 대사 네트웍의 진화적 분류 (Evolutionary Classification of Metabolic Networks by Hierarchical Clustering)

  • 오석준;정제균;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.226-228
    • /
    • 2002
  • 현재 유전자 서열 분석이 완료된 유전체들이 점점 늘어나고 있다. 따라서 이에 대한 방대한 정보가 생성됨에 따라 다양한 생물체들에 대하여 대사 네트웍을 통한 다차원적 분석이 가능하게 되었다. 대사 네트웍은 단백질 또는 효소들의 전체적인 상호작용을 표현하기 때문에 생물학적 메카니즘에 대하여 보다 풍부한 정보를 제공해 준다. 본 논문에서는 일차원적인 유전자 서열에 의한 종의 계통 분류가 아니라 메타 수준의 생리 구조적 비교를 통하여 계통분류학에 대하여 새로운 방법의 접근을 제안하고자 한다. 제안된 방법은 기존의 상동성 비교에 의한 계통 분류와 함께 좀 더 포괄적이고 거시적인 분석을 가능하게 한다.

  • PDF

구조적 특징에 기반한 대사 경로 드로잉 알고리즘의 설계 및 구현 (Design and Implementation of a Metabolic Pathway Drawing Algorithm based on Structural Characteristics)

  • 이소희;송은하;이상호;박현석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.325-327
    • /
    • 2004
  • '생물정보학'이란 생물학적 데이터를 처리, 가공하여 정보를 얻어내는 연구 분야로 이 중 대사체학은 대사 경로 네트워크를 가시화하여 생명 활동을 이해하고자 하는 분야로, 대사 경로 내의 흐름을 한 눈에 알 수 있도록 가시화하여 보여 주는 도구가 반드시 필요하다 따라서 본 논문에서는 새로운 '대사 경로 드로잉 알고리즘'을 제안하였다. 대사 경로 그래프의 구조로는 이분 그래프를 이용하여 가독성을 높였으며. 이 그래프가 척도 없는(scale-free) 네트워크 구조라는 것과 구조적으로 환형, 계층적 선형 컴포넌트를 가진다는 것을 고려하여 사이즈가 큰 그래프도 적절하게 드로잉 하도록 하였다.

  • PDF