• 제목/요약/키워드: 마이크로어레이 데이터

검색결과 103건 처리시간 0.034초

Seed를 이용한 마이크로어레이 데이터 클러스터링과 유전자 온틀로지를 이용한 클러스터의 해석

  • 강은미;신미영;정호열;박선희;조환규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.244-246
    • /
    • 2004
  • 마이크로어레이 칩 실험을 통하여 대량으로 생산되는 유전자 발현 데이터는 여러 가지 클러스터링 방법을 적용하여 분석할 수 있으며, 생성된 클러스터들 또한 여러 가지 방법으로 해석 할 수 있다. 본 논문에서는 기존의 클러스터링 방법들을 응용한 seed클러스터링 방법을 제안하고 생물학적 온톨로지인 Gene Ontology를 기반으로 클러스터를 해석한다. 본 논문에서는 효과적인 유전자 발현 데이터 클러스터링 방법과 생물학적 지식을 바탕으로 클러스터를 해석, 평가하는 방법을 보여 준다.

  • PDF

유전자 발현 데이터에 적용한 거시적인 바이클러스터링 기법 (Macroscopic Biclustering of Gene Expression Data)

  • 안재균;윤영미;박상현
    • 정보처리학회논문지D
    • /
    • 제16D권3호
    • /
    • pp.327-338
    • /
    • 2009
  • 마이크로어레이 데이터는 유전자의 집합이 어떠한 조건 혹은 샘플의 집합 하에서 얼마나 발현되는지를 수치화한 2차원 행렬 데이터이다. 바이클러스터는 마이크로어레이의 샘플의 부분 집합과 이 샘플 부분 집합 하에서 일정한 증감 패턴을 보이는 유전자의 부분 집합을 말한다. 이렇게 같은 패턴을 보이는 유전자의 부분 집합은 일정한 정도의 유의 수준으로 비슷한 기능을 한다고 말할 수 있다. 따라서 바이클러스터링 알고리즘은 같은 기능에 연관된 유전자의 집합과, 이 기능이 발현되고 있는 조건의 집합을 밝혀내는데 있어서 매우 유용하다. 본 논문에서는 다항식 시간 복잡도를 유지하면서, 높은 기능적 상관관계를 가지는 바이클러스터를 밝혀 낼 수 있는 알고리즘을 제안한다. 이 알고리즘은 1) 마이크로어레이 데이터에 심한 노이즈가 있을 경우 패턴으로 인식하지 못하는 기존 알고리즘과 달리, 노이즈 레벨이 심하더라도 거시적으로 비슷한 모양을 보이는 패턴을 찾아내는 방식을 이용하여 숨어있는 패턴들을 찾아낼 수 있고, 2) 바이클러스터 상호간에 오버랩을 허용하며, 또한 다양성이 보장되는 복수의 바이클러스터를 찾아내며, 3) 찾아진 유전자 부분 집합의 기능적 상관관계가 매우 높은 특성을 지니고, 4) 유전자 및 샘플의 순서와 상관없이 결정적인(deterministic) 결과를 도출한다. 또한 본 논문에서는 알고리즘이 찾아낸 바이클러스터의 기능적 상관관계의 정도와, 비교 알고리즘이 찾아낸 바이클러스터의 기능적 상관관계의 정도를 유전자 온톨로지(Gene Ontology)를 통해서 측정함으로써 비교하고 있다.

마이크로어레이 데이터와 PPI 데이터를 이용한 에스트로겐 수용체 음성 유방암 환자의 예후 특이 네트워크 식별 및 예후 예측 (Identification of prognosis-specific network and prediction for estrogen receptor-negative breast cancer using microarray data and PPI data)

  • 황유현;오민;윤영미
    • 한국컴퓨터정보학회논문지
    • /
    • 제20권2호
    • /
    • pp.137-147
    • /
    • 2015
  • 본 논문에서는 유전자 네트워크를 기반으로 유방암 환자의 예후를 예측하는 알고리듬을 제안한다. 유방암 환자의 마이크로어레이 데이터와 PPI(Protein-protein interaction)데이터를 이용하여 알고리듬의 분류자로 사용될 예후 특이 네트워크(Prognosis specific gene network)를 추출한다. PPI에 속한 모든 유전자 네트워크에 대하여 각각의 네트워크가 예후 좋음과 나쁨을 잘 구분하는지에 대한 점수를 피어슨 상관계수(Pearson's correlation coefficient)와 마이크로어레이 데이터를 이용하여 계산한다. 이들 중 가장 예후에 유의한 네트워크를 식별하고, 이 네트워크를 분류자로 사용하여 에스트로겐 수용체 음성 유방암 환자의 예후를 분류 분석 한다. 본 연구와 기존 연구의 알고리듬 정확도를 비교 분석 하기 위하여 독립 실험을 진행하고, 본 연구에서 제안된 알고리듬의 성능이 더 우수함을 보인다. 또한, Gene Ontology 데이터베이스를 활용하여 식별된 예후 특이 네트워크를 기능적으로 검증 한다.

마이크로 어레이 데이터에 적용된 2단계 K-means 클러스터링의 소개 (An Introduction of Two-Step K-means Clustering Applied to Microarray Data)

  • 박대훈;김연태;김성신;이춘환
    • 한국지능시스템학회논문지
    • /
    • 제17권2호
    • /
    • pp.167-172
    • /
    • 2007
  • 많은 유전자 정보와 그 부산물은 많은 방법을 통해 연구되어 왔다. DNA 마이크로어레이 기술의 사용은 많은 데이터를 가져왔으며, 이렇게 얻은 데이터는 기존의 연구 방법으로는 분석하기 힘들다. 본 논문에서는 많은 양의 데이터를 처리할 수 있게 하기 위하여 K-means 클러스터링 알고리즘을 이용한 분할 클러스터링을 제안하였다. 제안한 방법을 쌀 유전자로부터 나온 마이크로어레이 데이터에 적용함으로써 제안된 클러스터링 방법의 유용성을 검증하였으며, 기존의 K-means 클러스터링 알고리즘을 적용한 결과와 비교함으로써 제안된 알고리즘의 우수성을 확인할 수 있었다.

지식축적기반 마이크로어레이 분석 통합개발환경 프로그램 설계 (IDE Design for Microarray Analysis Based on Accumulative Knowledge)

  • 서민석;최지혜;오세종
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2010년도 춘계학술발표논문집 2부
    • /
    • pp.1201-1204
    • /
    • 2010
  • 최근, 마이크로어레이 실험 데이터의 품질과 재 생산성에 대한 신뢰도가 증가했기 때문에 마이크로어레이 데이터의 공유 및 활용에 대한 요구가 꾸준히 증가하고 있다. 하지만, 개별적으로 진행되는 이 실험에서, 연구자는 각각의 실험계획에 따른 실험을 위해 별도로 실험계획을 하고, 그에 따른 단편적인 결과를 얻을 뿐, 이를 다시 재활용 하는 방안에는 microarray databases를 이용하는 것만이 전부였다. 하지만, 이 방법은 일반 생물학자들이, 다시 데이터베이스를 이용해서 분석하는데 많은 어려움을 가져왔고, 또한 각각의 실험 과정을 이용하는 과정에서도, 통합개발환경을 구축하지 못 한 것에 대해 시간적 손해를 많이 입고 있다. 이에 본 논문에서는 실험계획부터 자료의 표준화 및 시각화, 유의한 유전자 탐색, 군집분석, 분류분석을 할 수 있는 통합개발환경 프로그램에 대해 제시하고, 결론적으로 이 데이터를 효과적으로 재활용 할 수 있는 방안에 대해서 제시하였다. 결론적으로, 이 프로그램은 개별적인 통계 프로그램으로 분석을 할 때에 비해, 편의성이 향상하며, 시간적인 소모를 줄임으로써, 상당히 많은 이득을 얻을 수 있으며, 한번 분석한 데이터를 효율적으로 저장해 놓음으로써, 추후에 제 2,3의 데이터 가공을 통해, 더 많은 정보를 얻어 낼 수 있다.

  • PDF

DNA 마이크로어레이 데이터의 계층적 클러스터링에 대한 리프오더링 알고리즘 개발 (A Heuristic Leaf Ordering Algorithm for Hierarchical Clustering of DNA Microarray Data)

  • 여상수;이정원;김성권
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (A)
    • /
    • pp.706-708
    • /
    • 2002
  • DNA 마이크로어레이 실험으로 나온 데이터들을 클러스터링하는 것은 유전자의 기능과 유전자의 네트워크를 파악해 나가는데 도움을 주게 된다. 계층적 클러스터링(hierarchical clustering) 방법은 그러한 실험 분석에서 가장 보편적으로 사용되는 방법이다. 본 논문에서는 계층적 클러스터링을 통해서 나온 결과 트리에 대해서, 트리의 리프 노드들을 재배열함으로써, 인접한 리프 노드들간의 거리의 종합이 최소가 되도록 하는 문제인 리프오더링 방법을 다루었고, 새로운 리프오더링 알고리즘을 제안하였다. 그리고, 이를 포함한 여러 리프오더링 방법들에 대한 실험 및 생물학적인 분석을 하였다.

  • PDF

마이크로어레이 데이터의 게놈수준 분석을 위한 퍼지 패턴 매칭에 의한 유전자 필터링 (Gene filtering based on fuzzy pattern matching for whole genome micro array data analysis)

  • 이선아;이건명;이승주;김원재;김용준;배석철
    • 한국지능시스템학회논문지
    • /
    • 제18권4호
    • /
    • pp.471-475
    • /
    • 2008
  • 생명과학분야에서 마이크로어레이 기술은 세포에서의 RNA 발현 프로파일을 관찰할 수 있도록 함으로써 생명현상의 규명 및 약물개발 등에서 분자수준의 생명현상에 대한 관찰과 분석이 가능해지고 있다. 마이크로어레이 데이터분석에서는 특정한 처리나 과정에서 현저한 특성을 보이는 유전자를 식별하기 위한 분석뿐만 아니라 유전자 전체인 게놈수준에서의 분석도 이루어진다. 약물반응 실험에서는 약물에 대한 게놈수준의 발현 프로파일을 관찰하는 것도 많은 정보를 제공할 수 있다. 약물실험에서는 대조군과 실험군들간에 관심있는 상대적인 발현특성을 갖는 유전자군을 전체적으로 추출하는 것이 필요한 경우가 있다. 예를 들면 정상군은 두개의 실험군에 대해서 중간정도의 발현정도를 갖는 유전자군을 식별하는 분석을 하는 경우, 생물학적인 데이터의 특성상 절대값을 비교하는 방법으로는 유용한 유전자들을 효과적으로 식별해 낼 수 없다. 이 논문에서는 정상군과 실험군들의 발현정도값의 경향을 판단하기 위해서 각 유전자에 대해서 집단별 대표값을 선정하여 퍼지집합으로 집단의 값의 범위를 결정하고, 이를 이용하여 특성 패턴을 갖는 유전자들을 식별해내는 방법을 제안하고, 실제 데이터를 통해서 실험한 결과를 보인다.

정규화 기반 Adaptive Simulated Annealing을 이용한 마이크로어레이 데이터 분류 시스템 (The Classification System of Microarray Data Using Adaptive Simulated Annealing based on Normalization.)

  • 박수영;정채영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.69-72
    • /
    • 2006
  • 최근 생명 정보학 기술의 발달로 마이크로 단위의 실험조작이 가능해짐에 따라 하나의 chip상에서 전체 genome의 expression pattern을 관찰할 수 있게 되었고, 동시에 수 만개의 유전자들 간의 상호작용도 연구가능하게 되었다. 이처럼 DNA 마이크로어레이 기술은 복잡한 생물체를 이해하는 새로운 방향을 제시해주게 되었다. 따라서 이러한 기술을 통해 얻어진 대량의 유전자 정보들을 효과적으로 분석하는 방법이 시급하다. 본 논문에서는 마이크로어레이 실험에서 다양한 원인에 의해 발생하는 잡음(noise)을 줄이거나 제거하는 과정인 정규화과정을 거쳐 특징 추출방법인 SVM(Support Vector Machine) 방법을 이용하여 데이터를 2개의 클래스로 나누고, 표준화 방법들의 성능 비교를 위해 Adaptive Simulated Annealing 알고리즘으로 정확도를 평가하는 분류 시스템을 설계 구현하였다.

  • PDF

마이크로어레이 기반 종양 분류 모델 설계와 구현 (The Design and Implement on Tumor Classification Model Based on Microarray)

  • 박수영;정채영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.713-716
    • /
    • 2007
  • 오늘날 인간 프로젝트와 같은 종합적인 연구의 궁극적 목적을 달성하기 위해서는 이들 연구로부터 획득한 대량의 관련 데이터에 대해 새로운 현실적 의미를 부여할 수 있어야 한다. 따라서 현재의 마이크로어레이 기술을 이용해서 효과적으로 종양을 분류하기 위해서는 특정 종양 분류와 밀접하게 관련이 있는 정보력 있는 유전자를 선택하는 과정이 필수적이다. 본 논문에서는 암에 걸린 흰쥐 외피 기간 세포 분화 실험에서 얻어진 3840 유전자의 마이크로어레이 cDNA를 이용해 데이터의 정규화를 거쳐 유사성 척도 방법으로 정보력 있는 유전자들을 추출한 후, DT, NB, SVM, MLP 알고리즘을 이용하여 클래스 분류 모델을 구축하고, 성능을 비교분석하였다. 피어슨 적률 상관 계수를 이용하여 선택된 50 유전자들을 멀티퍼셉트론 분류기로 분류한 결과 94.8%의 정확도를 보여 가장 최적의 조합을 보였다.

유전자 온톨로지를 이용한 마이크로어레이 데이터의 유전자 기능 분석 시스템의 개발 (Development of a Gene's Functional Classifying System for a Microarray Data using a Gene Ontology)

  • 이종근;박성수;홍동완;윤지희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (C)
    • /
    • pp.246-251
    • /
    • 2006
  • 마이크로어레이 실험은 수 천에서 수 만개의 유전자 발현 결과를 동시에 측정할 수 있어 질병의 발현 형질 분류 등에 유용하게 이용되고 있다. 그러나 마이크로어레이 실험은 동일한 플랫폼의 실험이라 할지라도 환경 등에 따라 그 실험 결과에 차이가 나는 등 오차를 항상 포함하고 있다. 또한 마이크로어레이 실험은 아직 고가의 실험으로 분류되어 다수의 샘플에 대한 반복 실험 결과를 얻기 어려운 상황이다. 따라서 이종의 플랫폼, 데이터 포맷, 정규화 기법 등이 서로 다른 데이터를 효율적으로 통합하여 유용한 정보를 추출하는 새로운 방식의 개발이 필요하다. 본 논문은 이와 같은 문제를 해결하기 위한 기초 단계 연구 결과이다. 마이크로어레이 실험 데이터로부터 통계적 방법을 이용하여 유의(informative) 유전자를 추출하고 유전자 온톨로지(Gene Ontology : GO)와의 연계를 통하여 유전자 정보의 기능적 분류 결과를 사용자에게 제공하는 유전자 기능 분석 시스템의 설계 및 구현 방안을 보인다. 본 시스템의 실험방법에서는 3-Fold Filtering 기법을 통하여 발현 차가 큰 유전자를 추출하고, t-검정 기법에 의하여 이들 유전자를 순위화 하였으며, 이 중 상위 100개의 유전자를 유의 유전자로 추출하였다. 다음, 이 들 유의 유전자의 t-검정 값을 GO의 유전자 기능을 나타내는 해당 텀 (term)에 가중치로 부과하여 각 유전자들과 기능적으로 연관성이 높은 텀들을 추출한다. 또한 본 연구의 유효성을 검증하기 위하여 본 시스템에 의한 마이크로어레이 데이터 분석 결과를 전문가에 의한 유전자 기능 분석 결과와 비교한다.투명성 있는 서비스를 제공하고 높은 신뢰성과 안정성이 확보될 수 있도록 구성하고자 한다. Query 수행을 여러 서버로 분산처리하게 함으로써 성능에 대한 신뢰성을 향상 시킬 수 있는 Load Balancing System을 제안한다.할 때 가장 효과적인 라우팅 프로토콜이라고 할 수 있다.iRNA 상의 의존관계를 분석할 수 있었다.수안보 등 지역에서 나타난다 이러한 이상대 주변에는 대개 온천이 발달되어 있었거나 새로 개발되어 있는 곳이다. 온천에 이용하고 있는 시추공의 자료는 배제하였으나 온천이응으로 직접적으로 영향을 받지 않은 시추공의 자료는 사용하였다 이러한 온천 주변 지역이라 하더라도 실제는 온천의 pumping 으로 인한 대류현상으로 주변 일대의 온도를 올려놓았기 때문에 비교적 높은 지열류량 값을 보인다. 한편 한반도 남동부 일대는 이번 추가된 자료에 의해 새로운 지열류량 분포 변화가 나타났다 강원 북부 오색온천지역 부근에서 높은 지열류량 분포를 보이며 또한 우리나라 대단층 중의 하나인 양산단층과 같은 방향으로 발달한 밀양단층, 모량단층, 동래단층 등 주변부로 NNE-SSW 방향의 지열류량 이상대가 발달한다. 이것으로 볼 때 지열류량은 지질구조와 무관하지 않음을 파악할 수 있다. 특히 이러한 단층대 주변은 지열수의 순환이 깊은 심도까지 가능하므로 이러한 대류현상으로 지표부근까지 높은 지온 전달이 되어 나타나는 것으로 판단된다.의 안정된 방사성표지효율을 보였다. $^{99m}Tc$-transferrin을 이용한 감염영상을 성공적으로 얻을 수 있었으며, $^{67}Ga$-citrate

  • PDF