• 제목/요약/키워드: 마이크로어레이 데이터

검색결과 103건 처리시간 0.02초

효모 마이크로어레이 유전자발현 데이터에 대한 군집화 비교 (Comparison of clustering with yeast microarray gene expression data)

  • 이경아;김재희
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권4호
    • /
    • pp.741-753
    • /
    • 2011
  • 마이크로어레이 유전자 발현데이터인 효모데이터를 이용하여 군집분석을 실시하였다. 모형기반 군집방법, K-평균법, 중앙값 중심분포 (PAM), 자기 조직화 지도 (SOM), 계층적 Ward 군집방법을 이용하여 군집화를 실시하고, 연결성 측도 (connectivity), Dunn지수, 실루엣 측도 (silhouette)를 이용하여 각 군집방법에 대한 유효성을 측정하고 군집분석 결과를 비교하고자한다.

암 분류를 위한 분류기법의 성능비교 (Performance Comparison of Multiclass Classification Methods for cancer Classification)

  • 박윤정;박승수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.220-222
    • /
    • 2006
  • 현재 마이크로어레이 기술은 대량의 유전자 발현 데이터 특히 암과 관련한 데이터들을 쏟아내고 있다. 이 데이터를 기반으로 암의 종류에 따른 유전자들의 차별적 발현 양상을 분석하고 발현량의 변화가 두드러지는 유전자들에 기반하여 암을 분별할 수 있는 분류 모델을 구축한 후, 이것을 암을 진단하거나 예측하는데 이용할 수 있다. 본 논문에서는 마이크로어레이 데이터를 사용해 특징추출방법과 분류를 위한 Naive Bayes, k-Nearest Neighborhood, Decision Tree, Support Vector Machine, Neural Network 알고리즘을 이용하여 최적의 조합을 찾고 어떤 알고리즘이 가장 효과적인지 실험을 통해 분석해보고 성능평가 하는 것을 목표로 한다.

  • PDF

마이크로어레이 데이터를 이용한 점증적 유전자 선택기반 암 분류 (Incremental Gene Selection-based Cancer Classification Using Microarray Data)

  • 권형태;홍진혁;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (B)
    • /
    • pp.7-10
    • /
    • 2007
  • 마이크로어레이 데이터는 매우 많은 수의 유전자로 구성되며, 암 분류 성능을 높이기 위해서는 대상 암과 관련된 유용한 유전자를 선택해야 한다. 기존 필터 기반 유전자 선택 기법은 유전자를 개별적으로 평가하여 암 분류에 사용하기 때문에, 유전자 사이의 관계나 분류기와의 상관성을 고려하지 않으며, 비슷한 특성의 유전자를 중복해서 선택하는 경향이 있다. 본 논문에서는 필터와 래퍼 방식을 결합하여 분류결과를 반복적으로 반영하며 유전자를 선택하는 기법을 제안한다. 필터 기법으로 유전자의 순위를 계산할 때 이전 분류에서 틀린 샘플의 가중치가 높도록 설계하고, 분류를 반복하면서 각 단계에서 유용한 유전자를 추가로 선택한다. 제안하는 방법을 대표적 암 분류 데이터인 림포마 암과 대장암 데이터에 적용하여 유용성을 검증하였다.

  • PDF

시간열 마이크로어레이 데이터를 이용한 질병 관련 유의한 패스웨이 유전자 집합의 검출 (A Method of Identifying Disease-related Significant Pathways Using Time-Series Microarray Data)

  • 김재영;신미영
    • 전자공학회논문지CI
    • /
    • 제47권5호
    • /
    • pp.17-24
    • /
    • 2010
  • 최근 특정 질병의 진단이나 예후 예측을 위해 마이크로어레이 실험 데이터를 이용한 질병 관련 바이오마커 검출 연구가 활발히 진행되고 있다. 특히 정상인에 비해 질병 환자군에서 특이하게 발현되는 개별 유전자를 바이오 마커로 이용하는 기존의 방식과는 달리 동일한 생물학적 패스웨이에 관여하는 유전자 집합의 변화를 분석하여 특이하게 발현되는 패스웨이 유전자 집합을 바이오 마커로 사용하는 유전자 집합 분석(Gene-set analysis) 연구가 주목받고 있다. 본 논문에서는 다양한 실험 조건 요인을 가지는 시간열 마이크로어레이 실험 데이터를 이용한 유의한 패스웨이 유전자 집합을 검출하는 방법에 대해 제안한다. 시간열 마이크로어레이 데이터을 이용하여 유전자 집합 분석을 수행하기 위해서는 시간에 따른 유전자 발현값의 변화에 따라 개별 유전자의 유의성을 나타내는 스코어를 maSigPro (microarray Significant Profiles)를 이용하여 계산한 후, 이를 기반으로 전체 유전자의 순위를 결정하여 후보 유전자 집합에 대한 유의성 검증을 윌콕슨 순위합 검증을 통해 수행한다. 후보 유전자 집합의 생성을 위해서는 MSigDB (Molecular Signatures Database)의 패스웨이 정보를 이용하였으며, 본 논문에서 제안한 방법의 검증을 위해 공개된 전립선 암 관련 시간열 마이크로어레이 실험 데이터에 적용한 결과 실제로 전립선암과 관련된 것으로 밝혀진 7개의 패스웨이 중 6개의 패스웨이를 정확하게 검출할 수 있었다.

시드 클러스터링 방법에 의한 유전자 발현 데이터 분석 (Gene Expression Data Analysis Using Seed Clustering)

  • 신미영
    • 전자공학회논문지CI
    • /
    • 제42권1호
    • /
    • pp.1-7
    • /
    • 2005
  • 마이크로어레이 데이터의 클러스터 분석은 생물학적으로 연관성 있는 유전자 그룹을 찾기 위해 종종 사용되는 방법이다. 기능적으로 연관된 유전자들이 대개 유사한 발현 패턴을 나타내는 특징을 이용하여 유사한 발현 프로파일을 가진 유전자 그룹을 찾아냄으로써 알려지지 않은 유전자들의 기능을 같은 그룹에 속한 다른 유전자로부터 유추할 수 있기 때문이다. 본 논문에서는 클러스터 분석을 위해 시드 클러스터링 알고리즘을 새로이 제안하고, 이 방법을 마이크로어레이 데이터 분석에 적용해본다. 시드 클러스터링 방법은 주어진 데이터를 계산적으로 분석하여 시드 패턴을 자동 추출하고, 이러한 시드 패턴을 목적 클러스터의 프로토타입 벡터로서 간주하여 클러스터를 생성하는 방법이다. 이러한 시드 클러스터링 방법은 수학적 원리에 기초하고 있기 때문에, 매우 체계적인 방법으로 안정적이며 일관성 있는 클러스터링 결과를 생성할 수 있다. 또한, 실제 마이크로어레이 데이터 분석에 적용해본 결과 데이터에 내재된 각 클러스터를 대표하는 시드 패턴을 매우 효과적으로 자동 추출할 수 있었으며, 클러스터링 결과 또한 타 방법에 비해 다소 우월한 경향을 나타내었다.

대조적인 지역 클러스터 식별 (Identification of Contrasting Local Clusters)

  • 이건명;이선아;황경순;이찬희
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2008년도 춘계학술대회 학술발표회 논문집
    • /
    • pp.286-287
    • /
    • 2008
  • 마이크로어레이 데이터는 여러 샘플들의 대량의 유전자들에 대한 발현정보를 표현하며, 이에 대한 분석을 통해서 생명현상에 대한 이해와 분석이 이루어지고 있다. 생명현상이 유전자의 발현에 많은 영향을 받는 것이 알려져있기 때문에 실험 샘플 집단내에서 또는 실험 샘플 집단간에서 발현 특성이 대조적으로 나타나는 유전자의 집단을 추출하는 것이 유용한 경우가 있다. 이 논문에서 관심영역으로 선택된 영역에 대해서 대조적인 패턴을 갖는 집단을 알고리즘적으로 선택하는 방법을 제안한다.

  • PDF

Non-negative matrix factorization 을 이용한 마이크로어레이 데이터의 클러스터링 (Clustering gene expression data using Non -Negative matrix factorization)

  • Lee, Min-Young;Cho, Ji-Hoon;Lee, In-Beum
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2004년도 The 3rd Annual Conference for The Korean Society for Bioinformatics Association of Asian Societies for Bioinformatics 2004 Symposium
    • /
    • pp.117-123
    • /
    • 2004
  • 마이크로어레이 (microarray) 기술이 개발된 후로 연관된 유전자 클러스터 (cluster)를 찾는 문제는 깊이 연구되어왔다. 이 문제는 핵심적인 과제 중 하나는 생물학적으로 타당한 클러스터의 수를 결정하는 데 있다. 본 논문은 최적의 클러스터 수를 결정하는 기준을 제시하고, non-negative factorization (NMF)를 이용해 클러스터 centroid의 패턴을 찾는 방법을 제안한다. NMF에 의해 발견된 각각의 패턴은 생물학적 프로세스의 특정 부분으로 해석될 수 있다. NMF는 factor matrix의 entity를 non-negative로 제약 (constraint)하고, 이 제약은 오직 additive combination만 허용하기 때문에 이러한 부분적인 패턴을 찾아낼 수 있다. NMF의 유용성은 이미지 분석과 텍스트 분석에서 이미 입증되어 있다. 본 논문에서 제안한 방법에 의해 위의패턴과 유사한 발현 패턴을 갖는 유전자를 모을 수 있었다. 제안된 방법은 human fibroblast데이터와 yeast cell cycle 데이터에 적용해 성능을 입증하였다.

  • PDF

Potential SVM을 이용한 압타머칩에서의 바이오마커 탐색 (Biomarker Detection on Aptamer-based Biochip Data by Potential SVM)

  • 김병희;김성천;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (A)
    • /
    • pp.22-27
    • /
    • 2006
  • 압타머칩은 혈청(serum) 내의 지정된 단백질의 상대적 양을 직접 측정할 수 있는 바이오칩으로서, 의학적 질병 진단에 유용하게 사용할 수 있는 툴이다. 압타머칩 데이터 분석에는 기존의 마이크로어레이 분석기법을 그대로 적용할 수 있다. 본 논문에서는 Potential SVM(PSVM)을 이용하여, 심혈관질환 샘플 기반의 압타머칩 데이터에서 바이오마커 후보 단백질을 선정한 결과를 정리한다. PSVM은 분류 알고리즘으로서 뿐만 아니라 자질 선택(feature selection)에서도 우수한 성능을 보이는 알고리즘으로 알려져 있다. 심혈관 질환의 단계에 따라 구분한 4개 클래스, 135개 샘플로 구성된 3K 압타머칩 데이터에 대해 PSVM을 적용하여 자질을 선택하고 분류성능을 측정한 결과, 마이크로어레이에서의 자질 선택에 많이 사용되는 Gain Ratio 기법과 비교하여 보다 적은 수의 단백질 정보로 보다 나은 분류 성능을 보임을 확인하였다. 더불어, PSVM을 이용해 선택한 단백질군을 심혈관 질환 진단을 위한 바이오마커 후보로 제시한다.

  • PDF

지역정렬을 이용한 유전자 발현 조절 프로그램 예측 (Inference of Gene Regulatory Program using Local Alignment)

  • 이지연;진희정;조환규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (A)
    • /
    • pp.11-16
    • /
    • 2006
  • 세포의 활동은 단순히 하나의 유전자의 발현으로 설명되기보다 여러 유전자와 그로 인해 생성된 단백질의 상호 작용에 의해 나타난다. 또한 마이크로어레이 실험을 통해 세포 내의 유전자 발현에 대한 정보를 알 수 있게 되고, Chromatin IP 마이크로어레이 실험을 통해 신뢰도가 높은 유전자 발현 조절 관계 데이터를 얻을 수 있게 되면서, 유사한 기능과 유사한 발현 패턴을 보이는 유전자들을 그룹으로 묶어 유전자 모듈로 규정하고 이를 하나의 유전자 조절 네트워크로 구성하고, 분석하는 연구들이 진행되고 있다. 본 논문에서는 ChIP 실험 데이터와 유전자 발현 데이터를 이용하여 지역 정렬을 수행해 하나의 유전자 모듈을 조절하는 조절 프로그램을 예측하는 알고리즘에 대해 기술한다. 조절 프로그램은 유전자 조절 모듈을 조절하는 조절자들의 역할 및 발현 여부에 따른 유전자 조절 모듈 내 유전자들의 발현을 설명할 수 있는 것이다.

  • PDF

약동학적 파라미터를 이용한 시간경로 마이크로어레이 자료의 군집분석 (Clustering of Time-Course Microarray Data Using Pharmacokinetic Parameter)

  • 이효정;김별아;박미라
    • 응용통계연구
    • /
    • 제24권4호
    • /
    • pp.623-631
    • /
    • 2011
  • 시간경로 마이크로어레이 자료 분석의 주요 목적 중의 하나는 유전자들의 시간에 따른 발현수준의 변화를 고려함으로써 발현패턴에 기초한 유전자들의 그룹을 찾기 위한 것으로, 군집분석을 위한 다양한 알고리즘들이 제안되었다. 본 연구에서 시간경로 마이크로어레이 자료에 대한 군집분석을 위해 두 약물제제 간 생물학적 동등성을 평가하기 위한 약동학 시험에서 사용되는 약동학적 파라미터 값에 기초한 군집분석을 제안하였으며 이를 실제 데이터 및 모의실험 자료에 적용하여 유용성을 검토하였다.