• 제목/요약/키워드: 유전자 발현 데이터

검색결과 190건 처리시간 0.033초

Pharmacogenomics를 위한 대규모 베이지안 유전자망 학습 (Large-Scale Bayesian Genetic Network Learning for Pharmacogenomics)

  • 황규백;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.139-141
    • /
    • 2001
  • Pharmacogenomics는 개인의 유전적 성향과 약물에 대한 반응간의 관계에 대해 연구하는 학문이다. 이를 위해 DNA microarray 데이터를 비롯한 대량의 생물학 데이터가 구축되고 있으며 이러한 대규모 데이터를 분석하기 위해서 기계학습과 데이터 마이닝의 여러 기법들이 이용되고 있다. 본 논문에서는 pharmacogenomics를 위한 생물학 데이터의 효율적인 분석 수단으로 베이지안망(Bayesian network)을 제시한다. 배이지안망은 다수의 변수들간의 확률적 관계를 표현하는 확률그래프모델(probabilistic graphical model)로 유전자 발현과 약물 반응 사이의 확률적 의존 관계를 분석하는데 적합하다. NC160 cell lines dataset으로부터 학습된 베이지안 유전자망(Bayesian genetic network)이 나타내는 관계는 생물학적 실험을 통해 검증된 실제 관계들을 다수 포함하며, 이는 배이지안 유전자망 분석을 통해 개략적인 유전자-유전자, 약물-약물, 유전자-약물 관계를 효율적으로 파악할 수 있음을 나타낸다.

  • PDF

다양한 종에서 하우스키핑 유전자 선택의 중요성 (Importance of Selecting The characterized Housekeeping Genes as Reference Genes in Various Species)

  • 채한화;노윤정;노희종;임다정
    • 한국산학기술학회논문지
    • /
    • 제21권8호
    • /
    • pp.417-428
    • /
    • 2020
  • 하우스키핑 유전자는 에너지생성, 물질합성, 세포사멸 및 세포방어 등과 같은 세포의 기본적인 기능을 수행하기 때문에 모든 유기체의 세포에서 발현된다. 세포의 기본적인 기능을 유지하기 때문에 발현 수준이 상대적으로 일정하여 단백질 발현 및 목적 유전자의 mRNA 발현 분석 등과 같은 유전자 발현 연구에서 기준 유전자로 사용되고 있다. 그러나 이들 유전자의 발현 수준은 조직과 세포마다 다를 수 있으며, 특정 환경 하에서 변할 수 있다. 그러므로 하우스키핑 유전자의 발현 안정성을 탐색하여 유전자 발현 연구에서 최적의 기준 유전자를 선택하는 것이 중요하다. 이 리뷰는 문헌을 통해 인간, 닭, 돼지 그리고 쥐에서 발견된 하우스키핑 유전자를 요약하고, geNorm, NormFinder 그리고 BestKeeper 소프트웨어를 통해 발현 안정성을 추정하였다. 하우스키핑 유전자의 발현 안정성에 대한 탐색은 유전자 발현 연구에서 실험 조건에 따라 가장 적합한 기준 유전자를 선별할 수 있고, 데이터의 정규화를 위해 적용될 수 있다.

유전자 온톨로지를 이용한 마이크로어레이 데이터의 유전자 기능 분석 시스템의 개발 (Development of a Gene's Functional Classifying System for a Microarray Data using a Gene Ontology)

  • 이종근;박성수;홍동완;윤지희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (C)
    • /
    • pp.246-251
    • /
    • 2006
  • 마이크로어레이 실험은 수 천에서 수 만개의 유전자 발현 결과를 동시에 측정할 수 있어 질병의 발현 형질 분류 등에 유용하게 이용되고 있다. 그러나 마이크로어레이 실험은 동일한 플랫폼의 실험이라 할지라도 환경 등에 따라 그 실험 결과에 차이가 나는 등 오차를 항상 포함하고 있다. 또한 마이크로어레이 실험은 아직 고가의 실험으로 분류되어 다수의 샘플에 대한 반복 실험 결과를 얻기 어려운 상황이다. 따라서 이종의 플랫폼, 데이터 포맷, 정규화 기법 등이 서로 다른 데이터를 효율적으로 통합하여 유용한 정보를 추출하는 새로운 방식의 개발이 필요하다. 본 논문은 이와 같은 문제를 해결하기 위한 기초 단계 연구 결과이다. 마이크로어레이 실험 데이터로부터 통계적 방법을 이용하여 유의(informative) 유전자를 추출하고 유전자 온톨로지(Gene Ontology : GO)와의 연계를 통하여 유전자 정보의 기능적 분류 결과를 사용자에게 제공하는 유전자 기능 분석 시스템의 설계 및 구현 방안을 보인다. 본 시스템의 실험방법에서는 3-Fold Filtering 기법을 통하여 발현 차가 큰 유전자를 추출하고, t-검정 기법에 의하여 이들 유전자를 순위화 하였으며, 이 중 상위 100개의 유전자를 유의 유전자로 추출하였다. 다음, 이 들 유의 유전자의 t-검정 값을 GO의 유전자 기능을 나타내는 해당 텀 (term)에 가중치로 부과하여 각 유전자들과 기능적으로 연관성이 높은 텀들을 추출한다. 또한 본 연구의 유효성을 검증하기 위하여 본 시스템에 의한 마이크로어레이 데이터 분석 결과를 전문가에 의한 유전자 기능 분석 결과와 비교한다.투명성 있는 서비스를 제공하고 높은 신뢰성과 안정성이 확보될 수 있도록 구성하고자 한다. Query 수행을 여러 서버로 분산처리하게 함으로써 성능에 대한 신뢰성을 향상 시킬 수 있는 Load Balancing System을 제안한다.할 때 가장 효과적인 라우팅 프로토콜이라고 할 수 있다.iRNA 상의 의존관계를 분석할 수 있었다.수안보 등 지역에서 나타난다 이러한 이상대 주변에는 대개 온천이 발달되어 있었거나 새로 개발되어 있는 곳이다. 온천에 이용하고 있는 시추공의 자료는 배제하였으나 온천이응으로 직접적으로 영향을 받지 않은 시추공의 자료는 사용하였다 이러한 온천 주변 지역이라 하더라도 실제는 온천의 pumping 으로 인한 대류현상으로 주변 일대의 온도를 올려놓았기 때문에 비교적 높은 지열류량 값을 보인다. 한편 한반도 남동부 일대는 이번 추가된 자료에 의해 새로운 지열류량 분포 변화가 나타났다 강원 북부 오색온천지역 부근에서 높은 지열류량 분포를 보이며 또한 우리나라 대단층 중의 하나인 양산단층과 같은 방향으로 발달한 밀양단층, 모량단층, 동래단층 등 주변부로 NNE-SSW 방향의 지열류량 이상대가 발달한다. 이것으로 볼 때 지열류량은 지질구조와 무관하지 않음을 파악할 수 있다. 특히 이러한 단층대 주변은 지열수의 순환이 깊은 심도까지 가능하므로 이러한 대류현상으로 지표부근까지 높은 지온 전달이 되어 나타나는 것으로 판단된다.의 안정된 방사성표지효율을 보였다. $^{99m}Tc$-transferrin을 이용한 감염영상을 성공적으로 얻을 수 있었으며, $^{67}Ga$-citrate

  • PDF

유전알고리즘을 이용한 유전자발현 데이타상의 특징-분류기쌍 최적 앙상블 탐색 (Searching for Optimal Ensemble of Feature-classifier Pairs in Gene Expression Profile using Genetic Algorithm)

  • 박찬호;조성배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권4호
    • /
    • pp.525-536
    • /
    • 2004
  • 유전발현 데이타는 생명체의 특정 조직에서 채취한 샘플을 microarray상에서 측정한 것으로, 유전자들의 발현 정도가 수치로 나타난 데이타이다. 일반적으로 정상조직과 이상조직에서 관련 유전자들의 발현정도는 차이를 보이기 때문에, 유전발현 데이타를 통하여 질병을 분류할 수 있다. 이러한 분류에 모든 유전자들이 관여하지는 않으므로 관련 유전자를 선별하는 작업인 특징선택이 필요하며, 선택된 유전자들을 적절히 분류하는 방법이 필요하다. 본 논문에서는 상관계수, 유사도, 정보이론 등에 기반을 둔 7가지 특징선택 방법과 대표적인 6가지 분류기에 대하여 특징-분류기 쌍의 최적 앙상블을 탐색하기 위한 유전자 알고리즘 기반 방법을 제안한다. 두 가지 암 관련 유전자 발현 데이타에 대하여 leave-one-out cross validation을 포함한 실험을 해본 결과, 림프종 데이타와 대장암 데이타 모두 단일 특징-분류기 쌍보다 훨씬 우수한 성능을 보이는 앙상블들을 발견할 수 있었다.

Identification of Differentially Expressed Genes in Ducks in Response to Avian Influenza A Virus Infections

  • Ndimukaga, Marc;Won, Kyunghye;Truong, Anh Duc;Song, Ki-Duk
    • 한국가금학회지
    • /
    • 제47권1호
    • /
    • pp.9-19
    • /
    • 2020
  • 본 연구는 고병원성 조류 인플루엔자 바이러스(high pathogenic avian influenza virus; HPAIV)와 저병원성 조류인플루엔자 바이러스(low pathogenic avian virus; LPAIV)가 감염된 오리의 폐세포에서 보고된 기존 전사체 데이터를 재분석하여 조류 인플루엔자 감염에 대응하는 숙주의 공통 전사체를 발굴하고, 생물정보 분석을 실시하여 바이오 마커로서 가능성을 제시하기 위하여 수행하였다. 이전 연구에서 생산된 microarray 데이터 세트를 재분석하여, HPAIV와 LPAIV가 각각 감염된 오리의 폐세포에서 각각 총 731 및 439개의 차등발현 유전자를 발굴하였다. 이들 차등발현 유전자 중에서, 227개의 유전자가 HPAIV와 LPAIV가 감염된 세포에서 공통적으로 조절되어, 193개의 유전자는 발현이 증가한 반면, 34개의 유전자는 발현이 감소하였다. 생물정보 분석을 통하여 차등발현 유전자들의 기능에 대한 주석달기를 실시하여, 리보솜과 단백질 대사 및 유전자 발현 관련 GO가 풍부해짐을 확인하였다. REACTOME 분석을 통하여 단백질 및 RNA 대사 경로 및 콜라겐 생합성과 변형을 포함한 조직 복구 경로가 조절됨을 확인하였다. 보다 구체적으로, 번역 및 RNA 품질 관리 경로에 관여하는 단백질을 코딩하는 유전자는 HPAIV 및 LPAIV 감염에 반응하여 발현의 증가 또는 감소하는 방향으로 조절되어 AIV가 숙주 번역 기계를 억제함으로써 숙주 방어 시스템을 회피할 수 있거나 번역을 위해 세포질로 내보내기 전에 AIV가 억제될 수 있음을 시사한다. AIV 감염은 바이러스 감염으로 인한 조직의 병변 형성을 조절하는 경로를 활성화시킬 수 있음을 시사한다.

배추의 조직 특이적 발현유전자 데이터베이스 (The Brassica rapa Tissue-specific EST Database)

  • 유희주;박신기;오미진;황현주;김남신;정희;손성한;박범석;문정환
    • 원예과학기술지
    • /
    • 제29권6호
    • /
    • pp.633-640
    • /
    • 2011
  • 배추는 배추속 식물의 A genome을 대표하는 모델로서 다양한 배추과 작물의 유전학 및 유전체학과 육종연구의 기반이 되는 중요한 작물이다. 최근 들어 배추 유전체 해독이 완료됨에 따라 유전체의 기능 연구가 보다 활발히 진행될 것으로 기대된다. 유전체 정보로부터 유전자의 구조를 예측하고, 기능을 분석하여 프로모터를 포함한 유용 유전자를 개발하기 위한 필수 재료로 이용되는 것이 다양한 조직 또는 실험 처리로부터 생성된 발현 유전자 데이터이다. 2011년 7월 현재 공공 데이터베이스에는 39개의 cDNA library로부터 분석된 147,217개의 배추 발현유전자가 보고되어 있다. 그러나 이들 발현 유전자들은 체계적으로 분석되거나 데이터베이스 형태로 정리되어 있지 않기 때문에 연구자들이 유전자 서열로부터 유용한 정보를 추출하여 사용하기 어려운 문제점이 있다. 따라서 해독 완료된 배추 유전체와 함께 발현 유전자 정보를 보다 잘 활용하기 위하여 배추의 조직 특이적 발현유전자 데이터베이스인 BrTED를 개발하였다. 데이터베이스는 EST 서열 처리-정보 검색 단위와 조직특이성 발현 특성 분석 단위로 이루어져 있으며, 각 정보들은 상호 연결되어 유기적인 검색 환경을 제공하게 하였다. BrTED는 23,962개의 단일 조합 유전자서열을 포함하고 있으며, 각 서열들의 유전자 주석과 암호화하고 있는 단백질의 기능을 동시에 제공한다. 또한 각 단일 조합 유전자서열들의 조직별 발현 특이성을 통계 분석을 통해 조사하여 연구자의 검색 기준에 따라 제공한다. BrTED의 실효성을 검증하기 위하여 데이터베이스를 통해 조직 특이적 발현 유전자 29개를 선발하고, 이들의 발현 특성을 RT-PCR로 확인한 결과, 선발한 유전자 모두 목표한 조직에서 특이적이거나 강한 발현을 보였다. BrTED는 조직 특이적 발현유전자를 신속하게 선발할 수 있는 공공 데이터베이스로서 배추의 기능 유전체 연구뿐만 아니라 근연 배추속 작물의 유전학과 유전체학 연구에 유용한 공공 연구 자원으로 이용될 수 있을 것이다.

시간열 마이크로어레이 데이터를 이용한 질병 관련 유의한 패스웨이 유전자 집합의 검출 (A Method of Identifying Disease-related Significant Pathways Using Time-Series Microarray Data)

  • 김재영;신미영
    • 전자공학회논문지CI
    • /
    • 제47권5호
    • /
    • pp.17-24
    • /
    • 2010
  • 최근 특정 질병의 진단이나 예후 예측을 위해 마이크로어레이 실험 데이터를 이용한 질병 관련 바이오마커 검출 연구가 활발히 진행되고 있다. 특히 정상인에 비해 질병 환자군에서 특이하게 발현되는 개별 유전자를 바이오 마커로 이용하는 기존의 방식과는 달리 동일한 생물학적 패스웨이에 관여하는 유전자 집합의 변화를 분석하여 특이하게 발현되는 패스웨이 유전자 집합을 바이오 마커로 사용하는 유전자 집합 분석(Gene-set analysis) 연구가 주목받고 있다. 본 논문에서는 다양한 실험 조건 요인을 가지는 시간열 마이크로어레이 실험 데이터를 이용한 유의한 패스웨이 유전자 집합을 검출하는 방법에 대해 제안한다. 시간열 마이크로어레이 데이터을 이용하여 유전자 집합 분석을 수행하기 위해서는 시간에 따른 유전자 발현값의 변화에 따라 개별 유전자의 유의성을 나타내는 스코어를 maSigPro (microarray Significant Profiles)를 이용하여 계산한 후, 이를 기반으로 전체 유전자의 순위를 결정하여 후보 유전자 집합에 대한 유의성 검증을 윌콕슨 순위합 검증을 통해 수행한다. 후보 유전자 집합의 생성을 위해서는 MSigDB (Molecular Signatures Database)의 패스웨이 정보를 이용하였으며, 본 논문에서 제안한 방법의 검증을 위해 공개된 전립선 암 관련 시간열 마이크로어레이 실험 데이터에 적용한 결과 실제로 전립선암과 관련된 것으로 밝혀진 7개의 패스웨이 중 6개의 패스웨이를 정확하게 검출할 수 있었다.

베이지안망을 이용한 유전자와 약물 간 관계 분석 (Analysis of Gene-Drug Interactions Using Bayesian Networks)

  • 오석준;황규백;장정호;장병탁
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2002년도 춘계 학술발표회 논문집
    • /
    • pp.91-97
    • /
    • 2002
  • 최근의 생물학 연구를 위한 기기의 자동화 및 고속화는 생물학 관련 정보량의 급증을 가져오고 있다. 예를 들어, DNA chip에서 얻어지는 마이크로어레이(microarray)는 수천 종류의 유전자의 발현량을 동시에 측정한다. 이러한 기술들은 생물의 세포나 조직에서 일어나는 일련의 다양한 현상을 전체적으로 조망하는 관점에서 관찰할 수 있는 기회를 제공하고 있으며, 이를 통한 생명공학의 전반적인 발전이 기대되고 있다. 따라서 대량의 생물학 관련 정보의 분석이나 데이터 마이닝이 행해지고 있으며 이를 위한 대표적인 기법들로는 각종 클러스터링(clustering) 및 신경망 계열의 모델 등이 있다. 본 논문에서는 확률그래프모델의 하나인 베이지안망(Bayesian network)을 생물정보분석에 이용한다. 구체적으로 유전자 발현패턴과 약물의 활성패턴 및 암 종류 사이의 확률적 관계를 모델링한다. 이러한 모델은 NCI60 dataset(http://discover.nci.nih.gov)에서 베이지안망을 학습함으로써 구성된다. 분석의 대상이 되는 데이터가 sparse하기 때문에 발생하는 어려움들을 해결하기 위한 기법들이 제시되며 학습된 모델에 대한 검증은 이미 생물학적으로 확인되어 있는 사실과의 비교를 통해 이루어진다. 학습된 베이지안망 모델은 각각의 유전자 간, 혹은 유전자와 처리된 약물 간의 실제 생물학적 관계를 다수 표현하며, 이는 제시되는 방법이 생물학적으로 유의미한 가설을 데이터 분석을 통해 효율적으로 생성하는데 유용하게 활용될 수 있음을 보인다.

  • PDF

효모 마이크로어레이 유전자 발현 데이터에 대한 유전자 선별 및 군집분석 (Gene Screening and Clustering of Yeast Microarray Gene Expression Data)

  • 이경아;김태훈;김재희
    • 응용통계연구
    • /
    • 제24권6호
    • /
    • pp.1077-1094
    • /
    • 2011
  • 마이크로어레이 유전자 발현 데이터인 yeast cdc15에 대해 시계열 데이터의 특성을 반영한 푸리에 계수를 이용한 검정통계량과 FDR 다중비교법을 이용하여 차별화된 유전자를 선별한 후 선별된 유전자들에 대해 모형기반 군집방법, K-평균법, PAM, SOM, 계층적 Ward 군집방법과 Fuzzy 군집방법을 실시하였다. 군집방법에 따른 특성을 알아보고 군집화 결과와 내부유효성 측도로 연결성 측도, Dunn 지수와 실루엣 값을 살펴본다. 또한 GO분석을 통한 생물학적 의미도 파악해본다.

마이크로어레이 데이터를 이용한 암 분류 표지 유전자 선별 시스템 (An Intelligent System of Marker Gene Selection for Classification of Cancers using Microarray Data)

  • 박수영;정채영
    • 한국정보통신학회논문지
    • /
    • 제14권10호
    • /
    • pp.2365-2370
    • /
    • 2010
  • 마이크로어레이를 기반으로 하는 암 분류 방법은 암 종류에 따라 다르게 발현되는 유전자 양상을 통계적으로 발견함으로써 정확한 암 분류에 기여할 수 있다. 따라서 현재의 마이크로어레이 기술을 이용해서 효과적으로 암을 분류하기 위해서는 특정 암과 밀접하게 관련이 있는 정보력 있는 유전자를 선택하는 과정이 필수적이다. 본 논문에서는 난소 암 마이크로어레이 데이터를 이용하여 암에 영향을 미치는 가장 다르게 발현할 가능성이 있는 표지 유전자를 추출할 수 있는 시스템을 고안하고, 다층퍼셉트론 분류기를 이용하여 기존의 마이크로어레이 시스템과 분류 성능을 비교분석하였다. 그 결과 ANOVA를 이용하여 선택된 표지 유전자를 포함하는 마이크로어레이 데이터 셋에서 98.61%의 향상된 분류 성능을 보였다.