• Title/Summary/Keyword: 유전자 발현 데이터

Search Result 190, Processing Time 0.03 seconds

Neural Network Pair with Negatively Correlated Genes for Cancer Classification (암의 분류를 위한 음의 상관관계 유전자의 신경망 쌍)

  • 원홍희;조성배
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.359-361
    • /
    • 2003
  • 정확한 암의 분류는 암의 진단 및 치료에 있어 매우 중요하지만, 암을 진단하기 위한 기존의 여러 방법들은 종종 불완전한 결과를 도출한다. 최근의 마이크로어레이 기술에 기반한 분자 수준의 진단은 정확하고 객관적이며 체계적인 암의 분류를 위한 방법론을 제시해준다. 유전자 발현 데이터는 일반적으로 수천개 이상의 유전자를 포함하는데, 유전자 발현 데이터의 모든 유전자가 암과 관련이 있는 것이 아니므로 정확한 암을 분류하기 위하여 중요한 유전자만을 추출하는 것이 바람직하다. 본 논문에서 음의 상관관계를 갖는 두 개의 이상적인 유전자 벡터를 정의한 후 이와 유사한 정도를 기준으로 중요한 유전자 집단을 추출하고, 각각을 신경망으로 학습하여 결합하는 신경망 쌍을 제안한다. 실험 결과는 음의 상관관계를 갖는 두 개의 유전자 집단이 암의 클래스를 잘 구분할 수 있음을 보여주었다. 이 유전자 집단을 특징으로 하여 각각 학습한 신경망을 베이시안 방법으로 결합한 결과, 벤치마크 데이터에 대하여 신경망 쌍이 개별 분류기에 비해 우수한 성능을 보임을 확인하였다.

  • PDF

Web-based microarray analysis using the virtual chip viewer and bioconductor. (MicroArray의 직관적 시각적 분석을 위한 웹 기반 분석 도구)

  • Lee, Seung-Won;Park, Jun-Hyung;Kim, Hyun-Jin;Kang, Byeong-Chul;Park, Hee-Kyung;Kim, In-Ju;Kim, Cheol-Min
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2005.05a
    • /
    • pp.198-201
    • /
    • 2005
  • DNA microarray 칩은 신약 개발, 유전적 질환 진단, Bio-molecular 상호작용 연구, 유전자의 기능연구 등 폭넓게 사용되고 있다. 이 논문은 cDNA mimcroarray 데이터를 분석하기 위한 웹형태의 시스템 개발에 대한 내용을 다룬다. 하나의 cDNA microarray에는 수 백에서 수 만개의 유전자가 심어져 있으며, 데이터를 분석할 때 대량의 데이터와 다양한 형태의 오류로 인해서 데이터간의 차이를 보정하는 분석 도구와 통계적 기법들이 사용되어야 한다. 본 논문에서는 가상 칩 뷰어를 이용하여 실제 microarray 데이터의 foreground intensity에서 백그라운드의 intensity를 제거하여 일반화된 칩 이미지를 생성한다. 이 가상 칩 뷰어는 여러 가지 필터효과와 서로 다른 두 형광의 차이를 조정하는 global normalization 기법을 사용하여 발현 유전자 분석을 시각적으로 할 수 있고, 중복된 마이크로어레이 칩 데이터를 통하여 시간이 많이 걸리는 분석전 칩의 유효성을 검토할 수 있다. 칩 데이터의 normalization을 위한 통계 방법으로 R 통계 도구와 linear 모델을 사용하여 microarray 칩의 유전자 발현 양상을 분석한다. 통계적 방법을 사용하지 않은 데이터를 추출, 이 데이터의 패턴 그래프 그리고 발현 레벨을 분류하여 마이크로어레이의 각 스팟의 유효성 검토의 정확성을 높였다. 이 시스템은 칩의 유효성 검토, 스팟의 유효성 검토, 유전자 선정에 대해 분석의 용이성과 정확성을 높일 수 있었다.

  • PDF

Seed를 이용한 마이크로어레이 데이터 클러스터링과 유전자 온틀로지를 이용한 클러스터의 해석

  • 강은미;신미영;정호열;박선희;조환규
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.244-246
    • /
    • 2004
  • 마이크로어레이 칩 실험을 통하여 대량으로 생산되는 유전자 발현 데이터는 여러 가지 클러스터링 방법을 적용하여 분석할 수 있으며, 생성된 클러스터들 또한 여러 가지 방법으로 해석 할 수 있다. 본 논문에서는 기존의 클러스터링 방법들을 응용한 seed클러스터링 방법을 제안하고 생물학적 온톨로지인 Gene Ontology를 기반으로 클러스터를 해석한다. 본 논문에서는 효과적인 유전자 발현 데이터 클러스터링 방법과 생물학적 지식을 바탕으로 클러스터를 해석, 평가하는 방법을 보여 준다.

  • PDF

Identification for Gene Regulatory Motifs by Kernel CCA (Kernel CCA를 이용한 유전자 발현 조절 기능 모티프 추출)

  • Rhee Je-Keun;Joung Je-Gun;Chang Jeong-Ho;Zhang Byoung-Tak
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.274-276
    • /
    • 2005
  • 유전자 발현은 많은 전자조절인자에 의해서 조절된다. 이러한 조절인자들은 각각 DNA 상에 존재하는 특정한 모티프에 결합하여 그 기능을 수행한다. 따라서 DNA 상의 특정한 서열 정보가 유전자 발현과 직접적으로 연관되어 있다고 생각할 수 있다. 본 논문에서는 두 가지 서로 다른 데이터들에 대한 관계를 알아보기 위하여 사용되는 방법인 Kernel CCA를 이용하여 DNA 상의 특정한 모티프와 유전자 발현 사이의 관계를 알아보았다. 이를 이용한 실험 결과, 유전자 발현과 밀접하게 관련되어 있는 모티프들을 발견할 수 있었고, 기존에 중요한 것으로 알려져 있는 모티프가 실제로도 유전자 발현에 밀접한 영향을 미친다는 것을 알 수 있었다.

  • PDF

Exploratory Analysis of Gene Expression Data Using Biplot (행렬도를 이용한 유전자발현자료의 탐색적 분석)

  • Park, Mi-Ra
    • The Korean Journal of Applied Statistics
    • /
    • v.18 no.2
    • /
    • pp.355-369
    • /
    • 2005
  • Genome sequencing and microarray technology produce ever-increasing amounts of complex data that needs statistical analysis. Visualization is an effective analytic technique that exploits the ability of the human brain to process large amounts of data. In this study, biplot approach applied to microarray data to see the relationship between genes and samples. The supplementary data method to classify new sample to known category is suggested. The methods are validated by applying it to well known microarray data such as Golub et al.(1999), Alizadeh et al.(2000), Ross et al.(2000). The results are compared to the results of several clustering methods. Modified graph which combine partitioning method and biplot is also suggested.

Macroscopic Biclustering of Gene Expression Data (유전자 발현 데이터에 적용한 거시적인 바이클러스터링 기법)

  • Ahn, Jae-Gyoon;Yoon, Young-Mi;Park, Sang-Hyun
    • The KIPS Transactions:PartD
    • /
    • v.16D no.3
    • /
    • pp.327-338
    • /
    • 2009
  • A microarray dataset is 2-dimensional dataset with a set of genes and a set of conditions. A bicluster is a subset of genes that show similar behavior within a subset of conditions. Genes that show similar behavior can be considered to have same cellular functions. Thus, biclustering algorithm is a useful tool to uncover groups of genes involved in the same cellular process and groups of conditions which take place in this process. We are proposing a polynomial time algorithm to identify functionally highly correlated biclusters. Our algorithm identifies 1) the gene set that has hidden patterns even if the level of noise is high, 2) the multiple, possibly overlapped, and diverse gene sets, 3) gene sets whose functional association is strongly high, and 4) deterministic biclustering results. We validated the level of functional association of our method, and compared with current methods using GO.

Performance Comparison of Multiclass Classification Methods for cancer Classification (암 분류를 위한 분류기법의 성능비교)

  • Park Yun-Jung;Park Seung-Soo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06b
    • /
    • pp.220-222
    • /
    • 2006
  • 현재 마이크로어레이 기술은 대량의 유전자 발현 데이터 특히 암과 관련한 데이터들을 쏟아내고 있다. 이 데이터를 기반으로 암의 종류에 따른 유전자들의 차별적 발현 양상을 분석하고 발현량의 변화가 두드러지는 유전자들에 기반하여 암을 분별할 수 있는 분류 모델을 구축한 후, 이것을 암을 진단하거나 예측하는데 이용할 수 있다. 본 논문에서는 마이크로어레이 데이터를 사용해 특징추출방법과 분류를 위한 Naive Bayes, k-Nearest Neighborhood, Decision Tree, Support Vector Machine, Neural Network 알고리즘을 이용하여 최적의 조합을 찾고 어떤 알고리즘이 가장 효과적인지 실험을 통해 분석해보고 성능평가 하는 것을 목표로 한다.

  • PDF

Toxicogenomic Analysis of Bacteria and Medaka Fish in Response to Environmental Toxic Chemicals

  • Gu Man-Bock
    • Proceedings of the Korean Society for Bioinformatics Conference
    • /
    • 2006.02a
    • /
    • pp.116-123
    • /
    • 2006
  • 생물체의 cDNA를 유리기판위에 고밀도로 첨착 시킨 유전자 칩과 정량적인 방법으로 개별 유전자 발현을 진단 가능한 Real- time PCR (실시간 고분자중합연쇄반응 기술) 기법은 첨단 의학분야와 신약개발 및 독성유전체 연구분야에 활발히 도입되고 있는 기술이다. 본 발표의 첫 번째 부분에서는 유전자칩 에서 얻어진 유전자 발현패턴분석에 기반한 바이오마커 선정 및 real time PCR에 의한 확증 관련 기술 과 유전자칩에서 얻어지는 수많은 데이터를 재정렬 및 다양한 분석기법과 display기술을 활용하여 광범위한 화학물질에 대한 독성효과 분석을 가능하게 해주며, 특정 독성물질에 대한 관련유전자 그룹 발견 및 독성영향에 따른 분류방법에 관한 결과를 발표할 것이다. 또한 바이오마커 활용의 하나로 박테리아세포 기반 바이오센서 제작및 세포칩 개발등에 대한 결과도 추가될 것이다. 두 번째 부분에서는 non-model organism(유전체정보가 확보되지 않은 생물체)인 송사리를 이용하여 새로운 2K 유전자칩을 개발하고, 여기서 각종 화학물질에 대하여 얻어진 수많은 유전자칩 분석 데이타를 활용하여 각각의 화학물질이 보여주는 독성효과를 매우 효과적이고 쉽게 이해할 수 있는 display기술을 개발, 적용함으로써 유전자칩 발현에 기반한 화학물질 독성 screening 및 specificity discrimination을 가능케 하는 예가 발표될 것이다. 이 연구에서 개발한 송사리 유전자칩은 간조직의 RNA를 직접 cDNA화 하는 방식을 취하고 있어 전체 송사리의 유전정보를 필요로 하지 않아 비용 및 효율에서 전체 송사리의 유전정보를 얻는 비용과 노력을 취하지 않고 간에서 발생하는 독성학적 영향 및 유전자의 발현정도를 정밀하고 효율적인 방법으로 얻어 낸다. 현재 2000여개의 cDNA유전자중 50%이상의 유전자가 17베타에스트라디올, 페놀, 노닐페놀, 비스페놀, 감마레이조사, 잔류약품중 이보프란, 다이클로펜악, 농약중의 파라???R, 돌연변이 유발물질 중의 이티비알, 금속류중의 카드뮴을 통해 발현양상과 특정 캐미칼별 발현 특이성이 조사되었고, 이들 유전자는 염기서열 분석을 통해 염기서열이 분석되었으며, 미국 NCBI의 유전자 은행과의 비교를 통해 일부유전자는 새로운 유전자로 밝혀지고 있다. 또한 이 발표에서는 소염진통제계열 의약품인 dichlofenac 이 송사리의 각종 조직에 미치는 독성영향을 Real-time PCR을 이용하여 대표적 스트레스 유전자의 발현에 미치는 영향에 대한 분석 예가 발표될 것이다.

  • PDF

A Function Study on Cancer related Isoform Switch in TCGA (암 관련 isoform switch 유전자에 대한 기능분석 연구)

  • Ryu, Jea-woon;Kim, Dae-soo
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2018.05a
    • /
    • pp.317-318
    • /
    • 2018
  • 유전자는 alternative splicing으로 환경에 맞는 전사체를 발현함으로써 생명체의 복잡성을 야기한다. 하지만 대부분의 유전자는 dominant한 isoform 하나만이 주로 발현되며 그 외는 극히 미약하게 발현을 한다. 정상 대비 암조직에서 dominant하게 발현되는 isoform은 암의 생성과 발달에 영향을 끼칠 것으로 보인다. 이에 정상과 비교하여 암 특이적인 isoform, 즉 isoform switch가 일어나는 유전자를 찾기 위해 TCGA의 RNA-seq 데이터를 다운로드하여 isoform switch가 일어나는 유전자를 뽑았다. 12 조직에 대한 2,925 유전자는 기능분석을 통해 암과 밀접하게 연관되어 있음을 알 수 있었다.

  • PDF

Prediction for Periodontal Disease using Gene Expression Profile Data based on Machine Learning (기계학습 기반 유전자 발현 데이터를 이용한 치주질환 예측)

  • Rhee, Je-Keun
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.23 no.8
    • /
    • pp.903-909
    • /
    • 2019
  • Periodontal disease is observed in many adult persons. However we has not clear know the molecular mechanism and how to treat the disease at the molecular levels. Here, we investigated the molecular differences between periodontal disease and normal controls using gene expression data. In particular, we checked whether the periodontal disease and normal tissues would be classified by machine learning algorithms using gene expression data. Moreover, we revealed the differentially expression genes and their function. As a result, we revealed that the periodontal disease and normal control samples were clearly clustered. In addition, by applying several classification algorithms, such as decision trees, random forests, support vector machines, the two samples were classified well with high accuracy, sensitivity and specificity, even though the dataset was imbalanced. Finally, we found that the genes which were related to inflammation and immune response, were usually have distinct patterns between the two classes.