• Title/Summary/Keyword: 유전자-질병 관계

Search Result 55, Processing Time 0.019 seconds

Nonstandard Machine Learning Algorithms for Microarray Data Mining

  • Zhang, Byoung-Tak
    • Proceedings of the Korean Society for Bioinformatics Conference
    • /
    • 2001.10a
    • /
    • pp.165-196
    • /
    • 2001
  • DNA chip 또는 microarray는 다수의 유전자 또는 유전자 조각을 (보통 수천내지 수만 개)칩상에 고정시켜 놓고 DNA hybridization 반응을 이용하여 유전자들의 발현 양상을 분석할 수 있는 기술이다. 이러한 high-throughput기술은 예전에는 생각하지 못했던 여러가지 분자생물학의 문제에 대한 해답을 제시해 줄 수 있을 뿐 만 아니라, 분자수준에서의 질병 진단, 신약 개발, 환경 오염 문제의 해결 등 그 응용 가능성이 무한하다. 이 기술의 실용적인 적용을 위해서는 DNA chip을 제작하기 위한 하드웨어/웻웨어 기술 외에도 이러한 데이터로부터 최대한 유용하고 새로운 지식을 창출하기 위한 bioinformatics 기술이 핵심이라고 할 수 있다. 유전자 발현 패턴을 데이터마이닝하는 문제는 크게 clustering, classification, dependency analysis로 구분할 수 있으며 이러한 기술은 통계학과인공지능 기계학습에 기반을 두고 있다. 주로 사용된 기법으로는 principal component analysis, hierarchical clustering, k-means, self-organizing maps, decision trees, multilayer perceptron neural networks, association rules 등이다. 본 세미나에서는 이러한 기본적인 기계학습 기술 외에 최근에 연구되고 있는 새로운 학습 기술로서 probabilistic graphical model (PGM)을 소개하고 이를 DNA chip 데이터 분석에 응용하는 연구를 살펴본다. PGM은 인공신경망, 그래프 이론, 확률 이론이 결합되어 형성된 기계학습 모델로서 인간 두뇌의 기억과 학습 기작에 기반을 두고 있으며 다른 기계학습 모델과의 큰 차이점 중의 하나는 generative model이라는 것이다. 즉 일단 모델이 만들어지면 이것으로부터 새로운 데이터를 생성할 수 있는 능력이 있어서, 만들어진 모델을 검증하고 이로부터 새로운 사실을 추론해 낼 수 있어 biological data mining 문제에서와 같이 새로운 지식을 발견하는 exploratory analysis에 적합하다. 또한probabilistic graphical model은 기존의 신경망 모델과는 달리 deterministic한의사결정이 아니라 확률에 기반한 soft inference를 하고 학습된 모델로부터 관련된 요인들간의 인과관계(causal relationship) 또는 상호의존관계(dependency)를 분석하기에 적합한 장점이 있다. 군체적인 PGM 모델의 예로서, Bayesian network, nonnegative matrix factorization (NMF), generative topographic mapping (GTM)의 구조와 학습 및 추론알고리즘을소개하고 이를 DNA칩 데이터 분석 평가 대회인 CAMDA-2000과 CAMDA-2001에서 사용된cancer diagnosis 문제와 gene-drug dependency analysis 문제에 적용한 결과를 살펴본다.

  • PDF

Development of a Gene's Functional Classifying System for a Microarray Data using a Gene Ontology (유전자 온톨로지를 이용한 마이크로어레이 데이터의 유전자 기능 분석 시스템의 개발)

  • Lee, Jong-Keun;Park, S.S.;Hong, D.W.;Yoon, J.H.
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10c
    • /
    • pp.246-251
    • /
    • 2006
  • 마이크로어레이 실험은 수 천에서 수 만개의 유전자 발현 결과를 동시에 측정할 수 있어 질병의 발현 형질 분류 등에 유용하게 이용되고 있다. 그러나 마이크로어레이 실험은 동일한 플랫폼의 실험이라 할지라도 환경 등에 따라 그 실험 결과에 차이가 나는 등 오차를 항상 포함하고 있다. 또한 마이크로어레이 실험은 아직 고가의 실험으로 분류되어 다수의 샘플에 대한 반복 실험 결과를 얻기 어려운 상황이다. 따라서 이종의 플랫폼, 데이터 포맷, 정규화 기법 등이 서로 다른 데이터를 효율적으로 통합하여 유용한 정보를 추출하는 새로운 방식의 개발이 필요하다. 본 논문은 이와 같은 문제를 해결하기 위한 기초 단계 연구 결과이다. 마이크로어레이 실험 데이터로부터 통계적 방법을 이용하여 유의(informative) 유전자를 추출하고 유전자 온톨로지(Gene Ontology : GO)와의 연계를 통하여 유전자 정보의 기능적 분류 결과를 사용자에게 제공하는 유전자 기능 분석 시스템의 설계 및 구현 방안을 보인다. 본 시스템의 실험방법에서는 3-Fold Filtering 기법을 통하여 발현 차가 큰 유전자를 추출하고, t-검정 기법에 의하여 이들 유전자를 순위화 하였으며, 이 중 상위 100개의 유전자를 유의 유전자로 추출하였다. 다음, 이 들 유의 유전자의 t-검정 값을 GO의 유전자 기능을 나타내는 해당 텀 (term)에 가중치로 부과하여 각 유전자들과 기능적으로 연관성이 높은 텀들을 추출한다. 또한 본 연구의 유효성을 검증하기 위하여 본 시스템에 의한 마이크로어레이 데이터 분석 결과를 전문가에 의한 유전자 기능 분석 결과와 비교한다.투명성 있는 서비스를 제공하고 높은 신뢰성과 안정성이 확보될 수 있도록 구성하고자 한다. Query 수행을 여러 서버로 분산처리하게 함으로써 성능에 대한 신뢰성을 향상 시킬 수 있는 Load Balancing System을 제안한다.할 때 가장 효과적인 라우팅 프로토콜이라고 할 수 있다.iRNA 상의 의존관계를 분석할 수 있었다.수안보 등 지역에서 나타난다 이러한 이상대 주변에는 대개 온천이 발달되어 있었거나 새로 개발되어 있는 곳이다. 온천에 이용하고 있는 시추공의 자료는 배제하였으나 온천이응으로 직접적으로 영향을 받지 않은 시추공의 자료는 사용하였다 이러한 온천 주변 지역이라 하더라도 실제는 온천의 pumping 으로 인한 대류현상으로 주변 일대의 온도를 올려놓았기 때문에 비교적 높은 지열류량 값을 보인다. 한편 한반도 남동부 일대는 이번 추가된 자료에 의해 새로운 지열류량 분포 변화가 나타났다 강원 북부 오색온천지역 부근에서 높은 지열류량 분포를 보이며 또한 우리나라 대단층 중의 하나인 양산단층과 같은 방향으로 발달한 밀양단층, 모량단층, 동래단층 등 주변부로 NNE-SSW 방향의 지열류량 이상대가 발달한다. 이것으로 볼 때 지열류량은 지질구조와 무관하지 않음을 파악할 수 있다. 특히 이러한 단층대 주변은 지열수의 순환이 깊은 심도까지 가능하므로 이러한 대류현상으로 지표부근까지 높은 지온 전달이 되어 나타나는 것으로 판단된다.의 안정된 방사성표지효율을 보였다. $^{99m}Tc$-transferrin을 이용한 감염영상을 성공적으로 얻을 수 있었으며, $^{67}Ga$-citrate

  • PDF

Gene Expression Data Analysis Using Parallel Processor based Pattern Classification Method (병렬 프로세서 기반의 패턴 분류 기법을 이용한 유전자 발현 데이터 분석)

  • Choi, Sun-Wook;Lee, Chong-Ho
    • Journal of the Institute of Electronics Engineers of Korea CI
    • /
    • v.46 no.6
    • /
    • pp.44-55
    • /
    • 2009
  • Diagnosis of diseases using gene expression data obtained from microarray chip is an active research area recently. It has been done by general machine learning algorithms, because it is difficult to analyze directly. However, recent research results about the analysis based on the interaction between genes is essential for the gene expression analysis, which means the analysis using the traditional machine learning algorithms has limitations. In this paper, we classify the gene expression data using the hyper-network model that considers the higher-order correlations between the features, and then compares the classification accuracies. And also, we present the new hypo-network model that improve the disadvantage of existing model, and compare the processing performances of the existing hypo-network model based on general sequential processor and the improved hypo-network model implemented on parallel processors. In the experimental results, we show that the performance of our model shows improved and competitive classification performance than traditional machine learning methods, as well as, the existing hypo-network model. We show that the performance is maximized when the hypernetwork model is implemented on our parallel processors.

GENE EXPRESSION ANALYSIS OF THE DENTAL PULP IN HEALTHY AND CARIES TEETH (치아 우식증에 따른 치수내 유전자 발현 변화에 관한 분석)

  • Oh, So-Hee;Kim, Jong-Soo
    • Journal of the korean academy of Pediatric Dentistry
    • /
    • v.37 no.3
    • /
    • pp.275-287
    • /
    • 2010
  • Deep caries may induce pulpitis and the pulpal tissue interacts with microbial invasion. The immune response to protect the pulpal tissue can be mediated by cellular signal molecules produced by the pulpal cells. The understanding of these processes is important to find future therapeutic method for the diseased pulp. The pulp tissue from sound teeth was set as control group (n=30) and the pulp tissue from decayed teeth was set as test group (n=30). Total RNA was extracted from the pulp of each group and it was used for cDNA microarray and reverse transcriptase-polymerase chain reaction(RT-PCR). The expression of TGF-${\beta}1$ was studied by immunohistochemistry. The results were as follows: 1. cDNA microarray analysis identified 520 genes with 6-fold or greater difference in expression level with 143 genes more abundant in health and 377 genes more abundant in disease. 2. The RT-PCR analysis was done for randomly selected 14 genes and the results supported the result of cDNA microarray assay. 3. TGF-${\beta}1$ was highly expressed in the carious pulp and it was found in odontoblast by immunohistochemistry. In conclusion, many cytokines were found to be significantly changed their expression in the diseased pulp(/M/>1.6).

MACROD2 Polymorphisms Are Associated with Hypertension in Korean Population (한국인에서의 MACROD2 유전자 다형성과 고혈압 상관성 연구)

  • Ko, Bokyung;Jin, Hyun-Seok
    • Korean Journal of Clinical Laboratory Science
    • /
    • v.51 no.1
    • /
    • pp.57-63
    • /
    • 2019
  • Hypertension is caused by a combination of genetic and environmental factors. In advanced countries, more than 30% of adults have hypertension. Among the genetic factors affecting hypertension, there are reports from European cohort studies that variants of the MACROD2 gene are correlated with blood pressure and the hypertension status. In this study, genetic polymorphisms of the MACROD2 gene region were selected and extracted based on Korean Genome and Epidemiology data, and logistic regression analysis was then performed for the hypertensive state. Linear regression analysis was also performed for the systolic and diastolic blood pressure. As a result, 16 SNPs showed a statistically significant association with a hypertensive state, and 2 SNPs (rs16996211, rs6034240) showed statistical significance, even in blood pressure. The most significant rs16996211 had a relative risk of hypertension of 0.85 (CI: 0.76~0.95, $P=3.1{\times}10^{-3}$), as well as an association with the systolic blood pressure (beta=-0.75, P=0.024) and diastolic blood pressure (beta=-0.59, P=0.01). These results suggest that polymorphisms of the MACROD2 gene are associated with hypertension in both Caucasians and Koreans, and highlight the potential genetic correlations with the pathogenesis of hypertension.

Molecular Characterization of Vibrio parahaemolyticus Isolates from Seawater, Fish Tanks, and Distributed Fishery Products in Jeju (제주지역 해수, 수족관물, 유통수산물에서 분리된 장염비브리오균의 분자생물학적 특성)

  • Man Jae Cho;Eunok Kang;Ye-seul Heo;Eun A Koh
    • Journal of Food Hygiene and Safety
    • /
    • v.38 no.4
    • /
    • pp.246-254
    • /
    • 2023
  • V. parahaemolyticus causes waterborne and foodborne disease such as acute diarrhea. In this study, V. parahaemolyticus isolates from seawater, fish tanks, and distributed fishery products in Jeju were investigated for potential toxin or species-specific genes (tdh, trh, tlh, and toxR) using RT-PCR and their genetic characteristics were analyzed using Pulsed-field gel electrophoresis (PFGE). Overall, V. parahaemolyticus of 90 strains (36.7%), including 33 strains from seawater, 8 strains from fish tanks, and 50 strains from fishery products, were isolated from 245 samples. All V. parahaemolyticus strains did not detect the tdh gene, whereas all strains detected tlh or toxR genes. In addition, trh genes were detected in 3 strains from seawater and 1 strain from fishery products. Monthly quantitative testing of seawater revealed that V. parahaemolyticus was positively correlated with water temperature. The 90 strains of V. parahemolyticus obtained in this study showed by gene homology between types, ranging from 64.0-97.3%. Among these, thirteen types showed 100% homology between genes. These results indicate that continuous monitoring is needed to facilitate food poisoning epidemiological investigations because some isolated V. parahaemolyticus strains harbored toxin genes and V. parahaemolyticus strains isolated from seawater, fish tanks, and distributed fishery products showed genetic similarity.

폐염균의 형질전환 및 recP유전자의 클로닝

  • 이동권
    • The Microorganisms and Industry
    • /
    • v.15 no.2
    • /
    • pp.24-28
    • /
    • 1989
  • 폐염균의 특징은 폐염, 류마티스성 심장병, 수막염 등의 질병을 일으키는 병원균이라는 것과 아주 높은 효율로 형질전환을 할 수 있다는 사실이다 ($10^{8}$ 개의 균에 염색체 DNA 1.mu.g을 써서 실험하였을 때 $10^{6}$개의 transformant를 얻을 수 있음). 폐염균이 자연상태에서 이렇게 높은 효율의 형질전환을 할 수 있는 이유는 정상생리의 일부로서 형질전환에 관계된 유전자가 형질전환을 할때 발현되기 때문이다. 그러나 폐염균 형질전환에 대한 연구는 아직도 초기단계라고 할 수 있으며 그 이유는 현재 전세계적으로 극소수의 연구자들만이 연구를 수행하고 있기 때문이다. 즉, 미국 Brookhaven National Laboratory의 Lacks와 프랑스 CNRS의 Claverys는 mismatch repair에 대한 연구를, Illinois 대학의 Morrison은 competence에 대해, 미국 Rockefeller 대학의 Hotchkiss와 Tomasz는 DNA binding을 연구하고 있을 뿐이다. 본 논고에서는 폐염균 형질전환에 대해 지금까지의 연구 상태와 문제점, recP의 클로닝에 대해 소개하고자 한다.

  • PDF

Mitochondrial Dysfunction and Cancer (미토콘드리아 기능 이상과 암)

  • Han, Yu-Seon;Jegal, Myeong-Eun;Kim, Yung-Jin
    • Journal of Life Science
    • /
    • v.29 no.9
    • /
    • pp.1034-1046
    • /
    • 2019
  • The mitochondria is the major cellular organelle of energy metabolism for the supply of cellular energy; it also plays an important role in controlling calcium regulation, reactive oxygen species (ROS) production, and apoptosis. Mitochondrial dysfunction causes various diseases, such as neurodegenerative diseases, Lou Gehrig's disease, cardiovascular disease, mental disorders, diabetes, and cancer. Most of the diseases are age-related diseases. In this review, we focus on the roles of mitochondrial dysfunction in cancer. Mitochondrial dysfunction induces carcinogenesis and is found in many cancers. The factors that cause mitochondrial dysfunction differ depending on the types of carcinoma, and those factors could cause cancer malignancy, such as resistance to therapy and metastasis. Mitochondrial dysfunction is caused by a lack of mitochondria, an inability to provide key substances, or a dysfunction in the ATP synthesis machinery. The main factor associated with cancer malignancy is mtDNA depletion. Mitochondrial dysfunction would leads to malignancy through changes in molecular activity or expression, but it is not known in detail which changes lead to cancer malignancy. In order to explore the relationship between mitochondrial dysfunction and cancer malignancy in detail, mitochondria dysfunctional cell lines are constructed using chemical methods such as EtBr treatment or gene editing methods, including shRNA and CRISPR/Cas9. Those mitochondria dysfunctional cell lines are used in the study of various diseases caused by mitochondrial dysfunction, including cancer.

The Convergence Analysis of Microarray-Based Gene Expression by Difference of Culture Environment in Human Oral Epithelial Cells (구강상피세포의 배양환경의 차이에 의한 마이크로어레이 기반 유전자 발현의 융복합 분석)

  • Son, Hwa-Kyung
    • Journal of the Korea Convergence Society
    • /
    • v.10 no.4
    • /
    • pp.81-89
    • /
    • 2019
  • This study was analyzed about the relationship between culture microenvironment and cell differentiation of HPV 16 E6/E7-transfected immortalized oral keratinocyte(IHOK). By the alteration of culture environment, IHOK-EF and IHOK-EFKGM were obtained, and the modulation of cell properties was observed by cell proliferation assay, immunofluorescence, microarray, and quantitative real-time PCR analysis. IHOK-EF losed the properties of epithelial cells and obtained the properties of mesenchymal cells, and in the result of microarray analysis, genes related to the inhibition of differentiation such as IL6, TWIST1, and ID2 were highly expressed in IHOK-EF. When the culture environment was recovered to initial environment, these changes were recovered partially, presenting the return of genes involved in the inhibition of differentiation such as IL6, and ID2, particularly. This study will contribute to understand adjustment aspect for cell surviving according to the change of culture microenvironment in the study for determining the cell characteristic, and facilitate therapeutic approach for human disease by applying surviving study according to the change of cancer microenvironment.

Generating Rank-Comparison Decision Rules with Variable Number of Genes for Cancer Classification (순위 비교를 기반으로 하는 다양한 유전자 개수로 이루어진 암 분류 결정 규칙의 생성)

  • Yoon, Young-Mi;Bien, Sang-Jay;Park, Sang-Hyun
    • The KIPS Transactions:PartD
    • /
    • v.15D no.6
    • /
    • pp.767-776
    • /
    • 2008
  • Microarray technology is extensively being used in experimental molecular biology field. Microarray experiments generate quantitative expression measurements for thousands of genes simultaneously, which is useful for the phenotype classification of many diseases. One of the two major problems in microarray data classification is that the number of genes exceeds the number of tissue samples. The other problem is that current methods generate classifiers that are accurate but difficult to interpret. Our paper addresses these two problems. We performed a direct integration of individual microarrays with same biological objectives by transforming an expression value into a rank value within a sample and generated rank-comparison decision rules with variable number of genes for cancer classification. Our classifier is an ensemble method which has k top scoring decision rules. Each rule contains a number of genes, a relationship among involved genes, and a class label. Current classifiers which are also ensemble methods consist of k top scoring decision rules. However these classifiers fix the number of genes in each rule as a pair or a triple. In this paper we generalized the number of genes involved in each rule. The number of genes in each rule is in the range of 2 to N respectively. Generalizing the number of genes increases the robustness and the reliability of the classifier for the class prediction of an independent sample. Also our classifier is readily interpretable, accurate with small number of genes, and shed a possibility of the use in a clinical setting.