• Title/Summary/Keyword: 유전자-질병 관계

Search Result 54, Processing Time 0.028 seconds

Co-occurrence Based Drug-disease Relationship Inference with Genes as Mediators (유전자를 중간 매개로 고려한 동시발생 기반의 약물-질병 관계 추론)

  • Shin, Sangwon;Sin, Yeeun;Jang, Giup;Yoo, Youngmi
    • The Journal of Korean Institute of Information Technology
    • /
    • v.16 no.11
    • /
    • pp.1-9
    • /
    • 2018
  • Drug repositioning is to discover new uses of drugs. Text mining derives knowledge from unstructured text. We propose a method to predict new drug-disease relationships by taking into account the rate of frequency of genes simultaneously measured in disease-gene and gene-drug. Co-occurrence of drug-gene and gene-disease in the biological literature is counted and calculate the rate of the gene for each drug and disease. Weights of drug-disease relationships are calculated using the average of the rates of genes that are measured and used to measure the accuracy for each disease. In measuring drug-disease relationships, a more accurate identification of relationships was shown by measuring the frequency on a sentence and considering multiple relationships than existing method.

Inferring Disease-related Genes using Title and Body in Biomedical Text (생물학 문헌 데이터의 제목과 본문을 이용한 질병 관련 유전자 추론 방법)

  • Kim, Jeongwoo;Kim, Hyunjin;Yeo, Yunku;Shin, Mincheol;Park, Sanghyun
    • KIISE Transactions on Computing Practices
    • /
    • v.23 no.1
    • /
    • pp.28-36
    • /
    • 2017
  • After the genome projects of the 90s, a vast number of gene studies have been stored in online databases. By using these databases, several biological relationships can be inferred. In this study, we proposed a method to infer disease-gene relationships using title and body in biomedical text. The title was used to extract hub genes from data in the literature; whereas, the body of the literature was used to extract sub genes that are related to hub genes. Through these steps, we were able to construct a local gene-network for each report in the literature. By integrating the local gene-networks, we then constructed a global gene-network. Subsequent analyses of the global gene-network allowed inference of disease-related genes with high rank. We validated the proposed method by comparing with previous methods. The results indicated that the proposed method is a meaningful approach to infer disease-related genes.

Evolutionary association learning for detecting higher-order interactions of DNA methylation regions in human diseases (인간 질병에서 DNA 메틸화 지역의 고차상호작용 탐색을 위한 진화적 연관관계 학습)

  • Rhee, Je-Keun;Kim, Soo-Jin;Zhang, Byoung-Tak
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06b
    • /
    • pp.420-422
    • /
    • 2012
  • DNA 메틸화는 후성유전학의 한 유형으로 유전자 발현을 조절하여 질병을 비롯한 다양한 생물학적 프로세스에 영향을 준다고 알려져 있다. 따라서 DNA 메틸화 정도와 인간 질병과의 연관성에 관한 연구는 질병의 원인 및 기전을 밝히고 메틸화 프로세스 조절을 통한 질병 치료 방법 개발을 위한 기반이 될 수 있다. 유전자 발현 조절 및 질병 발생은 많은 인자들의 복합적인 상호작용에 영향을 받으므로, 여러 위치에서의 메틸화 정도들의 고차원 조합을 이용한 질병과의 연관 관계 분석이 필수적이다. 본 연구에서는 진화 연산과 가중치 학습에 기반하여 유방암 발생과 연관되어 있는 메틸화 위치의 고차 상호작용을 탐색할 수 있는 방법을 제안한다.

Inference of Disease Module using Bayesian Network by Genetic Algorithm (유전자 알고리즘으로 학습한 베이지안 네트워크에 기초한 질병 모듈 추론)

  • Jeong, Da-Ye;Yeu, Yun-ku;Ahn, Jae-Gyoon;Park, Sang-Hyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.11a
    • /
    • pp.1117-1120
    • /
    • 2013
  • 사람의 질병은 여러 요인의 복합적인 작용으로 발생하는데 이 중 유전적인 요인에는 유전자 간의 상호작용을 들 수 있다. 마이크로어레이(Microarray) 데이터로부터 유전자의 활성화 및 억제 관계를 밝히려는 다양한 시도는 계속되어왔다. 그러나 마이크로어레이 자체가 갖는 불안정성과 실험조건 수의 제약이 커다란 장애가 되어 왔다. 이에 생물학적 사전 지식을 포함하는 방법들이 제안되었다. 본 논문에서는 질병과 관련된 유전자 간의 상호작용의 집합을 질병 모듈이라 정의하고 이를 유전자 알고리즘으로 학습한 베이지안 네트워크(Bayesian network)로 추론하는 방법을 제안한다.

Classification of Lymphoma Dataset with Combinatorially Correlated Feature Set (통합 상관된 특징 집합을 이용한 림프종 데이터의 분류)

  • Park, Chan-Ho;Cho, Sung-Bae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.05a
    • /
    • pp.321-324
    • /
    • 2003
  • 근래, DNA microarray와 관련된 기술의 발달은 한번에 수천 개 이상의 유전자발현데이터를 얻을 수 있게 해주었고, 많은 연구기관에서 이를 이용한 질병 분류에 관하여 연구를 진행하고 있다. 하지만 수천 개의 유전자 모두가 암에 관계된 것은 아니기 때문에, 관련 유전자의 선별 작업을 먼저 수행하는 것이 필요하며, 이를 위하여 통계기반 방법, 정보이론기반 방법 등 다양한 방법이 사용되고 있다. 본 논문에서는 의미 있는 유전자를 선택하는 방법으로서, 일반적인 순위-기반 방법이 양의 상관관계만 이용한다는 점을 보완하여, 유전자와 학습데이터 사이의 음의 상관관계까지도 고려한 방법을 제시하였다. 제안한 방법의 성능을 검증하고자 잘 알려진 암 관련 유전자발현데이터이인 림프종 데이터에 대하여, MLP와 KNN을 이용한 분류를 해 보았다. 실험 걸과 총합 상관관계를 가지는 특징 집합이 일반적인 순위-기반 방식의 특징 집합에 비하여 높은 분류 인식률을 보여주었다.

  • PDF

바이오인포매틱스 인프라 구축

  • Son, Hyeon-Seok
    • Journal of Scientific & Technological Knowledge Infrastructure
    • /
    • s.12
    • /
    • pp.52-57
    • /
    • 2003
  • 바이오인포매틱스 시스템은 생명공학, 의학, 약학 등의 바이오인포매틱스 관련 산.학.연 연구자들의 연구개발의 기반이 되는 대용량의 생물정보를 효율적으로 저장하는 데이터베이스 구축 및 운영에 필요한 검색 처리 및 분석 시스템을 구축하는 정보인프라로서 21세기 가장 각광 받는 분야로 자리잡고있다. 최근 기하급수적으로 증가하고 있는 유전정보와 특정그룹이나 개인별 유전자 변화와 질병 감수성과의 관계 및 특정 질병과 관련된 유전자에 대한 생물학적 2차, 3차 분석정보 등 바이오인포매틱스 연구의 확대 필요성이 증가하고 있으나, 대부분의 생명공학 관련 산.학.연 연구자들은 연구분야에 적합한 IT기술을 적용할 수 있는 적절한 방법을 보유하고 있지못한 실정이다.

  • PDF

Disease Prediction Index of Customized Nutrition And Exercise Management Services Based On Personal Genetic Information (개인유전자정보에 따른 맞춤형 영양 및 운동관리시스템의 질병 예측 인덱스)

  • Seo, Young-woo;Joo, Moon-il;Huh, Gyung Hye;Kim, Hee-cheol
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2017.10a
    • /
    • pp.602-604
    • /
    • 2017
  • As human life span has increased, people have wanted to live healthier desires. Especially Korea has rapidly entered an aging society, leading to the burden of medical expenses to the increase of disease accompanying aging. To alleviate the burden of medical expenses, prediction and prevention are important rather than treatment of diseases. It is possible to predict and prevent diseases by measuring individual genetic information. In order to utilize individual's genetic information Korea's genetic information is grasped through SNP (800 thousand) and GWAS optimized for the discovery of genetic factors of phenotype and disease of Koreans, The genetic information of each individual is analyzed in the genetic (constitutional) characteristics of the individual. In this thesis we develop a classification index so that we can classify populations of specific chronic diseases (obesity, diabetes or cardiovascular system). Try to develop health care services to manage custom diet and exercise associated with chronic illness.

  • PDF

Tumor Classifier using Variation in Genes' Correlation (유전자 발현값 상관관계 분석을 통한 암분류자 생성방법)

  • Ahn, Jaegyoon;Yoon, Youngmi;Shin, Eunji;Park, Sanghyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2009.11a
    • /
    • pp.769-770
    • /
    • 2009
  • 본 논문에서는 이상 표식 유전자를 사용하는 기존 분석방법과 달리, 두 유전자 사이의 관계를 측정하여 정상 클래스와 암 클래스에서의 상관관계가 변화된 정도를 분석하여 차이가 두드러지는 유전자 쌍(gene pair)을 질병 분류자(classifier)로 선택하는 방법을 제시한다. 제안한 암 분류 방법의 실험 결과, 소수의 분류자를 선택하여 높은 정확도로 암을 분류함으로써 그 유용성을 검증하였다.

Class prediction of an independent sample using a set of gene modules consisting of gene-pairs which were condition(Tumor, Normal) specific (조건(암, 정상)에 따라 특이적 관계를 나타내는 유전자 쌍으로 구성된 유전자 모듈을 이용한 독립샘플의 클래스예측)

  • Jeong, Hyeon-Iee;Yoon, Young-Mi
    • Journal of the Korea Society of Computer and Information
    • /
    • v.15 no.12
    • /
    • pp.197-207
    • /
    • 2010
  • Using a variety of data-mining methods on high-throughput cDNA microarray data, the level of gene expression in two different tissues can be compared, and DEG(Differentially Expressed Gene) genes in between normal cell and tumor cell can be detected. Diagnosis can be made with these genes, and also treatment strategy can be determined according to the cancer stages. Existing cancer classification methods using machine learning select the marker genes which are differential expressed in normal and tumor samples, and build a classifier using those marker genes. However, in addition to the differences in gene expression levels, the difference in gene-gene correlations between two conditions could be a good marker in disease diagnosis. In this study, we identify gene pairs with a big correlation difference in two sets of samples, build gene classification modules using these gene pairs. This cancer classification method using gene modules achieves higher accuracy than current methods. The implementing clinical kit can be considered since the number of genes in classification module is small. For future study, Authors plan to identify novel cancer-related genes with functionality analysis on the genes in a classification module through GO(Gene Ontology) enrichment validation, and to extend the classification module into gene regulatory networks.

A Relational Information Extraction System from Biomedical Literature (생의학 문헌에서의 관계 정보 추출 시스템)

  • Lim, Joon-Ho;Lim, Jase-Soo;Jang, Hyun-Chul;Park, Soo-Jun
    • 한국HCI학회:학술대회논문집
    • /
    • 2007.02a
    • /
    • pp.932-937
    • /
    • 2007
  • 생의학 분야 문헌의 양이 빠르게 증가함에 따라, 생의학 연구자들이 필요로 하는 정보를 얻기가 어렵게 되었다. 이를 해결하기 위해, 인간-컴퓨터 상호작용 분야에서는 생의학 문헌 검색 시스템, 또는 생의학 문헌의 정보 추출 시스템 등에 대한 연구가 진행되고 있다. 본 논문에서는 생의학 문헌으로부터 정보를 자동으로 추출하기 위한 관계정보 추출 시스템에 대해 소개한다. 소개하는 시스템은 크게 요약 수집 모듈, 관계 추출 모듈, 관계 가시화 모듈로 구성되어 있다. 우선, 요약 수집 모듈에서는 특정 주제의 문헌들을 검색 및 수집한다. 그리고, 관계 추출 모듈에서는 수집된 문헌들에 대해서, 단백질/유전자 등의 생물학 개체를 인식하고, 구문분석을 통하여 인식된 개체들 사이의 관계를 추출한다. 마지막으로, 관계 가시화 모듈에서는 추출된 관계를 통합하여 네트워크 형태로 가시화한다. 이 시스템은 생물학 실험 이전의 문헌 기반 타당성 검사, 단백질-단백질 상호작용 또는 특정 질병과 유전자의 조절관계 분석, 또는 대용량 문헌 처리를 통한 패스웨이 데이터베이스 구축 등에 활용될 수 있다.

  • PDF