DOI QR코드

DOI QR Code

Constructing Gene Regulatory Networks using Frequent Gene Expression Pattern and Chain Rules

빈발 유전자 발현 패턴과 연쇄 규칙을 이용한 유전자 조절 네트워크 구축

  • 이헌규 (충북대학교 대학원 전자계산학과) ;
  • 류근호 (충북대학교 전기전자 컴퓨터공학부) ;
  • 정두영 (충북대학교 전기전자 컴퓨터공학부)
  • Published : 2007.02.28

Abstract

Groups of genes control the functioning of a cell by complex interactions. Such interactions of gene groups are tailed Gene Regulatory Networks(GRNs). Two previous data mining approaches, clustering and classification, have been used to analyze gene expression data. Though these mining tools are useful for determining membership of genes by homology, they don't identify the regulatory relationships among genes found in the same class of molecular actions. Furthermore, we need to understand the mechanism of how genes relate and how they regulate one another. In order to detect regulatory relationships among genes from time-series Microarray data, we propose a novel approach using frequent pattern mining and chain rules. In this approach, we propose a method for transforming gene expression data to make suitable for frequent pattern mining, and gene expression patterns we detected by applying the FP-growth algorithm. Next, we construct a gene regulatory network from frequent gene patterns using chain rules. Finally, we validate our proposed method through our experimental results, which are consistent with published results.

유전자들의 그룹은 복잡한 상호작용들을 통해 세포의 기능이 조절되며 이러한 상호작용을 하는 유전자 그룹들을 유전자 조절 네트워크 (GRNs: Gene Regulatory Networks)라고 한다. 이전의 유전자 발현 분석 기법인 군집화와 분류는 단지 상동성에 의한 유전자들 사이의 소속을 결정하는 데에는 유용하나 분자 활동에서의 같은 클래스에서 발견되어지는 유전자들 사이의 조절 관계를 식별할 수 없다. 더욱이 유전자들이 어떻게 연관되는 지와 유전자들이 서로 어떻게 조절하는지에 대한 매커니즘의 이해가 필요하다. 따라서 이 논문에서는 시계열 마이크로어레이 데이터로부터의 유전자들의 조절 관계를 발견하기 위해서 빈발 패턴 마이닝과 연쇄 규칙을 이용한 새로운 접근법을 제안하였다. 이 기법에서는 먼저, 빈발 패턴 마이닝 적용을 위한 적절한 데이터 변환 방법을 제안하였고 FP-growth을 이용하여 유전자 발현 패턴들을 발견한다. 그런 다음, 연쇄 규칙을 이용하여 빈발한 유전자 패턴들로부터 유전자 조절 네트워크를 구축하였다. 마지막으로 제안된 기법의 검증은 공개된 유전자들의 조절 관계와 실험 결과의 일치함을 보임으로써 평가하였다.

Keywords

References

  1. Friedman, N., Linial, M., Nachman, I. and Pe'er, D., 'Using Bayesian networks to analyze expression data', Journal of Computational Biology, 7:601-620, 2000 https://doi.org/10.1089/106652700750050961
  2. Husmeier, D., 'Sensitivity and specificity of inferring genetic regulatory interactions from microarray experiments with dynamic Bayesian networks', Bioinformatics, 19: 2271-2282, 2003 https://doi.org/10.1093/bioinformatics/btg313
  3. Ting Chen, Vladimir Filkov, Steven S. Skiena, 'Identifying Gene Regulatory Networks from Experimental Data', RECOMB, 94-103, 1999
  4. Van Someren, E. P., Wessels, L. F. A., and Reinders, 'Linear modeling of genetic networks from experimental data. Proc., ISMB, 355-366, 2000
  5. Holter, N. S., Maritan, A., Fedoroff, N. V. and Banavar, J. R., 'Dynamic modeling of gene expression data, Proc., Natl, Acad. Sci. 1693-1698, 2000
  6. Rishi Khan, Yujing Zeng, Javier GarciaFrias and Guang Gao, 'A Bayesian Modeling Framework for Genetic Regulation', Proc., CSB'02, 2002 https://doi.org/10.1109/CSB.2002.1039357
  7. Akutsu, T., Miyano, S., and kuhara, S., 'Identification of genetic networks from a small number of gene expression patterns under the Boolean network model', Pacific Symposium on Biocomputing 17-28, 1999
  8. Eisen, M. B., Spellman, P. T., Brown, P.O., and Botstein, D., 'Cluster Analysis and Display of Genome-Wide Expression Patterns'. Proc., National Academy of Science. 95: 14863-14868, 1998 https://doi.org/10.1073/pnas.95.25.14863
  9. Spellman, P. T., Sherlock, G., Zhang, M. Q., Iyer, V. R., Anders, K., Eisen, M. B., Brown, P.O., Botstein, D. and Futcher, B., 'Comprehensive identification of cell cycle-regulated genes of the yeast Saccharomyces cerevisiae by microarray hybridization', Molecular Biology of the Cell, 9:3273-3297. 1998 https://doi.org/10.1091/mbc.9.12.3273
  10. Tamayo, P., Slonim, D., Mesirov, J., Zhu, Q., Kitareewan, S., Dmitrovsky, E., Lander, E. and Golub, T. 'Interpreting patterns of gene expression with selforganizing maps'. PNAS, 96:2907-2912. 1999 https://doi.org/10.1073/pnas.96.6.2907
  11. Brown, M. P., Grundy, W. N., Lin, D., Sugnet, C. W., Furey, T. S., Ares Jr., and Haussler, D., 'Knowledge-based analysis of microarray gene expression data by using support vector machines'. PNAS, 4;97(1):262-7. 2000
  12. Han, J., Pei, J., Yin, Y., 'Mining frequent patterns without candidate generation'. In SIGMOD'00, Dallas, TX, 2000 https://doi.org/10.1145/342009.335372
  13. Forsyth, R. and Rada, R., 'Machine Learning applications in Expert Systems and Information Retrieval', Ellis Horwood Limited, 1986
  14. Li, W., Han, J. and Pei, J., 'CMAR: Accurate and Efficient Classification Based on Multiple Association Rules', Proc., Interna'l Conf, on Data Mining, 2001 https://doi.org/10.1109/ICDM.2001.989541
  15. Meretakis, D. and Wuthrich, B., 'Extending naive bayes classifiers using long itemsets', Proc., the 5th ACM SIGKDD Conference on Knowledge Discovery and Data Min-ing, 165-174, 1999 https://doi.org/10.1145/312129.312222
  16. Elledge, S. J. and Davis, R. W., 'Identification of the DNA damage-responsive element of RNR2 and evidence that four distinct cellular factors bind it', Molecular and Cell Biology, 9(12):5373-86. 1989 https://doi.org/10.1128/MCB.9.12.5373
  17. Yeast Protein Database (YPD) (http://www.proteome.com)