IFSA 알고리즘을 이용한 유전자 상호 관계 분석

Analysis of Interactions in Multiple Genes using IFSA(Independent Feature Subspace Analysis)

  • 김혜진 (포항공과대학교 컴퓨터공학과) ;
  • 최승진 (포항공과대학교 컴퓨터공학과) ;
  • 방승양 (포항공과대학교 컴퓨터공학과)
  • 발행 : 2006.04.01

초록

세포는 환경 변화 및 자극으로부터 자신을 보호하기 위해 유전자가 발현하여 생명을 유지 시스템을 갖고 있다. 유전자의 발현은 비정상적인 상태의 세포를 환경을 조절, 변화시켜 정상으로 바꾸기 위한 기능, 발달단계에 필요한 기능 등 생명현상에 필요한 특수 역할을 수행한다. 따라서 각 유전자의 기능을 아는 것은 생물학적으로 상당히 의미 있는 일이다. 본 논문에서는 유전자 기능을 알아보기 위해 발현 패턴을 통해 같을 때, 유사한 형태 혹은 시차를 갖고 동일한 형태로 발현하는 유전자들은 같은 기능을 한다는 가정을 하였다. 이 가정에 기반하여 각 유전자들을 기능에 따라 분류하였다. (1) IFSA선형 모델을 적용하여 데이타를 잘 나타내 줄 수 있는 특징 패턴을 찾았으며 (2) 이 특징 패턴으로부터 본 논문에서 제안한 Membership Scoring Function을 이용하여 유전자를 필터링(filtering) 하였다. 이 유전자들은 기존의 ICA(Independent Component Analysis) 방법에서 보다 IFSA 방법이 더 효과적으로 각 기능에 따른 유전자 그룹을 찾아내줌을 GO(Gene Ontology)에서 확인할 수 있었다. 이는 시차 혹은 위상 변화에 상관없이 데이타를 잘 나타낼 수 있는 IFSA의 특성이, ICA보다. 생물학적인 변수를 더 고려해 줄 수 있기 때문이라고 생각된다[1]. 이 논문의 또 다른 주요 작업은 유전자의 상호작용 관계로부터 유전자 네트웍을 얻어내는 것이다. 유전자 네트웍은 같은 그룹 내에서 유전자간의 상관 계수를 구하고 가장 높은 상관도를 보이는 유전자쌍을 연결시켜 얻게되었다. 이 네트웍 역시 GO 해석에서 그 유효성을 확인하였다.를 평균 66.02에서 58.98로 줄이면서 계산시간은 평균 71ms에서 44ms 으로 빠르게 됨을 알 수 있었다.적외선 분광법을 이용한 사일리지의 화학적 조성분 함량 측정은 적은 오차 범위 내에서 신속하고 정확한 분석법이 될 수 있음을 확인 할 수 있었다. 비록 원물 생시료(IF)에 대한 직접적인 측정은 다소 예측 정확성이 떨어지지만 현장 적용성과 편리성을 높이기 위해서는 생시료의 측정시 오차를 줄일 수 있는 스펙트럼의 수처리 방법이나 산란보정 방법과 같은 데이터 처리기법에 대한 더 많은 연구가 앞으로 진행되어야 한다고 생각되어진다.상자의 50% 이상이 매일 생선 콩 및 콩제품과 채소류를 먹고 있었고, 인스턴트나 패스트푸드는 정상 체중군이 저체중군이나 과체중보다 매일 섭취하는 빈도가 낮았다(p<0.0177). 7. 가장 낮은 영양 섭취 상태를 보여준 영양소(% RDA< 75%)는 철분과 칼슘으로 조사 대상자의 3/4에 해당하는 조사 대상자가 영양 부족 상태였다. 칼슘 섭취의 경우 정상 체중군이 과체중군과 저체중군보다 섭취율이 낮았으나(p<0.0257) 철분은 군간 유의차는 없었다. 8. 칼슘의 경우 과체중군이 저체중군이나 정상 체중군에 비해 영양소 적정비율(NAR) 값이 높았으며(p<0.0257) 철분, 단백질, 비타민 $B_1$$B_2$, 나이아신의 경우도 통계적으로 유의하지는 않으나 과체중군이 저체중군 또는 정상 체중군의 NAR 값이 높은 경향을 보여주었다. 9가지 영양소의 NAR을 평균한 MAR 값은 군간 유의적이지는 않으나 과체중군(0.76)이 정상체중(0.73) 또는 저체중군(0.73)에 비해 높은 값은 보여주었다. 9.

The change of external/internal factors of the cell rquires specific biological functions to maintain life. Such functions encourage particular genes to jnteract/regulate each other in multiple ways. Accordingly, we applied a linear decomposition model IFSA, which derives hidden variables, called the 'expression mode' that corresponds to the functions. To interpret gene interaction/regulation, we used a cross-correlation method given an expression mode. Linear decomposition models such as principal component analysis (PCA) and independent component analysis (ICA) were shown to be useful in analyzing high dimensional DNA microarray data, compared to clustering methods. These methods assume that gene expression is controlled by a linear combination of uncorrelated/indepdendent latent variables. However these methods have some difficulty in grouping similar patterns which are slightly time-delayed or asymmetric since only exactly matched Patterns are considered. In order to overcome this, we employ the (IFSA) method of [1] to locate phase- and shut-invariant features. Membership scoring functions play an important role to classify genes since linear decomposition models basically aim at data reduction not but at grouping data. We address a new function essential to the IFSA method. In this paper we stress that IFSA is useful in grouping functionally-related genes in the presence of time-shift and expression phase variance. Ultimately, we propose a new approach to investigate the multiple interaction information of genes.

키워드

참고문헌

  1. A. Hyvarinen at al, 'Emergence of Phase , Shift Invarianct Features by Decomposition of Natural Images into Independent Feature Subspaces,' Neuro Computing, Vol.12, No.7, pp.1705-1720, 2000 https://doi.org/10.1162/089976600300015312
  2. J. -F. Cardoso, 'Multidimensional Independent Component Analysis,' ICASS 1998 https://doi.org/10.1109/ICASSP.1998.681443
  3. P. T. Spellman at al, 'Comprehensive Identification of Cell Cycle-Regulated Genes of the Yeast Saccharomyces cerevisiae by Microarray Hybridization,' Molecular Biology of the Cell, Vol.9, pp. 3273- 3297, 1998
  4. O. Alter at al, 'Singular Value Decomposition for Genome- Wide Expression Data Processing and Modeling,' Pacific Symposium Biocornputing, Vol.97, No.18, pp.10101-10106, 2000f https://doi.org/10.1073/pnas.97.18.10101
  5. N. Friedman at al, 'Using Bayesian Networks to Analyze Expression Data. Journal of Molecular Biology,' Vol.7, pp.601-620, 2000 https://doi.org/10.1145/332306.332355
  6. M.B. Eisen at al, 'Cluster Analysis, Display of Genome-wide Expression Pattern,' Pacific Symposium Biocomputing, Vol.95, pp.14863-14868, 1998
  7. N. Holter at al, 'Fundamental Patterns Underlying Gene Expression Profiles: Simplicity from Cornplexity,' Pacific Symposium Biocornputing, Vol.97, pp.8409-8414, 2000 https://doi.org/10.1073/pnas.150242097
  8. S. Raychaudhuri at al, 'Principal Components Analysis to Summarize Microarray Experiments: Application to Sporulation Time Series,' Proc. Pacific Symp. Biocomputing, pp.452-463, 2000
  9. G. Hori , at al, 'Blind Gene Classification Based on Independent Component Analysis of Microarray Data,' Proc. ICA, 2001
  10. W. Liebermeister 'Linear Modes of Gene Expression Determined by Independent Component Analysis,' Bioinformatics, Vol.18, No.1, pp.51-60, 2002 https://doi.org/10.1093/bioinformatics/18.1.51
  11. T. D. Moloshok at al, 'Application of Bayesian Decomposition for Analysing Microarray Data,' Bioinformatics, Vol.l8, No.4, pp.566-575, 2002 https://doi.org/10.1093/bioinformatics/18.4.566
  12. A. M. Martoglio at al, 'A Decomposition Model to Track Gene Expression Signatures: Preview on Observer- Independent Classification of Ovarian Cancer,' Bioinformatics, Vol.18, No.12, pp.1617-1624, 2002 https://doi.org/10.1093/bioinformatics/18.12.1617
  13. Vladimir Filkov at al, 'Identifying gene regulartory networks from experimental data,' Journal of Parallel Computing, Vol.27, pp.141-162, 2001 https://doi.org/10.1016/S0167-8191(00)00092-2
  14. Andrew T. Kwon at al, 'Inference of transcriptional regulation relationships from gene expression data,' Bioinformatics, Vol.19, No.8, pp. 905-912, 2003 https://doi.org/10.1093/bioinformatics/btg106
  15. T. Chen,H.L at al, 'MModeling Gene Expression with Differential Equations,' Pacific Symposium Biocomputing, pp.29-40, 1999
  16. P.T.Spellman, at al., 'Comprehensive identification of cell cycle-regulated genes of the yeast saccharornyces cerevisiae by microarray hybridization,' Molecular Biology of the Cell, vol.9, pp.3273-3279, 1998
  17. http://geneontology.org
  18. http://mips.gsf.de/genre/proj/yeast/index.jsp