• Title/Summary/Keyword: 표준화(normalization)

Search Result 56, Processing Time 0.025 seconds

Print-tip Normalization for DNA Microarray Data (DNA 마이크로어레이 자료의 PRINT-TIP별 표준화(NORMALIZATION) 방법)

  • Yi Sung-Gon;Park Taesung;Kang Sung Hyun;Lee Seung-Yeaun;Lee Yang Sung
    • The Korean Journal of Applied Statistics
    • /
    • v.18 no.1
    • /
    • pp.115-127
    • /
    • 2005
  • DNA microarray experiments allow us to study expression of thousands of genes simultaneously, Normalization is a process for removing noises occurred during the microarray experiment, Print-tip is regarded as one main sources of noises, In this paper, we review normalization methods most commonly used in the microarray experiments, Especially, we investigate the effects of print-tips through simulated data sets.

A Concordance Study of the Preprocessing Orders in Microarray Data (마이크로어레이 자료의 사전 처리 순서에 따른 검색의 일치도 분석)

  • Kim, Sang-Cheol;Lee, Jae-Hwi;Kim, Byung-Soo
    • The Korean Journal of Applied Statistics
    • /
    • v.22 no.3
    • /
    • pp.585-594
    • /
    • 2009
  • Researchers of microarray experiment transpose processed images of raw data to possible data of statistical analysis: it is preprocessing. Preprocessing of microarray has image filtering, imputation and normalization. There have been studied about several different methods of normalization and imputation, but there was not further study on the order of the procedures. We have no further study about which things put first on our procedure between normalization and imputation. This study is about the identification of differentially expressed genes(DEG) on the order of the preprocessing steps using two-dye cDNA microarray in colon cancer and gastric cancer. That is, we check for compare which combination of imputation and normalization steps can detect the DEG. We used imputation methods(K-nearly neighbor, Baysian principle comparison analysis) and normalization methods(global, within-print tip group, variance stabilization). Therefore, preprocessing steps have 12 methods. We identified concordance measure of DEG using the datasets to which the 12 different preprocessing orders were applied. When we applied preprocessing using variance stabilization of normalization method, there was a little variance in a sensitive way for detecting DEG.

Sensitivity analysis of normalization methods for indicators (지표의 표준화 방법에 대한 민감도 분석)

  • Yang, So-Hye;Choi, Si-Jung;Lee, Dong-Ryul
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2011.05a
    • /
    • pp.460-460
    • /
    • 2011
  • 국내에서는 수자원 정보화 사업에 일환으로 국가수자원종합정보시스템(WAMIS)을 개발하여 수자원에 관련된 많은 기초 자료 정보를 일반에 공개 제공하고 있으나, 주 이용 계층은 수자원관련 종사자 또는 연구자들이 대부분이다. 국가수자원종합정보시스템에서 제공하는 양질의 수자원 정보를 일반 국민들이 보다 쉽게 이해하고, 이용할 수 있도록 국내에서는 이들 기초자료를 바탕으로 다양한 수자원 지표 및 지수를 개발하였다. 이러한 수자원 관련 지표 및 지수를 개발하기 위해서는 서로 다른 단위와 특성을 가진 자료들을 모아 하나의 지표로 정의하는 과정이 필요하며, 하나의 지표로 정의되기 위해서는 반드시 표준화(normalization)과정이 필요하다. 국내에서 가장 보편적으로 사용하고 있는 방법은 Z-score법이며, 이외에도 가장 단순하고 간단한 방법인 Ranking 법, 자료의 극값(최대값, 최소값)을 이용하는 Re-scaling법, 일정 지표를 기준으로 하는 Distance to a reference country법 등이 있다. 표준화 방법은 각기 다른 장 단점을 가지고 있으며, 그 특성에 따라 정의되는 지표값은 다르게 나타날 수 있기에 지수값의 변화를 야기시킬 수 있다. 본 연구에서는 기 개발된 물이용안전성지수를 이용하여 기존 분석과 다양한 표준화 방법을 이용하여 지표를 산정하였을 때 표준화 방법에 따른 변화를 분석해 보고자 한다. 기존 연구에서 사용된 표준화 방법은 Z-score법이며, 다른 표준화 방법을 적용해 봄으로서 기존 산정 결과와의 차이를 비교 분석하였다. 지수를 구성하는 세부지표에 따라 수집되는 기초자료의 단위 및 특성은 다양하기 때문에 적합한 표준화 방법을 찾는 과정은 매우 중요하며, 이는 지표를 보다 정확하게 산정할 수 있도록 한다. 합리적인 표준화 방법을 통해 올바른 지수를 도출할 수 있고 객관적으로 수자원 환경을 평가할 수 있으며, 또한 수자원 계획 및 정책 개발에 있어 중요한 기준으로서 적용 할 수 있을 것으로 기대된다.

  • PDF

cDNA Microarray Normalization에 대한 연구

  • Kim, Jong-Yeong;Lee, Jae-Won
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2003.10a
    • /
    • pp.331-334
    • /
    • 2003
  • 마이크로 어레이(microarray)실험에서 표준화(normalization)는 유전자의 발현수준에 영향을 미치는 여러 기술적인 변인을 제거하는 과정이다. cDNA microarray normalization에 있어 여러 방법이 제안되었지만, 이중 print-tip 효과가 존재할 때 사용되는 방법으로 print-tip lowess normalization이 대표적으로 사용된다. normalization에 사용되는 lowess 함수는 데이터의 특성에 따라 window width를 정해야만 연구의 목적에 맞는 결과를 도출할 수 있다. 본 논문에서는 각각의 tip에서 최적의 window width를 계산하는 절차를 논의하였다. 또한 이의 결과와 기존의 같은 window width를 사용하는 print-tip lowess normalization 결과와 비교 평가하여 normalization의 기본 원칙에 대한 타당성을 확인하였다.

  • PDF

Ovarian Cancer Microarray Data Classification System Using Marker Genes Based on Normalization (표준화 기반 표지 유전자를 이용한 난소암 마이크로어레이 데이타 분류 시스템)

  • Park, Su-Young;Jung, Chai-Yeoung
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.15 no.9
    • /
    • pp.2032-2037
    • /
    • 2011
  • Marker genes are defined as genes in which the expression level characterizes a specific experimental condition. Such genes in which the expression levels differ significantly between different groups are highly informative relevant to the studied phenomenon. In this paper, first the system can detect marker genes that are selected by ranking genes according to statistics after normalizing data with methods that are the most widely used among several normalization methods proposed the while, And it compare and analyze a performance of each of normalization methods with mult-perceptron neural network layer. The Result that apply Multi-Layer perceptron algorithm at Microarray data set including eight of marker gene that are selected using ANOVA method after Lowess normalization represent the highest classification accuracy of 99.32% and the lowest prediction error estimate.

The Design Of Microarray Classification System Using Combination Of Significant Gene Selection Method Based On Normalization. (표준화 기반 유의한 유전자 선택 방법 조합을 이용한 마이크로어레이 분류 시스템 설계)

  • Park, Su-Young;Jung, Chai-Yeoung
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.12 no.12
    • /
    • pp.2259-2264
    • /
    • 2008
  • Significant genes are defined as genes in which the expression level characterizes a specific experimental condition. Such genes in which the expression levels differ significantly between different groups are highly informative relevant to the studied phenomenon. In this paper, first the system can detect informative genes by similarity scale combination method being proposed in this paper after normalizing data with methods that are the most widely used among several normalization methods proposed the while. And it compare and analyze a performance of each of normalization methods with multi-perceptron neural network layer. The Result classifying in Multi-Perceptron neural network classifier for selected 200 genes using combination of PC(Pearson correlation coefficient) and ED(Euclidean distance coefficient) after Lowess normalization represented the improved classification performance of 98.84%.

A Study on Comparison of Normalization and Weighting Method for Constructing Index about Flood (홍수관련 지표 산정을 위한 표준화 및 가중치 비교 연구)

  • Baeck, Seung-Hyub;Choi, Si-Jung;Hong, Seung-Jin;Kim, Dong-Phil
    • Journal of Wetlands Research
    • /
    • v.13 no.3
    • /
    • pp.411-426
    • /
    • 2011
  • The construction of composite indicators should be normalized and weighted to render them comparable and evaluable variables in the field, which undergoes absence of a distinct methodology and where the application of universally popular method is common. Constructing of indices does not compare and analyze applying various normalizing and weighting, but constructer generally use chosen method and develops indicators and indices in most research. In this study, indices are applied various normalization and weighting methods, thereby analyzing how much impact the index and identifying individual characteristics derive a more reasonable way to help other research in the future. 5 different methods of normalization and 4 different types of weights were compared and analyzed. There are different results depending applied normalized methods and Z-score method best reflects the characteristics of the variables. According to weighting methods, the calculated results show little difference, but the ranking results of indices did not changed significantly. It might be better to provide constructors with a set of normalization and weighting methods to reflect their characteristics in order to build flood indices through the result of this study.

Normalization and Search of the UV/VIS Spectra Measured from TLC/HPTLC (TLC/HPTLC에서 측정된 자외/가시부 스펙트럼의 표준화 및 검색)

  • Kang, Jong-Seong
    • YAKHAK HOEJI
    • /
    • v.38 no.4
    • /
    • pp.366-371
    • /
    • 1994
  • To improve the identification power of TLC/HPTLC the in situ reflectance spectra obtained directly from plates with commercial scanner are used. The spectrum normalization should be carried out prior to comparing and searching the spectra from library for the identification of compounds. Because the reflectance does not obey the Lambert-Beer's law, there arise some problems in normalization. These problems could be solved to some extent by normalizing the spectra with regression methods. The spectra are manipulated with the regression function of a curve obtained from the correlation plot. When the parabola was used as the manipulating function, the spectra were identified with the accuracy of 97% and this result was better than that of conventionally used the point and area normalization method.

  • PDF

A Bayesian Validation Method for Classification of Microarray Expression Data (마이크로어레이 발현 데이터 분류를 위한 베이지안 검증 기법)

  • Park, Su-Young;Jung, Jong-Pil;Jung, Chai-Yeoung
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.10 no.11
    • /
    • pp.2039-2044
    • /
    • 2006
  • Since the bio-information now even exceeds the capability of human brain, the techniques of data mining and artificial intelligent are needed to deal with the information in this field. There are many researches about using DNA microarray technique which can obtain information from thousands of genes at once, for developing new methods of analyzing and predicting of diseases. Discovering the mechanisms of unknown genes by using these new method is expecting to develop the new drugs and new curing methods. In this Paper, We tested accuracy on classification of microarray in Bayesian method to compare normalization method's Performance after dividing data in two class that is a feature abstraction method through a normalization process which reduce or remove noise generating in microarray experiment by various factors. And We represented that it improve classification performance in 95.89% after Lowess normalization.

Microarray 자료의 표준화 방법에 대한 고찰

  • Lee, Eun-Gyeong;Park, Tae-Seong
    • Bioinformatics and Biosystems
    • /
    • v.1 no.1
    • /
    • pp.8-16
    • /
    • 2006
  • DNA microarray 기술은 동시적으로 수천 개의 유전자의 발현상황을 탐색할 수 있다. 이 기술을 통해 얻어진 자료는 분석하기에 앞서 전처리 과정으로 배경보정 (background correction), 표준화 (normalization) 그리고 요약 (summarization)이 필요하다. 표준화란 microarray 실험에서 기술상의 문제로 첨가되는 일정한 잡음을 인식, 제거하기 위해 필요한 기법으로 그 동안 여러 방법들이 제시되어 왔다. 또한 마이크로어레이 자료의 분석을 위한 요약 방법으로도 많은 방법들이 연구되었다. 본 글에서는 표준화 방법들과 요약 방법들의 특성을 분석, 비교하고자 한다.

  • PDF