• Title/Summary/Keyword: 마이크로어레이 데이터

Search Result 103, Processing Time 0.03 seconds

Microarray Data Sharing System (마이크로어레이 데이터 공유 시스템)

  • Yoon, Jee-Hee;Hong, Dong-Wan;Lee, Jong-Keun
    • The Journal of the Korea Contents Association
    • /
    • v.9 no.8
    • /
    • pp.18-31
    • /
    • 2009
  • Improved reliability of microarray data and its reproducibility lead to recent increment in demand of data sharing and utilization among laboratories, but house-keeping and publicly opened microarray experimental data can hardly be accessed and utilized since they are in heterogeneous formats according to the various experimental methods and microarray platforms. In this paper, we propose a microarray sharing method which can easily retrieve and integrate microarray data from different experiment platforms, data formats, normalization methods, and analysis methods. Our system is based on web-service technology. The biologists of each site are able to search UDDI(Universal Description, Discovery, and Integration) registry, and download microarray data with common data structure of standard format recommended by MGED(Microarray Gene Expression Databases) society. The common data structure defined in this paper consists of IDF(Investigation Design Format), ADF(Array Design Format), SDRF(Sample and Relationship Format), and EDF(Expression Data Format). These components play role as templates to integrate microarray data with various structure and can be stored in standard formats such as MAGE-ML, MAGE-TAB, and XML Schema. In addition, our system provides advanced tools of automatic microarray data submitter and file manager to manipulate local microarray data efficiently.

Design and Implementation of Integrated System for Microarray Data (마이크로어레이 실험 및 분석 데이터 처리를 위한 통합 관리 시스템의 설계와 구현)

  • 이미경;최정현;조환규
    • Microbiology and Biotechnology Letters
    • /
    • v.31 no.2
    • /
    • pp.182-190
    • /
    • 2003
  • As DNA microarrays are widely used recently, the amount of microarray data is exponentially increasing. Until now, however, no domestic system is available for the efficient management of such data. Because the number of experimental data in a specific laboratory is limited, it is necessary to avoid redundant experiments and to accumulate the results using a shared data management system for microarrays. In this paper, a system named WEMA (WEb management of Micro Arrays) was designed and implemented to manage and process the microarray data. WEMA system was designed to include the basic feature of MIAME (Minimal Information About a Microarray Experiment), and general data units were also defined in the system in order to systematically manage the data. The WEMA system has three main features: efficient management of microarray data, integration of input/ouput data, and metafile processing. The system was tested with actual microarray data produced by a molecular biology laboratory, and we found that the biologists could systematically manage and easily analyze the microarray data. As a consequence, the researchers could reduce the cost of data exchange and communication.

SMILE : Development of an Integrated LIMS for Management and Analysis of Microarray Data (SMILE : 마이크로어레이 데이터 저장.관리.분석을 위한 통합 LIMS 개발)

  • Lee, Jeong-Won;Jin, Hee-Jeong;Cho, Hwan-Gue
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10a
    • /
    • pp.6-10
    • /
    • 2006
  • 마이크로어레이 실험의 등장으로 한 번에 수백 개에서 수천 개의 유전자를 실험할 수 있게 되었다. 이는 기존의 실험과 비교했을 때 질적인 측면과 양적인 측면에서 가히 혁신적이라 할 수 있다. 마이크로어레이 칩을 이용한 실험에서 쏟아져 나오는 엄청난 데이터를 비교, 분석, 관리하기 위해서는 실험실의 마이크로어레이 분석 소프트웨어나 시스템간의 데이터 형식이 호환되어야 하며, 소프트웨어의 지원 또한 획기적이고 효율적이어야 한다. 본 논문에서는 다양한 종류의 마이크로어레이 입력 데이터 및 분석 데이터를 다룰 수 있고, 표준 파일 형식으로의 변환 기능을 제공하며, 마이크로어레이 이미지 분석용 소프트웨어인 ArrayMall[1,2]과 유전자 조절 네트워크 분석 시스템인 GENAW[3]를 통합하고 마이크로어레이 실험데이터의 분석, 관리 및 데이터 공유를 위한 분산 시스템인 SMILE[4]에 대해 소개한다.

  • PDF

Design And Realization For Efficiently Storing Microarray Data Using Structural Similarity (구조적 유사성을 이용한 마이크로어레이 데이터의 효율적인 저장을 위한 기법의 설계 및 구현)

  • Yun, Jong-Han;Shin, Dong-Kyu;Shin, Dong-Il
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06c
    • /
    • pp.230-235
    • /
    • 2008
  • 생명정보 대량 획득기술의 하나인 마이크로어레이(microarray)는 DNA와 각종 유적자 연구에 사용되는 도구로서 확립되면서, 생명정보학(bioinformatics)분야의 발전에 크게 기여하였다. 그러나 마이크로어레이는 생명정보학분야의 핵심기술 중 하나로 발전하였음에도 불구하고 마이크로어레이 실험으로 생성되는 데이터는 형태가 다양하고 매우 복잡한 형태를 갖기 때문에 데이터의 공유나 저장에서 많은 어려움을 겪는 것이 사실이다. 따라서 마이크로어레이 실험결과 분석을 위한 최소한의 컨텐츠가 정의되고 표준화 되었다. MIAME 데이터, MAGE-OM/ML과 같은 표준화된 공개 저장소는 전문 생물학 연구단체에게 과거부터 지금까지 주요 관심사가 되어왔다. 하지만 많은 공개저장소의 설립되었지만 마이크로어레이 데이터의 구조적 특징을 고려하여 효과적인 설계를 하지 않은 것이 사실이다. 본 논문은 표준을 따르는 동시에 마이크로어레이 데이터의 구조적 빈발 패턴이 반복되는 계층적 특징을 반영하는 전략을 제안한다. 이를 통하여 복잡한 데이터의 구조를 객체들의 빈발 패턴을 파악하여 그 계층을 줄임으로서 복잡도를 줄일 수 있었다. 이 과정에서 관계형 데이터베이스 기반의 공개저장소의 성능에 영향을 주는 관계 테이블(join-table)의 숫자는 줄어든다. 이에 따라, 성능은 개선된다. 이 전략을 통하여 생성된 테이블의 숫자는 원본 데이터를 단순 매핑시켜 저장하는 방법에 비하여 약 31%줄어든다. 결국 MAGE-ML 데이터의 저장과 로딩 시간은 이 논문에서 제시하는 전략을 적용하지 않은 방법에 비해 60%에서 65%를 줄일 수 있었다.

  • PDF

An Algorithm for Addressing in Microarray using Regular Grid Structure Searching (균일 격자 구조 탐색을 이용한 마이크로어레이 주소 결정 알고리즘)

  • 진희정;조환규
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04a
    • /
    • pp.955-957
    • /
    • 2004
  • DNA 마이크로어레이(microarray)란 새로운 개념의 기술이 도입되면서, 이를 이용하여 유전체(genome)를 탐색하거나, 동시에 수천 개의 유전자간의 상호작용을 관찰 할 수 있게 되었다. 이러한 이점으로 인하여, 많은 DNA 마이크로어레이 실험이 시행되고 있다. DNA 마이크로어레이 실험으로 생성되는 이미지 데이터는 그 양이 방대하고, 분석하는 연구자에 따라 판정이 달라질 수 있으므로, 이를 효율적으로 분석할 수 있는 방법들이 필요하게 되었다. 하지만, 마이크로어레이 이미지 데이터는 반점(Spot) 위치의 변동이나 반점의 모양, 크기가 고르지 않는 것과 칼은 다양한 문제로 인하여 자동적으로 분석하기는 어렵다. 본 논문에서는 마이크로어레이의 균일 격자(regular grid) 구조 탐색을 이용하여 새로운 주소 결정 알고리즘을 소개한다.

  • PDF

Gene Expression Data Analysis Using Bayesian Networks (베이지안망을 이용한 유전자 발현 테이터의 분석)

  • 황규백;장병탁;김영택
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.301-303
    • /
    • 2001
  • 최근 DNA 칩 또는 마이크로어레이 기술의 발전으로 인해 한 세포 내의 수천 개의 유전자의 발현 정도를 동시에 측정할 수 있게 되었다. 이러한 마이크로어레이 데이터를 분석해서 암의 경과나 세포의 주기적 변화 등에 영향을 미치는 유전자들을 알아낼 수 있다. 본 논문에서는 베이지안망을 이용해서 마이크로어레이 데이터를 분석, 백혈병의 경과를 예측한다. 베이지안망은 다수의 변수들간의 확률적 관계를 표현하는 그래프 모델로 각 유전자들간의 확률적 관계를 표현하는 그래프 모델로 각 유전자들간의 확률적 관계를 사람이 알아보기 쉬운 형태로 학습할 수 있다는 장점이 있다. 마이크로어레이 데이터에 대해서 학습된 베이지안망은 백혈병 경과 예측에 대해서 기존의 방법보다 뛰어난 성능을 보였다.

  • PDF

Local Clustering for Multidimensional Data (다차원 데이터의 일부 차원을 반영한 지역 클러스터링)

  • Lee, Sun-A;Hwang, Kyung-Soon;Lee, Keon-Myung;Lee, Chan-Hee
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2008.04a
    • /
    • pp.17-18
    • /
    • 2008
  • 다차원 데이터들에 대한 거리기반 클러스터링에서는 데이터의 전체 차원을 고려한 거리 정보를 이용하여 근접한 것들을 인접하게 만든다. 마이크로어레이 데이터의 경우에는 일부 차원 관점에서 유사한 지역 클러스터를 찾는 것이 분석에서 유용한 경우가 있다. 이 논문에서는 마이크로어레이 데이터에 대한 지역 클러스터를 찾는 방법을 제안한다.

  • PDF

An Intelligent System of Marker Gene Selection for Classification of Cancers using Microarray Data (마이크로어레이 데이터를 이용한 암 분류 표지 유전자 선별 시스템)

  • Park, Su-Young;Jung, Chai-Yeoung
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.14 no.10
    • /
    • pp.2365-2370
    • /
    • 2010
  • The method of cancer classification based on microarray could contribute to being accurate cancer classification by finding differently expressing gene pattern statistically according to a cancer type. Therefore, the process to select a closely related informative gene with a particular cancer classification to classify cancer using present microarray technology with effect is essential. In this paper, the system can detect marker genes to likely express the most differentially explaining the effects of cancer using ovarian cancer microarray data. And it compare and analyze a performance of classification of the proposed system with it of established microarray system using multi-perceptron neural network layer. Microarray data set including marker gene that are selected using ANOVA method represent the highest classification accuracy of 98.61%, which show that it improve classification performance than established microarray system.

Multiple Optimal Classifiers based on Speciated Evolution for Classifying DNA Microarray Data (DNA 마이크로어레이 데이터의 분류를 위한 종분화 진화 기반의 최적 다중 분류기)

  • 박찬호;조성배
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.724-726
    • /
    • 2004
  • DNA 마이크로어레이 기술의 발전은 암의 조기 발견 및 예후 예측을 가능하게 해주었으며, 이와 관련된 많은 연구가 진행 중이다. 마이크로어레이 데이터의 분류에서 관련 유전자들의 선택은 필수적이며, 유전자 선택방법은 분류기와 짝을 이루어 특징-분류기를 형성한다. 이제까지 여러 가지 특징-분류기를 사용하여 마이크로어레이 데이터를 분류해 왔지만, 알고리즘의 한계와 데이터의 결함 등으로 인하여 최적의 특징-분류기를 찾기 어려웠다. 따라서 앙상블 분류기를 이용하여 높은 분류성능을 얻는 방법이 시도되어왔으며. 최적의 것을 찾기 위하여 유전자 알고리즘이 사용되기도 했다. 본 논문에서는 이를 발전시켜 다양한 최적의 앙상블을 생성하기 위해 종분화 방법을 사용한다. 림프종 암 데이터에 대하여 leave-one-out cross-validation을 적용한 결과, 제안한 방법으로 다양한 최적해를 탐색하는 것을 확인할 수 있었다.

  • PDF

Selection of Discriminative Genes for Data Mining of Time-series Microarray Data (시계열 마이크로어레이 데이터 마이닝을 위한 분별력 있는 유전자 선정 방법)

  • Lee Min-Su;Park Seung-Soo;Kang Sung-Hee;Park Woong-Yang
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06a
    • /
    • pp.25-27
    • /
    • 2006
  • 본 논문에서는 시계열 마이크로어레이데이터 마이닝을 위한 전처리 작업으로 시계열 마이크로어레이 데이터에 특징 추출 방법 및 상관관계 분석을 이용하여 분화 과정에 대해 분별력 있는 유전자들을 선정하기 위한 방법을 제안하고, 줄기세포가 신경세포로 분화하는 과정에서 특이적으로 발현되는 유전자들을 찾기 위한 시계열 마이크로어레이 데이터 분석 과정을 하나의 예로 제시한다. 분석 결과, 제안한 방법이 분화 특이적으로 발현되는 분별력 있는 유전자들, 분화 과정에서 공통적으로 발현되는 유전자들, 그리고 경계선에 존재하는 유전자들을 통해서 줄기세포 신경분화의 특징들을 규명하는데 매우 유용함을 보였다.

  • PDF