• Title/Summary/Keyword: 유전자 선택

Search Result 614, Processing Time 0.032 seconds

Unsupervised Feature Selection Method Using a Fuzzy-Genetic Algorithm (퍼지-유전자 알고리즘을 이용한 무감독 특징 선택 방법)

  • 이영제;이정훈
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2000.05a
    • /
    • pp.199-202
    • /
    • 2000
  • 본 논문에서는 퍼지-유전자 접근방법을 이용한 무감독 특징 선택방법에 대하여 나타내었다. 이 방법은 각각의 특징들의 중요도에 따라 순서를 정하기 위해 사용되는 weighted distance 를 포함하는 특징 평가 지표 (feature evaluation index)를 최소화시키는데 있다. 또한 특징 평가 지표에서 사용되는 각 패턴들의 쌍에 대하여 근접함의 정도를 퍼지 멤버쉽 함수를 이용하여 결정하고 유전자 알고리즘은 평가 지표를 최소화시킴으로써 각 특징의 중요도를 나타내는 최적의 weighting 계수의 집합을 한기 위하여 적용하였다.

  • PDF

Development of the Gene Therapy Vector for Targeting Ovarian Cancer Cells through ErbB Receptors (ErbB 수용체를 이용한 난소암세포 표적 유전자치료 벡터의 개발)

  • Joung, In-Sil;Bang, Seong-Ho
    • Korean Journal of Microbiology
    • /
    • v.47 no.1
    • /
    • pp.1-6
    • /
    • 2011
  • Inefficiency of in vivo gene transfer using currently available vectors reflects a major hurdle in cancer gene therapy. Both viral and non-viral approaches have been described to improve gene transfer efficiency but suffer from a number of limitations. Here we tested an adenovirus carrying the small peptide ligand derived from heregulin${\beta}$ EGF-like domain onto fiber, the adenoviral capsid protein, to deliver transgene to ovarian cancer cells which overexpress ErbB, the cognate receptors for heregulin. The attachement of 53 amino acids to fiber didn't affect on the fiber's trimer structure that is critical for the viral entry to cells. The fiber-modified adenovirus can mediate entry and expression of a ${\beta}$-galactosidase into cancer cells in an increased efficiency compared the unmodified adenovirus. Particularly, the gene transfer efficiency was improved up to 5 times in OVCAR3 cells, an ovarian cancer cell line. Such transduction systems hold promise for delivering genes to ErbB receptor overexpressing cancer cells, and could be used for future cancer gene therapy.

Genetic Algorithm Based Feature Selection Method Development for Pattern Recognition (패턴 인식문제를 위한 유전자 알고리즘 기반 특징 선택 방법 개발)

  • Park Chang-Hyun;Kim Ho-Duck;Yang Hyun-Chang;Sim Kwee-Bo
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.16 no.4
    • /
    • pp.466-471
    • /
    • 2006
  • IAn important problem of pattern recognition is to extract or select feature set, which is included in the pre-processing stage. In order to extract feature set, Principal component analysis has been usually used and SFS(Sequential Forward Selection) and SBS(Sequential Backward Selection) have been used as a feature selection method. This paper applies genetic algorithm which is a popular method for nonlinear optimization problem to the feature selection problem. So, we call it Genetic Algorithm Feature Selection(GAFS) and this algorithm is compared to other methods in the performance aspect.

Design of PID Controller for Magnetic Levitation RGV Using Genetic Algorithm Based on Clonal Selection (클론선택기반 유전자 알고리즘을 이용한 자기부상 RGV의 PID 제어기 설계)

  • Cho, Jae-Hoon;Kim, Yong-Tae
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.22 no.2
    • /
    • pp.239-245
    • /
    • 2012
  • This paper proposes a novel optimum design method for the PID controller of magnetic levitation-based Rail-Guided Vehicle(RGV) by a genetic algorithm using clone selection method and a new performance index function with performances of both time and frequency domain. Generally, since an attraction type levitation system is intrinsically unstable and requires a delicate controller that is designed considering overshoot and settling time, it is difficult to completely satisfy the desired performance through the methods designed by conventional performance indexes. In the paper, the conventional performance indexes are analyzed and then a new performance index for Maglev-based RGV is proposed. Also, an advanced genetic algorithm which is designed using clonal selection algorithm for performance improvement is proposed. To verify the proposed algorithm and the performance index, we compare the proposed method with a simple genetic algorithm and particle swarm optimization. The simulation results show that the proposed method is more effective than conventional optimization methods.

Classification of Gene Expression Profiles Using Common Features Selected (공통 선택된 특징을 이용한 유전 발현 데이터의 분류)

  • Park, Chan-Ho;Cho, Sung-Bae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11a
    • /
    • pp.351-354
    • /
    • 2002
  • 최근 생명공학 기술과 분석화학 기술의 발달로 생물 유전 데이터를 대량으로 얻는 것이 가능하게 되었다. 아울러 이렇게 얻어진 데이터를 적절하게 처리하고 분석하는 방법들도 여러 가지가 소개되어 왔다. 본 논문에서는 DNA 마이크로어레이 정보를 분류하기 위하여 세 가지 데이터에 대하여 여러 가지 특징 전혀 방법으로 선택된 유전자들을 사용하여 신경망 분류기에 적용시켜 보았다. 실험 결과 백혈병 데이터의 경우 피어슨 상관계수를 이용한 분류가 97.1%로 가장 높은 인식률을 보여주었다. 한편 여러 가지 특징 선택 방법에 의하여 공통적으로 선택된 유전자를 사용하여 분류하면 더 높은 인식률이 나올 것 같았지만 실제로는 기대에 못 미치는 성과를 보여주었다. 따라서 무조건 여러 번 선택된 특징을 선택하기 보다는 특징들끼리의 상관관계를 고려하여 선택하는 방법이 필요할 것이다.

  • PDF

Classification of Ovarian Cancer Microarray Data based on Intelligent Systems with Marker gene (선별 시스템 기반 표지 유전자를 포함한 난소암 마이크로어레이 데이터 분류)

  • Park, Su-Young;Jung, Chai-Yeoung
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.15 no.3
    • /
    • pp.747-752
    • /
    • 2011
  • Microarray classification typically possesses two striking attributes: (1) classifier design and error estimation are based on remarkably small samples and (2) cross-validation error estimation is employed in the majority of the papers. A Microarray data of ovarian cancer consists of the expressions of thens of thousands of genes, and there is no systematic procedure to analyze this information instantaneously. In this paper, gene markers are selected by ranking genes according to statistics, popular classification rules - linear discriminant analysis, k-nearest-neighbor and decision trees - has been performed comparing classification accuracy of data selecting gene markers and not selecting gene markers. The Result that apply linear classification analysis at Microarray data set including marker gene that are selected using ANOVA method represent the highest classification accuracy of 97.78% and the lowest prediction error estimate.

An Improved Probe Selection Algorithm for Large Genomes (대규모 염색체들을 위한 개선된 Probe 선택 알고리즘)

  • Kwon, Young-Dae;Park, Kyoung-Wook;Lim, Hyeong-Seok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.05a
    • /
    • pp.1045-1048
    • /
    • 2005
  • 유전자 칩의 정확성은 각 유전자들의 식별자로 활용되는 probe들에 의해 결정된다. 일반적으로 칩을 구성하는 probe들은 반응 오류를 예측하기 위해 이중구조와 녹는점과 같은 요소들을 고려한다. 또한 다른 유전자들과의 교차반응을 최소화하기 위해 각 probe들의 specificity도 고려되어야 한다. probe가 specificity를 보장하는지 검증하는 것은 전체 유전자들을 탐색해야 하므로 대규모 인간염색체에 대해서는 많은 시간이 소요된다. 본 논문에서는 specificity를 만족하는 probe들을 선택하는 효율적인 알고리즘을 제시한다. 제시한 알고리즘은 해시 테이블을 활용하여 probe가 specificity를 만족하지 못하게 하는 유전자 시퀀스들만을 탐색하여 비교한다. 제시한 알고리즘이 기존 알고리즘보다 효율적임을 실험결과를 통해 보인다.

  • PDF

A Node2Vec-Based Gene Expression Image Representation Method for Effectively Predicting Cancer Prognosis (암 예후를 효과적으로 예측하기 위한 Node2Vec 기반의 유전자 발현량 이미지 표현기법)

  • Choi, Jonghwan;Park, Sanghyun
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.8 no.10
    • /
    • pp.397-402
    • /
    • 2019
  • Accurately predicting cancer prognosis to provide appropriate treatment strategies for patients is one of the critical challenges in bioinformatics. Many researches have suggested machine learning models to predict patients' outcomes based on their gene expression data. Gene expression data is high-dimensional numerical data containing about 17,000 genes, so traditional researches used feature selection or dimensionality reduction approaches to elevate the performance of prognostic prediction models. These approaches, however, have an issue of making it difficult for the predictive models to grasp any biological interaction between the selected genes because feature selection and model training stages are performed independently. In this paper, we propose a novel two-dimensional image formatting approach for gene expression data to achieve feature selection and prognostic prediction effectively. Node2Vec is exploited to integrate biological interaction network and gene expression data and a convolutional neural network learns the integrated two-dimensional gene expression image data and predicts cancer prognosis. We evaluated our proposed model through double cross-validation and confirmed superior prognostic prediction accuracy to traditional machine learning models based on raw gene expression data. As our proposed approach is able to improve prediction models without loss of information caused by feature selection steps, we expect this will contribute to development of personalized medicine.

Feature Selection by Genetic Algorithm and Information Theory (유전자 알고리즘과 정보이론을 이용한 속성선택)

  • Cho, Jae-Hoon;Lee, Dae-Jong;Song, Chang-Kyu;Kim, Yong-Sam;Chun, Myung-Geun
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.18 no.1
    • /
    • pp.94-99
    • /
    • 2008
  • In the pattern classification problem, feature selection is an important technique to improve performance of the classifiers. Particularly, in the case of classifying with a large number of features or variables, the accuracy of the classifier can be improved by using the relevant feature subset to remove the irrelevant, redundant, or noisy data. In this paper we propose a feature selection method using genetic algorithm and information theory. Experimental results show that this method can achieve better performance for pattern recognition problems than conventional ones.

Optimal Classifier Ensemble for Lymphoma Cancer Using Genetic Algorithm (유전자 알고리즘을 이용한 림프종 암의 최적 분류기 앙상블)

  • 박찬호;조성배
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.356-358
    • /
    • 2003
  • DNA microarray기술의 발달로 한꺼번에 수천 개 유전자의 발현 정보를 얻는 것이 가능해졌는데, 이렇게 얻어진 데이터를 효과적으로 분류하는 시스템을 만들어놓으면 새로운 샘플이 정상상태인지, 질병을 가진 상태인지 예측할 수 있다. 분류 시스템을 위하여 여러 가지 특징선택방법들과 분류기법들을 사용할 수 있는데, 모든 상황에서 항상 뛰어난 성능을 보이는 특징선택법이나 분류기를 찾기는 힘들다. 안정되고 개선된 성능을 내기 위해서 특징-분류기의 앙상블을 이용할 수 있는데, 앙상블에 이용될 수 있는 특징선택 방법이나 분류기의 수가 많다면, 앙상블을 만들 수 있는 조합이 많아지기 때문에, 모든 조합에 대하여 앙상블 결과를 구하기는 거의 불가능하다. 이를 해결하기 위하여 본 논문에서는 유전자알고리즘을 이용하여 모든 앙상블 결과를 계산하지 않으면서 최적의 앙상블을 찾아내는 방법을 제안하였으며, 실제로 림프종 암 데이터에 적용한 결과 100%의 결합결과를 보이는 최적의 앙상블을 효과적으로 찾아내었다.

  • PDF