• 제목/요약/키워드: 유전자 선택

검색결과 614건 처리시간 0.026초

퍼지-유전자 알고리즘을 이용한 무감독 특징 선택 방법 (Unsupervised Feature Selection Method Using a Fuzzy-Genetic Algorithm)

  • 이영제;이정훈
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2000년도 춘계학술대회 학술발표 논문집
    • /
    • pp.199-202
    • /
    • 2000
  • 본 논문에서는 퍼지-유전자 접근방법을 이용한 무감독 특징 선택방법에 대하여 나타내었다. 이 방법은 각각의 특징들의 중요도에 따라 순서를 정하기 위해 사용되는 weighted distance 를 포함하는 특징 평가 지표 (feature evaluation index)를 최소화시키는데 있다. 또한 특징 평가 지표에서 사용되는 각 패턴들의 쌍에 대하여 근접함의 정도를 퍼지 멤버쉽 함수를 이용하여 결정하고 유전자 알고리즘은 평가 지표를 최소화시킴으로써 각 특징의 중요도를 나타내는 최적의 weighting 계수의 집합을 한기 위하여 적용하였다.

  • PDF

ErbB 수용체를 이용한 난소암세포 표적 유전자치료 벡터의 개발 (Development of the Gene Therapy Vector for Targeting Ovarian Cancer Cells through ErbB Receptors)

  • 정인실;방성호
    • 미생물학회지
    • /
    • 제47권1호
    • /
    • pp.1-6
    • /
    • 2011
  • 암의 유전자치료에서 암세포로의 선택적 유전자전달 매체의 부족은 치료효과의 감소를 야기하는 문제이다. 본 연구에서는 난소암 유전자치료의 효율을 높이기 위한 목적으로 난소암세포로 선택적인 유전자전달을 하도록 개량된 아데노바이러스 벡터를 제조하고, 그 효율성을 난소암세포주를 이용하여 조사하였다. 난소암세포에 과다발현하는 분자인 ErbB receptor를 표적하도록 아데노바이러스 외피단백질 fiber에 ErbB receptor에 대한 ligand인 heregulin으로부터 유래한 펩티드를 부착하였다. 53개의 아미노산으로 구성된 외부 펩티드를 fiber에 부착하였을 때 바이러스 감염에 중요한 기능을 하는 fiber 삼량체 구조 형성에 영향을 미치지 않았다. Fiber를 조작한 개량 아데노바이러스는 야생형 fiber를 가진 1세대 아데노바이러스 벡터에 비해 선택적으로 난소암으로 유전자를 전달하는 비율이 증가하였다. 특히 항암제에 저항성을 가진 난소암세포주 OVCAR3에서 유전자전달 효율이 약 5배 증가되었다. 따라서 난소암의 유전자치료에서 개량된 아데노바이러스로 치료 유전자를 전달하면 치료의 효율성을 향상시킬 수 있을 것이다.

패턴 인식문제를 위한 유전자 알고리즘 기반 특징 선택 방법 개발 (Genetic Algorithm Based Feature Selection Method Development for Pattern Recognition)

  • 박창현;김호덕;양현창;심귀보
    • 한국지능시스템학회논문지
    • /
    • 제16권4호
    • /
    • pp.466-471
    • /
    • 2006
  • 패턴 인식 문제에서 중요한 전처리 과정 중 하나는 특정을 선택하거나 추출하는 부분이다. 특정을 추출하는 방법으로는 PCA가 보통 사용되고 특정을 선택하는 방법으로는 SFS 나 SBS 등의 방법들이 자주 사용되고 있다. 본 논문은 진화 연산 방법으로써 비선형 최적화 문제에서 유용하게 사용되어 지고 있는 유전자 알고리즘을 특정 선택에 적용하는 유전자 알고리즘 특정 선택 (Genetic Algorithm Feature Selection: GAFS)방법을 개발하여 다른 특징 선택 알고리즘과의 비교를 통해 본 알고리즘의 성능을 관찰한다.

클론선택기반 유전자 알고리즘을 이용한 자기부상 RGV의 PID 제어기 설계 (Design of PID Controller for Magnetic Levitation RGV Using Genetic Algorithm Based on Clonal Selection)

  • 조재훈;김용태
    • 한국지능시스템학회논문지
    • /
    • 제22권2호
    • /
    • pp.239-245
    • /
    • 2012
  • 본 논문에서는 시간영역 및 주파수영역 성능지수와 클론 선택기반 유전자 알고리즘을 이용한 자기부상 RGV(Rail-Guided Vehicle)의 최적 PID 제어기 설계 기법을 제안한다. 일반적으로 RGV에 적용되는 흡인식 자기부상시스템은 시스템 자체의 불안정성을 내포하고 있으며, 오버슈트 및 정착시간을 고려한 설계가 요구되기 때문에 기존의 성능지수함수로는 원하는 성능을 얻기에 어려움이 있다. 본 논문에서는 먼저 PID 제어기 설계에 사용되는 성능지수함수를 분석하고, 자기부상 RGV에 적합한 시간영역 및 주파수영역 성능을 고려한 새로운 성능지수 함수를 제안하였다. 또한, 클론선택 최적화기법을 적용하여 성능이 향상된 클론 선택기반 유전자 알고리즘을 제안하였다. 제안된 최적화 알고리즘과 성능지수함수의 성능을 평가하기 위하여 단순 유전자 알고리즘과 기존의 군집 최적화 기법인 PSO(Particle Swarm Optimization)를 이용하여 비교 시뮬레이션을 하였다. 제안된 알고리즘이 기존의 최적화 기법들에 비해 자기부상 RGV의 최적 제어기 설계에 더 효과적임을 시뮬레이션을 통해 보였다.

공통 선택된 특징을 이용한 유전 발현 데이터의 분류 (Classification of Gene Expression Profiles Using Common Features Selected)

  • 박찬호;조성배
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (상)
    • /
    • pp.351-354
    • /
    • 2002
  • 최근 생명공학 기술과 분석화학 기술의 발달로 생물 유전 데이터를 대량으로 얻는 것이 가능하게 되었다. 아울러 이렇게 얻어진 데이터를 적절하게 처리하고 분석하는 방법들도 여러 가지가 소개되어 왔다. 본 논문에서는 DNA 마이크로어레이 정보를 분류하기 위하여 세 가지 데이터에 대하여 여러 가지 특징 전혀 방법으로 선택된 유전자들을 사용하여 신경망 분류기에 적용시켜 보았다. 실험 결과 백혈병 데이터의 경우 피어슨 상관계수를 이용한 분류가 97.1%로 가장 높은 인식률을 보여주었다. 한편 여러 가지 특징 선택 방법에 의하여 공통적으로 선택된 유전자를 사용하여 분류하면 더 높은 인식률이 나올 것 같았지만 실제로는 기대에 못 미치는 성과를 보여주었다. 따라서 무조건 여러 번 선택된 특징을 선택하기 보다는 특징들끼리의 상관관계를 고려하여 선택하는 방법이 필요할 것이다.

  • PDF

선별 시스템 기반 표지 유전자를 포함한 난소암 마이크로어레이 데이터 분류 (Classification of Ovarian Cancer Microarray Data based on Intelligent Systems with Marker gene)

  • 박수영;정채영
    • 한국정보통신학회논문지
    • /
    • 제15권3호
    • /
    • pp.747-752
    • /
    • 2011
  • 마이크로어레이 분류는 전형적으로 분류기 디자인과 에러 추정이 현저하게 작은 샘플에 기반한다는 것과 교차 검증 에러 추정이 대다수의 논문에 사용된다는 주목할 만한 두 가지 특징을 소유한다. 마이크로어레이 난소 암 데이터는 수 만개의 유전자 발현으로 구성되어 있고, 이러한 정보를 동시에 분석하기 위한 어떤 체계적인 절차도 없다. 본 논문에서는, 통계에 따라 유전자의 우선순위를 정함으로써 표지유전자를 선택하였고, 널리 보급되어 있는 분류 규칙인 선형 분류 분석, 3-nearest-neighbor와 결정 트리 알고리즘은 표지 유전자를 선택한 데이터와 선택하지 않는 데이터의 분류 정확도 비교를 위해 사용되어졌다. ANOVA를 이용하여 선택된 표지 유전자를 포함하는 마이크로어레이 데이터 셋에 선영 분류분석 규칙을 적용한 결과 97.78%의 가장 높은 분류 정확도와 가장 낮은 예측 에러 추정치를 나타내었다.

대규모 염색체들을 위한 개선된 Probe 선택 알고리즘 (An Improved Probe Selection Algorithm for Large Genomes)

  • 권영대;박경욱;임형석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.1045-1048
    • /
    • 2005
  • 유전자 칩의 정확성은 각 유전자들의 식별자로 활용되는 probe들에 의해 결정된다. 일반적으로 칩을 구성하는 probe들은 반응 오류를 예측하기 위해 이중구조와 녹는점과 같은 요소들을 고려한다. 또한 다른 유전자들과의 교차반응을 최소화하기 위해 각 probe들의 specificity도 고려되어야 한다. probe가 specificity를 보장하는지 검증하는 것은 전체 유전자들을 탐색해야 하므로 대규모 인간염색체에 대해서는 많은 시간이 소요된다. 본 논문에서는 specificity를 만족하는 probe들을 선택하는 효율적인 알고리즘을 제시한다. 제시한 알고리즘은 해시 테이블을 활용하여 probe가 specificity를 만족하지 못하게 하는 유전자 시퀀스들만을 탐색하여 비교한다. 제시한 알고리즘이 기존 알고리즘보다 효율적임을 실험결과를 통해 보인다.

  • PDF

암 예후를 효과적으로 예측하기 위한 Node2Vec 기반의 유전자 발현량 이미지 표현기법 (A Node2Vec-Based Gene Expression Image Representation Method for Effectively Predicting Cancer Prognosis)

  • 최종환;박상현
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권10호
    • /
    • pp.397-402
    • /
    • 2019
  • 암 환자에게 적절한 치료계획을 제공하기 위해 암의 진행양상 또는 환자의 생존 기간 등에 해당하는 환자의 예후를 정확히 예측하는 것은 생물정보학 분야에서 다루는 중요한 도전 과제 중 하나이다. 많은 연구에서 암 환자의 유전자 발현량 데이터를 이용하여 환자의 예후를 예측하는 기계학습 모델들이 많이 제안되어 오고 있다. 유전자 발현량 데이터는 약 17,000개의 유전자에 대한 수치값을 갖는 고차원의 수치형 자료이기에, 기존의 연구들은 특징 선택 또는 차원 축소 전략을 이용하여 예측 모델의 성능 향상을 도모하였다. 그러나 이러한 접근법은 특징 선택과 예측 모델의 훈련이 분리되어 있어서, 기계학습 모델은 선별된 유전자들이 생물학적으로 어떤 관계가 있는지 알기가 어렵다. 본 연구에서는 유전자 발현량 데이터를 이미지 형태로 변환하여 예후 예측이 효과적으로 특징 선택 및 예후 예측을 수행할 수 있는 기법을 제안한다. 유전자들 사이의 생물학적 상호작용 관계를 유전자 발현량 데이터에 통합하기 위해 Node2Vec을 활용하였으며, 2차원 이미지로 표현된 발현량 데이터를 효과적으로 학습할 수 있도록 합성곱 신경망 모델을 사용하였다. 제안하는 모델의 성능은 이중 교차검증을 통해 평가되었고, 유전자 발현량 데이터를 그대로 이용하는 기계학습모델보다 우월한 예후 예측 정확도를 가지는 것이 확인되었다. Node2Vec을 이용한 유전자 발현량의 새로운 이미지 표현법은 특징 선택으로 인한 정보의 손실이 없어 예측 모델의 성능을 높일 수 있으며, 이러한 접근법이 개인 맞춤형 의학의 발전에 이바지할 것으로 기대한다.

유전자 알고리즘과 정보이론을 이용한 속성선택 (Feature Selection by Genetic Algorithm and Information Theory)

  • 조재훈;이대종;송창규;김용삼;전명근
    • 한국지능시스템학회논문지
    • /
    • 제18권1호
    • /
    • pp.94-99
    • /
    • 2008
  • 속성선택 (Feature Selection)은 패턴분류 문제에서 분류기들의 성능을 향상시킬 수 있는 중요한 기법이다. 특히, 많은 속성들을 가지는 데이터의 분류문제에서 관련이 적은 데이터, 중복되거나 또는 노이즈 있는 데이터를 제거한 주요 속성부분집합을 선택하여 이용함으로써 분류기의 정확도를 향상시킬 수 있다. 본 논문에서는 유전자 알고리즘과 정보이론의 상호정보량을 이용하여 속성선택을 하는 기법을 제안하였다. 실험을 통하여 제안된 알고리즘이 패턴인식문제에서 다른 방법들보다 성능이 우수함을 보였다.

유전자 알고리즘을 이용한 림프종 암의 최적 분류기 앙상블 (Optimal Classifier Ensemble for Lymphoma Cancer Using Genetic Algorithm)

  • 박찬호;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.356-358
    • /
    • 2003
  • DNA microarray기술의 발달로 한꺼번에 수천 개 유전자의 발현 정보를 얻는 것이 가능해졌는데, 이렇게 얻어진 데이터를 효과적으로 분류하는 시스템을 만들어놓으면 새로운 샘플이 정상상태인지, 질병을 가진 상태인지 예측할 수 있다. 분류 시스템을 위하여 여러 가지 특징선택방법들과 분류기법들을 사용할 수 있는데, 모든 상황에서 항상 뛰어난 성능을 보이는 특징선택법이나 분류기를 찾기는 힘들다. 안정되고 개선된 성능을 내기 위해서 특징-분류기의 앙상블을 이용할 수 있는데, 앙상블에 이용될 수 있는 특징선택 방법이나 분류기의 수가 많다면, 앙상블을 만들 수 있는 조합이 많아지기 때문에, 모든 조합에 대하여 앙상블 결과를 구하기는 거의 불가능하다. 이를 해결하기 위하여 본 논문에서는 유전자알고리즘을 이용하여 모든 앙상블 결과를 계산하지 않으면서 최적의 앙상블을 찾아내는 방법을 제안하였으며, 실제로 림프종 암 데이터에 적용한 결과 100%의 결합결과를 보이는 최적의 앙상블을 효과적으로 찾아내었다.

  • PDF