• Title/Summary/Keyword: genetic algorithm,

검색결과 4,777건 처리시간 0.101초

COG 알고리즘을 통한 해양성 Euryarchaeota의 유전적 조성 분석 (Genetic Composition Analysis of Marine-Origin Euryarchaeota by using a COG Algorithm)

  • 이재화;이동근;김철민;이은열
    • 생명과학회지
    • /
    • 제13권3호
    • /
    • pp.298-307
    • /
    • 2003
  • 고세균 (Archaea)의 보존적 유전자를 파악하고 각 분류 단계별로 추가되는 보존적 유전자를 밝히기 위해 그리고 해양성 Euryarchaeota와 육지성 Euryarchaeota의 유전자 조성을 비교하기위해 COG (clusters of orthologous groups of proteins) 알고리즘을 이용하였다. 총 9종의 고세균이 공통적으로 보유하는 보존적 유전자는 340개로 나타났고 8종의 Euryarchaeota는 388개의 유전자가 보존적이었다. Euryarchaeota 각 종이 보유하는 orthologous에 대한 보존적 유전자의 비율은 20.73∼31.54%로 나타났다. 세균과 S.cerevisiae에는 없고 고세균 수준에서만 공통적인 265개 COG의 조성은 유전정보의 보존과 처리에 관여하는 COG가 94개 (35.5%)이고 대사에 관여하는 COG가 82개 (30.9%)로 유전정보와 물질대사와 관여하는 COG의 보존성이 높은 것으로 나타나 고세균이 독특한 생명체계를 이루고 있는 것으로 사료되었다. Euryarchaeota를 Crenarchaeota와 비교하면 핵산대사에서는 상당한 차이를 보이며 유전정보의 저장과 처리에서는 큰 차이가 없는 것으로 판단되었다. 해양성 Euryarchaeota의 보존적 COG는 기능분류별 종류가 육지성 Euryarchaeota와 달랐고 물질대사 관련 COG의 경우 육지성이 해양성보다 다양한 것을 알 수 있었다. 그리고 육지성과 해양성 Euryarchaeota는 탄수화물대사 등을 비롯한 생리적 측면에서 서로 차이가 있을 가능성이 높을 것으로 사료되었다. 본 연구는 해양 극한미생물인 해양성 Euryarchaeota의 기원과 분류단계에 따른 보존적 유전자를 파악하는데 도움을 줄뿐만 아니라 향후 해양미생물 등의 유용유전자 탐색 등에서도 Manco (Arch. Biochem. Biophy. 373, 182 (2000)) 등의 보고와 같이 충분한 연구가치가 있는 것으로 사료되었다.

범주형 자료를 포함한 다형질 임계개체모형에서 유전능력 추정 알고리즘 (Computing Algorithm for Genetic Evaluations on Several Linear and Categorical Traits in A Multivariate Threshold Animal Model)

  • 이득환
    • Journal of Animal Science and Technology
    • /
    • 제46권2호
    • /
    • pp.137-144
    • /
    • 2004
  • 불연속 범주형 자료에 대한 잠재변수가 존재한다는 가정하에 임계값을 추정하고 잠재변수를 생성하며 생성된 잠재변수 및 기타 연속변량에 대한 관측치를 포함하는 다변량 임계개체모형을 설정하고 유전능력을 예측하기 위한 방법을 제시하였다. 각각의 범주형 조사 자료의 특성을 갖는 형질에 있어서 임계점의 추정은 추정 가능한 임계점에 대한 1차 미분값(gradient)과 2차 미분값(Hessian)을 이용한 Newton 방법을 이용하면 추정가능하며 지역모수인 육종가의 추정은 PCG 방법으로 구현 가능하다. 이러한 이론은 Quaas(2001)가 제시한 하나의 이산형 자료와 하나의 연속형 자료의 2변량 동시 분석방법을 확장하여 전개한 것이며 이때 잠재변수 및 임계점의 추정은 기타 형질의 잔차 회귀계수 및 상관을 고려해야 한다. 본 연구를 위한 모의실험은 2개의 연속변량으로 체중과 유량을 고려하였고 또 다른 2개의 불연속 변량인 분만난이도와 출생시 생존유무를 고려하여 4형질 동시 분석을 실시하였다. 임계모형에 의한 육종가 추정치의 정확도는 4개의 구간으로 분류되어 기록된 분만난이도의 경우에 91${\sim}$92%의 정확도를 보였고 이항분포인 분만시 생존유무에 대하여는 87~89%의 정확도를 보였다. 반면에 이들 범주형 자료를 선형으로 간주하고 분석한 선형 동물개체 혼합모형에서는 72${\sim}$84% 및 59${\sim}$70%으로 비교적 낮은 추정의 정확도를 보였다. 따라서 범주형 자료의 유전분석은 선형 혼합모형 보다 임계형 혼합모형이 크게 타당할 것으로 사료되었다.

근 실시간 조건을 달성하기 위한 효과적 속성 선택 기법 기반의 고성능 하이브리드 침입 탐지 시스템 (Efficient Feature Selection Based Near Real-Time Hybrid Intrusion Detection System)

  • 이우솔;오상윤
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제5권12호
    • /
    • pp.471-480
    • /
    • 2016
  • 최근 국가 기반 시스템, 국방 및 안보 시스템 등에 대한 사이버 공격의 피해 규모가 점차 커지고 있으며, 군에서도 사이버전에 대한 중요성을 인식하고 전 평시 구분 없이 대비하고 있다. 이에 네트워크 보안에서 탐지와 대응에 핵심적인 역할을 하는 침입 탐지 시스템의 중요성이 증대되고 있다. 침입 탐지 시스템은 탐지 방법에 따라 오용 탐지, 이상 탐지 방식으로 나뉘는데, 근래에는 두 가지 방식을 혼합 적용한 하이브리드 침입 탐지 방식에 대한 연구가 진행 중이다. 그렇지만 기존 연구들은 높은 계산량이 요구된다는 점에서 근 실시간 네트워크 환경에 부적합하다는 문제점이 있었다. 본 논문에서는 기존의 하이브리드 침입 탐지 시스템의 성능 문제를 보완할 수 있는 효과적인 속성 선택 기법을 적용한 의사 결정 트리와 가중 K-평균 알고리즘 기반의 고성능 하이브리드 침입 탐지 시스템을 제안하였다. 상호 정보량과 유전자 알고리즘 기반의 속성 선택 기법을 적용하여 침입을 더 빠르고 효율적으로 탐지할 수 있으며, 오용 탐지 모델과 이상 탐지 모델을 위계적으로 결합하여 구조적으로 고도화된 하이브리드 침입 탐지 시스템을 제안하였다. 실험을 통해 제안한 하이브리드 침입 탐지 시스템은 98.68%로 높은 탐지율을 보장함과 동시에, 속성 선택 기법을 적용하여 고성능 침입 탐지를 수행할 수 있음을 검증하였다.

결빙 증식 최소화를 위한 다중 익형 형상 최적설계 (Design Optimization of Multi-element Airfoil Shapes to Minimize Ice Accretion)

  • 강민제;이혁진;조현승;명노신;이학진
    • 한국항공우주학회지
    • /
    • 제50권7호
    • /
    • pp.445-454
    • /
    • 2022
  • 항공기가 빙점 이하의 습도가 높은 구름대를 지날 때 액적이 항공기와 충돌하면 날개, 동체 등 항공기 구성품에 결빙이 발생한다. 특히 항공기의 날개에 결빙이 증식되면 공력 성능의 저하와 비행 안정성의 감소 등의 치명적인 안전 문제를 초래할 수 있다. 본 연구에서는 항공기 날개에 적용되는 고양력 장치인 다중 익형의 결빙 증식량이 최소가 되도록 형상 최적설계를 수행하였다. 3차원 Reynolds-Averaged Navier-Stokes 지배 방정식을 이용하여 공력해석을 수행하였고, 다물리 전산해석을 통해 결빙의 형상 및 증식량을 예측하였다. 최적설계의 목적함수는 결빙 증식량 최소화로 설정하였고, 설계변수는 Slat과 Flap의 전개 각도와 위치를 정의하는 형상 변수 6개를 선정하였다. 설계 과정에서 목적함수의 평가는 크리깅 근사모델을 사용하여 대체하였고 유전자 알고리즘을 적용하여 최적 형상을 도출하였다. 최적화를 수행한 결과, Slat과 Flap에 최적의 전개 각도와 위치를 적용하였을 때 결빙 증식량이 약 8% 감소하였다.

첨두유출량 저감을 위한 도시유역 경계 및 우수관망 최적 설계 (Optimal Designs of Urban Watershed Boundary and Sewer Networks to Reduce Peak Outflows)

  • 이정호;전환돈;김중훈
    • 한국방재학회 논문집
    • /
    • 제11권2호
    • /
    • pp.157-161
    • /
    • 2011
  • 자연유역에서의 유역 분할에 관한 많은 연구가 진행되어왔음에도 불구하고, 도시유역에서의 유역 분할에 관한 연구는 이루어져있지 않다. 도시유역간의 경계 구분에 있어서 두 개의 유역 사이에 어떤 자연적 경계 또는 행정적 경계가 존재하지 않아 그 구분이 모호한 경우, 각기 다른 유출구를 갖는 우수관망에 의한 도시유역간의 경계는 오직 우수관거시스템의 설계자에 의하여 결정된다. 본 연구에서 제안된 UWDM(Urban Watershed Division Model)은 각 유역의 유출구에서의 첨두유출량을 동시에 감소시키기 위한 유역경계를 결정하게 된다. 이때, UWDM은 복수의 관거 연결 방향을 갖는 맨홀간 연결 방향을 결정함으로써 우수관거 유출구에서의 첨두 유출량을 저감시키기 위한 우수관망을 결정한다. UWDM을 통한 우수관망의 변경은 관거 내 유출 수문곡선의 중첩효과를 변화시키기 때문에, 최적화된 우수관망에서의 수문곡선은 그 중첩효과가 감소된 만큼 유출구에서의 첨두 유출량을 감소시킬 수 있다. 따라서 UWDM은 유역 경계상에서의 맨홀간 관거의 연결 방향을 유전자알고리즘을 이용하여 결정함으로써 인접한 도시유역간의 경계를 최적화할 수 있다. 본 연구에서 제안된 모형은 서울의 50.3 ha의 각기 다른 유출구를 갖는 인접한 두 개의 도시유역에 적용되었으며, 이 모형의 유역 구분에 의하여 두 개의 우수관망 유출구에서의 첨두유출량은 약 22% 감소하는 결과를 나타냈다. 자연유역에서의 유역 분할에 관한 많은 연구가 진행되어왔음에도 불구하고, 도시유역에서의 유역 분할에 관한 연구는 이루어져있지 않다. 도시유역간의 경계 구분에 있어서 두 개의 유역 사이에 어떤 자연적 경계 또는 행정적 경계가 존재하지 않아 그 구분이 모호한 경우, 각기 다른 유출구를 갖는 우수관망에 의한 도시유역간의 경계는 오직 우수관거시스템의 설계자에 의하여 결정된다. 본 연구에서 제안된 UWDM(Urban Watershed Division Model)은 각 유역의 유출구에서의 첨두유출량을 동시에 감소시키기 위한 유역경계를 결정하게 된다. 이때, UWDM은 복수의 관거 연결 방향을 갖는 맨홀간 연결 방향을 결정함으로써 우수관거 유출구에서의 첨두 유출량을 저감시키기 위한 우수관망을 결정한다. UWDM을 통한 우수관망의 변경은 관거 내 유출 수문곡선의 중첩효과를 변화시키기 때문에, 최적화된 우수관망에서의 수문곡선은 그 중첩효과가 감소된 만큼 유출구에서의 첨두 유출량을 감소시킬 수 있다. 따라서 UWDM은 유역 경계상에서의 맨홀간 관거의 연결 방향을 유전자알고리즘을 이용하여 결정함으로써 인접한 도시유역간의 경계를 최적화할 수 있다. 본 연구에서 제안된 모형은 서울의 50.3 ha의 각기 다른 유출구를 갖는 인접한 두 개의 도시유역에 적용되었으며, 이 모형의 유역 구분에 의하여 두 개의 우수관망 유출구에서의 첨두유출량은 약 22% 감소하는 결과를 나타냈다.

비용효율적 지능형 침입탐지시스템 구현을 위한 유전자 알고리즘 기반 통합 모형 (An Integrated Model based on Genetic Algorithms for Implementing Cost-Effective Intelligent Intrusion Detection Systems)

  • 이현욱;김지훈;안현철
    • 지능정보연구
    • /
    • 제18권1호
    • /
    • pp.125-141
    • /
    • 2012
  • 본 연구는 최근 그 중요성이 한층 높아지고 있는 침입탐지시스템(IDS, Intrusion Detection System)의 침입탐지모형을 개선하기 위한 방안으로 유전자 알고리즘에 기반한 새로운 통합모형을 제시한다. 본 연구의 제안모형은 서로 상호보완적 관계에 있는 이분류 모형인 로지스틱 회귀분석(LOGIT, Logistic Regression), 의사결정나무(DT, Decision Tree), 인공신경망 (ANN, Artificial Neural Network), 그리고 SVM(Support Vector Machine)의 예측결과에 적절한 가중치를 부여해 최종 예측결과를 산출하도록 하였는데, 이 때 최적 가중치의 탐색을 위한 방법으로는 유전자 알고리즘을 사용한다. 아울러, 본 연구에서는 1차적으로 오탐지율을 최소화하는 최적의 모형을 산출한 뒤, 이어 비대칭 오류비용 개념을 반영해 오탐지로 인해 발생할 수 있는 전체 비용을 최소화할 수 있는 최적 임계치를 탐색, 최종적으로 가장 비용 효율적인 침입탐지모형을 도출하고자 하였다. 본 연구에서는 제안모형의 우수성을 확인하기 위해, 국내 한 공공기관의 보안센서로부터 수집된 로그 데이터를 바탕으로 실증 분석을 수행하였다. 그 결과, 본 연구에서 제안한 유전자 알고리즘 기반 통합모형이 인공신경망이나 SVM만으로 구성된 단일모형에 비해 학습용과 검증용 데이터셋 모두에서 더 우수한 탐지율을 보임을 확인할 수 있었다. 비대칭 오류비용을 고려한 전체 비용의 관점에서도 단일모형으로 된 비교모형에 비해 본 연구의 제안모형이 더 낮은 비용을 나타냄을 확인할 수 있었다. 이렇게 실증적으로 그 효과가 검증된 본 연구의 제안 모형은 앞으로 보다 지능화된 침입탐지시스템을 개발하는데 유용하게 활용될 수 있을 것으로 기대된다.

부도예측을 위한 KNN 앙상블 모형의 동시 최적화 (Investigating Dynamic Mutation Process of Issues Using Unstructured Text Analysis)

  • 민성환
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.139-157
    • /
    • 2016
  • 앙상블 분류기란 개별 분류기보다 더 좋은 성과를 내기 위해 다수의 분류기를 결합하는 것을 의미한다. 이와 같은 앙상블 분류기는 단일 분류기의 일반화 성능을 향상시키는데 매우 유용한 것으로 알려져 있다. 랜덤 서브스페이스 앙상블 기법은 각각의 기저 분류기들을 위해 원 입력 변수 집합으로부터 랜덤하게 입력 변수 집합을 선택하며 이를 통해 기저 분류기들을 다양화 시키는 기법이다. k-최근접 이웃(KNN: k nearest neighbor)을 기저 분류기로 하는 랜덤 서브스페이스 앙상블 모형의 성과는 단일 모형의 성과를 개선시키는 데 효과적인 것으로 알려져 있으며, 이와 같은 랜덤 서브스페이스 앙상블의 성과는 각 기저 분류기를 위해 랜덤하게 선택된 입력 변수 집합과 KNN의 파라미터 k의 값이 중요한 영향을 미친다. 하지만, 단일 모형을 위한 k의 최적 선택이나 단일 모형을 위한 입력 변수 집합의 최적 선택에 관한 연구는 있었지만 KNN을 기저 분류기로 하는 앙상블 모형에서 이들의 최적화와 관련된 연구는 없는 것이 현실이다. 이에 본 연구에서는 KNN을 기저 분류기로 하는 앙상블 모형의 성과 개선을 위해 각 기저 분류기들의 k 파라미터 값과 입력 변수 집합을 동시에 최적화하는 새로운 형태의 앙상블 모형을 제안하였다. 본 논문에서 제안한 방법은 앙상블을 구성하게 될 각각의 KNN 기저 분류기들에 대해 최적의 앙상블 성과가 나올 수 있도록 각각의 기저 분류기가 사용할 파라미터 k의 값과 입력 변수를 유전자 알고리즘을 이용해 탐색하였다. 제안한 모형의 검증을 위해 국내 기업의 부도 예측 관련 데이터를 가지고 다양한 실험을 하였으며, 실험 결과 제안한 모형이 기존의 앙상블 모형보다 기저 분류기의 다양화와 예측 성과 개선에 효과적임을 알 수 있었다.

오차 계산 방식에 따른 사료용 벼 품종의 품종모수 추정치 불확도 비교 (Comparison between Uncertainties of Cultivar Parameter Estimates Obtained Using Error Calculation Methods for Forage Rice Cultivars)

  • 조영상;현신우;김광수
    • 한국농림기상학회지
    • /
    • 제25권3호
    • /
    • pp.129-141
    • /
    • 2023
  • 작물 모형은 작물의 유전적 특성을 나타내는 품종모수를 요구하며, 품종모수는 작물의 개별 품종별로 추정되어야 한다. 품종모수의 추정에는 고품질의 많은 생육 자료가 요구되지만, 자료의 생산에 상당한 비용이 필요하다. 비교적 낮은 품질의 가용성이 높은 자료를 활용하는 대신, 대량의 랜덤 모수를 생성하고 이를 평가하여 품종모수를 추정할 수 있다. 본 연구에서는 SIMPLE 작물 모델의 불확도를 최소화하기 위해 품종모수 추정 방식을 비교하고, 두 앙상블 방식과 대한 비교를 하였다. 모수 추정을 위한 Metropolis-Hastings (MH) 알고리즘에 대한 목적함수로 로그 가능도(log-likelihood: LL)와 generic composite similarity measure (GCSM)를 사용하였다. 또한 품종모수의 평균값을 사용한 예측(Epm)과 개별 모수들로부터 얻어진 추정값의 평균값(Eem)의 일치도를 분석하여 앙상블 방식에 따른 불확도 변화를 파악하였다. 국내에서 재배되는 사료용 벼 품종인 조우 벼와 영우 벼를 대상으로 품종모수를 추정하였다. 2013년, 2014년, 2016년에 대한 수원, 전주, 나주, 익산에 위치한 실험포장에서 얻은 수량 관측 자료를 사용하였다. 또한 2016년부터 2018년까지 수원에서 보고된 별도의 수량 관측 자료를 사용하였다. 목적함수에 따라 추정된 품종모수의 분포에 차이가 있었다. LL을 통해 얻은 품종모수는 GCSM으로 얻은 품종모수보다 좁은 범위에 분포하였다. 두 가지 앙상블 접근법은 통계적으로 유의한 차이가 나타나지 않음을 확인하였다. GCSM의 상대적으로 높은 불확도는 수용확률을 조정하여 낮출 수 있다고 사료되고, Epm의 결과는 기존과 다른 앙상블 방식을 통해 적은 연산을 통해 불확도를 낮출 수 있음을 보인다.

하수관거시스템 개량 우선순위 결정 모형 (Rehabilitation Priority Decision Model for Sewer Systems)

  • 이정호;박무종;김중훈
    • 한국방재학회 논문집
    • /
    • 제8권6호
    • /
    • pp.7-14
    • /
    • 2008
  • 하수관거시스템 개량의 주된 목적은 불명수(Inflow/Infiltration, I/I)를 제거함으로써 그 성능을 향상시키는데 있다. 이때 전체 하수관거시스템 내에서 개개 관거별 I/I 발생량을 정량화할 수 있다면, 전체 하수관거시스템 내에서 소유역별 해당 정보의 추출이 보다 명확해질 수 있다. 그러나 실제 현장에서는 예산 및 시간의 제약 때문에 개개 관거의 I/I 발생 정보의 획득은 거의 불가능하다. 본 연구에서는 하수 관거별 I/I 발생량을 AHP(Analytic Hierarch Process)를 이용하여 정량화하였으며, 산정된 관거별 I/I 발생량을 이용하여 효율적인 하수과거 개량 사업 시행을 위한 개량 우선순위 결정 모형(Rehabiliation Priority Decision Model for sewer system, RPDM)을 개발하였다. 개개 관거별 I/I 발생량 산정 결과에 기반하여 RPDM은 개량이 시행되는 기간 동안 발생하는 I/I 발생량을 최소화하는 소유역별 최적 개량 우선순위(Optimal Rehabilitation Priority, ORP)를 유전자 알고리즘을 이용하여 결정한다. 이때 최적 개량 우선순위에 따른 소유역별 개량 시행 시 발생하는 이익은 개량 기간 동안 하수처리장으로 들어가는 I/I의 하수처리비용(Waste Water Treatment Cost, WWTC)에 대한 절감을 의미한다. 본 연구에서는 개발된 RPDM에 의한 최적 개량 우선순위의 결과는 일반적인 하수관거 개량사업의 우선순위 결정 방법인 점수가중평가법(Numerical Weighting Method, NWM)과 최악의 개량순서에 따른 결과들과 비교되었으며, 개량 기간 동안의 I/I 처리비용이 점수가중평가법에 비하여 22%, 최악의 개량순서에 비하여 40% 감소하는 것으로 나타났다.

젖소집단의 산차에 따른 체세포점수의 환경효과 및 분산성분 추정 (Estimation of Variance Component and Environment Effects on Somatic Cell Scores by Parity in Dairy Cattle)

  • 조광현;나승환;서강석;김시동;박병호;이영창;박종대;손삼규;최재관
    • Journal of Animal Science and Technology
    • /
    • 제48권1호
    • /
    • pp.39-48
    • /
    • 2006
  • 본 연구는 1999년 1월부터 2004년 12월까지의 체세포점수의 검정일 자료를 이용하여 124,635개의 초산자료와 134,308개의 2산자료, 37,412개의 3산자료, 41787개의 4산자료, 37412개의 5산 자료를 이용하였다. 분석에 사용된 방법은 체세포 점수에 영향을 미치는 분만연도, 연령, 비유단계, 산차, 계절의 효과를 추정하기 위하여 GLM을 이용하여 최소자승법으로 분석하였으며, 검정일 모형을 이용한 분산성분 추정은 EM-REML 분석방법을 전산 프로그램한 REMLF90을 이용하였다. 각 산차별로 연령에 대한 효과는 연령이 낮은 군에서 체세포 점수가 낮게 나타났으며, 연령이 높은 군에서는 다소 높게 나타났다. 비유단계별 효과는 1산과 2산에서는 비유초기에서 체세포 점수가 낮게 나타났으며 비유말기에 3.151, 3.696로 높은 체세포 점수를 나타났으나, 3산, 4산, 5산에서는 비유중기에 높은 체세포 점수를 나타내었으며, 대체로 피크기에 체세포 점수가 높게 나타나는데 4산과 5산에서는 비유말기에 체세포 점수가 낮게 나타났다. 분만계절별 환경효과는 1산~5산 모두 대체로 9~11월에 체세포 점수가 낮게 나타났으며, 대체로 유량이 낮게 추정되는 6~8월 사이에는 체세포 점수가 대체로 높게 나타났다. 각 산차별 유전력은 1산에서 5산까지 각각 0.05, 0.09, 0.10, 0.05, 0.05를 나타냈으며, 유전분산값은 비유초기의 경우 2, 3, 5산에서 높게 나타났으며, 1산과 4산의 경우는 대체로 낮게 추정되었다.