• 제목/요약/키워드: Optimal clustering

검색결과 363건 처리시간 0.027초

코시 군집 과정을 이용한 산사태 자료 분석 (Analyzing landslide data using Cauchy cluster process)

  • 이기세;김정환;박노욱;이우주
    • 응용통계연구
    • /
    • 제29권2호
    • /
    • pp.345-354
    • /
    • 2016
  • 산사태 자료에서 환경변수들이 산사태 발생 위험에 어떻게 영향을 주는지 분석하기 위해 현재까지 비동질적 포아송 과정 모형이 주로 사용되어 왔다. 그렇지만, 이 모형은 산사태 자료에서 쉽게 관측되는 산사태 위치의 군집 현상에 대해 설명하지 못한다. 이러한 한계점을 극복하기 위해 우리는 코시 군집 과정을 사용할 것을 제안한다. 그리고, 제안된 방법이 실제 산사태 자료에서 얼마나 모형의 적합도를 개선시키는지 K-함수의 관점에서 살펴보고자 한다. 또한, 코시 군집 과정의 모수 추론을 위해 제안된 다양한 추정 방법의 성능을 비교하기 위해 시뮬레이션 연구를 진행하였다.

유전자 재배열을 이용한 유전자 알고리즘의 성능향상 (Improving the Performance of Genetic Algorithms using Gene Reordering)

  • 황인재
    • 융합신호처리학회논문지
    • /
    • 제7권4호
    • /
    • pp.201-206
    • /
    • 2006
  • 유전자 알고리즘은 공학 분야에서 필요한 여러 가지 최적화 문제에 대하여 최적에 가까운 해를 제공해주는 반복적 알고리즘으로 알려져 있다. 본 논문에서는 특정 교배방법에서 유전자의 배열순서가 적합도가 높은 스키마의 길이에 미치는 영향을 고찰하였다. 또한 이에 따른 유전자 알고리즘의 성능 변화를 두 개의 예제를 이용한 실험을 통하여 관찰하였다. 예제로 사용된 그래프 분할과 knapsack 문제를 위해 몇 가지 유전자 재배열 방법을 제시하였다. 실험결과에 따르면 유전자 재배열 방법마다 서로 다른 유전자 알고리즘 성능을 보여주었으며, 적합도가 높은 스키마의 길이를 고려한 재배열 방법이 재배열을 하지 않았을 때 보다 유전자 알고리즘의 성능을 향상시켜 주는 것을 관찰하였다. 따라서 주어진 문제에 적합한 유전자 재배열 방법을 찾는 것이 대단히 중요함을 확인하였다.

  • PDF

앙상블모형을 이용한 공백기술예측 (Vacant Technology Forecasting using Ensemble Model)

  • 전성해
    • 한국지능시스템학회논문지
    • /
    • 제21권3호
    • /
    • pp.341-346
    • /
    • 2011
  • 공백기술예측은 기술경영 분야에서 중요하게 다루어지는 주제이다. 다양한 분야에서 현재까지의 기술개발결과를 분석하여 상대적으로 연구개발이 이루어지지 못한 분야를 찾아내어 개발하는 것은 국가와 기업의 발전에 중요한 영향을 미친다. 현재 특허는 기술개발결과에 대한 가장 객관적인 데이터 중 하나이다. 본 논문에서는 특허데이터를 이용하여 공백기술을 정량적으로 예측할 수 있는 방법에 대하여 연구한다. 하나의 정량적 기술예측모형이 완벽하다는 보장을 할 수 없기 때문에 본 연구에서는 여러 가지 모형들의 결과를 결합하여 예측하는 앙상블모형을 제안한다. 통계적 분석기법과 기계학습 알고리즘을 결합하여 보다 객관적이고 정확한 공백기술예측모형을 구축한다. 제안방법의 객관적인 성능평가를 위하여 각 기술분야에 대하여 최초 특허가 이루어진 시점부터 최근까지 출원, 등록된 특허데이터를 이용한다.

회로 분할을 위한 어댑티드 유전자 알고리즘 연구 (A Study of Adapted Genetic Algorithm for Circuit Partitioning)

  • 송호정;김현기
    • 한국콘텐츠학회논문지
    • /
    • 제21권7호
    • /
    • pp.164-170
    • /
    • 2021
  • VLSI 설계에서의 분할(partitioning)은 기능의 최적화를 위하여 설계하고자 하는 회로의 그룹화(grouping)하는 단계로서 레이아웃(layout)에서 면적과 전파지연의 최소화를 위해 함께 배치할 소자를 결정하는 문제이다. 이러한 분할 문제에서 해를 얻기 위해 사용되는 알고리즘은 Kernighan-Lin 알고리즘, Fiduccia Mattheyses heuristic, 시뮬레이티드 어닐링, 유전자 알고리즘 등의 방식이 이용된다. 본 논문에서는 회로 분할 문제에 대하여 유전자 알고리즘과 확률 진화 알고리즘을 결합한 어댑티드 유전자 알고리즘을 이용한 해 공간 탐색(solution space search) 방식을 제안하였으며, 제안한 방식을 유전자 알고리즘 및 시뮬레이티드 어닐링 방식과 비교, 분석하였고, 어댑티드 유전자 알고리즘이 시뮬레이티드 어닐링 및 유전자 알고리즘보다 더 효과적으로 최적해에 근접하는 것을 알 수 있었다.

제조공정 단말PC 작업자 접속 로그를 통한 이상 징후 탐지 모델 연구 (A Study on Anomaly Detection Model using Worker Access Log in Manufacturing Terminal PC)

  • 안종성;이경호
    • 정보보호학회논문지
    • /
    • 제29권2호
    • /
    • pp.321-330
    • /
    • 2019
  • 기업에서 내부자에 의한 기업 기밀 유출 방지는 기업의 생존을 위한 필수 과제이다. 내부자에 의한 정보유출 사고를 막기 위해 기업에서는 보안 솔류션을 도입하여 적용하고 있으나 접근 권한이 있는 내부자의 이상행위를 효과적으로 탐지하는 데에는 한계가 있다. 이번 연구에서는 기업의 제품 제조 이력, 품질 정보 등을 담고 있는 제조정보시스템의 작업자 작업화면 접근 로그 데이타를 기계학습 기법의 비지도학습 알고리즘을 활용하여 정상적인 접근 로그와 비정상적인 접근 로그를 효과적으로 군집화하는 방법을 연구하여 이상징후 탐지를 위한 최적화된 속성 선택 모델을 제시하고자 한다.

A Implementation of Optimal Multiple Classification System using Data Mining for Genome Analysis

  • Jeong, Yu-Jeong;Choi, Gwang-Mi
    • 한국컴퓨터정보학회논문지
    • /
    • 제23권12호
    • /
    • pp.43-48
    • /
    • 2018
  • In this paper, more efficient classification result could be obtained by applying the combination of the Hidden Markov Model and SVM Model to HMSV algorithm gene expression data which simulated the stochastic flow of gene data and clustering it. In this paper, we verified the HMSV algorithm that combines independently learned algorithms. To prove that this paper is superior to other papers, we tested the sensitivity and specificity of the most commonly used classification criteria. As a result, the K-means is 71% and the SOM is 68%. The proposed HMSV algorithm is 85%. These results are stable and high. It can be seen that this is better classified than using a general classification algorithm. The algorithm proposed in this paper is a stochastic modeling of the generation process of the characteristics included in the signal, and a good recognition rate can be obtained with a small amount of calculation, so it will be useful to study the relationship with diseases by showing fast and effective performance improvement with an algorithm that clusters nodes by simulating the stochastic flow of Gene Data through data mining of BigData.

Population structure analysis of Yeonsan Ogye using microsatellite markers

  • Cho, Sung Hyun;Lee, Seung-Sook;Manjula, Prabuddha;Kim, Minjun;Lee, Seung Hwan;Lee, Jun Heon;Seo, Dongwon
    • Journal of Animal Science and Technology
    • /
    • 제62권6호
    • /
    • pp.790-800
    • /
    • 2020
  • The Yeonsan Ogye (YO) chicken is a natural heritage of Korea, characterized by black feathers, skin, bones, eyes, and comb. The purebred of YO population has been reared under the natural mating system with no systematic selection and breeding plan. The purpose of this study was to identify the genetic diversity and find the optimal number of population sub-division using 12 polymorphic microsatellite (MS) markers to construct a pedigree-based breeding plan for the YO population. A total of 509 YO birds were used for this study. Genetic diversity and population structure analysis were conducted based on the MS marker genotype information. The overall average polymorphic information content value and expected heterozygosity of the population were 0.586, and 0.642, respectively. The K-mean cluster analysis based on the genetic distance result confirmed that the current YO population can be divided into three ancestry groups. Individuals in each group were evaluated based on their genetic distance to identify the potential candidates for a future breeding plan. This study concludes that a future breeding plan with known pedigree information of selected founder animals, which holds high genetic diversity, could be the best strategy to ensure the conservation of the Korean YO chicken population.

인공신경망과 대기부식환경 모니터링 데이터를 이용한 항공기 세척주기 결정 알고리즘 (Algorithm for Determining Aircraft Washing Intervals Using Atmospheric Corrosion Monitoring of Airbase Data and an Artificial Neural Network)

  • 권혁준;이두열
    • Corrosion Science and Technology
    • /
    • 제22권5호
    • /
    • pp.377-386
    • /
    • 2023
  • Aircraft washing is performed periodically for corrosion control. Currently, the aircraft washing interval is qualitatively set according to the geographical conditions of each base. We developed a washing interval determination algorithm based on atmospheric corrosion environment monitoring data at the Republic of Korea Air Force (ROKAF) bases and United States Air Force (USAF) bases to determine the optimal interval. The main factors of the washing interval decision algorithm were identified through hierarchical clustering, sensitivity analysis, and analysis of variance, and criteria were derived. To improve the classification accuracy, we developed a washing interval decision model based on an artificial neural network (ANN). The ANN model was calibrated and validated using the atmospheric corrosion environment monitoring data and washing intervals of the USAF bases. The new algorithm returned a three-level washing interval, depending on the corrosion rate of steel and the results of the ANN model. A new base-specific aircraft washing interval was proposed by inputting the atmospheric corrosion environment monitoring results of the ROKAF bases into the algorithm.

L 및 LH-모멘트법과 지역빈도분석에 의한 가뭄우량의 추정 (II)- LH-모멘트법을 중심으로 - (Estimation of Drought Rainfall by Regional Frequency Analysis Using L and LH-Moments (II) - On the method of LH-moments -)

  • 이순혁;윤성수;맹승진;류경식;주호길;박진선
    • 한국농공학회논문집
    • /
    • 제46권5호
    • /
    • pp.27-39
    • /
    • 2004
  • In the first part of this study, five homogeneous regions in view of topographical and geographically homogeneous aspects except Jeju and Ulreung islands in Korea were accomplished by K-means clustering method. A total of 57 rain gauges were used for the regional frequency analysis with minimum rainfall series for the consecutive durations. Generalized Extreme Value distribution was confirmed as an optimal one among applied distributions. Drought rainfalls following the return periods were estimated by at-site and regional frequency analysis using L-moments method. It was confirmed that the design drought rainfalls estimated by the regional frequency analysis were shown to be more appropriate than those by the at-site frequency analysis. In the second part of this study, LH-moment ratio diagram and the Kolmogorov-Smirnov test on the Gumbel (GUM), Generalized Extreme Value (GEV), Generalized Logistic (GLO) and Generalized Pareto (GPA) distributions were accomplished to get optimal probability distribution. Design drought rainfalls were estimated by both at-site and regional frequency analysis using LH-moments and GEV distribution, which was confirmed as an optimal one among applied distributions. Design rainfalls were estimated by at-site and regional frequency analysis using LH-moments, the observed and simulated data resulted from Monte Carlotechniques. Design drought rainfalls derived by regional frequency analysis using L1, L2, L3 and L4-moments (LH-moments) method have shown higher reliability than those of at-site frequency analysis in view of RRMSE (Relative Root-Mean-Square Error), RBIAS (Relative Bias) and RR (Relative Reduction) for the estimated design drought rainfalls. Relative efficiency were calculated for the judgment of relative merits and demerits for the design drought rainfalls derived by regional frequency analysis using L-moments and L1, L2, L3 and L4-moments applied in the first report and second report of this study, respectively. Consequently, design drought rainfalls derived by regional frequency analysis using L-moments were shown as more reliable than those using LH-moments. Finally, design drought rainfalls for the classified five homogeneous regions following the various consecutive durations were derived by regional frequency analysis using L-moments, which was confirmed as a more reliable method through this study. Maps for the design drought rainfalls for the classified five homogeneous regions following the various consecutive durations were accomplished by the method of inverse distance weight and Arc-View, which is one of GIS techniques.

SOFM 신경회로망을 이용한 한국어 음소 인식 (Korean Phoneme Recognition Using Self-Organizing Feature Map)

  • 전용구;양진우;김순협
    • 한국음향학회지
    • /
    • 제14권2호
    • /
    • pp.101-112
    • /
    • 1995
  • 본 논문에서는 패턴 매칭 방법에 근거하여 인식 단위가 음소인 음소 기반 인식 시스템을 구성하였다. 선택한 신경망 구조는 생물학적 신경망인 코호넨(T. Kohonen)의 SOFM(Self-Organizing Feature Map)으로 패턴 매칭 과정 중 클러스터러(clusterer)로 사용하였다. SOFM 신경망은 신호 공간에 대해서 최적의 국소(局所) 해부적 사상(local topographical mapping)에 의한 자기 조직화 과정을 수행하며, 그 결과 인식 문제에 있어서 상당히 높은 정확도를 나타낸다. 따라서 SOFM 신경망은 음소 인식에도 효과적으로 응용될 수 있다. 또한 음소 인식 시스템의 성능 향상을 위해 K-means클러스터링 알고리즘이 결합된 학습 알고리즘을 제안하였다. 제안된 음소 인식 시스템의 성능을 평가하기 위해 먼저, 인식 대상음소는 모음군 17개, 자음의 경우 파열음9개, 마찰음 3개, 파찰음 3개, 유음 및 비음 4개, 음소의 성질이 다른 종성 7개의 음소군으로 모두 43개의 음소를 대상으로 실험하였으며, 각 음소군에 대한 특징 지도를 구성하여 레이블러(labeler)의 기능을 수행하게 하였다. 화자 종속 인식 실험 결과 $87.2\%$의 인식률을 보였으며 제안한 학습법의 빠른 수렴성과 인식률 향상을 확인하였다.

  • PDF