• 제목/요약/키워드: Machine learning algorithm

검색결과 1,482건 처리시간 0.026초

차분 진화 알고리즘을 이용한 Fuzzy Prototype Classifier 최적화 (The Optimization of Fuzzy Prototype Classifier by using Differential Evolutionary Algorithm)

  • 안태천;노석범;김용수
    • 한국지능시스템학회논문지
    • /
    • 제24권2호
    • /
    • pp.161-165
    • /
    • 2014
  • 본 논문에서는 입력 공간의 부분 영역의 특성을 기술하기 위하여 각 부분 영역을 대표하는 prototype을 정의하고 정의된 Prototype 에 가중치를 적용하여 각 부분 영역이 각 클래스의 경계면에 미치는 영향을 차등화 하는 Fuzzy Prototype 분류기를 제안 한다. 제안된 패턴 분류기의 Prototype은 퍼지 클러스터링 알고리즘인 Fuzzy C-Means Clustering 알고리즘을 사용하여 결정한다. 또한, 각 부분 영역의 가중치를 결정하기 위하여 유전자 알고리즘에서 파생된 차분 진화 알고리즘을 적용하여 각각의 퍼지 규칙의 가중치를 최적화 한다. 또한 퍼지 규칙 기반 시스템 기반 패턴 분류기의 경우 각각의 퍼지 규칙의 후반부 구조인 다항식의 계수를 추정하기 위하여 Linear Discriminant Analysis를 사용한다. 마지막으로, 본 논문에서 제안한 패턴 분류기의 패턴 분류 특성 및 성능을 평가하기위하여 기계 학습 데이터를 사용한다.

빠른 클러스터 개수 선정을 통한 효율적인 데이터 클러스터링 방법 (Efficient Data Clustering using Fast Choice for Number of Clusters)

  • 김성수;강범수
    • 산업경영시스템학회지
    • /
    • 제41권2호
    • /
    • pp.1-8
    • /
    • 2018
  • K-means algorithm is one of the most popular and widely used clustering method because it is easy to implement and very efficient. However, this method has the limitation to be used with fixed number of clusters because of only considering the intra-cluster distance to evaluate the data clustering solutions. Silhouette is useful and stable valid index to decide the data clustering solution with number of clusters to consider the intra and inter cluster distance for unsupervised data. However, this valid index has high computational burden because of considering quality measure for each data object. The objective of this paper is to propose the fast and simple speed-up method to overcome this limitation to use silhouette for the effective large-scale data clustering. In the first step, the proposed method calculates and saves the distance for each data once. In the second step, this distance matrix is used to calculate the relative distance rate ($V_j$) of each data j and this rate is used to choose the suitable number of clusters without much computation time. In the third step, the proposed efficient heuristic algorithm (Group search optimization, GSO, in this paper) can search the global optimum with saving computational capacity with good initial solutions using $V_j$ probabilistically for the data clustering. The performance of our proposed method is validated to save significantly computation time against the original silhouette only using Ruspini, Iris, Wine and Breast cancer in UCI machine learning repository datasets by experiment and analysis. Especially, the performance of our proposed method is much better than previous method for the larger size of data.

Balanced Canopy Clustering에 기반한 일반적 k-인접 이웃 그래프 생성 알고리즘 (A Generic Algorithm for k-Nearest Neighbor Graph Construction Based on Balanced Canopy Clustering)

  • 박영기;황혜수;이상구
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권4호
    • /
    • pp.327-332
    • /
    • 2015
  • k-인접 이웃 그래프는 모든 정점에 대한 k-NN 정보를 나타내는 데이터 구조로서, 많은 정보검색 및 추천 시스템에서 k-인접 이웃 그래프를 활용하고 있다. 현재까지 k-인접 이웃 그래프를 생성하는 다양한 방법들이 제안되었지만, 다음의 두 조건을 동시에 만족하는 알고리즘은 제안되지 못했다: (1) 특정유사도 척도를 가정하지 않는다. (2) 정점 또는 차원의 수가 증가하더라도 정확도가 감소하지 않는다. 본 논문에서는 balanced canopy clustering을 이용하여 위 두 조건을 모두 만족하는 k-NN 그래프 생성 알고리즘을 제안한다. 실험 결과, 정점과 차원의 수에 상관없이 기본 알고리즘에 비해 5배 이상 빠르면서 약 92%의 정확도를 유지했다. 본 알고리즘은 새로운 유사도 척도를 사용하거나, 높은 정확도를 보장해야 할 경우 효과적으로 사용될 수 있다.

문자 인식 향상을 위한 회전 정렬 알고리즘에 관한 연구 (A Study on Rotational Alignment Algorithm for Improving Character Recognition)

  • 진고환
    • 한국융합학회논문지
    • /
    • 제10권11호
    • /
    • pp.79-84
    • /
    • 2019
  • 영상을 기반으로 하는 기술들의 지속적인 발전으로 다양한 분야에서 활용되고 있고, 카메라를 통하여 획득한 영상의 객체를 분석하고 판별하는 비전 시스템의 기술 수요가 급속하게 증가하고 있다. 비전 시스템의 핵심 기술인 영상처리는 반도체 생산 분야의 불량 검사, 타이어 표면의 숫자 및 심볼과 같은 객체 인식 검사 등에 사용되고 있고, 자동차 번호판 인식 등의 연구가 계속하여 이루어지고 있는 실정으로, 객체를 신속, 정확하게 인식할 필요가 있다. 본 논문에서는 곡면과 같은 곳에 마킹되어 있는 숫자나 심볼과 같이 기울어진 객체를 인식하기 위하여 입력된 영상 이미지의 객체 기울기에 대한 각도 값을 확인하여 객체의 회전 정렬을 통한 인식 모델을 제안한다. 제안 모델은 컨투어 알고리즘을 기반으로 객체 영역을 추출하고, 객체의 각도를 산출한 후, 회전 정렬된 이미지에 대한 객체 인식을 진행할 수 있는 모델이다. 향후 연구에서는 기계학습을 통한 탬플릿 매칭 연구가 필요하다.

Performance Counter Monitor를 이용한 FLUSH+RELOAD 공격 실시간 탐지 기법 (Real-Time Detection on FLUSH+RELOAD Attack Using Performance Counter Monitor)

  • 조종현;김태현;신영주
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제8권6호
    • /
    • pp.151-158
    • /
    • 2019
  • 캐시 부채널 공격 중 하나인 FLUSH+RELOAD 공격은 높은 해상도와 적은 노이즈로 여러 악성 프로그램에서도 활용되는 등 비밀 정보의 유출에 대한 위험성이 높은 공격이다. 따라서 이 공격을 막기 위해 실시간으로 공격을 탐지하는 기술을 개발할 필요가 있다. 본 논문에서는 프로세서의 PCM (Performance Counter Monitor)를 이용한 실시간 FLUSH+RELOAD 공격 탐지 기법을 제안한다. 탐지 방법의 개발을 위해 우선 공격이 발생하는 동안 PCM의 여러 카운터들의 값들의 변화를 4가지 실험을 통해 관찰하였다. 그 결과, 3가지 중요한 요인에 의해 공격 탐지를 할 수 있다는 것을 발견하였다. 이를 바탕으로 머신 러닝의 logistic regression과 ANN(Artificial Neural Network)를 사용해 결과에 대한 각각 학습을 시킨 뒤 실시간으로 공격에 대한 탐지를 할 수 있는 알고리즘을 개발하였다. 이 탐지 알고리즘은 일정한 시간동안 공격을 진행하여 모든 공격을 감지하는데 성공하였고 상대적으로 적은 오탐률을 보여주었다.

K-means 알고리즘을 통한 연하 곤란 환자의 심각도를 확인하는 프로그램 개발 연구 (A study on the development of a program to check the severity of dysphagia patients using the K-means algorithm)

  • 최동규;장종욱
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2019년도 춘계학술대회
    • /
    • pp.104-107
    • /
    • 2019
  • 현대인들은 과거에 비해 풍부한 먹거리와 다양한 삶의 형태를 가지게 되었으나 바쁜 생활 속에 아침을 거르게 되고, 제 시간에 식사를 하지 못하는 등의 올바르지 못한 식습관을 형성하게 되었다. 이러한 식습관은 장기간 유지되면서 소화기관 장애로 이어지게 된다. 그에 가장 쉽게 발생하는 증상이 역류성 식도염과 삼킴 장애라고 불리는 연하 곤란이 있으며, 그 중 연하 곤란은 다양한 합병증의 형태로 발전하거나 위암, 후두암등의 전조증상으로 확인되기도 하여 빠르고 정확한 진단이 요구된다. 이에 따른 진단 결과는 현재도 의사가 수동적으로 판단하며 그 결과가 제각각이다. 여기서 말하는 진단 결과는 중증 정도를 말하는 것이며, 그에 따른 치료법이나 합병증을 파악할 때의 잘못된 진단으로 과한 치료나 부족한 대처로 이어지게 될 수도 있다. 본 논문에서는 연하 곤란의 심각 정도를 파악하기 위해 연하 곤란 진단 과정에서 식도로 이어지는 구간에 후두개곡과 이상와 부에 남는 잔여 음식물을 확인하기 위한 X-ray 이미지 처리에 K-means 알고리즘을 사용하는 프로그램을 개발하는 것을 연구하였다.

  • PDF

인공지능형 전훈분석기술: 'L2-OODA 앙상블 알고리즘'을 중심으로 (Technology of Lessons Learned Analysis using Artificial intelligence: Focused on the 'L2-OODA Ensemble Algorithm')

  • 양성실;신진
    • 융합보안논문지
    • /
    • 제21권2호
    • /
    • pp.67-79
    • /
    • 2021
  • 전훈이란 군사용어로서 전투발전분야의 교육과 현실에서 문제점이 확인되거나 개선이 필요한 요소를 찾아서 미래의 발전을 도모하는 모든 활동이다. 이 논문에서는 전훈활동을 추진하는데 드러나는 문제점, 즉 분석시 장기간 소요, 예산 문제, 전문가 필요성 등을 해결하고자 실제 사례를 제시하고 인공지능 분석 추론기술을 적용하는 데 초점을 맞춘다. 이미 실용화되어 사용 중인, 인지 컴퓨팅 관련 기술을 활용한 인공지능 법률자문 서비스가 전훈의 문제점을 해결하는데 가장 적합한 사례로 판단했다. 이 논문은 인공지능을 활용한 지능형 전훈분석 추론기술의 효과적인 적용방안을 제시한다. 이를 위해, 전훈분석 정의 및 사례, 인공지능의 머신러닝으로 진화, 인지 컴퓨팅 등 이론적 배경을 살펴보고, 새롭게 제안한 L2-OODA 앙상블 알고리즘을 이용해 국방분야 신기술에 적용함으로써 현존전력 개선 및 최적화를 구현하는데 기여하고자 한다.

Adaptively selected autocorrelation structure-based Kriging metamodel for slope reliability analysis

  • Li, Jing-Ze;Zhang, Shao-He;Liu, Lei-Lei;Wu, Jing-Jing;Cheng, Yung-Ming
    • Geomechanics and Engineering
    • /
    • 제30권2호
    • /
    • pp.187-199
    • /
    • 2022
  • Kriging metamodel, as a flexible machine learning method for approximating deterministic analysis models of an engineering system, has been widely used for efficiently estimating slope reliability in recent years. However, the autocorrelation function (ACF), a key input to Kriging that affects the accuracy of reliability estimation, is usually selected based on empiricism. This paper proposes an adaption of the Kriging method, named as Genetic Algorithm optimized Whittle-Matérn Kriging (GAWMK), for addressing this issue. The non-classical two-parameter Whittle-Matérn (WM) function, which can represent different ACFs in the Matérn family by controlling a smoothness parameter, is adopted in GAWMK to avoid subjectively selecting ACFs. The genetic algorithm is used to optimize the WM model to adaptively select the optimal autocorrelation structure of the GAWMK model. Monte Carlo simulation is then performed based on GAWMK for a subsequent slope reliability analysis. Applications to one explicit analytical example and two slope examples are presented to illustrate and validate the proposed method. It is found that reliability results estimated by the Kriging models using randomly chosen ACFs might be biased. The proposed method performs reasonably well in slope reliability estimation.

보조 혼합 샘플링을 이용한 베이지안 로지스틱 회귀모형 : 당뇨병 자료에 적용 및 분류에서의 성능 비교 (Bayesian logit models with auxiliary mixture sampling for analyzing diabetes diagnosis data)

  • 이은희;황범석
    • 응용통계연구
    • /
    • 제35권1호
    • /
    • pp.131-146
    • /
    • 2022
  • 로지스틱 회귀 모형은 다양한 분야에서 범주형 종속 변수를 예측하거나 분류하기 위한 모형으로 많이 사용되고 있다. 로지스틱 회귀 모형에 대한 전통적인 베이지안 추론 기법으로 메트로폴리스-헤이스팅스 알고리즘이 많이 사용되었지만, 수렴의 속도가 느리고 제안 분포에 대한 적절성을 보장하기 어렵다. 따라서, 본 논문에서는 모형에 대한 베이지안 추론 방법으로 Frühwirth-Schnatter와 Frühwirth (2007)에서 제안된 보조 혼합 샘플링(auxiliary mixture sampling) 기법을 사용하였다. 이 방법은 모형의 선형성과 정규성을 만족시키기 위해 두 단계에 거쳐 잠재변수를 도입하며, 결과적으로 깁스 샘플링을 통한 추론을 가능하게 한다. 제안한 모형의 효과를 검증하기 위해 2020년 지역사회 건강조사 당뇨병 자료에 적용하여 메트로폴리스-헤이스팅스를 사용한 모형과 추론 결과를 비교 분석하였다. 또한, 다양한 분류 모형들과 본 논문에서 제안한 모형의 분류 성능을 비교한 결과 제안된 모형이 분류 분석에서도 좋은 성능을 보이는 것을 확인할 수 있었다.

동아시아 대기의 강 탐지 알고리즘 비교 (Comparison of Atmospheric River Detection Algorithms in East Asia)

  • 김규리;백승윤;권예은;손석우
    • 대기
    • /
    • 제33권4호
    • /
    • pp.399-411
    • /
    • 2023
  • This study compares the three detection algorithms of East Asian summer atmospheric rivers (ARs). The algorithms developed by Guan and Waliser (GW15), Park et al. (P21), and Tian et al. (T23) are particularly compared in terms of the AR frequency, the number of AR events, and the AR duration for the period of 2016-2020. All three algorithms show similar spatio-temporal distributions of AR frequency, centered along the edge of the North Pacific high. The maximum AR frequency gradually shifts northward in early summer as the edge of the North Pacific High expands, and retreats in late summer. However, the detailed pattern and the maximum value differ among the algorithms. When the AR frequency is decomposed into the number of AR events and the AR duration, the AR frequencies detected by GW15 and P21 are equally explained by both factors. However, the number of AR events primarily determine the AR frequency in T23. This difference occurs as T23 utilizes the machine learning algorithm applied to moisture field while GW15 and P21 apply the threshold value to moisture transport field. When evaluating AR-related precipitation, the ARs detected by P21 show the closest relationship with total precipitation in East Asia by up to 60%. These results indicate that AR detection in the East Asian summer is sensitive to the choice of the detection algorithm and can be optimized for the target region.