• 제목/요약/키워드: k-NN분류

검색결과 189건 처리시간 0.032초

PCA와 비선형분류기에 기반을 둔 유도전동기의 고장진단 (Fault Diagnosis of Induction Motor based on PCA and Nonlinear Classifier)

  • 박성무;이대종;전명근
    • 한국지능시스템학회논문지
    • /
    • 제16권1호
    • /
    • pp.119-123
    • /
    • 2006
  • 본 논문에서는, 주성분분석기법과 다층신경망에 기반을 유도전동기의 고장진단기법을 제안하고자 한다. 입력의 수가 많을 경우 다층신경망만을 이용하여 분류하는 데는 한계가 있다. 이러한 문제점을 해결하기 위해 주성분분석기법에 의해 입력특징의 수를 축약한 후, 비선형분류기인 다층신경망을 적용하였다. 또한, 주성 분석기법에 추출된 특징벡터가 고장상태별로 비선형성 특성을 보일 경우 기존의 거리척도 기반에 의한 분류방법으로 정확한 진단을 하는데 어려움이 있다. 이를 위해 비선형 분류기인 MLP를 적용함으로써 효과적인 고장진단을 하자 한다. 세안된 기법은 다양한 실험을 통해 기존의 선형분류기에 비해 우수한 겨과를 보임을 나타내고자 한다.

비모수적 기법에 의한 확률론적 저수지 유입량 예측 (Probabilistic Reservoir Inflow Forecast Using Nonparametric Methods)

  • 이한구;김선기;조영현;정구열
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2008년도 학술발표회 논문집
    • /
    • pp.184-188
    • /
    • 2008
  • 추계학적 시계열 분석은 크게 수문자료의 장기간 합성과 실시간 예측으로 구분해 볼 수 있다. 장기간 합성은 주로 수문자료의 추계적 특성을 반영한 수자원 시스템의 운영율 개발에 이용되어 왔다. 반면에 실시간 예측은 수자원 시스템의 순응적(adaptive) 관리에 적용되고 있다. 두 개념의 차이로 전자는 시계열 자료를 합성하여 발생 가능한 모든 수문조합을 얻고자 하는 것이라면 후자는 전 시간의 수문량을 조건으로 하는 다음 시간의 값을 순응적으로 예측하는 것이라 할 수 있다. 수문자료의 합성과 예측에는 크게 결정론적, 확률론적 방법의 두 가지 대별될 수 있다. 결정론적 모델링 방법에는 인공신경망이나 Fuzzy 기법 등을 이용할 수 있으며, 확률론적 방법에는 ARMAX 등의 모수적 기법과 k-NN(k-nearest neighbor bootstrap resampling), KDE(kernel density estimates), 추계학적 인공신경망 등의 비모수적 기법으로 분류할 수 있다. 본 연구에서는 대표적 비모수적 기법인 k-NN를 이용하여 충주댐을 대상으로 월 및 일 유입량 자료의 예측 정도를 살펴보았다. 전 시간 관측치를 조건으로 하는 다음 시간의 조건부 확률분포를 구하여 평균값을 계산한 후 관측치와 비교함으로써 모형의 정도를 살펴보았다. 그리고 실시간 저수지 운영에 이 기법의 활용성과 장단점도 살펴보았다. 모형개발 절차로 모형의 보정을 거쳐 검증을 실시하였다. 결론적으로 월 및 일 유입량 예측에 k-NN 기법이 실무적으로 적용될 수 있었으며, 장점으로는 k-NN 기법이 다른 기법보다 모델링 절차가 비교적 쉬워 저수지 운영 최적화 등 타 시스템과의 연계에 수월함이 인식되었다.

  • PDF

스마트 장치에서 비접촉식 전위계차 센서 신호를 이용한 동작 인식 기법 (Gestures Recognition for Smart Device using Contact less Electronic Potential Sensor)

  • 오강한;김수형;나인섭;김영철;문창협
    • 스마트미디어저널
    • /
    • 제3권2호
    • /
    • pp.14-19
    • /
    • 2014
  • 본 논문에서는 스마트 TV, 스마트폰으로 대표되는 스마트 장치에서 비접촉식 전위계차 센서(CEPS)로부터 추출된 동작신호를 k-NN과 DTW 알고리즘을 이용하여 인식하는 방법을 제안한다. 먼저 CEPS 신호는 칼만 필터를 이용해서 잡음을 제거해주고 정규화를 시켜준다. 다음 인식 속도를 향상시키고 분류에 방해되는 성분제거 하기 위해 PCA 알고리즘을 사용해서 신호의 차원을 축소시켰다. 그리고 k-NN과 DTW 알고리즘을 사용하여 인식 작업을 수행하였다. 실험 결과에서는 앞서 언급된 2개의 스마트 장치 환경 셋팅에 대해서 설명하고 각각의 환경에서 추출된 신호를 제안된 알고리즘에 의해서 인식을 하였다. 기존 인식 알고리즘의 결합과 분해를 통해 다양한 결과를 비교 분석함하고 90% 이상의 인식률을 달성함으로써 제안된 방법의 우수성을 증명하였다.

초월평면 최적화를 이용한 최근접 초월평면 학습법의 성능 향상 방법 (An Optimizing Hyperrectangle method for Nearest Hyperrectangle Learning)

  • 이형일
    • 한국지능시스템학회논문지
    • /
    • 제13권3호
    • /
    • pp.328-333
    • /
    • 2003
  • 메모리기반 추론에서 기억공간의 효율적인 사용과 분류성능의 향상을 위하여 제안된 NGE이론에 기반한 최근접 초월평면법은 학습자료를 초월평면상에 투영시켜 생성된 초월평면을 이용한다. 이때 학습자료에 포합될 수 있는 오류자료가 그대로 초월평면에 포함되어 분류의 정확성을 저해하는 요인으로 작용하는 단점을 가지고 있다. 본 논문에서는 기존의 최근접 초월평면의 단점을 보완한 초월평면 최적화(OH:Optimizing Hyperrectangle) 방법을 제안 한다. 제안된 방법은 특징가중치 벡터를 초월평면마다 할당하여 학습하고, 학습 후 생성된 모든 초월평면에 대해 특징별 최빈구간을 추출하여 최적초월평면을 구성하여 분류 시 사용한다. 제안된 방법은 EACH시스템과 마찬가지로 k-NN분류기에서 필요로 하는 메모리 공간의 40%정도를 사용하며, 분류에 있어서는 EACH시스템 보다 우수한 인식 성능을 보이고 있다.

얼굴인식을 위한 거리척도학습 방법 비교 (A Comparison of Distance Metric Learning Methods for Face Recognition)

  • 밧수리수브다;고재필
    • 한국멀티미디어학회논문지
    • /
    • 제14권6호
    • /
    • pp.711-718
    • /
    • 2011
  • 얼굴인식과 같이 클래스의 수가 변하는 분류 문제에는 학습이 필요하지 않은 k-최근접이웃 분류기가 적합하다. 최근 학습 데이터의 분포를 반영하여 거리 척도를 학습하는 방법은 k 최근접이웃 분류기의 획기적 성능향상을 보고하였다. 거리척도학습 방법은 적용 분야에 따라 성능 개선 정도가 다르다. 본 논문에서는 얼굴인식에 대하여 주요 거리척도학습 방법의 성능을 비교한다. 공개 얼굴 데이터베이스에 대한 실험 결과는 성능 및 계산시간 측면에서 주성분 분석 기반의 마하라노비스 거리척도가 얼굴인식 문제에서는 여전히 좋은 선택이 될 수 있음을 보여준다.

놈(Norm)에 따른 k-최근접 이웃 학습의 성능 변화 (k-Nearest Neighbor Learning with Varying Norms)

  • 김두혁;김찬주;황규백
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.371-375
    • /
    • 2008
  • 예제 기반 학습(instance-based learning) 방법 중 하나인 k-최근접 이웃(k-nearest reighbor, k-NN) 학습은 간단하고 예측 정확도가 비교적 높아 분류 및 회귀 문제 해결을 위한 기반 방법론으로 널리 적용되고 있다. k-NN 학습을 위한 알고리즘은 기본적으로 유클리드 거리 혹은 2-놈(norm)에 기반하여 학습예제들 사이의 거리를 계산한다. 본 논문에서는 유클리드 거리를 일반화한 개념인 p-놈의 사용이 k-NN 학습의 성능에 어떠한 영향을 미치는지 연구하였다. 구체적으로 합성데이터와 다수의 기계학습 벤치마크 문제 및 실제 데이터에 다양한 p-놈을 적용하여 그 일반화 성능을 경험적으로 조사하였다. 실험 결과, 데이터에 잡음이 많이 존재하거나 문제가 어려운 경우에 p의 값을 작게 하는 것이 성능을 향상시킬 수 있었다.

  • PDF

향상된 텍스트 분류 (An Improved Text Classification)

  • 왕광싱;신성윤;신광성;이현창
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2019년도 제59차 동계학술대회논문집 27권1호
    • /
    • pp.125-126
    • /
    • 2019
  • In this paper, we propose an improved kNN classification method. Through improved the mothed and normalizing the data, the purpose of improving the accuracy is achieved. Then we compared the three classification algorithms and the improved algorithm by experimental data.

  • PDF

문헌범주화에서 학습문헌수 최적화에 관한 연구 (Optimization of Number of Training Documents in Text Categorization)

  • 심경
    • 정보관리학회지
    • /
    • 제23권4호
    • /
    • pp.277-294
    • /
    • 2006
  • 본 연구는 실재 시스템 환경에서 문헌 분류를 위해 범주화 기법을 적용할 경우, 범주화 성능이 어느 정도이며, 적정한 문헌범주화 성능의 달성을 위하여 분류기 학습에 필요한 범주당 가장 이상적인 학습문헌집합의 규모는 무엇인가를 파악하기 위하여 kNN 분류기를 사용하여 실험하였다. 실험문헌집단으로15만 여건의 실제 서비스되는 데이터베이스에서 2,556건 이상의 문헌을 가진 8개 범주를 선정하였다. 이들을 대상으로 범주당 학습문헌수 20개(Tr-20)에서 2,000개(Tr-2000)까지 단계별로 증가시키며 8개 학습문헌집합 규모를 갖도록 하위문헌집단을 구성한 후, 학습문헌집합 규모에 따른 하위문헌집단 간 범주화 성능을 비교하였다. 8개 하위문헌집단의 거시평균 성능은 $F_1$ 값 30%로 선행연구에서 발견된 kNN 분류기의 일반적인 성능에 미치지 못하는 낮은 성능을 보였다. 실험을 수행한 8개 대상문헌집단 중 학습문헌수가 100개인 Tr-100 문헌집단이 $F_1$값 31%로 비용대 효과면에서 분류기 학습에 필요한 최적정의 실험문헌집합수로 판단되었다. 또한, 실험문헌집단에 부여된 주제범주 정확도를 수작업 재분류를 통하여 확인한 후, 이들의 범주별 범주화 성능과 관련성을 기반으로 위 결론의 신빙성을 높였다.

Genetic Algorithm과 다중부스팅 Classifier를 이용한 암진단 시스템 (Cancer Diagnosis System using Genetic Algorithm and Multi-boosting Classifier)

  • 온승엽;지승도
    • 한국시뮬레이션학회논문지
    • /
    • 제20권2호
    • /
    • pp.77-85
    • /
    • 2011
  • 생물 및 의학계에서는 생물정보학(bioinformatics)의 데이터 중 혈청 단백질(proteome)에서 추출한 데이터가 질병의 진단에 관련된 정보를 가지고 있고, 이 데이터를 분류 분석함으로 질병을 조기에 진단 할 수 있다고 믿고 있다. 본 논문에서는 혈청 단백질(2-D PAGE: Two-dimensional polyacrylamide gel electrophoresis)로부터 암과 정상을 판별하는 새로운 복합분류기를 제안한다. 새로운 복합 분류기에서는 support vector machine(SVM)와 다층 퍼셉트론(multi-layer perceptron: MLP)와 k-최근 접 이웃(k-nearest neighbor: k-NN)분류기를 앙상블(ensemble) 방법으로 통합하는 동시에 다중 부스팅(boosting) 방법으로 각 분류기를 확장하여 부분류기(subclassifier)의 배열(array)으로서 복합분류기를 구성하였다. 각 부분류기에서는 최적 특성 집합 (feature set)을 탐색하기 위하여 유전 알고리즘(genetic algorithm: GA)를 적용하였다. 복합분류기의 성능을 측정하기 위하여 암연구에서 얻어진 임상 데이터를 복합분류기에 적용하였고 결과로서 단일 분류기 보다 높은 분류 정확도와 안정성을 보여 주었다.

영상 분할을 위한 퍼지 커널 K-nearest neighbor 알고리즘 (Fuzzy Kernel K-Nearest Neighbor Algorithm for Image Segmentation)

  • 최병인;이정훈
    • 한국지능시스템학회논문지
    • /
    • 제15권7호
    • /
    • pp.828-833
    • /
    • 2005
  • 커널 기법은 데이터를 high dimension 상의 속성 공간으로 mapping함으로써 복잡한 분포를 가지는 데이터에 대하여 기존의 선형 분류 알고리즘들의 성능을 향상시킬 수 있다r4]. 본 논문에서는 기존의 유클리디안 거리측정방법 대신에 커널 함수에 의한 속성 공간의 거리측정방법을 fuzzy K-nearest neighbor(fuzzy K-NN) 알고리즘에 적용한 fuzzy kernel K-nearest neighbor(fuzzy kernel K-NN) 알고리즘을 제안한다. 제시한 알고리즘은 데이터에 대한 적절한 커널 함수의 선택으로 기존 알고리즘의 성능을 향상시킬 수 있다. 제시한 알고리즘의 타당성을 보이기 위하여 여러 데이터 집합에 대한 실험결과와 실제 영상의 분할 결과를 보일 것이다.