• 제목/요약/키워드: k-nn classification

검색결과 188건 처리시간 0.027초

다변량 데이터의 분류 성능 향상을 위한 특질 추출 및 분류 기법을 통합한 신경망 알고리즘 (Feature Selecting and Classifying Integrated Neural Network Algorithm for Multi-variate Classification)

  • 윤현수;백준걸
    • 산업공학
    • /
    • 제24권2호
    • /
    • pp.97-104
    • /
    • 2011
  • Research for multi-variate classification has been studied through two kinds of procedures which are feature selection and classification. Feature Selection techniques have been applied to select important features and the other one has improved classification performances through classifier applications. In general, each technique has been independently studied, however consideration of the interaction between both procedures has not been widely explored which leads to a degraded performance. In this paper, through integrating these two procedures, classification performance can be improved. The proposed model takes advantage of KBANN (Knowledge-Based Artificial Neural Network) which uses prior knowledge to learn NN (Neural Network) as training information. Each NN learns characteristics of the Feature Selection and Classification techniques as training sets. The integrated NN can be learned again to modify features appropriately and enhance classification performance. This innovative technique is called ALBNN (Algorithm Learning-Based Neural Network). The experiments' results show improved performance in various classification problems.

한국 전통음악 (국악)에 대한 자동 장르 분류 시스템 구현 (An Implementation of Automatic Genre Classification System for Korean Traditional Music)

  • 이강규;윤원중;박규식
    • 한국음향학회지
    • /
    • 제24권1호
    • /
    • pp.29-37
    • /
    • 2005
  • 본 논문은 한국의 전통 음악, 즉 국악 장르를 자동으로 분류하는 시스템을 제안한다. 제안된 시스템은 입력 음악의 내용기반 분석을 통하여 궁중음악, 풍류방음악, 민속성악, 민속기악, 불교음악, 무속음악 등 6가지 장르중 하나로 자동분류하여 해당 음악의 장르 결과를 보여준다. 국악 장르 분류에 사용된 내용기반 알고리즘은 크게 음악의 특징 벡터 추출 그리고 장르 분류를 위한 패턴인식 과정 2가지로 구성된다. 음악의 특징 벡터 추출은 디지탈 신호 처리기술을 이용하여 해당 음악의 spectral centroid, rolloff, flux 등 STFT (Short Time Fourier Transform) 기반의 특징 계수들과 MFCC (Mel frequency cepstral coefficient), LPC (Linear predictive coding) 등의 계수들을 구한 후 SFS (Sequential Forward Selection) 최적 특징 벡터 열을 선별하여 사용하였으며 패틴 분류 알고리즘으로는 k-NN (k -Nearest Neighbor), Gaussian, GMM (Gaussian Mixture Model), SVM (Support Vector Machine) 분류기를 사용하였다. 특히 본 연구에서는 입력 질의의 패턴 (혹은 구간) 변화에 따른 시스템의 불확실성을 개선하기 위하여 MFC (Multi Feature Clustring) 방법을 이용하여 DB를 구축하였다. 모의실험 결과 k-NN 과 SVM 분류기 모두 $97{\%}$ 이상의 장르 분류 성공률을 보였으나, SVM 이 k-NN에 비해 약 3배 이상의 빠른 분류 성능을 가지고 있음을 확인하였다.

신경망 또는 k-NN에 의한 신문 기사 분류와 그의 성능 비교 (The Comparison of Neural Network and k-NN Algorithm for News Article Classification)

  • 조태호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.363-365
    • /
    • 1998
  • 텍스트 마이닝(Text Mining)이란 텍스트형태의 문서들의 패턴 또는 관계를 추출하여 사용자가 원하는 새로운 정보를 가공하거나 기존의 정보를 변형하는 과정을 말한다. 텍스트 마이닝의 기능에는 문서 범주화(Document Categorization), 문서 군집화(Document Clustering), 그리고 문서 요약(Document Summarization)이 이에 해당된다. 문서 범주화란 문서에게 사전에 정의한 범주를 부여하는 과정을 말하고, 문서 군집화란 문서들을 계층적 구조로 형성하는 과정을 말하고, 문서 요약이란 문서의 전체 내용을 대표할 수 있는 내용의 일부만을 추출하는 과정을 말한다. 이 논문에서는 문서 범주화만을 다룰 것이며 그 대상으로는 신문기사로 설정하였다. 그의 범주는 4가지로 정치, 경제, 스포츠, 그리고 정보통신으로 설정하였다. 문서 범주화는 문서 분류(Document Classification)라고도 하며 문서에 범주를 자동으로 부여하여 기존에 인위적으로 부여함으로써 소요되는 시간과 비용을 절감하는 것이 목적이다. 문서 범주화에 대하여 k-NN(k-Nearest Neighbor)와 신경망을 이용하였으며, 신경망을 이용한 경우가 k-NN을 이용한 경우보다 성능이 우수하였다.

  • PDF

범주형 시퀀스 데이터의 K-Nearest Neighbor알고리즘 (A K-Nearest Neighbor Algorithm for Categorical Sequence Data)

  • 오승준
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권2호
    • /
    • pp.215-221
    • /
    • 2005
  • 최근에는 단백질 시퀀스, 소매점 거래 데이터, 웹 로그 등과 같은 상업적이거나 과학적인 데이터의 폭발적인 증가를 볼 수 있다. 이런 데이터들은 순서적인 면을 가지고 있는 시퀀스 데이터들이다. 본 논문에서는 이런 시퀀스 데이터들을 분류하는 문제를 다룬다. 분류 기법 으로는 의사결정 나무나 베이지안 분류기, K-NN방법 등 석러 종류가 있는데, 본 연구에서는 또-U방법을 이용하여 시퀀스들을 분류한다. 또한, 시퀀스들간의 유사도를 구하기 위한 새로운 계산 방법과 효율적인 계산 방법도 제안한다.

  • PDF

기계학습을 기반으로 한 인터넷 학술문서의 효과적 자동분류에 관한 연구 (The Study on the Effective Automatic Classification of Internet Document Using the Machine Learning)

  • 노영희
    • 한국도서관정보학회지
    • /
    • 제32권3호
    • /
    • pp.307-330
    • /
    • 2001
  • 본 연구에서는 kNN분류기를 이용한 범주화 방법에 대한 성능 실험을 하였다. kNN분류기와 같은 대부분의 예제기반 자동 분류기법은 학습문서집단의 자질을 축소하게 되는데 자질을 몇 퍼센트 축소함으로써 높은 성능을 얻을 수 있는지를 알아보고자 하였다. 또한, kNN분류기는 학습문서집단에서 검증문서와 가장 유사한 k개의 학습문서를 찾아야 하는데, 이때 가장 적합한 k값은 얼마인지를 실험을 통하여 검증하여 보고자 하였다.

  • PDF

부분방전원 분류기법의 패턴분류율 비교 (Comparison of Classification rate of PD Sources)

  • 박성희;임기조;강성화
    • 한국전기전자재료학회:학술대회논문집
    • /
    • 한국전기전자재료학회 2005년도 하계학술대회 논문집 Vol.6
    • /
    • pp.566-567
    • /
    • 2005
  • Until now variable pattern classification methods have been introduced. So, variable methods in PD source classification were applied. NN(neural network) the most used scheme as a PD(partial discharge) source classification. But in recent year another method were developed. These methods is present superior to NN in the field of image and signal process function of classification. In this paper, it is show classification result in PD source using three methods; that is, BP(back-propagation), ANFIS(adaptive neuro-fuzzy inference system), PCA-LDA(principle component analysis-linear discriminant analysis).

  • PDF

k-Nearest Neighbors 분류기를 이용한 복합 지표 산불피해 영역 탐지 (Mapping Burned Forests Using a k-Nearest Neighbors Classifier in Complex Land Cover)

  • 이한나;윤공현;김기홍
    • 대한토목학회논문집
    • /
    • 제43권6호
    • /
    • pp.883-896
    • /
    • 2023
  • 인간 활동 영역이 산지 곳곳에 퍼져 있는 한국에서는 산불이 주거지역이나 각종 시설물을 위협하는 경우가 잦다. 따라서 산불 이후 대책 마련과 피해 복구를 위해 피해 범위를 빠르게 파악할 필요가 있으며, 이러한 경우 원격탐사가 유용한 도구가 될 수 있다. 본 연구에서는 2019년 4월에 발생한 고성·속초 산불 피해지역에 k-nearest neighbor (kNN) 알고리즘을 적용하여 피해 범위를 탐지하는 실험을 수행하였다. 다양한 인공지물을 포함하는 지표와 숲이 혼재된 지역 특성을 고려하여 적절한 공간 해상도와 시간 해상도를 제공하는 Sentinel-2 multispectral instrument (MSI) 자료를 사용하였다. Sentinel-2 MSI의 여섯 밴드와 정규식생지수(NDVI), 정규탄화지수(NBR)를 분류 특성으로 사용하였다. 산불 피해지역과 비피해 지역에서 무작위로 추출된 2,000개 지점 정보를 이용하여 kNN 분류기를 훈련시켰다. 분류 성능을 높이기 위해 데이터에서 특이값을 제거하고 임상도를 병용하였다. 다양한 이웃(neighbor) 수와 분류 특성 조합을 적용하여 산불 후 데이터를 이용한 실험과 산불 전후 데이터 차이를 이용한 실험을 수행하였다. 산불 전후 데이터 차이를 이용하였을 때 더 우수한 분류 성과를 얻을 수 있었지만, 산불 후 데이터만을 이용한 경우에도 피해지역의 범위를 파악할 수 있었다.

DTW-kNN 기반의 유망 기술 식별을 위한 의사결정 지원 시스템 구현 방안 (Implementation of DTW-kNN-based Decision Support System for Discriminating Emerging Technologies)

  • 정도헌;박주연
    • 산업융합연구
    • /
    • 제20권8호
    • /
    • pp.77-84
    • /
    • 2022
  • 본 연구는 기계 학습 기반의 자동 분류 기법을 적용함으로써 유망 기술의 선정 과정에 활용할 수 있는 의사결정 지원 시스템의 구현 방안을 제시하는 것을 목표로 한다. 연구 수행을 위해 전체 시스템의 아키텍처를 구축하고 세부 연구 단계를 진행하였다. 우선, 유망 기술 후보 아이템을 선정하고 빅데이터 시스템을 활용하여 추세 데이터를 자동 생성하였다. 기술 발전의 개념 모델과 패턴 분류 체계를 정의한 후 자동 분류 실험을 통해 효율적인 기계 학습 방안을 제시하였다. 마지막으로 시스템의 분석 결과를 해석하고 활용 방안을 도출하고자 하였다. 본 연구에서 제안한 동적 시간 와핑(DTW) 기법과 k-최근접 이웃(kNN) 분류 모델을 결합한 DTW-kNN 기반의 분류 실험에서 최대 87.7%의 식별 성능을 보여주었으며, 특히 추세의 변동이 심한 'eventual' 정의 구간에서는 유클리디언 거리(ED) 알고리즘 대비 39.4% 포인트의 최대 성능 차이를 보여주어 제안 모델의 우수함을 확인할 수 있었다. 또한, 시스템이 제시하는 분석 결과를 통해, 대량의 추세 데이터를 입력받아 유형별로 자동 분류하고 필터링하는 과정에 본 의사결정 지원 시스템을 효과적으로 활용할 수 있음을 확인하였다.

Classification of TV Program Scenes Based on Audio Information

  • Lee, Kang-Kyu;Yoon, Won-Jung;Park, Kyu-Sik
    • The Journal of the Acoustical Society of Korea
    • /
    • 제23권3E호
    • /
    • pp.91-97
    • /
    • 2004
  • In this paper, we propose a classification system of TV program scenes based on audio information. The system classifies the video scene into six categories of commercials, basketball games, football games, news reports, weather forecasts and music videos. Two type of audio feature set are extracted from each audio frame-timbral features and coefficient domain features which result in 58-dimensional feature vector. In order to reduce the computational complexity of the system, 58-dimensional feature set is further optimized to yield l0-dimensional features through Sequential Forward Selection (SFS) method. This down-sized feature set is finally used to train and classify the given TV program scenes using κ -NN, Gaussian pattern matching algorithm. The classification result of 91.6% reported here shows the promising performance of the video scene classification based on the audio information. Finally, the system stability problem corresponding to different query length is investigated.

K_NN 분류기의 메모리 사용과 점진적 학습에 대한 연구 (A Study on the Storage Requirement and Incremental Learning of the k-NN Classifier)

  • 이형일;윤충화
    • 정보학연구
    • /
    • 제1권1호
    • /
    • pp.65-84
    • /
    • 1998
  • 메모리 기반 추론 기법은 분류시 입력 패턴과 저장된 패턴들 사이의 거리를 이용하는 교사 학습 기법으로써, 거리 기반 학습 알고리즘이라고도 한다. 메모리 기반 추론은 k_NN 분류기에 기반한 것으로, 학습은 추가 처리 없이 단순히 학습 패턴들을 메모리에 저장함으로써 수행된다. 본 논문에서는 기존의 k-NN 분류기보다 효율적인 분류가 가능하고, 점진적 학습 기능을 갖는 새로운 알고리즘을 제안한다. 또한 제안된 기법은 노이즈에 민감하지 않으며, 효율적인 메모리 사용을 보장한다.

  • PDF