• 제목/요약/키워드: k-NN algorithm

검색결과 272건 처리시간 0.035초

향상된 텍스트 분류 (An Improved Text Classification)

  • 왕광싱;신성윤;신광성;이현창
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2019년도 제59차 동계학술대회논문집 27권1호
    • /
    • pp.125-126
    • /
    • 2019
  • In this paper, we propose an improved kNN classification method. Through improved the mothed and normalizing the data, the purpose of improving the accuracy is achieved. Then we compared the three classification algorithms and the improved algorithm by experimental data.

  • PDF

센서네트워크를 위한 K-NN 기반의 위치 추정 시스템 (Location Positioning System Based on K-NN for Sensor Networks)

  • 김병국;홍원길
    • 한국멀티미디어학회논문지
    • /
    • 제15권9호
    • /
    • pp.1112-1125
    • /
    • 2012
  • LBS(Location Based Service)를 위한 대표적인 수단으로 GPS가 많이 사용된다. 그러나 GPS는 야외 및 개방된 공간에서만 이용이 가능하다. 또한, 저전력을 기반으로 한 무선 센서네트워크에서의 활용은 비효율적이다. 본 논문에서는 실내 환경에서 위치 측위를 위하여 기존 시스템들과는 다른 접근 방법을 이용하여 위치를 측위 한다. 무선 센서네트워크에서 대표적으로 사용하는 IEEE 802.15.4를 기반으로 K-NN (K-Nearest Neighbor) 알고리즘에 중간값(Intermediate Value)을 적용하여, 더 세밀하게 위치를 측위 할 수 있는 시스템을 제안한다. K-NN의 경우 측정된 위치의 정교성은 셈플링의 개수에 비례한다. 그러나 센서네트워크에서 셈플링 개수를 무수히 늘리는 것은 비효율적이다. 본 논문에서는 셈플링값에 중간값을 적용하여 셈플링을 줄이는 알고리즘을 제안한다. 그리고 제안한 알고리즘을 구현하고 이를 실험하여 기존의 K-NN 기반의 위치 추정보다 약 두 배의 정밀도를 얻을 수 있음을 증명한다.

유전알고리즘을 이용한 최적 k-최근접이웃 분류기 (Optimal k-Nearest Neighborhood Classifier Using Genetic Algorithm)

  • 박종선;허균
    • Communications for Statistical Applications and Methods
    • /
    • 제17권1호
    • /
    • pp.17-27
    • /
    • 2010
  • 분류분석에 사용되는 k-최근접이웃 분류기에 유전알고리즘을 적용하여 의미 있는 변수들과 이들에 대한 가중치 그리고 적절한 k를 동시에 선택하는 알고리즘을 제시하였다. 다양한 실제 자료에 대하여 기존의 여러 방법들과 교차타당성 방법을 통하여 비교한 결과 효과적인 것으로 나타났다.

지역적 k값을 사용한 k-Nearest Neighbor Classifier (k-Nearest Neighbor Classifier using Local Values of k)

  • 이상훈;오경환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.193-195
    • /
    • 2003
  • 본 논문에서는 k-Nearest Neighbor(k-NN) 알고리즘을 최적화하기 위해 지역적으로 다른 k(고려할 neighbor의 개수)를 사용하는 새로운 방법을 제안한다. 인스턴스 공간(instance space)에서 노이즈(noise)의 분포가 지역적(local)으로 다를 경우, 각 지점에서 고려해야 할 최적의 이웃 인스턴스(neighbor)의 수는 해당 지점에서의 국부적인 노이즈 분포에 따라 다르다. 그러나 기존의 방법은 전체 인스턴스 공간에 대해 동일한 k를 사용하기 때문에 이러한 인스턴스 공간의 지역적인 특성을 고려하지 못한다. 따라서 본 논문에서는 지역적으로 분포가 다른 노이즈 문제를 해결하기 위해 인스턴스 공간을 여러 개의 부분으로 나누고, 각 부분에 최적화된 k의 값을 사용하여 kNN을 수행하는 새로운 방법인 Local-k Nearest Neighbor 알고리즘(LkNN Algorithm)을 제안한다. LkNN을 통해 생성된 k의 집합은 인스턴스 공간의 각 부분을 대표하는 값으로, 해당 지역의 인스턴스가 고려해야 할 이웃(neighbor)의 수를 결정지어준다. 제안한 알고리즘에 적합한 데이터의 도메인(domain)과 그것의 향상된 성능은 UCI ML Data Repository 데이터를 사용한 실험을 통해 검증하였다.

  • PDF

텍스트 분류 기법의 발전 (Enhancement of Text Classification Method)

  • 신광성;신성윤
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2019년도 춘계학술대회
    • /
    • pp.155-156
    • /
    • 2019
  • Classification and Regression Tree (CART), SVM (Support Vector Machine) 및 k-nearest neighbor classification (kNN)과 같은 기존 기계 학습 기반 감정 분석 방법은 정확성이 떨어졌습니다. 본 논문에서는 개선 된 kNN 분류 방법을 제안한다. 개선 된 방법 및 데이터 정규화를 통해 정확성 향상의 목적이 달성됩니다. 그 후, 3 가지 분류 알고리즘과 개선 된 알고리즘을 실험 데이터에 기초하여 비교 하였다.

  • PDF

Short-term Electric Load Forecasting Using Data Mining Technique

  • Kim, Cheol-Hong;Koo, Bon-Gil;Park, June-Ho
    • Journal of Electrical Engineering and Technology
    • /
    • 제7권6호
    • /
    • pp.807-813
    • /
    • 2012
  • In this paper, we introduce data mining techniques for short-term load forecasting (STLF). First, we use the K-mean algorithm to classify historical load data by season into four patterns. Second, we use the k-NN algorithm to divide the classified data into four patterns for Mondays, other weekdays, Saturdays, and Sundays. The classified data are used to develop a time series forecasting model. We then forecast the hourly load on weekdays and weekends, excluding special holidays. The historical load data are used as inputs for load forecasting. We compare our results with the KEPCO hourly record for 2008 and conclude that our approach is effective.

신경회로망을 이용한 태양광 발전의 MPPT 제어 (MPPT Control of Photovoltaic using Neural Network)

  • 고재섭;최정식;정철호;김도연;정병진;정동화
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2008년도 춘계학술대회 논문집 전기기기 및 에너지변환시스템부문
    • /
    • pp.221-223
    • /
    • 2008
  • This paper presents a maximum power point tracking(MPPT) of Photovoltaic system with chopping ratio of DC-DC converter considered load. A variation of solar irradiation is most important factor in the MPPT of PV system. That is nonlinear, aperiodic and complicated. The paper consists of solar radiation source, DC-DC converter, DC motor and load(cf, pump). NN algorithm apply to DC-DC converter through an adaptive control of neural network, calculates converter-chopping ratio using an adaptive control of NN. The results of an adaptive control of NN compared with the results of converter-chopping ratio which are calculated mathematical modeling and evaluate the proposed algorithm. The experimental data show that an adequacy of the algorithm was established through the compared data.

  • PDF

적응형 재귀 분할 평균법을 이용한 메모리기반 추론 알고리즘 (A Memory-based Reasoning Algorithm using Adaptive Recursive Partition Averaging Method)

  • 이형일;최학윤
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권4호
    • /
    • pp.478-487
    • /
    • 2004
  • 메모리 기반 추론에서 기억공간의 효율적인 사용과 분류성능의 향상을 위하여 제안되었던 RPA(Recursive Partition Averaging)알고리즘은 대상 패턴 공간을 분할 한 후 대표 패턴을 추출하여 분류 기준 패턴으로 사용한다. 이 기법은 메모리 사용 효율과 분류 성능 면에서 우수한 결과를 보였지만, 분할 종료 조건과 대표패턴의 추출 방법이 분류 성능 저하의 원인이 되는 단점을 가지고 있었다. 여기에서는 기존 RPA의 단점을 보안한 ARPA(Adaptive RPA) 알고리즘을 제안한다. 제안된 알고리즘은 패턴 공간의 분할 종료 조건으로 특징별 최빈 패턴 구간(FPD: Feature-based population densimeter)추출 알고리즘을 사용하며, 학습 결과 패턴의 생성을 대표패턴 추출기법 대신 최빈 패턴 구간을 이용하여 생성한 최적초월평면(OH: Optimized Hyperrectangle)을 사용한다. 제안된 알고리즘은 k-NN 분류기에서 필요로 하는 메모리 공간의 40%정도를 사용하며, 분류에 있어서도 RPA보다 우수한 인식 성능을 보이고 있다. 또한 저장된 패턴의 감소로 인하여, 실제 분류에 소요되는 시간 비교에 있어서도 k-NN보다 월등히 우수한 성능을 보이고 있다.

신경망 또는 k-NN에 의한 신문 기사 분류와 그의 성능 비교 (The Comparison of Neural Network and k-NN Algorithm for News Article Classification)

  • 조태호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.363-365
    • /
    • 1998
  • 텍스트 마이닝(Text Mining)이란 텍스트형태의 문서들의 패턴 또는 관계를 추출하여 사용자가 원하는 새로운 정보를 가공하거나 기존의 정보를 변형하는 과정을 말한다. 텍스트 마이닝의 기능에는 문서 범주화(Document Categorization), 문서 군집화(Document Clustering), 그리고 문서 요약(Document Summarization)이 이에 해당된다. 문서 범주화란 문서에게 사전에 정의한 범주를 부여하는 과정을 말하고, 문서 군집화란 문서들을 계층적 구조로 형성하는 과정을 말하고, 문서 요약이란 문서의 전체 내용을 대표할 수 있는 내용의 일부만을 추출하는 과정을 말한다. 이 논문에서는 문서 범주화만을 다룰 것이며 그 대상으로는 신문기사로 설정하였다. 그의 범주는 4가지로 정치, 경제, 스포츠, 그리고 정보통신으로 설정하였다. 문서 범주화는 문서 분류(Document Classification)라고도 하며 문서에 범주를 자동으로 부여하여 기존에 인위적으로 부여함으로써 소요되는 시간과 비용을 절감하는 것이 목적이다. 문서 범주화에 대하여 k-NN(k-Nearest Neighbor)와 신경망을 이용하였으며, 신경망을 이용한 경우가 k-NN을 이용한 경우보다 성능이 우수하였다.

  • PDF

시계열 위성영상과 머신러닝 기법을 이용한 산림 바이오매스 및 배출기준선 추정 (Machine-learning Approaches with Multi-temporal Remotely Sensed Data for Estimation of Forest Biomass and Forest Reference Emission Levels)

  • 이용규;이정수
    • 한국산림과학회지
    • /
    • 제111권4호
    • /
    • pp.603-612
    • /
    • 2022
  • 본 연구는 다중시기 위성영상과 머신러닝 알고리즘을 이용하여 준국가수준의 시계열 산림바이오매스량을 추정하였으며, 이를 바탕으로 산림배출기준선 설정하여 비교·분석하였다. 머신러닝기반의 산림바이오매스 추정 모델을 구축하기 위하여 Landsat TM 위성영상과 유럽항공우주국에서 제공하는 Biomass Climate Change Initiative 정보를 이용하였으며, 머신러닝 알고리즘은 비모수 학습모델인 k-Nearest Neighbor(kNN)과 의사결정나무 기반의 Random Forest(RF)를 적용하였다. 또한, 추정된 산림바이오매스량은 Forest reference emission levels(FREL) 자료와 비교하였다. 머신러닝 알고리즘 별 산림바이오매스 추정 모델을 비교해보면, 최적의 kNN 모델과 RF 모델의 Root Mean Square Error (RMSE)는 각각 35.9와 34.41였으며, RF모델이 kNN모델보다 상대적으로 우수하였다. 또한, FREL, kNN, RF 모델 별 산림배출기준선의 기울기는 각각 약 -33천ton, -253천ton, -92천ton으로 설정되었다.