• 제목/요약/키워드: Nearest Neighbor Selection

검색결과 61건 처리시간 0.037초

최인접 거리 비율 정합을 이용한 영상 특징점 선택 방법 (Image Feature Point Selection Method Using Nearest Neighbor Distance Ratio Matching)

  • 이준우;정재협;강종욱;나상일;정동석
    • 전자공학회논문지
    • /
    • 제49권12호
    • /
    • pp.124-130
    • /
    • 2012
  • 본 논문에서는 현재 진행 중인 MPEG(Motion Picture Experts Group, ISO/IEC JTC1 SC29 WG11)의 표준화 작업 중 CDVS(Compact Descriptor for Visual Search)의 CE-7(Core Experiment)인 특징점 선택에 대한 방법을 제안한다. 서술자의 경량화를 위해서는 영상으로부터 추출된 많은 수의 특징점들 중에서 영상 정합에 사용될 중요한 특징점들을 선택해야 한다. 본 논문에서는 최 인접 거리 비율 정합(Nearest Neighbor distance ratio matching) 방법에 의해 영상 정합 단계에서 사용되지 않고 버려지는 특징점들을 미리 추출 단에서 제거하는 방법 제안하였다. 제안된 방법을 통하여 적은 비트 전송률을 요하는 시스템에서 특징점의 낭비를 피할 수 있고 결과적으로 추가적인 특징점을 사용할 수 있으므로 전체적인 성능 향상을 얻을 수 있었다. 제안된 알고리즘을 통하여 Pair-wise 정합 실험에서 기존의 Test Model 대비 최고 2.3%의 성공율(True positive rate)의 향상을 보였다.

고객 맞춤 서비스를 위한 HPPS(Hybrid Preference Prediction System) 설계 (A Design of HPPS(Hybrid Preference Prediction System) for Customer-Tailored Service)

  • 정은희;이병관
    • 한국멀티미디어학회논문지
    • /
    • 제14권11호
    • /
    • pp.1467-1477
    • /
    • 2011
  • 본 논문에서는 고객 맞춤 서비스의 선호도를 정확하게 예측하기 위하여 사용자 프로파일 분석, 사용자간 유사도 분석을 이용한 HPPS(Hybrid Preference Prediction System) 설계를 제안한다. 기존의 NBCFA(Neighborhood Based Collaborative Filtering Algorithm)과 달리, 본 논문은 첫째, 선호도 예측식에서 이웃의 상품 평가가 없을 경우 상품에 대한 평균값을 이용하도록 하였고, 둘째, 선호도 예측식에서 사용자의 특성을 분석한 가중치를 반영하도록 하였고, 끝으로, 인접 이웃을 선정할 때 유사도, 상품 평가 여부, 평가 횟수를 반영하여 HPPS에 선호도의 정확도를 향상시켰다. 따라서 첫째와 둘째의 선호도 예측식을 이용하면 HPPS의 정확도는 기존의 NBCFA에 비해 97.24% 향상되었고, 인접이웃 선정방식에서도 HPPS 시스템의 정확도가 75% 향상되었다.

k-Nearest Neighbor 알고리즘을 이용한 도심 내 주요 도로 구간의 교통속도 단기 예측 방법 (Short-Term Prediction of Vehicle Speed on Main City Roads using the k-Nearest Neighbor Algorithm)

  • 모하메드 아리프 라시이디;김정민;류광렬
    • 지능정보연구
    • /
    • 제20권1호
    • /
    • pp.121-131
    • /
    • 2014
  • 교통속도는 교통 문제를 해결하기 위한 중요한 지표 중 하나이다. 이를 이용하여 교통혼잡 탐지, 주행 시간 예측, 도로 설계와 같은 다양한 문제 해결에 활용할 수 있다. 따라서 정확한 교통속도 예측은 지능형 교통 시스템의 개발에 있어 필수적인 요소라고 할 수 있다. 본 논문에서는 대한민국 부산시의 특정 도로를 대상으로 교통 속도에 대한 분석 및 예측을 수행하였다. 과거 연구에서는 대상 도로의 속도 예측을 위해 과거 대상 도로의 교통속도 이력 데이터만을 사용하였다. 그러나 실제 대상 도로의 교통 상황은 인접한 도로의 교통 상황의 영향을 받게 된다. 따라서 본 논문에서는 실제 부산시의 과거 교통속도 이력 데이터를 기반으로 대상 도로와 인접 도로를 모두 고려하여 교통속도 예측 모델의 학습을 위한 속성을 추출하였다. 이와 같이 후보 속성들을 추출 한 후 선형 회귀 (linear regression), 모델 트리 (model tree) 및 k-nearest neighbor (k-NN) 기법을 이용하여 속성의 부분집합 선택 (feature subset selection)과 교통속도 예측 모델 생성을 수행하였다. 실험 결과 주어진 교통 데이터에서 k-NN 기법은 선형 회귀 및 모델 트리 기법에 비해 평균절대백분율오차 (mean absolute percent error, MAPE)와 제곱근평균제곱오차 (root mean squared error, RMSE) 측면에서 더 나은 성능을 보임을 확인하였다.

상호정보 추정을 위한 k-최근접이웃 기반방법 (k-Nearest Neighbor-Based Approach for the Estimation of Mutual Information)

  • 차운옥;허문열
    • Communications for Statistical Applications and Methods
    • /
    • 제15권6호
    • /
    • pp.977-991
    • /
    • 2008
  • 본 논문에서는 연속형 변수에 대한 결합확률분포를 추정하지 않고도 상호정보(MI) 추정량을 구할 수 있는 k-최근접이웃 기반방법에 대하여 연구하였다. 변수가 동일한 값들을 가지는 경우 k-최근접이웃을 구할 때 생기는 문제점을 해결하기 위하여 지터링(jittering)과 붓스트랩(bootstrap) 방법을 제안하였다. 몬테칼로 모의실험과 실제 데이터에 대한 실험을 수행한 결과, k=1과 같이 작은 값을 사용한 k-최근접이웃 기반방법에 의해 효율적인 MI 추정량을 구할 수 있었다. k-최근접이웃 기반방법은 연속형 설명변수, 범주형 또는 연속형인 목적변수 형태의 데이터에 적용할 수 있으며, 목적변수에 영향을 주는 중요한 설명변수의 순서를 구할 수 있을 뿐만 아니라 다차원에도 적용할 수 있기 때문에 중요변수의 집합을 구하는 변수 선택(feature subset selection) 문제에도 적용할 수 있다.

Centroid and Nearest Neighbor based Class Imbalance Reduction with Relevant Feature Selection using Ant Colony Optimization for Software Defect Prediction

  • B., Kiran Kumar;Gyani, Jayadev;Y., Bhavani;P., Ganesh Reddy;T, Nagasai Anjani Kumar
    • International Journal of Computer Science & Network Security
    • /
    • 제22권10호
    • /
    • pp.1-10
    • /
    • 2022
  • Nowadays software defect prediction (SDP) is most active research going on in software engineering. Early detection of defects lowers the cost of the software and also improves reliability. Machine learning techniques are widely used to create SDP models based on programming measures. The majority of defect prediction models in the literature have problems with class imbalance and high dimensionality. In this paper, we proposed Centroid and Nearest Neighbor based Class Imbalance Reduction (CNNCIR) technique that considers dataset distribution characteristics to generate symmetry between defective and non-defective records in imbalanced datasets. The proposed approach is compared with SMOTE (Synthetic Minority Oversampling Technique). The high-dimensionality problem is addressed using Ant Colony Optimization (ACO) technique by choosing relevant features. We used nine different classifiers to analyze six open-source software defect datasets from the PROMISE repository and seven performance measures are used to evaluate them. The results of the proposed CNNCIR method with ACO based feature selection reveals that it outperforms SMOTE in the majority of cases.

Impact of Instance Selection on kNN-Based Text Categorization

  • Barigou, Fatiha
    • Journal of Information Processing Systems
    • /
    • 제14권2호
    • /
    • pp.418-434
    • /
    • 2018
  • With the increasing use of the Internet and electronic documents, automatic text categorization becomes imperative. Several machine learning algorithms have been proposed for text categorization. The k-nearest neighbor algorithm (kNN) is known to be one of the best state of the art classifiers when used for text categorization. However, kNN suffers from limitations such as high computation when classifying new instances. Instance selection techniques have emerged as highly competitive methods to improve kNN through data reduction. However previous works have evaluated those approaches only on structured datasets. In addition, their performance has not been examined over the text categorization domain where the dimensionality and size of the dataset is very high. Motivated by these observations, this paper investigates and analyzes the impact of instance selection on kNN-based text categorization in terms of various aspects such as classification accuracy, classification efficiency, and data reduction.

SVM을 이용한 LVQ3 학습의 성능개선 (An Improvement of LVQ3 Learning Using SVM)

  • 김상운
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 하계종합학술대회 논문집(3)
    • /
    • pp.9-12
    • /
    • 2001
  • Learning vector quantization (LVQ) is a supervised learning technique that uses class information to move the vector quantizer slightly, so as to improve the quality of the classifier decision regions. In this paper we propose a selection method of initial codebook vectors for a teaming vector quantization (LVQ3) using support vector machines (SVM). The method is experimented with artificial and real design data sets and compared with conventional methods of the condensed nearest neighbor (CNN) and its modifications (mCNN). From the experiments, it is discovered that the proposed method produces higher performance than the conventional ones and then it could be used efficiently for designing nonparametric classifiers.

  • PDF

Guitar Tab Digit Recognition and Play using Prototype based Classification

  • Baek, Byung-Hyun;Lee, Hyun-Jong;Hwang, Doosung
    • 한국컴퓨터정보학회논문지
    • /
    • 제21권9호
    • /
    • pp.19-25
    • /
    • 2016
  • This paper is to recognize and play tab chords from guitar musical sheets. The musical chord area of an input image is segmented by changing the image in saturation and applying the Grabcut algorithm. Based on a template matching, our approach detects tab starting sections on a segmented musical area. The virtual block method is introduced to search blanks over chord lines and extract tab fret segments, which doesn't cause the computation loss to remove tab lines. In the experimental tests, the prototype based classification outperforms Bayesian method and the nearest neighbor rule with the whole set of training data and its performance is similar to that of the support vector machine. The experimental result shows that the prediction rate is about 99.0% and the number of selected prototypes is below 3.0%.

근접 이웃 선정 협력적 필터링 추천시스템에서 이웃 선정 방법에 관한 연구 (A study on neighbor selection methods in k-NN collaborative filtering recommender system)

  • 이석준
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권5호
    • /
    • pp.809-818
    • /
    • 2009
  • 협력적 필터링 기법은 전자상거래에서 거래되는 아이템에 대하여 고객들이 평가한 선호 정보를 이용하여 특정 상품에 대한 선호도 예측 대상 고객의 선호도를 예측하는 기법이다. 협력적 필터링 기법을 통한 예측 정확도를 향상시키기 위해서는 예측에 이용할 수 있는 고객들의 선호 정보를 충분히 확보하여야 한다. 그러나 과도한 이웃 고객의 선호 정보는 오히려 예측 정확도에 부정적 영향을 미치며 또한 과소 정보 역시 예측 정확도 감소에 영향을 미칠 수 있다. 본 연구에서는 협력적 필터링 알고리즘 적용에 있어 k명의 근접 이웃을 결정하는 이웃 선정방법을 개선하였으며 개별 고객의 선호도 평가 정보를 이용하여 적정 이웃 수를 결정할 수 있는 방법을 제시한다. 본 연구의 결과는 근접 이웃 수 결정을 위한 기존 방법인 탐색적 방법을 개선함과 동시에 선호도 예측 정확도를 향상시키는데 유용한 방법을 제공할 수 있다.

  • PDF

칼라 이미지 스케일의 보간 (Interpolation of Color Image Scales)

  • 김성환;정성환;이준환
    • 감성과학
    • /
    • 제10권3호
    • /
    • pp.289-297
    • /
    • 2007
  • 칼라 이미지 스케일은 칼라 전문가들의 지식에 의해 획득되고, 형용사와 대응되는 칼라(들)을 선택하기 위해 동일한 형용사 이미지 스케일들에서 형용사들과 칼라를 표현한다. 이들은 이미지 스케일을 얻기 위한 실험과 통계분석의 어려움 때문에 일반적으로, 단지 제한된 수의 칼라들만이 이미지 스케일에 위치한다. 이는 칼라를 선택하는 과정을 비전문가에게 어렵게 만든다. 본 논문에서는 이미지 스케일에 따라 연속적인 칼라를 제공하는 퍼지 K-근접 이웃 보간 방법에 기초를 둔 칼라 이미지 스케일의 보간 방법을 제안한다. 실험의 결과들은 보간된 이미지 스케일은 칼라 선택 과정에 있어 실용적으로 유용하게 사용될 수 있을 것이라 본다.

  • PDF