• 제목/요약/키워드: k-NN classification

검색결과 188건 처리시간 0.022초

Mongolian Traditional Stamp Recognition using Scalable kNN

  • Gantuya., P;Mungunshagai., B;Suvdaa., B
    • International journal of advanced smart convergence
    • /
    • 제4권2호
    • /
    • pp.170-176
    • /
    • 2015
  • The stamp is one of the crucial information of traditional historical and cultural for nations. In this paper, we purpose to detect official stamps from scanned document and recognize the Mongolian traditional, historical stamps. Therefore we performed following steps: first, we detect official stamps from scanned document based on red-color segmentation and document standard. Then we collected 234 traditional stamp images with 6 classes and 100 official stamp images from scanned document images. Also we implemented the processing algorithms for noise removing, resize and reshape etc. Finally, we proposed a new scale invariant classification algorithm based on KNN (k-nearest neighbor). In the experimental result, our proposed a method had shown proper recognition rate.

Random Forest 분류기와 Bag-of-Feature 특징 히스토그램을 이용한 의료영상 자동 분류 및 검색 (Medical Image Classification and Retrieval Using BoF Feature Histogram with Random Forest Classifier)

  • 손정은;고병철;남재열
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권4호
    • /
    • pp.273-280
    • /
    • 2013
  • 본 논문에서는 의료영상의 특성을 반영하여 픽셀 그래디언트의 방향 값을 특징으로 하는 OCS-LBP (Oriented Center Symmetric Local Binary Patterns) 특징을 개발하고 BoF(Bag-of-Feature)와 Random Forest 분류기를 이용한 영상 검색 방법을 제안한다. 학습영상에서 추출된 특징 값은 code book 으로 군집화 되고, 각 영상들은 code book을 통해 의미 있는 새로운 차원인 BoF특징으로 변환된다. 이렇게 추출된 BoF특징은 Random Forest 분류기에 적용되고 학습된 분류기에 의해 유사한 특성을 갖는 N개의 클래스별로 분류되게 된다. 질의 영상이 입력되면 동일한 OCS-LBP특징이 추출되고 code book을 통해 BoF특징이 추출된다. 전통적인 내용기반 영상검색과는 다르게, 본 논문에서는 질의 영상에서 추출된 BoF특징이 학습된 Random Forest에 적용되어 가장 유사한 K-근접 이웃 (K-nearest neighbor) 클래스들을 선택하고 선택된 클래스들에 포함된 영상들에 대해서만 질의 영상과의 BoF 유사도 측정을 통해 최종 유사한 영상을 검색하게 된다. 실험결과에서 본 논문에서 제안하는 방법은 빠르고 우수한 검색 성능을 보여 주었다.

분류 알고리즘과 NCA를 활용한 기계학습 기반 구조건전성 모니터링 시스템 (Machine Learning Based Structural Health Monitoring System using Classification and NCA)

  • 신창교;권현석;박유림;김천곤
    • 한국항행학회논문지
    • /
    • 제23권1호
    • /
    • pp.84-89
    • /
    • 2019
  • 본 연구는 복합재 항공기의 비행 데이터를 활용한 기계학습 기반 구조건전성 모니터링 시스템 연구의 예비 연구이다. 본 연구에서는 구조건전성 모니터링에 이용되기에 가장 적합한 기계학습 알고리즘을 선별하고, 실 기체 데이터에 대한 적용을 위해 차원 축소를 수행하였다. 이를 위해 외팔보를 통해 모사된 항공기 날개 구조와 부가 질량을 통해 손상 모사 실험을 진행하고, 분류 알고리즘을 통해 데이터를 손상의 위치와 정도에 따라 구분하였다. 이를 위해 FBG (fiber bragg grating) 센서를 부착한 외팔보의 진동 실험을 통해 정상상태와 12개의 손상상태에 대한 데이터를 취득하고, MATLAB 환경에서 tree, discriminant, SVM (support vector machine), kNN, ensemble 알고리즘의 비교와 파라미터 튜닝을 통해 가장 적합한 알고리즘을 도출하였다. 또한 NCA (neighborhood component analysis)를 이용한 특징 선택을 통해, 실 기체에서 나올 수 있는 고차원 데이터의 관리를 위해 필요한 차원 축소를 수행하였다. 그 결과, quadratic SVM이 NCA를 적용하지 않은 모델에서 98.7%, NCA를 적용한 모델에서 95.9%로 가장 높은 정답률을 보였다. 또한 NCA 적용 후 모델의 예측 속도, 학습 시간, 용량이 모두 향상되었다.

움직임 실루엣 영상의 일반적인 표현 방식에 대한 연구 (A General Representation of Motion Silhouette Image: Generic Motion Silhouette Image(GMSI))

  • 홍성준;이희성;김은태
    • 제어로봇시스템학회논문지
    • /
    • 제13권8호
    • /
    • pp.749-753
    • /
    • 2007
  • In this paper, a generalized version of the Motion Silhouette Image(MSI) called the Generic Motion Silhouette Image (GMSI) is proposed for gait recognition. The GMSI is a gray-level image and involves the spatiotemporal information of individual motion. The GMSI not only generalizes the MSI but also reflects a flexible feature of a gait sequence. Along with the GMSI, we use the Principal Component Analysis(PCA) to reduce the dimensionality of the GMSI and the Nearest Neighbor(NN) for classification. We apply the proposed feature to NLPR database and compare it with the conventional MSI. Experimental results show the effectiveness of the GMSI.

최적화 사례기반추론을 이용한 통신시장 고객관계관리 (Customer Relationship Management in Telecom Market using an Optimized Case-based Reasoning)

  • 안현철;김경재
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2006년도 추계학술대회 학술발표 논문집 제16권 제2호
    • /
    • pp.285-288
    • /
    • 2006
  • Most previous studies on improving the effectiveness of CBR have focused on the similarity function aspect or optimization of case features and their weights. However, according to some of the prior research, finding the optimal k parameter for the k-nearest neighbor (k-NN) is also crucial for improving the performance of the CBR system. Nonetheless, there have been few attempts to optimize the number of neighbors, especially using artificial intelligence (AI) techniques. In this study, we introduce a genetic algorithm (GA) to optimize the number of neighbors that combine, as well as the weight of each feature. The new model is applied to the real-world case of a major telecommunication company in Korea in order to build the prediction model for the customer profitability level. Experimental results show that our GA-optimized CBR approach outperforms other AI techniques for this mulriclass classification problem.

  • PDF

사물인터넷 관련 버그 정정을 위한 버그리포트 속성 분석 (Bug Reports Attribute Analysis for Fixing The Bug on The Internet of Things)

  • 권기문;정성순
    • 전자공학회논문지
    • /
    • 제52권5호
    • /
    • pp.235-241
    • /
    • 2015
  • 최근 사물인터넷과 관련된 연구와 산업이 급속히 발전하고 있다. 사물인터넷과 관련된 소프트웨어 개발 및 유지보수 활동에서 버그 정정은 큰 비중을 차지하는 활동이다. 본 논문에서는 사물인터넷과 관련된 버그를 정정하는데 소요되는 시간을 분석함으로써 버그 정정 시간에 영향을 미칠 수 있는 속성이 무엇인지 분석한다. 버그 리포트가 제공하는 속성 정보에 따라 k-NN 분류 방법을 사용하여 버그 리포트를 분류하고 유사한 속성을 가진 버그 리포트를 선별한다. 유사한 버그 리포트의 버그 정정 시간을 계산하여 새로운 버그의 정정 시간을 예측한다. 예측 정확도에 따라 버그 정정 시간에 영향을 미치는 속성 중 운영체제(os), 컴포넌트, 리포터, 할당자(assignee) 속성을 사용했을 때 버그 정정 시간 예측에 가장 좋은 정확도를 나타냈다.

말초혈액영상에서 신경망 모델을 이용한 적혈구의 형태학적 변이 분류 (Morphological Variation Classification of Red Blood Cells using Neural Network Model in the Peripheral Blood Images)

  • 김경수;김판구
    • 한국정보처리학회논문지
    • /
    • 제6권10호
    • /
    • pp.2707-2715
    • /
    • 1999
  • Recently, there have been researches to automate processing and analysing images in the medical field using image processing technique, a fast communication network, and high performance hardware. In this paper, we propose a system to be able to analyze morphological abnormality of red-blood cells for peripheral blood image using image processing techniques. To do this, we segment red-blood cells in the blood image acquired from microscope with CCD camera and then extract UNL fourier features to classify them into 15 classes. We reduce the number of multi-variate features using PCA to construct a more efficient classifier. Our system has the best performance in recognition rate, compared with two other algorithms, LVQ3 and k-NN. So, we show that it can be applied to a pathological guided system.

  • PDF

심전도를 이용한 경쟁-협력의 감성 인식 방법 (Emotion Recognition Method of Competition-Cooperation Using Electrocardiogram)

  • 박상인;이동원;문성철;황민철
    • 감성과학
    • /
    • 제21권3호
    • /
    • pp.73-82
    • /
    • 2018
  • 경쟁과 협력을 인식하는 것은 일하는 공간에서 상호작용 디자인을 하는 데에 필요한 요소이다. 본 연구는 타인과의 상호작용에서 유발되는 경쟁과 협력의 사회 감성을 심장의 생리 반응 패턴으로 객관적이고 정량적으로 인식하는 방법을 개발하는 것이 목적이다. 피험자 60명은 패턴 게임으로 구성된 과제로 경쟁-협력 실험에 참여하였고 심전도를 측정하였다. 심전도로부터 시간 영역 지표인 RRI와 SDNN, pNN50, rMSSD를 추출하였고, 주파수 영역 지표인 VLF와 LF, HF, VLF/HF, LF/HF, lnVLF, lnLF, lnHF, lnVLF/lnHF를 추출하였다. 독립 표본 t검정으로 사회 감성에 따라 추출한 지표들의 통계적 유의성을 확인하였다. 통계적으로 유의한 지표들로 단계적 판별 분석을 진행하여 선정된 SDNN, VLF, lnVLF/lnHF 지표로 경쟁-협력 규칙을 정의하고 검증하였다. 검증 결과 85%의 인식 정확도를 보였다. 본 연구에서 제안한 감성 인식 방법은 다양한 분야에 접목되어 사용자 맞춤형 서비스 제공에 활용될 수 있을 것이라 생각된다.

Pitch 히스토그램을 이용한 내용기반 음악 정보 검색 (Content-based Music Information Retrieval using Pitch Histogram)

  • 박만수;박철의;김회린;강경옥
    • 방송공학회논문지
    • /
    • 제9권1호
    • /
    • pp.2-7
    • /
    • 2004
  • 본 논문에서는 내용 기반 음악 정보 검색에 MPEG-7에 정의된 오디오 서술자를 적용하는 방법을 제안한다. 특히 Pitch 정보와 timbral 특징들은 음색 구분을 용이하게 할 수 있어 음악 검색뿐만 아니라 음악 장르 분류 또는 QBH(Query By Humming)에 이용 될 수 있다. 이러한 방법을 통하여 오디오 신호의 대표적인 특성을 표현 할 수 있는 특징벡터를 구성 할 수 있다면 추후에 멀티모달 시스템을 이용한 검색 알고리즘에도 오디오 특징으로 이용 될 수 있을 것이다. 본 논문에서는 방송 시스템에 적용하기 위해 영화나 드라마의 배경음악에 해당하는 O.S.T 앨범으로 검색 범위를 제한하였다. 즉, 사용자가 임의로 검색을 요청한 시점에서 비디오 컨텐츠로부터 추출한 임의의 오디오 클립만을 이용하여 그 컨텐츠 전체의 O.S.T 앨범 내에서 음악을 검색할 수 있도록 하였다. 오디오 특징 백터를 구성하기 위해 필요한 MPEG-7 오디오 서술자의 조합 방법을 제안하고 distance 또는 ratio 계산 방식을 통해 성능 향상을 추구하였다. 또한 reference 음악의 템플릿 구성 방식의 변화를 통해 성능 향상을 추구하였다. Classifier로 k-NN 방식을 사용하여 성능평가를 수행한 결과 timbral spectral feature 보다는 pitch 정보를 이용한 특징이 우수한 성능을 보였고 vector distance 방식으로는 특징들의 비율을 이용한 IFCR(Intra-Feature Component Ratio) 방식이 ED(Euclidean Distance) 방식보다 우수한 성능을 보였다.

메모리 기반 추론 기법에 기반한 점진적 다분할평균 알고리즘 (An Incremental Multi Partition Averaging Algorithm Based on Memory Based Reasoning)

  • 이형일
    • 전기전자학회논문지
    • /
    • 제12권1호
    • /
    • pp.65-74
    • /
    • 2008
  • 패턴 분류에 많이 사용되는 기법 중의 하나인 메모리 기반 추론 알고리즘은 단순히 메모리에 저장하고 분류 시에 저장된 패턴과 테스트 패턴간의 거리를 계산하여 가장 가까운 학습패턴의 클래스로 분류하는 기법이기 때문에 패턴의 개수가 늘어나면 메모리가 증가하고 또한 추가로 패턴이 발생할 경우 처음부터 다시 수행해야하는 문제점을 가지고 있다. 이러한 문제점을 해결하기 위하여 이미 학습한 대표패턴을 기억하고 새로 들어오는 패턴에 대해서만 학습하는 점진적 학습 방법을 제안한다. 즉 추가로 학습패턴이 발생할 경우 매번 전체 학습 패턴을 다시 학습하는 것이 아니라, 새로 추가된 데이터만을 학습하여 대표패턴을 추출하여 메모리사용을 줄이는 iMPA(incremental Multi Partition Averaging)기법을 제안하였다. 본 논문에서 제안한 기법은 대표적인 메모리기반 추론 기법인 k-NN 기법과 비교하여 현저하게 줄어든 대표패턴으로 유사한 분류 성능을 보여주며, 점진적 특성을 지닌 NGE 이론을 구현한 EACH 시스템과 점진적인 실험에서도 탁월한 분류 성능을 보여준다.

  • PDF