• 제목/요약/키워드: K-NN(K-Nearest Neighbor)

검색결과 198건 처리시간 0.03초

Mongolian Traditional Stamp Recognition using Scalable kNN

  • Gantuya., P;Mungunshagai., B;Suvdaa., B
    • International journal of advanced smart convergence
    • /
    • 제4권2호
    • /
    • pp.170-176
    • /
    • 2015
  • The stamp is one of the crucial information of traditional historical and cultural for nations. In this paper, we purpose to detect official stamps from scanned document and recognize the Mongolian traditional, historical stamps. Therefore we performed following steps: first, we detect official stamps from scanned document based on red-color segmentation and document standard. Then we collected 234 traditional stamp images with 6 classes and 100 official stamp images from scanned document images. Also we implemented the processing algorithms for noise removing, resize and reshape etc. Finally, we proposed a new scale invariant classification algorithm based on KNN (k-nearest neighbor). In the experimental result, our proposed a method had shown proper recognition rate.

도로 상에서 움직이는 객체를 위한 교차점 도로 모델 기반의 효율적인 색인방식 (An Efficient Indexing Method for Network Constrained Moving Objects Based on Intersection-oriented Network Model)

  • 윤호원;서동민;복경수;유재수;조기형
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.397-400
    • /
    • 2006
  • 본 논문에서는 위치기반 서비스에서 도로 네트워크 상을 움직이는 객체들의 현재 위치를 효율적으로 갱신하는 색인기법을 제안한다. 효율적인 시공간 질의 처리를 위하여 도로를 적절하게 분할하여 색인하게 된다. 기존의 도로 분할 방식은 연결정보를 포함하지 않기 때문에 객체가 현재의 도로 영역을 벗어났을 때 색인구조를 처음부터 검색해야 하는 단점이 있다. 제안하는 기법은 도로를 분할할 때 교차점을 포함하도록 분할하여 연결 정보가 유지되도록 한다. 이로 인해 제안하는 알고리즘은 객체가 색인된 현재의 도로 영역을 벗어났을 때 연결 정보와 NN(Nearest Neighbor) 검색 기법을 이용하여 벗어난 도로를 바로 찾아갈 수 있으므로 향상된 갱신 성능을 보인다.

  • PDF

Personal Identification Using Teeth Images

  • Kim Tae-Woo;Cho Tae-Kyung;Park Byoung-Soo;Lee Myung-Wook
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2004년도 ICEIC The International Conference on Electronics Informations and Communications
    • /
    • pp.435-437
    • /
    • 2004
  • This paper presents a personal identification method using teeth images. The method uses images for teeth expressions of anterior and posterior occlusion state and LDA-based technique. Teeth images give merits for recognition because teeth, rigid objects, cannot be deformed at the moment of image acquisition. In the experiments, personal identification for 12 people was successful. It was shown that our method can contribute to multi-modal authentication systems.

  • PDF

효율적인 Nearest Surrounder 질의 처리 방법 (Efficient Nearest Surrounder Queries Processing)

  • 최정임;정재화;김종완;임석진;강상원;정순영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (C)
    • /
    • pp.124-129
    • /
    • 2007
  • 지금까지 질의 점을 중심으로 최근접 객체(Nearest Neighbor : NN)를 찾는 다양한 연구가 진행되었다. 하지만 이 방법은 질의 점과 객체의 거리만을 고려하기 때문에 질의 점을 둘러싸고 있는 객체들을 찾을 수 없다는 문제점이 있다. 이것을 해결하기 위해서 제안 된 것이 최근접 주변객체(Nearest Surrounder : NS) 질의 처리이다. 최근접 주변 객체는 질의 점을 둘러싸고 있으면서 가장 가까운 객체들을 찾는 것에 대한 연구이다. 기존의 NS를 찾는 방법은 객체 인덱싱을 위하여 R-tree를 사용하며, 질의 점과 최소경계사각형(minimum bounding rectangle : MBR)이 이루는 각의 범위를 계산한다. 계산 수행 결과 각 MBR들 이 이루는 각의 범위가 겹치는 부분이 발생하면 해당 각 범위 내에서 질의 점으로부터 최소거리에 있는 MBR을 선택해야 하므로 범위별 질의 점과 MBR들의 최대 최소 거리를 구해야 한다. 이러한 범위별 계산 과정은 계산 비용을 높이는 단점이 있다. 따라서 본 논문에서는 NS를 필요로 하는 영역에서 각 범위별 겹쳐지는 MBR들의 꼭지점 좌표만을 비교한다. 이것은 기존 연구에서 계산 비용을 높이는 공통 각 계산 절차를 개선하고, 최대 최소 거리 계산 수행은 생략하여 NS를 찾는다. 제안 기법을 위해 논문에서 사용하는 각 알고리즘은 이전 연구보다 나은 계산비용 절감 효과를 가져 올 수 있다.

  • PDF

The Optimized Detection Range of RFID-based Positioning System using k-Nearest Neighbor Algorithm

  • 김정환;허준;한수희;김상민
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2008년도 공동추계학술대회
    • /
    • pp.270-271
    • /
    • 2008
  • The positioning technology for a moving object is an important and essential component of ubiquitous communication computing environment and applications, for which Radio Frequency IDentification Identification(RFID) is has been considered as also a core technology for ubiquitous wireless communication. RFID-based positioning system calculates the position of moving object based on k-nearest neighbor(k-nn) algorithm using detected k-tags which have known coordinates and k can be determined according to the detection range of RFID system. In this paper, RFID-based positioning system determines the position of moving object not using weight factor which depends on received signal strength but assuming that tags within the detection range always operate and have same weight value. Because the latter system is much more economical than the former one. The geometries of tags were determined with considerations in huge buildings like office buildings, shopping malls and warehouses, so they were determined as the line in 1-Dimensional space, the square in 2-Dimensional space and the cubic in 3-Dimensional space. In 1-Dimensional space, the optimal detection range is determined as 125% of the tag spacing distance through the analytical and numerical approach. Here, the analytical approach means a mathematical proof and the numerical approach means a simulation using matlab. But the analytical approach is very difficult in 2- and 3-Dimensional space, so through the numerical approach, the optimal detection range is determined as 134% of the tag spacing distance in 2-Dimensional space and 143% of the tag spacing distance in 3-Dimensional space. This result can be used as a fundamental study for designing RFID-based positioning system.

  • PDF

움직임 실루엣 영상의 일반적인 표현 방식에 대한 연구 (A General Representation of Motion Silhouette Image: Generic Motion Silhouette Image(GMSI))

  • 홍성준;이희성;김은태
    • 제어로봇시스템학회논문지
    • /
    • 제13권8호
    • /
    • pp.749-753
    • /
    • 2007
  • In this paper, a generalized version of the Motion Silhouette Image(MSI) called the Generic Motion Silhouette Image (GMSI) is proposed for gait recognition. The GMSI is a gray-level image and involves the spatiotemporal information of individual motion. The GMSI not only generalizes the MSI but also reflects a flexible feature of a gait sequence. Along with the GMSI, we use the Principal Component Analysis(PCA) to reduce the dimensionality of the GMSI and the Nearest Neighbor(NN) for classification. We apply the proposed feature to NLPR database and compare it with the conventional MSI. Experimental results show the effectiveness of the GMSI.

최적화 사례기반추론을 이용한 통신시장 고객관계관리 (Customer Relationship Management in Telecom Market using an Optimized Case-based Reasoning)

  • 안현철;김경재
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2006년도 추계학술대회 학술발표 논문집 제16권 제2호
    • /
    • pp.285-288
    • /
    • 2006
  • Most previous studies on improving the effectiveness of CBR have focused on the similarity function aspect or optimization of case features and their weights. However, according to some of the prior research, finding the optimal k parameter for the k-nearest neighbor (k-NN) is also crucial for improving the performance of the CBR system. Nonetheless, there have been few attempts to optimize the number of neighbors, especially using artificial intelligence (AI) techniques. In this study, we introduce a genetic algorithm (GA) to optimize the number of neighbors that combine, as well as the weight of each feature. The new model is applied to the real-world case of a major telecommunication company in Korea in order to build the prediction model for the customer profitability level. Experimental results show that our GA-optimized CBR approach outperforms other AI techniques for this mulriclass classification problem.

  • PDF

멀웨어 검출을 위한 기계학습 알고리즘과 특징 추출에 대한 성능연구 (A Study on Performance of ML Algorithms and Feature Extraction to detect Malware)

  • 안태현;박재균;권영만
    • 한국인터넷방송통신학회논문지
    • /
    • 제18권1호
    • /
    • pp.211-216
    • /
    • 2018
  • 이 논문에서는 알려지지 않은 PE 파일이 멀웨어의 여부를 분류하는 방법을 연구하였다. 멀웨어 탐지 영역의 분류 문제에서는 특징 추출과 분류가 중요하다. 위와 같은 목적으로 멀웨어 탐지를 위해 우리는 어떠한 특징들이 분류기에 적합한지, 어떠한 분류기가 선택된 특징들에 대해 연구하였다. 그래서 우리는 멀웨어 탐지를 위한 기능과 분류기의 좋은 조합을 찾기 위해 실험하였다. 이를 위해 두 단계로 실험을 실시하였다. 1 단계에서는 Opcode, Windows API, Opcode + Windows API의 특징들을 이용하여 정확도를 비교하였다. 여기에서 Opcode + Windows API 특징이 다른 특징보다 더 좋은 결과를 나타내었다. 2 단계에서는 나이브 베이즈, K-NN, SVM, DT의 분류기들의 AUC 값을 비교하였다. 그 결과 DT의 분류기가 더 좋은 결과 값을 나타내었다.

DNN 모델을 이용한 기계 학습 기반 k-최근접 질의 처리 최적화 기법 (k-NN Query Optimization Scheme Based on Machine Learning Using a DNN Model)

  • 위지원;최도진;이현병;임종태;임헌진;복경수;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제20권10호
    • /
    • pp.715-725
    • /
    • 2020
  • 본 논문에서는 고차원의 특징 벡터에서 질의와 가장 가까운 k개의 데이터를 찾는 k-최근접 질의 최적화 방법을 제안한다. k-최근접 질의는 k개의 데이터를 포함할 가능성이 있는 범위를 기반으로 범위 질의로 변환되어 처리하는 기법이다. 본 논문에서는 처리 비용을 감소시키고 검색 속도를 가속화 할 수 있는 최적의 범위를 도출하기 위해 k-최근접 질의 처리 시 DNN 모델을 이용한 최적화 기법을 제안한다. 제안하는 기법은 온라인 모듈과 오프라인 모듈로 구성된다. 온라인 모듈에서는 클라이언트로부터 요청을 받아 실제 질의를 처리한다. 오프라인 모듈에서는 과거 최적화 기법의 결과를 학습 로그로 사용한 DNN 모델로 최적의 범위를 도출하고 온라인 모듈로 전달한다. 제안하는 기법의 우수성 및 타당성의 입증을 위하여 다양한 성능 평가를 수행한다.

K번째 최근접 표본 재추출 방법에 의한 일 강우량의 추계학적 분해에 대한 연구 (Stochastic disaggregation of daily rainfall based on K-Nearest neighbor resampling method)

  • 박희성;정건희
    • 한국수자원학회논문집
    • /
    • 제49권4호
    • /
    • pp.283-291
    • /
    • 2016
  • 산업의 발전에 따라 기반시설 및 인구 등이 대도시에 밀집되어, 도시홍수방어는 인명피해 뿐만 아니라 재산피해 저감 차원에서도 매우 중요한 문제가 되었다. 요즘은 이러한 도시유역의 유출해석을 보다 정확하게 하기 위해 시강우나 분단위의 강우자료를 활용하고 있다. 하지만 기후변화 시나리오와 같은 미래 강우시나리오는 현재 일단위 수준으로 제공되므로 미래 강우에 대한 확률빈도 해석에 제한이 있다. 이에 본 연구에서는 추계학적 기법을 이용해 일강우 자료를 시강우 자료로 분해하고자 하였다. 일자료를 시자료로 분해하기 위해 과거 시강우 자료를 기반으로 Gram Schmidt 변환과 K개의 최근접 표본 중 하나를 재추출하는 비모수적인 기법(KNNR)을 적용하였다. 이 방법은 연유출량을 월유출량으로 분해하기 위해 개발된 것이다. 하지만 강우자료는 유출량 자료와 달리 확률밀도가 작아 일강우를 시강우로 분해하는 데 직접 적용하는 경우 결과가 실제와 유사한 통계 패턴을 갖는다고 보기 어려웠다. 이를 보완하기 위해 본 연구에서는 분해하고자 하는 일자의 전일과 후일을 포함한 3일 강우패턴을 7개로 구분하고 동일 패턴을 가진 자료들만 분해에 이용하도록 하여 강우자료에 대한 적용성을 높였다. 과거 52년간의 서울기상관측소 시강우 자료를 이용하여 강우자료의 분해에 대한 결과를 분석한 결과, 분해된 시강우 자료가 관측된 시강우자료와 통계적으로 매우 유사한 것을 확인하였다. 향후 기후변화자료의 시강우 분해 등에 활용하여 보다 정확한 도시유출에 대한 빈도해석 등에 적용할 수 있을 것으로 판단된다.