• 제목/요약/키워드: K-Nearest Neighbor 알고리즘

검색결과 204건 처리시간 0.023초

비공간 검색 조건이 포함된 k-최근접 질의 처리를 위한 R-트리와 시그니쳐 파일의 결합 (Combining R-trees and Signature Files for Handling k-Nearest Neighbor Queries with Non-spatial Predicates)

  • 박동주;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제27권4호
    • /
    • pp.651-662
    • /
    • 2000
  • 멀티미디어 데이터베이스에서 k-최근접 질의는 가장 일반적이며, 비공간 검색 조건이 포함된 경우가 많다. 현재까지 이러한 질의를 위한 여러 기법 중에서 Hjaltason과 Samet이 제안한 점증적 최근접 알고리즘에 가장 유용하다고 알려져 있다. 질의 처리를 위해 상위 연산자가 k보다 많은 객체를 요구할 때, 이 알고리즘은 처음부터 질의를 재실행하지 않고 다음 객체를 전달할 수 있기 때문이다. 그런데, 이 알고리즘에서 사용하는 R-트리는 결국에는 비공간 검색조건을 만족시키지 않을 투플 후보들을 부분적으로 제거할 수가 없기 때문에 비효율적이다. 본 논문에서 우리는 이 알고리즘을 보완한 RS-트리 기반 점증적 최근접 알고리즘을 제안한다. RS-트리는 R-트리와, 그 보조 트리로서 계층적 시스니쳐 파일을 기반으로 하는 S-트리로 구성된다. S-트리는 R-트리를 탐색하는 과정에서 많은 불필요한 투플을 제거하는 역할을 수행한다. 본 논문에서는 실험을 통해 RS-트리가 Hjaltason과 Samet의 알고리즘의 성능을 향상시킬 수 있음을 보인다.

  • PDF

SOM기반 특징 신호 추출 기법을 이용한 불균형 주기 신호의 이상 탐지 (Fault Detection of Unbalanced Cycle Signal Data Using SOM-based Feature Signal Extraction Method)

  • 김송이;강지훈;박종혁;김성식;백준걸
    • 한국시뮬레이션학회논문지
    • /
    • 제21권2호
    • /
    • pp.79-90
    • /
    • 2012
  • 본 연구는 공정신호가 불균형 데이터인 경우 이상 탐지 알고리즘의 성능 개선을 위한 특징 신호 추출 기법을 제안한다. 불균형 데이터란 범주 구분 문제에서 하나의 범주의 속하는 데이터의 비율이 다른 범주의 데이터에 비해 크게 차이나 이상 탐지성능이 크게 저하되는 경우를 의미한다. 공정이 운영되는 경우 얻을 수 있는 이상 신호의 수는 정상 신호에 비해 매우 적기에 이러한 문제를 해결하여 이상 탐지 기법을 적용하는 것은 매우 중요하다. 불균형 문제 해결을 위해 SOM(Self-Organizing Map) 알고리즘을 이용하여 각 노드에 대응되는 가중치를 특징 신호로 간주하여 정상 데이터와 이상 데이터의 비율을 맞춘다. 특징 신호 데이터 집단의 이상 탐지를 위해 클래스 분류 기법인 kNN(k-Nearest Neighbor)과 SVM(Support Vector Machine)을 적용하여 이를 공정 신호 이상탐지를 위해 주로 사용하는 Hotelling's $T^2$ 관리도와 성능을 비교한다. 반도체 공정에서 발생한다고 알려진 공정 신호를 모사하여 신호 알고리즘 성능의 우수성을 검증한다.

빅데이터 환경에서 기계학습 알고리즘 응용을 통한 보안 성향 분석 기법 (Security tendency analysis techniques through machine learning algorithms applications in big data environments)

  • 최도현;박중오
    • 디지털융복합연구
    • /
    • 제13권9호
    • /
    • pp.269-276
    • /
    • 2015
  • 최근 빅데이터 관련 산업 활성화에 따라 글로벌 보안 업체들은 지능적인 보안 위협 모니터링과 예방을 위해 분석 데이터의 범위를 정형/비정형 데이터로 확대하고, 보안 예방을 목적으로 사용자의 성향 분석 기법을 활용하려는 추세이다. 이는 기존 정형 데이터(기존 수치화 가능한 자료)의 분석 결과에서 추론할 수 있는 정보의 범위가 한정적이기 때문이다. 본 논문은 빅데이터 환경에서 기계학습 알고리즘($Na{\ddot{i}}ve$ Bayes, Decision Tree, K-nearest neighbor, Apriori)을 효율적으로 응용하여 보안 성향(목적 별 항목 분류, 긍정 부정 판단, 핵심 키워드 연관성 분석)을 분석하는데 활용한다. 성능 분석 결과 보안 성향 판단을 위한 보안항목 및 특정 지표를 정형/비정형 데이터에서 추출할 수 있음을 확인하였다.

고차 국소 자동 상관 특징 정보를 이용한 외관 기반 객체 인식 (Appearance-based Object Recognition Using Higher Order Local Auto Correlation Feature Information)

  • 강명아
    • 한국정보통신학회논문지
    • /
    • 제15권7호
    • /
    • pp.1439-1446
    • /
    • 2011
  • 본 논문에서는 고차 상관 특정 정보와 주성분 분석을 결합하여 차원을 낮추면서도 객체 인식을 유지하고, 고유 공간 구성 시간을 현저하게 줄이는 알고리즘에 대해 기술한다. 제안된 방법은 기존의 기하학적 정보를 이용하거나 스테레오 영상을 이용하는 방법에 비해 많은 계산량이 요구되지 않기 때문에 실시간 시스템 구축에 매우 적합하다는 것이 실험을 통하여 증명되었다. 또한 인식률을 향상시키기 위해 단순히 기존의 방법인 point to point 방식인 단순 거리 계산은 오차가 많기 때문에 본 논문에서는 개선된 Class to Class방식인 K-Nearest Neighbor을 이용하여 몇 개의 연속적인 입력영상을 인식의 단위로 이용하여 인식 오차를 줄일 수 있었다.

세그먼트 적합성 판단을 위한 계층적 최근접 검색 기법 (Hierarchical Nearest-Neighbor Method for Decision of Segment Fitness)

  • 신복숙;차의영;이임건
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2007년도 추계종합학술대회
    • /
    • pp.418-421
    • /
    • 2007
  • 이 논문에서는 곤충 발자국의 패턴을 판별하기 위한 전 단계로 추출되는 군집화된 세그먼트들 중에서, 곤충 발자국의 패턴을 분석하는 데에 부적합한 세그먼트들을 제거하기 위한 계층적 최근접 검색 기법을 제안한다. 발자국 형태와 거의 구별되지 않는 비정형적인 노이즈는 발자국과 서로 구별되는 특징을 규명하기 전까지는 영상처리 전 단계에서 완전히 제거될 수 없어 군집화 기법에 의해 추출된 세그먼트에도 이러한 노이즈를 내포하게 된다. 따라서 모든 세그먼트의 적합성을 평가하여, 노이즈 정보로 인해 타당성이 부족한 세그먼트를 제거함으로써 다음 단계에 수행되는 세그먼트들에 대한 곤충 발자국 패턴의 특징값 추출 성능이 향상될 수 있다.

  • PDF

HD-Tree: 고성능 Lock-Free NNS KD-Tree (HD-Tree: High performance Lock-Free Nearest Neighbor Search KD-Tree)

  • 이상기;정내훈
    • 한국게임학회 논문지
    • /
    • 제20권5호
    • /
    • pp.53-64
    • /
    • 2020
  • KD-Tree에서 NNS의 구현은 다차원 데이터를 다루는 응용 프로그램에서 필수적이다. 본 논문에서는 자료구조의 동시 수정, 검색이 일어나는 멀티스레드 상황에서 NNS를 지원하는 고성능 Lock-Free KD-Tree인 HD-Tree를 제안한다. HD-Tree는 동기화에 사용되는 노드 수를 최소화하고, 사용하는 원자 연산자의 수를 감소시켜 성능을 개선하였다. 실험 결과 HD-Tree는 8코어 16스레드의 멀티코어 시스템에서 기존의 NNS보다 성능이 최대 95% 향상되었고, 삽입/삭제연산은 코어보다 스레드가 많은 상황에서 기존 알고리즘보다 최대 15%향상된 성능을 보여준다.

ICA-factorial 표현법을 이용한 얼굴감정인식 (Facial Expression Recognition using ICA-Factorial Representation Method)

  • 한수정;곽근창;고현주;김승석;전명근
    • 한국지능시스템학회논문지
    • /
    • 제13권3호
    • /
    • pp.371-376
    • /
    • 2003
  • 본 논문에서는 효과적인 정보를 표현하는 Independent Component Analysis(ICA)-factorial 표현방법을 이용하여 얼굴감정 인식을 수행한다. 얼굴감정인식은 두 단계인 특징추출 과정과 인식과정에 의해 이루어진다. 먼저 특징추출방법은 주성분 분석(Principal Component Analysis)을 이용하여 얼굴영상의 고차원 공간을 저차원 특징공간으로 변환한 후 ICA-factorial 표현방법을 통해 좀 더 효과적으로 특징벡터를 추출한다. 인식단계는 최소거리 분류방법인 유클리디안 거리에 근거한 K-Nearest Neighbor 알고리즘으로 얼굴감정을 인식한다. 6개의 기본감정(기쁨, 슬픔, 화남, 놀람, 공포, 혐오)에 대해 얼굴 감정 데이터베이스를 구축하고 실험해본 결과 기존의 방법보다 좋은 인식 성능을 얻었다.

Fingerprinting 무선측위 알고리즘을 이용한 영역 기반의 주파수 간섭 관리 기법 (Location-based Frequency Interference Management Scheme Using Fingerprinting Localization Algorithms)

  • 홍애란;김광열;양모찬;오선애;정홍규;신요안
    • 한국통신학회논문지
    • /
    • 제37C권10호
    • /
    • pp.901-908
    • /
    • 2012
  • 미래의 지능형 공장 환경은 관리자가 M2M (Machine-to-Machine) 통신을 이용하여 원격으로 공장 안의 기기들의 동작 상태와 환경을 인지하고 관리하는 것을 목표로 하고 있다. 하지만, 공장 안에서 사용하는 통신 프로토콜인 WLAN (Wireless Local Area Network), ZigBee, Bluetooth 등은 동일한 ISM (Industrial Scientific Medical) 대역을 사용하기 때문에 상호 간섭이 발생하게 된다. 본 논문에서는 Fingerprinting 무선측위 기술을 이용하여 영역 기반으로 주파수를 할당하는 기법을 제안한다. 그리고 일반적인 기법이 가지고 있는 측위 성능의 문제점을 개선하기 위하여, k-NN (Nearest Neighbor) 알고리즘을 적용하고 또한 이를 기반으로 한 새로운 기법도 제안한다. 모의실험 결과를 통해 제안된 무선측위 알고리즘이 다른 기법들보다 측위 성능의 오차가 감소하였으며, 궁극적인 목표로 하고 있는 채널 간섭율 또한 향상되었기에 주파수의 간섭을 보다 효율적으로 관리할 수 있다는 결론을 얻었다. 아울러 지속적인 위치 추정을 통하여 공장 환경 내 안전도 보장할 수 있음을 확인하였다.

놈(Norm)에 따른 k-최근접 이웃 학습의 성능 변화 (k-Nearest Neighbor Learning with Varying Norms)

  • 김두혁;김찬주;황규백
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.371-375
    • /
    • 2008
  • 예제 기반 학습(instance-based learning) 방법 중 하나인 k-최근접 이웃(k-nearest reighbor, k-NN) 학습은 간단하고 예측 정확도가 비교적 높아 분류 및 회귀 문제 해결을 위한 기반 방법론으로 널리 적용되고 있다. k-NN 학습을 위한 알고리즘은 기본적으로 유클리드 거리 혹은 2-놈(norm)에 기반하여 학습예제들 사이의 거리를 계산한다. 본 논문에서는 유클리드 거리를 일반화한 개념인 p-놈의 사용이 k-NN 학습의 성능에 어떠한 영향을 미치는지 연구하였다. 구체적으로 합성데이터와 다수의 기계학습 벤치마크 문제 및 실제 데이터에 다양한 p-놈을 적용하여 그 일반화 성능을 경험적으로 조사하였다. 실험 결과, 데이터에 잡음이 많이 존재하거나 문제가 어려운 경우에 p의 값을 작게 하는 것이 성능을 향상시킬 수 있었다.

  • PDF

IoT 네트워크에서 악성 트래픽을 탐지하기 위한 머신러닝 알고리즘의 성능 비교연구 (A comparative study of the performance of machine learning algorithms to detect malicious traffic in IoT networks)

  • 현미진
    • 디지털융복합연구
    • /
    • 제19권9호
    • /
    • pp.463-468
    • /
    • 2021
  • IoT는 기술의 발전과 IoT 기기의 보급 및 서비스의 활성화로 폭발적인 증가세를 보이고 있지만, 최근 다양한 봇넷의 활동에 의해 심각한 보안 위험과 재정적 피해가 발생하고 있다. 따라서 이러한 봇넷의 활동을 정확하고 빠르게 탐지하는 것이 중요하다고 할 수 있다. IoT 환경에서의 보안은 최소한의 프로세싱 성능과 메모리로 운영을 해야 하는 특성이 있는 만큼, 본 논문에서는 탐지를 위한 최소한의 특성을 선택하고, KNN(K-Nearest Neighbor), Naïve Bayes, Decision Tree, Random Forest와 같은 머신러닝 알고리즘이 봇넷의 활동을 탐지하는 성능을 비교연구 하였다. Bot-IoT 데이터셋을 사용한 실험 결과는 적용한 머신러닝 알고리즘 중 KNN이 DDoS, DoS, Reconnaissance 공격을 가장 효과적이고 효율적으로 탐지할 수 있음을 보여주었다.