• 제목/요약/키워드: 최근접 이웃 분류

검색결과 77건 처리시간 0.033초

랜덤 투영 앙상블 기법을 활용한 적응 최근접 이웃 판별분류기법 (Random projection ensemble adaptive nearest neighbor classification)

  • 강종경;전명식
    • 응용통계연구
    • /
    • 제34권3호
    • /
    • pp.401-410
    • /
    • 2021
  • 판별분류분석에서 널리 이용되는 k-최근접 이웃 분류 방법은 고정된 이웃의 수만을 고려하여 자료의 국소적 특징을 반영하지 못하는 한계가 있다. 이에 자료의 국소적 구조를 고려하여 이웃의 개수를 선택하는 적응 최근접이웃방법이 개발된 바 있다. 고차원 자료의 분석에 있어서는 k-최근접 이웃 분류를 사용하기 전에 랜덤 투영 기법 등을 활용하여 차원 축소를 수행하는 것이 일반적이다. 이렇게 랜덤 투영시킨 다수의 분류 결과들을 면밀히 조합하여 투표를 통해 최종 할당을 하는 기법이 최근 개발된 바 있다. 본 연구에서는 고차원 자료에서의 분석을 위해 적응 최근접이웃방법과 랜덤 투영 앙상블 기법을 조합한 새로운 판별분류 기법을 제안하였다. 제안된 방법은 기존에 개발된 방법에 비해 분류 정확성 측면에서 더 뛰어남을 모의실험 및 실제 사례 분석을 통해 확인하였다.

k-최근접 이웃 정보를 활용한 베이지안 추론 분류

  • 노영균;김기응;이태훈;윤성로
    • 정보와 통신
    • /
    • 제31권11호
    • /
    • pp.27-34
    • /
    • 2014
  • 본 리뷰 논문에서는 많은 데이터 환경에서 얻어진 k-최근접 이웃들(k-nearest neighbors)의 이론적 성질로부터 어떻게 분류를 위한 알고리즘을 만들어낼 것인가에 대한 여러 가지 방법들을 설명한다. 많은 데이터 환경에서의 최근접 이웃 데이터의 정보는 다양한 기계학습 문제를 푸는데 아주 좋은 이론적인 성질을 가지고 있다. 하지만, 이런 이론적인 특성들이 데이터가 많지 않은 환경에서는 전혀 나타나지 않을 뿐 아니라 오히려 다른 다양한 알고리즘들에 비해 성능이 많이 뒤쳐지는 결과를 보여주고 있다. 본 리뷰 논문에서는 많은 데이터 환경 하에서 k-최근접 이웃들의 정보가 어떤 이론적인 특성을 가지는지 설명하고, 특별히 이런 특성들을 가지고 k-최근접 이웃을 이용한 분류 문제를 어떻게 베이지안 추론(Baysian inference) 문제로 수식화 할 수 있는지 보인다. 마지막으로 현재의 빅데이터 환경에서 실용적으로 사용할 수 있는 알고리즘들을 소개한다.

바이올린과 첼로 연주 데이터를 이용한 분류 알고리즘의 성능 비교 (Performance Comparison of Classification Algorithms in Music Recognition using Violin and Cello Sound Files)

  • 김재천;곽경섭
    • 한국통신학회논문지
    • /
    • 제30권5C호
    • /
    • pp.305-312
    • /
    • 2005
  • 음악인식에 주로 사용되는 세 가지 알고리즘의 성능을 비교하였다. 다양한 분류알고리즘을 소개하고 그 중 베이지안법, 최근접이웃법과 k-최근접이웃법을 이용하여 악기를 분류하였다. 악기 샘플파일에서 영교차율, 평균, 분산, 평균피크레벨의 4가지 특성값을 추출하여 분류시스템의 데이터로 사용하였다. 사용된 악기 샘플은 바이올린, 바로크 바이올린, 바로크 첼로이다. 실험결과 최근접이웃 알고리즘이 악기 분류에 있어서 가장 좋은 성능을 보여 주었다. 최근접이웃 알고리즘은 단순하면서도 빠른 계산결과를 보여 악기 분류에 적절한 알고리즘으로 판단되었다.

최근접 이웃 규칙 기반 프로토타입 선택과 편의-분산을 이용한 성능 평가 (Nearest-neighbor Rule based Prototype Selection Method and Performance Evaluation using Bias-Variance Analysis)

  • 심세용;황두성
    • 전자공학회논문지
    • /
    • 제52권10호
    • /
    • pp.73-81
    • /
    • 2015
  • 이 논문은 프로토타입 선택 방법을 제안하고, 편의-분산 분해를 이용하여 최근접 이웃 알고리즘과 프로토타입 기반 분류 학습의 일반화 성능 비교 평가에 있다. 제안하는 프로토타입 분류기는 클래스 영역 내에서 가변 반지름을 이용한 다차원 구를 정의하고, 적은 수의 프로토타입으로 구성된 새로운 훈련 데이터 집합을 생성한다. 최근접 이웃 분류기는 새 훈련 집합을 이용하여 테스트 데이터의 클래스를 예측한다. 평균 기대 오류의 편의와 분산 요소를 분해하여 최근접 이웃 규칙, 베이지안 분류기, 고정 반지름을 이용한 프로토타입 선택 방법, 제안하는 프로토타입 선택 방법의 일반화 성능을 비교한다. 실험에서 제안하는 프로토타입 분류기의 편의-분산 변화 추세는 모든 훈련 데이터를 사용하는 최근접 이웃 알고리즘과 비슷한 편의-분산 추세를 보였으며, 프로토타입 선택 비율은 전체 데이터의 평균 약 27.0% 이하로 나타났다.

유전알고리즘을 이용한 최적 k-최근접이웃 분류기 (Optimal k-Nearest Neighborhood Classifier Using Genetic Algorithm)

  • 박종선;허균
    • Communications for Statistical Applications and Methods
    • /
    • 제17권1호
    • /
    • pp.17-27
    • /
    • 2010
  • 분류분석에 사용되는 k-최근접이웃 분류기에 유전알고리즘을 적용하여 의미 있는 변수들과 이들에 대한 가중치 그리고 적절한 k를 동시에 선택하는 알고리즘을 제시하였다. 다양한 실제 자료에 대하여 기존의 여러 방법들과 교차타당성 방법을 통하여 비교한 결과 효과적인 것으로 나타났다.

클래스 영역의 다차원 구 생성에 의한 프로토타입 기반 분류 (Prototype based Classification by Generating Multidimensional Spheres per Class Area)

  • 심세용;황두성
    • 한국컴퓨터정보학회논문지
    • /
    • 제20권2호
    • /
    • pp.21-28
    • /
    • 2015
  • 본 논문에서는 최근접 이웃 규칙을 이용한 프로토타입 선택 기반 분류 학습을 제안하였다. 각 훈련 데이터가 대표하는 클래스 영역을 구(sphere)로 분할하는데 최근접 이웃 규칙을 적용시키며, 구의 내부는 동일 클래스 데이터들만 포함하도록 한다. 프로토타입은 구의 중심점이며 프로토타입의 반지름은 가장 인접한 다른 클래스 데이터와 가장 먼 동일 클래스 데이터의 중간 거리 값으로 결정한다. 그리고 전체 훈련 데이터를 대표하는 최소의 프로토타입 집합을 선택하기 위해 집합 덮개 최적화를 이용하여 프로토타입 선택 문제를 변형시켰다. 제안하는 프로토타입 선택 방법은 클래스 별 적용이 가능한 그리디 알고리즘으로 설계되었다. 제안하는 방법은 계산 복잡도가 높지 않으며, 대규모 훈련 데이터에 대한 병렬처리의 가능성이 높다. 프로토타입 기반 분류 학습은 선택된 프로토타입 집합을 새로운 훈련 데이터 집합으로 사용하고 최근접 이웃 규칙을 적용하여 테스트 데이터의 클래스를 예측한다. 실험에서 제안하는 프로토타입 기반 분류기는 최근접 이웃 학습, 베이지안 분류 학습과 다른 프로토타입 분류기에 비해 일반화 성능이 우수하였다.

최근접 이웃 커널을 이용한 깊이 영상 완성 기술 (Depth Map Completion using Nearest Neighbor Kernel)

  • 정태현;우딘 쿠툽;오병태
    • 방송공학회논문지
    • /
    • 제27권6호
    • /
    • pp.906-913
    • /
    • 2022
  • 본 논문에서는 희소 깊이 영상과 컬러 영상을 이용해 조밀한 깊이 영상을 추정하는 깊이 완성을 수행하기 위해 최근접 이웃 커널 기술을 사용하는 방식의 네트워크를 제안한다. 먼저 예측하고자 하는 깊이 영상을 대략적인 깊이 정보의 구조 정보를 포함하는 부분과 세밀한 깊이 정보를 가지는 상세 부분으로 분할하여 예측하는 방식을 제안한다. 이 과정에서 깊이 영상의 구조 및 상세 정보는 분류 기법과 회귀 기법을 활용하여 각각 추정하였으며, 특히 분류 과정에서 최근접 이웃 커널 정보를 활용하여 주변 정보를 통해 분류를 진행하는 방식을 제안하였다. 제안 방식은 기존의 희소 깊이 완성 방식과 비교하여 우수한 성능을 나타냈고, 시각적으로도 만족할만한 결과를 보이게 됨을 확인하였다.

클래스 초월구를 이용한 프로토타입 기반 분류 (Prototype-Based Classification Using Class Hyperspheres)

  • 이현종;황두성
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권10호
    • /
    • pp.483-488
    • /
    • 2016
  • 본 논문은 최근접 이웃 규칙을 이용한 프로토타입을 이용하는 분류 학습을 제안한다. 훈련 데이터가 대표하는 클래스 영역을 초월구로 분할하는데 최근접 이웃규칙을 적용시키며, 초월구는 동일 클래스 데이터들만 포함시킨다. 초월구의 반지름은 가장 인접한 다른 클래스 데이터와 가장 먼 동일 클래스 데이터의 중간 거리 값으로 결정한다. 그리고 전체 훈련 데이터를 대표하는 최소의 프로토타입 집합을 선택하기 위해 집합 덮개 최적화를 이용한다. 제안하는 선택 방법은 클래스 별 프로토타입을 선택하는 그리디 알고리즘으로 설계되며, 대규모 훈련 데이터에 대한 병렬처리가 가능하다. 분류 예측은 최근접 이웃 규칙을 이용하며, 새로운 훈련 데이터는 프로토타입 집합이다. 실험에서 제안하는 방법은 기 연구된 학습 방법에 비해 일반화 성능이 우수하다.

K-최근접 이웃 알고리즘을 활용한 심장병 진단 및 예측 (Classification of Heart Disease Using K-Nearest Neighbor Imputation)

  • 박평우;이석원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.742-745
    • /
    • 2017
  • 본 논문은 심장질환 도메인에 데이터 마이닝 기법을 적용한 연구로, 기존 환자의 정보에 대하여 K-최근접 이웃 알고리즘을 통해 결측 값을 대체하고, 대표적인 예측 분류기인 나이브 베이지안, 소포트 벡터 머신, 그리고 다층 퍼셉트론을 적용하여 각각 결과를 비교 및 분석한다. 본 연구의 실험은 K 최적화 과정을 포함하고 10-겹 교차 검증 방식으로 수행되었으며, 비교 및 분석은 정확도와 카파 통계치를 통해 판별한다.

특성함수 및 k-최근접이웃 알고리즘을 이용한 국악기 분류 (Classification of Korean Traditional Musical Instruments Using Feature Functions and k-nearest Neighbor Algorithm)

  • 김석호;곽경섭;김재천
    • 한국멀티미디어학회논문지
    • /
    • 제9권3호
    • /
    • pp.279-286
    • /
    • 2006
  • 주파수 분포벡터를 이용한 분류방법을 국악기 분류 및 인식에 적용하였으며 분류에 사용되는 주파수 분포 벡터 중에서 리듬성분을 수치화한 평균피크값을 제안하였다. 대부분의 주파수 처리함수들은 주파수값의 평균, 통계적특성에 기반을 두고 있으며 국악기자동분류를 위해 신호의 평균, 분산, 영교차율, 균형주파수, 평균 피크값을 이용하여 실험하였다. 국악의 장르 구분을 위한 선행 연구로서 음악신호를 함수처리하고 k-최근접이웃 분류알고리즘을 적용하여 분류하였다. 기존의 주파수 분포벡터를 이용하여 발표되었던 서양음악의 분류 성공률 87%보다 향상된 94.44%의 성공률을 나타냈다.

  • PDF