• 제목/요약/키워드: 최근접 이웃 알고리즘

검색결과 98건 처리시간 0.028초

프로토타입 선택을 이용한 최근접 분류 학습의 성능 개선 (Performance Improvement of Nearest-neighbor Classification Learning through Prototype Selections)

  • 황두성
    • 전자공학회논문지CI
    • /
    • 제49권2호
    • /
    • pp.53-60
    • /
    • 2012
  • 최근접 이웃 분류에서 입력 데이터의 클래스는 선택된 근접 학습 데이터들 중에서 가장 빈번한 클래스로 예측된다. 최근접분류 학습은 학습 단계가 없으나, 준비된 데이터가 모두 예측 분류에 참여하여 일반화 성능이 학습 데이터의 질에 의존된다. 그러므로 학습 데이터가 많아지면 높은 기억 장치 용량과 예측 분류 시 높은 계산 시간이 요구된다. 본 논문에서는 분리 경계면에 위치한 학습 데이터들로 구성된 새로운 학습 데이터를 생성시켜 분류 예측을 수행하는 프로토타입 선택 알고리즘을 제안한다. 제안하는 알고리즘에서는 분리 경계 영역에 위치한 데이터를 Tomek links와 거리를 이용하여 선별하며, 이미 선택된 데이터와 클래스와 거리 관계 분석을 이용하여 프로토타입 집합에 추가 여부를 결정한다. 실험에서 선택된 프로토타입의 수는 원래 학습 데이터에 비해 적은 수의 데이터 집합이 되어 최근접 분류의 적용 시 기억장소의 축소와 빠른 예측 시간을 제공할수 있다.

정지영상 확대시 보간법에 관한 연구 (A Study on Interpolation for Enlarged Still Image)

  • 강길봉;양영수;김장형
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2001년도 춘계종합학술대회
    • /
    • pp.643-648
    • /
    • 2001
  • 본 논문은 정지영상을 확대했을 때 높은 해상도_를 얻기 위한 영상 처리 기술로서 기존의 보간법 이외에 새로운 보간법을 제안했다. 영상 처리에서 주로 사용되는 보간법인 최근접 이웃화소 보간법과 양선형 보간법인 두 보간법을 조합하여 장점을 살리고 단점을 보완하는 알고리즘으로서 향상된 화질의 확대 영상을 얼을 수 있는 혼합형 보간법에 대하여 연구를 하였다.

  • PDF

지적 구조 분석을 위한 새로운 클러스터링 기법에 관한 연구 (A novel clustering method for examining and analyzing the intellectual structure of a scholarly field)

  • 이재윤
    • 정보관리학회지
    • /
    • 제23권4호
    • /
    • pp.215-231
    • /
    • 2006
  • 패스파인더 네트워크를 사용하여 지적 구조의 분석과 규명을 시도한 여러 연구가 발표되었다. 패스파인더 네트워크는 다차원척도법에 비해서 여러 장점을 가지고 있지만 구축 알고리즘의 복잡도가 매우 높아서 실행 시간이 오래 걸리며, 전통적인 지적 구조 분석에 유용하게 사용되어온 군집분석을 함께 적용하기가 어려운 것이 단점이다. 이 연구에서는 이와 같은 패스파인더 네트워크의 약점을 보완할 수 있는 새로운 기법으로 병렬최근접이웃클러스터링(PNNC) 기법을 제안하였다. PNNC 기법의 클러스터링 성능을 전통적인 계층적 병합식 클러스터링 기법들과 비교해본 결과 효과성과 효율성 양면에서 기존 기법보다 우세한 것으로 확인되었다.

대사증후군의 예측 모델링을 위한 베이지안 네트워크의 속성 순서 최적화 (An Attribute Ordering Optimization in Bayesian Networks for Prognostic Modeling of the Metabolic Syndrome)

  • 박한샘;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (A)
    • /
    • pp.1-3
    • /
    • 2006
  • 대사증후군은 당뇨병, 고혈압, 복부 비만, 고지혈증 등의 질병이 한 개인에게 동시에 발현하는 것을 말하며, 최근 경제여건의 향상 및 식생활 습관의 변화와 함께 우리나라에서도 심각한 문제가 되고 있다. 한편 불확실성의 처리를 위해 많이 사용되는 베이지안 네트워크는 사람이 분석 가능한 확률 기반의 모델로 최근 의학분야에서 질병의 진단이나 예측모델을 구성하기 위한 방법으로 유용하게 사용되고 있다. 베이지안 네트워크의 구조를 학습하는 대표적인 알고리즘인 K2 알고리즘은 속성이 입력되는 순서의 영향을 받으며, 따라서 이 또한 하나의 주제로써 연구되어 왔다. 본 논문에서는 유전자 알고리즘을 이용하여 베이지안 네트워크에 입력되는 속성 순서를 최적화하며 이 과정에서 의학지식을 적용해 효율적인 최적화가 가능하도록 하였다. 제안하는 모델을 통해 1993년의 데이터를 가지고 1995년의 상태를 예측하는 분류 실험을 수행한 결과 속성 순서 최적화 후에 이전보다 향상된 예측율을 보였으며 또한 다층 신경망, k-최근접 이웃 등을 이용한 다른 모델보다 더 높은 예측율을 보였다.

  • PDF

감시정찰 센서네트워크의 표적 탐지 및 식별 알고리즘에 관한 연구

  • 심현민;김태복;김이형;강태인
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2007년도 추계학술대회
    • /
    • pp.324-328
    • /
    • 2007
  • 본 논문은 감시정찰 센서네트워크에서 센서노드의 주요 기능인 표적의 탐지 및 식별을 위한 알고리즘을 제안한다. 감시정찰 센서네트워크에서 각 센서노드는 노드의 크기 및 센서, 프로세서, 네트워크, 전원 등의 자원의 제약이 있기 때문에 침입하는 적의 탐지 및 종류 식별을 위해서는 효율적인 알고리즘의 선정과 최적화가 요구된다. 본 논문에서는 음향, 진동, PIR, 자기 센서 등을 이용하여 사람, 차량 및 궤도 차량의 침입을 탐지하기 위한 적응 임계값 알고리즘과 그 종류를 식별하기 위한 최대우도추정 기법, k-최근접 이웃 추정 기법에 기반한 표적의 탐지 및 식별 알고리즘을 제안한다. 실험결과 음향 및 진동 센서에 의한 차량의 탐지, PIR 센서에 의한 사람의 탐지가 가능함을 확인할 수 있었으며 주파수 특징점을 이용하여 차량과 궤도차량의 종류식별이 가능함을 확인할 수 있었다.

  • PDF

다중소스 데이터 융합 기반의 가스 누출 예측을 위한 선형 보간 및 머신러닝 기법 (Linear interpolation and Machine Learning Methods for Gas Leakage Prediction Base on Multi-source Data Integration)

  • 홍고르출;조겨리;김미혜
    • 한국융합학회논문지
    • /
    • 제13권3호
    • /
    • pp.33-41
    • /
    • 2022
  • 본 논문에서는 다중 요인을 고려한 천연 가스 누출 정도 예측을 위해 관련 요인을 포함하는 기상청 자료와 천연가스 누출 자료를 통합하고, 요인 분석을 기반으로 중요 특성을 선택하는 머신러닝 기법을 제안한다. 제안된 기법은 3단계 절차로 구성되어 있다. 먼저, 통합 데이터 셋에 대해 선형 보간법을 수행하여 결측 데이터를 보완하는 전처리를 수행한다. 머신러닝 모델 학습 최적화를 위해 OrdinalEncoder(OE) 기반 정규화와 함께 요인 분석을 사용하여 필수 특징을 선택하며, 데이터 셋은 k-평균 클러스터링으로 레이블을 지정한다. 최종적으로 K-최근접 이웃, DT(Decision Tree), RF(Random Forest), NB(Naive Bayes)의 네 가지 알고리즘을 사용하여 가스 누출 수준을 예측한다. 제안된 방법은 정확도, AUC, 평균 표준 오차(MSE)로 평가되었으며, 테스트 결과 OE-F 전처리를 수행한 경우 기존 기법에 비해 성공적으로 개선되었음을 보였다. 또한 OE-F 기반 KNN(OE-F-KNN)은 95.20%의 정확도, 96.13%의 AUC, 0.031의 MSE로 비교 알고리즘 중 최고 성능을 보였다.

지적 구조의 규명을 위한 네트워크 형성 방식에 관한 연구 (A Study on the Network Generation Methods for Examining the Intellectual Structure of Knowledge Domains)

  • 이재윤
    • 한국문헌정보학회지
    • /
    • 제40권2호
    • /
    • pp.333-355
    • /
    • 2006
  • 이 연구에서는 지적 구조 분석을 위해서 계량서지적 자료를 시각적으로 표현하는 다양한 네트워크 형성 방식에 대해서 사례와 함께 각각의 특성을 살펴보았다. 기준값 절단 방식, 최근접이웃 그래프, 최소비용 신장트리, 패스파인더 네트워크의 네 가지 네트워크 형성 방식 중에서 전체 구조와 세부 구조의 표현 능력이 모두 뛰어난 패스파인더 네트워크 알고리즘이 최근 가장 활발히 응용되고 있다. 최근접이웃 그래프는 아직까지 계량서지적 분석에 응용된 사례는 없으나 간단한 알고리즘과 클러스터링 능력 등과 같은 지적 구조 규명에 도움이 될 수 있는 몇 가지 장점을 갖추고 있는 것으로 확인되었다. 다차원척도나 군집분석과 달리 네트워크를 이용한 시각화에서는 입력자료의 전처리에 따라서 생성된 지적 구조의 차이가 큰 것으로 나타났다. 이 연구에서 고찰한 여러 네트워크 형성 방식을 적절히 활용함으로써 국내의 지적 구조 규명 연구를 활성화할 수 있을 것이라 기대된다.

베이지안 네트워크와 특이값 분해 알고리즘을 이용한 운동 추천 시스템 (An exercise recommendation system using bayesian network and singular value decomposition algorithm)

  • 신아영;임유진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.470-473
    • /
    • 2021
  • 본 논문에서는 코로나-19로 인해 홈 트레이닝 시장이 성장하고 있는 상황 속에서 효율적인 운동을 위해 사용자의 식습관, 신체조건, 선호도 등을 바탕으로 적합한 운동을 추천해주는 시스템을 제안한다. 먼저 K-최근접 이웃 알고리즘을 활용해 비만의 정도에 따라 사용자를 분류하고, 운동 데이터를 소모 칼로리에 따라 클러스터링 한다. 다음으로 비만의 정도와 운동 레벨에 따라 정해진 추천 점수를 통해 사전 선호도 확률을 계산하고, 베이지안 네트워크를 통해 사후 확률을 구한다. 이를 바탕으로 특이값 분해 알고리즘(SVD)를 활용하여 사용자 맞춤형 운동을 추천한다. 제안 시스템의 성능을 검증하기 위해 비교 실험을 진행하여 회귀 문제 평가 척도인 RMSE 값 측면에서 성능을 분석하였다.

사용자의 색상 선호 기반 추천 시스템을 위한 상품 이미지 속 의류 색상 분석 (Color Analysis of Clothing in Product Images for User's Color Preference-Based Recommendation System)

  • 노은진;박상원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.643-645
    • /
    • 2022
  • 많은 온라인 쇼핑몰에서 색상 기반 필터링 서비스나 추천 시스템을 제공하지만, 수동 분류는 많은 시간이 들고 오류 위험이 있다. 본 연구의 실험에서는 먼저 분석할 의류 이미지를 실루엣 분석으로 수행한 경우와 수행하지 않는 경우의 k-평균 군집화 알고리즘으로 가장 우세한 색상 군집의 중심값을 도출하는데, 만약 군집 개수가 2개 이상이면 보다 큰 군집의 중심값만을 고려한다. 이 중심값을 이용해 사전 학습한 k-최근접 이웃 알고리즘으로 색상 클래스를 분류한다. 실험 결과 실루엣 분석을 수행하지 않은 k-평균 군집화 알고리즘을 사용한 분류 방식이 정확도와 수행 시간 모두 매우 준수하였으나, 배경색이 존재하여 의류 색 분석에 영향을 줄 수 있는 경우 잘못 분류한다는 문제도 있다.

이동 평균 기반 동적 시간 와핑 기법을 이용한 시계열 키워드 데이터의 분류 성능 개선 방안 (Enhancing Classification Performance of Temporal Keyword Data by Using Moving Average-based Dynamic Time Warping Method)

  • 정도헌
    • 정보관리학회지
    • /
    • 제36권4호
    • /
    • pp.83-105
    • /
    • 2019
  • 본 연구는 시계열 특성을 갖는 데이터의 패턴 유사도 비교를 통해 유사 추세를 보이는 키워드를 자동 분류하기 위한 효과적인 방법을 제안하는 것을 목표로 한다. 이를 위해 대량의 웹 뉴스 기사를 수집하고 키워드를 추출한 후 120개 구간을 갖는 시계열 데이터를 생성하였다. 제안한 모델의 성능 평가를 위한 테스트 셋을 구축하기 위해, 440개의 주요 키워드를 8종의 추세 유형에 따라 수작업으로 범주를 부여하였다. 본 연구에서는 시계열 분석에 널리 활용되는 동적 시간 와핑(DTW) 기법을 기반으로, 추세의 경향성을 잘 보여주는 이동평균(MA) 기법을 DTW에 추가 적용한 응용 모델인 MA-DTW를 제안하였다, 자동 분류 성능 평가를 위해 k-최근접 이웃(kNN) 알고리즘을 적용한 결과, ED와 DTW가 각각 마이크로 평균 F1 기준 48.2%와 66.6%의 최고 점수를 보인 데 비해, 제안 모델은 최고 74.3%의 식별 성능을 보여주었다. 종합 성능 평가를 통해 측정된 모든 지표에서, 제안 모델이 기존의 ED와 DTW에 비해 우수한 성능을 보임을 확인하였다.