• 제목/요약/키워드: k-NN classification

검색결과 188건 처리시간 0.024초

모델기반 특징추출을 이용한 지역변화 특성에 따른 개체기반 표정인식 (Facial Expression Recognition with Instance-based Learning Based on Regional-Variation Characteristics Using Models-based Feature Extraction)

  • 박미애;고재필
    • 한국멀티미디어학회논문지
    • /
    • 제9권11호
    • /
    • pp.1465-1473
    • /
    • 2006
  • 본 논문에서는 Active Shape Models(ASM)과 상태기반 모델을 사용하여 동영상으로부터 얼굴 표정을 인식하는 방법을 제시한다. ASM을 이용하여 하나의 입력 영상에 대한 얼굴요소특징점들을 정합하고, 그 과정에서 생성되는 모양변수벡터를 추출한다. 동영상에 대해 추출되는 모양변수벡터 집합을 세 가지 상태 중 한 가지를 가지는 상태벡터로 변환하고 분류기를 통해 얼굴의 표정을 인식한다. 분류단계에서는 표정별 표정변화에 따른 변화영역의 차이를 고려한 새로운 유사도 측정치를 제안한다. 공개데이터베이스 KCFD에 대한 실험에서는 제안한 측정치와 기존의 이친 측정치를 사용한 k-NN의 인식률이 k가 1일 때 각각 89.1% 및 86.2%을 보임으로써, 제안한 측정치가 기존의 이진 측정치보다 더 높은 인식률을 나타내는 것을 보인다.

  • PDF

내용기반 검색을 위한 SOMk-NN탐색 알고리즘 (SOMk-NN Search Algorithm for Content-Based Retrieval)

  • 오군석;김판구
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권5호
    • /
    • pp.358-366
    • /
    • 2002
  • 특징정보를 기반으로 한 유사 이미지 검색은 이미지 데이타베이스에 있어서 중요한 과제의 하나이다. 이미지 데이타의 특징정보는 각 이미지를 식별하는데 유용한 정보이다. 본 논문에서는 자기 조직화 맵 기반의 고속 k-NN 탐색 알고리즘을 제안한다. 자기 조직화 맵은 고차원 특징벡터를 2차원 공간에 맵핑하여 위상특징 맵을 생성한다. 위상특징 맵은 입력 데이타의 특징공간과 상호관계(유사성)를 가지고 있으며, 인접노드에 서로 유사한 특징벡터가 클러스터링된다. 그러므로 위상특징 맵상의 각 노드에는 노드 벡터와 각 노드벡터에 가장 가까운 유사 이미지가 분류된다. 이러한 자기 조직화 맵에 의한 유사 이미지 분류결과에 대하여 k-NV 탐색을 구현하기 위하여, (1) 위상특징 맵에 대한 접근방법, (2) 고속탐색을 위한 pruning strategy의 적용을 실현하였다. 본 연구에서는 실험을 통하여 실제 이미지로부터 추출한 색상 특징을 사용하여 제안한 알고리즘의 성능을 평가함으로써 유사 이미지 검색에 유효한 견과를 얻을 수 있었다.

이동 평균 기반 동적 시간 와핑 기법을 이용한 시계열 키워드 데이터의 분류 성능 개선 방안 (Enhancing Classification Performance of Temporal Keyword Data by Using Moving Average-based Dynamic Time Warping Method)

  • 정도헌
    • 정보관리학회지
    • /
    • 제36권4호
    • /
    • pp.83-105
    • /
    • 2019
  • 본 연구는 시계열 특성을 갖는 데이터의 패턴 유사도 비교를 통해 유사 추세를 보이는 키워드를 자동 분류하기 위한 효과적인 방법을 제안하는 것을 목표로 한다. 이를 위해 대량의 웹 뉴스 기사를 수집하고 키워드를 추출한 후 120개 구간을 갖는 시계열 데이터를 생성하였다. 제안한 모델의 성능 평가를 위한 테스트 셋을 구축하기 위해, 440개의 주요 키워드를 8종의 추세 유형에 따라 수작업으로 범주를 부여하였다. 본 연구에서는 시계열 분석에 널리 활용되는 동적 시간 와핑(DTW) 기법을 기반으로, 추세의 경향성을 잘 보여주는 이동평균(MA) 기법을 DTW에 추가 적용한 응용 모델인 MA-DTW를 제안하였다, 자동 분류 성능 평가를 위해 k-최근접 이웃(kNN) 알고리즘을 적용한 결과, ED와 DTW가 각각 마이크로 평균 F1 기준 48.2%와 66.6%의 최고 점수를 보인 데 비해, 제안 모델은 최고 74.3%의 식별 성능을 보여주었다. 종합 성능 평가를 통해 측정된 모든 지표에서, 제안 모델이 기존의 ED와 DTW에 비해 우수한 성능을 보임을 확인하였다.

119 신고 데이터를 이용한 자연어처리 기반 재난안전 상황 분류 알고리즘 분석 (Analysis of Disaster Safety Situation Classification Algorithm Based on Natural Language Processing Using 119 Calls Data)

  • 권수정;강윤희;이용학;이민호;박성호;강명주
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권10호
    • /
    • pp.317-322
    • /
    • 2020
  • 인공지능의 발달로 인하여 재난 분야에서는 재난대응 지원 시스템으로 이용되고 있다. 재난은 언제 어디서든지 발생할 수 있으며, 재난 발생 시 소방청 119 신고접수대에 접수되는 신고는 크게 화재, 구조, 구급, 기타 신고 등 4가지로 구분된다. 119 신고에 따른 재난 대응도 그 종류 및 상황에 따라 다르게 대응된다. 본 논문에서는 119 신고 데이터 1280개 문서를 학습 데이터 셋을 이용하여 SVM, NB, k-NN, DT, SGD, RF 상황 분류 기계학습 알고리즘을 3 클래스로 테스트한 분류 성능은 최고 92%, 최소 77%의 성능을 보였다. 인공지능의 발달로 인하여 재난 분야에서는 재난 대응 지원 시스템으로 이용되고 있다. 재난은 언제 어디서든지 발생할 수 있으며, 재난 발생 시 소방청 119 신고접수대에 접수되는 신고는 크게 화재, 구조, 구급, 기타 신고 등 4가지로 구분된다. 119 신고에 따른 재난대응도 그 종류 및 상황에 따라 다르게 대응된다. 본 논문에서는 119 신고 데이터 1280개 문서를 학습 데이터 셋을 이용하여 SVM, NB, k-NN, DT, SGD, RF 상황 분류 알고리즘을 3 클래스로 테스트한 분류 성능은 최고 92%, 최소 77%의 성능을 보였다. 앞으로 다양한 분야의 재난별 데이터 셋을 확보하여 효율적인 재난 대응 연구가 필요하다.

Genetic Algorithm과 다중부스팅 Classifier를 이용한 암진단 시스템 (Cancer Diagnosis System using Genetic Algorithm and Multi-boosting Classifier)

  • 온승엽;지승도
    • 한국시뮬레이션학회논문지
    • /
    • 제20권2호
    • /
    • pp.77-85
    • /
    • 2011
  • 생물 및 의학계에서는 생물정보학(bioinformatics)의 데이터 중 혈청 단백질(proteome)에서 추출한 데이터가 질병의 진단에 관련된 정보를 가지고 있고, 이 데이터를 분류 분석함으로 질병을 조기에 진단 할 수 있다고 믿고 있다. 본 논문에서는 혈청 단백질(2-D PAGE: Two-dimensional polyacrylamide gel electrophoresis)로부터 암과 정상을 판별하는 새로운 복합분류기를 제안한다. 새로운 복합 분류기에서는 support vector machine(SVM)와 다층 퍼셉트론(multi-layer perceptron: MLP)와 k-최근 접 이웃(k-nearest neighbor: k-NN)분류기를 앙상블(ensemble) 방법으로 통합하는 동시에 다중 부스팅(boosting) 방법으로 각 분류기를 확장하여 부분류기(subclassifier)의 배열(array)으로서 복합분류기를 구성하였다. 각 부분류기에서는 최적 특성 집합 (feature set)을 탐색하기 위하여 유전 알고리즘(genetic algorithm: GA)를 적용하였다. 복합분류기의 성능을 측정하기 위하여 암연구에서 얻어진 임상 데이터를 복합분류기에 적용하였고 결과로서 단일 분류기 보다 높은 분류 정확도와 안정성을 보여 주었다.

특성함수 및 k-최근접이웃 알고리즘을 이용한 국악기 분류 (Classification of Korean Traditional Musical Instruments Using Feature Functions and k-nearest Neighbor Algorithm)

  • 김석호;곽경섭;김재천
    • 한국멀티미디어학회논문지
    • /
    • 제9권3호
    • /
    • pp.279-286
    • /
    • 2006
  • 주파수 분포벡터를 이용한 분류방법을 국악기 분류 및 인식에 적용하였으며 분류에 사용되는 주파수 분포 벡터 중에서 리듬성분을 수치화한 평균피크값을 제안하였다. 대부분의 주파수 처리함수들은 주파수값의 평균, 통계적특성에 기반을 두고 있으며 국악기자동분류를 위해 신호의 평균, 분산, 영교차율, 균형주파수, 평균 피크값을 이용하여 실험하였다. 국악의 장르 구분을 위한 선행 연구로서 음악신호를 함수처리하고 k-최근접이웃 분류알고리즘을 적용하여 분류하였다. 기존의 주파수 분포벡터를 이용하여 발표되었던 서양음악의 분류 성공률 87%보다 향상된 94.44%의 성공률을 나타냈다.

  • PDF

성별 구분을 통한 음성 감성인식 성능 향상에 대한 연구 (A Study on The Improvement of Emotion Recognition by Gender Discrimination)

  • 조윤호;박규식
    • 대한전자공학회논문지SP
    • /
    • 제45권4호
    • /
    • pp.107-114
    • /
    • 2008
  • 본 논문은 남/여 성별에 기반해 음성을 평상, 기쁨, 슬픔, 화남의 4가지 감성 상태로 분류하는 감성인식 시스템을 구축하였다. 제안된 시스템은 입력 음성으로부터 1차적으로 남/여 성별을 분류하고, 분류된 성별을 기반으로 남/여 각기 최적의 특징벡터 열을 적용하여 감성인식을 수행함으로써 감성인식 성공률을 향상시켰다. 또한 음성인식에서 주로 사용되는 ZCPA(Zero Crossings with Peak Amplitudes)를 감성인식용 특징벡터로 사용하여 성능을 향상시켰으며, 남/여 각각의 특징 벡터 열을 최적화하기 위해 SFS(Sequential Forward Selection) 기법을 사용하였다. 감성 패턴 분류기로는 k-NN과 SVM을 비교하여 실험하였다. 실험결과 제안 시스템은 4가지 감성상태에 대해 약 85.3%의 높은 감성 인식 성공률을 달성할 수 있어 향후 감성을 인식하는 콜센터, 휴머노이드형 로봇이나 유비쿼터스(Ubiquitous) 환경 등 다양한 분야에서 감성인식 정보를 유용하게 사용될 수 있을 것으로 기대된다.

전력품질 분석을 위한 특징 추출 (Feature extraction for Power Quality analysis)

  • 이진목;홍덕표;최재호
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2005년도 제36회 하계학술대회 논문집 전기설비
    • /
    • pp.94-96
    • /
    • 2005
  • Power Quality(PQ) problems are various owing to a wide variety of causes so detection and classification of many kinds of PQ problems are awkward. Almost all studies about it were about getting good results by Neural Networks(NN) which get input features from as random variables, FFT and wavelet transform. However they are discontented with results because it is very difficult to classify all PQ items. A study about feature extraction becomes needed. Thus, this paper suggests effective way of using principle Component Analysis (PCA) for PQ Problem classification. PCA found more effective features among all features so it will help us to get more good result of classification.

  • PDF

호흡곤란환자의 입-퇴원 분석을 위한 규칙가중치 기반 퍼지 분류모델 (Rule Weight-Based Fuzzy Classification Model for Analyzing Admission-Discharge of Dyspnea Patients)

  • 손창식;신아미;이영동;박형섭;박희준;김윤년
    • 대한의용생체공학회:의공학회지
    • /
    • 제31권1호
    • /
    • pp.40-49
    • /
    • 2010
  • A rule weight -based fuzzy classification model is proposed to analyze the patterns of admission-discharge of patients as a previous research for differential diagnosis of dyspnea. The proposed model is automatically generated from a labeled data set, supervised learning strategy, using three procedure methodology: i) select fuzzy partition regions from spatial distribution of data; ii) generate fuzzy membership functions from the selected partition regions; and iii) extract a set of candidate rules and resolve a conflict problem among the candidate rules. The effectiveness of the proposed fuzzy classification model was demonstrated by comparing the experimental results for the dyspnea patients' data set with 11 features selected from 55 features by clinicians with those obtained using the conventional classification methods, such as standard fuzzy classifier without rule weights, C4.5, QDA, kNN, and SVMs.

고객 질의 문서 자동 분류를 위한 학습 알고리즘 성능 평가 (Performance Evaluation on the Learning Algorithm for Automatic Classification of Q&A Documents)

  • 최정민;이병수
    • 정보처리학회논문지D
    • /
    • 제13D권1호
    • /
    • pp.133-138
    • /
    • 2006
  • 최근 인터넷의 보급으로 전자상거래가 대중들에게 나타났고 현재 기업들의 경영환경 변화를 주도하고 있다. 전자상거래에서는 기업이 고객과의 유지 및 관계 구축을 위하여 고객이 원하는 것이 무엇인가를 파악하고 그것을 고객에게 제안하는 여러 가지 고객 채널을 가지고 있는데, 그 중 게시판과 전자메일은 고객의 질의를 직접적으로 들을 수 있는 인바운드(Inbound) 정보로서 매우 중요한 채널로 다루어지고 있다. 그러나 현재 운영되는 전자상거래의 게시판과 전자메일은 체계적인 관리와 처리과정 없이 질의와 답변이 이루어지고 있는 실정이다. 따라서 본 연구에서는 이러한 문제점의 해결을 위해 인공지능 분야의 문서 분류에서 널리 사용되고 있는 기계학습 알고리즘 중 대표적인 나이브 베이지안(Naive Bayesian), TFIDF, 신경망, k-NN 알고리즘을 도입하여 전자상거래에서 존재하는 여러 가지 고객 질의의 카테고리를 자동으로 분류할 수 있도록 함으로써 관리자가 정확한 답변을 신속하게 처리할 수 있도록 하였다. 그리고 도입한 알고리즘의 고객 질의 문서 자동 분류 성능 실험을 통해 어떤 알고리즘이 우수한 분류 성능을 나타내는지 확인하였으며 실험 결과 나이브 베지이지안 알고리즘이 95%이상의 높은 분류 성능을 나타내는 것을 확인하였다.