• 제목/요약/키워드: 분류기 결합

검색결과 248건 처리시간 0.03초

어휘별 분류기를 이용한 한국어 품사 부착의 성능 향상 (Improving Korean Part-of-Speech Tagging Using The Lexical Specific Classifier)

  • 최원종;이도길;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2006년도 제18회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.133-139
    • /
    • 2006
  • 한국어 형태소 분석 및 품사 부착을 위해 지금까지 다양한 모델들이 제안이 되었으며 어절단위 평가로 95%를 넘는 성능을 보여주는 자동 태거가 보고 되었다. 하지만 형태소 분석 및 품사 부착은 모든 자연어처리 시스템의 성능에 큰 영향을 미치므로 작은 오류도 중요하다. 본 연구에서는 대상 어절의 주변 형태소의 어휘와 품사 자질, 그리고 어절 자질을 이용하여 분류기를 학습한 후 자동 태거의 품사 부착 결과를 입력으로 받아 후처리 하는 어휘별 분류기를 제안한다. 실험 결과 어휘별 분류기를 이용한 후처리만으로 어절단위 평가 6.86%$(95.251%{\rightarrow}95.577%)$의 오류가 감소하는 성능향상을 얻었으며, 기존에 제안된 품사별 자질을 이용한 후처리 방법과 순차 결합할 경우 16.91%$(95.251%{\rightarrow}96.054%)$의 오류가 감소하는 성능 향상을 얻을 수 있었다. 특히 본 논문에서 제안하는 방법은 형태소 어휘까지 정정할 수 있기 때문에 품사별 자질을 이용한 후처리 방법의 성능을 더욱 향상시킬 수 있다.

  • PDF

폐질환 조기 검출을 위한 결합 히스토그램 기반의 통계적 특징 인자에 대한 연구 (Study of Joint Histogram Based Statistical Features for Early Detection of Lung Disease)

  • 원철호
    • 재활복지공학회논문지
    • /
    • 제10권4호
    • /
    • pp.259-265
    • /
    • 2016
  • 본 논문에서는 폐질환 조기 검출을 위하여 Broncho vascular, Emphysema, Ground Glass Reticular, Ground Glass, Honeycomb, Normal의 6가지 폐조직에 대한 새로운 분류기법을 제안하였다. 단순 베이즈 분류기와 아다부스트 학습 기법을 도입하여 459개의 결합 히스토그램 특징인자로부터 유효한 특징인자를 선별함으로써 폐조직을 분류하였다. 다중 해상도 해석, 체적 LBP 및 CT 휘도를 기반으로 하는 결합 히스토그램 특징인자는 정확도, 민감도, 특이도 결과에서 기존의 3D AMFM보다 우수한 결과를 보였다. 제안한 특징인자와 3D AMFM 특징인자의 정확도는 각각 90.1%과 85.3%로서 제안한 특징인자의 우수한 분류 성능을 확인하였다.

부트스트랩 샘플링 최적화를 통한 앙상블 모형의 성능 개선 (Improving an Ensemble Model by Optimizing Bootstrap Sampling)

  • 민성환
    • 인터넷정보학회논문지
    • /
    • 제17권2호
    • /
    • pp.49-57
    • /
    • 2016
  • 앙상블 학습 기법은 개별 모형보다 더 좋은 예측 성과를 얻기 위해 다수의 분류기를 결합하는 것으로 예측 성과를 향상시키는데에 매우 유용한 것으로 알려져 있다. 배깅은 단일 분류기의 예측 성과를 향상시키는 대표적인 앙상블 기법중의 하나이다. 배깅은 원 학습 데이터로부터 부트스트랩 샘플링 방법을 통해 서로 다른 학습 데이터를 추출하고, 각각의 부트스트랩 샘플에 대해 학습 알고리즘을 적용하여 서로 다른 다수의 기저 분류기들을 생성시키게 되며, 최종적으로 서로 다른 분류기로부터 나온 결과를 결합하게 된다. 배깅에서 부트스트랩 샘플은 원 학습 데이터로부터 램덤하게 추출한 샘플로 각각의 부트스트랩 샘플이 동일한 정보를 가지고 있지는 않으며 이로 인해 배깅 모형의 성과는 편차가 발생하게 된다. 본 논문에서는 이와 같은 부트스트랩 샘플을 최적화함으로써 표준 배깅 앙상블의 성과를 개선시키는 새로운 방법을 제안하였다. 제안한 모형에서는 앙상블 모형의 성과를 개선시키기 위해 부트스트랩 샘플링을 최적화하였으며 이를 위해 유전자 알고리즘이 활용되었다. 본 논문에서는 제안한 모형을 국내 부도 예측 문제에 적용해 보았으며, 실험 결과 제안한 모형이 우수한 성과를 보였다.

토지 피복 분류에서 분광 영상정보와 시간 문맥 정보의 결합을 위한 베이지안 확률 규칙의 적용 (Application of Bayesian Probability Rule to the Combination of Spectral and Temporal Contextual Information in Land-cover Classification)

  • 이상원;박노욱
    • 대한원격탐사학회지
    • /
    • 제27권4호
    • /
    • pp.445-455
    • /
    • 2011
  • 이 논문은 분광 영상정보만으로 구분력이 상대적으로 떨어지는 분류 항목들의 분류 정확도 향상을 목적으로 기 존재하는 토지피복도로부터 계산된 시간 문맥 정보를 결합하는 확률론적 분류 방법론을 제안하였다. 기 존재하는 토지피복도와 고려하고 있는 시기의 훈련 집단으로부터 분류 항목간 전이 확률을 계산하여 이를 사전 확률로 간주하였다. 분광 영상정보로부터 얻어지는 조건부 확률을 사전 확률과 결합하여 최종적인 사후 확률을 계산하여 분류 항목을 결정하였다. 제안 기법은 기존 시간 문맥 정보를 결합할 때 많은 계산량을 요구하는 방법론들과 달리 확률론적 분류 방법에 쉽게 적용이 가능한 장점이 있다. 시계열 MODIS 자료를 이용한 농작물 분류 사례 연구를 수행하여, 제안 기법의 적용가능성을 검증하였다. MODIS 자료의 낮은 공간 해상도로 인한 혼재 효과로 분광 영상정보만으로 구분력이 떨어지는 분류 항목들은 시간 문맥 정보를 고려함으로써 상대적인 구분력이 향상되어 최종적으로 향상된 분류 정확도를 나타내었다. 따라서 제안 기법은 분류 정확도의 향상과 더불어 기제작된 토지피복도의 갱신에도 효과적으로 이용될 수 있을 것으로 기대된다.

SVM 분류기를 이용한 필기체 숫자인식 (Recognition of Handwritten Numerals using SVM Classifiers)

  • 박중조;김경민
    • 융합신호처리학회논문지
    • /
    • 제8권3호
    • /
    • pp.136-142
    • /
    • 2007
  • 최근의 인식 시스템 연구들에 의하면 SVM 분류기가 여러 다른 분류기에 비해 우수한 인식 성능을 나타내고 있다. 이에 본 논문에서는 SVM 분류기를 사용하여 필기체 숫자를 인식하는 알고리즘을 제시한다. 본 기법에서는 필기체 숫자의 특징으로서 망특징과 Kirsch 연산자에 의한 방향 특징 및 오목특징을 사용하는데, 이중에서 처음 두 특징은 숫자를 이루는 선에 대한 전경 정보를 표현하며, 마지막 특징은 숫자의 배경 정보를 표현하여 상호 보완적인 역학을 수행한다. 본질적으로 SVM은 두 클래스 분류기이므로 이를 다중 클래스 분류기로 사용하기 위해서는 여러 개의 SVM들을 결합하여 사용해야 하는데, 본 논문에서는 "일대일" 방법과 "일대다" 방법을 사용하여 주어진 특징에 대한 인식을 수행하였다. 제시된 기법의 성능 평가를 위해 CENPARMI 필기체 숫자 데이터베이스를 사용하여 실험하였으며, 그 결과 98.45%의 인식률을 얻을 수 있었다.

  • PDF

DTW와 퓨전기법을 이용한 비유사도 기반 분류법의 최적화 (On Optimizing Dissimilarity-Based Classifications Using a DTW and Fusion Strategies)

  • 김상운;김승환
    • 전자공학회논문지CI
    • /
    • 제47권2호
    • /
    • pp.21-28
    • /
    • 2010
  • 본 논문에서는 동적시간교정법(dynamic time warping: DTW)과 다중퓨전기법(multiple fusion strategy: MFS)을 연속 적용하여 비유사도기반 분류법(dissimilarity-based classification: DBC)을 최적화시키는 방법의 실험결과를 보고한다. DBC란 샘플패턴을 분류하기 위하여 샘플의 특징 값을 이용하는 대신에 샘플들 사이의 비유사도를 측정하여 분류기를 설계하는 방법이다. DTW에서는 다음과 같이 두 단계로 나누어 비유사도를 측정한다. 먼저 상관계수를 이용하여 객체 샘플들을 대응시키기 위한 최적의 대응경로를 찾을 수 있도록 샘플들을 조정한다. 그리고 기존의 거리측정법으로 조정된 샘플들 사이의 비유사도를 측정한다. MFS에서는 분류기결합 뿐만 아니라 비유사도 행렬생성에서도 퓨전기법을 적용한다. 즉, DTW 기법으로 작성한 다수의 비유사도 행렬들을 결합하여 새로운 비유사도 행렬을 생성한 다음, 이 행렬공간에서 여러 개의 베이스 분류기를 학습하여 다시 결합한다. 본 논문에서 제안한 방법을 벤취마크 영상 데이터베이스를 대상으로 실험한 결과, 기존의 방법과 비교하여 분류성능을 향상시킬 수 있음을 확인하였다. 이와 같은 실험결과로 볼 때, 제안 방법을 멀티미디어 정보검색 등과 같은 다른 고차원 응용에도 활용할 수 있을 것으로 사료된다.

Boosted 국부 이진 패턴을 적용한 얼굴 표정 인식에 관한 연구 (A Study on Facial Expression Recognition using Boosted Local Binary Pattern)

  • 원철호
    • 한국멀티미디어학회논문지
    • /
    • 제16권12호
    • /
    • pp.1357-1367
    • /
    • 2013
  • 최근 얼굴 표정 인식에 있어 영상 기반의 방법의 하나로서 ULBP 블록 히스토그램 피쳐와 SVM을 분류기로 사용한 연구가 수행되었다. Ojala 등에 의해 소개된 LBP는 높은 식별력과 조명의 변화에 대한 내구성과 간단한 연산 때문에 영상 인식 분야에 많이 사용되고 있다. 본 논문에서는 ULBP 블록 히스토그램을 계산함에 있어 분할 영역의 이동, 크기 변화에 더하여 미세한 특징 요소를 표현할 수 있도록 $LBP_{8,2}$$LBP_{8,1}$를 결합하였다. $LBP_{8,1}$ 660개, $LBP_{8,2}$ 550개의 분할 창으로부터 1210개의 ULBP 히스토그램 피쳐를 추출하고 이로부터 AdaBoost를 이용하여 50개의 약 분류기를 생성하였다. $LBP_{8,1}$$LBP_{8,2}$가 결합된 하이브리드 형태의 ULBP 블록 히스토그램 피쳐와 SVM 분류기를 이용함으로써 표정 인식률을 향상시킬 수 있었으며 다양한 실험을 통하여 이를 확인하였다. 본 논문에서 제안한 하이브리드 Boosted ULBP 히스토그램의 경우에 표정의 인식률이 96.3%로 가장 높은 결과를 보였으며 제안한 방법의 우수성을 확인하였다.

Support Vector Machine을 이용한 문맥 인지형 융합 (Context-Aware Fusion with Support Vector Machine)

  • 허경용;김성훈
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권6호
    • /
    • pp.19-26
    • /
    • 2014
  • 앙상블 분류기는 여러 개의 분류기에서의 예측 결과를 결합함으로써 단일 분류기에 비해 신뢰성 높은 예측 결과를 얻을 수 있는 방법으로 널리 사용되고 있다. 앙상블 분류기를 위해서는 여러 가지 방법이 사용되고 있으며 흔히 사용되는 방법으로는 부스팅이 있다. 하지만 부스팅은 단계적인 학습을 통해 이전 단계에서 잘못 분류된 샘플들을 다음 단계에서 다시 분류하는 방식으로 이전 단계로의 피드백이 불완전한 순차적인 방법이라는 한계가 있다. 이 논문에서는 단일 분류기 중 가장 성능이 좋은 것으로 알려진 SVM을 기본분류기로 사용하여 동시에 여러개의 SVM을 학습하는 문맥 감지형 SVM 앙상블알고리즘을 제안한다. 제안하는 방법에서는 특징 공간을 문맥으로 나누는 클러스터링과 SVM 학습을 동시에 진행하므로 특징 공간 분할과 학습이 서로의 결과를 사용할 수 있어 기존 앙상블학습에 비해 더 나은 결과를 얻을 수 있으며 이는 실험 결과를 통해 확인할 수 있다.

GAVaPS를 이용한 다수 K-Nearest Neighbor classifier들의 Feature 선택 (Feature Selection for Multiple K-Nearest Neighbor classifiers using GAVaPS)

  • 이희성;이제헌;김은태
    • 한국지능시스템학회논문지
    • /
    • 제18권6호
    • /
    • pp.871-875
    • /
    • 2008
  • 본 논문은 개체 변환 유전자 알고리즘을 (GAVaPS) 이용하여 k-nearest neighbor (k-NN) 분류기에서 사용되는 특징들을 선정하는 방법을 제시한다. 우리는 다수의 k-NN 분류기들을 사용하기 때문에 사용되는 특징들을 선정하는 문제는 매우 탐색 영역이 크고 해결하기 어려운 문제이다. 따라서 우리는 효과적인 특징득의 선정을 위해 일반적인 유전자 알고리즘 (GA) 보다 효율적이라고 알려진 개체군 변환 유전자 알고리즘을 사용한다. 또한 다수 k-NN 분류기를 개체군 변환 유전자 알고리즘으로 효과적으로 결합하는 방법을 제시한다. 제안하는 알고리즘의 우수성을 여러 실험을 통해 보여준다.