• 제목/요약/키워드: 분류기 결합

검색결과 249건 처리시간 0.033초

해외 데이터베이스의 통제키워드에 기초한 국내 학술지 논문의 자동분류 성능 향상에 관한 실험적 연구 (An Experimental Study on the Performance Improvement of Automatic Classification for the Articles of Korean Journals Based on Controlled Keywords in International Database)

  • 김판준;이재윤
    • 한국문헌정보학회지
    • /
    • 제48권3호
    • /
    • pp.491-510
    • /
    • 2014
  • 학술지 논문의 효율적인 관리 및 검색을 위한 주요 요소인 키워드는 통제키워드와 비통제키워드로 구분할 수 있다. 그러나 현재 국내 데이터베이스에서 대부분의 학술지 논문에는 비통제키워드인 저자키워드만이 부여되어 있을 뿐, 망라적인 탐색을 돕는 통제키워드로서 디스크립터는 제공되지 않고 있다. 이 연구에서는 해외 데이터베이스의 학술지 논문에 부여된 통제키워드를 학습한 분류기를 사용하여, 국내 학술지 논문에 디스크립터를 자동 할당하는 실험을 수행하였다. 그 결과, 국외 데이터베이스의 디스크립터 학습을 통해 영문 초록이 있는 국내 학술지 논문에 통제키워드를 자동 할당할 수 있는 가능성을 확인하였다. 또한, 다양한 분류기 및 분류기 결합을 통하여 이러한 디스크립터 자동 할당의 성능 향상을 모색하였다.

유전 알고리즘이 결합된 MLP와 HMM 합성 분류기를 이용한 근전도 신호 인식 기법 (An EMG Signals Classification using Hybrid HMM and MLP Classifier with Genetic Algorithms)

  • 정정수;권장우;류길수
    • 한국멀티미디어학회논문지
    • /
    • 제6권1호
    • /
    • pp.48-57
    • /
    • 2003
  • 본 연구는 hidden Markov model(HMM)과 유전알고리 즘을 갖는 MLP(multilayer perceptron) 합성 분류기를 이용한 근전 신호의 인식에 관한 연구이다. 제안된 기법에서 유전알고리즘은 전역적인 탐색으로 신경회로망의 최적의 초기 연결강도를 선택하는데, 이로 인하여 학습속도 및 인식률이 향상되게 된다. 근전 신호의 동적 특성은 연속 운동 인식처럼 신호의 길이 및 시작점과 끝점이 일정치 않고 시변성이 큰 경우에 반드시 고려되어야 하나, 일반 신경회로망에서는 이의 적용이 용이하지 않다. 따라서, 본 연구에서는 신호의 동적 특성에 대한 적응성을 갖는 HMM과 MLP 신경회로망을 결합시킨 구조를 갖는 인식기를 제안한다. 이러한 구조는 인식기의 입장에서 볼 때 HMM의 신호의 동적 특성에 대한 적응성과, MLP의 정적인 신호에 대한 우수한 분류력이 결합되어 동적인 신호에도 높은 인식율을 갖는 특성을 갖는다.

  • PDF

웹 사용 마이닝을 위한 SASOM+DT를 이용한 웹 데이터의 분류 (Classification of Web Data Using SASOM+DT for Web Usage Mining)

  • 유시호;김경중;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.346-348
    • /
    • 2002
  • 웹 마이닝은 크게 구조 마이닝, 컨텐츠 마이닝, 사용 마이닝으로 분류될 수 있다. 이 중에서도 사용 마이닝은 사용자의 로그 데이터를 바탕으로 사용자가 탐색한 웹 페이지의 순서를 추출하거나 연관관계를 분석하는 작업이다. 특히 웹에 기반을 둔 애플리케이션의 요구를 충족시키기 위해서 사용 마이닝은 웹 마이닝에 있어서 중요한 부분으로 부각되고 있다. 본 논문에서는 사용자들의 웹 페이지의 방문 패턴을 분석하여, 미래행동을 예측하는 것을 문제로 삼고, 사용자들의 이용패턴을 SASOM(Strtcture-Adaptive SOM)분류기들의 DT(Decision Tree)앙상블을 이용하여 분류하는 방법을 제안해보았다. MS웹 데이터를 가지고 SASOM 분류기의 집합을 DT를 이용하여 결합한 결과, 분류기 하나만 사용한 경우 보다 더 좋은 결과를 얻어, 3.5% 이하의 낮은 오류율을 보였다.

  • PDF

Random Forests와 관계 가중치 결합을 이용한 의료 영상 분류 및 주석 자동 생성 (Medical Image Classification and Keyword Annotation Using Combination of Random Forests and Relation Weight)

  • 이지현;김성훈;고병철;남재열
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.596-598
    • /
    • 2010
  • 본 논문에서는 의료영상 중 X-ray 영상을 대상으로 영상을 분류하고 분류 결과에 따라 다중 키워드를 생성하는 방법을 제시한다. X-ray영상은 대부분 그레이 영상임으로 Local Binary Patterns (LBP)을 이용하여 픽셀간의 연관성을 특징으로 추출하고, 실시간 학습 및 분류가 가능한 Random Forests 분류기로 영상들을 30개의 클래스로 분류한다. 또한, 미리 정의된 신체 부위간의 관계 가중치를 분류 스코어에 결합하여 신뢰값을 생성하고 이를 기반으로 영상에 대해 다중 주석을 부여하게 된다. 이렇게 부여된 다중 주석은 키워드 기반의 의료영상을 가능케 함으로 보다 쉽고 효율적인 검색 환경을 제공할 수 있다.

포섭구조 일대다 지지벡터기계와 Naive Bayes 분류기를 이용한 효과적인 지문분류 (Effective Fingerprint Classification using Subsumed One-Vs-All Support Vector Machines and Naive Bayes Classifiers)

  • 홍진혁;민준기;조웅근;조성배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권10호
    • /
    • pp.886-895
    • /
    • 2006
  • 지문분류는 사전에 정의된 클래스로 입력된 지문을 분류하여 자동지문인식 시스템에서 비교해야할 지문의 수를 줄여준다. 지지벡터기계(support vector machine; SVM)는 패턴인식 분야에서 널리 사용되고 있을 뿐만 아니라 지문분류에서도 높은 성능을 보이고 있다. SVM은 이진클래스 분류기이기 때문에 다중클래스 문제인 지문분류를 위해서 적절한 분류기 생성과 결합 기법이 필요하며, 본 논문에서는 일대다(one-vs-all; OVA) 방식으로 구성된 SVM을 naive Bayes(NB) 분류기를 이용하여 동적으로 구성하는 분류방법을 제안한다. 지문분류에서 대표적으로 사용되는 특징인 FingerCode와 지문의 구조적 특징인 특이점과 의사융선을 사용하여 OVA SVM과 NB 분류기를 학습하고, 포섭구조의 분류기를 구성하여 효과적인 지문분류를 수행한다. NIST-4 데이타베이스에 제안하는 방법을 적용하여 5클래스 분류에 대해서 90.8%의 높은 분류율을 획득하였으며, OVA 전략의 SVM을 다중클래스 분류문제에 적용할 때 발생하는 동점문제를 효과적으로 처리하였다.

클러스터 내 분별 오류 최소화를 위한 퍼지 클러스터링 (Within-Cluster-Discriminative Fuzzy Clustering)

  • 허경용;이수종
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2013년도 제48차 하계학술발표논문집 21권2호
    • /
    • pp.269-270
    • /
    • 2013
  • 퍼지 클러스터링은 유사도가 높은 데이터 포인트들이 동일한 클러스터에 포함되도록 하는 대표적인 비교사 학습 방법 중 하나이다. 이 논문에서는 클러스터링을 분류기의 전처리 단계에서 활용할 수 있도록 클러스터 내에서 분류 오류가 최소가 될 수 있도록 클러스터를 생성할 수 있는 새로운 퍼지 클러스터링 방법을 제안한다. 제안하는 클러스터링은 특징 벡터와 함께 클래스 라벨을 활용하므로 분류기와 결합하여 사용할 경우 기존 분류기와 함께 사용할 경우 보다 우수한 성능을 기대할 수 있다.

  • PDF

Word2vec과 앙상블 분류기를 사용한 효율적 한국어 감성 분류 방안 (Effective Korean sentiment classification method using word2vec and ensemble classifier)

  • 박성수;이건창
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권1호
    • /
    • pp.133-140
    • /
    • 2018
  • 감성 분석에서 정확한 감성 분류는 중요한 연구 주제이다. 본 연구는 최근 많은 연구가 이루어지는 word2vec과 앙상블 방법을 이용하여 효과적으로 한국어 리뷰를 감성 분류하는 방법을 제시한다. 연구는 20 만 개의 한국 영화 리뷰 텍스트에 대해, 품사 기반 BOW 자질과 word2vec를 사용한 자질을 생성하고, 두 개의 자질 표현을 결합한 통합 자질을 생성했다. 감성 분류를 위해 Logistic Regression, Decision Tree, Naive Bayes, Support Vector Machine의 단일 분류기와 Adaptive Boost, Bagging, Gradient Boosting, Random Forest의 앙상블 분류기를 사용하였다. 연구 결과로 형용사와 부사를 포함한 BOW자질과 word2vec자질로 구성된 통합 자질 표현이 가장 높은 감성 분류 정확도를 보였다. 실증결과, 단일 분류기인 SVM이 가장 높은 성능을 나타내었지만, 앙상블 분류기는 단일 분류기와 비슷하거나 약간 낮은 성능을 보였다.

암의 분류를 위한 음의 상관관계 유전자의 신경망 쌍 (Neural Network Pair with Negatively Correlated Genes for Cancer Classification)

  • 원홍희;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.359-361
    • /
    • 2003
  • 정확한 암의 분류는 암의 진단 및 치료에 있어 매우 중요하지만, 암을 진단하기 위한 기존의 여러 방법들은 종종 불완전한 결과를 도출한다. 최근의 마이크로어레이 기술에 기반한 분자 수준의 진단은 정확하고 객관적이며 체계적인 암의 분류를 위한 방법론을 제시해준다. 유전자 발현 데이터는 일반적으로 수천개 이상의 유전자를 포함하는데, 유전자 발현 데이터의 모든 유전자가 암과 관련이 있는 것이 아니므로 정확한 암을 분류하기 위하여 중요한 유전자만을 추출하는 것이 바람직하다. 본 논문에서 음의 상관관계를 갖는 두 개의 이상적인 유전자 벡터를 정의한 후 이와 유사한 정도를 기준으로 중요한 유전자 집단을 추출하고, 각각을 신경망으로 학습하여 결합하는 신경망 쌍을 제안한다. 실험 결과는 음의 상관관계를 갖는 두 개의 유전자 집단이 암의 클래스를 잘 구분할 수 있음을 보여주었다. 이 유전자 집단을 특징으로 하여 각각 학습한 신경망을 베이시안 방법으로 결합한 결과, 벤치마크 데이터에 대하여 신경망 쌍이 개별 분류기에 비해 우수한 성능을 보임을 확인하였다.

  • PDF

비선형 반복 패턴과 스펙트럼 분석을 이용한 집중-비집중 분류기의 성능 평가 (Performance Evaluation of Attention-inattetion Classifiers using Non-linear Recurrence Pattern and Spectrum Analysis)

  • 이지은;유선국;이병채
    • 감성과학
    • /
    • 제16권3호
    • /
    • pp.409-416
    • /
    • 2013
  • 집중은 관련된 사건을 선택적으로 주의하고, 관련 없는 사건을 무시하는 인간의 중요한 인지 기능중의 하나이다. 인간의 집중 능력을 관리 이용하는 컴퓨터 기반 장치에 있어서 집중과 비집중 상태를 구분하는 것은 필수적으로 요구되는 조건이다. 본 논문에서는, 뇌파신호로부터 분류기의 입력으로 사용되는 특징을 효율적으로 추출하기 위하여 비선형 반복 패턴 분석기법과 스펙트럼 분석 기법을 새로이 결합하였고(13개 특징 추출), 서포트벡터머신, 역전파 알고리즘, 선형분리, 로지스틱 회귀 분류 기반 분류기들을 포함하는 집중-비집중 분류기들의 성능을 분석하였다. 그중에서 81 %의 정확도를 보이는 서포트벡터머신 분류기가 가장 좋은 성능을 보였다. 또한 스펙트럼 분석으로 추출한 특징만을 사용하였을 경우(76 % 정확도)가 비선형 분석 방법으로 추출한 특징만을 사용했을 경우(67 % 정확도)보다 좀 더 우수한 성능을 보였다. 비선형-스펙트럼 분석법을 복합 적용한 서포트벡터머신 분류기가 추후 집중 관련 장비 설계에 있어서 효율적으로 적용될 수 있을 것이다.

  • PDF

조명 정규화 및 하이브리드 분류기를 이용한 계량기 숫자 인식 (Meter Numeric Character Recognition Using Illumination Normalization and Hybrid Classifier)

  • 오한글;조성원;정선태
    • 한국지능시스템학회논문지
    • /
    • 제24권1호
    • /
    • pp.71-77
    • /
    • 2014
  • 본 논문에서는 저조도 및 음영이 생기는 조명 환경하에서 성능이 개선된 계량기 숫자 인식 방법을 제안한다. 저조도 및 음영 문제를 해결하기 위해 LN(Local Normalization) 처리 기법을 이용한 조명 정규화를 수행한 후, 계량기 숫자 영역 검출과 3단계 계량기 숫자 분할이 이루어진다. 마지막으로 분할된 숫자 데이터를 분류하기 위한 하이브리드 숫자 분류기가 적용된다. 제안된 하이브리드 숫자 분류기는 역전파 신경망과 템플레이트 매칭의 연속 결합으로 이루어지고, 계량기 숫자 분류에 보다 강인한 휴리스틱 규칙에 의해 최종적으로 숫자를 분류한다. 저조도 및 음영 조명 환경하의 다양한 계량기 종류에 대해 직접 촬영하여 자체 제작한 계량기 이미지 데이터베이스에 기반한 실험을 통해 본 논문에서 제안한 숫자 인식 방법을 평가하고, 제안된 계량기 숫자 인식 방법이 효과적으로 잘 동작함을 확인하였다.