• 제목/요약/키워드: 분류 문제

검색결과 3,561건 처리시간 0.035초

효과적인 얼굴 인식을 위한 인식기 선택 (Classifier Selection for Efficient Face Recognition)

  • 남미영;이필규
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 춘계종합학술대회
    • /
    • pp.453-456
    • /
    • 2005
  • 본 논문에서는 얼굴의 속성에 따라 각각의 알고리즘의 인식 성능이 달라지는 점에 착안해서, 다양한 얼굴 데이터를 클러스터링한 후 가장 효과적인 알고리즘을 선택적으로 사용하여 인식 성능을 높이는 방법을 제안하였다. 인식기 융합 문제는 인식결과를 결정짓는 문제에서 많이 사용하는 방식이며, Kuncheva는 데이터를 기준을 두어 영역별로 구분한 후. 각 데이터 영역에 맞는 분류기가 어떠한 것인가를 찾는 방법을 제안하였다. 분류기 여러개를 선택하여 사용할 경우, 어떻게 결과를 융합할것 인가에 대한 문제는 제시하지 않고 있다. 단지. 각 영역에 대하여, 어떠한 분류기를 사용하는 것이 좋을 것인가에 대한 문제만을 해결한다. 어떠한 영역의 데이터는 여러개의 분류기를 적용해도 된다는 결론하에, 각 분류기가 유사한 성능을 나타내므로, 어떠한 분류기를 사용하든 무관하다는 방향으로 전개한다. 따라서 본 논문에서는 각 데이터 영역별로 어떠한 분류기가 좋을 것인지 판단하며, 각 분류기에서 나온 결과값들을 융합하는 방법에 대하여 제안한다.

  • PDF

대규모 분류 체계에서 계층적 샘플링을 활용한 문서의 분류 (Classification using Hierarchical Sampling in Large Classification System)

  • 홍성모;장헌석;강인호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.51-55
    • /
    • 2017
  • 대규모 분류체계를 사용하는 경우, 기존 방법의 딥 러닝으로는 분류 정확도가 현저히 떨어진다. 이를 해결하기 위해 계층 구조를 활용한 네거티브 샘플링 방법을 제안한다. 학습 문서가 속한 카테고리의 상위 카테고리와 일정부분 겹치는 범위에서 네거티브 샘플을 선택하면, 하나의 큰 문제를 다수개의 하위 문제로 쪼개서 해결하는 학습 효과가 있다. 소규모 분류 체계와 대규모 분류체계 각각에서 샘플링 전략을 차용하였을 때를 비교한 결과, 대규모에서 효과가 좋았으며 그 때의 정확도가 150배 이상 차이가 나는 것을 보였다.

  • PDF

서포트 벡터 기반 퍼지 분류 시스템을 이용한 물체 인식 (The study on the object recognition using Fuzzy Classification system based on Support Vector)

  • 김성진;원상철
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2003년도 학술회의 논문집 정보 및 제어부문 A
    • /
    • pp.167-170
    • /
    • 2003
  • 본 논문에서는 패턴 인식의 전형적인 경우인 보이기 기반 물체 인식(Appearance based object recognition)을 수행하기 위하여, 일반적인 퍼지 분류 모델과, 서포트 벡터 머신을 하이브리드(hybrid) 하게 연결한 서포트 벡터 기반 퍼지 분류 시스템이라는 새로운 방법을 제안하고 이에 대하여 연구한다. 일반적인 분류(classification)문제의 경우 두 클래스로 구분하는데 최적의 성능을 가지고 있는 서포트 벡터 머신이 다중클래스(Multiclass)의 경우 발생 하는 계산량의 증가 문제를 해 결하기 위하여 다중 클래스 분류(Multiclass classification)에 장점을 가진 퍼지 분류 시스템을 도입, 서포트 벡터 머신에 연결함으로써 단점을 보완하는 시스템을 제안한다. 즉 서포트 벡터 머신을 통해 퍼지 시스템의 구조를 러닝(learning)하는데 사용하여 최종 적으로는 퍼지 분류 시스템(Fuzzy Classifier)이 나오도록 하는 것이다. 이 시스템의 성능을 확인하고자 여러 가지 물체들에 대한 이미지를 가지고 있는 COIL(Columbia Object Image Library) 데이터 베이스를 사용하여 보이기 기반 물체 인식(Appearance based Object Recognition)을 수행 하였으며 이를 순수한 서포트 벡터 머신만을 이용하여 물체 인식을 수행한 경우와 정확도 및 인식 시간에 대하여 비교하였다.

  • PDF

대규모 분류 체계에서 계층적 샘플링을 활용한 문서의 분류 (Classification using Hierarchical Sampling in Large Classification System)

  • 홍성모;장헌석;강인호
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.51-55
    • /
    • 2017
  • 대규모 분류체계를 사용하는 경우, 기존 방법의 딥 러닝으로는 분류 정확도가 현저히 떨어진다. 이를 해결하기 위해 계층 구조를 활용한 네거티브 샘플링 방법을 제안한다. 학습 문서가 속한 카테고리의 상위 카테고리와 일정부분 겹치는 범위에서 네거티브 샘플을 선택하면, 하나의 큰 문제를 다수개의 하위 문제로 쪼개서 해결하는 학습 효과가 있다. 소규모 분류 체계와 대규모 분류체계 각각에서 샘플링 전략을 차용하였을 때를 비교한 결과, 대규모에서 효과가 좋았으며 그 때의 정확도가 150배 이상 차이가 나는 것을 보였다.

  • PDF

SVM 앙상블을 이용한 심혈관질환 질환단계 예측 (Prediction of Cardiovascular Disease Steps using Support Vector Machine Ensemble)

  • 엄재홍;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (A)
    • /
    • pp.76-78
    • /
    • 2006
  • 현재 심혈관 질환은 암 다음으로 높은 사망 원인으로 기록되고 있어 심혈관 질환에 대한 초기 진단은 질환의 치료에 매우 중요한 문제로 대두되고 있다. 본 논문에서는 SVM을 이용하여 심혈관질환 환자의 질환 단계를 예측하였다. 일반적으로 이진분류에 사용되는 SVM을 이용하여 정상 및 질환 $1{\sim}3$기의 총 4가지 분류가 필요한 다분류 분류문제를 처리하기 위해서 논문에서는 독립적 학습된 단일 SVM 분류기들을 결합하여 분류를 수행하는 SVM 앙상블 방법을 사용하였다. 단일 분류기의 결합은 Majority voting, 최소자승에러기반 가중치 부여, 2단계층 결합 등의 방법으로 수행하여 심혈관 질환 분류에 적합한 앙상블의 구성을 시도하였다. 실험 데이터는 (주)제노프라의 압타머 칩 데이터를 사용하였다. 서로 다른 데이터를 이용하여 학습된 이종의 SVM들을 결합한 결과 질환단계 예측에 있어서 단일 SVM을 이용하여 질환 단계를 예측하는 경우 보다 향상된 질환단계 예측 성능을 관찰할 수 있었으며, 심혈관 질환의 예측에 대해서는 단일 SVM 분류기의 2단 계층 결합법이 가장 좋은 성능을 보임을 확인하였다.

  • PDF

계층적 레이블 임베딩을 이용한 세부 분류 개체명 인식 (Fine-grained Named Entity Recognition using Hierarchical Label Embedding)

  • 김홍진;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.251-256
    • /
    • 2021
  • 개체명 인식은 정보 추출의 하위 작업으로, 문서에서 개체명에 해당하는 단어를 찾아 알맞은 개체명을 분류하는 자연어처리 기술이다. 질의 응답, 관계 추출 등과 같은 자연어처리 작업에 대한 관심이 높아짐에 따라 세부 분류 개체명 인식에 대한 수요가 증가했다. 그러나 기존 개체명 인식 성능에 비해 세부 분류 개체명 인식의 성능이 낮다. 이러한 성능 차이의 원인은 세부 분류 개체명 데이터가 불균형하기 때문이다. 본 논문에서는 이러한 데이터 불균형 문제를 해결하기 위해 대분류 개체명 정보를 활용하여 세부 분류 개체명 인식을 수행하는 방법과 대분류 개체명 인식의 오류 전파를 완화하기 위한 2단계 학습 방법을 제안한다. 또한 레이블 주의집중 네트워크 기반의 구조에서 레이블의 공통 요소를 공유하여 세부 분류 개체명 인식에 효과적인 레이블 임베딩 구성 방법을 제안한다.

  • PDF

웹 기반 주관식 답분류 채점시스템 (A Web-based Grading System for Classifying Answers of Subjective Test)

  • 방훈;강태호;김원진;원대희;이재영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.589-591
    • /
    • 2001
  • 본 논문에서는 근거리통신, 인터넷 등의 통신을 이용하여 해당 출제자의 분야별로 출제한 주관식문제를 모든 응시자가 주관식문제의 답을 보내고, 해당 답들을 문제별로 답을 분류한 답, 빈도수, 문제, 해설 등의 채점 정보를 출제자에게 알려주면 출제자는 응시자가 쓴 답들의 종류, 각 답들의 분포, 문제의 해설 등을 참고하여 각 답에 대하여 배점을 결정하고 서버는 이 배점으로 채점한 결과를 출제자에게 보여주는 주관식 답분류 채점시스템에 관한 것이다.

  • PDF

영상분류문제를 위한 역전파 신경망과 Support Vector Machines의 비교 연구 (A Comparison Study on Back-Propagation Neural Network and Support Vector Machines for the Image Classification Problems)

  • 서광규
    • 한국산학기술학회논문지
    • /
    • 제9권6호
    • /
    • pp.1889-1893
    • /
    • 2008
  • 본 논문은 영상 분류 문제를 위한 support vector machines (SVMs)의 적용을 통한 분류의 성능을 다루고 있다. 본 연구에서는 영상 분류 문제에서 자연영상을 대상으로 색상, 질감, 형상 특징벡터를 추출하고, 각각의 특징벡터와 이들을 결합한 특징벡터를 사용하여 역전파 신경망과 SVM 기반의 방법을 적용하여 영상 분류의 정확성을 비교한다. 실험결과는 각각의 특징벡터중에는 색상 특징벡터값을 이용한 영상 분류가 그리고 각각의 특징벡터보다는 이들을 결합한 특징벡터를 이용한 영상 분류가 보다 우수함을 보여준다. 그리고 알고리즘간의 비교에서는 정확성과 일반화성능 측면에서 역전파 신경망보다 SVMs이 우수함을 보였다.

한국어 분류를 위한 효율적인 서브 워드 분절 (Efficient Subword Segmentation for Korean Language Classification)

  • 서현진;남정재;김민석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.535-540
    • /
    • 2022
  • Out of Vocabulary(OOV) 문제는 인공신경망 기계번역(Neural Machine Translation, NMT)에서 빈번히 제기되어 왔다. 이를 해결하기 위해, 기존에는 단어를 효율적인 압축할 수 있는 Byte Pair Encoding(BPE)[1]이 대표적으로 이용되었다. 하지만 BPE는 빈도수를 기반으로 토큰화가 진행되는 결정론적 특성을 취하고 있기에, 다양한 문장에 관한 일반화된 분절 능력을 함양하기 어렵다. 이를 극복하기 위해 최근 서브 워드를 정규화하는 방법(Subword Regularization)이 제안되었다. 서브 워드 정규화는 동일한 단어 안에서 발생할 수 있는 다양한 분절 경우의 수를 고려하도록 설계되어 다수의 실험에서 우수한 성능을 보였다. 그러나 분류 작업, 특히 한국어를 대상으로 한 분류에 있어서 서브 워드 정규화를 적용한 사례는 아직까지 확인된 바가 없다. 이를 위해 본 논문에서는 서브 워드 정규화를 대표하는 두 가지 방법인 유니그램 기반 서브 워드 정규화[2]와 BPE-Dropout[3]을 이용해 한국어 분류 문제에 대한 서브 워드 정규화의 효과성을 제안한다. NMT 뿐만 아니라 분류 문제 역시 단어의 구성성 및 그 의미를 파악하는 것은 각 문장이 속하는 클래스를 결정하는데 유의미한 기여를 한다. 더불어 서브 워드 정규화는 한국어의 문장 구성 요소에 관해 폭넓은 인지능력을 함양할 수 있다. 해당 방법은 본고에서 진행한 한국어 분류 과제 실험에서 기존 BPE 대비 최대 4.7% 높은 성능을 거두었다.

  • PDF