• 제목/요약/키워드: 분류각

검색결과 5,720건 처리시간 0.03초

다중결정템플릿기반 SVM결합모델을 통한 지문분류 (Fingerprint Classification Using SVM Combination Models based on Multiple Decision Templates)

  • 민준기;홍진혁;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.751-753
    • /
    • 2005
  • 지문을 5가지 클래스로 나누는 헨리시스템을 기반으로 신경망이나 SVM(Support Vector Machines) 등과 같은 다양한 패턴분류 기법들이 지문분류에 많이 사용되고 있다. 특히 최근에는 높은 분류 성능을 보이는 SVM 분류기의 결합을 이용한 연구가 활발히 진행되고 있다. 지문은 클래스 구분이 모호한 영상이 많아서 단일결합모델로는 분류에 한계가 있다. 이를 위해 본 논문에서는 새로운 분류기 결합모델인 다중결정템플릿(Multiple Decision Templates, MuDTs)을 제안한다. 이 방법은 하나의 지문클래스로부터 서로 다른 특성을 갖는 클러스터들을 추출하여 각 클러스터에 적합한 결합모델을 생성한다. NIST-database4 데이터로부터 추출한 핑거코드에 대해 실험한 결과. 5클래스와 4클래스 분류문제에 대하여 각각 $90.4\%$$94.9\%$의 분류성능(거부율 $1.8\%$)을 획득하였다.

  • PDF

DDC 20판의 주기 분석에 근거한 보조표 분류지원 전문가시스템 설계에 관한 연구 (A Study on Classification Support Expert System Design based on Note Analysis for DDC 20 Tables)

  • 김상미;남태우
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1994년도 제1회 학술대회 논문집
    • /
    • pp.129-132
    • /
    • 1994
  • DOC 20판에서는 보조표 활용을 위하여 다양한 형태의 주기(Note)가 여러 곳에 마련되어 있다. 이 주기는 새로운 학문들이 이전판의 분류체재와의 중복성을 극복하고, 정확한 문헌분류를 위한 중요한 문법규칙들을 포함하고 있다. 그러나. 기술된 주기의 다양성이 제대로 정리되어 있지 않아서 이 주기의 활용은 미흡한 실정이다. 따라서, 본 연구는 DDC 20판의 보조표 T1(표준세분표: Standard Subdivisions) 및 T2(지리, 시대, 인물 구분표: Geographic Areas, Historical Periods, Persons)에 대안 이용주기를 통계적 빈도수를 고려하여 분석하고, 분석된 주기를 유형별로 분류하여 각 유형별 분류기호 생성 문법을 마련하였으며, 분류기호 생성 문법을 유도트리(Derivation tree)를 활용하여 정확한 분류과정을 예시하고, 이를 자동분류시스템으로 활용할 수 있는 분류진원 전문가시스템 모형을 설계하였다.

  • PDF

고해상도 위성영상을 이용한 SVM의 분류정확도 분석 (Analysis of the SVM using High Resolution Satellite Imagery)

  • 강준묵;이성순;박준규;백승희
    • 한국측량학회:학술대회논문집
    • /
    • 한국측량학회 2010년 춘계학술발표회 논문집
    • /
    • pp.271-273
    • /
    • 2010
  • 고해상도 위성영상을 이용하여 대상물을 분류하는 것은 원격탐사의 중요한 분야이며, 위성영상 분류에 대한 주요 주제 중 하나는 분류정확도를 높이는 것이다. 본 연구에서는 KOMPSAT-2 영상을 이용하여 SVM(Support Vector Machine)과 MLC(Maximum Likelihood Classification) 방법으로 감독분류를 수행하고 각 분류결과의 비교를 통해 분류방법에 따른 정확도를 평가하고자 하였다. 적은 수의 표본 데이터를 이용한 고해상도 위성영상의 분류결과 SVM이 MLC에 비해 양호한 분류결과를 나타냄을 알 수 있었다.

  • PDF

어휘 유사 문장 판별을 위한 BERT모델의 학습자료 구축 (Methodology of Developing Train Set for BERT's Sentence Similarity Classification with Lexical Mismatch)

  • 정재환;김동준;이우철;이연수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.265-271
    • /
    • 2019
  • 본 논문은 어휘가 비슷한 문장들을 효과적으로 분류하는 BERT 기반 유사 문장 분류기의 학습 자료 구성 방법을 제안한다. 기존의 유사 문장 분류기는 문장의 의미와 상관 없이 각 문장에서 출현한 어휘의 유사도를 기준으로 분류하였다. 이는 학습 자료 내의 유사 문장 쌍들이 유사하지 않은 문장 쌍들보다 어휘 유사도가 높기 때문이다. 따라서, 본 논문은 어휘 유사도가 높은 유사 의미 문장 쌍들과 어휘 유사도가 높지 않은 의미 문장 쌍들을 학습 자료에 추가하여 BERT 유사 문장 분류기를 학습하여 전체 분류 성능을 크게 향상시켰다. 이는 문장의 의미를 결정짓는 단어들과 그렇지 않은 단어들을 유사 문장 분류기가 학습하였기 때문이다. 제안하는 학습 데이터 구축 방법을 기반으로 학습된 BERT 유사 문장 분류기들의 학습된 self-attention weight들을 비교 분석하여 BERT 내부에서 어떤 변화가 발생하였는지 확인하였다.

  • PDF

온톨로지 기반의 웹 페이지 분류 시스템 (Web Page Classification System based upon Ontology)

  • 최재혁;서혜성;노상욱;최경희;정기현
    • 정보처리학회논문지B
    • /
    • 제11B권6호
    • /
    • pp.723-734
    • /
    • 2004
  • 본 논문은 온톨로지(ontology)에 기반 한 자동화된 웹 페이지 분류 시스템을 제안한다. 웹 페이지의 분류를 위하여 첫 번째 단계에서는 각 웹 페이지가 속한 범주(category)를 대표할 수 있는 단어를 선정하며, 이를 위하여 단어빈도와 문서빈도를 곱한 값을 계산한다. 두 번째 단계에서는 첫 번째 단계에 의해 선택된 단어의 정보이득(information gain)을 계산해 분류 확률이 높은 단어를 우선적으로 선정한다. 두 단계를 통하여 선정된 단어들과 웹 페이지의 분류 정보를 가지고, 기계학습에 의하여 컴파일 된 규칙(compiled rules)을 생성한다. 생성된 규칙은 임의의 웹 페이지들을 도메인 온톨로지에 의해 정의된 범주 별로 분류할 수 있도록 한다. 본 논문의 실험에서는 주어진 웹 페이지 집합에서 각 범주 별로 평균 240개의 단어로부터 78개의 단어를 결과적으로 선정하였으며, 이를 바탕으로 웹 페이지 분류 규칙을 생성하였다. 실험 결과에서 제안한 시스템의 평균 분류 정확도는 약 83.52%로 측정되었다.

출력 코딩 기반 다중 클래스 서포트 벡터 머신을 위한 특징 선택 기법 (A Novel Feature Selection Method for Output Coding based Multiclass SVM)

  • 이영주;이정진
    • 한국멀티미디어학회논문지
    • /
    • 제16권7호
    • /
    • pp.795-801
    • /
    • 2013
  • 서포트 벡터 머신은 뛰어난 일반화 성능에 힘입어 다양한 분야에서 의사 결정 나무나 인공 신경망에 비해 더 좋은 분류 성능을 보이고 있기 때문에 최근 널리 사용되고 있다. 서포트 벡터 머신은 기본적으로 이진 분류 문제를 위하여 설계되었기 때문에 서포트 벡터 머신을 다중 클래스 문제에 적용하기 위한 방법으로 다중 이진 분류기의 출력 결과를 이용하는 출력 코딩 방법이 주로 사용되고 있다. 그러나 출력 코딩 기반 서포트 벡터 머신에 사용된 기존 특징 선택 기법은 각 분류기의 정확도 향상을 위한 특징이 아니라 전체 분류 정확도 향상을 위한 특징을 선택하고 있다. 본 논문에서는 출력 코딩 기반 서포트 벡터 머신의 각 이진 분류기의 분류 정확도를 최대화하는 특징을 각각 선택하여 사용함으로써, 전체 분류 정확도를 향상시키는 특징 선택 기법을 제안한다. 실험 결과는 제안 기법이 기존 특징 선택 기법에 비하여 통계적으로 유의미한 분류 정확도 향상이 있었음을 보여주었다.

배치 정규화와 CNN을 이용한 개선된 영상분류 방법 (An Improved Image Classification Using Batch Normalization and CNN)

  • 지명근;전준철;김남기
    • 인터넷정보학회논문지
    • /
    • 제19권3호
    • /
    • pp.35-42
    • /
    • 2018
  • 딥 러닝은 영상 분류를 위한 여러 방법 중 높은 정확도를 보이는 방법으로 알려져 있다. 본 논문에서는 딥 러닝 방법 가운데 합성곱 신경망 (CNN:Convolutional Neural Network)을 이용하여 영상을 분류함에 있어 배치 정규화 방법이 추가된 CNN을 이용하여 영상 분류의 정확도를 높이는 방법을 제시하였다. 본 논문에서는 영상 분류를 더 정확하게 수행하기 위해 기존의 뉴럴 네트워크에 배치 정규화 계층 (layer)를 추가하는 방법을 제안한다. 배치 정규화는 각 계층에 존재하는 편향을 줄이기 위해 고안된 방법으로, 각 배치의 평균과 분산을 계산하여 이동시키는 방법이다. 본 논문에서 제시된 방법의 우수성을 입증하기 위하여 SHREC13, MNIST, SVHN, CIFAR-10, CIFAR-100의 5개 영상 데이터 집합을 이용하여 영상분류 실험을 하여 정확도와 mAP를 측정한다. 실험 결과 일반적인 CNN 보다 배치 정규화가 추가된 CNN이 영상 분류 시 보다 높은 분류 정확도와 mAP를 보임을 확인 할 수 있었다.

한국의 민속약용식물에 대한 정량적 분석 (Quantitative Analysis of the Medicinal Usage in Ethnobotanical Plant Resources of Korea)

  • 정재민;조상호;김영실
    • 한국자원식물학회:학술대회논문집
    • /
    • 한국자원식물학회 2018년도 춘계학술발표회
    • /
    • pp.41-41
    • /
    • 2018
  • 민속식물과 그 이용에 관한 전통지식이 산업화, 도시화 및 노인 세대의 퇴장과 더불어 빠르게 사라지고 있다. 이에 본 연구는 민속식물 주권확보 기반구축을 위하여 2005년부터 2017년까지 1차(2005~2013), 2차(2014~2017)에 걸쳐 남한 전역 및 함경북도 접경지역을 대상으로 각 지역에서 전통적으로 이용해왔으며 전승되어 온 민속식물 관련 전통지식을 발굴 및 수집하였다. 민속식물 중 약용으로 사용된 것은 121과 383속 583종 3아종 64변종 12품종으로 총 662분류군으로 확인되어 식용 다음으로 큰 비중을 차지하였다. 이는 한반도 전체 관속식물 4,881분류군의 약 13.6%에 해당하며, 총 115,236건의 조사된 전통지식 중 17.9%를 약용이 점유하여 식용(67.2%) 다음이며 용재용(4.9%), 유지용(2.5%), 관상용(1.3%) 등에 비하여 상당히 높게 나타났다. 662분류군 중 자생식물은 511분류군(77.2%)으로 나타났고, 생활형은 다년생 초본이 295분류군(44.6%)으로 낙엽성 목본(186분류군), 1년생 초본(78분류군) 등 타 생활형에 보다 높았다. 약용식물의 이용부위는 뿌리(34.1%)가 가장 많았고 그 다음으로 줄기(16.2%), 잎(15.4%), 열매(12.1%), 전초(12.1%), 수피(3.2%), 종자(2.4%), 꽃(1.9%) 등의 순으로 나타났다. 우리나라에서 이용빈도가 높은 상위 10개 분류군을 살펴보면 익모초, 쇠무릎, 인동덩굴, 느릅나무, 삽주, 엉겅퀴, 쑥, 질경이, 오갈피나무, 할미꽃 등의 순으로 조사되었다. 본 연구에서는 민속식물의 이용에 대한 중요도를 알아보기 위하여 특정식물 종의 이용을 언급한 정보보유자의 수(FC: Frequency of Citations), 이용범주의 수(NC: Number of use-Categories), 특정식물을 이용하는 수(UR: number of User Reports)를 활용하여 문화적 중요도(CI: Cultural Importance), 상대적 인용빈도(RFC: Relative Frequency of Citations), 상대적 중요도(RI: Relative Importance) 및 문화적 가치(CV: Cultural Value)를 산출하여 우리나라에서 중요한 민속식물을 정량적으로 확인, 비교하였고 각 분류군별 지수도 제시하였다.

  • PDF

KCI 등재 학술지의 분류를 위한 네트워크 군집화 방법의 비교 (A classification of the journals in KCI using network clustering methods)

  • 김진광;김소형;오창혁
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권4호
    • /
    • pp.947-957
    • /
    • 2016
  • KCI는 국내 학술지 및 게재 논문과 인용에 대한 데이터베이스이며, 이를 이용하여 국내 학술지 간의 인용 관계를 파악할 수 있다. 현재 사용 중인 KCI의 학술지 분류는 각 학술지의 등재 신청 시 학술지 발간 주체가 선정한 분류로 인용 관계에 의한 분류가 아니다. 이로 인해 같은 분류에 속하는 학술지 사이의 인용관계가 없거나 낮은 현상이 발생하기도 하여 인용관계가 많은 학술지끼리 같이 묶여야 한다는 기준에 부합하지 않는 문제점이 발생하고 있다. 따라서 학술지 분류가 학술지 간의 인용정도를 잘 대표하지 못하는 것으로 알려져 있다. 본 연구에서는 KCI에 등재된 학술지 분류와 KCI 인용망에 네트워크 군집화 알고리즘을 적용한 군집 결과를 토대로 어떠한 차이가 있는지 살펴보았다. 이를 위해 최근 논문에서 대표적으로 다뤄지는 네트워크 알고리즘을 제시하고, 인용관계에 따른 각 알고리즘의 군집 결과 차이를 비교하였다. 그 결과 '인포맵' 알고리즘이 기존 KCI 분류망과 모듈화 구조 측면에서 유사성이 가장 높은 것으로 나타났다.

퍼지 소속도 함수와 가중치 평균을 이용한 지도 학습 기반 분류기 설계 (Design of a Classifier Based on Supervised Learning Using Fuzzy Membership Function and Weighted Average)

  • 우영운
    • 한국정보통신학회논문지
    • /
    • 제25권4호
    • /
    • pp.508-514
    • /
    • 2021
  • 본 논문에서는 지도 학습 기반의 분류기 제안을 위해, 분류 데이터의 각 특징별 소속도를 결정하는 3가지 종류의 퍼지 소속도 함수를 제안하였다. 또한 각 특징별 소속도들의 평균값을 이용하여 분류 결과를 도출하는 과정에 사용되는 평균값 산출 기법을 단순 산술평균이 아닌 다양한 가중치를 활용한 가중치 평균을 이용함으로써 분류기 성능을 향상시킬 수 있는 가능성을 제시하였다. 제안한 기법들의 실험을 위해 Iris, Ecoli, Yeast의 3가지 표준 데이터 세트를 사용하였다. 실험 결과, 서로 다른 특성의 데이터 세트들에 대해서도 고르게 우수한 분류 성능이 얻어질 수 있음을 확인하였고, 기존에 발표된 다른 기법들에 의한 해당 데이터 세트들의 분류 성능과 비교했을 때, 퍼지 소속도 함수의 개선과 가중치 평균 기법의 개선을 통해 더욱 우수한 분류 성능이 가능함을 확인할 수 있었다.