• 제목/요약/키워드: 분류화

검색결과 4,781건 처리시간 0.032초

문헌분류법에서의 주류설정의 원리 (A Study on Principle and Theory of Main Classes in the Library Classification)

  • 남태우
    • 한국문헌정보학회지
    • /
    • 제40권4호
    • /
    • pp.333-366
    • /
    • 2006
  • 지식분류는 개념을 설정하고 정의를 내린 후 학문명칭을 부여한다. 문헌분류법은 지식기반 원칙이므로 학문명칭을 실용성 우선으로 하여 주류명을 설정하는 단궤로부터 시작된다 어떤 분류법도 지식의 최초의 구분은 주류(main classes)를 창출하는 일이다. 주류는 일반적으로 전통적 학문분류와 등가이다. 그러나 주류의 설정은 지식구분과 동일한 순차는 존재할 수 없다. 그래서 주류를 구성하는 일은 다양할 수밖에 없다. 어느 분류법이든 두 가지 관념이 기본이 되는데 군집화와 순차화이다. 그렇다면 군집화는 주류명을 부여하는 단계라면, 순차화는 주류순을 결정하는 단계라고 할 수 있다. 문헌분류법에서 각각의 주류를 열거하고 있으나, 이에 대한 명확한 기준이나 철학이나 이론적 근거를 규명할 수는 없다. 그렇지만 이러한 주류설정의 원칙이나 이론 등은 전혀 연구된바가 없다. 따라서 본 연구에서는 분류표의 총체적인 구조의 근거가 되는 주류의 설정원칙과 그 논리를 연구하고자 함이 목적이다.

신문자동인식 시스템을 위한 문자의 분류에 관한 연구 (A Study on the Classify of Character for Newspaper Automatic Recognition System)

  • 이승형;전종익;조용주;남궁재찬
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
    • /
    • pp.209-215
    • /
    • 1989
  • 본 논문에서는 신문자동인식을 위한 신문문자의 분류에 관한 연구를 하였다. 먼저, 문서의 문자를 추출하기 위하여 블럭화를 행한다. 블럭화는 문자열을 찾아 절과절, 단어와 단어 사이를 찾아 분리구간을 정한다음 블럭을 합성 및 분리를 하였다. 다음으로 블럭화된 문자의 종류를 알기 위한 각 문자에 대하여 6 형식 분류를 하여 특성을 조사함으로써 문자분류를 행하였다. 본 연구에서는 실험을 용하여 블럭화는 충실하게 추출이 되어졌고 한글의 모아쓰기 특성과 한문과의 유사한 형식특성 때문에 분류에 어려움이 있었으나 비교적 충실하게 추출하였다.

  • PDF

쇼크 그래프를 이용한 효과적인 영상 군집화 (Effective Image Clustering Using Shock Graphsm)

  • 장석우;솔리마 카남;백우진
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2011년도 제43차 동계학술발표논문집 19권1호
    • /
    • pp.249-252
    • /
    • 2011
  • 본 논문에서는 쇼크(shock) 그래프 기반의 뼈대 특징을 이용하여 모양 정보를 분류하기 위해 그래프 편집 거리(edit cost) 기반의 k-means 군집화 알고리즘을 적용하는 방법을 제안한다. 본 논문에서 제안된 방법에서는 먼저 질의 영상과 대상 데이터베이스 영상으로부터 뼈대 기반의 쇼크 그래프를 추출한 후 종점(end points)과 분기점(branch points)을 가중치를 이용하여 적응적으로 선택한다. 그런 다음, 두 영상 사이의 편집 거리를 구하여 이를 k-means 군집화 알고리즘의 거리 척도로 적용함으로써 대용량의 영상을 보다 효과적으로 분류한다. 성능을 평가하기 위해서 제안된 알고리즘을 MPEG-7 데이터베이스에 적용하였으며, 그 결과 제안된 영상 분류 방법이 기존의 영상 분류 방법에 비해서 보다 효과적으로 모양 기반의 영상을 분류하였음을 확인하였다.

  • PDF

EM 알고리즘을 이용한 이진 분류 문서 범주화의 성능 향상 (Improving performance of Binary Text Classification Using the EM algorithm)

  • 한형동;고영중;서정연
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.790-792
    • /
    • 2004
  • 문서 범주화에서 이진분류를 다중 분류에 적용할 때, 일반적으로 One-Against-All 방법을 사용한다. 하지만, 이 One-Against-All 방법은 한가지 문제점을 가진다. 즉, positive 집합의 문서들은 사람이 직접 범주를 할당한 것이지만, negative 집합의 문서들은 사람이 직접 범주를 할당한 것이 아니기 때문에 오류 문서들이 포함될 수 있다는 것이다. 본 논문에서는 이러한 문제점을 해결하기 위해 Sliding Window기법과 EM 알고리즘을 이진 분류 기반의 문서 범주화에 적용할 것을 제안한다. 먼저 Sliding Window 기법을 이용하여 학습 데이터로부터 오류 문서들을 추출하고 이 문서들을 EM 알고리즘을 사용해서 다시 범주를 할당함으로써 이진 분류 기반의 문서 범주화 기법의 성능을 향상시킨다.

  • PDF

대용량 디지털 사진 분류 및 레이아웃 시스템 개발 (Layout System for Large-Scale Photo Classification)

  • 장철진;김형준;조환규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.98-101
    • /
    • 2009
  • 디지털 카메라의 사용이 일반화됨에 따라 수많은 디지털 사진들이 새롭게 생성되고 있다. 수많은 사진을 사용자가 직접 분류하고 앨범화하는 것은 많은 노력과 시간이 소요되는 불편한 작업이 되고 있다. 최근 들어서는 카메라의 높은 보급률로 인해 하나의 행사에 있어서도 여러대의 카메라가 사용되는 등 대용량 사진을 효과적으로 분류하고 시각화할 수 있는 방법의 필요성이 증가하고 있다. 개인적인 사진 관리에 있어서 뿐만 아니라 여러명의 촬영한 사진의 분류 및 제 3 자에게 사진이 촬영된 내용을 소개하기 위한 목적 등 다양한 방면에서 사진 클러스터링 및 시각화와 관련된 기법이 사용될 수 있다. 본 논문에서는 이와 관련된 이전 연구들을 살펴보고 개발중인 사진 분류 및 시각화 시스템의 프로토타입을 소개하며 기존 방법들과 차별화되는 사진 처리 기법에 대해서 살펴본다.

저성능 자원에서 멀티 에이전트 운영을 위한 의도 분류 모델 경량화 (Compressing intent classification model for multi-agent in low-resource devices)

  • 윤용선;강진범
    • 지능정보연구
    • /
    • 제28권3호
    • /
    • pp.45-55
    • /
    • 2022
  • 최근 자연어 처리 분야에서 대규모 사전학습 언어모델(Large-scale pretrained language model, LPLM)이 발전함에 따라 이를 미세조정(Fine-tuning)한 의도 분류 모델의 성능도 개선되었다. 하지만 실시간 응답을 요하는 대화 시스템에서 대규모 모델을 미세조정하는 방법은 많은 운영 비용을 필요로 한다. 이를 해결하기 위해 본 연구는 저성능 자원에서도 멀티에이전트 운영이 가능한 의도 분류 모델 경량화 방법을 제안한다. 제안 방법은 경량화된 문장 인코더를 학습하는 과제 독립적(Task-agnostic) 단계와 경량화된 문장 인코더에 어답터(Adapter)를 부착하여 의도 분류 모델을 학습하는 과제 특화적(Task-specific) 단계로 구성된다. 다양한 도메인의 의도 분류 데이터셋으로 진행한 실험을 통해 제안 방법의 효과성을 입증하였다.

복합 분류기를 이용한 웹 문서 범주화에 관한 실험적 연구 (An Experimental Study on Categorization of Web Documents Using an Ensemble Classifier)

  • 이혜원;정영미
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2003년도 제10회 학술대회 논문집
    • /
    • pp.73-82
    • /
    • 2003
  • 본 연구에서는 웹 문서를 분류하기 위해 문서로부터 다양한 자질을 추출하고, 두 가지의 분류기를 통해 여러 개의 분류 예측치를 구한 다음, 그것들을 하나의 결과물로 통합하는 복합분류기를 사용하였다. 먼저 다양한 자질 집합에 대해 일반적으로 많이 사용되는 kNN(k nearest neighbor) 분류기와 나이브 베이즈(Naive Bayes) 분류기를 사용한 범주화 실험을 수행하고, 실험을 통해 나온 범주 예측치를 통합하는 복합 분류기들의 성능을 비교하였다. 또한 단일 분류기들을 통해 나온 모든 범주 예측치를 통합하는 과정을 수행하여, 단일 분류기만을 사용할 경우와 복합 분류기를 사용할 경우를 비교해 더 좋은 성능을 나타내는 분류기를 밝히고자 한다.

  • PDF

한국산 상사화속(Lycoris, 수선화과)의 분류학적 재검토 (A taxonomic review of Korean Lycoris (Amaryllidaceae))

  • 김무열
    • 식물분류학회지
    • /
    • 제34권1호
    • /
    • pp.9-26
    • /
    • 2004
  • 한국산 상사화속 식물을 분류학적으로 재검토하여 5종 2변종으로 재정리하였다. 이중 한국 특산식물은 진노랑상사화, 위도상사화, 붉노랑강상사화, 제주상사화, 백양꽃 5종이다. 또한 위도상사화, 붉노랑상사화, 제주상사화는 acrocentric 염색체를 가진 식물과 metacentric과 telocentric 염색체를 가진 식물간의 자연교잡을 통해 형성된 교잡종임을 지지해 주고 있다. 붉노랑상사화의 holotype 표본으로 "M. Kim, Aug. 20, 1987"표본을 새로이 지정하고 재명명하였다. 위도상사화는 붉노랑상사화와 뚜렷이 구별되어 종으로 승격하고 재명명하였다. 정확한 종동정을 위해 검색표와 각 분류군의 기재문을 제시하였다.

문제분류규칙을 이용한 변수 순서화 알고리즘 (Variable Ordering Algorithms Using Problem Classifying)

  • 손석원
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권4호
    • /
    • pp.127-135
    • /
    • 2011
  • 백트래킹을 이용한 깊이우선탐색에서 해를 빨리 찾기 위한 방법 중 하나는 결정변수의 순서를 효과적으로 배열하는 것이다. 이 때 문제의 동적 및 정적 특성을 고려한 변수 순서화 알고리즘 개발은 매우 중요한 문제이다. 그러나 문제에 적합한 최적의 변수 순서화 알고리즘을 개발하는 것은 어려운 문제이다. 본 논문에서는 변수의 속성에 기반을 두어 문제의 형태를 규정하는 문제분류규칙을 제안하고 이 규칙을 이용하여 문제에 적합한 변수 순서화 알고리즘의 형태를 예측할 수 있게 한다. 결정변수가 동적 및 정적 특성을 갖는 DS-type 문제로서 주파수 할당문제를 선택하여 최적의 변수 순서화 알고리즘을 예측한다. 또한 문제분류규칙에 의해 생성되지 않는 특별한 형태의 문제인 기지국 위치문제를 적용하여 제안하는 문제분류규칙의 효용성을 입증한다.

KCI 등재 학술지의 분류를 위한 네트워크 군집화 방법의 비교 (A classification of the journals in KCI using network clustering methods)

  • 김진광;김소형;오창혁
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권4호
    • /
    • pp.947-957
    • /
    • 2016
  • KCI는 국내 학술지 및 게재 논문과 인용에 대한 데이터베이스이며, 이를 이용하여 국내 학술지 간의 인용 관계를 파악할 수 있다. 현재 사용 중인 KCI의 학술지 분류는 각 학술지의 등재 신청 시 학술지 발간 주체가 선정한 분류로 인용 관계에 의한 분류가 아니다. 이로 인해 같은 분류에 속하는 학술지 사이의 인용관계가 없거나 낮은 현상이 발생하기도 하여 인용관계가 많은 학술지끼리 같이 묶여야 한다는 기준에 부합하지 않는 문제점이 발생하고 있다. 따라서 학술지 분류가 학술지 간의 인용정도를 잘 대표하지 못하는 것으로 알려져 있다. 본 연구에서는 KCI에 등재된 학술지 분류와 KCI 인용망에 네트워크 군집화 알고리즘을 적용한 군집 결과를 토대로 어떠한 차이가 있는지 살펴보았다. 이를 위해 최근 논문에서 대표적으로 다뤄지는 네트워크 알고리즘을 제시하고, 인용관계에 따른 각 알고리즘의 군집 결과 차이를 비교하였다. 그 결과 '인포맵' 알고리즘이 기존 KCI 분류망과 모듈화 구조 측면에서 유사성이 가장 높은 것으로 나타났다.