• 제목/요약/키워드: category classification

검색결과 658건 처리시간 0.029초

PCA와 동적 분류체계를 사용한 자동 이메일 계층 분류 (Automatic e-mail Hierarchy Classification using Dynamic Category Hierarchy and Principal Component Analysis)

  • 박선
    • 한국항행학회논문지
    • /
    • 제13권3호
    • /
    • pp.419-425
    • /
    • 2009
  • 인터넷 사용의 보편화로 인해 이메일의 양이 급속히 증가하고 있다. 이에 따라서 수신된 메일을 효율적이고 정확하게 분류할 필요성이 점차 증가하고 있다. 현재의 이메일 분류 기술들은 베이지안, 규칙 기반 등을 이용하여 스팸 메일을 필터링하기 위한 이원 분류가 주를 이루고 있다. 이메일의 다원분류 방법중 군집(clustering)을 이용한 분류 방법은 분류의 정확도가 떨어지고 분류 레이블이 없는 단점이 있으며, 분류(classification)를 이용한 방법은 미리 분류 레이블을 사용자가 지정해야 하며 학습시켜야 하는 단점을 갖는다. 본 논문에서는 PCA (Principal Component Analysis)를 기반으로 한 자동 카테고리 생성 방법과 동적 분류 체계 방법을 결합한 새로운 자동 이메일 계층 분류 방법을 제안한다. 이 방법은 수신되는 이메일을 자동으로 분류하여 대량의 메일을 효율적으로 관리할 수 있으며, 메일을 동적으로 재분류 하여 분류 정확률을 높일 수 있다.

  • PDF

A Comparison Study of Multiclass SVM Methods in Microarray Data

  • Hwang, Jin-Soo;Lee, Ji-Young;Kim, Jee-Yun
    • Journal of the Korean Data and Information Science Society
    • /
    • 제17권2호
    • /
    • pp.311-324
    • /
    • 2006
  • The Support Vector Machine(SVM) is very functional and efficient classification method to any other classification analysis method. However, its optimal extension to more than two classes is not obvious. In this paper several multi-category SVM methods are introduced and compared using simulation and real data sets. Also comparison with traditional multi-category classification and SVM based methods is performed.

  • PDF

한국전통문양의 유형에 따른 분류에 관한 연구 (A Study on Classification of Koran Traditional Patterns Based on Their Types)

  • 장수경
    • 복식문화연구
    • /
    • 제2권2호
    • /
    • pp.283-295
    • /
    • 1994
  • A systematic classification of Korean traditional patterns has been made according to their objects and presenting methods. The classification is represented with 3 levels of categories. First, the superordinate category is composed of 7 groups of patterns, i.e. Naturals, Animals, Plants, Artifacts, Geometric, Composites, and Others. Second, the basic category is composed of motifs in each group. Third, the subordinate category is composed of 3 types, i.e. realistic, stylized, abstracted, according to the degree of simplification. As this classification is a method for organizing informations in Korean traditional patterns in a systematic way, it can offer a useful basis for computerization of the patterns.

  • PDF

Modified ECCD 및 문서별 범주 가중치를 이용한 문서 분류 시스템 (A Document Classification System Using Modified ECCD and Category Weight for each Document)

  • 한정석;박상용;이수원
    • 정보처리학회논문지B
    • /
    • 제19B권4호
    • /
    • pp.237-242
    • /
    • 2012
  • 웹 문서 정보 서비스는 관리자의 효율적 문서관리와 사용자의 문서검색 편의성을 위해 문서 분류 시스템을 필요로 한다. 기존의 문서 분류 시스템은 분류하고자 하는 문서 내 선택된 자질어의 개수가 적거나, 특정 범주의 문서 비율이 높아 그 범주에서 대부분의 자질어가 선택되어 모델이 생성된 경우 분류 정확도가 저하되는 문제점을 가진다. 이러한 문제점을 해결하기 위해 본 논문에서는 'Modified ECCD' 기법 및 '문서별 범주 가중치' 특징 변수를 사용한 문서 분류 시스템을 제안한다. 실험 결과, 제안 방법인 'Modified ECCD' 기법이 ${\chi}^2$ 및 ECCD 기법에 비해 높은 분류 성능을 보였으며, '문서별 범주 가중치' 특징 변수를 'Modified ECCD' 기법으로 선택된 자질어 변수에 추가하여 학습하였을 경우에 더 높은 분류 성능을 보였다.

한국 인터넷서점 분류체계 연구 - 카테고리와 도서 분류를 중심으로 - (A Study of Classification System for Online Bookstore in Korea: Categories and Book Classification)

  • 곽철완
    • 한국문헌정보학회지
    • /
    • 제47권1호
    • /
    • pp.221-247
    • /
    • 2013
  • 본 연구의 목적은 국내 인터넷서점들의 카테고리 및 판매도서의 분류의 특징을 조사 및 분석하여 그 개선 방안을 제시하는데 있다. 이를 위해, 국내의 8개 인터넷서점을 선정하여 각 서점의 1차 카테고리 명칭의 일치 여부와, 판매도서의 카테고리 분류를 상호 비교하였다. 카테고리 비교를 위해서 일치도 변인, 카테고리 분류 비교를 위해서 분류 일치성 변인을 사용하였다. 연구 결과, 인터넷서점의 카테고리 일치도는 상당히 높았지만, 카테고리 분류는 판매도서에 따라 인터넷서점 간 차이가 많았다. 일부 인터넷서점에서 활용하고 있는 ISBN 내용분류기호는 판매도서의 카테고리 분류에 효과적인 역할을 하지 못하고 있었다. 개선방안으로 서점에 판매도서 분류에 활용할 수 있는 출판물 카테고리 개발을 제안하였다.

주성분 분석과 동적 분류체계를 사용한 자동 이메일 분류 (Automatic e-mail classification using Dynamic Category Hierarchy and Principal Component Analysis)

  • 박선;김철원;이양원
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2009년도 춘계학술대회
    • /
    • pp.576-579
    • /
    • 2009
  • 인터넷 사용의 보편화로 이메일의 양이 급속히 증가하고 있다. 따라서 수신 메일을 효율적이면서 정확하게 분류할 필요성이 점차 증가하고 있다. 현재의 이메일 분류는 베이지안, 규칙 기반 등을 이용하여 스팸 메일을 필터링하기 위한 이원 분류가 주를 이루고 있다. 클러스터링을 이용한 다원 분류 방법은 분류의 정확도가 떨어지는 단점이 있다. 본 논문에서는 주성분 분석(PCA, Principal Component Analysis)을 기반으로 한 자동 카테고리 생성 방법과 동적 분류 체계 방법을 결합한 새로운 자동 이메일 분류 방법을 제안한다. 이 방법은 수신되는 이메일을 자동으로 분류하여 대량의 메일을 효율적으로 관리할 수 있으며, 메일을 동적으로 재분류 하여 분류 정확률을 높일 수 있다.

  • PDF

자동 카테고리 생성과 동적 분류 체계를 사용한 이메일 분류 (Classification of e-mail Using Dynamic Category Hierarchy and Automatic category generation)

  • 안찬민;박상호;이주홍;최범기;박선
    • 지능정보연구
    • /
    • 제10권2호
    • /
    • pp.79-89
    • /
    • 2004
  • 이메일 사용이 보편화됨에 따라 점차 수신되는 메일의 량이 증가하고 있다. 이러한 메일 량의 증가는 사용자로 하여금 이메일을 좀더 효율적으로 분류할 수 있는 방법을 필요하게 한다. 그러나 현재의 이메일 분류는 규칙기반, 베이시안, SVM등을 이용하여 스팸메일을 필터링 하는 이원분류가 주로 연구되고 있다. 이외에도 다원분류에 대한 연구로는 클러스터링을 이용한 방법이 있으나, 이는 단순히 유사도에 의해 메일을 그룹화 하는 수준이다. 본 논문에서는 벡터모델의 유사도를 기반으로 한 자동 카테고리 생성 방법과 동적분류체계 방법을 결합하여 새로운 이메일 자동 분류 방법을 제안했다. 본 논문에서 제안한 방법은 이메일을 자동으로 다원분류하며 대량의 메일도 효율적으로 관리할 수 있다. 또한 메일을 동적으로 재분류 할 수 있게 함으로써 정확율을 높였다.

  • PDF

새로운 영상 향상법과 신경회로망을 이용한 다중분광 영상의 카테고리 분류 (A Category Classification of Multispectral Images Using a New Image Enhancement Method and Neural Networks)

  • 신현욱;안명석;조용욱;조석제
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 1999년도 추계종합학술대회
    • /
    • pp.204-209
    • /
    • 1999
  • 일반적으로 신경회로망은 다중분광 영상의 카테고리 분류를 위해 많이 사용되나 다중분광 영상의 경우 카테고리간 명암도차가 얼마나지 않아 오차 수렴시간이 많이 걸리고 분류성능이 떨어진다. 이와 같은 문제점을 해결하기 위해 본 논문에서는 평활화 과정, 주된 골을 찾는 과정, 그리고 향상 과정으로 구성되는 새로운 영상 향상법을 제안하고, 제안한 방법으로 향상된 다중분광 영상을 신경회로망의 입력으로 하여 카테고리 분류하였다. 제안한 방법을 LANDSAT TM 영상에 적용한 결과 신경회로망의 오차 수렴속도가 빨라졌고, 분류 성능이 향상되었음을 확인할 수 있었다.

  • PDF

역대 본초서(本草書)의 본초분류체계에 대한 연구 (A Study on the Bencao Classification System in Materia Medica of East Asian Medical History)

  • 白明勳;辛相元
    • 대한한의학원전학회지
    • /
    • 제36권3호
    • /
    • pp.89-128
    • /
    • 2023
  • Objectives : This study aims to diachronically examine the classification systems of all materia medica, followed by categorization and analysis of each category to deduce each category's characteristic. This will provide foundation for further examining classifications of bencao in contemporary herbology. Methods : Classification systems from a total of 93 bencao related texts were collected and categorized. Each category's classification system was analyzed to determine its meaning. The classification systems were compared from a diachronic perspective, to further deduce each system's problem from a historical context. Results : The classification systems of materia medica could be summarized as following three standards: quality, origin, and medical application. In reality, bencao could be generally classified according to origin and medical application. The origin-based classification system provided a stable and flexible classification outline in the expansion process of bencao. The medical application-based classification strengthened the relationship between bencao and illness pattern, improving clinical applicability. Conclusions : In the history of herbology, the two classification systems created the current of herbology through mutual contribution and conflict. We hope that further discussion on the direction towards which classification system of bencao in contemporary herbology should head will proceed based on this study.

Improving Classification Accuracy in Hierarchical Trees via Greedy Node Expansion

  • Byungjin Lim;Jong Wook Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권6호
    • /
    • pp.113-120
    • /
    • 2024
  • 정보통신 기술이 발전함에 따라 우리는 일상에서 다양한 형태의 데이터를 손쉽게 생성하고 있다. 이처럼 방대한 데이터를 효율적으로 관리하려면, 체계적인 카테고리별 분류가 필수적이다. 효율적인 검색과 탐색을 위해서 데이터는 트리 형태의 계층적 구조인 범주 트리로 조직화되는데, 이는 뉴스 웹사이트나 위키피디아에서 자주 볼 수 있는 구조이다. 이에 따라 방대한 양의 문서를 범주 트리의 단말 노드로 분류하는 다양한 기법들이 제안되었다. 그러나 범주 트리를 대상으로 하는 문서 분류기법들은 범주 트리의 높이가 증가할수록 단말 노드의 수가 기하급수적으로 늘어나고 루트 노드부터 단말 노드까지의 길이가 길어져서 오분류 가능성이 증가하며, 결국 분류 정확도의 저하로 이어진다. 그러므로 본 연구에서는 사용자의 요구 분류 정확도를 만족시키면서 세분화된 분류를 구현할 수 있는 새로운 노드 확장 기반 분류 알고리즘을 제안한다. 제안 기법은 탐욕적 접근법을 활용하여 높은 분류정확도를 갖는 노드를 우선적으로 확장함으로써, 범주 트리의 분류 정확도를 극대화한다. 실데이터를 이용한 실험 결과는 제안 기법이 단순 방법보다 향상된 성능을 제공함을 입증한다.