• Title/Summary/Keyword: 계층적 분류 방법

Search Result 348, Processing Time 0.029 seconds

Ontology-Based Document Classification (온톨로지 기반 웹 문서 분류)

  • 송무희;임수연;민도식;강동진;이상조
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10a
    • /
    • pp.535-537
    • /
    • 2003
  • 본 논문에서는 웹 문서들이 가지는 용어 정보들과 어휘들의 의미구조를 계층적 형태로 표현한 온틀로지 기반 자동 문서분류 방법을 제안한다. 문서 분류는 문서들을 가장 잘 표현할 수 있는 자질들을 점하고 이러한 자질들을 통해 미리 정의된 2개 이상의 카테고리에 문서의 내용을 파악하여 가장 관련이 있는 카테고리로 할당하는 것이다. 본 논문에서는 웹 문서에서 추출한 용어 정보들의 유사도와 온톨로지 카테고리의 유사도를 계산하여 웹 문서를 분류하며, 문서 분류를 위한 실험데이터나 학습과정 없이 바로 실시간으로 문서분류가 이루어지며, 결과적으로 문서들이 가지는 고유한 의미와 관계의 식별을 통하여 보다 더 정확하게 문서분류를 가능하게 해준다.

  • PDF

Design and Implementation of a Component Repository System based on a CBD Methodology (CBD 기반 컴포넌트 리파지토리 시스템 설계 및 구현)

  • Park, Chang-Sup;Yeon, Seung-Ho;Rhee, Hae-Kyu;Park, Hyun-Gyu;Lee, Sang-Soo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.05b
    • /
    • pp.1003-1006
    • /
    • 2003
  • 본 논문에서는 KT 서비스개발연구소에서 개발된 컴포넌트 리파지토리 시스템의 설계 및 구현방법을 소개한다. 본 시스템은 CBD 방법론 및 EJB 컴포넌트 모델을 적용하여 유연하고 확장성 높은 컴포넌트 기반 시스템으로 개발되었다. 본 시스템은 컴포넌트를 기술하고 검색하기 위한 컴포넌트 명세 방법과 컴포넌트들을 체계적으로 분류, 관리할 수 있는 계층적 분류 체계를 정의한다 또 컴포넌트의 재활용을 위해 효과적인 검색 및 탐색 방법을 제공하며, 사용자 관리 및 통계 기능 둥을 포함한다. 본 논문에서는 요구사항 분석, 설계, 구현 단계에서 CBD 방법론의 적용 방안을 기술하고, 특히 컴포넌트 식별 및 컴포넌트 구조 설계 방법에 대해 상세히 기술한다.

  • PDF

Study on Classification Scheme for Multilateral and Hierarchical Traffic Identification (다각적이고 계층적인 트래픽 분석을 위한 트래픽 분류 체계에 관한 연구)

  • Yoon, Sung-Ho;An, Hyun-Min;Kim, Myung-Sup
    • KIPS Transactions on Computer and Communication Systems
    • /
    • v.3 no.2
    • /
    • pp.47-56
    • /
    • 2014
  • Internet traffic has rapidly increased due to the supplying wireless devices and the appearance of various applications and services. By increasing internet traffic rapidly, the need of Internet traffic classification becomes important for the effective use of network resource. However, the traffic classification scheme is not much studied comparing to the study for classification method. This paper proposes novel classification scheme for multilateral and hierarchical traffic identification. The proposed scheme can support multilateral identification with 4 classification criteria such as service, application, protocol, and function. In addition, the proposed scheme can support hierarchical analysis based on roll-up and drill-down operation. We prove the applicability and advantages of the proposed scheme by applying it to real campus network traffic.

Extended Electronic Catalog for dynamic and flexible Electronic Commerce (전자상거래를 위한 확장된 디지털 카탈로그 및 질의 모델 제안)

  • 정지혜;이상구;우치수
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.120-122
    • /
    • 1999
  • World Wide Web은 하이퍼미디어라는 뛰어난 사용자 인터페이스 기능을 제공함으로써 인터넷을 대중화 시켰고, 전자상거래라는 인터넷의 상업화도 가능하게 되었다. 이와 같은 전자상거래에서 필수적인 기술 중의 하나는 사용자가 원하는 상품의 카탈로그를 쉽고 빠르게 찾는 것이다. 본 논문의 목적은 전자 카탈로그를 정의하고 질의하는 모델을 제안하여 전자 카탈로그 시스템을 보다 쉽게 구축하고 유지하며 사용자의 요구사항을 만족하는 상품에 대한 카탈로그를 보다 쉽게 검색할 수 있는 방법을 제공하는 것이다. 본 모델의 주된 아이디어는 상품에 대한 정보를 표현하는 기존의 카탈로그와 계층적 검색을 위해 존재하는 분류체계를 통합하여 하나의 객체로 정의하고 그 객체에 대한 질의 언어를 정의함으로써 기존의 카탈로그에 대한 개념을 확장하여 전자 카탈로그 시스템 전반에 관한 검색을 용이하도록 하는 것이다. 확장된 카탈로그는 하나의 객체로 정의되기 때문에 질의에 의해 전체를 필터링해서 일부분만을 보여주거나, 사용자가 원하는 형태로 재구성하는 것이 가능하게 된다. 이를 위해 본 모델에서는 상품에 대한 정보를 그래프 형태로 정의하고 그들을 계층적으로 분류하는 분류 체계에 대해서 설명한다. 그리고 확장된 카탈로그를 각 상품과 카테고리를 노드로 한 그래프 형태로 정의하고 그에 대한 질의어를 제안한다.

  • PDF

A SVM-based Method for Classifying Tagged Web Resources using Tag Stability of Folksonomy in Categories (범주별 태그 안정성을 이용한 태그 부착 자원의 SVM 기반 분류 기법)

  • Koh, Byung-Gul;Lee, Kang-Pyo;Kim, Hyoung-Joo
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.15 no.6
    • /
    • pp.414-423
    • /
    • 2009
  • Folksonomy, which is collaborative classification created by freely selected keywords, is one of the driving factors of the web 2.0. Folksonomy has advantage of being built at low cost while its weakness is lack of hierarchical or systematic structure in comparison with taxonomy. If we can build classifier that is able to classify web resources from collective intelligence in taxonomy, we can build taxonomy at low cost. In this paper, targeting folksonomy in Slashdot.org, we define a general model and show that collective intelligence, which can build classifier, really exists in folksonomy using a stability value. We suggest method that builds SVM classifier using stability that is result from this collective intelligence. The experiment shows that our proposed method managed to build taxonomy from folksonomy with high accuracy.

Reinforcement Method for Automated Text Classification using Post-processing and Training with Definition Criteria (학습방법개선과 후처리 분석을 이용한 자동문서분류의 성능향상 방법)

  • Choi, Yun-Jeong;Park, Seung-Soo
    • The KIPS Transactions:PartB
    • /
    • v.12B no.7 s.103
    • /
    • pp.811-822
    • /
    • 2005
  • Automated text categorization is to classify free text documents into predefined categories automatically and whose main goals is to reduce considerable manual process required to the task. The researches to improving the text categorization performance(efficiency) in recent years, focused on enhancing existing classification models and algorithms itself, but, whose range had been limited by feature based statistical methodology. In this paper, we propose RTPost system of different style from i.ny traditional method, which takes fault tolerant system approach and data mining strategy. The 2 important parts of RTPost system are reinforcement training and post-processing part. First, the main point of training method deals with the problem of defining category to be classified before selecting training sample documents. And post-processing method deals with the problem of assigning category, not performance of classification algorithms. In experiments, we applied our system to documents getting low classification accuracy which were laid on a decision boundary nearby. Through the experiments, we shows that our system has high accuracy and stability in actual conditions. It wholly did not depend on some variables which are important influence to classification power such as number of training documents, selection problem and performance of classification algorithms. In addition, we can expect self learning effect which decrease the training cost and increase the training power with employing active learning advantage.

Classification of Tongue Coating for Tongue Diagnosis in Korean Medicine (한의학의 설진을 위한 설태 분류 방법)

  • Kim, Keun-Ho;Choi, Eun-Ji;Lee, Si-Woo;Kim, Jong-Yeol
    • Proceedings of the KIEE Conference
    • /
    • 2008.07a
    • /
    • pp.1985-1986
    • /
    • 2008
  • 혀의 상태는 인체 내부의 생리적 병리적 특성의 변화를 나타내므로, 한의학에서 중요한 지수가 된다. 한의학에서 설진 방법은 환자의 설질과 설태의 변화를 관찰함으로써 질병을 진찰하는 방법이므로, 편리할 뿐만 아니라 비침습적이고, 널리 쓰이고 있다. 그러나 설진은 광원, 환자의 자세, 한의사의 상태와 같은 검사 환경에 의해 영향을 받는다. 표준화된 진단을 위한 자동 진단 시스템을 개발하기 위하여 질병의 예후를 판단할 수 있는 설태 분류 방법은 필수적이지만, 컬러의 경계가 모호하므로 설태와 설질을 구분하기는 매우 어렵다. 이 논문에서 분할된 설체 내에서 컬러를 계층적으로 분류하여 설태를 분류하는 방법을 제안한다. 또한 설태 영역을 정확하게 분할하도록 하였다. 제안된 방법은 표준화된 진단을 가능하도록 한다.

  • PDF

Conceptual Clustering of Korean Concordances using Similarities between Morphemes (형태소 사이의 유사도를 이용한 용례의 의미별 분류)

  • Baek, Dae-Ho;Lee, Ho;Rim, Hae-Chang
    • Annual Conference on Human and Language Technology
    • /
    • 1996.10a
    • /
    • pp.235-240
    • /
    • 1996
  • 본 논문에서는 정보 검색에서 사용하는 계층적 클러스터링 기법을 이용하여 용례들을 중심어의 의미에 따라 분류하고자 한다. 분류에 필요한 용례 사이의 유사도는 형태소 사이의 유사도를 이용하여 계산한다. 형태소 사이의 유사도 계산에는 상호 정보, 상호 정보의 유사도, 벡터 유사도 등을 사용한다. 품사 태깅된 17만 코퍼스에서 명사 4개와 동사 4개를 중심어로 사용하여 추출된 용례에 대해서 각 방법의 정확도를 실험한 결과 상호 정보와 상호 정보 유사도를 더한 값을 형태소 사이의 유사도로 사용한 방법이 90.16%의 정확도를 보였다. 제안된 방법에서 사용하는 정보들은 의미 태깅되지 않은 코퍼스에서 추출할 수 있기 때문에, 정보의 획득이 쉬운 장점이 있다.

  • PDF

Hierarchical Land Cover Classification using IKONOS and AIRSAR Images (IKONOS와 AIRSAR 영상을 이용한 계층적 토지 피복 분류)

  • Yeom, Jun-Ho;Lee, Jeong-Ho;Kim, Duk-Jin;Kim, Yong-Il
    • Korean Journal of Remote Sensing
    • /
    • v.27 no.4
    • /
    • pp.435-444
    • /
    • 2011
  • The land cover map derived from spectral features of high resolution optical images has low spectral resolution and heterogeneity in the same land cover class. For this reason, despite the same land cover class, the land cover can be classified into various land cover classes especially in vegetation area. In order to overcome these problems, detailed vegetation classification is applied to optical satellite image and SAR(Synthetic Aperture Radar) integrated data in vegetation area which is the result of pre-classification from optical image. The pre-classification and vegetation classification were performed with MLC(Maximum Likelihood Classification) method. The hierarchical land cover classification was proposed from fusion of detailed vegetation classes and non-vegetation classes of pre-classification. We can verify the facts that the proposed method has higher accuracy than not only general SAR data and GLCM(Gray Level Co-occurrence Matrix) texture integrated methods but also hierarchical GLCM integrated method. Especially the proposed method has high accuracy with respect to both vegetation and non-vegetation classification.

A Study on Cluster Topic Selection in Hierarchical Clustering (계층적 클러스터링에서 분류 대표어 선정에 관한 연구)

  • Yi, Sang-Seon;Lee, Shin-Won;An, Dong-Un;Chung, Sung-Jong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.05a
    • /
    • pp.669-672
    • /
    • 2004
  • 정보의 양이 많아지면서 정보 검색 시스템에 검색 결과를 자동으로 구조화하는 계층적 클러스터링을 적용하는 시도가 늘고 있다. 계층적 클러스터링은 문서 간의 유사도를 통해 클러스터를 계층 구조로 만들어 검색 성능을 높이고 결과를 사용자에게 이해하기 쉽게 보여준다. 계층 구조는 검색 결과를 요약하는 것이기 때문에 클러스터의 내용을 효과적으로 함축할 수 있는 대표어의 선정이 중요하다. 각 클러스터의 대표어를 선정하기 위해 대표어에 명사인 단어만 추출하고 상위 클러스터 대표어에 사용된 단어는 하위 클러스터에 사용하지 않는 방법을 적용하여 대표어의 질을 높였다.

  • PDF