• 제목/요약/키워드: Hierarchical Classification

검색결과 388건 처리시간 0.236초

텍스트 문서 분류에서 범주간 유사도와 계층적 분류 방법의 성과 관계 연구 (A Study on the Relationship between Class Similarity and the Performance of Hierarchical Classification Method in a Text Document Classification Problem)

  • 장수정;민대기
    • 한국전자거래학회지
    • /
    • 제25권3호
    • /
    • pp.77-93
    • /
    • 2020
  • 비정형 텍스트 문서를 다중 범주로 분류하는 문제에 있어서, 계층적 분류 방법이 비계층적 분류 방법에 비하여 분류 성능이 우수한 것으로 알려져 있다. 기존 문헌과 다르게 본 연구에서는 사전에 범주들의 계층 구조가 정의된 상황에서 계층적 분류 방법과 비계층적 분류 방법의 성능을 비교하였다. 수자원 분야 기후변화 적응기술과 관련한 논문 분류 데이터와 20NewsGroup 오픈 데이터를 대상으로 계층적/비계층적 분류 방법의 성능을 비교하였다. 본 연구결과 기존 문헌과 다르게 계층적 분류 방법이 비계층적 분류 방법에 비하여 언제나 성능이 우수한 것은 아님을 확인하였다. 계층 구조의 상위/하위 수준에서의 상대적 유사도에 따라서 계층적/비계층적 분류 방법의 성능에 차이가 있음을 확인하였다. 즉, 상위 수준의 유사도가 하위 수준보다 상대적으로 낮은 경우 상위 수준에서의 오분류 감소로 계층적 분류 방법의 성능이 개선됨을 확인하였다.

계층적 CNN 기반 스테가노그래피 알고리즘의 6진 분류 (Hierarchical CNN-Based Senary Classification of Steganographic Algorithms)

  • 강상훈;박한훈
    • 한국멀티미디어학회논문지
    • /
    • 제24권4호
    • /
    • pp.550-557
    • /
    • 2021
  • Image steganalysis is a technique for detecting images with steganographic algorithms applied, called stego images. With state-of-the-art CNN-based steganalysis methods, we can detect stego images with high accuracy, but it is not possible to know which steganographic algorithm is used. Identifying stego images is essential for extracting embedded data. In this paper, as the first step for extracting data from stego images, we propose a hierarchical CNN structure for senary classification of steganographic algorithms. The hierarchical CNN structure consists of multiple CNN networks which are trained to classify each steganographic algorithm and performs binary or ternary classification. Thus, it classifies multiple steganogrphic algorithms hierarchically and stepwise, rather than classifying them at the same time. In experiments of comparing with several conventional methods, including those of classifying multiple steganographic algorithms at the same time, it is verified that using the hierarchical CNN structure can greatly improve the classification accuracy.

효율적인 사물 이미지 분류를 위한 계층적 이미지 분류 체계의 설계 및 구현 (Design and Implementation of Hierarchical Image Classification System for Efficient Image Classification of Objects)

  • 유태우;김윤욱;정하민;유현수;안용학
    • 융합보안논문지
    • /
    • 제18권3호
    • /
    • pp.53-59
    • /
    • 2018
  • 본 논문에서는 효율적인 사물 이미지 분류를 위한 계층적 이미지 분류 체계 방안에 대해 제안한다. 기존의 전체 이미지를 한 번에 분류하는 무 계층 이미지 분류에서는 상대적으로 유사한 모양을 가진 사물은 효율적으로 인식하지 못하는 모습을 보여줬다. 따라서 본 논문에서는 사물 이미지에 대해 계층적으로 분류를 시도하는 단계적 계층 구조에서의 이미지 분류 기법을 소개한다. 또한, 실제 시스템에 딥 러닝 이미지 분류가 적용되었을 때 발생할 수 있는 확장성에 대해서 고려하기 위해 확장성이 고려된 효율적인 클래스 구성 방식과 알고리즘도 소개한다. 이와 같은 방식은 상대적으로 유사한 형태를 보인 사물 이미지에 대해 더 높은 신뢰도로 이미지를 분류하는 것을 가능하게 한다.

  • PDF

Effective and Efficient Similarity Measures for Purchase Histories Considering Product Taxonomy

  • Yang, Yu-Jeong;Lee, Ki Yong
    • Journal of Information Processing Systems
    • /
    • 제17권1호
    • /
    • pp.107-123
    • /
    • 2021
  • In an online shopping site or offline store, products purchased by each customer over time form the purchase history of the customer. Also, in most retailers, products have a product taxonomy, which represents a hierarchical classification of products. Considering the product taxonomy, the lower the level of the category to which two products both belong, the more similar the two products. However, there has been little work on similarity measures for sequences considering a hierarchical classification of elements. In this paper, we propose new similarity measures for purchase histories considering not only the purchase order of products but also the hierarchical classification of products. Unlike the existing methods, where the similarity between two elements in sequences is only 0 or 1 depending on whether two elements are the same or not, the proposed method can assign any real number between 0 and 1 considering the hierarchical classification of elements. We apply this idea to extend three existing representative similarity measures for sequences. We also propose an efficient computation method for the proposed similarity measures. Through various experiments, we show that the proposed method can measure the similarity between purchase histories very effectively and efficiently.

계층적 분류방식에 의한 인영 검증 (A Hierarchical Classification Method for Verification of Seal Imprint)

  • 김진희;심재창;현기호;하영호
    • 전자공학회논문지B
    • /
    • 제28B권11호
    • /
    • pp.904-912
    • /
    • 1991
  • Automatic recognition of seal imprint has been required in the oriental countries. In this paper, a hierarchical approach for seal imprint verification is presented. Global features are used for seal imprint description in the first step. In the second step, conventional and several proposed local features are used to detect useful informations such as size, distribution and relative position of stroke length from seal imprint. In the last step, seal imprints are classified into one of three categories 'accept', 'ambiguous' and reject', based on the hierarchical classification. Experimental results show good performance on classification and recognition.

  • PDF

효율적인 패킷 분류를 위한 계층 우선순위 트라이 (Hierarchical Priority Trie for Efficient Packet Classification)

  • 추하늘;임혜숙
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2007년도 하계종합학술대회 논문집
    • /
    • pp.15-16
    • /
    • 2007
  • In order to provide value-added services, next generation routers should perform packet classification for each incoming packet at wire-speed. In this paper, we proposed hierarchical priority trio (Hptrie) for packet classification. The proposed scheme improves the search performance and the memory requirement by replacing empty internal nodes in ordinary hierarchical trio with priority nodes which are the nodes including the highest priority rule among sub-trie nodes.

  • PDF

계층구조적 분류모델을 이용한 심전도에서의 비정상 비트 검출 (Detection of Abnormal Heartbeat using Hierarchical Qassification in ECG)

  • 이도훈;조백환;박관수;송수화;이종실;지영준;김인영;김선일
    • 대한의용생체공학회:의공학회지
    • /
    • 제29권6호
    • /
    • pp.466-476
    • /
    • 2008
  • The more people use ambulatory electrocardiogram(ECG) for arrhythmia detection, the more researchers report the automatic classification algorithms. Most of the previous studies don't consider the un-balanced data distribution. Even in patients, there are much more normal beats than abnormal beats among the data from 24 hours. To solve this problem, the hierarchical classification using 21 features was adopted for arrhythmia abnormal beat detection. The features include R-R intervals and data to describe the morphology of the wave. To validate the algorithm, 44 non-pacemaker recordings from physionet were used. The hierarchical classification model with 2 stages on domain knowledge was constructed. Using our suggested method, we could improve the performance in abnormal beat classification from the conventional multi-class classification method. In conclusion, the domain knowledge based hierarchical classification is useful to the ECG beat classification with unbalanced data distribution.

다단계 계층군집 영상분류법을 이용한 토지 피복 분석 (Analysis of Land-cover Types Using Multistage Hierarchical flustering Image Classification)

  • 이상훈
    • 대한원격탐사학회지
    • /
    • 제19권2호
    • /
    • pp.135-147
    • /
    • 2003
  • 본 연구는 한반도 위성 영상자료에 다단계 계층군집 영상분류법을 적용하여 관측지역의 피복특성을 분석한다. 다단계 계층군집 영상분류는 크게 두 단계로 이루어진다. 첫 번째 단계는 계층군집에 의해 공간적으로 근접하고 있는 이웃집단간의 결합을 하는 공간확장 영상분할 단계이고 두번째 단계는 결합지역의 공간적 제약 없이 영상분할 단계에서 분할된 집단을 계층군집에 의해 적은 한정적인 수의 클래스로 분류하는 과정이다. 계층군집 영상분류는 수치영상의 계층구조에 근거하여 매 단계 두 개의 집단을 한 개의 집단으로 합병하므로 클래스 수에 따른 분류집단 간의 관계를 나타내는 계층나무를 구성할 수 있다. 실험결과는 계층군집 영상분류에 의해 구성된 계층나무는 토지사용간의 계층구조를 자세히 밝혀주고 토지 피복 특성의 정확한 분석에는 좀 더 자세한 분광정보가 필요함을 보여주고 있다.

Enhancing the Narrow-down Approach to Large-scale Hierarchical Text Classification with Category Path Information

  • Oh, Heung-Seon;Jung, Yuchul
    • Journal of Information Science Theory and Practice
    • /
    • 제5권3호
    • /
    • pp.31-47
    • /
    • 2017
  • The narrow-down approach, separately composed of search and classification stages, is an effective way of dealing with large-scale hierarchical text classification. Recent approaches introduce methods of incorporating global, local, and path information extracted from web taxonomies in the classification stage. Meanwhile, in the case of utilizing path information, there have been few efforts to address existing limitations and develop more sophisticated methods. In this paper, we propose an expansion method to effectively exploit category path information based on the observation that the existing method is exposed to a term mismatch problem and low discrimination power due to insufficient path information. The key idea of our method is to utilize relevant information not presented on category paths by adding more useful words. We evaluate the effectiveness of our method on state-of-the art narrow-down methods and report the results with in-depth analysis.

오토인코더 기반 심층 지도 네트워크를 활용한 계층형 데이터 분류 방법론 (Methodology for Classifying Hierarchical Data Using Autoencoder-based Deeply Supervised Network)

  • 김윤하;김남규
    • 지능정보연구
    • /
    • 제28권3호
    • /
    • pp.185-207
    • /
    • 2022
  • 최근 딥 러닝 기술의 발전으로 인해, 텍스트, 이미지 등 비정형 데이터 분석에 딥 러닝 알고리즘을 적용하는 연구가 활발히 수행되고 있다. 그중 텍스트 분류는 학계 및 업계에서 오랜 기간 연구되어 온 분야로, 분류의 성능을 향상시키기 위해 계층형 레이블 등 데이터 자체의 특성을 활용하기 위한 다양한 시도가 이루어지고 있다. 하지만 계층적 분류를 위해 주로 사용되는 하향식 접근법은 상위 레벨의 오분류가 하위 레벨의 정분류 기회를 차단한다는 한계가 있다. 따라서, 본 연구에서는 레이블의 계층적인 관계를 고려하면서도 상위 레벨의 분류가 하위 레벨의 분류를 차단하지 않도록 하여 분류 성능을 향상시키기 위해, 오토인코더 기반 심층 지도 네트워크를 활용한 계층형 데이터 분류 방법론을 제안한다. 제안 방법론은 오토인코더의 잠재변수에 하위 레이블을 예측하는 주 분류기를 추가하고, 인코더의 은닉층에 상위 레벨의 레이블 예측하는 보조 분류기를 추가하여 End-to-End 학습을 진행한다. 제안 방법론의 성능을 평가하기 위하여 국내 논문 데이터 총 22,512건에 대한 실험을 수행한 결과, 제안 모델이 기존의 지도 오토인코더 및 DNN 모델에 비해 분류 정확도와 F1-Score에서 우수한 성능을 나타냄을 확인하였다.