• 제목/요약/키워드: information classification

검색결과 8,303건 처리시간 0.037초

문서 범주화를 이용한 지식관리시스템에서의 전문가 분류 자동화 (Automation of Expert Classification in Knowledge Management Systems Using Text Categorization Technique)

  • 양근우;허순영
    • Asia pacific journal of information systems
    • /
    • 제14권2호
    • /
    • pp.115-130
    • /
    • 2004
  • This paper proposes how to build an expert profile database in KMS, which provides the information of expertise that each expert possesses in the organization. To manage tacit knowledge in a knowledge management system, recent researches in this field have shown that it is more applicable in many ways to provide expert search mechanisms in KMS to pinpoint experts in the organizations with searched expertise so that users can contact them for help. In this paper, we develop a framework to automate expert classification using a text categorization technique called Vector Space Model, through which an expert database composed of all the compiled profile information is built. This approach minimizes the maintenance cost of manual expert profiling while eliminating the possibility of incorrectness and obsolescence resulted from subjective manual processing. Also, we define the structure of expertise so that we can implement the expert classification framework to build an expert database in KMS. The developed prototype system, "Knowledge Portal for Researchers in Science and Technology," is introduced to show the applicability of the proposed framework.

E-mail Classification and Category Re-organization using Dynamic Category Hierarchy and PCA

  • Park, Sun;Kim, Chul-Won;An, Dong-Un
    • Journal of information and communication convergence engineering
    • /
    • 제7권3호
    • /
    • pp.351-355
    • /
    • 2009
  • The amount of incoming e-mails is increasing rapidly due to the wide usage of Internet. We often group e-mails into categories for maintaining e-mail efficiently. However reading the email messages and classifying them is still tedious task. Moreover, the number of e-mails and manual classifying is increasing everyday. So, automatic e-mail classification is important techniques. In this paper, we propose a multi-way e-mail classification method that uses PCA for automatic category generation and dynamic category hierarchy for re-organizing e-mail categories. It classifies a huge amount of receiving e-mail messages automatically, efficiently, and accurately.

Packet Classification을 위한 Cross-Product 알고리즘 구현과 성능평가 (Cross-Product Algorithm Implementation and Performance Evaluation for Packet Classification)

  • 강길수;최경희;정기현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (중)
    • /
    • pp.1077-1080
    • /
    • 2003
  • 본 연구는 룰들의 각 필드들을 index하여 곱한 cross-product 테이블을 이용한 packet classification 알고리즘에 대해 연구하고 그 것의 성능을 평가하고 분석한다. 현재 Packet Classification은 Packet Filtering, Policy Routing, Accounting & Billing, Traffic Rate Limiting, Traffic Shaping, 등등의 서비스를 위한 가장 핵심적인 작업이다. 그러나 이들을 빠르게 서비스하는 알고리즘은 아직 존재하지 않는다. 단지 하드웨어 TCAM 을 이용해서 작은 룰들에 대한 처리만이 어느 정도 가능한 실정이다. 이에 본 연구는 소프트웨어를 이용한 cross-product 알고리즘의 효용성을 가늠하고자 연구하고 이를 실제 구현해 평가하고자 한다.

  • PDF

SUPPORT Applications for Classification Trees

  • Lee, Sang-Bock;Park, Sun-Young
    • Journal of the Korean Data and Information Science Society
    • /
    • 제15권3호
    • /
    • pp.565-574
    • /
    • 2004
  • Classification tree algorithms including as CART by Brieman et al.(1984) in some aspects, recursively partition the data space with the aim of making the distribution of the class variable as pure as within each partition and consist of several steps. SUPPORT(smoothed and unsmoothed piecewise-polynomial regression trees) method of Chaudhuri et al(1994), a weighted averaging technique is used to combine piecewise polynomial fits into a smooth one. We focus on applying SUPPORT to a binary class variable. Logistic model is considered in the caculation techniques and the results are shown good classification rates compared with other methods as CART, QUEST, and CHAID.

  • PDF

Combined Features with Global and Local Features for Gas Classification

  • Choi, Sang-Il
    • 한국컴퓨터정보학회논문지
    • /
    • 제21권9호
    • /
    • pp.11-18
    • /
    • 2016
  • In this paper, we propose a gas classification method using combined features for an electronic nose system that performs well even when some loss occurs in measuring data samples. We first divide the entire measurement for a data sample into three local sections, which are the stabilization, exposure, and purge; local features are then extracted from each section. Based on the discrimination analysis, measurements of the discriminative information amounts are taken. Subsequently, the local features that have a large amount of discriminative information are chosen to compose the combined features together with the global features that extracted from the entire measurement section of the data sample. The experimental results show that the combined features by the proposed method gives better classification performance for a variety of volatile organic compound data than the other feature types, especially when there is data loss.

New Unsupervised Classification Technique for Polarimetric SAR Images

  • Oh, Yi-Sok;Lee, Kyung-Yup;Jang, Ge-Ba
    • 대한원격탐사학회지
    • /
    • 제25권3호
    • /
    • pp.255-261
    • /
    • 2009
  • A new polarimetric SAR image classification technique based on the degree of polarization (DoP) and the co-polarized phase-difference (CPD) is presented in this paper. Since the DoP and the CPD of a scattered wave provide information on the randomness of the scattering and the type of scattering mechanisms, at first, the statistics of the DoP and CPD are examined with measured polarimetric SAR image data. Then, a DoP-CPD diagram with appropriate boundaries between six different classes is developed based on the SAR image. The classification technique is verified using the JPL AirSAR and ALOS PALSAR polarimetric data. The technique may have capability to classify an SAR image into six major classes; a bare surface, a village, a crown-layer short vegetation canopy, a trunk-layer short vegetation canopy, a crown-layer forest, and a trunk-dominated forest.

A Recent Development in Support Vector Machine Classification

  • Hong, Dug-Hun;Hwang, Chang-Ha;Na, Eun-Young
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 한국데이터정보과학회 2002년도 춘계학술대회
    • /
    • pp.23-28
    • /
    • 2002
  • Support vector machine(SVM) has been very successful in classification, regression, time series prediction and density estimation. In this paper, we will propose SVM for fuzzy data classification.

  • PDF

능동 학습과 시간 문맥 정보를 이용한 작물 재배지역 분류 (Classification of Crop Cultivation Areas Using Active Learning and Temporal Contextual Information)

  • 김예슬;유희영;박노욱;이경도
    • 한국지리정보학회지
    • /
    • 제18권3호
    • /
    • pp.76-88
    • /
    • 2015
  • 이 논문에서는 작물 재배지의 분류를 목적으로 능동 학습과 과거 토지 피복도 기반의 시간 문맥 정보를 결합하는 분류 방법론을 제안하였다. 신뢰성 높은 훈련 자료의 추출을 위하여 능동 학습 기반 반복 분류를 적용하였으며, 과거 토지 피복도의 작물 재배 규칙을 시간 문맥 정보로 정량화 하여 능동 학습 기법의 적용시 훈련 자료의 할당과 작물 간 분광학적 혼재 효과 완화에 이용하였다. 제안 분류 방법론의 적용 가능성을 평가하기 위해 미국 Illinois 주의 옥수수와 콩 재배지역의 구분을 목적으로 MODIS 시계열 식생지수 자료와 과거 cropland data layer(CDL) 자료를 이용한 사례연구를 수행하였다. 사례연구 결과, 초기 감독 분류 결과에서 나타났던 옥수수와 콩의 오분류와 기타 작물과 비작물의 오분류 양상이 능동 학습 기반 반복 분류를 통해 완화되었다. 그리고 CDL 자료로부터 추출한 시간 문맥 정보를 추가적으로 결합함으로써 주요 작물에서 나타나는 과추정 양상이 완화되어 가장 우수한 분류 정확도를 나타내었다. 따라서 제안 기법이 양질의 훈련 자료의 확보가 쉽지 않은 작물 재배지의 분류에 유용하게 적용될 수 있음을 확인하였다.

Fuzzy SVM for Multi-Class Classification

  • 나은영;홍덕헌;황창하
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 한국데이터정보과학회 2003년도 추계학술대회
    • /
    • pp.123-123
    • /
    • 2003
  • More elaborated methods allowing the usage of binary classifiers for the resolution of multi-class classification problems are briefly presented. This way of using FSVC to learn a K-class classification problem consists in choosing the maximum applied to the outputs of K FSVC solving a one-per-class decomposition of the general problem.

  • PDF

중소기업의 FTA 특혜활용을 위한 HS 품목분류 자가결정 방법에 대한 연구 (A Study on Methodology of Self-determination of HS Commodity Classification for Utilizing FTA Preferential Tariff of SMEs)

  • 김영춘;류건우;이주영
    • 통상정보연구
    • /
    • 제16권1호
    • /
    • pp.91-116
    • /
    • 2014
  • FTA가 확대됨에 따라 FTA별로 상이한 원산지결정기준을 활용한 특혜 수혜가 점차 어려워지고 있다. 특히 전문인력과 정보가 부족한 중소기업은 정확한 품목분류를 통한 원산지결정에 상당한 어려움을 겪고 있는 실정이다. 따라서 본 논문에서는 품목분류 지식이 부족한 비전문가도 수출입 상품의 품목분류를 손쉽게 하여 FTA를 최대한 활용할 수 있도록 지원하는 정보기술 활용방법으로서, 품목분류를 시뮬레이션 할 수 있는 기술적인 요소와 로직 등을 검토하였다. 그리고 이를 위해 품목분류를 위한 요소를 물품별로 분석해 사례베이스를 구축하여 품목번호 결정을 지원하는 기술을 제시하였다. 본 시스템의 사용자는 FTA 컨설팅 효과뿐만 아니라 교육 효과가 있는 품목분류 자가결정 시스템을 활용함으로써, 품목분류에 대한 자체점검이 가능하고 품목분류에 드는 시간과 비용을 줄일 수 있으며, 정확한 품목분류에 근거하여 원산지증명서를 발급하여 FTA 특혜관세 혜택을 향유할 수 있음에 따라 경쟁력을 강화할 수 있는 이점을 누릴 수 있을 것이다.

  • PDF