• Title/Summary/Keyword: 분류화

Search Result 4,781, Processing Time 0.03 seconds

An Automatic Classification System of Korean Documents Using Weight for Keywords of Document and Word Cluster (문서의 주제어별 가중치 부여와 단어 군집을 이용한 한국어 문서 자동 분류 시스템)

  • Hur, Jun-Hui;Choi, Jun-Hyeog;Lee, Jung-Hyun;Kim, Joong-Bae;Rim, Kee-Wook
    • The KIPS Transactions:PartB
    • /
    • v.8B no.5
    • /
    • pp.447-454
    • /
    • 2001
  • The automatic document classification is a method that assigns unlabeled documents to the existing classes. The automatic document classification can be applied to a classification of news group articles, a classification of web documents, showing more precise results of Information Retrieval using a learning of users. In this paper, we use the weighted Bayesian classifier that weights with keywords of a document to improve the classification accuracy. If the system cant classify a document properly because of the lack of the number of words as the feature of a document, it uses relevance word cluster to supplement the feature of a document. The clusters are made by the automatic word clustering from the corpus. As the result, the proposed system outperformed existing classification system in the classification accuracy on Korean documents.

  • PDF

Design of a Sound Classification System for Context-Aware Mobile Computing (상황 인식 모바일 컴퓨팅을 위한 사운드 분류 시스템 설계)

  • Kim, Joo-Hee;Lee, Seok-Jun;Kim, In-Cheol
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.11a
    • /
    • pp.1305-1308
    • /
    • 2013
  • 본 논문에서는 스마트폰 사용자의 실시간 상황 인식을 위한 효과적인 사운드 분류 시스템을 제안한다. 이 시스템에서는 PCM 형태의 사운드 입력 데이터에 대한 전처리를 통해 고요한 사운드와 화이트 노이즈를 학습 및 분류 단계 이전에 미리 여과함으로써, 계산 자원의 불필요한 소모를 막을 수 있다. 또한 에너지 레벨이 낮아 신호의 패턴을 파악하기 어려운 사운드 데이터는 증폭함으로써, 이들에 대한 분류 성능을 향상시킬 수 있다. 또, 제안하는 사운드 분류 시스템에서는 HMM 분류 모델의 효율적인 학습과 적용을 위해 k-평균 군집화를 이용하여 특징 벡터들에 대한 차원 축소와 이산화를 수행하고, 그 결과를 모아 일정한 길이의 시계열 데이터를 구성하였다. 대학 연구동내 다양한 일상생활 상황들에서 수집한 8가지 유형의 사운드 데이터 집합을 이용하여 성능 분석 실험을 수행하였고, 이를 통해 본 논문에서 제안하는 사운드 분류 시스템의 높은 성능을 확인할 수 있었다.

Implementation of Topic Classifier for University News-based BI Analysis (대학 BI 분석을 위한 주제분류기의 구현)

  • Jang, Seo-Yoon;Jang, Hyeon-Yeong;Cha, Chae-Won
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2021.01a
    • /
    • pp.23-25
    • /
    • 2021
  • 본 논문에서는 대학별 홍보 전략, 발전에 기여하기 위한 서비스를 제안한다. 이 서비스는 데이터 수집에는 크롤링을 사용하고 사이킷 런을 사용하여 정확도를 최대화하고, 각 분류된 카테고리의 오류을 최소화한다. 이 서비스는 각 카테고리별로 특성이 높은 키워드를 사용하여 카테고리 별 학습 데이터셋을 생성한 후 이러한 학습 데이터셋을 바탕으로 각 기사들을 최적의 카테고리로 분류해주는 분류기를 구현한다. 이러한 분류기를 사용하여 분류된 기사들을 분석하여 막대 그래프 등의 시각화된 자료들로 볼 수 있도록 하여 기존의 대학 홍보 자료에 비해 누구든 쉽고 간단하게 접근이 가능하도록 한다.

  • PDF

A study on the digitalization of apparel design process (의류 생산설계 업무의 디지털화에 과한 연구 - 여성 자켓 디자인 및 패턴 데이터베이스 구축 방법 -)

  • 송지영;천종숙
    • Proceedings of the Korean Society for Emotion and Sensibility Conference
    • /
    • 2001.11a
    • /
    • pp.158-163
    • /
    • 2001
  • 본 논문의 국내 패션 업체에서 상품기획 과정 중 많은 시간과 노력을 투자해야 했던 디자인 및 패턴 자료를 데이터베이스화하여 key word를 통해 효율적으로 찾아 사용할 수 있도록 한 디지털 여성 자켓 분류 데이터베이스 시스템을 개발하고자 실시되었다. 이를 위해 의류업체 종사자 48명과 의류학 전공 대학원생 54명, 패턴 전문가 11명을 대상으로 설문조사 및 인터뷰를 실시하여 디자인 및 패턴의 분류 기준과 의류 생산기획 업무의 디지털화 가능성을 검토하였다. 본 연구의 결과는 다음과 같다. 국내 의류업체에서는 상품기획시 국외패션잡지와 collection지를 가장 많이 활용하고 있었으며, 디자인 및 패턴 DB 프로그램에 대한 효용성 기대와 수용도 기대에는 집단간 유의한 차이가 있는 것으로 나타났다. 여성 자켓 디자인 DB를 위한 구성요소 분류 기준은 7가지고 선정되었고, 이미지 형용사 분류 기준은 6가지로 선정되었다. 또한 자켓 제작을 위한 block pattern 분류 기준은 4가지로 선정되었다. 본 연구를 통해 개발된 자켓 디자인 선택 프로그램의 모델을 제시한 후 실험 참가자들에게 효용성 및 사용가능성을 다시 검증한 결과, 프로그램 제시 전 조사결과보다 유의하게 긍정적으로 평가되었으며, 데이터베이스 자료 활용시 이미지 형용사를 통한 검색보다는 구성요소를 통한 검색에 더 만족하는 것으로 나타났다.

  • PDF

Disease Classification System of Oriental Medicine using Enhanced FCM Algorithm (개선된 FCM 알고리즘을 이용한 한방의 질병 분류 시스템)

  • Jang, Su-Jae;Choi, Kyoung-Yeol;Kim, Kwang-Beak
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2011.05a
    • /
    • pp.93-96
    • /
    • 2011
  • 본 논문에서는 개선된 FCM 알고리즘을 적용하여 통계청에서 제공하는 한국 표준 질병 사인 분류표(K.C.D)를 기초로 질병을 분류한 후, 질병을 도출하고 애매한 증상의 차이의 정도를 퍼지 추론기법을 사용하여 정확한 질병 상세를 도출할 수 있는 한방 질병 분류 시스템을 제시한다. 기존의 FCM 알고리즘은 입력 벡터들과 각 군집 중심과의 거리를 이용하여 측정된 유사도에 기초한 목적 함수의 최적화 방식을 사용한다. 하지만 측정된 패턴과 군집 공간상의 패턴들의 분포에 따라 바람직하지 못한 군집화 결과를 보일 수 있다. 따라서 본 논문에서는 군집들의 대칭성 측도에 퍼지 이론을 적용하여 기존의 FCM 알고리즘으로 군집화 한 결과를 재 군집화 하여 군집화의 정확성을 개선시킨 후, 증상의 차이를 구분하기 위해서 애매한 증상의 정도를 퍼지 추론 방법을 적용하여 정확한 질병 상세를 도출할 수 있는 방법을 제시한다. 본 논문에서는 개선된 FCM 알고리즘을 적용하여 질병을 분류한 후, 퍼지 제어 기법으로 질병을 추출함으로써 기존의 한방 자가진단 시스템 보다 정확하게 질병을 도출한 것을 확인하였다.

  • PDF

Emotional Tag and Evaluation Method for Personalized Curation (개인화 큐레이션을 위한 감성 분류 및 평가)

  • Im, Ji-Hui;Sung, Joo-Won;Koo, Hyung-Keun;Ock, Cheol-Young;Chang, Du-Seong
    • Annual Conference on Human and Language Technology
    • /
    • 2014.10a
    • /
    • pp.122-126
    • /
    • 2014
  • 감성은 콘텐츠 구매과정에서 결정적인 요소로 작용하며, 영화 콘텐츠의 탐색/소비 과정에서도 콘텐츠 소비의 새로운 기준이다. 그러므로 본 연구에서는 콘텐츠의 내용과 감성을 반영하기 위한 감성분류체계를 제안하였다. 제안한 감성분류체계를 기반으로 사용자의 취향과 감성에 기반하여 콘텐츠를 분류/추천하여 개인화된 편성을 제공하는 것을 "감성 큐레이션"이라 정의하고, 이를 위한 감성기반 큐레이션 방법론을 기술하고 실험을 통해 추천 효과를 입증하였다. 큐레이션은 기존의 개인화 추천과 달리 고객 취향뿐만이 아닌, 신선함, 다양성을 제공할 수 있어야 하며, 상용 큐레이션 서비스에서는 실제 시청으로 연결되는 비율이 중요하다. 본 연구에서는 큐레이션 성능 평가를 위해 성향인지도, 신선도, 다양성에 기반한 만족도 설문조사 방법과 함께, 콘텐츠의 전체 시청률 대비 큐레이션을 통해 추천되어 증가된 시청률의 확대 비율인 Lift score 라는 새로운 평가 방법을 제안하여 그 효용성을 증명하였다.

  • PDF

Travel Time Prediction Algorithm using Rule-based Classification on Road Networks (규칙-기반 분류화 기법을 이용한 도로 네트워크 상에서의 주행 시간 예측 알고리즘)

  • Lee, Hyun-Jo;Chowdhury, Nihad Karim;Chang, Jae-Woo
    • The Journal of the Korea Contents Association
    • /
    • v.8 no.10
    • /
    • pp.76-87
    • /
    • 2008
  • Prediction of travel time on road network is one of crucial research issue in dynamic route guidance system. A new approach based on Rule-Based classification is proposed for predicting travel time. This approach departs from many existing prediction models in that it explicitly consider traffic patterns during day time as well as week day. We can predict travel time accurately by considering both traffic condition of time range in a day and traffic patterns of vehicles in a week. We compare the proposed method with the existing prediction models like Link-based, Micro-T* and Switching model. It is also revealed that proposed method can reduce MARE (mean absolute relative error) significantly, compared with the existing predictors.

Text Classification based on a Feature Projection Technique with Robustness from Noisy Data (오류 데이타에 강한 자질 투영법 기반의 문서 범주화 기법)

  • 고영중;서정연
    • Journal of KIISE:Software and Applications
    • /
    • v.31 no.4
    • /
    • pp.498-504
    • /
    • 2004
  • This paper presents a new text classifier based on a feature projection technique. In feature projections, training documents are represented as the projections on each feature. A classification process is based on individual feature projections. The final classification is determined by the sum from the individual classification of each feature. In our experiments, the proposed classifier showed high performance. Especially, it have fast execution speed and robustness with noisy data in comparison with k-NN and SVM, which are among the state-of-art text classifiers. Since the algorithm of the proposed classifier is very simple, its implementation and training process can be done very simply. Therefore, it can be a useful classifier in text classification tasks which need fast execution speed, robustness, and high performance.

A Personalized Retrieval System Based on Classification and User Query (분류와 사용자 질의어 정보에 기반한 개인화 검색 시스템)

  • Kim, Kwang-Young;Shim, Kang-Seop;Kwak, Seung-Jin
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.43 no.3
    • /
    • pp.163-180
    • /
    • 2009
  • In this paper, we describe a developmental system for establishing personal information tendency based on user queries. For each query, the system classified it based on the category information using a kNN classifier. As category information, we used DDC field which is already assigned to each record in the database. The system accumulates category information for all user queries and the user's personalized feature for the target database. We then developed a personalized retrieval system reflecting the personalized feature to produce search result. Our system re-ranks the result documents by adding more weights to the documents for which categories match with the user's personalized feature. By using user's tendency information, the ambiguity problem of the word could be solved. In this paper, we conducted experiments for personalized search and word sense disambiguation (WSD) on a collection of Korean journal articles of science and technology arena. Our experimental result and user's evaluation show that the performance of the personalized search system and WSD is proved to be useful for actual field services.