• 제목/요약/키워드: information classification

검색결과 8,303건 처리시간 0.034초

의료 웹포럼에서의 텍스트 분석을 통한 정보적 지지 및 감성적 지지 유형의 글 분류 모델 (The Informative Support and Emotional Support Classification Model for Medical Web Forums using Text Analysis)

  • 우지영;이민정
    • 한국IT서비스학회지
    • /
    • 제11권sup호
    • /
    • pp.139-152
    • /
    • 2012
  • In the medical web forum, people share medical experience and information as patients and patents' families. Some people search medical information written in non-expert language and some people offer words of comport to who are suffering from diseases. Medical web forums play a role of the informative support and the emotional support. We propose the automatic classification model of articles in the medical web forum into the information support and emotional support. We extract text features of articles in web forum using text mining techniques from the perspective of linguistics and then perform supervised learning to classify texts into the information support and the emotional support types. We adopt the Support Vector Machine (SVM), Naive-Bayesian, decision tree for automatic classification. We apply the proposed model to the HealthBoards forum, which is also one of the largest and most dynamic medical web forum.

자동 잔향 편집을 위한 컬러 및 깊이 정보 기반 실내 장면 분류 (Indoor Scene Classification based on Color and Depth Images for Automated Reverberation Sound Editing)

  • 정민혁;유용현;박성준;황승준;백중환
    • 한국정보통신학회논문지
    • /
    • 제24권3호
    • /
    • pp.384-390
    • /
    • 2020
  • 영화나 VR 콘텐츠 제작 시 음향에 잔향 효과를 주는 것은 현장감과 생동감을 느끼게 하는데 매우 중요한 요소이다. 공간에 따른 음향의 잔향 시간은 RT60(Reverberation Time 60dB)이라는 표준에서 권고된다. 본 논문에서는 음향 편집 시 자동 잔향 편집을 위한 장면 인식 기법을 제안한다. 이를 위해 컬러 이미지와 예측된 깊이 이미지를 동일한 모델에 독립적으로 학습하는 분류 모델을 설계하였다. 실내 장면 분류는 내부 구조가 유사한 클래스가 존재하여 컬러 정보 학습만으로는 인식률의 한계가 존재한다. 공간의 깊이 정보를 사용하기 위해 딥러닝 기반의 깊이 정보 추출 기술을 사용하였다. RT60을 기반으로 총 10개의 장면 클래스를 구성하고 모델 학습 및 평가를 진행하였다. 최종적으로 제안하는 SCR+DNet(Scene Classification for Reverb+Depth Net) 분류기는 92.4%의 정확도로 기존의 CNN 분류기들보다 더 높은 성능을 달성하였다.

통계적 정보기반 계층적 퍼지-러프 분류기법 (Statistical Information-Based Hierarchical Fuzzy-Rough Classification Approach)

  • 손창식;서석태;정환묵;권순학
    • 한국지능시스템학회논문지
    • /
    • 제17권6호
    • /
    • pp.792-798
    • /
    • 2007
  • 본 논문에서는 학습기법을 사용하지 않고 패턴분류의 성능을 최대화하면서 규칙의 수를 줄일 수 있는 통계적 정보기반 계층적 퍼지-러프 분류방법을 제안한다. 제안된 방법에서 통계적 정보는 계층적 퍼지-러프 분류 시스템에서 각 계층의 입력부 퍼지집합의 분할 구간을 추출하기 위해서 사용되었고, 러프집합은 통계적 정보로부터 추출된 분할 구간들과 연관된 퍼지 if-then 규칙의 수를 최소화하기 위해서 사용되었다. 제안된 방법의 효과성을 보이기 위해 Fisher의 IRIS 데이터를 사용한 기존 패턴분류 방법의 분류 정확도와 규칙들의 수를 비교하였다. 그 결과, 제안된 방법은 기존 방법들의 분류 성능과 유사함을 확인할 수 있었다.

Real-time Classification of Internet Application Traffic using a Hierarchical Multi-class SVM

  • Yu, Jae-Hak;Lee, Han-Sung;Im, Young-Hee;Kim, Myung-Sup;Park, Dai-Hee
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제4권5호
    • /
    • pp.859-876
    • /
    • 2010
  • In this paper, we propose a hierarchical application traffic classification system as an alternative means to overcome the limitations of the port number and payload based methodologies, which are traditionally considered traffic classification methods. The proposed system is a new classification model that hierarchically combines a binary classifier SVM and Support Vector Data Descriptions (SVDDs). The proposed system selects an optimal attribute subset from the bi-directional traffic flows generated by our traffic analysis system (KU-MON) that enables real-time collection and analysis of campus traffic. The system is composed of three layers: The first layer is a binary classifier SVM that performs rapid classification between P2P and non-P2P traffic. The second layer classifies P2P traffic into file-sharing, messenger and TV, based on three SVDDs. The third layer performs specialized classification of all individual application traffic types. Since the proposed system enables both coarse- and fine-grained classification, it can guarantee efficient resource management, such as a stable network environment, seamless bandwidth guarantee and appropriate QoS. Moreover, even when a new application emerges, it can be easily adapted for incremental updating and scaling. Only additional training for the new part of the application traffic is needed instead of retraining the entire system. The performance of the proposed system is validated via experiments which confirm that its recall and precision measures are satisfactory.

Movie Popularity Classification Based on Support Vector Machine Combined with Social Network Analysis

  • Dorjmaa, Tserendulam;Shin, Taeksoo
    • 한국IT서비스학회지
    • /
    • 제16권3호
    • /
    • pp.167-183
    • /
    • 2017
  • The rapid growth of information technology and mobile service platforms, i.e., internet, google, and facebook, etc. has led the abundance of data. Due to this environment, the world is now facing a revolution in the process that data is searched, collected, stored, and shared. Abundance of data gives us several opportunities to knowledge discovery and data mining techniques. In recent years, data mining methods as a solution to discovery and extraction of available knowledge in database has been more popular in e-commerce service fields such as, in particular, movie recommendation. However, most of the classification approaches for predicting the movie popularity have used only several types of information of the movie such as actor, director, rating score, language and countries etc. In this study, we propose a classification-based support vector machine (SVM) model for predicting the movie popularity based on movie's genre data and social network data. Social network analysis (SNA) is used for improving the classification accuracy. This study builds the movies' network (one mode network) based on initial data which is a two mode network as user-to-movie network. For the proposed method we computed degree centrality, betweenness centrality, closeness centrality, and eigenvector centrality as centrality measures in movie's network. Those four centrality values and movies' genre data were used to classify the movie popularity in this study. The logistic regression, neural network, $na{\ddot{i}}ve$ Bayes classifier, and decision tree as benchmarking models for movie popularity classification were also used for comparison with the performance of our proposed model. To assess the classifier's performance accuracy this study used MovieLens data as an open database. Our empirical results indicate that our proposed model with movie's genre and centrality data has by approximately 0% higher accuracy than other classification models with only movie's genre data. The implications of our results show that our proposed model can be used for improving movie popularity classification accuracy.

토지 피복 분류에서 분광 영상정보와 시간 문맥 정보의 결합을 위한 베이지안 확률 규칙의 적용 (Application of Bayesian Probability Rule to the Combination of Spectral and Temporal Contextual Information in Land-cover Classification)

  • 이상원;박노욱
    • 대한원격탐사학회지
    • /
    • 제27권4호
    • /
    • pp.445-455
    • /
    • 2011
  • 이 논문은 분광 영상정보만으로 구분력이 상대적으로 떨어지는 분류 항목들의 분류 정확도 향상을 목적으로 기 존재하는 토지피복도로부터 계산된 시간 문맥 정보를 결합하는 확률론적 분류 방법론을 제안하였다. 기 존재하는 토지피복도와 고려하고 있는 시기의 훈련 집단으로부터 분류 항목간 전이 확률을 계산하여 이를 사전 확률로 간주하였다. 분광 영상정보로부터 얻어지는 조건부 확률을 사전 확률과 결합하여 최종적인 사후 확률을 계산하여 분류 항목을 결정하였다. 제안 기법은 기존 시간 문맥 정보를 결합할 때 많은 계산량을 요구하는 방법론들과 달리 확률론적 분류 방법에 쉽게 적용이 가능한 장점이 있다. 시계열 MODIS 자료를 이용한 농작물 분류 사례 연구를 수행하여, 제안 기법의 적용가능성을 검증하였다. MODIS 자료의 낮은 공간 해상도로 인한 혼재 효과로 분광 영상정보만으로 구분력이 떨어지는 분류 항목들은 시간 문맥 정보를 고려함으로써 상대적인 구분력이 향상되어 최종적으로 향상된 분류 정확도를 나타내었다. 따라서 제안 기법은 분류 정확도의 향상과 더불어 기제작된 토지피복도의 갱신에도 효과적으로 이용될 수 있을 것으로 기대된다.

한은도서분류법에 관한 연구 (A Study on the Han-Un Decimal Classification)

  • 여지숙;오동근
    • 한국도서관정보학회지
    • /
    • 제37권1호
    • /
    • pp.329-352
    • /
    • 2006
  • 이 연구는 우리나라 근대문헌분류사의 중요한 분류표의 하나인 한은도서분류법의 편찬 및 개정 경위를 살펴보고 편찬당시 참조한 각종 분류표와 이를 비교하고 분류표 자체를 구체적으로 분석하였다. 한은도서분류법은 한국은행정보자료실에서 사용할 목적으로 초판을 간행하였고, 이후 한차례 수정판을 간행하였다. 그리고 편찬 당시 주요 주류와 조기표에서 NDC를 참조한 것으로 나타났으며, 종교와 어학, 문학에서는 KDCP를 참조한 것으로 나타났다.

  • PDF

의사결정트리의 분류 정확도 향상 (Classification Accuracy Improvement for Decision Tree)

  • 메하리 마르타 레제네;박상현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.787-790
    • /
    • 2017
  • Data quality is the main issue in the classification problems; generally, the presence of noisy instances in the training dataset will not lead to robust classification performance. Such instances may cause the generated decision tree to suffer from over-fitting and its accuracy may decrease. Decision trees are useful, efficient, and commonly used for solving various real world classification problems in data mining. In this paper, we introduce a preprocessing technique to improve the classification accuracy rates of the C4.5 decision tree algorithm. In the proposed preprocessing method, we applied the naive Bayes classifier to remove the noisy instances from the training dataset. We applied our proposed method to a real e-commerce sales dataset to test the performance of the proposed algorithm against the existing C4.5 decision tree classifier. As the experimental results, the proposed method improved the classification accuracy by 8.5% and 14.32% using training dataset and 10-fold crossvalidation, respectively.

실외 주행 로봇의 이동 성능 개선을 위한 지형 분류 (Terrain Classification for Enhancing Mobility of Outdoor Mobile Robot)

  • 김자영;이종화;이지홍;권인소
    • 로봇학회논문지
    • /
    • 제5권4호
    • /
    • pp.339-348
    • /
    • 2010
  • One of the requirements for autonomous vehicles on off-road is to move stably in unstructured environments. Such capacity of autonomous vehicles is one of the most important abilities in consideration of mobility. So, many researchers use contact and/or non-contact methods to determine a terrain whether the vehicle can move on or not. In this paper we introduce an algorithm to classify terrains using visual information(one of the non-contacting methods). As a pre-processing, a contrast enhancement technique is introduced to improve classification of terrain. Also, for conducting classification algorithm, training images are grouped according to materials of the surface, and then Bayesian classification are applied to new images to determine membership to each group. In addition to the classification, we can build Traversability map specified by friction coefficients on which autonomous vehicles can decide to go or not. Experiments are made with Load-Cell to determine real friction coefficients of various terrains.

인터넷 쇼핑몰의 상품 분류체계에 대한 연구 (A Study of Classification Systems in the Internet Shopping Malls)

  • 곽철완
    • 정보관리학회지
    • /
    • 제18권4호
    • /
    • pp.201-215
    • /
    • 2001
  • 인터넷 쇼핑몰의 상품에 대한 분류체계를 도서관 분류이론에 적용하여, 효과적인 분류체계 구축을 위한 기준점을 파악하고자 하였다. 연구 방법은 기존의 웹 쇼핑몰 세 곳을 선정하여, 분류체계를 Ranganathan의 분류이론을 기준으로 하여 비교 분석하였다. 결과 크게 6가지 기준들이 파악되었는데, 상품의 특성, 범주의 포괄성, 다양한 접근점, 범부의 배열순서와 용어의 일관성, 용어의 최신성과 명백성, 용어의 반복적 사용의 금지들이었다. 추후 연구과제로 상품 탐색 형태와 인터페이스와의 관련성이 제시되었다.

  • PDF