• Title/Summary/Keyword: 데이타마이닝 시스템

Search Result 39, Processing Time 0.029 seconds

Product reputation mining based on sentiment analysis (감성 분석 기반의 제품 평판 마이닝)

  • Song, In-Hwan;Han, Jinju;On, Byung-Won
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.429-433
    • /
    • 2019
  • 스마트폰 보급의 확산으로 제품 구매 시 웹 사이트 및 SNS를 이용하여 제품 리뷰를 참고하는 소비자들이 증가하고 있다. 전자 상거래 사이트의 제품 리뷰는 구매 예정자들에게 유용한 정보로 활용되곤 한다. 하지만 구매 예정자가 직접 제품에 대한 리뷰 데이터를 찾아 전체 내용을 일일이 읽고 분석해야하기 때문에 시간이 오래 걸릴뿐만 아니라 가공되지 않는 데이터가 줄 수 있는 정보는 한정적이다. 또한 이러한 리뷰들은 상품의 특징을 파악하기에도 어려움이 있다. 본 논문에서는 제품의 주요 이슈를 추출하고 주요 이슈에 대한 감성 분석과 감성 요약을 통해 제품 분석 및 평가를 제공하는 시스템을 설계 및 구현하였다. 이를 휴대폰 제품에 적용하여 구축한 시스템을 통해 소비자가 방대한 양의 제품의 리뷰 데이터를 분석할 필요 없이 제품의 주요 이슈와 가공된 분석 결과를 시각적으로 빠르게 제공받을 수 있음을 보였다.

  • PDF

A Design of Goods Recommendation System based on Multi-crossselling (다중크로스셀링 기반의 개인 상품 추천 시스템의 설계)

  • Yun Jong-Chan;Kim Jong-Jin;Youn Sung-Dae
    • Journal of Korea Multimedia Society
    • /
    • v.9 no.9
    • /
    • pp.1095-1106
    • /
    • 2006
  • Recently, many effort is demanded for appropriate operation and management of the Electronic commerce system. Electronic commerce system must provide information satisfying customers. To do this, many kinds of studies are being advanced about electronic commerce system using intelligent agent technology. In this paper, We propose a support system for goods based on Case-Based Reasoning(CBR) and multi-crossselling technology. The system can supply the information of goods that is suitable about customer need under specification condition with CBR technique and can search several goods approximate to customer pattern using Multi-crossselling technique.

  • PDF

A Text Classification System based on a Supervised Learning Algorithm (교사학습 알고리즘을 이용한 텍스트 분류 시스템)

  • 김진상;성정호;김성주
    • Proceedings of the Korea Database Society Conference
    • /
    • 1998.09a
    • /
    • pp.421-430
    • /
    • 1998
  • 지식경영을 위한 다양한 대상 업무중에서 텍스트 데이터의 마이닝은 특히 중요하다. 그 이유는 텍스트 데이터가 양적인 면에서 가장 풍부하고, 또 발견할 수 있는 지식을 가장 많이 포함하고 있기 때문이다. 본 논문에서는 텍스트 데이터베이스에서 지식발견을 위한 한 과정으로 텍스트 데이터베이스 내의 텍스트들을 분류하는 기법을 기술한다. 특히 문서 분류 방법은 데이터베이스의 일부 데이터를 훈련, 예제로 간주하여 교사 학습 알고리즘을 통해 학습한 후 나머지 데이터를 이용해 분류 정확성을 검증 및 향상시킨다. 시험 데이터로는 인터넷의 뉴스그룹의 기사를 이용하였고, 시험 결과 분류의 정확성은 한글 및 영문 모두 최소 70% 이상으로 나타났다.

  • PDF

An Example-Based Natural Language Dialogue System for EPG Information Access (EPG 정보 검색을 위한 예제 기반 자연어 대화 시스템)

  • Kim, Seok-Hwan;Lee, Cheong-Jae;Jung, Sang-Keun;Lee, GaryGeun-Bae
    • Journal of KIISE:Software and Applications
    • /
    • v.34 no.2
    • /
    • pp.123-130
    • /
    • 2007
  • In this paper, we present an example-based natural language dialogue system for Electronic Program Guide Information Access. We introduce an effective and practical dialogue management technique incorporating dialogue examples and situation-based rules. In order to generate cooperative responses to smoothly lead the dialogue with users, our natural language dialogue system consists of natural language understanding, dialogue manager, system utterance generator. and EPG database manager. Each module is designed and implemented to make an effective and practical natural language dialogue system. In particular, in order to reflect the up-to-date EPG information which is updated frequently and periodically, we applied a web-mining technology to the EPG database manager, which builds the content database based on automatically extracted information from popular EPG websites. The automatically generated content database is used by other modules in the system for building their own resources. Evaluations show that our system performs EPG access task in high performance and can be managed with low cost.

Analysis of Web Data Applying Data Mining (데이터마이닝을 이용한 웹 데이터 분석)

  • 채승경;서용무
    • Proceedings of the Korea Database Society Conference
    • /
    • 2001.06a
    • /
    • pp.345-361
    • /
    • 2001
  • 인터넷의 확산으로 웹 구조, 웹 로그 등을 분석하는 웹마이닝(Web Mining)에 대한 연구가 활발히 진행되고 있다. 그러나 웹에서 발생하는 데이터에 대한 분석은 아직 미약한 상태이다. 웹에서 획득된 데이터는 신뢰도가 낮아 통계와 같은 기존의 분석 방법을 적용하기에 많은 어려움이 따른다. 또한 대용량 데이터와 실제 데이터에 유연한 분석을 제공하는 데이터 마이닝은 아직까지 적용 분야가 매우 한정되어 있다. 본 논문에서는 인터넷 사이트의 실제 데이터를 이용하여 데이터마이닝 과정에 따라 데이터 정제, 데이터 선택, 데이터 변환 등 효과적인 데이터 전처리 방법을 제시한다. 또한 이렇게 전처리된 데이터로 고객 세분화, 우수 고객 분류를 위한 데이터마이닝 기법을 적용한 후 수행 결과를 분석한다. 마지막으로 분석의 한계점을 지적하고 보다 양질의 데이터마이닝을 위한 시스템 및 사이트 설계 방안을 제시한다.

  • PDF

A News Video Mining based on Multi-modal Approach and Text Mining (멀티모달 방법론과 텍스트 마이닝 기반의 뉴스 비디오 마이닝)

  • Lee, Han-Sung;Im, Young-Hee;Yu, Jae-Hak;Oh, Seung-Geun;Park, Dai-Hee
    • Journal of KIISE:Databases
    • /
    • v.37 no.3
    • /
    • pp.127-136
    • /
    • 2010
  • With rapid growth of information and computer communication technologies, the numbers of digital documents including multimedia data have been recently exploded. In particular, news video database and news video mining have became the subject of extensive research, to develop effective and efficient tools for manipulation and analysis of news videos, because of their information richness. However, many research focus on browsing, retrieval and summarization of news videos. Up to date, it is a relatively early state to discover and to analyse the plentiful latent semantic knowledge from news videos. In this paper, we propose the news video mining system based on multi-modal approach and text mining, which uses the visual-textual information of news video clips and their scripts. The proposed system systematically constructs a taxonomy of news video stories in automatic manner with hierarchical clustering algorithm which is one of text mining methods. Then, it multilaterally analyzes the topics of news video stories by means of time-cluster trend graph, weighted cluster growth index, and network analysis. To clarify the validity of our approach, we analyzed the news videos on "The Second Summit of South and North Korea in 2007".

Extracting Maximal Similar Paths between Two XML Documents using Sequential Pattern Mining (순차 패턴 마이닝을 사용한 두 XML 문서간 최대 유사 경로 추출)

  • 이정원;박승수
    • Journal of KIISE:Databases
    • /
    • v.31 no.5
    • /
    • pp.553-566
    • /
    • 2004
  • Some of the current main research areas involving techniques related to XML consist of storing XML documents, optimizing the query, and indexing. As such we may focus on the set of documents that are composed of various structures, but that are not shared with common structure such as the same DTD or XML Schema. In the case, it is essential to analyze structural similarities and differences among many documents. For example, when the documents from the Web or EDMS (Electronic Document Management System) are required to be merged or classified, it is very important to find the common structure for the process of handling documents. In this paper, we transformed sequential pattern mining algorithms(1) to extract maximal similar paths between two XML documents. Experiments with XML documents show that our transformed sequential pattern mining algorithms can exactly find common structures and maximal similar paths between them. For analyzing experimental results, similarity metrics based on maximal similar paths can exactly classify the types of XML documents.

Tightly Coupled Integration of Ranking SVM and RDBMS (랭킹 SVM과 RDBMS의 밀결합 통합)

  • Song, Jae-Hwan;Oh, Jin-Oh;Yang, Eun-Seok;Yu, Hwan-Jo
    • Journal of KIISE:Databases
    • /
    • v.36 no.4
    • /
    • pp.247-253
    • /
    • 2009
  • Rank learning and processing have gained much attention in the IR and data mining communities for the last decade. While other data mining techniques such as classification and regression have been actively researched to interoperate with RDBMS by using the tightly coupled or loose coupling approaches, ranking has been researched independently without integrating into RDBMS. This paper proposes a tightly coupled integration of the Ranking SVM into MySQL in order to perform the rank learning task efficiently within the RDBMS. We implemented new SQL commands for learning ranking functions and predicting ranking scores. We evaluated our tightly coupled integration of Ranking SVM by comparing it to a loose coupling implementation. The experiment results show that our approach has a performance improvement of $10{\sim}40%$ in the training phase and 60% in the prediction phase.

CALS환경에서 기업간 정보공유의 범위에 관한 연구

  • 고일상
    • Proceedings of the CALSEC Conference
    • /
    • 1999.07a
    • /
    • pp.41-50
    • /
    • 1999
  • 최근의 CALS 시스템 구축 가속화 및 전자상거래 활성화 분위기는 정보기술의 전략적 활용의 초점을 개별기업 위주에서 기업간 협력체제 구축과 이를 바탕으로 하는 기업간 전자적 결합(Electronic Integration)으로 옮기고 있다. 우리는 정보기술의 공유를 기반으로 새로운 기업간의 관계를 구축할 수 있으며, 이러한 관계를 전략적으로 활용함으로써 기존 사업에서의 경쟁우위 뿐만 아니라, 새로운 사업기회를 창출할 수 있다. 관련기업간의 데이터 표준화를 통한 정보의 공유는 CALS 시스템 구축의 바탕이 된다고 할 수 있는데, 정보공유의 범위는 산업별 특성과 제품별 특성에 따라 달라질 수밖에 없으며, 관련기업간의 교섭력(Bargaining Power)에 의해서도 영향을 받게된다. CALS 환경에서는 개별기업의 정보전략에 따라 수직적 협력관계에 있는 기업들간의 정보공유 정도와 수평적 협력관계에 있는 기업들간의 정보공유 정도가 결정된다고 할 수 있다. 정보공유의 범위를 설정하는 데에는 기업간에 이루어지는 업무의 성격, 공급-제조-유통으로 연결되는 관련기업간의 구조 등도 크게 영향을 미치는 것으로 파악되고 있다. 이 연구에서는 CALS 시스템 구축과정에서 우리가 고려할 수 있는 정보공유의 범위를 관련업무공유, 시스템공유, 부품 설비공유, 시설공유 등의 관점에서 분석하여 봄으로써, 각 산업별로 진행되고 있는 시범사업들의 시스템 영역의 범위를 재조명해보고자 한다. 이 연구에서 집중적으로 다루게 될 정보공유의 범위에 대한 내용은 CALS 시스템을 개발하려는 기업들의 응용서비스 개발 및 정보전략 구축에 중요한 공헌을 할 수 있을 것으로 기대된다.진" 사업에 대한 표준 설정을 위하여 노스캐롤라이나주 지방보건소의 "보건교육/건강증진" 표준체제를 예로 들었다. 다음으로, 경제적인 효율면에서 볼 때 "보건교육/건강증진" 사업에는 단기 혹은 장기 투자가치가 있는가 하는 것이다. 새로 태어나는 미국 지방 보건소의 "보건교육/건강증진" 활동은 지역 시민 및 그 단체가 광범위하고도 자연 다발적으로 참여할 때만 성공할 수 있다고 결론 지울 수 있다.한 분야별 전문가시스템 개발을 지양하고 MCRDR이론을 기반으로 한 범용성 있는 전문가시스템 개발 툴의 개발에 관한 연구를 소개한다. 후 새로운 지식을 얻는 반복적인 Explanation-based Data Mining Architecture를 제시하였다. 본 연구의 의의로는 데이타 마이닝을 통한 귀납적 지식생성에 있어 귀납적 오류의 발생을 고메인 지식을 통해 설명가능 함을 보임으로 검증하고 아울러 이러한 설명을 통해 연역적으로 새로운 가설지식을 생성시켜 이를 가설검증방식으로 검증함으로써 귀납적 접근과 연역적 접근의 통합 데이타 마이닝 접근을 제시하였다는데 있다.gical learning to give information necessary to improve the making. program and policy decision making, The objectives of the study are to develop the methodology of modeling the socioeconomic evaluation, and build up the practical socioeconomic evaluation model of the HAN projec

  • PDF

An Algorithm for Updating Discovered Association Rules in Data Mining (데이타 마이닝에서 기존의 연관 규칙을 갱신하는 앨고리듬 개발)

  • 이동명;지영근;황종원;강맹규
    • Journal of Korean Society of Industrial and Systems Engineering
    • /
    • v.20 no.43
    • /
    • pp.265-276
    • /
    • 1997
  • There have been many studies on efficient discovery of association rules in large databases. However, it is nontrivial to maintain such discovered rules in large databases because a database may allow frequent or occasional updates and such updates may not only invalidate some existing strong association rules but also turn some weak rules into strong ones. The major idea of updating algorithm is to resuse the information of the old large itemsets and to integrate the support information of the new large itemsets in order to substantially reduce the pool of candidate sets to be re-exmained. In this paper, an updating algorithm is proposed for efficient maintenance of discovered assocation rules when new transaction data are added to a transaction database. And superiority of the proposed updating algorithm will be shown by comparing with FUP algorithm that was already proposed.

  • PDF