• 제목/요약/키워드: 데이타마이닝 시스템

검색결과 39건 처리시간 0.034초

감성 분석 기반의 제품 평판 마이닝 (Product reputation mining based on sentiment analysis)

  • 송인환;한진주;온병원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.429-433
    • /
    • 2019
  • 스마트폰 보급의 확산으로 제품 구매 시 웹 사이트 및 SNS를 이용하여 제품 리뷰를 참고하는 소비자들이 증가하고 있다. 전자 상거래 사이트의 제품 리뷰는 구매 예정자들에게 유용한 정보로 활용되곤 한다. 하지만 구매 예정자가 직접 제품에 대한 리뷰 데이터를 찾아 전체 내용을 일일이 읽고 분석해야하기 때문에 시간이 오래 걸릴뿐만 아니라 가공되지 않는 데이터가 줄 수 있는 정보는 한정적이다. 또한 이러한 리뷰들은 상품의 특징을 파악하기에도 어려움이 있다. 본 논문에서는 제품의 주요 이슈를 추출하고 주요 이슈에 대한 감성 분석과 감성 요약을 통해 제품 분석 및 평가를 제공하는 시스템을 설계 및 구현하였다. 이를 휴대폰 제품에 적용하여 구축한 시스템을 통해 소비자가 방대한 양의 제품의 리뷰 데이터를 분석할 필요 없이 제품의 주요 이슈와 가공된 분석 결과를 시각적으로 빠르게 제공받을 수 있음을 보였다.

  • PDF

다중크로스셀링 기반의 개인 상품 추천 시스템의 설계 (A Design of Goods Recommendation System based on Multi-crossselling)

  • 윤종찬;김종진;윤성대
    • 한국멀티미디어학회논문지
    • /
    • 제9권9호
    • /
    • pp.1095-1106
    • /
    • 2006
  • 전자상거래시스템의 효율적인 운영과 관리를 위해서 더욱 많은 노력이 요구되고 있으며 고객의 요구에 대해서 가장 적절한 상품 정보를 제공함으로서 만족을 극대화할 수 있어야 한다. 이를 위해서 많은 지능형 에이전트기술을 사용한 전자상거래시스템이 도입되고 있다. 본 논문에서는 전자상거래시스템에서 개인 상품 추천 지원을 위한 사례기반추론기법과 다중크로스 셀링기법(Multi-Crossselling)을 기반으로 한 상품 추천시스템을 제안하였다. 제안한 시스템은 다중크로스셀링 기법을 통해 고객패턴의 유사값에 가까운 여러 상품을 추출하고 사례기반추론기법을 통해 특정 조건에서 고객의 요구에 대해 적절한 상품 정보를 제공하고자 한다.

  • PDF

교사학습 알고리즘을 이용한 텍스트 분류 시스템 (A Text Classification System based on a Supervised Learning Algorithm)

  • 김진상;성정호;김성주
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1998년도 국제 컨퍼런스: 국가경쟁력 향상을 위한 디지틀도서관 구축방안
    • /
    • pp.421-430
    • /
    • 1998
  • 지식경영을 위한 다양한 대상 업무중에서 텍스트 데이터의 마이닝은 특히 중요하다. 그 이유는 텍스트 데이터가 양적인 면에서 가장 풍부하고, 또 발견할 수 있는 지식을 가장 많이 포함하고 있기 때문이다. 본 논문에서는 텍스트 데이터베이스에서 지식발견을 위한 한 과정으로 텍스트 데이터베이스 내의 텍스트들을 분류하는 기법을 기술한다. 특히 문서 분류 방법은 데이터베이스의 일부 데이터를 훈련, 예제로 간주하여 교사 학습 알고리즘을 통해 학습한 후 나머지 데이터를 이용해 분류 정확성을 검증 및 향상시킨다. 시험 데이터로는 인터넷의 뉴스그룹의 기사를 이용하였고, 시험 결과 분류의 정확성은 한글 및 영문 모두 최소 70% 이상으로 나타났다.

  • PDF

EPG 정보 검색을 위한 예제 기반 자연어 대화 시스템 (An Example-Based Natural Language Dialogue System for EPG Information Access)

  • 김석환;이청재;정상근;이근배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권2호
    • /
    • pp.123-130
    • /
    • 2007
  • 본 논문에서는 EPG 정보 검색을 위한 자연어 대화 시스템에 대해 논한다. 자연어 대화 시스템 구축을 위한, 대화 예제를 이용한 상황 기반 대화 관리 방법론은, 효율적이고 실용적인 대화 시스템 구축을 가능하게 한다. 대화 시스템은 사용자 발화에 대해 적합한 시스템 응답 발화를 출력하는 과정으로 진행되며, 이를 위해, 사용자 발화 의미 분석, 대화 관리, 시스템 응답 발화 생성의 과정을 거친다. 정확하고 신속한 정보의 전달이 중요한 EPG 정보 검색 도메인의 특성상 EPG 데이타베이스의 관리 및 갱신이 중요한 요소로 작용한다. 이를 위해 웹마이닝 기반의 EPG 데이타베이스 관리자를 구현함으로써 데이타베이스 구축에 필요한 비용을 최소화하고, 신속하고 정확한 정보를 제공할 수 있었다. 실험 결과를 통해 본 시스템이 EPG 정보 검색을 위해 적은 비용으로 높은 성능을 보이고 있음을 확인한다.

데이터마이닝을 이용한 웹 데이터 분석 (Analysis of Web Data Applying Data Mining)

  • 채승경;서용무
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 2001년도 춘계 Conference: CRM과 DB응용 기술을 통한 e-Business혁신
    • /
    • pp.345-361
    • /
    • 2001
  • 인터넷의 확산으로 웹 구조, 웹 로그 등을 분석하는 웹마이닝(Web Mining)에 대한 연구가 활발히 진행되고 있다. 그러나 웹에서 발생하는 데이터에 대한 분석은 아직 미약한 상태이다. 웹에서 획득된 데이터는 신뢰도가 낮아 통계와 같은 기존의 분석 방법을 적용하기에 많은 어려움이 따른다. 또한 대용량 데이터와 실제 데이터에 유연한 분석을 제공하는 데이터 마이닝은 아직까지 적용 분야가 매우 한정되어 있다. 본 논문에서는 인터넷 사이트의 실제 데이터를 이용하여 데이터마이닝 과정에 따라 데이터 정제, 데이터 선택, 데이터 변환 등 효과적인 데이터 전처리 방법을 제시한다. 또한 이렇게 전처리된 데이터로 고객 세분화, 우수 고객 분류를 위한 데이터마이닝 기법을 적용한 후 수행 결과를 분석한다. 마지막으로 분석의 한계점을 지적하고 보다 양질의 데이터마이닝을 위한 시스템 및 사이트 설계 방안을 제시한다.

  • PDF

멀티모달 방법론과 텍스트 마이닝 기반의 뉴스 비디오 마이닝 (A News Video Mining based on Multi-modal Approach and Text Mining)

  • 이한성;임영희;유재학;오승근;박대희
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제37권3호
    • /
    • pp.127-136
    • /
    • 2010
  • 정보 통신기술이 발전함에 따라 멀티미디어 데이터를 포함하는 디지털 기록물의 양은 기하급수적으로 증가하고 있다. 특히 뉴스 비디오는 시대상을 반영하는 풍부한 정보를 내포하고 있으므로, 이를 효과적으로 관리하고 분석하기 위한 뉴스 비디오 데이터베이스 및 뉴스 비디오 마이닝은 광범위하게 연구되어왔다. 그러나 현재까지의 뉴스 비디오 관련 연구들은 뉴스 기사에 대한 브라우징, 검색, 요약에 치중되어 있으며, 뉴스 비디오에 내재되어 있는 풍부한 잠재적 지식을 탐사하는 고수준의 의미 분석 단계에는 이르지 못하고 있다. 본 논문에서는 뉴스 비디오 클립과 스크립트를 동시에 이용하는, 멀티모달 방법론과 텍스트 마이닝 기반의 뉴스 비디오 마이닝 시스템을 제안한다. 제안된 시스템은 텍스트 마이닝의 군집분석을 통해 뉴스 기사들을 자동 분류하고, 분류 결과에 대해 기간별 군집 추이그래프, 군집성장도 분석 및 네트워크 분석을 수행함으로써, 뉴스 비디오의 기사별 주제와 관련한 다각적 분석을 수행한다. 제안된 시스템의 타당성 검증을 위하여 "2007년 제2차 남북 정상회담" 관련 뉴스 비디오를 대상으로 뉴스 비디오 분석을 수행하였다.

순차 패턴 마이닝을 사용한 두 XML 문서간 최대 유사 경로 추출 (Extracting Maximal Similar Paths between Two XML Documents using Sequential Pattern Mining)

  • 이정원;박승수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권5호
    • /
    • pp.553-566
    • /
    • 2004
  • 최근 XML 저장 기법, 질의 최적화, 인덱싱 등의 XML 관련 기술이 활발히 연구되고 있다. 이와 관련하여 하나의 DTD나 XML Schema로 정의된 고정 구조를 공유하는 문서 집합이 아니라 다양한 구조를 가진 문서 집합인 경우 다중 문서간의 구조적 유사성이나 차이점 등을 파악할 필요가 있다. 예를 들어 서로 다른 사이트나 문서 관리 시스템에서 도출된 문서들을 합병하거나 분류할 필요가 있을 때, 문서를 처리하기 위해 공유 구조를 발견하는 일은 매우 중요하다. 본 연구에서는 다양한 문서들의 구조를 구성하는 경로들간의 유사성을 파악하기 위해 기존의 순차패턴 마이닝 알고리즘(1)을 변형하여 두 XML 문서간 최대 유사 경로를 추출한다. 몇 가지 실험을 통해 본 논문에서 제안한 변형된 순차패턴 마이닝 알고리즘이 두 문서간의 최대 유사 경로를 찾아내고 또한 두 문서간의 정확한 공유 경로 및 최대 유사 경로를 정확히 찾을 수 있음을 보인다. 또한 실험 결과 분석을 위해 최대 유사 경로를 기반으로 정의된 유사성 척도가 XML 문서를 정확하게 분류할 있음을 보인다.

랭킹 SVM과 RDBMS의 밀결합 통합 (Tightly Coupled Integration of Ranking SVM and RDBMS)

  • 송재환;오진오;양은석;유환조
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권4호
    • /
    • pp.247-253
    • /
    • 2009
  • 지난 십 년간 랭킹은 데이터 마이닝 분야의 활발한 연구분야였다. 그러나 랭킹은 다른 데이터 마이닝 기법들과 비슷하게 RDBMS와는 독립적으로 개발되었고, 그로 인해 기존에 널리 사용되고 있는 RDBMS들과의 연동성이 떨어진다는 단점이 존재하게 되었다. 다른 데이터 마이닝 기법들은 소결합이나 밀결합 접근법을 이용하여 RDBMS와 연동하기 위한 연구가 활발하게 진행되어 왔고, 그 결과 실제로 사용 가능한 응용시스템들이 나오게 되었다. 그러나 랭킹에서는 이와 같은 노력들이 잘 이루어지지 않고 있다. 본 논문에서는 랭킹 작업을 RDBMS에 연동하여 효율적으로 수행하기 위하여 MySQL에 Ranking SVM을 통합하는 작업을 진행하였다. 밀결합 접근법을 기반으로 하는 우리의 구현은 MySQL에 랭킹을 위한 새로운 SQL 명령어를 추가하였고 랭킹 작업의 효율성을 확인하기 위해서 소결합 접근법을 기반으로 하는 Ranking SVM과 성능을 비교 평가하여 훈련단계에서 $10{\sim}40%$, 예측단계에서 평균 60%의 성능향상을 확인할 수 있었다.

CALS환경에서 기업간 정보공유의 범위에 관한 연구

  • 고일상
    • 한국전자거래학회:학술대회논문집
    • /
    • 한국전자거래학회 1999년도 학술대회지 vol.1
    • /
    • pp.41-50
    • /
    • 1999
  • 최근의 CALS 시스템 구축 가속화 및 전자상거래 활성화 분위기는 정보기술의 전략적 활용의 초점을 개별기업 위주에서 기업간 협력체제 구축과 이를 바탕으로 하는 기업간 전자적 결합(Electronic Integration)으로 옮기고 있다. 우리는 정보기술의 공유를 기반으로 새로운 기업간의 관계를 구축할 수 있으며, 이러한 관계를 전략적으로 활용함으로써 기존 사업에서의 경쟁우위 뿐만 아니라, 새로운 사업기회를 창출할 수 있다. 관련기업간의 데이터 표준화를 통한 정보의 공유는 CALS 시스템 구축의 바탕이 된다고 할 수 있는데, 정보공유의 범위는 산업별 특성과 제품별 특성에 따라 달라질 수밖에 없으며, 관련기업간의 교섭력(Bargaining Power)에 의해서도 영향을 받게된다. CALS 환경에서는 개별기업의 정보전략에 따라 수직적 협력관계에 있는 기업들간의 정보공유 정도와 수평적 협력관계에 있는 기업들간의 정보공유 정도가 결정된다고 할 수 있다. 정보공유의 범위를 설정하는 데에는 기업간에 이루어지는 업무의 성격, 공급-제조-유통으로 연결되는 관련기업간의 구조 등도 크게 영향을 미치는 것으로 파악되고 있다. 이 연구에서는 CALS 시스템 구축과정에서 우리가 고려할 수 있는 정보공유의 범위를 관련업무공유, 시스템공유, 부품 설비공유, 시설공유 등의 관점에서 분석하여 봄으로써, 각 산업별로 진행되고 있는 시범사업들의 시스템 영역의 범위를 재조명해보고자 한다. 이 연구에서 집중적으로 다루게 될 정보공유의 범위에 대한 내용은 CALS 시스템을 개발하려는 기업들의 응용서비스 개발 및 정보전략 구축에 중요한 공헌을 할 수 있을 것으로 기대된다.진" 사업에 대한 표준 설정을 위하여 노스캐롤라이나주 지방보건소의 "보건교육/건강증진" 표준체제를 예로 들었다. 다음으로, 경제적인 효율면에서 볼 때 "보건교육/건강증진" 사업에는 단기 혹은 장기 투자가치가 있는가 하는 것이다. 새로 태어나는 미국 지방 보건소의 "보건교육/건강증진" 활동은 지역 시민 및 그 단체가 광범위하고도 자연 다발적으로 참여할 때만 성공할 수 있다고 결론 지울 수 있다.한 분야별 전문가시스템 개발을 지양하고 MCRDR이론을 기반으로 한 범용성 있는 전문가시스템 개발 툴의 개발에 관한 연구를 소개한다. 후 새로운 지식을 얻는 반복적인 Explanation-based Data Mining Architecture를 제시하였다. 본 연구의 의의로는 데이타 마이닝을 통한 귀납적 지식생성에 있어 귀납적 오류의 발생을 고메인 지식을 통해 설명가능 함을 보임으로 검증하고 아울러 이러한 설명을 통해 연역적으로 새로운 가설지식을 생성시켜 이를 가설검증방식으로 검증함으로써 귀납적 접근과 연역적 접근의 통합 데이타 마이닝 접근을 제시하였다는데 있다.gical learning to give information necessary to improve the making. program and policy decision making, The objectives of the study are to develop the methodology of modeling the socioeconomic evaluation, and build up the practical socioeconomic evaluation model of the HAN projec

  • PDF

데이타 마이닝에서 기존의 연관 규칙을 갱신하는 앨고리듬 개발 (An Algorithm for Updating Discovered Association Rules in Data Mining)

  • 이동명;지영근;황종원;강맹규
    • 산업경영시스템학회지
    • /
    • 제20권43호
    • /
    • pp.265-276
    • /
    • 1997
  • There have been many studies on efficient discovery of association rules in large databases. However, it is nontrivial to maintain such discovered rules in large databases because a database may allow frequent or occasional updates and such updates may not only invalidate some existing strong association rules but also turn some weak rules into strong ones. The major idea of updating algorithm is to resuse the information of the old large itemsets and to integrate the support information of the new large itemsets in order to substantially reduce the pool of candidate sets to be re-exmained. In this paper, an updating algorithm is proposed for efficient maintenance of discovered assocation rules when new transaction data are added to a transaction database. And superiority of the proposed updating algorithm will be shown by comparing with FUP algorithm that was already proposed.

  • PDF