• 제목/요약/키워드: 가중치 마이닝

검색결과 115건 처리시간 0.029초

가중치 순회로부터 빈발 순회패턴의 탐사 및 순회분할을 통한 성능향상 (Discovery of Frequent Traversal Patterns from Weighted Traversals and Performance Enhancement by Traversal Split)

  • 이성대;박휴찬
    • 한국정보통신학회논문지
    • /
    • 제11권5호
    • /
    • pp.940-948
    • /
    • 2007
  • 실세계의 많은 문제는 그래프와 그 그래프를 순회하는 트랜잭션으로 모델링 될 수 있다. 예를 들면, 웹페이지의 연결구조는 그래프로 표현될 수 있고, 사용자의 웹페이지 방문경로는 그 그래프를 순회하는 트랜잭션으로 모델링 될 수 있다. 이와 같이 그래프를 순회하는 트랜잭션들로부터 빈발 패턴과 같이 중요한 패턴을 찾아내는 것은 의미있는 일이다. 본 논문에서는, 방향 그래프와 그 그래프를 순회하는 가중치가 있는 트랜잭션들이 주어졌을 때, 빈발한 순회패턴을 탐사하는 알고리즘을 제안한다. 또한, 이 알고리즘의 성능향상을 위하여 순회를 분할하는 방법을 제안하고 실험을 통하여 검증한다.

클러스터 내부 빈발 지지도를 이용한 개선된 사용 프로파일 평가 (Evaluation Of Improved Usage Profiles Using Frequency Support Threshold In Clusters)

  • 안계순;이필규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.277-279
    • /
    • 2002
  • 웹 로그 기반의 웹 사용 마이닝은 명시적 평가 의존, 확장성 결여, 그리고 다차원 및 희박한 데이터에 성능이 떨어지는 협력적 여과의 문제를 다소 해결할 수 있다. 그러나 k-Means 군집화 방법으로 생성된 군집속 유사 사용자 이동 패턴으로는 클러스터속 사용자 전체의 선호도를 표현할 수 없으므로 사용자 이동 패턴인 트랜잭션들로부터 사용 프로파일을 유도해야 한다. 본 논문에서는 유사 군집 사용자들의 관심과 기호를 표현할 수 있도록 클러스터 내부 데이타로부터 평균 가중치 및 빈발 지지도 임계값을 사용하여 개선된 사용 프로파일을 생성하고 실험 데이터를 통한 예측력과 추천에 대한 성능을 평가한다.

  • PDF

발생 간격 기반 가중치 부여 기법을 활용한 데이터 스트림에서 가중치 순차패턴 탐색 (Finding Weighted Sequential Patterns over Data Streams via a Gap-based Weighting Approach)

  • 장중혁
    • 지능정보연구
    • /
    • 제16권3호
    • /
    • pp.55-75
    • /
    • 2010
  • 일반적인 순차패턴 마이닝에서는 분석 대상 데이터 집합에 포함되는 구성요소의 발생 순서만을 고려하며, 따라서 단순 순차패턴은 쉽게 찾을 수 있는 반면 실제 응용 분야에서 널리 활용될 수 있는 관심도가 큰 순차패턴을 탐색하는데 한계가 있다. 이러한 단점을 보완하기 위한 대표적인 연구 주제들 중의 하나가 가중치 순차패턴 탐색이다. 가중치 순차패턴 탐색에서는 관심도가 큰 순차패턴을 얻기 위해서 구성요소의 단순 발생 순서 뿐만 아니라 구성요소의 가중치를 추가로 고려한다. 본 논문에서는 발생 간격에 기반 한 순차패턴 가중치 부여 기법 및 이를 활용한 순차 데이터 스트림에 대한 가중치 순차패턴 탐색 방법을 제안한다. 발생 간격 기반 가중치는 사전에 정의된 별도의 가중치 정보를 필요로 하지 않으며 순차정보를 구성하는 구성요소들의 발생 간격으로부터 구해진다. 즉, 순차패턴의 가중치를 구하는데 있어서 구성요소의 발생순서와 더불어 이들의 발생 간격을 고려하며, 따라서 보다 관심도가 크고 유용한 순차패턴을 얻는데 도움이 된다. 한편, 근래 대부분의 컴퓨터 응용 분야에서는 한정적인 데이터 집합 형태가 아닌 데이터 스트림 형태로 정보를 발생시키고 있다. 이와 같은 데이터 생성 환경의 변화를 고려하여 본 논문에서는 순차 데이터 스트림을 마이닝 대상으로 고려하였다.

데이터 스트림 마이닝에서 양방향 감쇠 기법을 활용한 고관심 정보 탐색 (Mining highly attention itemsets using a two-way decay mechanism in data stream mining)

  • 장중혁
    • 한국산업정보학회논문지
    • /
    • 제20권2호
    • /
    • pp.1-9
    • /
    • 2015
  • 데이터 스트림 마이닝에서 대부분의 정보 중요성 차별화 기법들은 오래된 정보에 비해 최근에 발생한 정보에 보다 큰 가중치를 부여한다. 하지만, 오래 전에 발생한 정보 중에도 매우 중요한 의미를 갖는 정보들이 존재하기도 한다. 예를 들어, 도소매 상점에서 과거에는 단골 고객이었으나 일정 기간 동안 방문하지 않은 경우, 해당 고객의 구매 기록 등이 포함된 오래된 정보들은 집중 마케팅을 통한 판매실적 증대에 매우 중요한 자료가 될 수 있다. 본 논문에서는 하나의 데이터 스트림에서 최근에는 자주 발생되지 않으나 과거에 빈번히 발생했던 것으로서 관심도가 큰 항목집합을 의미하는 고관심 정보 HAI(Highly Attention Itemsets)를 정의하고, 이를 효율적으로 탐색하기 위한 양방향 감쇠 기법 및 데이터 스트림 마이닝 기법을 제안한다.

오피니언 마이닝 기반 SNS 감성 정보 분석 전략 설계 (A Design of SNS Emotional Information Analysis Strategy based on Opinion Mining)

  • 정은희;이병관
    • 한국정보전자통신기술학회논문지
    • /
    • 제8권6호
    • /
    • pp.544-550
    • /
    • 2015
  • 현재, SNS으로 소통되는 의견들이 증가하고 있기 때문에 SNS 메시지로부터 의미 있는 정보를 유추해내는 오피니언 마이닝(Opinion mining) 기술이 중요해지고 있다. 본 논문은 반의어와 부사의 위치에 따라 가중치를 다르게 설정하여 SNS의 감성 정보를 정확하게 추출하는 오피니언 마이닝 기반 SNS 감성 정보 분석 전략(SEIAS, SNS Emotional Information Analysis Strategy)을 제안한다. 제안하는 SEIAS(SNS Emotional Information Analysis Strategy)는 첫째, 오피니언 마이닝 분석에 필요한 감성사전을 구축하고, 둘째, SNS 데이터를 실시간으로 수집하고, 수집된 SNS 데이터와 감성사전를 비교하여 SNS 데이터의 의견값을 산출한다. 특히, 데이터의 의견값을 산출할 때, 반의어, 부사의 위치에 따라 가중값을 다르게 설정함으로써 기존의 SO-PMI와 비교하였을 때 오피니언 분석결과의 정확도를 향상시켰다.

데이터 스트림 마이닝에서 정보 중요성 차별화를 위한 퍼지 윈도우 기법 (A Fuzzy Window Mechanism for Information Differentiation in Mining Data Streams)

  • 장중혁
    • 한국산학기술학회논문지
    • /
    • 제12권9호
    • /
    • pp.4183-4191
    • /
    • 2011
  • 구성요소가 지속적으로 생성되고 시간 흐름에 따라 변화되기도 하는 데이터 스트림의 특성을 고려하여 데이터 스트림 구성요소의 중요성을 발생 시간에 따라 차별화하기 위한 기법들이 활발히 제안되어 왔다. 기존의 방법들은 최근에 발생된 정보에 집중된 분석 결과를 제공하는데 효과적이나 보다 유연하게 다양한 형태로 정보 중요성을 차별화하는데 한계가 있다. 퍼지 개념에 기반한 정보 중요성 차별화는 이러한 한계를 보완하는 좋은 대안이 될 수 있다. 퍼지 개념은 기존의 뚜렷한 경계를 갖는 접근법의 문제점을 극복하고 실세계의 요구에 보다 부합되는 결과를 제공할 수 있는 방법으로 여러 데이터 마이닝 분야에서 널리 적용되어 왔다. 본 논문에서는 퍼지 개념을 적용하여 데이터 스트림 마이닝에서 정보 중요성 차별화에 효율적으로 활용될 수 있는 퍼지 윈도우 기법을 제안한다. 퍼지 캘린더를 포함한 기본적인 퍼지 개념에 대해서 먼저 기술하고, 다음으로 데이터 스트림 마이닝에서 퍼지 윈도우 기법을 적용한 가중치 패턴 탐색에 대한 세부 내용을 기술한다.

Improvement of recommendation system using attribute-based opinion mining of online customer reviews

  • Misun Lee;Hyunchul Ahn
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권12호
    • /
    • pp.259-266
    • /
    • 2023
  • 본 논문에서는 속성기반 오피니언 마이닝(ABOM)을 적용한 협업 필터링의 정확도 성능을 개선할 수 있는 알고리즘을 제안한다. 실험을 위해 국내 스마트폰 사용자의 스마트폰 앱에 대한 총 1,227건의 온라인 소비자 리뷰 데이터가 분석에 사용되었다. KKMA(꼬꼬마)분석기를 이용하여 형태소 분석 및 KOSAC를 사용하여 감성어 분석 후 LDA 토픽 모델링을 사용하여 속성 추출한 가중치 값을 부여한 리뷰별로 토픽 모델링 결과를 이용하여 협업필터링의 평점과 감성스코어의 평점을 합산한 평균값 정확도 오차를 계산한 통계모형 성능 평가인 MAE, MAPE, RMSE를 사용하였다. 실험을 통해 추천 알고리즘 중 전통적인 협업필터링과 LDA 속성 추출과 감성분석을 결합한 속성기반 오피니언 마이닝(Aspect-Based Opinion Mining, ABOM) 기법을 결합하여 온라인 고객의 앱 평점(APP_Score) 대한 정확도를 예측하였다. 분석 결과 전통적인 협업필터링을 구현한 평점의 정확도 보다 속성기반 오피니언 마이닝 CF를 적용한 평점의 예측 정확도가 더 우수한 것으로 나타났다.

데이터 스트림에서 가중치 지지도 기반 빈발 패턴 추출 방법 (An Efficient Method for Mining Frequent Patterns based on Weighted Support over Data Streams)

  • 김영희;김원영;김응모
    • 한국산학기술학회논문지
    • /
    • 제10권8호
    • /
    • pp.1998-2004
    • /
    • 2009
  • 다양한 저장 장치의 발달과 네트워크의 발전은 대용량의 데이터를 연속적으로 빠르게 생성한다. 데이터 스트림에서의 데이터 마이닝은 처리 시간 및 메모리 사용에 제한적이다. 또한 생성된 데이터를 한 번의 스캔으로 유용한 패턴을 발견할 수 있어야 하고 정보 변화 가능성이 큰 데이터 속성을 갖는 경우 최근의 정보를 반영한 빠른 분석이 가능해야 한다. 기존의 지지도 기반 마이닝 방법들은 일정 기간 동안 미리 정의된 지지도 이상의 빈발 항목에 대하여만 고려하므로 중요도가 높은 항목들을 간과하는 문제점을 가지고 있다. 본 논문에서는 시간의 변화에 따른 가변성을 고려하여 가중치 지지도를 갖는 데이터 항목들에 대하여 보다 의미 있는 정보를 제공하기 위한 효율적인 빈발패턴 추출 방법을 제안하고자 한다. 제안된 WSFI-Mine(Weighted Support Frequent Itemsets Mine) 방법은 DCT(Data Stream Closed Pattern Tree) 데이터 구조를 이용하여 패쇄 빈발 항목을 탐사한다. 제안된 알고리즘은 DSM-FI와 THUI-Mine 알고리즘과 지지도 변화에 따른 성능을 비교하였고 그 결과 비교 알고리즘 보다 수행 시간이 우수함을 보였고, 빈발 항목을 생성하는 후보 항목의 수를 줄이므로 메모리 사용량을 효율적으로 사용할 수 있음을 보였다.

상품 리뷰 감성분석을 이용한 아이템 기반 협업 필터링 추천 기법 (Item-Based Collaborative Filtering Recommendation Technique Using Product Review Sentiment Analysis)

  • 윤소영;윤성대
    • 한국정보통신학회논문지
    • /
    • 제24권8호
    • /
    • pp.970-977
    • /
    • 2020
  • 협업 필터링 추천 기법은 전자상거래 기업들이 추천시스템을 도입한 이래로 가장 널리 사용되고 있다. 그러나 온라인에서 상품이나 콘텐츠의 구매가 일상화되면서 단순히 구매 고객의 평점만을 사용하는 추천 방식으로는 추천의 정확성이 낮아지는 문제점이 발생하였다. 본 논문에서는 추천의 정확성을 향상시키기 위해, 상품 리뷰를 분석하고 이를 가중치로 사용한 협업 필터링 추천 기법을 제안한다. 제안하는 기법은 상품에 대한 리뷰를 텍스트 마이닝 기법으로 정제하여 특징을 추출하고 감성 기반 분석을 통해 감성 점수를 산출한다. 사용자에게 더 나은 아이템을 추천하기 위해 산출된 점수를 아이템 예측 값 계산 시 가중치로 사용한다. 실험을 통해 전통적인 협업 필터링 기법보다 제안하는 기법의 정확성이 향상되는 것을 확인할 수 있었다.

소프트웨어 시험성적서에 대한 텍스트 분석 (Text Analysis of Software Test Report)

  • 정혜정;한군희
    • 한국융합학회논문지
    • /
    • 제11권11호
    • /
    • pp.25-31
    • /
    • 2020
  • 본 연구는 소프트웨어의 시험 평가에 있어 품질 특성에 대한 가중치를 적용하는 방법을 연구한 것이다. 가중치 적용방안은 시험성적서의 텍스트를 분석해서 텍스트의 빈도에 따른 비율을 소프트웨어 시험 성적의 품질 특성에 대한 가중치로 활용한다. 본 연구의 결과에 대한 타당성 검토는 개발자와 사용자를 중심으로 소프트웨어의 중요도를 평가하게 한 설문조사의 결과와 텍스트 분석의 빈도분석 결과를 비교해서 검토했다. ISO/IEC 25023에서 제시한 8가지 품질 특성을 기반으로 품질을 측정할 경우 동일한 가중치를 적용해서 소프트웨어 품질을 평가하는 것에 비하여 본 연구의 결과는 소프트웨어 특성을 고려한 소프트웨어 품질 측정 결과이므로 소프트웨어 시험 평가에 대한 품질 측정의 타당성이 높아진다고 할 수 있다.