• 제목/요약/키워드: interestingness

검색결과 46건 처리시간 0.022초

기준 확인 측도와 연관성 평가기준과의 관계 탐색 (Exploration of relationship between confirmation measures and association thresholds)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권4호
    • /
    • pp.835-845
    • /
    • 2013
  • 데이터 마이닝닝 기법들 중에서 연관성 규칙 마이닝 (association rule mining)은 대용량의 사건 발생 기록 데이터로부터 항목 간의 연관성을 측정하는 기법이다. 이 기법은 매우 방대한 양의 상품 또는 서비스 거래 기록 데이터로부터 항목들 간의 연관성을 측정하는 기법으로 제조업, 유통업, 보험업, 의료 및 교육 분야 등 많은 분야에 적용되고 있다. 의미 있는 연관성 규칙을 탐색하기 위한 흥미도 측도는 크게 객관적 흥미도 측도와 주관적 흥미도 측도, 그리고 의미론적 흥미도 측도로 분류할 수 있다. 이와는 별개로 기준 확인 또는 증거 지원과 관련된 측도들을 개발하기 위해 많은 시도가 있었으나 기준 확인 측도에 대한 연관성 평가 기준 조건 충족 여부나 기본적인 연관성 평가 측도인 지지도, 신뢰도, 그리고 향상도 등과의 관계는 아직 규명되지 않았다. 이에 본 논문에서는 가장 많이 활용되고 있는 비대칭적 기준 확인 측도에 대해 흥미도 측도의 기준에 대한 조건 충족 여부를 검토하는 동시에 기본적인 연관성 평가 측도들과의 관계를 수식을 통해 유도한 후, 예제를 통해 연관성 규칙의 관점에서 기준 확인 측도의 유용성을 살펴보았다. 그 결과, 본 논문에서 고려한 모든 기준 확인 측도들이 흥미도 측도의 기준에 대한 조건들을 모두 만족하였다. 또한 이들을 기본적인 연관성 평가 기준인 지지도, 신뢰도, 그리고 향상도와의 관계를 식을 통해 규명한 동시에 방향성과 행태적 해석 가능성을 예제를 통해 확인할 수 있었다. 특히 이들 측도 중에서 Kemeny와 Oppenheim이 제안한 측도와 Rips가 제안한 측도가 가장 바람직한 연관성 평가 기준으로 활용할 수 있다는 사실을 확인할 수 있었다.

모든 주변 비율을 고려한 확률적 흥미도 측도 기반 유사성 측도의 연관성 평가 기준 활용 방안 (Utilization of similarity measures by PIM with AMP as association rule thresholds)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권1호
    • /
    • pp.117-124
    • /
    • 2013
  • 연관성 규칙 탐사는 상당한 양의 데이터베이스에 내재되어 있는 항목들 간의 관련성을 파악하는 것으로 쇼핑몰, 보건 및 의료, 교육분야 등의 현장에서 많이 적용되고 있다. 이러한 연관성 규칙을 생성하기 위해 연관성 규칙 평가 기준인 지지도, 신뢰도, 향상도 등이 활용되고 있다. 이들 중에서 신뢰도가 연관성 평가 기준으로 가장 많이 활용되고는 있으나 항상 양의 값을 취하는 비대칭적 측도이기 때문에 항목 간에 연관성 규칙을 생성하는 데 어려움이 존재하게 된다. 이러한 문제를 해결하기 위해 본 논문에서는 주변 비율 전부를 포함한 확률적 흥미도 기반 유사성 측도를 연관성 평가 기준으로 활용하는 방안을 고려하였다. 이 측도들은 주변비율 전부와 교차표의 모든 항을 고려하여 연관성의 강도를 측정하는 측도이므로 나타나는 모든 정보를 충실히 반영해주는 측도라고 할 수 있다. 모의실험을 통해 확인한 결과, 모든 주변 비율을 고려한 확률적 흥미도 기반 유사성 측도 대부분이 기존의 연관성 평가 기준과 마찬가지로 연관성의 정도를 파악할 수 있는 동시에 부호를 포함하고 있어서 연관성의 방향도 알 수 있었다.

부분적 주변 비율에 의한 확률적 흥미도 측도 기반 유사성 측도의 상한 및 하한의 설정 (Bounds of PIM-based similarity measures with partially marginal proportion)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권4호
    • /
    • pp.857-864
    • /
    • 2015
  • 데이터 마이닝은 다양한 형태의 방대한 데이터 집합으로부터 보이지 않는 지식이나 새로운 법칙을 발견한 후, 이를 바탕으로 의사결정 등을 위한 정보로 활용하고자 하는 것이다. 데이터 마이닝 기법중의 하나인 군집 분석은 거리 또는 유사성 측도를 이용하여 집단을 분류하고, 구분된 각 집단의 특성을 파악하기 위한 기법이다. 본 논문에서는 주변 확률이 일부 포함된 확률적 흥미도 측도 기반의 유사성 측도들인 Peirce I, Peirce II, Cole I, Cole II, 그리고 이들을 응용한 Park I 및 Park II에 대한 대소 관계를 수식의 증명뿐만 아니라 예제 데이터에 의해서도 규명하였다. 그 결과, Cole I과 Cole II의 측도를 동시에 고려한 Loevinger 측도가 기존의 측도들 중에서는 상한이 되나 Park I 및 Park II를 함께 고려했을 경우에는 동시발생비율, 동시 비발생비율, 그리고 두 가지 형태의 불일치비율의 크기에 따라 변한다는 사실을 확인하였다.

주변 확률을 고려하지 않는 확률적 흥미도 측도 계열 유사성 측도의 서열화 (A study on the ordering of PIM family similarity measures without marginal probability)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권2호
    • /
    • pp.367-376
    • /
    • 2015
  • 데이터마이닝 기법 중의 하나인 군집분석은 다양한 특성을 지닌 관찰대상에 대해 유사성을 바탕으로 동질적인 군집으로 묶은 후, 동일 군집에 속해 있는 공통된 특성을 조사하는데 이용되는 기법이다. 본 논문에서는 주변 확률을 고려하지 않는 확률적 흥미도 측도 기반 유사성 측도인 Yule I과 II, Michael, Digby, Baulieu, 그리고 Dispersion 측도에 대해 상한 및 하한을 설정함으로써 이들의 대소관계를 규명하였다. 그 결과, 세 가지 유형의 대소 관계가 성립한다는 사실을 수식의 증명뿐만 아니라 실제 데이터 및 모의실험 데이터에 의해서도 확인할 수 있었다. 이들 측도들은 각 경계에 있는 측도와는 더욱 더 유사한 값을 가지므로 각 측도의 상한 및 하한은 여러 가지 측도들을 분류하는 도구가 되며, 실제 값의 관점에서 각 측도들의 관계를 알게 되면 주어진 알고리즘의 안정화에 도움이 될 수 있을 것이다.

상대적 규칙 정확도의 균형화에 의한 연관성 측도의 개발 (Development of association rule threshold by balancing of relative rule accuracy)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권6호
    • /
    • pp.1345-1352
    • /
    • 2014
  • 데이터마이닝 기법 중에서 연관성 규칙은 연관성 평가 기준을 기반으로 하여 데이터베이스에 포함되어 있는 항목들 간의 관련성을 탐색하는 기법이다. 일반적인 연관성 규칙 기법과는 달리 역의 연관성 규칙은 하나의 항목집합이 발생하지 않으면 다른 항목집합도 발생하지 않는다는 규칙을 찾아내는 것이다. 이러한 역의 연관성 규칙을 일반적인 연관성 규칙과 함께 생성하면 기업체에서 특정 제품을 판매하기 위해서는 그 제품만의 마케팅뿐만 아니라 더 나아가 어떤 제품의 마케팅이 필요한 지에 대한 정보를 파악할 수 있다. 이를 위해 본 논문에서는 이러한 두 종류의 연관성 규칙에 적용 가능한 균형화된 기여 상대적 규칙 정확도를 연관성 평가 기준으로 제안하고자 한다. 또한 Piatetsky-Shapiro (1991)가 제안한 흥미도 측도가 가져야 할 조건들을 점검한 후, 예제를 통하여 제안된 측도와 연관성 규칙에 적용 가능한 의학진단분야의 평가 측도들의 유용성을 비교하였다. 그 결과, 기여 상대적 정확도와 역의 기여 상대적 정확도의 크기가 다르게 나타나면 연관성의 정도를 명확하게 설명하기가 어려우므로 이들 두 측도를 동시에 고려한 균형화된 기여 상대적 규칙 정확도를 이용하는 것이 가장 바람직하다는 사실을 확인하였다.

데이터 마이닝에서의 상식 기반 후처리 기법 (Common-Sense Knowledge based Post-Processing Technique in Data Mining)

  • 이인기;용환승
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(A)
    • /
    • pp.25-28
    • /
    • 2011
  • 새로운 지식과 패턴을 발견하고자 하는 데이터 마이닝 알고리즘들은 큰 수의 규칙들을 생성하는 문제점을 가지고 있다. 최근 들어 이러한 문제를 해결하기 위한 방법으로 다양한 유용성(Interestingness) 연구들이 데이터 마이닝의 후처리 단계에서 진행되고 있다. 그러나 이러한 접근방법들 역시 지식을 습득하기 위한 과정에서 병목현상을 보여줌으로써 수많은 상식수준의 규칙을 정제하지 못하고 있다. 본 연구에서는 이러한 문제점을 해결하기 위한 방안으로 상식을 기반으로 하는 Common-Sense 척도를 정의하고 구현한다. 규칙이 얼마나 상식에 가까운지를 시맨틱 차원교체 기법을 이용한 유사도 분석을 통해 측정한다.

애니매이션이 이해와 흥미에 미치는 효과 (The Effect of Animation on Comprehension and Interest)

  • Kim, Sung-il;Whang, Sang-min;Barbara Tversky;Julie Morrison
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2002년도 춘계학술대회
    • /
    • pp.85-91
    • /
    • 2002
  • This study was conducted to investigate the interaction effects of various presentation types of graphics and the individual differences in need for cognition on comprehension, interestingness, and motivation. The depiction of the operation of a bicycle tire pump was presented in one of the following conditions, (a) simultaneous presentation, (b) successive presentation, (c) self-pace presentation, (d) animation. For younger students, animated graphics are rated more enjoyable and motivating only when they are low in NFC. If they are high in NFC, animated graphics are not more effective than static graphics in terms of comprehension, interest, and motivation. On the other hand, for older students, self-paced static graphics are more interesting and enjoyable than the animated graphics regardless of their NFC score. These results suggest that the animated graphics are not always beneficial for loaming and motivation.

  • PDF

실시간 검색어 분석을 이용한 인터넷 정보 관심도 분석 (An Analysis on Internet Information using Real Time Search Words)

  • 노기섭
    • 문화기술의 융합
    • /
    • 제4권4호
    • /
    • pp.337-341
    • /
    • 2018
  • 온라인 미디어의 지속적인 발전과 최근 모바일 컴퓨팅 사용 환경이 급격하게 개선됨에 따라 인터넷 정보의 유통이 공급자 중심 단방향에서 소비자 중심의 양방향으로 빠르게 변화하였다. 이에 따라 인터넷 정보의 관심도를 측정하는 것이 공급자와 소비자에게 중요한 문제로 대두되었다. 본 논문에서는 국내 인터넷 정보제공 업체에서 제공하는 실시간 검색어를 자동화된 소프트웨어를 구현하여 1개월간의 데이터를 수집하고, 실시간 검색어의 지속시간을 분석하여 인터넷 정보 관심도를 분석하였다.

온라인 뉴스 이용 동기가 수용의도와 만족도에 미치는 영향 - 한·중 대학생을 비교 중심으로 - (The Effect of Online News Use Motivation on Acceptance and Satisfaction A Comparative Study on Korean and Chinese University Students)

  • 왕상;안수근
    • 한국콘텐츠학회논문지
    • /
    • 제20권6호
    • /
    • pp.293-311
    • /
    • 2020
  • 최근 어떠한 매체를 이용하는지 보다는 이용하는 이유에 대한 연구의 중요성이 커지고 있으므로 상이한 국가 구성원들을 대상으로 동일한 설문을 통해 온라인뉴스 이용 동기가 수용의도와 만족도에 어떤 영향을 미치며, 어떻게 다른지를 파악해 보고자 하였다. 연구결과 분석결과 가설1에서는 한국대학생의 경우 온라인뉴스 이용 동기중 흥미성, 정보성, 휴식성, 뉴스추구, 편리성이 만족도에, 중국 대학생의 경우 온라인뉴스 이용 동기의 뉴스추구, 습관성, 상호작용성, 편리성은 온라인뉴스 만족도에 유의적인 정(+)의 영향을 미치는 것으로 나타났다. 가설 2에서는 한국 대학생의 경우 온라인뉴스 이용 동기의 흥미성, 정보성, 습관성, 편리성은 모두 온라인뉴스 수용의도에 중국 대학생의 경우 정보성, 습관성, 편리성이 온라인뉴스 수용의도에 정(+)의 영향을 미치는 것으로 나타났다. 마지막으로 가설 3에서는 온라인뉴스 만족도가 온라인뉴스 수용의도에 유의적인 정(+)의 영향을 미치는 것으로 나타났다. 또한 본 연구에서는 한·중 대학생 간의 PLS 경로계수에 유의한 차이가 있는 것으로 나타나 각 국가의 뉴스매체의 특성 및 문화로 인해 온라인 뉴스를 이용하려는 동기 및 목적이 상이하며, 이에 따른 만족도와 수용의도가 서로 상이하므로 양국의 미디어 매체 또는 온라인 뉴스를 제공하는 기업은 이를 고려하여 콘텐츠를 설계하고 서비스를 제공해야 함을 시사하였다.

연관 규칙 마이닝에서 비교 기여 순수 신뢰도의 제안 (The proposition of compared and attributably pure confidence in association rule mining)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권3호
    • /
    • pp.523-532
    • /
    • 2013
  • 데이터 마이닝은 빅 데이터에 잠재되어 있는 지식이나 패턴을 찾아내는 기술이며, 대표적인 기법 중의 하나가 연관성 규칙 마이닝이다. 이 기법은 지지도, 신뢰도, 향상도 등의 연관성 평가 기준을 기반으로 하여 각 항목들 간의 관련성을 찾아내는 데 활용되고 있다. 연관성을 평가하기 위한 기준으로 여러 가지 흥미도 측도가 개발되어 있는데, 그 중에서도 신뢰도가 가장 많이 활용되고 있으나 연관성의 방향을 알 수가 없다는 단점을 가지고 있다. 이를 보완하기 위한 측도로 순수 신뢰도가 개발되었으나. 양의 신뢰도과 음의 신뢰도의 값이 동일한 경우에는 이 측도의 값이 같아지므로 정확한 연관성 규칙을 발견할 수 없게 된다. 이러한 단점을 보완하기 위해 기여 순수 신뢰도와 비교 신뢰도가 개발되었는데 이들은 이들 측도들이 취할 수 있는 값의 범위에 대한 문제를 제외하고는 흥미도 측도로서는 매우 바람직하다고 할 수 있으나 값의 범위에 대한 문제점이 존재한다. 이 문제를 해결하기 위해 본 논문에서는 기여 순수 신뢰도와 비교 신뢰도의 크기를 동시에 고려한 비교 기여 순수 신뢰도를 제안하였다. 또한 예제를 통하여 그 유용성을 알아본 결과, 비교 기여 순수 신뢰도는 그 부호에 의해 연관성 규칙의 방향을 파악할 수 있는 동시에 그 값의 범위가 [-1, +1]의 값을 가지므로 행태적 해석이 가능한 것으로 확인되었다.