• 제목/요약/키워드: frequent item set

검색결과 21건 처리시간 0.022초

Fuzzy Utility를 활용한 연관규칙 마이닝 시스템을 위한 알고리즘의 구현에 관한 연구 (A Study on the Implementation of an optimized Algorithm for association rule mining system using Fuzzy Utility)

  • 박인규;최규석
    • 한국인터넷방송통신학회논문지
    • /
    • 제20권1호
    • /
    • pp.19-25
    • /
    • 2020
  • 빈발 패턴 마이닝에서 각 패턴이 가지는 불확실한 정보로 인하여 정보의 손실을 수반하기 마련이다. 또한 실제적인 환경에서는 패턴들의 중요도가 시간에 따라서 변하기 때문에 이러한 요구에 부합하기 위하여 퍼지논리를 적용하고 패턴이 가지는 중요도의 동적특성을 고려하여야 한다. 본 논문에서는 웹 로그 데이터베이스에서 퍼지 유틸리티 기반 웹페이지 집합 마이닝을 통해 웹 로그 데이터베이스에서 빈발 웹 페이지 집합의 추출을 위한 퍼지 유틸리티 마이닝 기법을 제안한다. 여기서 퍼지 집합의 하향 폐쇄 특성은 최소 퍼지 유틸리티 임계 값(MFUTV) 및 사용자 정의 백분위 수(UDP)에 의해 넓은 공간을 제거하기 위해 적용된다. 여러 실험을 통하여 제안하는 기법은 매우 효과이며 확장성이 좋은 것임을 보인다.

Portion sizes of foods frequently consumed by the Korean elderly: Data from KNHANES IV-2

  • Kim, Sook-Bae;Kim, Soon-Kyung;Kim, Se-Na;Kim, So-Young;Cho, Young-Sook;Kim, Mi-Hyun
    • Nutrition Research and Practice
    • /
    • 제5권6호
    • /
    • pp.553-559
    • /
    • 2011
  • The purpose of this study was to define a one-portion size of food frequently consumed by the Koreans aged 65 years or over. From the original 8,631 people who took part in the Forth Korea National Health and Nutrition Examination Survey(KNHANES IV-2) 2008, we analyzed the data on 1,458 persons (16.9%) aged 65 and over, and selected food items consumed based on the intake frequency of 30 or more by all participant. A total of 158 varieties of food items were selected. The portion size of food items was set on the basis of the median amount (50 percentile) in a single intake by a single person. In the cereals category, 13 items were selected, of which the most frequently consumed item was well-polished rice with portion size of 75 g. Among legumes, 7 items were selected, of which the most frequent item was dried black soybean with a portion size of 6 g. Among the 16 groups, the most varied food group (49 items) was vegetables, and among these the most frequently occurring item was garlic (5 g), while among the fruit group, only 11 items were selected, as their intake frequency was low. Fish and shellfish were more frequently consumed by the elderly than meats. The most frequently consumed meat was pork loin, with a portion size of 30 g. In fish and shellfish, the most frequently consumed item was dried and boiled large anchovy with a portion size of 2 g. Portion sizes for food items consumed regularly by the elderly may be conveniently and effectively used in dietary planning and in nutritional education programs, and in assessing the diet intake status of the elderly.

구매종속성이 존재하는 상황에서 부분 부재고 EOQ 모형에 대한 고찰 (Deterministic EOQ Model with Partial Backordering when Purchase Dependence Exists)

  • 박창규
    • 경영과학
    • /
    • 제32권1호
    • /
    • pp.65-82
    • /
    • 2015
  • Purchase dependence is a frequent phenomenon in retail shops and is characterized by the purchase of certain items together due to their unknown interior associations. Although this concept has been significantly examined in the marketing field (e.g. market basket analysis), it has largely remained unaddressed in operations management. Since purchase dependence is an important factor in designing inventory replenishment policies, this paper demonstrates the means of applying it to the partial backordering inventory model. Through computational analyses, this paper compares the performance of inventory models that either consider or ignore purchase dependence; the results demonstrate that inventory models that ignore purchase dependence incur more average cost per unit time than the model that considers purchase dependence, and the impact of purchase dependence can increase in significance as the item set becomes more closely correlated with regard to order demand.

Partial Backordering Inventory Model under Purchase Dependence

  • Park, Changkyu
    • Industrial Engineering and Management Systems
    • /
    • 제14권3호
    • /
    • pp.275-288
    • /
    • 2015
  • Purchase dependence is a frequent phenomenon in retail shops and is characterized by the purchase of certain items together due to their unknown interior associations. Although this concept has been significantly examined in the marketing field (e.g. market basket analysis), it has largely remained unaddressed in operations management. Since purchase dependence is an important factor in designing inventory replenishment policies, this paper demonstrates the means of applying it to the partial backordering inventory model. Through computational analyses, this paper compares the performance of inventory models that either consider or ignore purchase dependence; the results demonstrate that inventory models that ignore purchase dependence incur more average cost per unit time than the model that considers purchase dependence, and the impact of purchase dependence can increase in significance as the item set becomes more closely correlated with regard to order demand.

다중 해시함수 기반 데이터 스트림에서의 아이템 의사 주기 탐사 기법 (Finding Pseudo Periods over Data Streams based on Multiple Hash Functions)

  • 이학주;김재완;이원석
    • 한국IT서비스학회지
    • /
    • 제16권1호
    • /
    • pp.73-82
    • /
    • 2017
  • Recently in-memory data stream processing has been actively applied to various subjects such as query processing, OLAP, data mining, i.e., frequent item sets, association rules, clustering. However, finding regular periodic patterns of events in an infinite data stream gets less attention. Most researches about finding periods use autocorrelation functions to find certain changes in periodic patterns, not period itself. And they usually find periodic patterns in time-series databases, not in data streams. Literally a period means the length or era of time that some phenomenon recur in a certain time interval. However in real applications a data set indeed evolves with tiny differences as time elapses. This kind of a period is called as a pseudo-period. This paper proposes a new scheme called FPMH (Finding Periods using Multiple Hash functions) algorithm to find such a set of pseudo-periods over a data stream based on multiple hash functions. According to the type of pseudo period, this paper categorizes FPMH into three, FPMH-E, FPMH-PC, FPMH-PP. To maximize the performance of the algorithm in the data stream environment and to keep most recent periodic patterns in memory, we applied decay mechanism to FPMH algorithms. FPMH algorithm minimizes the usage of memory as well as processing time with acceptable accuracy.

Anomalous Event Detection in Traffic Video Based on Sequential Temporal Patterns of Spatial Interval Events

  • Ashok Kumar, P.M.;Vaidehi, V.
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제9권1호
    • /
    • pp.169-189
    • /
    • 2015
  • Detection of anomalous events from video streams is a challenging problem in many video surveillance applications. One such application that has received significant attention from the computer vision community is traffic video surveillance. In this paper, a Lossy Count based Sequential Temporal Pattern mining approach (LC-STP) is proposed for detecting spatio-temporal abnormal events (such as a traffic violation at junction) from sequences of video streams. The proposed approach relies mainly on spatial abstractions of each object, mining frequent temporal patterns in a sequence of video frames to form a regular temporal pattern. In order to detect each object in every frame, the input video is first pre-processed by applying Gaussian Mixture Models. After the detection of foreground objects, the tracking is carried out using block motion estimation by the three-step search method. The primitive events of the object are represented by assigning spatial and temporal symbols corresponding to their location and time information. These primitive events are analyzed to form a temporal pattern in a sequence of video frames, representing temporal relation between various object's primitive events. This is repeated for each window of sequences, and the support for temporal sequence is obtained based on LC-STP to discover regular patterns of normal events. Events deviating from these patterns are identified as anomalies. Unlike the traditional frequent item set mining methods, the proposed method generates maximal frequent patterns without candidate generation. Furthermore, experimental results show that the proposed method performs well and can detect video anomalies in real traffic video data.

변화출현확률이 시각단기기억 기반 변화탐지 수행에 미치는 영향 (The Influence of Change Prevalence on Visual Short-Term Memory-Based Change Detection Performance)

  • 손한결;현주석
    • 인지과학
    • /
    • 제32권3호
    • /
    • pp.117-139
    • /
    • 2021
  • 짧은 시차를 두고 출현하는 기억과 검사배열 사이에 차이 항목의 유무를 찾아내는 변화탐지 원리는 검사배열 출현 시 기억항목들과 견주어 차이가 있는 한 항목을 탐색한다는 점에서 시각탐색 원리와 닮아있다. 본 연구는 두 과제 사이의 이러한 유사성을 배경으로, 시각단기기억 기반 변화탐지 과제에서 변화의 출현 가능성 증감이 변화탐지 반응의사결정에 미치는 영향 즉 변화출현확률 효과의 양상을 조사했다. 이를 위해 네 개의 색상 사각형에 뒤이어 출현한 또 다른 네 개의 색상 사각형 사이의 색상들을 비교해 색상 변화 항목의 유무를 판단하는 단순세부특징 변화탐지 과제를 실시했다. 변화 항목의 출현 가능성은 전체 시행 대비 20, 50 및 80% 확률로 처치되었으며 그에 따른 변화탐지 수행 오류와 탐지민감도 및 반응시간을 분석했다. 그 결과 변화 항목의 출현 가능성이 증가할수록 오경보는 증가하고 실수 반응은 감소했으며 정기각 반응시간 또한 지연된 것이 관찰되었다. 이 변화출현확률 효과는 시각탐색 과제에서 표적의 출현 가능성 증감에 따라 관찰되는 표적출현확률 효과와 매우 유사했으며 이는 두 효과를 초래하는 배경 원리가 서로 닮아있을 가능성을 시사한다.

연관규칙 마이닝에서의 동시성 기준 확장에 대한 연구 (An Investigation on Expanding Co-occurrence Criteria in Association Rule Mining)

  • 김미성;김남규;안재현
    • 지능정보연구
    • /
    • 제18권1호
    • /
    • pp.23-38
    • /
    • 2012
  • 온라인 쇼핑몰은 인터넷을 통해 손쉽게 접근이 가능하기 때문에, 최초 구매의사가 발생한 시점으로부터 이에 대한 실제 구매가 실현되기까지의 기간이 오프라인 쇼핑몰에 비해 비교적 짧게 나타난다. 즉 오프라인 쇼핑몰의 경우 구매희망 물품을 바로 구매하기 보다는 몇 개의 물품들을 모아서 구매하는 행태가 일반적이다. 하지만, 인터넷 쇼핑몰의 경우 단 하나의 물품만을 포함하고 있는 주문이 전체 주문의 절반 이상을 차지한다. 따라서 온라인 쇼핑몰 데이터의 장바구니 분석에 전통적 데이터마이닝 기법을 그대로 적용할 경우, Null Transaction의 수가 지나치게 많음으로 인해 합리적 수준의 지지도(Support)를 만족시키는 규칙을 찾는 것이 매우 어렵게 된다. 이러한 이유로 온라인 데이터를 사용한 많은 연구는 동시성 기준을 여러 방법으로 확장하여 사용하였는데, 이들 동시성 기준은 명확한 근거나 합의 없이 연구자의 상황에 따라 임의로 선택된 측면이 있다. 따라서 본 연구에서는 온라인 마켓 분석에 적용되는 구매의 동시성 기준을 정확도 측면에서 평가함으로써, 구매의 동시성 기준 선정을 위한 근거를 제시하고자 한다. 또한 동시성 기준의 정확도가 고객의 평균 구매간격에 따라 상이하게 나타나는 것을 파악하여, 향후 고객의 특성에 따른 차별화된 추천 시스템 구축을 위한 기본 방향을 제시하고자 한다. 이를 위해 국내 대형 인터넷 쇼핑몰의 최근 2년간 실제 거래 내역을 대상으로 실험을 수행하였으며, 실험 결과 단골 고객의 구매 추천을 위한 분석의 경우 추천 범위와 분석 데이터의 동시성 기준을 맞추어 연관규칙을 도출하는 것이 바람직하며, 비단골 고객의 경우 대부분의 추천 범위에 대해서 분석 데이터의 동시성 기준을 비교적 길게 설정하여 연관규칙을 도출하는 것이 바람직한 것으로 나타났다.

RFM기반 FP-tree 마이닝을 이용한 개인화 추천시스템 (Personalized Recommendation System using FP-tree Mining based on RFM)

  • 조영성;류근호
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권2호
    • /
    • pp.197-206
    • /
    • 2012
  • 기존의 연관규칙을 이용한 추천시스템은 매번 계속적으로 대량의 데이터를 스캔해야 하므로 속도가 느릴 뿐 아니라 확장성 문제와 정확도 문제가 있다. 본 논문에서는 사용자의 평가 자료에 의존하지 않고 묵시적인(Implicit)방법을 이용하여 RFM(Recency, Frequency, Monetary)기반 FP-tree 마이닝을 이용한 개인화 추천시스템을 제안한다. 구매 가능성이 높은 아이템을 찾기 위해서 고객정보와 구매이력정보를 기반으로 고객과 아이템의 속성 반영이 가능한 RFM기법과 FP-tree 마이닝을 이용한다. 제안 방법으로 RFM기반의 FP-tree 마이닝을 이용하여 후보집합의 발생없이 빈발항목을 구성하고 연관규칙을 생성한다. 생성된 연관규칙의 지지도, 신뢰도, 향상도를 사용하여 추천 효율성이 높은 아이템 추천이 가능하다. 성능평가를 위해 현업에서 사용하는 인터넷 화장품 아이템 쇼핑몰의 데이터를 기반으로 데이터 셋을 구성하여 기존의 시스템과 비교 실험을 통해 성능을 평가하여 효용성과 타당성을 입증하였다.

교통사고 데이터의 마이닝을 위한 연관규칙 학습기법과 서브그룹 발견기법의 비교 (Comparison of Association Rule Learning and Subgroup Discovery for Mining Traffic Accident Data)

  • 김정민;류광렬
    • 지능정보연구
    • /
    • 제21권4호
    • /
    • pp.1-16
    • /
    • 2015
  • 교통사고의 원인을 규명하고 미래의 사고를 방지하기 위한 노력의 일환으로 데이터 마이닝 기법을 이용한 교통 데이터 분석의 연구가 이루어지고 있다. 하지만 기존의 교통 데이터를 이용한 마이닝 연구들은 학습된 결과를 사람이 이해하기 어려워 분석에 많은 노력이 필요하다는 문제가 있었다. 본 논문에서는 많은 속성들로 표현된 교통사고 데이터로부터 유용한 패턴을 발견하기 위해 규칙 학습 기반의 데이터 마이닝 기법인 연관규칙 학습기법과 서브그룹 발견기법을 적용하였다. 연관규칙 학습기법은 비지도 학습 기법의 하나로 데이터 내에서 동시에 많이 등장하는 아이템(item)들을 찾아 규칙의 형태로 가공해 주며, 서브그룹 발견기법은 사용자가 지정한 대상 속성이 결론부에 나타나는 규칙을 학습하는 지도학습 기반 기법으로 일반성과 흥미도가 높은 규칙을 학습한다. 규칙 학습 시 사용자의 의도를 반영하기 위해서는 하나 이상의 관심 속성들을 조합한 합성 속성을 만들어 규칙을 학습할 수 있다. 규칙이 도출되고 나면 후처리 과정을 통해 중복된 규칙을 제거하고 유사한 규칙을 일반화하여 규칙들을 더 단순하고 이해하기 쉬운 형태로 가공한다. 교통사고 데이터를 대상으로 두 기법을 적용한 결과 대상 속성을 지정하지 않고 연관규칙 학습기법을 적용하는 경우 사용자가 쉽게 알기 어려운 속성 사이의 숨겨진 관계를 발견할 수 있었으며, 대상 속성을 지정하여 연관규칙 학습기법과 서브그룹 발견기법을 적용하는 경우 파라미터 조정에 많은 노력을 기울여야 하는 연관규칙 학습기법에 비해 서브그룹 발견기법이 흥미로운 규칙들을 더 쉽게 찾을 수 있음을 확인하였다.