• 제목/요약/키워드: Support Pattern

검색결과 1,179건 처리시간 0.031초

다중 최소 임계치 기반 빈발 패턴 마이닝의 성능분석 (Performance Analysis of Frequent Pattern Mining with Multiple Minimum Supports)

  • 양흥모;윤은일
    • 인터넷정보학회논문지
    • /
    • 제14권6호
    • /
    • pp.1-8
    • /
    • 2013
  • 거대한 데이터베이스로부터 중요하고 의미 있는 정보를 찾아내기 위해 데이터 마이닝 기법들이 사용되며, 패턴 마이닝은 이러한 데이터 마이닝을 위한 중요한 기법 중에 하나이다. 패턴 마이닝은 거대 데이터베이스로부터 유용한 패턴을 찾아내는 기법이며, 패턴 마이닝 분야 중에 하나인 빈발 패턴 마이닝은 데이터베이스에서 최소 임계치 이상의 빈도수를 가지는 빈발 패턴을 마이닝 한다. 전통적인 빈발 패턴 마이닝은 전체 데이터베이스에 대한 단일 최소 임계치를 기반으로 중요 빈발 패턴을 마이닝 한다. 단일 최소 임계치 모델은 데이터베이스 내 모든 아이템이 동일한 특성을 가진다고 암묵적으로 가정한다. 그러나 실제 응용에서는 각 아이템들이 개별적인 특성을 가지고 있을 수 있으며, 따라서 이를 반영한 패턴 마이닝 기법이 요구된다. 데이터베이스 내 아이템들의 이러한 특성이 반영되지 않은 빈발 패턴 마이닝 모델에서, 중요한 희귀 아이템이 포함된 패턴을 마이닝 하기 위해서는 낮은 최소 임계치를 설정해야 한다. 그러나 너무 낮은 최소 임계치는 의미 없는 아이템들을 포함하는 수많은 패턴을 야기한다. 반대로 높은 최소 임계치는 희귀 아이템이 포함된 패턴을 마이닝 하지 못하는 희귀 아이템 문제라 불리는 딜레마가 발생한다. 이러한 문제의 해결을 위한 초기 연구들은 아이템 빈도수에 따라 데이터를 몇 개의 블록으로 분할하거나 관련 희귀 아이템들을 하나의 그룹으로 만드는 방법을 사용한 근사적 접근법을 제안하였다. 그러나 이러한 기법들은 근사적 방법의 적용에 의해 모든 희귀 패턴을 포함한 빈발 패턴을 마이닝 하지 못한다. 다중 최소 임계치를 고려한 패턴 마이닝 모델은 아이템들의 개별적인 특성을 반영하여 희귀 아이템 문제를 해결하기 위해 제안되었다. 다중 최소 임계치 기반의 빈발 패턴 마이닝 모델에서 각 아이템은 MIS (Minimum Item Support)라고 불리는 개별 최소 임계치를 가지며, 아이템들의 데이터베이스 내 빈도수를 기반으로 계산된다. 다중 최소 임계치 모델은 MIS를 통해 수많은 의미 없는 패턴을 생성하지 않고도 손실 없이 모든 희귀 빈발 패턴을 찾아낸다. 한편, 빈발 패턴을 마이닝 하는 과정에서 후보 패턴들이 생성되며, 단일 최소 임계치 모델에서는 각 후보 패턴의 빈도수가 유일한 최소 임계치와 비교된다. 따라서, 희귀 아이템 문제가 발생할 뿐만 아니라 후보 패턴을 구성하는 아이템들의 특성이 고려되지 않는다. 다중 최소 임계치 모델에서는 이 문제를 다루기 위해 후보 패턴을 구성하는 아이템들의 MIS 값 중에서 가장 작은 MIS 값을 해당 후보 패턴의 최소 임계치로 설정하여 패턴 내 아이템들의 특성을 반영한다. 이를 적용하여 효율적으로 희귀 빈발 패턴을 마이닝 하기 위해 트리 구조 기반의 알고리즘은 빈도수 내림차순으로 트리 내 아이템들을 정렬하는 단일 최소 임계치 모델과는 달리 MIS 내림차순으로 아이템들을 정렬하여 마이닝을 수행한다. 본 논문에서는 다중 최소 임계치 기반의 빈발 패턴 마이닝 알고리즘에 대한 특성을 살펴보고, 일반 단일 임계치 기반 알고리즘과의 성능평가를 수행한다. 성능평가는 실행 속도, 메모리 사용량, 그리고 확장성의 관점에서 수행된다. 성능평가 결과, 다중 최소 임계치 기반의 빈발 패턴 마이닝 알고리즘은 희귀 빈발 패턴을 포함한 모든 빈발 패턴을 단일 임계치 기반의 빈발 패턴 마이닝 알고리즘보다 더 빠른 속도로 마이닝 하였으며, 각 아이템의 최소 임계치 정보를 위한 추가적인 메모리를 필요로 하였다. 또한, 비교 알고리즘들은 좋은 확장성 결과를 보였다.

NATM 산악터널의 숏크리트 투입율에 관한 연구 (A study on Actual Quantity of Shotcrete Sprayed in a NATM tunnel)

  • 이철주;김성윤;김동건;유남재
    • 산업기술연구
    • /
    • 제29권B호
    • /
    • pp.57-64
    • /
    • 2009
  • This study has analysed actual overbreak, shotcrete rebound and the ratio between the actual quantity of shotcrete to designed shotcrete measured during a NATM tunnel construction. The measured shotcrete rebound was about 7.2% in average which was about half the allowable rebound (15%), showing shotcrete spraying was performed well. Based on the measurement of excavated tunnel shape, average overbreak was about 28.5cm after tunnel excavation by drill and blasting method. This was about 260% of allowable overbreak. In addition, due to the rebound and overbreak actual amount of shotcrete used in the tunnelling work was about 116.5 % of the designed value. According to the field measurement the ratio of actual shotcrete to designed value showed some relation with standard support pattern, but the size of overbreak did not show the correlation with standard support pattern. Hence current design specifications stating the size of overbreak based entirely on standard support pattern should perhaps be reestablished. The insight into the design guideline regarding overbreak and shotcrete.

  • PDF

터널 지보패턴 결정을 위한 위험도 분석 (A risk analysis for the determination of a tunnel support pattern)

  • 유광호;박연준
    • 한국터널지하공간학회 논문집
    • /
    • 제5권3호
    • /
    • pp.241-250
    • /
    • 2003
  • 암반은 그 특성상 매우 불균질하며, 조사 및 시험을 통하여 얻을 수 있는 자료는 아주 한정적이다. 이러한 이유 때문에 암반 중에 구조물을 구축하는 작업은 많은 불확실성 (uncertainties)을 내포하게 된다. 터널 설계에 있어서 주요 설계 파라미터인 지보패턴, 굴진장 및 굴착방법 등은 최적의 값으로 결정되어야 하나 그 결정이 쉽지 않으며, 결정을 잘못할 경우 원하지 않는 risk, 즉 터널 안정성의 저하 혹은 지보재의 지나친 보강으로 인한 경제적 손실을 발생시킨다. 본 연구에서는 터널설계 시 주요한 설계 파라미터인 지보패턴 및 굴진장을 위험도 분석 기법에 근거하여 결정하는 방법을 소개하였다. 지보량이 증가할수록 신뢰지수가 증가하여 터널의 안정성이 증가함을 정량적으로 확인할 수 있었으며, 터널의 붕괴 등으로 말미암아 발생할 수 있는 손실비용 및 공사비를 고려하여 위험도 분석을 실시함으로서 최적의 지보패턴 및 굴진장을 정량적으로 결정할 수 있었다.

  • PDF

CP-Tree구조를 이용한 높은 신뢰도를 갖는 연관 규칙의 효율적 탐색 방법 (An Efficient Search Method for High Confidence Association Rules Using CP(Confidence Pattern)-Tree Structure)

  • 송한규;김재련
    • 산업경영시스템학회지
    • /
    • 제25권1호
    • /
    • pp.1-8
    • /
    • 2002
  • The traditional approaches of association rule mining have relied on high support condition to find interesting rules. However, in some application such as analyzing the web page link and discovering some unusual combinations of some factors that have always caused some disease, we are interested in rules with high confidence that have very low support or need not have high support. In these cases, the traditional algorithms are not suitable since it relies on first satisfying high support. In this paper, we propose a new model, CP(Confidence Pattern)-Tree, to identify high confidence rule between 2-items without support constraint. constraint. In addition, we discuss confidence association rule between two more items without support constraint.

일 지역 취약가구 독거노인의 건강상태에 따른 가정지원과 도움요구 (Home Care Support and Support Requirements According to Health Condition in the Poor Elderly People Living Alone)

  • 박지원;김용순;김기숙
    • 가정간호학회지
    • /
    • 제16권2호
    • /
    • pp.89-97
    • /
    • 2009
  • Purpose: To identify the health condition, home care support, support requirement of poor and elderly people living alone. Method: Data was collected through self-administered questionnaires and analyzed by descriptive statistics, t-test, ANOVA and correlation. Survey involved 269 conveniently selected who have a social support in H city. Result: Perceived health condition of subjects was bad to moderate (mean score: 2.22). There were significant home care support differences according to gender, religion, education level and dwelling pattern. Support requirement was influences only by the dwelling pattern. Perceived health condition showed a positive correlation with home care support of friends and neighbors, and a negative correlation with support requirement (medical, material, economic emotional support). Conclusion: These findings are expected to make a positive contribution to create an ideal intervention for public visiting nurses and social workers to improve the quality of life in poor and elderly people who live alone.

  • PDF

대표 패턴 마이닝에 활용되는 패턴 압축 기법들에 대한 분석 및 성능 평가 (Analysis and Performance Evaluation of Pattern Condensing Techniques used in Representative Pattern Mining)

  • 이강인;윤은일
    • 인터넷정보학회논문지
    • /
    • 제16권2호
    • /
    • pp.77-83
    • /
    • 2015
  • 데이터 마이닝에서 활발히 연구되고 있는 주요 분야들 가운데 하나인 빈발 패턴 마이닝은 대규모의 데이터 집합 또는 데이터베이스로부터 숨겨진 유용한 패턴 정보를 추출하기 위한 방법이다. 또한 이 기법으로 얻을 수 있는 결과물을 통해 데이터베이스내의 다양하고 중요한 특징들을 더욱 손쉽게 자동적으로 분석할 수 있기 때문에 많은 응용영역에도 활발히 적용되고 있다. 하지만 이러한 데이터베이스로부터 단순히 사용자에 의해 설정된 최소 지지도 임계값만을 가지고 이를 만족하는 모든 패턴들을 추출하는 기존의 전통적인 빈발 패턴 마이닝 방식은 데이터베이스의 특성과 임계값 설정의 정도에 따라 극도로 많은 수의 결과 패턴을 생성하는 문제를 가지며, 이에 따른 시간 및 공간 자원의 낭비를 초래한다. 또한 과도하게 생성된 패턴에 대한 분석의 어려움 역시 심각한 문제가 된다. 기존의 빈발 패턴 마이닝 접근방법들이 직면한 이러한 문제를 해결하고자, 데이터베이스로부터 가능한 모든 빈발 패턴들을 마이닝하는 것이 아닌, 이들에 대한 대표 패턴들만은 선별적으로 추출할 수 있도록 하는 대표 패턴 마이닝의 개념과 다양한 관련 기법들이 제안되었다. 본 논문에서는 생성되는 각 패턴의 최대성 또는 폐쇄성을 고려하는 패턴 압축 기법들에 대한 특성들을 기술하고, 이에대한 비교 및 분석을 진행한다. 최대 빈발 패턴 혹은 닫힌 빈발 패턴들을 마이닝함으로써, 효과적인 패턴 압축이 가능하며, 더 적은 시공간 자원으로 마이닝 작업을 수행할 수 있다. 또한 압축된 패턴들은 필요시 다시 원래의 패턴 형태로 복구가 가능한 특징이 있으며, 특히 닫힌 패턴 접근 방법을 이용하면 패턴을 압축하고 다시 해제하는 과정에서 어떠한 정보의 손실도 일어나지 않는다. 본 논문에서는 같은 플랫폼 상에서 동일한 구현 수준의 알고리즘에 대해 실세계로부터 축적된 실 데이터셋들을 가지고 상기 기법들에 대한 성능평가를 진행함으로써, 각 기법이 패턴 생성, 수행 시간, 메모리 사용량과 같은 실제적인 마이닝 성능에 대해 어떠한 영향을 미치는지에 대한 심층적 분석결과를 보인다.

골관절염 환자의 운동양상과 운동장애 영향요인 (Exercise Pattern and Influencing Factor of Exercise Barrier in Patients with Osteoarthritis)

  • 김종임;김인자;강현숙;배상철;이은옥
    • 근관절건강학회지
    • /
    • 제9권2호
    • /
    • pp.135-143
    • /
    • 2002
  • Exercise is an important strategy for health promotion in patients having osteoarthritis. But, lots of patients with osteoarthritis were underexercised. Exercise pattern and influencing factors of exercise barrier are not well-known. To address this issue, we studied the exercise pattern and influencing factors of exercise barrier in patients with osteoarthritis. The subjects of the study were 463 adult osteoarthritis (Mean age = 61.63 years) who had diagnosed osteoarthritis by rheumatologist. Data were gathered from May 1999 to February 2000 using a questionnaire and exercise barrier(Sallis et al, 1989), exercise pattern(Lee et al., 2000), physical status by WOMAC(Bellamy, 1989), socail support(Sallis et al., 1989), fatigue and pain using graphic rating scale, depression by CES-D(Radloff,1977). Data were analyzed with the SPSS win 6.0 using frequency, ANOVA, Stepwise multiple regression. The results of this study were as follows; 1) 56.4% of sample was 'do not exercise at all', 'longer rest than exercise', was 15.9%, 'longer exercise than rest' was 7.2%, 'exercise regularly' was 20.5%. 2) Social support (F=10.349, p=0.000) and exercise barrier(F=4.455, p=0.004) were showed significantly difference by exercise pattern. 3) Influencing factors of exercise barrier were depression and social support. Thoses explained 13.3% of exercise barrier. In conclusion, half of osteoarthritis patient did not do exercise and it was shown that depression and social support were major influencing factors to exercise barrier. The results of this study can be applied to develop the health promoting educational program for patients with osteoarthritis.

  • PDF

휴먼 인지를 위한 근적외선 영상에서의 얼굴 검출 (Face Detection in Near Infra-red for Human Recognition)

  • 이경숙;김현덕
    • 디지털콘텐츠학회 논문지
    • /
    • 제13권2호
    • /
    • pp.189-195
    • /
    • 2012
  • 본 논문에서는 휴먼 인지를 위한, 근적외선 얼굴 영상에서의 얼굴 검출 방법이 제안된다. 에지의 강도와 방향에 기반한 에지 히스토그램이 근적외선 영상으로부터 얼굴을 검출하기 위해 사용되었다. 조명변화에 강인하기 때문에, 제안된 에지 히스토그램은 얼굴을 효과적으로 표현하고 구별한다. 얼굴 검출을 위한 분류기로서는 SVM(Support Vector Machine)을 사용하였으며 제안한 방법은 ULBP(Uniform Local Binary Pattern)보다 적은 피쳐 개수를 가지면서도 에러율 측면에서, ULBP의 경우보다 나은 성능을 나타내었다.

일본 대도시 독거노인의 자녀와의 지원교환형태에 따른 생활만족도 (Exploring Relationships between Life Satisfaction and Patterns of Support Exchange of the Elderly Living Alone and Their Children in Metropolitan City in Japan)

  • 임효연
    • 대한가정학회지
    • /
    • 제47권5호
    • /
    • pp.59-66
    • /
    • 2009
  • The present study identified the patterns of support exchange between the elderly living alone and their children in a metropolitan city in Japan and examined the relationships between the patterns of support exchange and their life satisfaction. The sample was collected from 1,020 the elderly living alone in Osaka city selected with random sampling method. The questionnaires were mailed to the respondents, who were asked to send them back. The response rate was 51.7%(n = 526). We used 371 sample of respondents who have children. The results indicated that:(1)the patterns of support exchange were different by the types of social support, (2)the life satisfaction of the elderly who had an appropriate balance of a support exchange pattern was significantly higher than the life satisfaction of those who had low support exchange or only provided supports to their children. The findings imply that an appropriate balance of support exchange between the elderly living alone and their children was crucial in improving life satisfaction of the elderly living alone.

길이에 따라 감소하는 빈도수 제한조건을 고려한 가중화 그래프 패턴 마이닝 기법 (A Weighted Frequent Graph Pattern Mining Approach considering Length-Decreasing Support Constraints)

  • 윤은일;이강인
    • 인터넷정보학회논문지
    • /
    • 제15권6호
    • /
    • pp.125-132
    • /
    • 2014
  • 대규모의 데이터베이스로부터 숨겨진 유용한 패턴 정보를 찾기 위해 빈발 패턴 마이닝이 제안된 이래로, 다양한 종류의 접근 방법들과 어플리케이션들이 연구되어 왔다. 특히, 빈발 그래프 패턴 마이닝은 계속해서 복잡해져 가는 최근의 데이터들을 효과적으로 다루기 위해 제안되었고, 이와 관련한 다양한 효율적인 알고리즘들이 연구되어 왔다. 그래프 데이터베이스로부터 얻을 수 있는 그래프 패턴들은 이를 구성하는 요소들에 따라 다른 중요도를 가지며 길이에 따라 다른 특성을 갖는다. 하지만, 전통적인 빈발 그래프 패턴 마이닝 접근 방법들은 이러한 문제들을 고려할 수 없다는 한계점을 지닌다. 즉, 기존의 방법들은 마이닝 과정에서 추출되는 그래프 패턴들의 길이에 상관없이 오직 하나의 최소 지지도 임계값만을 고려하고 이들의 가중치 요소들을 사용하지 않기 때문에, 실제적으로 쓸모없는 그래프 패턴들이 상당량 생성될 수 있다. 작은 수의 정점과 간선을 갖는 작은 그래프 패턴들은 이들에 대한 가중화 지지도 값이 상대적으로 높을 때 흥미로운 특성을 갖는 경향이 있는 반면, 많은 정점과 간선을 갖는 큰 그래프 패턴들은 비록 가중화 지지도 값이 상대적으로 낮을지라도 흥미로운 특성을 가질 수 있다. 이러한 이유로, 본 논문에서는 길이에 따라 감소하는 지지도 제한조건을 고려한 가중치 기반의 빈발 그래프 패턴 마이닝 알고리즘을 제안한다. 본 논문에서 제공되는 총체적인 실험 결과들은 제안되는 방법이 기존의 최신 그래프 마이닝 알고리즘과 비교하여 패턴 생성, 수행시간, 그리고 메모리 사용량 측면에서 더욱 뛰어난 성능을 보장함을 보인다.