• 제목/요약/키워드: Association thresholds

검색결과 103건 처리시간 0.027초

인과적 확인 측도에 의한 연관성 규칙 탐색 (Proposition of causally confirmed measures in association rule mining)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권4호
    • /
    • pp.857-868
    • /
    • 2014
  • 대량의 데이터로부터 과거에 알려지지 않았던 유용한 정보를 발견하는 기술인 데이터 마이닝 기법은 오늘날 빅 데이터 시대에 가장 대표적인 분석 기법이라고 할 수 있다. 이들 중에서도 연관성 규칙은 지지도, 신뢰도, 향상도 등의 여러 가지 흥미도 측도를 기반으로 하여 항목들 간의 관련성을 찾아내는 것이다. 그러나 기본적인 연관성 평가 기준만으로는 두 항목 간의 인과관계를 설명할 수 없을 뿐만 아니라 연관성의 방향도 파악할 수 없다. 본 논문에서는 이러한 문제를 해결하기 위해 인과적 확인 연관성 평가 기준을 제안하는 동시에, 제안한 평가 기준들이 흥미도 측도의 조건을 충족하는지의 여부를 점검하였다. 본 논문에서 제안한 인과적 확인 향상도는 세 가지 조건 모두를 만족하는 것으로 입증되었다. 인과적 확인 지지도와 인과적 확인 신뢰도는 동시 발생 확률의 값에 따라 단조 증가하는 조건과 각 항목의 주변 확률의 값에 따라 단조 감소하는 조건은 만족하였다. 또한 예제를 통해 기본적인 연관성 평가 기준과 인과적 연관성 평가 기준, 그리고 인과적 확인 연관성 평가 기준을 비교해 본 결과, 본 논문에서 제안하는 인과적 확인 측도들이 다른 평가 기준에 비해 가장 바람직한 측도라는 사실을 파악하였다.

인과적 연관성 규칙 평가 기준의 제안 (Proposition of causal association rule thresholds)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권6호
    • /
    • pp.1189-1197
    • /
    • 2013
  • 연관성 규칙 마이닝은 지지도, 신뢰도, 향상도 등의 흥미도 측도를 기반으로 하여 대용량 데이터베이스를 구성하고 있는 항목들 간의 관련성을 찾아내는 기법이다. 이 기법은 기업의 의사결정 문제, 유통업에서의 교차판매, 고객관리 등 현업에서 많이 활용되고는 있으나, 이러한 기본적인 연관성 평가기준만으로는 두 항목 간의 인과관계를 설명할 수 없다. 본 논문에서는 이러한 문제를 해결하기 위해 인과적 연관성 규칙을 제안하는 동시에, 고려하는 평가 기준들이 흥미도 측도의 조건을 충족하는지의 여부를 점검하였다. 본 논문에서 제안한 인과적 향상도는 세 가지 조건 모두를 만족하는 것으로 입증되었다. 인과적 지지도와 인과적 신뢰도는 동시 발생 확률의 값에 따라 단조 증가하는 조건과 각 항목의 주변 확률의 값에 따라 단조 감소하는 조건은 만족하였다. 반면에 두 항목이 독립이면 연관성 평가기준의 값이 1이 되는 조건에 대해서는 기존의 지지도와 신뢰도와 같이 이 조건이 충족되지 않았다. 또한 예제를 통해 기존의 연관성 평가 기준과 인과적 연관성 평가 기준을 비교해 본 결과, 기존의 평가측도인 지지도와 신뢰도를 기준으로 연관성 규칙 생성 여부를 판단했을 때 탈락되는 규칙도 인과적 평가 기준인 인과적 지지도와 인과적 신뢰도를 이용하여 판단하게 되면 연관성 규칙으로 채택할 수 있다는 사실을 발견하였다.

관심 항목의 발생 가능한 규칙의 수를 고려한 연관성 평가기준 (Association rule thresholds considering the number of possible rules of interest items)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권4호
    • /
    • pp.717-725
    • /
    • 2012
  • 데이터 마이닝은 데이터베이스로부터 쉽게 드러나지 않는 의미 있는 정보를 생성하는 기법이다. 이 중에서 연관성 규칙은 일반적으로 발생 여부를 나타내는 자료를 이용하여 지지도, 신뢰도, 향상도 등을 수치화함으로써 항목들 간의 관련성을 나타낸다. 기존의 연관성 규칙은 발생 빈도의 크기를 고려하지 않음으로써 정보 손실에 의한 오류를 범할 수 있다. 이를 위해 본 논문에서는 발생 가능한 규칙의 수를 고려한 연관성 평가 기준들을 제안하고 예제를 통하여 기존 연구와 비교한 후, 본 논문에서 제안한 연관성 평가 기준의 유용성을 살펴보았다. 실제 데이터를 통하여 분석한 결과, 기존의 연관성 규칙 평가 기준은 관심항목 수와 트랜잭션의 수를 2배로 하여도 지지도와 신뢰도, 향상도의 값이 동일한 반면에 본 논문에서 제안한 평가 기준은 발생 가능한 규칙의 수를 고려하기 때문에 각각의 평가 기준의 값들이 트랜잭션의 수에 따라 다르다는 것을 알 수 있었다. 또한 본 논문에서 제안하는 평가 기준이 기존의 연관성 규칙 평가 기준에 비해 좀 더 정확한 정보를 제공하는 것을 알 수 있다. 특히 본 논문에서 제안한 신뢰도의 범위가 기존 연관성 평가 기준에 비해 크므로 좀 더 비교 가능한 정보를 제공하는 동시에 향상도의 비교를 용이하게 한다고 할 수 있다.

콜센터 근로자의 청력역치에 영향을 미치는 요인 (Factors that Affect the Hearing Thresholds of Call Center Workers)

  • 유계묵;김갑배;정광재;김규상
    • 한국산업보건학회지
    • /
    • 제21권3호
    • /
    • pp.168-176
    • /
    • 2011
  • Objectives: Hundreds of thousands of call center workers are wearing an acoustic device for their businesses, such as telemarketing and customer counseling, and the number of the workers are increasing sharply. Because call center workers always talk to dozens of customers over the headset, they would be placed under the state of a higher risk with their hearing ability. The purpose of this study is to investigate factors that affect the hearing thresholds for the call center workers. Methods: This study investigated hearing losses of 101 workers of 5 call centers in Korea by executing puretone audiometry and self-administered questionnaires. A cross table analysis was processed to compare gender differences between male and female. Male and female hearing thresholds were compared with the Students' t-test, and one-way ANOVA was conducted to observe the difference between non-occupational and occupational characteristics in 2, 3, 4, 6, and 8 kHz hearing thresholds for the female workers. Additionally, multiple regression analysis was conducted to find the factors that affect the 4 kHz hearing thresholds. Results and Conclusions: Male hearing thresholds were higher than those of female except for 8 kHz. In the group having an ear related disease, hearing threshold of male left ear was highly affected rather than that of female in 4 kHz. There were significant differences in the variables of alcohol drinking (2 kHz) and headset volume (8 kHz) in both ears. While this study does not show any significant factors that affect the hearing thresholds in the occupational characteristics, the gender and the previous ear related diseases, non-occupational characteristics, were found as the factors in 4 kHz. It is suggested that the more detailed survey be performed to identify the occupational factors that affect the hearing thresholds in the call center workers based on the result derived from this study.

연관 규칙 마이닝에서의 평가기준 표준화 방안 (Standardization for basic association measures in association rule mining)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권5호
    • /
    • pp.891-899
    • /
    • 2010
  • 연관성 규칙은 방대한 양의 데이터베이스 속에 있는 각 항목들 간의 관련성을 수치화함으로써 두개 이상의 항목간의 관련성을 나타내는 기법으로 데이터 마이닝 분야에서 가장 많이 활용되고 있다. 의미 있는 연관성 규칙을 탐색하기 위한 가장 기본적인 평가기준에는 지지도, 신뢰도, 향상도 등이 있으며, 이들을 이용하여 연관성 규칙을 생성하게 된다. 이 때 사용되는 향상도는 그 값의 범위가 지지도나 신뢰도와는 다르므로 지지도나 신뢰도의 범위를 동일하도록 하기 위해 표준화할 필요가 있으며, 지지도와 신뢰도도 하나의 후항변수에 대해 여러 개의 전항변수들이 있는 경우 이들 중 어느 것이 후항변수와 가장 연관성이 있는지를 객관적으로 비교하기 위해서도 표준화가 필요하다. 본 논문에서는 각 항목집합의 주변 발생확률을 고려하여 객관적이고도 정확한 연관성 정도를 파악하기 위해 연관성 평가기준을 표준화하는 방안에 대해 연구하고자 한다. 또한 흥미도 측도의 세 가지 조건의 충족 여부를 점검해 본 후, 구체적인 예제를 통하여 기존의 연관성 평가기준과 표준화된 연관성 평가기준을 비교 분석하고자 한다.

적외선 영상 표적추적 성능 개선을 위한 적응적인 자동문턱치 산출 기법 연구 (Adaptive Automatic Thresholding in Infrared Image Target Tracking)

  • 김태한;송택렬
    • 제어로봇시스템학회논문지
    • /
    • 제17권6호
    • /
    • pp.579-586
    • /
    • 2011
  • It is very critical for image processing of IIR (Imaging Infrared) seekers to achieve improved guidance performance for missile systems to determine appropriate thresholds in various environments. In this paper, we propose automatic threshold determination methods for proper thresholds to extract definite target signals in an EOCM (Electro-Optical Countermeasures) environment with low SNR (Signal-to-Noise Ratios). In particular, thresholds are found to be too low to extract target signals if one uses the Otsu method so that we suggest a Shifted Otsu method to solve this problem. Also we improve extracting target signal by changing Shifted Otsu thresholds according to the TBR (Target to Background Ratio). The suggested method is tested for real IIR images and the results are compared with the Otsu method. The HPDAF (Highest Probabilistic Data Association Filter) which selects the target originated measurements by taking into account of both signal intensity and statistical distance information is applied in this study.

젊은 여성에서 짠맛 역치 및 자기 평가 짠맛 선호도와 나트륨 섭취 간의 상호 관련성 (Relationship between thresholds and self-assessed preference for saltiness and sodium intake in young women)

  • 심유진;양윤정;양윤경
    • Journal of Nutrition and Health
    • /
    • 제49권2호
    • /
    • pp.88-98
    • /
    • 2016
  • 본 연구에서는 20대 초반 한국 여성의 짠맛 역치 및 선호도를 측정하여 음식섭취빈도법을 통해 추정한 나트륨 섭취량과의 연관성을 분석하고, 자기 평가 짠맛 선호도와 관련되어 있는 나트륨 섭취 관련 식행동과 나트륨 섭취 기여 음식을 조사하였다. 자기 평가 짠맛 선호도는 음식섭취빈도법을 이용하여 추정한 나트륨 섭취량과 유의한 양의 상관관계에 있었으며, 나트륨 증가 식행동과 양의 상관관계에 있었고, 나트륨 감소 식행동과 음의 상관관계에 있었다. 나트륨 섭취와 관련된 식행동 중에는 식탁에서 소금과 양념간장의 사용, 외식과 배달음식의 빈도, 국, 찌개, 국수류의 국물 섭취, 레토르트나 가공 식품의 이용, 생채소의 섭취, 싱거운 맛에 대한 수용태도 등의 항목이 자기 평가 짠맛 선호도와 유의한 관련성이 있었으며 나트륨 섭취 기여음식 중에는 라면, 순두부찌개, 총각김치 및 김치를 이용한 음식 등이 자기 평가 짠맛 선호도와 유의하게 관련되어 있어, 짠맛 선호도가 이들 식행동 및 음식을 통해 높은 나트륨 섭취와 관련되어 있는 것으로 생각된다. 예상과는 달리 짠맛 검출 및 인식 역치는 자기 평가 짠맛 선호도, 나트륨 섭취량, 나트륨 증가 및 감소 식행동과 유의한 상관관계를 보이지 않아 식품체계가 아닌 염화나트륨 수용액을 이용한 짠맛 역치보다는 자기 평가된 짠맛 선호도가 개인의 평상시 나트륨 섭취량을 간접적으로 평가할 수 있는 더 좋은 지표로서 생각된다. 결론적으로, 자기 평가 짠맛 선호도는 나트륨 섭취와 관련된 식행동과의 연관성으로 인하여 평상시 나트륨 섭취 정도를 잘 반영하는 것으로 나타났으며, 개인의 나트륨 섭취 수준을 평가하는 간단하고 효과적인 도구로서 활용될 수 있을 것이다.

향상도 영향 감소화에 의한 연관성 순위결정함수 (Association rule ranking function by decreased lift influence)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권3호
    • /
    • pp.397-405
    • /
    • 2010
  • 데이터 마이닝은 대규모의 데이터베이스에 내재되어 있는 유용한 정보를 찾아내는 과정이며, 중요한 목표 중의 하나는 여러 변수들 간의 관계를 발견하고 결정하는 것이다. 이를 위해 필요한 기법인 연관성 규칙 마이닝은 각 항목들 간의 관련성을 찾아내는 데 활용되며, 지지도, 신뢰도, 향상도 등의 연관성 측도를 기반으로 두 항목간의 관계를 수치화함으로써 의미 있는 규칙을 찾아낸다. 본 논문에서는 3개의 연관기준값들 중 어느 하나라도 기준 이상이 되는 규칙의 순위를 매겨 필요한 연관성 규칙만을 생성할 수 있는 연관성 순위 결정 함수를 개발하는데 기존의 연구 결과를 개선하기 위해 특정 연관 기준값의 영향을 더 많이 받지 않도록 3개 연관기준값의 범위를 조정한 연관성 순위 결정 함수를 제안하고자 한다. 모의실험을 해본 결과, 대체적으로 본 논문에서 제안한 함수는 연관성 측도들과 최저 연관기준값들간의 차이를 잘 반영하고 있으며, 최저 연관성 기준값들의 범위와는 관계없이 항상 -1과 1 사이의 값을 가지며, 최저 연관기준값을 모두 충족하게 되면 1의 값을 가지며, 3개 모두 충족되지 않으면 -1의 값을 갖게 된다는 사실을 알 수 있었다.

이분형 예측 유사성 측도의 연관성 평가 기준 적용 방안 (The application for predictive similarity measures of binary data in association rule mining)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권3호
    • /
    • pp.495-503
    • /
    • 2011
  • 데이터 마이닝에서의 연관성 규칙은 방대한 양의 데이터베이스에 내재되어 있는 항목들 간의 관련성을 수치화 하는 방법이다. 의미 있는 연관성 규칙을 탐사하기 위한 가장 기본적인 연관성 규칙 평가 기준에는 지지도, 신뢰도, 향상도 등이 있다. 이들 중에서 향상도는 그 값에 의해 양의 연관성이 있는지 아니면 음의 연관성이 있는지, 즉 연관성의 방향을 알 수 있는 반면에 지지도와 신뢰도는 그 방향을 알 수가 없다. 이를 위해 순수 신뢰도와 기여 순수 신뢰도가 제안되었으나 이들 또한 단점을 안고 있다. 본 논문에서는 기존의 여러 형태의 신뢰도가 가지고 있는 문제점을 해결하기 위해 군집분석이나 다차원 분석에서 활용되고 있는 이분형 예측 유사성 측도 중에서 -1과 1 사이의 값을 가지는 Yule의 Y 및 Q 측도를 연관성 평가 기준으로 제안하였다. 또한 기존의 순수 신뢰도 및 기여 순수 신뢰도의 문제점을 파악한 후, 예제를 통하여 이분형 예측 유사성 측도의 유용성에 관해 알아보았다. 그 결과, 본 논문에서 고려한 유사성 측도들은 기존의 측도들이 가지고 있는 문제점을 해결할 수 있어서 본 논문에서 제안한 이분형 예측 유사성 측도가 연관성 평가 기준으로 활용할 수 있다는 사실을 확인하였다.

동시 비 발생 빈도를 고려한 유사성 측도의 연관성 규칙 평가 기준 활용 방안 (Association rule thresholds of similarity measures considering negative co-occurrence frequencies)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권6호
    • /
    • pp.1113-1121
    • /
    • 2011
  • 최근 여러 분야에서 다양한 데이터 마이닝 방법들을 현업에 적용하고 있는 추세이다. 가장 많이 활용되고 있는 데이터 마이닝 기법 중의 하나인 연관성 규칙은 대용량 데이터베이스에 내재되어 있는 항목들 간의 관련성을 수치화하여 그들 간의 연관 정도를 나타내는 기법이다. 의미 있는 연관성 규칙을 생성하기 위해 지지도, 신뢰도, 향상도 등의 측도가 가장 기본적으로 활용되고 있다. 본 논문에서는 군집 분석이나 다차원 분석법에서 많이 활용되고 있는 유사성 측도들 중에서 동시 비 발생 빈도를 고려한 유사성 측도를 연관성 평가 기준으로 제안한 후, 예제를 통하여 기존의 신뢰도 및 지지도와 비교함으로써 그 유용성을 알아보았다. 모의실험 결과를 종합해볼 때, 동시 발생 빈도 또는 동시 비 발생 빈도가 증가하면 본 논문에서 고려한 모든 유사성 측도들은 지지도 및 신뢰도와 마찬가지로 증가하며, 불일치 계수의 값이 증가하면 이 측도들은 감소하게 된다는 사실을 알 수 있었다. 또한 이들 유사성 측도들은 지지도 및 신뢰도와 매우 유의한 상관관계가 있는 것으로 나타났으며, 전항과 후항이 바뀌더라도 값의 변화가 없기 때문에 신뢰도 보다 더 바람직한 연관성 규칙 평가 기준이라고 할 수 있다.