• 제목/요약/키워드: 측도

검색결과 363건 처리시간 0.023초

모든 주변 비율을 고려한 확률적 흥미도 측도 기반 유사성 측도의 연관성 평가 기준 활용 방안 (Utilization of similarity measures by PIM with AMP as association rule thresholds)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권1호
    • /
    • pp.117-124
    • /
    • 2013
  • 연관성 규칙 탐사는 상당한 양의 데이터베이스에 내재되어 있는 항목들 간의 관련성을 파악하는 것으로 쇼핑몰, 보건 및 의료, 교육분야 등의 현장에서 많이 적용되고 있다. 이러한 연관성 규칙을 생성하기 위해 연관성 규칙 평가 기준인 지지도, 신뢰도, 향상도 등이 활용되고 있다. 이들 중에서 신뢰도가 연관성 평가 기준으로 가장 많이 활용되고는 있으나 항상 양의 값을 취하는 비대칭적 측도이기 때문에 항목 간에 연관성 규칙을 생성하는 데 어려움이 존재하게 된다. 이러한 문제를 해결하기 위해 본 논문에서는 주변 비율 전부를 포함한 확률적 흥미도 기반 유사성 측도를 연관성 평가 기준으로 활용하는 방안을 고려하였다. 이 측도들은 주변비율 전부와 교차표의 모든 항을 고려하여 연관성의 강도를 측정하는 측도이므로 나타나는 모든 정보를 충실히 반영해주는 측도라고 할 수 있다. 모의실험을 통해 확인한 결과, 모든 주변 비율을 고려한 확률적 흥미도 기반 유사성 측도 대부분이 기존의 연관성 평가 기준과 마찬가지로 연관성의 정도를 파악할 수 있는 동시에 부호를 포함하고 있어서 연관성의 방향도 알 수 있었다.

확률적 흥미도를 이용한 유사성 측도의 연관성 평가 기준 (Exploration of PIM based similarity measures as association rule thresholds)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권6호
    • /
    • pp.1127-1135
    • /
    • 2012
  • 연관성 규칙 기법은 대용량데이터베이스에 있는 항목들 간의 관련성을 수치화 하는 것으로 데이터 마이닝 기법 중에서는 가장 많이 활용되고 있다. 연관성 규칙을 탐사하기 위한 연관성 규칙 평가 기준에는 지지도, 신뢰도, 향상도 등이 있다. 이들 중에서 가장 중심이 되는 신뢰도는 비대칭적 측도일 뿐만 아니라 항상 양의 값만을 취하고 있어서 항목 간에 연관성 규칙을 생성하는 데 여러가지 문제가 존재한다. 이러한 문제를 해결하기 위해 본 논문에서는 확률적 흥미도 측도 기반, 특히 주변 비율을 고려하지 않은 유사성 측도를 연관성 평가 기준으로 적용하는 방안에 대해 연구하였다. 예제에 의한 비교를 통하여 Yule과 Michael의 유사성 계수와 Pearson의 파이 계수는 신뢰도와 동일하게 연관성의 정도를 파악할 수 있는 동시에 부호를 포함하고 있어서 연관성의 방향도 알 수 있었으나, 카이 제곱 통계량 기반 측도들은 항상 양의 값만 나타날 뿐만 아니라 신뢰도와는 변화하는 양상이 다르다는 것을 확인할 수 있었다.

거주지 분화에 대한 공간통계학적 접근 (I): 공간 분리성 측도의 개발 (A Spatial Statistical Approach to Residential Differentiation (I): Developing a Spatial Separation Measure)

  • 이상일
    • 대한지리학회지
    • /
    • 제42권4호
    • /
    • pp.616-631
    • /
    • 2007
  • 거주지 분화 현상은 도시적 삶의 공간성을 파악하는데 본질적인 요소이기 때문에 도시학 연구에서 오랫동안 주목을 받아왔다. 거주지 분화 현상에 대한 연구 과제 중의 하나가 상이한 두 집단이 얼마나 공간적으로 분리되어 있는지를 측정하는 문제이다. 이러한 측면에서 가장 널리 사용되어온 것이 상이지수(index of dissimilarity)인데, 이 지수는 거주지 분리의 '불균등성(unevenness)'은 측정할 수 있지만, 공간적 '집중도(clustering)'는 측정하지 못하는 단점을 갖고 있다. 이러한 단점을 극복하기 위해 제안되어 온 '공간적 격리 지수(spatial indices of segregation)' 역시 가설검정 절차를 제시하지 못하고 최근의 공간통계학 연구 성과를 수용하지 못하는 등의 단점을 가지고 있다. 이러한 의미에서 본 논문의 주된 연구 목적은 새로운 '공간 분리성 측도(spatial separation measure)'를 개발하는 것이다. 이 공간 분리성 측도는 상이한 인구 집단이 거주 공간에 얼마나 불균등하게 분포하고 있는지에 대한 것뿐만 아니라 그러한 불균등 분포가 보여주는 공간적 의존성의 정도까지도 측정하는 새로운 통계량이다. 주요 연구 결과는 다음과 같다. 첫째, 기존의 '공간 연관성 측도(spatial association measures)'와 '공간적 카이-스퀘어 통계량(spatial chi-square statistics)'을 통합하여 새로운 측도를 개발했으며, 일반화된 랜덤화 검정법을 적용해 측도에 대한 유의성 검정법을 제시하였다. 둘째, 개발된 측도와 유의성 검정법을 우리나라 7대 도시의 학력 집단 간 거주지 분리 현상에 적용함으로써, 연구방법론으로서의 유용성을 확인하였다.

이진 Clustering을 이용한 Ad Hoc 망의 이동성 해석 측도 (Mobility Analysis Metric for Ad Hoc Network Using Pairwise Clustering)

  • 안홍영
    • 한국인터넷방송통신학회논문지
    • /
    • 제10권5호
    • /
    • pp.193-199
    • /
    • 2010
  • 본 논문에서는 Ad Hoc 망의 동적인 연결 상태를 측정하는 도구로서 두 노드 사이의 최대 클러스터간 거리가 전파반경을 넘어서는 시간, 즉 경로 붕괴시간 $T_i$ 들의 합 $\sum_{i}T_i$를 측도로 사용할 것을 제안한다. 경로 붕괴시간 $T_i$는 모빌리티 모델로부터 노드들의 위치를 시간 샘플링한 후 이진 Clustering을 통해 최대 Cluster 거리를 시간의 함수로 구하고, 이로부터 전파반경을 넘어서는 시간구간을 찾아서 구한다. 본 논문에서 제안하는 측도는 개별 연결에 대한 측도로서 뿐만 아니라, 평균을 취함으로서 시스템 전체의 특성을 규정짓는 측도로서도 사용할 수 있다.

준 노름 퍼지 적분에 의해 정의된 퍼지 측도 (Fuzzy Measures Defined by the Semi-Normed Fuzzy Integrals)

  • Kim, Mi-Hye;Lee, Soon-Seok
    • 한국콘텐츠학회논문지
    • /
    • 제2권4호
    • /
    • pp.99-103
    • /
    • 2002
  • 본 논문에서는 t 준노름이 연속인 경우 이미 주어진 퍼지 측도에 관한 측정 가능한 함수의 준 노름 퍼지 적분을 이용하여 퍼지 측도를 정의하는 방법에 대해서 조사했다. 즉 (X, F, g)이 퍼지 측도 공간이라고 하고 h$\in$L$^\circ$(X), 이며 $\top$는 연속 t 준노름이라 하자. 그러면 임의의 $A\in$F에 대해 $\nu$(A)=$\int _A$h$\top$g에 의하여 정의된 집합치 함수 $\nu$는 (X, F)상에서 퍼지 측도이다.

  • PDF

혼합자료에서 독립성 검정에 의한 연관성 측정 (A Unified Measure of Association for Complex Data Obtained from Independence Tests)

  • 이승천;허문열
    • 응용통계연구
    • /
    • 제16권1호
    • /
    • pp.151-167
    • /
    • 2003
  • 두 확률변수의 연관성을 측정하는 측도는 많이 있으나, 이러한 측도는 같은 유형인 변수들 간의 관계를 측정하기 위한 것으로 여러 가지 유형의 변수들이 혼재되어 있는 혼합자료에서 사용하기는 곤란하다 본 논문에서는 두 확률변수의 독립성 검정을 통해 구한 p-값으로 혼합자료에서 사용될 수 있는 새로운 연관성 측도를 구하였으며, 이렇게 구하여진 연관성 측도가 혼합자료에서 변수들 간의 연관성을 비교하는데 유용하게 사용될 수 있음을 보였다.

혼합자료에서 독립성검정에 의한 연관성 측정 (A unified measure of association for complex data obtained from independence tests)

  • 이승천;허문열
    • 응용통계연구
    • /
    • 제34권4호
    • /
    • pp.523-536
    • /
    • 2021
  • 두 확률변수의 연관성을 측정하는 측도는 많이 있으나, 이러한 측도는 같은 유형인 변수들 간의 관계를 측정하기 위한 것으로 여러 가지 유형의 변수들이 혼재되어 있는 혼합자료에서 사용하기는 곤란하다. 본 논문에서는 두 확률변수의 독립성 검정을 통해 구한 p-값으로 혼합자료에서 사용될 수 있는 새로운 연관성 측도를 구하였으며, 이렇게 구하여 진 연관성 측도가 혼합자료에서 변수들 간의 연관성을 비교하는데 유용하게 사용될 수 있음을 보였다.

오즈 곡선과 최적분류점 (Odds curve and optimal threshold)

  • 홍종선;오태규;오세현
    • 응용통계연구
    • /
    • 제34권5호
    • /
    • pp.807-822
    • /
    • 2021
  • 오즈 곡선으로 설명이 가능한 정확도 측도들을 살펴보고, 오즈 곡선의 성질을 바탕으로 대안적인 최대 사각형 정확도 측도를 제안한다. 다양한 확률분포함수와 실증예제를 고려하여 정확도 측도들에 대응하는 분류점을 구하고, 분류점을 측정하는 통계량들을 비교하면서 특징을 토론한다. 그러므로 ROC 곡선 등과 유사하게 오즈 곡선으로부터도 최적분류점들을 발견하고 설명할 수 있으며, 최대사각형 측도는 이진 분류모형의 성능을 향상시킬 수 있는 정확도 측도로 활용할 수 있다.

혼동행렬의 상관계수를 이용한 최적분류점 (Optimal threshold using the correlation coefficient for the confusion matrix)

  • 홍종선;오세현;최예원
    • 응용통계연구
    • /
    • 제35권1호
    • /
    • pp.77-91
    • /
    • 2022
  • 의학통계와 신용평가 분야에서 혼합분포함수를 판별하는 최적분류점 추정하기 위하여 판별력을 측정하는 다양한 정확도 측도들이 존재한다. 최근에 혼동행렬 빈도수로 표현되는 Matthews의 상관계수와 정밀도와 재현율의 조화평균인 F1 통계량의 정확도 측도들이 최적분류점을 추정하는데 연구되었다. 본 연구에서는 이런 정확도 측도들 중에서 표본크기에 의존하는 정확도 측도들은 두 표본크기 차이가 많은 경우에 최적분류점을 설정하는데 적절하지 않음을 발견한다. 그리고 대안적인 정확도 측도로 혼동행렬의 비율들의 함수인 상관계수를 정의하고, 이를 최대화하는 분류점을 최적분류점으로 추정하는 방법을 제안하고 이 방법의 유용성과 활용성에 대하여 토론한다.

강도 3의 직교배열을 평가하기 위한 측도

  • 장대흥
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2004년도 학술발표논문집
    • /
    • pp.211-218
    • /
    • 2004
  • 우리는 직교배열로서 직교계획, 즉 강도(strength)가 2인 직교배열을 주로 이용한다. 그러나, 강도 3인 직교배열은 주효과들과 2인자교호작용이 포함되는 가법모형 하에서 전체최적화(universal optimality)하다는 것이 밝혀져 있다. 그러므로, 임의의 배열이 강도 3인 직교배열인가를 평가하는 측도가 필요하다. 이를 확장하면 임의의 배열이 강도 $t(\geqt2)$인 직교배열인가를 평가하는 측도를 제안할 수 있다.

  • PDF