• 제목/요약/키워드: 중심성 측도

검색결과 13건 처리시간 0.024초

확률적 흥미도를 이용한 유사성 측도의 연관성 평가 기준 (Exploration of PIM based similarity measures as association rule thresholds)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권6호
    • /
    • pp.1127-1135
    • /
    • 2012
  • 연관성 규칙 기법은 대용량데이터베이스에 있는 항목들 간의 관련성을 수치화 하는 것으로 데이터 마이닝 기법 중에서는 가장 많이 활용되고 있다. 연관성 규칙을 탐사하기 위한 연관성 규칙 평가 기준에는 지지도, 신뢰도, 향상도 등이 있다. 이들 중에서 가장 중심이 되는 신뢰도는 비대칭적 측도일 뿐만 아니라 항상 양의 값만을 취하고 있어서 항목 간에 연관성 규칙을 생성하는 데 여러가지 문제가 존재한다. 이러한 문제를 해결하기 위해 본 논문에서는 확률적 흥미도 측도 기반, 특히 주변 비율을 고려하지 않은 유사성 측도를 연관성 평가 기준으로 적용하는 방안에 대해 연구하였다. 예제에 의한 비교를 통하여 Yule과 Michael의 유사성 계수와 Pearson의 파이 계수는 신뢰도와 동일하게 연관성의 정도를 파악할 수 있는 동시에 부호를 포함하고 있어서 연관성의 방향도 알 수 있었으나, 카이 제곱 통계량 기반 측도들은 항상 양의 값만 나타날 뿐만 아니라 신뢰도와는 변화하는 양상이 다르다는 것을 확인할 수 있었다.

효모 마이크로어레이 유전자발현 데이터에 대한 군집화 비교 (Comparison of clustering with yeast microarray gene expression data)

  • 이경아;김재희
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권4호
    • /
    • pp.741-753
    • /
    • 2011
  • 마이크로어레이 유전자 발현데이터인 효모데이터를 이용하여 군집분석을 실시하였다. 모형기반 군집방법, K-평균법, 중앙값 중심분포 (PAM), 자기 조직화 지도 (SOM), 계층적 Ward 군집방법을 이용하여 군집화를 실시하고, 연결성 측도 (connectivity), Dunn지수, 실루엣 측도 (silhouette)를 이용하여 각 군집방법에 대한 유효성을 측정하고 군집분석 결과를 비교하고자한다.

네트워크 중심성 지표를 이용한 서울 수도권 지하철망 특성 분석 (Analysis of Seoul Metropolitan Subway Network Characteristics Using Network Centrality Measures)

  • 이정원;이강원
    • 한국철도학회논문집
    • /
    • 제20권3호
    • /
    • pp.413-422
    • /
    • 2017
  • 본 연구에서는 네트워크 중심성 지표를 사용하여 지하철 네트워크의 개별 노드의 중요성을 분석하고 이로부터 한국 지하철 네트워크의 특성을 분석하였다. 중심성 측도로 매개, 근접 그리고 차수 중심성을 사용하였다. 본 연구에서는 기존에 제안된 매개 중심성 지표와 승객들의 실제 흐름양을 함께 고려한 가중 매개 중심성 지표를 새롭게 제안하였다. 그리고 본 연구에서 제안한 여러 중심성 지표들 사이의 상관관계를 조사함으로서 서울 수도권 지하철과 승객 흐름의 구조적 특성 등을 조사하였다. 아울러 승객들 흐름의 편중 현상을 조사하기 위하여 멱분포(Power-law) 분석을 수행하여 결과 분석의 신빙성을 더하였다.

적분개념의 발달 (리만적분에서 르베그적분으로의 이행을 중심으로) (Development of the Integral Concept (from Riemann to Lebesgue))

  • 김경화
    • 한국수학사학회지
    • /
    • 제21권3호
    • /
    • pp.67-96
    • /
    • 2008
  • 19세기에 푸리에와 디리클레가 한 개의 식으로 표현되지 않을 수도 있는 "임의의" 함수를 삼각급수로 표현하는 것과 관련하여 연속함수의 적분을 다루었던 코시의 적분보다 더 일반적인 적분의 필요성을 제기하여 리만적분론으로 이끌었다. 한동안 리만적분이 가장 일반적인 적분으로 간주되었고, 이 적분론이 집중적으로 다루어진 결과 리만적분의 약점들이 보였으나, 적어도 초기에는 이것들이 리만적분에 대한 비판으로 보이지 않았다. 그러나 죠르단이 1892년에 용량개념을 소개하며 리만적분론을 측도론적 배경에서 다루었고, 이로부터 몇 년 후에 보렐이 죠르단의 용량론을 측도론으로 발전시킨 후에 르베그가 이 둘의 이론을 합쳐서 지금 "르베그적분"으로 알고 있는 적분의 새 개념을 얻게 되었다.

  • PDF

제2종의 중심합성계획의 통계적 성질 (Statistical Properties of Second Type Central Composite Designs)

  • 김혁주;박성현
    • 응용통계연구
    • /
    • 제19권2호
    • /
    • pp.257-270
    • /
    • 2006
  • Kim(2002)은 축점의 위치가 두 개의 수에 의하여 정해지는 제2종의 중심합성계획을 제시하고 이를 CCD2라 불렀다. 본 논문에서는 CCD2를 더욱 연구하여 몇 가지의 새로운 사실을 밝혔다. 직교성과 회전성, 직교성과 기울기회전성, 회전성과 균등정밀성을 동시에 갖는 CCD2들을 구하였으며, Park과 Kim(1992)이 제시한 기울기회전성의 측도를 이러한 CCD2들에 적용하여 그 결과를 관찰하였다.

강의평가의 타당성과 신뢰성에 관한 연구 전주대학교 강의평가 결과를 중심으로 (A study on validity and reliability of students' evaluation)

  • 이기훈
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권1호
    • /
    • pp.87-98
    • /
    • 2010
  • 본 논문은 강의평가의 타당성과 신뢰성을 측정하는 방법을 소개하고 실제자료를 이용하여 타당성과 신뢰성을 평가하였다. 기존의 강의평가 관련논문이 강의평가에 미치는 외생적인 영향을 통제하는 데 주력한 데 반해, 교원의 신분에 직접적인 영향을 미칠 수 있는 중대한 강의평가가 과연 믿을 만한 평가인가에 관한 근원적인 질문에 답하려 하였다. 전주대학교의 강의평가 결과를 실증 분석한 결과 타당성과 신뢰성 면에서 어느 정도 만족할 만한 수준임을 확인할 수 있었다. 본 논문에서는 기존에 간편하게 사용되던 신뢰성 측도가 아닌 일반화가능도 계수를 이용하여 신뢰성을 평가하는 방법을 자세히 소개하고 그 장점을 설명하였다.

효과적인 패턴분류를 위한 개선된 FCM 기반 하이브리드 네트워크 (Enhanced FCM Based Hybrid Network for Effective Pattern Classification)

  • 김태형;차의영;김광백
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2008년도 제39차 동계학술발표논문집 16권2호
    • /
    • pp.35-40
    • /
    • 2009
  • FCM 알고리즘은 입력 벡터와 각 클러스터의 유클리드 거리를 이용하여 구해진 소속도만를 비교하여 데이터를 분류하기 때문에 클러스터링 된 공간에서의 데이터들의 분포에 따라 바람직하지 못한 클러스터링 결과를 보일 수 있다. 이러한 문제점을 개선하기 위해 대칭적 성질을 이용하는 대칭성 측도에 퍼지 이론을 적용하여 군집간의 거리에 따른 변화와 군집 중심의 위치, 그리고 군집 형태에 따라 영향을 덜 받는 개선된 FCM이 제안되었다. 본 논문에서는 효과적으로 패턴을 분류하기 위해 개선된 FCM 알고리즘을 적용한 개선된 하이브리드 네트워크를 제안한다. 제안된 하이브리드 네트워크는 개선된 FCM 알고리즘을 입력층과 중간층의 학습구조 적용하고 중간층과 출력층의 학습구조는 일반화된 델타학습법을 적용한다. 제안된 방법의 인식성능을 평가하기 위해 2차원 좌표평면 상의 데이터를 기존의 Max_Min 신경망을 이용한 FCM 기반 RBF 네트워크와 FCM 기반 RBF 네트워크, HCM 기반 네트워크와 제안된 방법 간의 학습 및 인식 성능을 비교 및 분석하였다.

  • PDF

개선된 FCM 알고리즘을 이용한 한방의 질병 분류 시스템 (Disease Classification System of Oriental Medicine using Enhanced FCM Algorithm)

  • 장수재;최경열;김광백
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2011년도 춘계학술대회
    • /
    • pp.93-96
    • /
    • 2011
  • 본 논문에서는 개선된 FCM 알고리즘을 적용하여 통계청에서 제공하는 한국 표준 질병 사인 분류표(K.C.D)를 기초로 질병을 분류한 후, 질병을 도출하고 애매한 증상의 차이의 정도를 퍼지 추론기법을 사용하여 정확한 질병 상세를 도출할 수 있는 한방 질병 분류 시스템을 제시한다. 기존의 FCM 알고리즘은 입력 벡터들과 각 군집 중심과의 거리를 이용하여 측정된 유사도에 기초한 목적 함수의 최적화 방식을 사용한다. 하지만 측정된 패턴과 군집 공간상의 패턴들의 분포에 따라 바람직하지 못한 군집화 결과를 보일 수 있다. 따라서 본 논문에서는 군집들의 대칭성 측도에 퍼지 이론을 적용하여 기존의 FCM 알고리즘으로 군집화 한 결과를 재 군집화 하여 군집화의 정확성을 개선시킨 후, 증상의 차이를 구분하기 위해서 애매한 증상의 정도를 퍼지 추론 방법을 적용하여 정확한 질병 상세를 도출할 수 있는 방법을 제시한다. 본 논문에서는 개선된 FCM 알고리즘을 적용하여 질병을 분류한 후, 퍼지 제어 기법으로 질병을 추출함으로써 기존의 한방 자가진단 시스템 보다 정확하게 질병을 도출한 것을 확인하였다.

  • PDF

Entropy에 의한 Randomness 검정법 (A Randomness Test by the Entropy)

  • 최봉대;신양우;이경현
    • 한국정보보호학회:학술대회논문집
    • /
    • 한국정보보호학회 1991년도 학술발표논문집
    • /
    • pp.105-133
    • /
    • 1991
  • 본 논문에서는 임의의 이진 난수발생기의 source가 $BMS_{p}$ 이거나 M-memory를 갖는 마르코프연쇄로 모델화 되었을 경우에 비트당 entropy와 관련이 있는 새로운 randomness에 관한 통계적 검정법을 제안한다. 기존에 알려진 이진 난수발생기의 randomness검정법이 0또는 1의 분포의 편향성(bias)이나 연속된 비트간의 상관성(correlation)중의 한 종류만의 non-randomness를 추적해낼 수 있는 반면에 새로운 검정법은 위의 두가지 검정을 통과하였을 때 암호학적으로 중요한 측도인 비트당 entropy 를 측정하여 암호학적인 약점을 검정할 수 있다. 또한 대칭(비밀키) 암호시스템의 통계적 결점을 바탕으로 하여 키를 찾는 공격자의 최적 전략( optimal strategy)문제를 분석하여 이 최적 전략이 이진 수열의 비트당 entropy와 밀접한 관계가 있음을 보이고 이 비트당 entropy와 관련이 있는 새로운 통계량을 도입하여 이진 난수 발생기의 source의 이진수열이 다음 3가지 경우, 즉, i.i.d. symmetric인 경우, $BMS_{p}$ 인 경우, M-memory를 갖는 마르코프연쇄인 경우의 각각에 대하여 특성을 조사하고 새로운 통계량의 평균과 분산을 구한다. 이때 구한 새로운 통계량은 잘 알려진 중심 극한 정리에 의하여 근사적으로 정규분포를 따르므로 위의 평균과 분산을 이용하여 스트림 암호시스템에서 구성요소로 많이 사용되는 몇 몇 간단한 이진 난수 발생기에 적용하여 통계적 검정을 실시함으로써 entropy 관점의 검정법이 새로운 randomness 검정법으로 타당함을 보인다.

  • PDF

사회네트워크분석과 텍스트마이닝을 이용한 배구 경기력 분석 (Performance analysis of volleyball games using the social network and text mining techniques)

  • 강병욱;허만규;최승배
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권3호
    • /
    • pp.619-630
    • /
    • 2015
  • 본 연구의 목적은 '사회네트워크분석'과 '텍스트마이닝'을 이용하여 국내 남자프로배구 구단의 공격, 패스 패턴을 찾아내고, 배구경기력과 관련된 핵심 키워드 추출하여 경기력을 평가하여 향후 구단의 경기 전력을 수립하는데 기초자료로 활용하는데 있다. 본 연구에서는 '사회네트워크분석'을 통해 도출된 그룹변수들을 '텍스트마이닝' 기법의 결과인 경기의 '승패'에 차이를 검정하기 위해 '0' 그룹 (6명)과 '1' 그룹 (11명)으로 재구성하였다. 연구의 결과로서 '사회네트워크분석'의 연결중심성과 중개중심성의 순위로 판단하면, '0' 그룹 보다 '1' 그룹이 우수한 경기력을 보였다. '사회네트워크분석'에 의해서 재구성된 '0' 그룹과 '1' 그룹에 따라서 '텍스트마이닝'에 의해서 생성된 '승패' 그룹에 대한 유의성 검정 결과 유의한 차이가 있는 것으로 나타났다 (p값: 0.001). '그룹별' 클러스터링 결과, '0' 그룹의 경우 'D' 선수와 'E' 선수가 '세트' 플레이를 통하여 정확하게 득점한다고 할 수 있다. '1' 그룹의 경우 'K' 선수가 '디그'에 의해서 '공격'을 하는 경우 실패하는 경우가 많고, 'C' 선수와 'P' 선수는 '세트' 정확한 플레이를 한 것으로 나타났다.