• Title/Summary/Keyword: 평가규칙

Search Result 1,025, Processing Time 0.035 seconds

The proposition of attributably pure confidence in association rule mining (연관 규칙 마이닝에서 기여 순수 신뢰도의 제안)

  • Park, Hee-Chang
    • Journal of the Korean Data and Information Science Society
    • /
    • v.22 no.2
    • /
    • pp.235-243
    • /
    • 2011
  • The most widely used data mining technique is to explore association rules. This technique has been used to find the relationship between each set of items based on the association thresholds such as support, confidence, lift, etc. There are many interestingness measures as the criteria for evaluating association rules. Among them, confidence is the most frequently used, but it has the drawback that it can not determine the direction of the association. The net confidence measure was developed to compensate for this drawback, but it is useless in the case that the value of positive confidence is the same as that of negative confidence. This paper propose a attributably pure confidence to evaluate association rules and then describe some properties for a proposed measure. The comparative studies with confidence, net confidence, and attributably pure confidence are shown by numerical example. The results show that the attributably pure confidence is better than confidence or net confidence.

TF-IDF Based Association Rule Analysis System for Medical Data (의료 정보 추출을 위한 TF-IDF 기반의 연관규칙 분석 시스템)

  • Park, Hosik;Lee, Minsu;Hwang, Sungjin;Oh, Sangyoon
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.5 no.3
    • /
    • pp.145-154
    • /
    • 2016
  • Because of the recent interest in the u-Health and development of IT technology, a need of utilizing a medical information data has been increased. Among previous studies that utilize various data mining algorithms for processing medical information data, there are studies of association rule analysis. In the studies, an association between the symptoms with specified diseases is the target to discover, however, infrequent terms which can be important information for a disease diagnosis are not considered in most cases. In this paper, we proposed a new association rule mining system considering the importance of each term using TF-IDF weight to consider infrequent but important items. In addition, the proposed system can predict candidate diagnoses from medical text records using term similarity analysis based on medical ontology.

The Effects of Sujective Knowledge on Information Search and Evaluation Rules for Apparel Products (의류제품에 대한 주관적 지식이 정보탐색과 평가규칙에 미치는 영향)

  • 김은영;이영선
    • Journal of the Korean Society of Clothing and Textiles
    • /
    • v.26 no.9
    • /
    • pp.1378-1389
    • /
    • 2002
  • This study was to identify dimensions of subjective knowledge and to test the structural model of the effect of subjective knowledge on information search and evaluation rules for apparel products. A questionnaire was administered to 668 females living in Seoul, Taejon, and Cheongju, and the data were analysed by using LISREL 8. The results of this study were as follows: First, consumers' subjective knowledge regarding apparel products consisted of five factors; Style knowledge, Fashion Knowledge, Store Knowledge, Fabric/Management Knowledge, and Brand knowledge. Those factors were influenced by the experience related with apparel products. Second, the subjective knowledge influenced information searches. That is, internal search was significantly influenced by fashion knowledge and store knowledge, while external search was significantly influenced by fashion knowledge and fabric/management knowledge. Third, the subjective knowledge had indirect effects on evaluation rules via search activities (e.g., internal and external), suggesting that the internal search was mediated in relationship between subjective knowledge and compensatory rule, while the urtemal search was mediated in the relationship between subjective knowledge and noncompensatory rule. Therefore, this study implies that subjective knowledge plays an important role to explain consumers' decision making processes such as information search and evaluation.

Part-of-Speech Tagging Using Complemental Characteristics of Linguistic Knowledge and Stochastic Information (언어 지식과 통계 정보의 보완적 특성을 이용한 품사 태깅)

  • Lim, Heui-Seok;Kim, Jin-Dong;Rim, Hae-Chang
    • Annual Conference on Human and Language Technology
    • /
    • 1997.10a
    • /
    • pp.102-108
    • /
    • 1997
  • 기존의 품사 태깅 방법에서 독립적으로 사용해온 언어 지식과 통계 정보는 품사 태깅의 정확도와 처리 범위의 향상을 위해서 상호 보완적인 특성을 갖는다. 이에 본 논문은 언어 지식과 통계 정보의 보완적 특성을 이용한 규칙 우선 직렬 품사 태깅 방법을 제안한다. 제안된 방법은 언어 지식에 의한 품사 태깅 결과를 선호함으로써 규칙 기반 품사 태깅의 정확도를 유지하며, 언어 지식에 의해서 모호성이 해소되지 않은 어절에 통계 정보에 의한 품사 태깅 결과를 할당함으로써 통계 기반 품사 태깅의 처리 범위를 유지한다. 또한, 수정 언어 지식에 의해 태깅 결과의 오류를 보정함으로써 품사 태깅의 정확도를 향상시킨다. 약 2만 어절 크기의 외부 평가 코퍼스에 대해 수행된 실험 결과, 규칙 우선 직렬 품사 태깅 시스템은 통계 정보만을 이용한 품사 태깅의 정확도보다 32.70% 향상된 95.43%의 정확도를 보였다.

  • PDF

Optimal Design of Interval Type-2 Fuzzy Set-based Multi-Output Fuzzy Neural Networks (다중 출력을 가지는 Interval Type-2 퍼지 집합 기반 퍼지 뉴럴 네트워크 최적 설계)

  • Park, Keon-Jun;Kim, Yong-Kab;Oh, Sung-Kwun;Kim, Hyun-Ki
    • Proceedings of the KIEE Conference
    • /
    • 2011.07a
    • /
    • pp.1968-1969
    • /
    • 2011
  • 본 논문에서는 패턴 인식을 위한 다중 출력을 가지는 Interval Type-2 퍼지 집합을 이용한 퍼지 집합 기반 퍼지 뉴럴 네트워크를 소개한다. Interval Type-2 퍼지 집합 기반 퍼지 뉴럴 네트워크는 각 입력 변수에 따른 서로 분리된 입력 공간을 분할함으로서 네트워크 및 규칙을 구성한다. 규칙의 전반부는 퍼지 입력 공간을 개별적으로 분할하여 표현하고, 각 공간은 Interval Type-2 퍼지 집합으로 구성된다. 규칙의 후반부는 패턴 인식을 위한 다중 출력을 가지며 Interval 집합을 이용하여 다항식으로서 표현된다. 다항식의 계수인 연결가중치는 오류역 전파 알고리즘을 이용하여 학습한다. 또한 실수 코딩 유전자 알고리즘을 이용하여 제안된 네트워크를 최적화한다. 제안된 네트워크는 표준 모델로서 널리 사용되는 수치적인 예를 통하여 평가한다.

  • PDF

Design of Interval Type-2 Fuzzy Set-based Fuzzy Neural Network and Its Optimization (Interval Type-2 퍼지 집합 기반 퍼지뉴럴네트워크 설계 및 최적화)

  • Park, Keon-Jun;Oh, Sung-Kwun;Kim, Hyun-Ki
    • Proceedings of the KIEE Conference
    • /
    • 2009.07a
    • /
    • pp.1901_1902
    • /
    • 2009
  • 본 논문에서는 Interval Type-2 퍼지 집합을 이용한 퍼지집합 기반 퍼지뉴럴네트워크를 설계하고 최적화한다. Interval Type-2 퍼지뉴럴네트워크는 각 입력 변수에 따른 서로 분리된 입력 공간을 분할함으로서 네트워크 및 규칙을 구성한다. 규칙의 전반부는 퍼지 입력 공간을 개별적으로 분할하여 표현하고, 각 공간은 Interval Type-2 퍼지 집합으로 구성된다. 규칙의 후반부는 Interval 집합을 이용하여 다항식으로서 표현되며, 오류역전파 알고리즘을 이용하여 연결가중치인 후반부 다항식을 학습한다. 또한, 각 입력에 대한 전반부 멤버쉽함수의 정점과 불확실성 계수 그리고 학습률 및 모멘텀 계수를 유전자 알고리즘을 이용하여 최적 동조한다. 제안된 네트워크는 표준 모델로서 널리 사용되는 수치적인 예를 통하여 평가한다.

  • PDF

Nonlinear System Modeling Using Bacterial Foraging and FCM-based Fuzzy System (Bacterial Foraging Algorithm과 FCM 기반 퍼지 시스템을 이용한 비선형 시스템 모델링)

  • Jo Jae-Hun;Jeon Myeong-Geun;Kim Dong-Hwa
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2006.05a
    • /
    • pp.121-124
    • /
    • 2006
  • 본 논문에서는 Bacterial Foraging Algorithm과 FCM(fuzzy c-means)클러스터링을 이용하여 TSK(Takagi-Sugeno-Kang)형태의 퍼지 규칙 생성과 퍼지 시스템(FCM-ANFIS)을 효과적으로 구축하는 방법을 제안한다. 구조동정에서는 먼저 PCA(Principal Component Analysis)을 이용하여 입력 데이터 성분간의 상관관계를 제거한 후에 FCM을 이용하여 클러스터를 생성하고 성능지표에 근거해서 타당한 클러스터의 수, 즉 퍼지 규칙의 수를 얻는다. 파라미터 동정에서는 Bacterial Foraging Algorithm을 이용하여 전제부 파라미터를 최적화 시킨다. 결론부 파라미터는 RLSE(Recursive Least Square Estimate)에 의해 추정되어진다. PCA(Principal Component Analysis)와 FCM을 적용함으로써 타당한 규칙 수를 생성하였고 Bacterial Foraging Algorithm을 이용하여 최적의 전제부 파라미터를 구하였다. 제안된 방법의 성능을 평가하기 위하여 Box-Jenkins의 가스로 데이터와 Rice taste 데이터의 모델링에 적용하였고 우수한 성능을 보임을 알 수 있었다.

  • PDF

Algorithm for Extraction of Large itemsets (빈발 항목집합 추출을 위한 알고리즘)

  • Chai, Duck-Jin;Hwang, Bu-Hyun
    • Annual Conference of KIPS
    • /
    • 2000.10a
    • /
    • pp.117-120
    • /
    • 2000
  • 데이터 마이닝이란 대량의 실제 데이터로부터, 이전에 잘 알려지지는 않았지만, 잠재적으로 유용한 정보를 추출하는 작업이라 정의한다. 데이터 마이닝 기술 중에서 현재 가장 활발하게 연구되고 있는 것들 중의 하나가 연관 규칙 탐사이다. 연관 규칙이란 어떤 사건이 일어나면 다른 사건이 일어나는 관련성을 의미한다. 기존의 연관 규칙을 발견하기 위한 알고리즘들은 k-빈발 항목집합을 추출하기 위하여 k-후보 항목집합의 개수를 줄이거나 데이터베이스의 크기를 줄이는데 많은 연구가 이루어져 오고 있다. 본 논문에서는 상대적으로 많은 후보 항목집합의 데이터베이스 스캔을 통하여 추출되는 2-빈발 항목집합은 해쉬 기법을 사용하여 추출하고 k(k>2)-빈발 항목집합은 데이터베이스를 전처리하여 트랜잭션의 길이에 따라 두 개의 트랜잭션 집합으로 분리하고 분리된 데이터베이스에 다른 알고리즘을 사용하여 빈발 항목집합을 찾는 알고리즘을 제안한다. 그리고 성능 평가를 통하여 제안하는 방법의 성능 및 타당성을 보인다.

  • PDF

Fuzzy Rule-based Summarization of Event Sequences in an Indoor Multi-camera Environment (실내 멀티카메라 환경에서의 퍼지 규칙 기반 이벤트 시퀀스 요약)

  • Park, Han-Saem;Cho, Sung-Bae
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.10c
    • /
    • pp.288-292
    • /
    • 2007
  • 최근 동영상 데이터의 폭발적인 증가와 함께 이의 요약을 위한 연구가 활발히 이루어지고 있다. 동영상 데이터 수집 과정에서 하나의 카메라가 아닌 멀티 카메라를 활용하는 경우도 늘고 있는데 이들 대부분은 실내에서 넓은 영역을 커버하거나 물체를 추적하기 위한 목적으로 멀티 카메라 시스템을 사용하였다. 본 논문에서는 하나의 이벤트를 여러 방향으로부터 입력하여 하나의 대상에 대한 다양한 시각과 정보에 초점을 맞추며, 이를 바탕으로 수집된 이벤트 시퀀스에 대한 문제를 다룬다. 과정은 여러 개의 카메라 뷰 가운데 최적의 뷰를 선택하는 카메라 뷰 선택과정과, 그렇게 만들어진 하나의 전체 시퀀스를 요약하는 과정으로 나누어진다. 본 논문에서는 사용자 조사 및 분석을 통해 얻은 사용자 선호도 통계 정보로부터 카메라 뷰 선택을 위한 규칙을 획득하였고, 사람의 의사결정과정을 모방하고자 퍼지 규칙기반 시스템을 사용하여 이벤트를 평가한 후 그 점수에 근거한 요약을 수행하였다.

  • PDF

BMAP/PH/N Queueing Model with Retrial and Losses (재시도와 손실을 고려한 BMAP/PH/N 대기모형 분석)

  • Kim, Che-Soong
    • Journal of Korean Society of Industrial and Systems Engineering
    • /
    • v.29 no.1
    • /
    • pp.41-46
    • /
    • 2006
  • 본 논문에서는 재시도와 완전입력 규칙을 갖는 BMAP/PH/N/0 대기시스템에 대한 주요 성능평가척도와 시스템의 정상상태 조건을 제시한다. 고려되는 시스템은 모든 서버가 서비스를 하고 있을 경우 도착이 이루어지는 배치도착은 모두 손실되며, 반대의 경우 도착하는 배치는 서비스를 받기 위해 시스템에 들어가게 된다. 만약 쉬고 있는 서버의 수가 불충분하여 배치의 일부가 즉각 서비스를 받을 수 없다면, 일단 오빗으로 이동하고 표준 재시도 대기 시스템의 규칙에 따라 후에 서비스를 받게 된다. 본 논문에서는 배치 마코프도착과정, 단계 서비스분포 및 유한버퍼를 갖는 다중서버 재시도 대기 시스템에 대한 수리모형을 제시한다. 제시된 시스템의 정상상태 분포 존재를 위한 충분조건을 유도하고, 이 분포를 계산하기 위한 알고리즘이 제시된다. 끝으로 완전입력규칙을 갖는 시스템에 대한 손실확률을 계산하기 위한 식이 유도하고, 수치 예제들을 제시한다.