• 제목/요약/키워드: Statistical similarity

검색결과 311건 처리시간 0.025초

한국어 퍼지 언어변수를 이용한 리스크 평가의 논리적 일관성 (Logical Consistency in Risk Assessment using the Korean Fuzzy Linguistic Variables)

  • 임현교;변상훈
    • 한국안전학회지
    • /
    • 제31권4호
    • /
    • pp.120-125
    • /
    • 2016
  • Usually, a risk can be expressed as a product of likelihood and consequence of a hazard factor. Therefore, conventional risk assessment is carried out by frequency analysis and severity analysis, in turns. However, it is well known that intuitive thinking is another excellent way of thinking of human beings. This study aimed to confirm whether there exist any difference in risk assessment results derived by two different procedures - intuitive and analytical. Thus, the present study showed 10 different illustrations to 30 undergraduate students. Their responses were organized as fuzzy membership functions, and summarized as risk assessments, and compared. The results were also verified with the help of statistical hypothesis testing, which showed no significant difference. On the contrary, however, similarity measure used in fuzzy set theory was not credible as anticipated. Many cases failed to satisfy statistical hypothesis even with similarity measure higher than 0.60 so that only a trend could be accepted. In addition, a subject showed a somewhat consistent logical discrepancy in his response, which implied the necessity of sincere analysis in fuzzy formulations.

패턴매칭을 이용한 유사도 비교 분석 (A Similarity Valuating System using The Pattern Matching)

  • 고방원;김영철
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권1호
    • /
    • pp.185-192
    • /
    • 2010
  • 본 논문에서는 서로 다른 두 개의 문서에 등장하는 패턴 매칭을 이용하여 유사도를 평가하는 시스템을 제안한다. 기존의 문서들의 유사도를 평가하는 방법에는 지문법과 같은 통계적 방법을 주로 이용하였다. 하지만 이 방법은 관련이 없는 두 문서에서 우연히 유사한 단어가 많이 등장 할 때 유사성이 높게 나오는 정확성의 문제점이 있다. 이러한 문제점은 단순히 두 문서의 통계적인 수치를 비교하기 때문에 발생한다. 하지만 본 논문에서 제시하는 패턴을 이용한 방법은 일치하는 패턴을 검색하여 유사성을 판별하기 때문에 이러한 문제를 해결하였다. 하지만 패턴을 검색하는 시간이 오래 걸리는 단점이 있는데 이를 개선하는 알고리즘 또한 본문에서 소개한다.

A Heuristic Methodology for Fault Diagnosis using Statistical Patterns

  • Kwon, Young-il;Song, Suh-ill
    • 품질경영학회지
    • /
    • 제21권2호
    • /
    • pp.17-26
    • /
    • 1993
  • Process fault diagnosis is a complicated matter because quality control problems can result from a variety of causes. These causes include problems with electrical components, mechanical components, human errors, job justification errors, and air conditioning influences. In order to make the system run smoothly with minimum delay, it is necessary to suggest heuristic remedies for the detected faults. Hence, this paper describes a heuristic methodology of fault diagnosis that is performed using statistical patterns generated by quality characteristics The proposed methodology is described briefly as follows: If a sample pattern generated by random variables is similar to the number of prototype patterns, the sample pattern may be matched by any prototype pattern among them to be resembled. This concept is based on the similarity between a sample pattern and the matched prototype pattern. The similarity is calculated as the weighted average of squared deviation, which is expressed as the difference between the relative values of standard normal distribution to be transformed by the observed values of quality characteristics in a sample pattern and the critical values of the corresponding ones in a matched prototype pattern.

  • PDF

Cluster Analysis with Balancing Weight on Mixed-type Data

  • Chae, Seong-San;Kim, Jong-Min;Yang, Wan-Youn
    • Communications for Statistical Applications and Methods
    • /
    • 제13권3호
    • /
    • pp.719-732
    • /
    • 2006
  • A set of clustering algorithms with proper weight on the formulation of distance which extend to mixed numeric and multiple binary values is presented. A simple matching and Jaccard coefficients are used to measure similarity between objects for multiple binary attributes. Similarities are converted to dissimilarities between i th and j th objects. The performance of clustering algorithms with balancing weight on different similarity measures is demonstrated. Our experiments show that clustering algorithms with application of proper weight give competitive recovery level when a set of data with mixed numeric and multiple binary attributes is clustered.

A Study on Decision Tree for Multiple Binary Responses

  • Lee, Seong-Keon
    • Communications for Statistical Applications and Methods
    • /
    • 제10권3호
    • /
    • pp.971-980
    • /
    • 2003
  • The tree method can be extended to multivariate responses, such as repeated measure and longitudinal data, by modifying the split function so as to accommodate multiple responses. Recently, some decision trees for multiple responses have been constructed by Segal (1992) and Zhang (1998). Segal suggested a tree can analyze continuous longitudinal response using Mahalanobis distance for within node homogeneity measures and Zhang suggested a tree can analyze multiple binary responses using generalized entropy criterion which is proportional to maximum likelihood of joint distribution of multiple binary responses. In this paper, we will modify CART procedure and suggest a new tree-based method that can analyze multiple binary responses using similarity measures.

Study on a Measurement of Disclosure Risk of Microdata by Similarity

  • Cho, Hyeon-Kwan;Kwon, Dae-Hong;Lee, Suk-Hoon
    • 응용통계연구
    • /
    • 제25권5호
    • /
    • pp.743-755
    • /
    • 2012
  • Researchers using various of statistical data want to obtain microdata for a detailed analysis. Institutes need to provide microdata after masking processes for sensitive data. Many researchers have used the proportion of unique identity for the measurement of disclosure risk. We proposed a new measurement of disclosure risk that considers the case that all identities are the same or similar. As an application example, we compare the newly proposed measurement and the existing measurement using 10667 data in 'Korea Household Income and Expenditure Survey data for 2010'.

A New Similarity Measure Based on Intraclass Statistics for Biometric Systems

  • Lee, Kwan-Yong;Park, Hye-Young
    • ETRI Journal
    • /
    • 제25권5호
    • /
    • pp.401-406
    • /
    • 2003
  • A biometric system determines the identity of a person by measuring physical features that can distinguish that person from others. Since biometric features have many variations and can be easily corrupted by noises and deformations, it is necessary to apply machine learning techniques to treat the data. When applying the conventional machine learning methods in designing a specific biometric system, however, one first runs into the difficulty of collecting sufficient data for each person to be registered to the system. In addition, there can be an almost infinite number of variations of non-registered data. Therefore, it is difficult to analyze and predict the distributional properties of real data that are essential for the system to deal with in practical applications. These difficulties require a new framework of identification and verification that is appropriate and efficient for the specific situations of biometric systems. As a preliminary solution, this paper proposes a simple but theoretically well-defined method based on a statistical test theory. Our computational experiments on real-world data show that the proposed method has potential for coping with the actual difficulties in biometrics.

  • PDF

분야간 유사도와 통계기법을 이용한 전문용어의 자동 추출 (Automatic Term Recognition using Domain Similarity and Statistical Methods)

  • 오종훈;이경순;최기선
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권4호
    • /
    • pp.258-269
    • /
    • 2002
  • 지금까지 전문용어를 자동으로 추출 (Automatic Term Recognition: ATR)하기 위한 많은 연구들이 있어 왔다. 이들 연구들은 주로 문서 내의 용어의 빈도수와 같은 단순한 통계정보를 이용하여 전문용어를 추출하였다. 하지만 전문분야의 기계가독형 사전의 구축으로 인하여 전문용어를 추출하는 데 있어 전문분야 사전의 사용이 가능하게 되었다. 본 논문에서는 이러한 기계가독형 전문분야 사전들을 이용하여 사전 간의 계층관계를 구축하고 이를 이용하여 전문용어를 추출하는 방법을 제시한다. 또한 전문용어 사전에서 나타나지 않는 전문용어를 추출하기 위하여 용어의 빈도수, 외래어 및 외국어, 내포관계 등을 포함한 통계기법을 이용한다. 본 논문에서 제안하는 기법은 기존의 방법에 비해 좋은 성능을 나타내었다.

비선형 평활화와 통계적 상관성에 기반을 둔 인식성능 개선 (An Improvement of Recognition Performance Based on Nonlinear Equalization and Statistical Correlation)

  • 신현수;조용현
    • 한국지능시스템학회논문지
    • /
    • 제22권5호
    • /
    • pp.555-562
    • /
    • 2012
  • 본 논문에서는 영상의 비선형 평활화와 특징들의 통계적 상관성에 기반을 둔 조합형 인식성능 개선기법을 제안하였다. 여기서 비선형 평활화는 로지스틱 함수에 기반을 둔 히스토그램 재조정의 전처리 기법으로 영상의 밝기를 조정하여 화질을 개선하기 위함이다. 통계적 상관성은 정규상호상관계수에 의해 측정되며, 이는 유사도를 좀 더 빠르고 정확하게 측정하기 위함이다. 또한 독립성분분석에 의한 국부적인 특징들을 대상으로 정규상호상관을 계산함으로써 좀 더 정확한 유사도를 통계적으로 측정하기 위함이다. 제안된 기법을 30개 40*50픽셀의 명암도 변화를 가지는 얼굴영상들을 대상으로 실험한 결과, 전처리를 하지 않은 기법이나 기존 및 적응적 변형히스토그램 평활화에 의한 전처리 기법에 비해 각각 영상의 속성을 잘 반영한 우수한 인식성능이 있음을 확인하였다.

자가 표본 기반 단일 영상 초해상도 복원을 위한 혼합 놈 패치 유사도 검색 (Mixed-Norm Patch Similarity Search for Self-Example-based Single Image Super-Resolution)

  • 오종근;홍민철
    • 전기전자학회논문지
    • /
    • 제22권2호
    • /
    • pp.491-494
    • /
    • 2018
  • 본 논문은 표본 기반 단일 영상 초해상도 복원 방식의 성능 개선을 위한 혼합 놈을 이용한 패치 유사도 검색 방식에 대해 제안한다. 초해상도 영상 복원 과정에서 패치의 국부 통계 특성을 반영하기 위해 패치 경사도에 따른 놈의 차수를 결정하고, 놈의 차수를 패치간의 유사도 검색을 위한 함수로 사용하는 방식에 대해 제안한다. 실험 결과를 통해 제안하는 유사도 검색 방식은 기존 검색 방식의 성능을 개선할 수 있는 능력이 있음을 확인할 수 있었다.