• 제목/요약/키워드: Similarity measures

검색결과 305건 처리시간 0.025초

Cluster Analysis with Balancing Weight on Mixed-type Data

  • Chae, Seong-San;Kim, Jong-Min;Yang, Wan-Youn
    • Communications for Statistical Applications and Methods
    • /
    • 제13권3호
    • /
    • pp.719-732
    • /
    • 2006
  • A set of clustering algorithms with proper weight on the formulation of distance which extend to mixed numeric and multiple binary values is presented. A simple matching and Jaccard coefficients are used to measure similarity between objects for multiple binary attributes. Similarities are converted to dissimilarities between i th and j th objects. The performance of clustering algorithms with balancing weight on different similarity measures is demonstrated. Our experiments show that clustering algorithms with application of proper weight give competitive recovery level when a set of data with mixed numeric and multiple binary attributes is clustered.

공동주택 소음에 대한 감성 평가 (IDENTIFYING EMOTIONAL ELEMENTS OF APARTMENT NOISE)

  • 민윤기;은희준;조문재;손진훈
    • 한국감성과학회:학술대회논문집
    • /
    • 한국감성과학회 1999년도 춘계학술발표논문집 논문집
    • /
    • pp.39-44
    • /
    • 1999
  • The purpose of this study was to extract emotional dimensions from Korean adjectives relating to apartment noise. Noise-related 296 Korean adjectives were extracted from a dictionary and three evaluators selected 96 adjectives from those by removing very similar ones in meaning. Two types of 96 7-point scales were conducted to college students for evaluation, whether each adjective describes apartment noise appropriately. From this evaluation, 28 adjectives having above 4.5 points were selected. Again, 8 different types of 7-point scales on 378 adjective pairs(28 x 27/2) were administrated to separate college students to evaluate the degree of similarity between 28 adjectives. Based upon this evaluation, 14 adjectives were finally selected and scores on similarity sere analyzed through two different statistical analyses (Multi-dimensional scale and Cluster analysis). The results showed that three dimensions (displeasure, sensitivity and perceived loudness) exist in peoples' emotional response state to apartment noise. The previous studies have treated annoyance and sensitivity as separate measures to noise. However, this study showed that these two factors were on the same emotional dimension labeled as 'sensitivity' In addition, new dimension, labeled as 'displeasure', was found.

  • PDF

공통 Phrase의 관계 그래프와 Suffix Tree 문서 모델을 이용한 문서 군집화 기법 (Document Clustering with Relational Graph Of Common Phrase and Suffix Tree Document Model)

  • 조윤호;이상근
    • 한국콘텐츠학회논문지
    • /
    • 제9권2호
    • /
    • pp.142-151
    • /
    • 2009
  • 기존의 문서 군집화 기법 NSTC은 문서 군집화 과정 내에서 TF-IDF를 이용하여 문서간 유사도를 측정한다. 본 논문에서는 TF-IDF가 아닌, 공통 Phrase의 관계 그래프를 이용한 새로운 문서간 유사도 측정을 제안한다. 이 방법은 문서 집합 내의 공통 Phrase들의 관계를 나타낸 관계 그래프를 통해 공통 Phrase의 가중치를 부여하는 방법을 제시한다. 또한 실험을 통해 NSTC와 비교하여 본 논문에서 제안한 문서간 유사도 측정 기법이 문서 군집화에 더욱 효과적임을 보였다.

Video Content Indexing using Kullback-Leibler Distance

  • Kim, Sang-Hyun
    • International Journal of Contents
    • /
    • 제5권4호
    • /
    • pp.51-54
    • /
    • 2009
  • In huge video databases, the effective video content indexing method is required. While manual indexing is the most effective approach to this goal, it is slow and expensive. Thus automatic indexing is desirable and recently various indexing tools for video databases have been developed. For efficient video content indexing, the similarity measure is an important factor. This paper presents new similarity measures between frames and proposes a new algorithm to index video content using Kullback-Leibler distance defined between two histograms. Experimental results show that the proposed algorithm using Kullback-Leibler distance gives remarkable high accuracy ratios compared with several conventional algorithms to index video content.

함수의 정의역 변형에 의한 신호간의 거리 측정 방법 (A Modified Domain Deformation Theory for Signal Classification)

  • 김성수
    • 대한전기학회논문지:전력기술부문A
    • /
    • 제48권3호
    • /
    • pp.342-349
    • /
    • 1999
  • The metric defined on the domain deformation space better measures the similarity between bounded and continuous signals for the purpose of classification via the metric distances between signals. In this paper, a modified domain deformation theory is introduced for one-dimensional signal classification. A new metric defined on a modified domain deformation for measuring the distance between signals is employed. By introducing a newly defined metric space via the newly defined Integra-Normalizer, the assumption that domain deformation is applicable only to continuous signals is removed such that any kind of integrable signal can be classified. The metric on the modified domain deformation has an advantage over the $L^2$ metric as well as the previously introduced domain deformation does.

  • PDF

다중영상 영역기반 영상정합을 위한 유사성 측정방법 분석 (An Analysis of Similarity Measures for Area-based Multi-Image Matching)

  • 노명종;김정섭;조우석
    • 한국측량학회지
    • /
    • 제30권2호
    • /
    • pp.143-152
    • /
    • 2012
  • 항공영상을 이용하여 수치표면자료와 같은 3차원 자료를 자동으로 제작하기 위해서는 영상정합이 반드시 필요하다. 최근 사용되고 있는 항공 디지털 프레임 영상은 과거의 아날로그 영상에 비해 폐색지역이 적은 고중복도 다중 스트립 영상으로 촬영되기에 용이하다. 최근 다중 스트립 영상을 이용한 다중영상정합 기법에 대한 연구가 많이 이루어지고 있으며, 특히 각 영상에서 추출된 점(point feature)이나 형상(linear feature)의 유사성 측정 방법에 대한 연구가 진행되고 있다. 본 연구에서는 수직궤적 기반 다중영상정합을 대상으로 영역기반 유사성 측정 방법으로 SNCC(Sum of Normalized Cross-Correlation)와 SSD(Sum of Squared-Difference) 방법을 비교 분석하였다. 또한 영역기반 유사성 측정에 필요한 요소로 영상의 화소값, 화소값 기울기 강도, 화소값과 화소값 기울기 강도 평균을 각각 사용하여 결과를 비교하였다. 이 외에도 영역기반 유사성 측정에서 중요한 요소인 기준 윈도우의 크기를 비정규 적응형 기준 윈도우 방법과 정규 적응형 윈도우 방법을 적용하여 결과를 비교 분석하였다. 실험을 위하여 사용된 항공영상은 ZI Imaging 사의 DMC (Digital Modular Camera)에 의해 종중복도는 80%, 횡중복도는 60%로 촬영되었으며, 3개의 스트립으로 구성되었다. 다양한 방법으로 실험을 수행한 결과에 따르면 유사성 측정 방법으로는 SNCC, 유사성 측정 요소로는 화소값과 화소값 기울기 강도 평균, 그리고 비정규 적응형 기준 윈도우가 수직궤적 기반 다중영상정합의 영역기반 유사성 측정에 가장 적합하다는 것을 확인하였다.

단어 임베딩 및 벡터 유사도 기반 게임 리뷰 자동 분류 시스템 개발 (Development of An Automatic Classification System for Game Reviews Based on Word Embedding and Vector Similarity)

  • 양유정;이보현;김진실;이기용
    • 한국전자거래학회지
    • /
    • 제24권2호
    • /
    • pp.1-14
    • /
    • 2019
  • 게임은 소프트웨어 특성상 출시 후 사용자들의 반응을 빠르게 파악하여 개선하는 것이 중요하다. 하지만 구글 플레이 앱 스토어 등 사용자들이 게임을 다운로드하고 리뷰를 올릴 수 있는 대부분의 사이트들은 게임 리뷰에 대한 매우 제한적이고 모호한 분류 기능만을 제공한다. 따라서 본 논문에서는 사용자들이 사이트에 올린 게임 리뷰를 보다 명확하고 운영에 유용한 주제들로 자동 분류하는 시스템을 개발한다. 본 논문에서 개발한 시스템은 리뷰에 포함된 단어들을 대표적인 단어 임베딩 모델인 word2vec을 사용하여 벡터들로 변환하고, 이 벡터들과 각 주제 간 유사도를 측정하여 해당 리뷰를 관련된 주제로 분류한다. 특히 분류 성능에 직접적인 영향을 미치는 벡터 간 유사도 측정 방법을 선택하기 위해 본 연구에서는 대표적인 벡터 간 유사도 측정 방법인 유클리디안 유사도, 코사인 유사도, 확장된 자카드 유사도의 성능을 실제 데이터를 사용하여 비교하였다. 또한 어떤 리뷰가 둘 이상의 주제에 해당하는 경우를 위해 임계값에 기반한 다중 분류 방법을 사용하였다. 구글 플레이 앱스토어의 실제 데이터를 사용한 실험 결과 본 시스템은 95%까지의 정확도를 보임을 확인하였다.

표상 유사성 분석을 이용한 감각양상에 따른 정서표상 모델과 정서가 모델의 검증 (Testing Modality-Generality and Valence Models using Representational Similarity Analysis)

  • 김현중;김종완
    • 감성과학
    • /
    • 제26권2호
    • /
    • pp.25-38
    • /
    • 2023
  • 정서표상에 대한 논의 중 첫 번째는 정서가 차원에서의 정서표상, 두 번째는 감각양상에 따른 정서표상을 설명하는 것이다. 선행연구에서는 정서표상을 설명하기 위해 정서가 모델(부호 정서가, 비부호 정서가), 감각양상에 따른 정서표상 모델(감각보편성, 감각특징성)들이 제시되었다. 본 연구에서는 최근에 등장한 ASMR을 이용하여 기존 연구에서 제시된 모델들을 비교하여 어떠한 모델이 정서표상을 잘 설명하는지 확인하고자 하였다. 본 연구에서 사용한 자료는 Kim & Kim(2022)에서 수집한 3개의 정서유형(부정, 중립, 긍정) 및 2개의 감각양상(청각, 시청각)으로 구분된 ASMR 자극에 대한 정서평정자료를 사용하였다. 이후, 해당 자료에 대한 다차원척도법, 표상 유사성 분석 및 이원 변량분석, 다중회귀분석 및 이원 변량분석을 실시하였다. 다차원척도법 결과, 비부호 정서가에 비해 부호 정서가, 감각특징성에 비해 감각보편성에서 자극의 정서유형 간 구분이 잘 이루어졌다. 다차원척도법 결과와 유사하게, 표상 유사성 분석 및 다중회귀분석 결과 또한 비부호 정서가에 비해 부호 정서가, 감각특징성에 비해 감각보편성이 유의하게 정서표상을 잘 설명하였다. 이러한 결과는 정서가 모델 중 1차원의 양극단에 긍정과 부정이 위치하는 모델이 ASMR에 대한 정서표상을 잘 설명하며, 감각양상과 상관없이 정서표상이 일관적임을 시사한다.

Design of A Personalized Classifier using Soft Computing Techniques and Its Application to Facial Expression Recognition

  • Kim, Dae-Jin;Zeungnam Bien
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 ISIS 2003
    • /
    • pp.521-524
    • /
    • 2003
  • In this paper, we propose a design process of 'personalized' classification with soft computing techniques. Based on human's thinking way, a construction methodology for personalized classifier is mentioned. Here, two fuzzy similarity measures and ensemble of classifiers are effectively used. As one of the possible applications, facial expression recognition problem is discussed. The numerical result shows that the proposed method is very useful for on-line learning, reusability of previous knowledge and so on.

  • PDF

Tolerance Rough Set Approaches in the Classification of Multi-Attribute Data

  • Lee, Jaeik;Suh Kapsun;Suh, Yong-Soo
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 1997년도 추계학술대회 학술발표 논문집
    • /
    • pp.419-423
    • /
    • 1997
  • This paper is concerned about the classification of objects together with muti-attributes such as remote sensing image data by using tolerance rough set. To produce more reliable relations from given attributes in the data, we define new similarity measures by using scaling. Our Method will be applied to classify multi-spectral image data.

  • PDF