• Title/Summary/Keyword: 유사거리

Search Result 1,257, Processing Time 0.034 seconds

A Study on Integrating Similarities (유사도 통합에 관한 연구)

  • Kim, Sunkyung;Park, Ji Su;Shon, Jin Gon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.11a
    • /
    • pp.53-56
    • /
    • 2020
  • 유사도는 두 객체의 비슷한 정도를 실수로 나타낸 것이며 반대 개념인 다른 정도를 나타내는 것을 거리라 한다. 실세계에서 정확히 같은 것은 존재하기 힘들기 때문에 많은 응용 분야에서 유사도나 거리를 이용한다. 거리 중 대표적인 것으로 유클리드 공간에서 두 점 사이의 직선거리이다. 이 거리를 유클리드 거리라고 한다. 코사인 유사도는 벡터 공간에서 두 벡터 사이각의 코사인 값이다. 이외에도 용도에 따라 다양한 거리 또는 유사도가 연구되고 있다. 수학적으로 유사도는 이변수 함수로 나타낸다. 앞선 연구에서 민코프스키는 맨하탄 거리, 유클리드 거리 등을 매개변수 p를 이용하여 하나의 식으로 통합하였다. 이러한 유사도 통합은 유사도에 대한 새로운 통찰력을 제공하고 또 다른 응용을 제공한다. 본 논문은 기존 유사도의 의미를 개관하고 추가적인 매개변수를 도입하여 민코프스키 거리와 코사인 유사도를 통합한 식을 제시한다.

A distance metric of nominal attribute based on conditional probability (조건부 확률에 기반한 범주형 자료의 거리 측정)

  • 이재호;우종하;오경환
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2003.09b
    • /
    • pp.53-56
    • /
    • 2003
  • 유사도 혹은 자료간의 거리 개념은 많은 기계학습 알고리즘에서 사용되고 있는 중요한 측정개념이다 하지만 입력되는 자료의 속성들중 순서가 정의되지 않은 범주형 속성이 포함되어 있는 경우, 자료간의 유사도나 거리 측정에 어려움이 따른다. 비거리 기반의 알고리즘들의 경우-C4.5, CART-거리의 측정없이 작동할 수 있지만, 거리기반의 알고리즘들의 경우 범주형 속성의 거리 정보 결여로 효과적으로 적용될 수 없는 문제점을 갖고 있다. 본 논문에서는 이러한 범주형 자료들간 거리 측정을 자료 집합의 특성을 충분히 고려한 방법을 제안한다. 이를 위해 자료 집합의 선험적인 정보를 필요로 한다. 이런 선험적 정보인 조건부 확률을 기반으로한 거리 측정방법을 제시하고 오류 피드백을 통해서 속성 간 거리 측정을 최적화 하려고 노력한다. 주어진 자료 집합에 대해 서로 다른 두 범주형 값이 목적 속성에 대해서 유사한 분포를 보인다면 이들 값들은 비교적 가까운 거리로 결정한다 이렇게 결정된 거리를 기반으로 학습 단계를 진행하며 이때 발생한 오류들에 대해 피드백 작업을 진행한다. UCI Machine Learning Repository의 자료들을 이용한 실험 결과를 통해 제안한 거리 측정 방법의 우수한 성능을 확인하였다.

  • PDF

A Basic Study on Matching Color Images with Different Color Sets (상이한 칼라 집합으로 구성된 영상의 정합에 관한 기초 연구)

  • 김동균;김성영;김종민;김민환
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2002.05c
    • /
    • pp.164-169
    • /
    • 2002
  • 칼라 정보를 이용하여 영상을 정합하기 위해서는 적은 수의 칼라 집합으로 영상을 표현하는 영상 양자화 과정이 필요하다. 적응적 양자화를 사용하는 경우에는 균일 양자화에 비해 높은 정합 성능을 기대할 수 있지만 상이한 칼라 집합의 생성으로 인해 영상 정합 과정이 힘들게 된다. 이에 본 논문에서는 상이한 칼라 집합을 갖는 영상을 정합할 수 있는 기초적인 연구를 수행하였다. 영상 정합을 위해 우선 STR(sort-tile-recursive) 방법[1]을 응용하여 질의 영상의 각 칼라에 대한 유사 칼라를 DB 영상으로부터 빠르게 선정할 수 있는 방법을 개발하였다. 질의 칼라와 유사 칼라간의 유사도를 정의하고 이를 기반으로 영상간의 유사도를 계산함으로써 영상 정합에 이용할 수 있도록 하였다. 칼라간의 유사도는 칼라 차이가 고려되어 정의되는데 칼라 차이는 칼라 공간에서의 칼라 거리로 계산된다. 칼라 거리를 계산하기 위해 유클리디언 거리를 이용할 경우 많은 계산량이 요구되므로 기존의 시티블록 거리나 체스보드 거리에 비해 유클리디언 거리를 좀더 유사하게 근사화하면서 빠른 계산이 가능한 거리 계산 방법을 개발하였다.

  • PDF

Construction of Fuzzy Entropy and Similarity Measure with Distance Measure (거리 측도를 이용한 퍼지 엔트로피와 유사측도의 구성)

  • Lee Sang-Hyuk;Kim Sung-Shin
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.15 no.5
    • /
    • pp.521-526
    • /
    • 2005
  • The fuzzy entropy is proposed for measuring of uncertainty with the help of relation between distance measure and similarity measure. The proposed fuzzy entropy is constructed through a distance measure. In this study, Hamming distance measure is employed for a distance measure. Also a similarity measure is constructed through a distance measure for the measure of similarity between fuzzy sets or crisp sets and the proposed fuzzy entropies and similarity measures are proved.

Comparison of adaptation length coefficient equations for nonequilibrium sediment transport simulation (비평형 유사이송 모의를 위한 적응거리계수 산정 공식 비교)

  • Jeong, Anchul;Kim, Seongwon;An, Hyunuk;Jang, Chang-Lae;Jung, Kwansue
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2018.05a
    • /
    • pp.76-76
    • /
    • 2018
  • 하천에서의 유사이송과 하상변동을 분석하는 대표적인 방법으로는 현장에서 유사량이나 하상고를 측정하여 분석하는 실측에 의한 방법, 수리모형 실험과 수치모형을 이용하는 방법이 있다. 이 중에서 실측에 의한 방법은 시간과 비용의 한계로 수치해석모형을 이용한 연구가 많이 이루어 지고 있다. 현재까지 개발된 다양한 하상변동 수치모형들은 유사이송 상태를 평형 유사이송 상태를 가정하고 개발되어 왔다. 평형 유사이송은 흐름과 하상재료 등의 조건이 발생시킬 수 있는 유사이송능력과 실제 유사이송률이 동일하다고 가정하는 것이다. 그러나, 실제 유사이송에서는 흐름 및 지형 등의 변화에 따라서 지속적으로 새롭게 형성되는 유사이송능력에 실제 유사이송률이 빠르게 도달하지 못하면서 유사이송능력과 유사이송률 사이에 시 공간의 격차가 발생하게 된다. 이러한 상황을 비평형 유사이송이라고 하며 지속적인 하상 상승 및 저하가 발생하는 구간, 댐과 같은 구조물에 의해서 유사의 연속성이 차단되는 구간, 하상재료가 불연속한 구간 등에서 주로 발생하는 것으로 알려져 있다. 비평형 유사이송을 수학적으로 모의하기 위한 대표적인 방법에는 적응거리계수와 회복계수를 이용하는 방법이 있다. 위의 계수들은 흐름 및 하상 특성을 이용하여 공간에 대한 유사이송의 지체현상을 고려하는 방법으로 이를 산정하기 위한 다양한 공식들이 제시되고 있다. 그러나, 각 공식들에 의해서 제시되는 값에 많은 차이가 있는 것으로 알려져 있다. 본 연구에서는 실내실험과 수치실험을 통해서 평형/비평형 유사이송 및 집중형/분포형 적응거리계수를 고려한 모의 결과를 비교하였으며, 적응거리계수 산정공식에 따른 비평형 유사이송 모의 결과를 비교하였다. 본 연구에서 적용한 실내실험에 대해서는 평형 유사이송보다는 비평형 유사이송을 고려한 경우와 비평형 유사이송 공식을 이용하여 적응거리계수를 분포형 매개변수로 이용하는 경우가 실제 하상변동 모의 결과에 더 근접한 수치실험 결과를 제공하는 것으로 나타났다.

  • PDF

Non-parametric approach for the grouped dissimilarities using the multidimensional scaling and analysis of distance (다차원척도법과 거리분석을 활용한 그룹화된 비유사성에 대한 비모수적 접근법)

  • Nam, Seungchan;Choi, Yong-Seok
    • The Korean Journal of Applied Statistics
    • /
    • v.30 no.4
    • /
    • pp.567-578
    • /
    • 2017
  • Grouped multivariate data can be tested for differences between two or more groups using multivariate analysis of variance (MANOVA). However, this method cannot be used if several assumptions of MANOVA are violated. In this case, multidimensional scaling (MDS) and analysis of distance (AOD) can be applied to grouped dissimilarities based on the various distances. A permutation test is a non-parametric method that can also be used to test differences between groups. MDS is used to calculate the coordinates of observations from dissimilarities and AOD is useful for finding group structure using the coordinates. In particular, AOD is mathematically associated with MANOVA if using the Euclidean distance when computing dissimilarities. In this paper, we study the between and within group structure by applying MDS and AOD to the grouped dissimilarities. In addition, we propose a new test statistic using the group structure for the permutation test. Finally, we investigate the relationship between AOD and MANOVA from dissimilarities based on the Euclidean distance.

Similarity Measure Construction of the Fuzzy Set for the Reliable Data Selection (신뢰성 있는 정보의 추출을 위한 퍼지집합의 유사측도 구성)

  • Lee Sang-Hyuk
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.30 no.9C
    • /
    • pp.854-859
    • /
    • 2005
  • We construct the fuzzy entropy for measuring of uncertainty with the help of relation between distance measure and similarity measure. Proposed fuzzy entropy is constructed through distance measure. In this study, the distance measure is used Hamming distance measure. Also for the measure of similarity between fuzzy sets or crisp sets, we construct similarity measure through distance measure, and the proposed 려zzy entropies and similarity measures are proved.

A Sequence Similarity Measure Considering the Product Taxonomy in Transaction Data (구매이력 데이터에서 상품 분류 체계를 고려한 시퀀스 유사도 측정 기법)

  • Yang, Yu-Jeong;Lee, Ki Yong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.05a
    • /
    • pp.367-370
    • /
    • 2019
  • 본 논문은 구매이력 데이터에서 상품간의 분류 체계를 고려하여 시퀀스 간의 유사도를 계산하는 새로운 방법을 제안한다. 시퀀스란 두 항목간의 순서가 존재하는 데이터를 의미한다. 항목 간의 선후관계가 중요한 시퀀스 데이터에서는 두 시퀀스 간의 유사도를 정확히 정의하는 것이 중요하다. 본 논문에서는 대표적인 시퀀스 유사도 측정 알고리즘인 편집 거리 알고리즘을 활용하여 구매이력 데이터에서 시퀀스 간의 유사도를 정의한다. 상품은 상품의 특성에 따라 항목 분류 체계에서 여러 범주로 분류된다. 이 경우 기존의 편집 거리 알고리즘에서 문자의 일치유무에 따라 단순히 0 또는 1을 부여하는 것은 부정확하다. 따라서 본 논문은 편집 거리 알고리즘의 수정 연산 중 대체 연산 비용 계산 시 항목 분류 트리를 사용하여 연산 비용이 0 에서 1 사이의 값을 가지도록 세분화하였다. 실험 결과 제안 방법은 대체 연산 비용 계산 시 두 문자가 다르면 단순히 1 을 부여하는 기존의 편집 거리 알고리즘에 비해 시퀀스 간의 유사도를 더 정확하게 계산함을 확인하였다.

Phoneme Similarity Error Correction System using Bhattacharyya Distance Measurement Method (바타챠랴 거리 측정법을 이용한 음소 유사율 오류 보정 개선 시스템)

  • Ahn, Chan-Shik;Oh, Sang-Yeob
    • Journal of the Korea Society of Computer and Information
    • /
    • v.15 no.6
    • /
    • pp.73-80
    • /
    • 2010
  • Vocabulary recognition system is providing inaccurate vocabulary and similar phoneme recognition due to reduce recognition rate. It's require method of similar phoneme recognition unrecognized and efficient feature extraction process. Therefore in this paper propose phoneme likelihood error correction improvement system using based on phoneme feature Bhattacharyya distance measurement. Phoneme likelihood is monophone training data phoneme using HMM feature extraction method, similar phoneme is induced recognition able to accurate phoneme using Bhattacharyya distance measurement. They are effective recognition rate improvement. System performance comparison as a result of recognition improve represent 1.2%, 97.91% by Euclidean distance measurement and dynamic time warping(DTW) system.

Designing of an Efficient Fuzzy-induced Distance Classifier for the Recognition of Binary Images (이진 영상 인식을 위한 효과적인 퍼지 기반 거리 인식기의 설계)

  • 송영기;강환일
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2000.04a
    • /
    • pp.469-474
    • /
    • 2000
  • 본 논문에서는 두 이진 영상의 비교시 그 유사도를 결정하는 새로운 방법을 제안한다. 이는 두 영상사이의 최소거리에 기반한 방법이며, 제안된 방법에서는 구해진 거리 그 자체보다는 이 거리의 분포로부터 최적 거리를 계산한다. 구해진 거리 분포 함수로부터 최종적인 두 영상의 유사도는 비퍼지화 추론을 이용하여 계산되어진다. 제안한 방법을 실제 문제에 적용하여 그 우수성을 검증하였다.

  • PDF