• Title/Summary/Keyword: 유사도 함수

Search Result 1,079, Processing Time 0.03 seconds

Similarity Computation between Music Motifs Using Cosine Measure (Cosine Measure를 이용한 음악 동기간 유사도 계산)

  • Lim, Sang-Hyuk;Ku, Kyong-I;Kim, Yoo-Sung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.05c
    • /
    • pp.1603-1606
    • /
    • 2003
  • 음악에서 동기는 독립성을 지니는 최소 단위이며, 저작권 검사의 단위로 이용된다 따라서, 한 음악에서 약간의 변화를 가지고 반복되는 주제선율을 추출하거나, 다른 음악간의 유사도를 측정하는데 유사도 계산은 필요하다. 본 논문에서는 비교되는 동기의 선율정보를 음 길이와 음높이가 함께 고려되는 시계열 데이타로 변환하고, cosine measure를 이용하여 동기간의 유사도를 계산한다. 시계열 데이타에서 유사도 계산으로 사용되는 유클리드 거리함수 대신 cosine measure를 이용한 경우, 공간상의 거리 합대신 변화 방향이 반영됨으로써 비교되는 동기간의 유사도를 정확하게 계산한다. 본 논문에서 제안된 동기간의 유사도 계산은 내용 기반 음악 검색에서 색인으로 사용되는 주제선율을 추출하거나, 다른 음악의 동기간의 유사성을 비교하는데 이용될 수 있다.

  • PDF

On fuzzy preinvexity in Choquet integrals (쇼케이적분에서 퍼지 프리인벡스에 관한 연구)

  • Jang, Lee-Chae;Kim, Hyun-Mee
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.18 no.2
    • /
    • pp.183-186
    • /
    • 2008
  • We consider fuzzy invex sets, fuzzy preinvex functions, fuzzy quasi-preinvex functions, and fuzzy logarithmic preinvex functions. Murofushi et al. have been studied Choquet integrals and their properties. In this paper, we study some characterizations in Choquet integrals as follows: fuzzy preinvexity, fuzzy quasi-preinvexity, and fuzzy logarithemic preinvexity, that mean some characterizations of functionals defined by Choquet integrals. Furthermore, we discuss Jensen's type inequality in Choquet integrals.

Data Augmentation Strategy based on Token Cut-off for Using Triplet Loss in Unsupervised Contrastive Learning (비지도 대조 학습에서 삼중항 손실 함수 도입을 위한 토큰 컷오프 기반 데이터 증강 기법)

  • Myeongsoo Han;Yoo Hyun Jeong;Dong-Kyu Chae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.05a
    • /
    • pp.618-620
    • /
    • 2023
  • 최근 자연어처리 분야에서 의미론적 유사성을 반영하기 위한 대조 학습 (contrastive learning) 관련 연구가 활발히 이뤄지고 있다. 이러한 대조 학습의 핵심은 의미론적으로 가까워져야 하는 쌍과 멀어져야 하는 쌍을 잘 구축하는 것이지만, 기존의 손실 함수는 문장의 상대적인 유사성을 풍부하게 반영하는데 한계가 있다. 이를 해결하기 위해, 이전 연구에서는 삼중 항 손실 함수 (triplet loss)를 도입하였으며, 본 논문에서는 이러한 삼중 항을 구성하기 위해 대조 학습에서의 효과적인 토큰 컷오프(cutoff) 데이터 증강 기법을 제안한다. BERT, RoBERTa 등 널리 활용되는 언어 모델을 이용한 실험을 통해 제안하는 방법의 우수한 성능을 보인다.

A Study on the Degree of Signature Similarity between Domain Model and Object Candidate Groups (영역 모델과 객체후보군의 유사도 측정에 관한 연구)

  • 박성옥;노경주;이문근
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.522-524
    • /
    • 1999
  • 절차지향 소프트웨어를 객체지향 소프트웨어로 변환하는 여러 가지 방법이 존재한다. 프로그램을 변환하기 위하여 일반적으로 함수, 변수와 자료형들 간의 관계를 이용한다. 이들간의 관계성을 이용하면 결과로서 객체 후보가 생성된다. 생성된 객체 후보와 영역 전문가에 의하여 생성된 영역 모델을 비교하여 두 모델간의 유사성을 측정하여야 한다. 본 논문에서는 클래스의 시그너처(클래스 이름, 속성의 이름, 속성의 자료형, 메소드 이름, 메소드의 리턴형, 메소드 파라미터의 자료형)을 이용하여 클래스와 객체 후보의 유사도를 측정하고, 측정된 유사도의 평균값을 이용하여 객체 후보군의 유사도를 측정한다. 기존의 연구 방법과는 다르게 n개의 클래스와 m개의 객체 후보사이의 구문적 측면의 유사도 측정뿐만이 아니라 의미적 측면의 유사도를 측정하는 방법을 제시하여 최적합 객체 후보군을 추출하도록 하였다.

  • PDF

A New Similarity Measure for e-Catalog Retrieval Based on Semantic Relationship (의미적 연결 관계에 기반한 전자 카탈로그 검색용 유사도 척도)

  • Seo, Kwang-Hun;Lee, Sang-Goo
    • Journal of KIISE:Databases
    • /
    • v.34 no.6
    • /
    • pp.554-563
    • /
    • 2007
  • The e-Marketplace is growing rapidly and providing a more complex relationship between providers and consumers. In recent years, e-Marketplace integration or cooperation issues have become an important issue in e-Business. The e-Catalog is a key factor in e-Business, which means an e-Catalog System needs to contain more large data and requires a more efficient retrieval system. This paper focuses on designing an efficient retrieval system for very large e-Catalogs of large e-Marketplaces. For this reason, a new similarity measure for e-Catalog retrieval based on semantic relationships was proposed. Our achievement is this: first, a new e-Catalog data model based on semantic relationships was designed. Second, the model was extended by considering lexical features (Especially, focus on Korean). Third, the factors affecting similarity with the model was defined. Fourth, from the factors, we finally defined a new similarity measure, realized the system and verified it through experimentation.

Box-Cox 변형(變形)을 이용한 지가함수(地價函數)의 추정(推定)

  • Son, Jae-Yeong;An, Hong-Gi
    • KDI Journal of Economic Policy
    • /
    • v.16 no.2
    • /
    • pp.21-49
    • /
    • 1994
  • 공시지가제도하에서 개별필지 가격산정은 지가함수(地價函數) 추정, 비준표(比準表) 작성, 인근 유사 표준지(標準地)와의 특성차이를 감안한 가격결정 과정을 거치는데, 각 단계의 기술적 문제에 대한 연구는 별로 없었다. 이 글은 지가함수(地價函數) 추정에서 log-log함수형태가 통계학적으로 또는 실제 활용상 적합한가의 문제와 지가함수(地價函數) 추정결과를 그대로 지가예측식(地價豫測式)으로 이용할 수 있는가의 두가지 문제를 다루고 있다. 서울시 서초구와 강남구자료에 대해 Box-Cox 변형(變型)을 이용한 지가함수(地價函數)와 log-log형태의 지가함수(地價函數)를 추정하여 비교해 본 결과 통계학적으로는 전자가 우월하지만, 지가추정(地價推定)에서 양자간의 차이는 크지 않았으며 추정비용(推定費用), 활용(活用)의 용이성 등의 관점에서는 후자가 선호되었다. 또 지가함수(地價函數) 추정결과를 현재와 같이 표준지와 여타 토지간의 가격차이(價格差異)를 계산하는 용도로 한정하는 것이 표준지가격(標準地價格) 자체가 가진 정보를 활용하는 방안으로 바람직하다는 결론을 얻었다.

  • PDF

Comparison of Daily Soil Water Contents between Energy BalanceWater Budget Approach and TDR (에너지와 물수지 연계방법과 TDR로부터 얻어진 매일 토양 함수량의 비교)

  • 임창수
    • Water for future
    • /
    • v.29 no.4
    • /
    • pp.119-129
    • /
    • 1996
  • The daily soil water contents were obtained from the time domain reflectometry (TDR) method and energy balance-water budget approach with eddy correlation at the two small semiarid watersheds of Lucky Hills and Kendall during the summer rainy period. There was a comparison of daily soil water content measured and estimated from these two different approaches. The comparison is valuable to evaluate the accuracy of current soil water content measuring system using TDR and energy balance-water budget approach using eddy correlation method at small watersheed scale. The degree of similarity between the regressions of these two methods of measuring soil water content was explained by determining the correlations between these methods. Simple linear regression analyses showed that soil water content measured from TDR method was responsible for 58% and 63% of the variations estimated from energy balance-water budget approach with eddy correlation at Lucky Hills and Kendall, respectively. The scatter plots and the regression analyses revealed that two different approaches for soil water content measurement at small watershed scale have no significant difference.

  • PDF

An Efficient Video Sequence Matching Algorithm (효율적인 비디오 시퀀스 정합 알고리즘)

  • 김상현;박래홍
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • v.41 no.5
    • /
    • pp.45-52
    • /
    • 2004
  • According tothe development of digital media technologies various algorithms for video sequence matching have been proposed to match the video sequences efficiently. A large number of video sequence matching methods have focused on frame-wise query, whereas a relatively few algorithms have been presented for video sequence matching or video shot matching. In this paper, we propose an efficientalgorithm to index the video sequences and to retrieve the sequences for video sequence query. To improve the accuracy and performance of video sequence matching, we employ the Cauchy function as a similarity measure between histograms of consecutive frames, which yields a high performance compared with conventional measures. The key frames extracted from segmented video shots can be used not only for video shot clustering but also for video sequence matching or browsing, where the key frame is defined by the frame that is significantly different from the previous fames. Several key frame extraction algorithms have been proposed, in which similar methods used for shot boundary detection were employed with proper similarity measures. In this paper, we propose the efficient algorithm to extract key frames using the cumulative Cauchy function measure and. compare its performance with that of conventional algorithms. Video sequence matching can be performed by evaluating the similarity between data sets of key frames. To improve the matching efficiency with the set of extracted key frames we employ the Cauchy function and the modified Hausdorff distance. Experimental results with several color video sequences show that the proposed method yields the high matching performance and accuracy with a low computational load compared with conventional algorithms.

A Study on Fitness Function of Clustering Algorithm based on Genetic Algorithm (유전자 알고리즘을 이용한 군집화 기법의 적합도 함수에 관한 연구)

  • 이수정;권혜련;김은주;이일병
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.310-312
    • /
    • 2001
  • 최근 관심의 대상이 되고 있는 CRM, eCRM에는 데이터 마이닝 기법이 핵심 기술로 이용되고 있다. 이러한 데이터 마이닝 기법가운데 가장 널리 사용되고 있는 군집화는, 데이터 집합을 유사한 데이터의 군집들로 분할하여 데이터 속에 존재하는 의미 있는 정보를 얻는 것이다. 그런데 기존의 군집화 알고리즘은 사전에 군집의 개수를 미리 결정해줘야 하고 잡음에 민감하여 지역적 최적해(local minima)에 수렴할 수 있다는 문제점을 가지고 있다. 이러한 문제점의 개선을 위해, 본 논문에서는 유사도 개념을 적합도 함수로 사용하는 유전자 알고리즘을 적용한 군집화 기법을 제안하다. 특히 적합도 하수에 사용된 군집의 대표값 개념은 요약 정보만을 이용하여 계산속도가 향상되기 때문에 대용량 데이터를 다루는 마이닝에 적합할 것을 기대된다.

  • PDF

A Fast Partial Distortion Elimination Algorithm Using Motion Similarity of Macro-blocks (매크로블록 간 움직임유사도를 이용한 고속 PDE 알고리즘)

  • Ryu, Tae-Kyung;Jeong, Yong-Jae;Moon, Kwang-Seok;Kim, Jong-Nam
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2009.05a
    • /
    • pp.225-228
    • /
    • 2009
  • 본 논문에서는 인접블록간의 움직임 유사도를 이용하여 불필요한 후보블록을 보다 빠르게 제거하는 PDE기반의 고속 블록매칭 알고리즘을 제안한다. 제안한 방법은 기존의 방법보다 불필요한 계수를 효율적으로 제거하기 위하여 인접 블록간의 영상의 유사성에 기초하여 네 개의 인접 매크로블록 가운데 최대 복잡도를 가지는 서브블록의 누적 분포 함수(cumulative distribution function-CDF)와 서브블록별 복잡도가 집중되지 않도록 하기위하여 normalized스캔 방법에 사용하여 효율적으로 계산량을 감소하였다. 제안한 알고리즘은 화질의 저하 없이 기존의 PDE 알고리즘에 비해 55% 이상의 계산량을 줄였으며, MPEG-2 및 MPEG-4 AVC를 이용하는 비디오 압축 응용분야에 유용하게 사용될 수 있을 것이다.

  • PDF