• Title/Summary/Keyword: 유사도측정

Search Result 1,382, Processing Time 0.027 seconds

Tree Similarity: Interoperability Evaluation Tool (트리 유사도: 상호운용성 평가도구)

  • Jeong, Seonghoon;Bae, Jae-Hak J.
    • 한국어정보학회:학술대회논문집
    • /
    • 2017.10a
    • /
    • pp.276-280
    • /
    • 2017
  • 현대사회에 존재하는 다양한 시스템들이 병합될 때는 병합을 위해서 여러 가지 방법을 사용해 볼 수 있다. 이때 시스템의 성격에 따라 더 적절한 병합 방법론이 존재할 수 있지만, 어떤 방법이 해당 시스템을 통합하는데 더 적절한지를 판단하기는 쉽지 않다. 본 논문에서는 서로 다른 시스템을 통합할 때, 그 상호 운용성을 평가하기 위한 수단으로 트리의 유사도를 측정하는 방안을 제시한다. 이렇게 측정된 유사도는 0이상 1이하의 값을 가지며, 정확한 수치로 제시되기 때문에 서로 다른 통합 방법론을 평가하기 위한 계량적 근거로 사용될 수 있다. 다만 트리 구조로 나타낼 수 없는 일부 시스템들에 대해서는 적용할 수 없는 한계를 가진다.

  • PDF

A Study on the Design and Implementation of Plagiarism Analysis System of Music Contents (음악콘텐츠 표절분석시스템 설계 및 구현에 관한 연구)

  • Shin, Mi-hae;Kim, Eui-jeong
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2013.10a
    • /
    • pp.279-282
    • /
    • 2013
  • In this paper, we propose a novel implementation method to detect musical plagiarism which can provide human experts evidences to decide plagiarism using cutting-edge information technologies and thereby can solve exhaustive disputes on cases of musical plagiarism when the cases are decided by human experts' emotional preferences.

  • PDF

Pre-Clustering Algorithm for Selecting Optimal Objects (최적합 객체 선정을 위한 선 클러스터링 알고리즘)

  • Jang Joo-Hyun;Roh Hi-Young
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.901-903
    • /
    • 2005
  • 본 논문에서는 절차 중심 소프트웨어를 객체 지향 소프트웨어로 재/역공학기 위한 다단계 절차 중 객체 추출 단계에서 선 클러스터링을 통해 불필요한 정제 결합단계를 축소하고, 영역 전문가의 선택으로 영역모델링에 가장 가까운 객체 후보군을 제시하는 알고리즘을 제안하고자 한다. 기존의 연구에서는 영역 모델링과 다중 객체 후보군과의 유사도를 측정하여 영역 전문가에게 최적합 후보를 선택할 수 있는 측정 결과를 제시하였다. 하지만 영역 전문가가 제시하는 영역 모델링이 존재한다면 정제 결합단계이전에 최대한의 선 클러스터링을 통해서 영역 모델링과 가장 유사한 통합 객체를 제시할 수 있고, 정제 결합 단계를 선 클러스터링을 통해서 축소할 수 있으며 이를 통해서 객체 후보군과 영역모델링의 유사도를 향상 시키며 클러스터링에 따른 시간과 공간을 절약할 수 있다. 따라서 본 논문에서는 영역 모델링과 사용자의 함수, 전역변수의 선택을 통해 영역 모델링에 가장 유사한 객체 후보군을 찾는 선 클러스터링 알고리즘 제안 하고자 한다.

  • PDF

A Similarity Evaluation using Structural Information of Documents (문서구조 정보 기반의 유사도 측정)

  • Shin, Mi-Hae;Ko, Bang-Won;Kim, Young-Chul;Jeong, Jin-Yeong
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2010.07a
    • /
    • pp.499-502
    • /
    • 2010
  • 인터넷의 발달로 인한 수많은 정보의 공유는 지식 정보사회의 발전을 가져왔다. 이러한 정보사회의 발전과 동시에 표절과 같은 새로운 지식 범죄도 급증하고 있다. 표절은 연구의 정직성과 창의성을 떨어뜨리고 학문의 발전을 저해하는 요소이다. 이러한 표절을 근절하기 위해서 그동안 많은 방법들과 시스템들이 제시되었다. 이중 자연어로 구성된 구조가 없는 일반 문서의 표절을 검사하는 방법은 지문법을 이용하였다. 지문법과 같이 통계적인 방법을 이용한 유사도 검사 방법은 문서 대 문서 전체를 비교하기 때문에 부분적 유사성, 즉 문장이나 문단 단위의 비교를 할 수 없는 단점이 있다. 본 논문에서 제시하는 시스템은 자연어로 이루어진 일반문서 중 특별한 문서의 구조 정보를 가질 수 있는 일반 텍스트 문서를 대상으로 유사도를 측정하였다. 즉 텍스트 문서 구조를 AST 형태의 자료구조로 표시하고 이를 이용하여 사용자가 원하는 부분 또는 전체 유사도 측정 방법을 제시한다.

  • PDF

Sentence Similarity Analysis using Ontology Based on Cosine Similarity (코사인 유사도를 기반의 온톨로지를 이용한 문장유사도 분석)

  • Hwang, Chi-gon;Yoon, Chang-Pyo;Yun, Dai Yeol
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2021.05a
    • /
    • pp.441-443
    • /
    • 2021
  • Sentence or text similarity is a measure of the degree of similarity between two sentences. Techniques for measuring text similarity include Jacquard similarity, cosine similarity, Euclidean similarity, and Manhattan similarity. Currently, the cosine similarity technique is most often used, but since this is an analysis according to the occurrence or frequency of a word in a sentence, the analysis on the semantic relationship is insufficient. Therefore, we try to improve the efficiency of analysis on the similarity of sentences by giving relations between words using ontology and including semantic similarity when extracting words that are commonly included in two sentences.

  • PDF

An Efficient Image Registration Based on Multidimensional Intensity Fluctuation (다차원 명암도 증감 기반 효율적인 영상정합)

  • Cho, Yong-Hyun
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.22 no.3
    • /
    • pp.287-293
    • /
    • 2012
  • This paper presents an efficient image registration method by measuring the similarity, which is based on multi-dimensional intensity fluctuation. Multi-dimensional intensity which considers 4 directions of the image, is applied to reflect more properties in similarity decision. And an intensity fluctuation is also applied to measure comprehensively the similarity by considering a change in brightness between the adjacent pixels of image. The normalized cross-correlation(NCC) is calculated by considering an intensity fluctuation to each of 4 directions. The 5 correlation coefficients based on the NCC have been used to measure the registration, which are total NCC, the arithmetical mean and a simple product on the correlation coefficient of each direction and on the normalized correlation coefficient by the maximum NCC, respectively. The proposed method has been applied to the problem for registrating the 22 face images of 243*243 pixels and the 9 person images of 500*500 pixels, respectively. The experimental results show that the proposed method has a superior registration performance that appears the image properties well. Especially, the arithmetical mean on the correlation coefficient of each direction is the best registration measure.

Analysis of Performance Improvement of Collaborative Filtering based on Neighbor Selection Criteria (이웃 선정 조건에 따른 협력 필터링의 성능 향상 분석)

  • Lee, Soojung
    • The Journal of Korean Association of Computer Education
    • /
    • v.18 no.4
    • /
    • pp.55-62
    • /
    • 2015
  • Recommender systems through collaborative filtering has been utilized successfully in various areas by providing with convenience in searching information. Measuring similarity is critical in determining performance of these systems, because it is the criteria for the range of recommenders. This study analyzes distributions of similarity from traditional measures and investigates relations between similarities and the number of co-rated items. With this, this study suggests a method for selecting reliable recommenders by restricting similarities, which compensates for the drawbacks of previous measures. Experimental results showed that restricting similarities of neighbors by upper and lower thresholds yield superior performance than previous methods, especially when consulting fewer nearest neighbors. Maximum improvement of 0.047 for cosine similarity and that of 0.03 for Pearson was achieved. This result tells that a collaborative filtering system using Pearson or cosine similarities should not consult neighbors with very high or low similarities.

Shape similarity measure for M:N areal object pairs using the Zernike moment descriptor (저니키 모멘트 서술자를 이용한 M:N 면 객체 쌍의 형상 유사도 측정)

  • Huh, Yong;Yu, Ki-Yun
    • Journal of the Korean Society of Surveying, Geodesy, Photogrammetry and Cartography
    • /
    • v.30 no.2
    • /
    • pp.153-162
    • /
    • 2012
  • In this paper, we propose a new shape similarity measure for M:N polygon pairs regardless of different object cardinalities in the pairs. The proposed method compares the projections of two shape functions onto Zernike polynomial basis functions, where the shape functions were obtained from each overall region of objects, thus not being affected by the cardinalities of object pairs. Moments with low-order basis functions describe global shape properties and those with high-order basis functions describe local shape properties. Therefore several moments up to a certain order where the original shapes were similarly reconstructed can efficiently describe the shape properties thus be used for shape comparison. The proposed method was applied for the building objects in the New address digital map and a car navigation map of Seoul area. Comparing to an overlapping ratio method, the proposed method's similarity is more robust to object cardinality.

Program Reuse Possibility Measurement Based on Rough and Fuzzy Sets (러프 집합과 퍼지 집합에 기반한 프로그램 재사용 가능도 측정)

  • 김혜경;김미경;최완규;이성주
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 1998.10a
    • /
    • pp.145-149
    • /
    • 1998
  • 소프트웨어의 유지보수면에서, 재사용이 매우 중요시되고 있는 가운데, 사용자가 최소 노력으로 필요한 컴포넌트들을 선택 및 유사 컴포넌트들을 평가할 수 있는 방법이 필요하다. 따라서, 본 논문에서는 현업에서의 많은 연구와 실험을 통해서 그 타당성이 검증된 척도들을 측정 인자로 설정, 여기에 러프 집합으로써 각 측정 인자들의 중요도를 측정하고, 이러한 측정값들을 Sugeno의 퍼지 적분으로써 종합하여 컴포넌트의 재사용 가능도를 평가하여 재사용이 용이한 컴포넌트 순으로 사용자에게 제공할 수 있는 재사용 가능도 평가 방법을 제안한다.

  • PDF

Trajectory Search Algorithm for Spatio-temporal Similarity of Moving Objects on Road Network (도로 네트워크에서 이동 객체를 위한 시공간 유사 궤적 검색 알고리즘)

  • Kim, Young-Chang;Vista, Rabindra;Chang, Jae-Woo
    • Journal of Korea Spatial Information System Society
    • /
    • v.9 no.1
    • /
    • pp.59-77
    • /
    • 2007
  • Advances in mobile techknowledges and supporting techniques require an effective representation and analysis of moving objects. Similarity search of moving object trajectories is an active research area in data mining. In this paper, we propose a trajectory search algorithm for spatio-temporal similarity of moving objects on road network. For this, we define spatio-temporal distance between two trajectories of moving objects on road networks, and propose a new method to measure spatio-temporal similarity based on the real road network distance. In addition, we propose a similar trajectory search algorithm that retrieves spatio-temporal similar trajectories in the road network. The algorithm uses a signature file in order to retrieve candidate trajectories efficiently. Finally, we provide performance analysis to show the efficiency of the proposed algorithm.

  • PDF