• Title/Summary/Keyword: 유사도 계산 방법

Search Result 1,268, Processing Time 0.033 seconds

An Approach for Accuracy in Computing Link-based Similarity of Scientific Papers (링크 기반 논문 유사도 계산의 정확도 향상 방안)

  • Yoon, Seok-Ho;Kim, Ji-Soo;Kim, Sang-Wook
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06c
    • /
    • pp.160-162
    • /
    • 2012
  • 본 논문에서는 논문들 간의 유사도를 계산하는 기존 링크 기반 유사도 계산 방안의 정확도를 향상시키기는 방안을 제안한다. 제안하는 방안은 링크로 연결되어 있는 두 객체의 관련 정도를 경험적인 세 가지 방법(인기도 고려, 발행연도 고려, 내용 관련도 고려)을 이용해서 계산하고 계산된 값을 링크의 가중치로 사용한다. 실험을 통하여 기존 링크 기반 유사도 계산 방안보다 제안하는 방안을 적용한 기존 링크 기반 유사도 계산 방안의 정확도가 우수하다는 것을 보인다.

Improvement and Application of Stable Cannel Analysis and Design (안정하도 평가 및 설계 방법의 개선과 적용)

  • Jang, Eun-kyung;Ji, Un;Ahn, Myeong-Hui
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.14-14
    • /
    • 2017
  • 안정하도란 하도형성유량이 발생하는 조건에 대해 단면내에서 발생하는 유사량과 유입되는 유사량이 평형상태를 유지하는 단면을 의미하며, 안정하도 평가 및 설계란 현재 단면을 안정하도 단면과 비교하여 평가하거나 안정하도를 만족하는 하상경사와 하폭, 수심을 도출하는 과정을 의미한다. 이러한 안정하도 평가 및 설계는 하천을 정비하거나 복원하는 과정에서 장기적인 하상 평형상태를 고려하기 위해 적용할 수 있으며, 하상 침식 혹은 퇴적에 대해 지점별 평가방법으로 활용 할 수 있다. 안정하도 단면은 상류에서 유입되는 유사량과 대상구간의 발생 유사량의 평형조건에 의해 결정되기 때문에 유입되는 유사량 자료의 정확성과 대상구간 발생 유사량 산정의 정확도가 전체 평가 결과의 신뢰도에 가장 중요한 요소로 작용한다. 그러나 현재까지 활용되어 온 안정하도 단면 계산 방법의 경우 대상구간 발생 유사량 결정을 위한 유사이송공식의 선택이 특정 공식으로 한정되어있어 국내 하상과 적합한 유사이송공식의 적용이 매우 제한적이었다. 따라서 본 연구에서는 이러한 기존의 안정하도 평가 및 설계 방법을 개선하기 위해 다양한 유사이송공식의 적용이 가능한 안정하도 평가 모델의 알고리즘을 제시하였으며, 관련 분야의 실무자가 쉽게 활용 할 수 있도록 사용자 친화적인 사용자 친화적인 안정하도 평가 및 설계 프로그램(Stable Channel Analysis and Design, SCAD)을 개발하였다. 본 연구에서는 기존의 안정하도 단면 계산 방법인 Copeland 방법을 분석하여 새로운 알고리즘을 개발하였으며, 단면 유사량 분석 계산과정에서 자갈하상 공식을 포함한 총 다섯 가지의 유사이송공식을 새롭게 추가하였다. 개발된 SCAD 프로그램은 정확도 및 적용성 향상을 위해 청미천과 내성천 모래하상 구간 그리고 원주천 자갈하상 구간에 대해 시험계산을 수행하였고 평가 결과를 프로그램 개선을 위해 적극 활용하였다. 또한 웹 포팅 프로그램 구축을 통해 다양한 사용자가 특정 웹사이트에서 프로그램에 쉽게 접근할 수 있도록 하였다. 본 연구에서는 개선된 안정하도 평가 및 설계 프로그램을 활용하여 다양한 유사이송공식 선택에 따른 안정하도 산정 결과 값의 변화를 분석하고 그 범위를 정량적으로 제시하였다.

  • PDF

Improving the Performance of Document Similarity by using GPU Parallelism (GPU 병렬성을 이용한 문서 유사도 계산 성능 개선)

  • Park, Il-Nam;Bae, Byung-Gurl;Im, Eun-Jin;Kang, Seung-Shik
    • The KIPS Transactions:PartB
    • /
    • v.19B no.4
    • /
    • pp.243-248
    • /
    • 2012
  • In the information retrieval systems like vector model implementation and document clustering, document similarity calculation takes a great part on the overall performance of the system. In this paper, GPU parallelism has been explored to enhance the processing speed of document similarity calculation in a CUDA framework. The proposed method increased the similarity calculation speed almost 15 times better compared to the typical CPU-based framework. It is 5.2 and 3.4 times better than the methods by using CUBLAS and Thrust, respectively.

Designing of an Efficient Fuzzy-induced Distance Classifier for the Recognition of Binary Images (이진 영상 인식을 위한 효과적인 퍼지 기반 거리 인식기의 설계)

  • 송영기;강환일
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2000.04a
    • /
    • pp.469-474
    • /
    • 2000
  • 본 논문에서는 두 이진 영상의 비교시 그 유사도를 결정하는 새로운 방법을 제안한다. 이는 두 영상사이의 최소거리에 기반한 방법이며, 제안된 방법에서는 구해진 거리 그 자체보다는 이 거리의 분포로부터 최적 거리를 계산한다. 구해진 거리 분포 함수로부터 최종적인 두 영상의 유사도는 비퍼지화 추론을 이용하여 계산되어진다. 제안한 방법을 실제 문제에 적용하여 그 우수성을 검증하였다.

  • PDF

Similarity Calculation for Mobile Life Log Data Mining (모바일 라이프로그 데이터 마이닝을 위한 Non-Euclidean 데이터의 유사도 계산)

  • Lee, Young-Seol;Cho, Sung-Bae
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06a
    • /
    • pp.298-301
    • /
    • 2011
  • 모바일 기기에서 수집된 많은 정보들은 시맨틱한 정보들을 포함하고 있기 때문에 수치 해석에 특화된 클러스터링 등의 데이터마이닝 방법들을 적용하기가 힘들다. 따라서 상대적인 유사도를 계산하는 방법이 많이 이용되지만, 상대적인 유사도 값조차 유클리드 거리로 환산이 불가능한 특징을 가지는 경우가 많다. 본 논문에서는 비유클리드 특징을 가지는 유사도를 TFIDF 와 pseudo-Euclidean embedding을 적용하여 유클리드 공간 상의 거리값으로 변환하는 방법을 제안한다. 제안하는 방법의 가능성을 보이기 위하여 모바일 기기에서 대학생들의 생활 패턴을 반영하는 데이터를 수집하고, 수집된 데이터에 제안하는 방법을 적용한다. 그리고 적용된 결과를 대학생들의 생활 패턴과 비교하여 분석한다. 또한 장소 간의 유사도를 이용하는 애플리케이션의 프로토타입을 개발한다.

Automatic Inter-Phoneme Similarity Calculation Method Using PAM Matrix Model (PAM 행렬 모델을 이용한 음소 간 유사도 자동 계산 기법)

  • Kim, Sung-Hwan;Cho, Hwan-Gue
    • The Journal of the Korea Contents Association
    • /
    • v.12 no.3
    • /
    • pp.34-43
    • /
    • 2012
  • Determining the similarity between two strings can be applied various area such as information retrieval, spell checker and spam filtering. Similarity calculation between Korean strings based on dynamic programming methods firstly requires a definition of the similarity between phonemes. However, existing methods have a limitation that they use manually set similarity scores. In this paper, we propose a method to automatically calculate inter-phoneme similarity from a given set of variant words using a PAM-like probabilistic model. Our proposed method first finds the pairs of similar words from a given word set, and derives derivation rules from text alignment results among the similar word pairs. Then, similarity scores are calculated from the frequencies of variations between different phonemes. As an experimental result, we show an improvement of 10.1%~14.1% and 8.1%~11.8% in terms of sensitivity compared with the simple match-mismatch scoring scheme and the manually set inter-phoneme similarity scheme, respectively, with a specificity of 77.2%~80.4%.

An efficient method for segmentation of fast motion video (움직임이 큰 비디오에 효율적인 비디오 분할 방법)

  • Park, Min-Ho;Park, Rae-Hong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.05a
    • /
    • pp.181-184
    • /
    • 2005
  • 기존의 비디오 분할 방법은 밝기의 변화가 큰 영상이나 움직임이 큰 영상에 대해서는 정확한 분할이 이루어지지 않았다. 본 논문은 움직임 정보를 이용하여 움직임이 큰 영상에서 좀 더 정확하게 비디오를 분할할 수 있는 방법을 제안한다. 이를 위해 블록 정합 알고리즘을 이용하여 얻어진 움직임 벡터로부터 움직임 유사도를 찾는 방법을 제안한다. 또 연속된 프레임에서 픽셀의 차이 값을 계산할 때 motion blur 로 생기는 오차를 각 블록의 움직임 크기로 보상하여 좀 더 정확한 픽셀의 차이 값을 계산하는 방법을 제안한다. 이렇게 얻어진 두 가지 정보를 이용하여 discontinuity value 를 계산한다. 움직임이 많은 액션 영화 3 편에 대해 실험한 결과 제안한 방법이 기존의 움직임 유사도와 픽셀 차이 값을 구하여 샷 경계 검출을 하는 방법보다 좀 더 정확한 샷 경계 검출을 하고 있다는 것을 보여준다.

  • PDF

Conceptual Clustering of Korean Concordances using Similarities between Morphemes (형태소 사이의 유사도를 이용한 용례의 의미별 분류)

  • Baek, Dae-Ho;Lee, Ho;Rim, Hae-Chang
    • Annual Conference on Human and Language Technology
    • /
    • 1996.10a
    • /
    • pp.235-240
    • /
    • 1996
  • 본 논문에서는 정보 검색에서 사용하는 계층적 클러스터링 기법을 이용하여 용례들을 중심어의 의미에 따라 분류하고자 한다. 분류에 필요한 용례 사이의 유사도는 형태소 사이의 유사도를 이용하여 계산한다. 형태소 사이의 유사도 계산에는 상호 정보, 상호 정보의 유사도, 벡터 유사도 등을 사용한다. 품사 태깅된 17만 코퍼스에서 명사 4개와 동사 4개를 중심어로 사용하여 추출된 용례에 대해서 각 방법의 정확도를 실험한 결과 상호 정보와 상호 정보 유사도를 더한 값을 형태소 사이의 유사도로 사용한 방법이 90.16%의 정확도를 보였다. 제안된 방법에서 사용하는 정보들은 의미 태깅되지 않은 코퍼스에서 추출할 수 있기 때문에, 정보의 획득이 쉬운 장점이 있다.

  • PDF

Maximizing the Early Abandon Effect in Time-Series Distance Computation (시계열 거리 계산에서 미리 버림 효과의 최대화)

  • Lee, Jeong-Gon;Kim, Sang-Pil;Moon, Yang-Sae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.04a
    • /
    • pp.1226-1228
    • /
    • 2011
  • 본 논문에서는 유사 시퀀스 매칭에서 미리 버림 계산의 효율적인 방법을 제안한다. 미리 버림은 유사 시퀀스 매칭에서 유클리디안 거리 계산 도중 거리 계산 값이 허용치보다 큰 경우 나머지 거리 계산을 하지 않는 방법이다. 기존의 방법은 시퀀스 첫 엔트리를 시작으로 하여 유클리디안 거리 계산을 진행한다. 이 방법은 데이터 고려 없이 계산이 진행되기 때문에 데이터의 특성에 따라 효과가 크게 다른 점을 보인다. 본 논문에서는 미리 버림의 효과를 최대화 시키기 위해 유클리디안 거리 계산 시작점을 오프셋이라 정의하고, 이를 데이터 특성에 맞게 조절하는 방법을 제안한다. 실험 결과, 제안한 오프셋 조절 미리 버림 방법이 대용량의 데이터 베이스 기반 시스템에서 기존 기법에 비해 좋은 성능 향상시킨 것으로 나타났다.

A Hierarchical Clustering Algorithm Using Extended Sequence Element-based Similarity Measure (확장된 시퀀스 요소 기반의 유사도를 이용한 계층적 클러스터링 알고리즘)

  • Oh, Seung-Joon
    • Journal of the Korea Society of Computer and Information
    • /
    • v.11 no.5 s.43
    • /
    • pp.321-327
    • /
    • 2006
  • Recently there has been enormous growth in the amount of commercial and scientific data. Such datasets consist of sequence data that have an inherent sequential nature. However, only a few of the existing clustering algorithms consider sequentiality. This study presents a similarity measure and a method for clustering such sequence datasets. Especially, we present an extended concept of the measure of similarity, which considers various conditions. Using a splice dataset, we show that the quality of clusters generated by our proposed clustering algorithm is better than that of clusters produced by traditional clustering algorithms.

  • PDF