• Title/Summary/Keyword: 유사도 측정 기법

Search Result 620, Processing Time 0.033 seconds

Fall-Velocity Measurement Using Image Analysis Technique (영상해석기법을 이용한 침강속도 측정)

  • Yun, Byeong-Man;Yu, Gwon-Gyu;No, Yeong-Sin
    • Journal of Korea Water Resources Association
    • /
    • v.34 no.4
    • /
    • pp.327-333
    • /
    • 2001
  • Particle tracking velocimetry (PTV) is introduced and applied to the fall-velocity measurement. The fall velocities of sediment particles were measured using PTV in the still water and compared with the values presented in the existing literature. Comparison shows that PTV measures the fall velocities accurately. This result enables the measurement of fall velocity in the turbulent flows, which was not possible with conventional methods.

  • PDF

A Hybrid Clustering Technique for Processing Large Data (대용량 데이터 처리를 위한 하이브리드형 클러스터링 기법)

  • Kim, Man-Sun;Lee, Sang-Yong
    • The KIPS Transactions:PartB
    • /
    • v.10B no.1
    • /
    • pp.33-40
    • /
    • 2003
  • Data mining plays an important role in a knowledge discovery process and various algorithms of data mining can be selected for the specific purpose. Most of traditional hierachical clustering methode are suitable for processing small data sets, so they difficulties in handling large data sets because of limited resources and insufficient efficiency. In this study we propose a hybrid neural networks clustering technique, called PPC for Pre-Post Clustering that can be applied to large data sets and find unknown patterns. PPC combinds an artificial intelligence method, SOM and a statistical method, hierarchical clustering technique, and clusters data through two processes. In pre-clustering process, PPC digests large data sets using SOM. Then in post-clustering, PPC measures Similarity values according to cohesive distances which show inner features, and adjacent distances which show external distances between clusters. At last PPC clusters large data sets using the simularity values. Experiment with UCI repository data showed that PPC had better cohensive values than the other clustering techniques.

A Localization Method using Similarity of RSSI in WSN (무선 센서네트워크에서 수신신호세기의 유사도를 이용한 위치결정 기법)

  • Park Chan-Sik;Kim Seung-Beom;Gang Dong-Yeon;Cha Eun-Jong;Lee Sang-Jeong
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2006.05a
    • /
    • pp.179-182
    • /
    • 2006
  • WSN에서 위치를 구하는 방법으로 WLSQ와 DB를 이용하는 방법이 대표적이다. WLSQ에서는 수신된 RSSI로부터 거리를 구하고 구해진 거리를 이용하여 위치를 구하며, 구해진 위치의 정확도는 측정된 RSSI의 정확도와 이로부터 거리를 구하는 알고리즘에 좌우된다. DB를 이용하는 기법은 DB를 구축하는 방법과 측정된 RSSI와 DB를 비교하는 기법에 따라 정확도가 결정된다. 본 논문에서는 수신된 RSSI와 DB를 비교하여 위치를 구하는 기법의 구현 및 성능을 나타내었으며, WLSQ의 결과와 비교하였다.

  • PDF

Purchase Transaction Similarity Measure Considering Product Taxonomy (상품 분류 체계를 고려한 구매이력 유사도 측정 기법)

  • Yang, Yu-Jeong;Lee, Ki Yong
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.8 no.9
    • /
    • pp.363-372
    • /
    • 2019
  • A sequence refers to data in which the order exists on the two items, and purchase transaction data in which the products purchased by one customer are listed is one of the representative sequence data. In general, all goods have a product taxonomy, such as category/ sub-category/ sub-sub category, and if they are similar to each other, they are classified into the same category according to their characteristics. Therefore, in this paper, we not only consider the purchase order of products to compare two purchase transaction sequences, but also calculate their similarity by giving a higher score if they are in the same category in spite of their difference. Especially, in order to choose the best similarity measure that directly affects the calculation performance of the purchase transaction sequences, we have compared the performance of three representative similarity measures, the Levenshtein distance, dynamic time warping distance, and the Needleman-Wunsch similarity. We have extended the existing methods to take into account the product taxonomy. For conventional similarity measures, the comparison of goods in two sequences is calculated by simply assigning a value of 0 or 1 according to whether or not the product is matched. However, the proposed method is subdivided to have a value between 0 and 1 using the product taxonomy tree to give a different degree of relevance between the two products, even if they are different products. Through experiments, we have confirmed that the proposed method was measured the similarity more accurately than the previous method. Furthermore, we have confirmed that dynamic time warping distance was the most suitable measure because it considered the degree of association of the product in the sequence and showed good performance for two sequences with different lengths.

A Hierarchical Representatives Clustering Technique for Data Mining (데이터 마이닝을 위한 계층적 대표값 군집화 기법)

  • 안병주;김은주;이일병
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.69-71
    • /
    • 2000
  • 군집화는 데이터 집합을 유사한 데이터 개체들의 군집들로 분할하여 데이터 속에 존재하는 의미 있는 정보를 얻는 과정이다. 대부분의 군집화 기법들은 비교적 적은 양의 데이터를 대상으로 한 것이고 다차원 대용량의 데이터 처리에 관한 문제는 다루지 않고 있어서 데이터 마이닝을 위한 군집화 기법으로는 부적절하다. 따라서 본 논문을 통해 대용량의 데이터에 적용할 수 있는 새로운 군집화 알고리즘인 계층적 대표값 군집화(HRC) 기법을 제안한다. HRC는 자기조직화지도와 계층적 군집화 기법을 접목한 하이브리드 방법으로 두 단계에 거쳐 군집화를 수행한다. 첫 번째 단계에서 자기조직화지도를 통해 데이터를 요약하고, 두 번째 단계에서 요약된 대표값 정보만을 가지고 계층적인 군집화를 수행한다. 또한, 두 번째 단계의 계층적 군집화 적용시 양질의 군집을 발견하기 위해 군집간의 유사도를 측정하는 새로운 척도를 고안하였다. 그리고 실험을 통해 HRC와 기존 군집화 알고리즘이 발견한 군집의 질을 비교하여 성능을 평가했다.

  • PDF

Modifying Sparse Data for Collaborative Filtering (협동적 여과를 위한 희소 데이터 변형 기법)

  • Kim, Hyung-Il;Kim, Jun-Tae
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.610-612
    • /
    • 2005
  • 협동적 여과를 이용한 추천 시스템은 데이터의 희소성 문제(sparseness problem)와 초기 추천 문제 (cold-start problem)에 대해 취약점을 가지고 있다. 협동적 여과를 이용한 추천 시스템에서 사용하는 선호도 데이터에 아이템들의 전체 수량에 비해 매우 적은 양의 아이템 선호도만 존재한다면 사용자들의 유사도 측정에 문제를 발생시켜 극단적인 경우엔 협동적 추천이 불가능할 경우가 발생한다. 이와 같은 문제는 선호도 데이터에 나타난 아이템들의 총수에 비해 사용자가 선호(구매)한 아이템이 극히 적은 수량으로 존재하기 때문이며 새로운 사용자의 경우에는 아이템 선호도 정보가 전혀 없기 때문에 유사 사용자를 추출하지 못하여 아이템을 전혀 추천할 수 없는 문제가 발생한다. 본 논문에서는 희소성이 높은 선호도 데이터를 희소하지 않은 상태로 변형하는 희소 데이터 변형 기법을 제안한다. 희소 데이터 변형 기법은 희소데이터에 나타난 사용자와 아이템의 추가 속성 정보의 확률분포를 이용하여 알려지지 않은 선호도 값을 예측함으로써 희소성이 높은 선호도 데이터를 변경하고, 변경된 선호도 데이터를 협동적 추천에 적용하여 추천 성능을 향상시킨다. 이와 같은 선호도 데이터 변경 기법을 데이터 블러링(data blurring)이라 한다. 몇가지 실험 결과를 통해 제안된 기법의 효과를 확인하였다.

  • PDF

Cause Diagnosis Method of Semiconductor Defects using Block-based Clustering and Histogram x2 Distance (블록 기반 클러스터링과 히스토그램 카이 제곱 거리를 이용한 반도체 결함 원인 진단 기법)

  • Lee, Young-Joo;Lee, Jeong-Jin
    • Journal of Korea Multimedia Society
    • /
    • v.15 no.9
    • /
    • pp.1149-1155
    • /
    • 2012
  • In this paper, we propose cause diagnosis method of semiconductor defects from semiconductor industrial images. Our method constructs feature database (DB) of defect images. Then, defect and input images are subdivided by uniform block. And the block similarity is measured using histogram kai-square distance after color histogram calculation. Then, searched blocks in each image are merged into connected objects using clustering. Finally, the most similar defect image from feature DB is searched with the defect cause by measuring cluster similarity based on features of each cluster. Our method was validated by calculating the search accuracy of n output images having high similarity. With n = 1, 2, 3, the search accuracy was measured to be 100% regardless of defect categories. Our method could be used for the industrial applications.

Sentence Similarity Analysis using Ontology Based on Cosine Similarity (코사인 유사도를 기반의 온톨로지를 이용한 문장유사도 분석)

  • Hwang, Chi-gon;Yoon, Chang-Pyo;Yun, Dai Yeol
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2021.05a
    • /
    • pp.441-443
    • /
    • 2021
  • Sentence or text similarity is a measure of the degree of similarity between two sentences. Techniques for measuring text similarity include Jacquard similarity, cosine similarity, Euclidean similarity, and Manhattan similarity. Currently, the cosine similarity technique is most often used, but since this is an analysis according to the occurrence or frequency of a word in a sentence, the analysis on the semantic relationship is insufficient. Therefore, we try to improve the efficiency of analysis on the similarity of sentences by giving relations between words using ontology and including semantic similarity when extracting words that are commonly included in two sentences.

  • PDF

Development of GRD Measurement Method using Natural Target in Imagery (영상 내 자연표적을 이용한 GRD 측정기법 개발)

  • Kim, Jae-In;Jeong, Jae-Hoon;Kim, Tae-Jung
    • Korean Journal of Remote Sensing
    • /
    • v.26 no.5
    • /
    • pp.527-536
    • /
    • 2010
  • This paper reports a reliable GRD (Ground Resolved Distance) measurement method of using natural targets instead of the method using artificial targets. For this, we developed an edge profile extraction technique suitable for natural targets. We demonstrated the accuracy and stability of this technique firstly by comparing GRD values generated by this technique visually inspected GRD values for artificial targets taken in laboratory environments. We then demonstrated the feasibility of GRD estimation from natural targets by comparing GRD values from natural targets to those from artificial targets using satellite images containing both artificial and natural targets. The GRDs measured from the proposed method were similar to the values from visual inspection and the GRDs measured from the natural targets were similar to the values from artificial targets. These results support our proposed method is able to measure reliable GRD from natural targets.

Similarity Measurement System of Korean Documents Using the Specified Particles and High Frequency Words (특정 조사와 빈도수 높은 단어를 이용한 한글 논문의 유사도 측정 시스템 구현)

  • Yoo, Seung-Hee;Han, So-Hee;Cho, Dong-Sub
    • Proceedings of the KIEE Conference
    • /
    • 2007.07a
    • /
    • pp.1829-1830
    • /
    • 2007
  • 인터넷의 발달로 대량의 전자문서들을 손쉽게 구할 수 있는 정보의 바다라 불리는 현대사회에서 논문 표절은 심각한 문제를 안게 되었다. 표절여부를 검사하는 방법에는 여러 가지가 있지만 보다 정확하고 빠르게 검출할 수 있는 기법이 요구된다. 외국에서는 표절을 검사하기 위한 시스템적인 접근이 이루어지고 있지만 국내에서의 표절 검사에 대한 연구는 아직 초기 단계에 있다. 본 논문에서는 논문 표절 검사 시스템에 사용되는 기법 중 지문법을 바탕으로 하지만 기존의 단어, 문장 등을 사용하는 방법과 차별을 두어 몇몇 주요 단어와 특정 조사의 비교를 이용해 유사성을 측정하여 보다 빠르고 정확하게 검출할 수 있는 시스템을 구현해 보았다.

  • PDF