• 제목/요약/키워드: Similarity Measurement Method

검색결과 178건 처리시간 0.028초

POI(Point Of Interest) 데이터 검색에서 문자열 유사도 측정 정확도 향상 기법 (Accuracy Improvement Methods for String Similarity Measurement in POI(Point Of Interest) Data Retrieval)

  • 고은별;이종우
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제20권9호
    • /
    • pp.498-506
    • /
    • 2014
  • 교통의 발달로 활동범위가 넓은 현대인들은 네비게이션과 지도 앱을 통한 길찾기 검색을 자주 이용한다. 하지만 기존 검색 시스템에서는 부정확한 질의어가 입력되면 원하는 결과를 출력하지 못한다. 이 문제를 해결하기 위해 집합-기반 POI 검색 알고리즘이 등장했고 이어 문자열 유사도 측정 기법, 중복 글자를 고려한 검색 알고리즘이 연구되었다. 본 논문에서는 이전에 연구된 문자열 유사도 측정 알고리즘의 정확도를 향상시킨 기법을 제안한다. 기존 문자열 유사도 측정 기법에서 고려하지 않았던 고유어의 추정단계와 중복 단어를 고려한 블록 및 블록 나열 순서 구하기를 추가하고 측정 기법을 수식화한다. 이를 통해 측정방법을 체계적으로 표현하고 일반화함으로써 POI 검색 결과의 정확도를 향상시킨다. 실험을 통해 본 논문에서 제시하는 기법이 검색 결과 및 검색 순위의 정확도를 향상시킨다는 것을 확인하였다.

퍼지 관계를 활용한 사례기반추론 예측 정확성 향상에 관한 연구 (A Study on Forecasting Accuracy Improvement of Case Based Reasoning Approach Using Fuzzy Relation)

  • 이인호;신경식
    • 지능정보연구
    • /
    • 제16권4호
    • /
    • pp.67-84
    • /
    • 2010
  • 미래에 대한 정확한 예측은 경영자, 또는 기업이 수행하는 경영의사결정에 매우 중요한 역할을 한다. 예측만 정확하다면 경영의사결정의 질은 매우 높아질 수 있을 것이다. 하지만 점점 가속화되고 있는 경영 환경의 변화로 말미암아 미래 예측을 정확하게 하는 일은 점점 더 어려워지고 있다. 이에 기업에서는 정확한 예측을 위하여 전문가의 휴리스틱뿐만 아니라 과학적 예측모형을 함께 활용하여 예측의 성과를 높이는 노력을 해 오고 있다. 본 연구는 사례기반추론모형을 예측을 위한 기본 모형으로 설정하고, 데이터 간의 유사도 측정에 퍼지 관계의 개념을 적용함으로써 개선된 예측성과를 얻고자 하였다. 특히, 독립변수 중 기호 데이터 형식의 속성을 가지는 변수들간의 유사도를 측정하기 위해 이진논리의 개념(일치여부의 판단)과 퍼지 관계 및 합성의 개념을 이용하여 도출된 유사도 매트릭스를 사용하였다. 연구 결과, 기호 데이터 형식의 속성을 가지는 변수들 간의 유사도 측정에서 퍼지 관계 및 합성의 개념을 적용하는 방법이 이진논리의 개념을 적용하는 방법과 비교하여 더 우수한 예측정확성을 나타내었다. 그러나 유사도 측정을 위해 다양한 퍼지합성방법(Max-min 합성, Max-product 합성, Max-average 합성)을 적용하여 예측하는 경우에는 예측정확성 측면에서 퍼지 합성방법 간의 통계적인 차이는 유의하지 않았다. 본 연구는 사례기반추론 모형의 구축에서 가장 중요한 유사도 측정에 있어서 퍼지 관계 및 퍼지 합성의 개념을 적용함으로써 유사도 측정 및 적용 방법론을 제시하였다는데 의의가 있다.

누설전류 측정을 통한 활선 절연물의 오손도 추정 (Estimation of Pollution Degree for Liveline Insulator with Leakage Current Measurement)

  • 심규일;최남호;박강식;한상옥
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2001년도 하계학술대회 논문집 C
    • /
    • pp.1472-1474
    • /
    • 2001
  • In this paper, a method was presented to estimate the contamination degree of outdoor insulator by the measurement of surface leakage current. Contamination is one of the most important factor to determine the performance of insulator. Thus, it is very important to exam the contamination degree on the outdoor insulator. There are many limits, such as reliability of data, interval of measurement and similarity of environmental conditions, in conventional method. So, the estimation technique for contamination has been needed to monitor the accurate pollution degree of insulator in situ. In this investigation, phase difference was measured to compare the variance of phase difference with the contamination degree and relative humidity. From the result, we could confirm the capability of the estimation method.

  • PDF

최소 DTW 거리 기반의 데이터 시퀀스 색인 기법 (Sequence Data Indexing Method based on Minimum DTW Distance)

  • 길기정;송석일;송재종;이석필;장세진;이종설
    • 한국콘텐츠학회논문지
    • /
    • 제11권12호
    • /
    • pp.52-59
    • /
    • 2011
  • 이 논문에서는 시퀀스 데이터베이스에서 효과적인 유사 검색을 지원하기 위한 색인 기법을 제안한다. 제안하는 색인 기법에서는 데이터 시퀀스에 대한 필터링 효과를 얻기 위해, 최소 DTW 거리를 새롭게 제안한다. 최소 DTW 거리는 유사한 데이터 시퀀스 그룹과 질의 시퀀스 사이의 최소거리를 측정하는 방법이다. 최소 DTW 거리는 계층적인 색인 구조를 통해서 시퀀스 데이터베이스를 필터링하면서 유사도 검색을 수행할 수 있도록 한다. 마지막으로, 실험을 통해서 제안하는 방법의 우수성을 입증한다.

양생기공과 심리기술훈련의 구성요인과 측정평가방법의 비교 연구 (Comparative Study on the Configuration Factors and Measurement Method of Yangsaeng Gigong and Psychological Skills Training)

  • 정미영;한창현;박수진;이상남;권영규
    • 동의생리병리학회지
    • /
    • 제22권5호
    • /
    • pp.1047-1056
    • /
    • 2008
  • If we can evaluate the training results more appropriately and analyze the psychological changes in more objectively, the training can be more efficient and it can help to solve the problems during the training. This research analyzed the similarity and differences of Yangseng Qigong and psychological skill training's components and measurement methods. Also, the research further studied psychological skill training's measurement method. Results : The measurement type of Yangseng Qigong are Sagong, a record of Sagong, Damgong, IIgi, and Sogyeol. Similarly, the measurement type of psychological skills training are questionnaire, interview, personal profile, and observation of a single subject. Despite the similarities between the measurement type of Yangsaeng Qigong and psychological skills training, unfortunately there are differences in the contents. Thus, If we introduce strengths of each method to the other, we may have better measurement methods. The questionnaire method of psychological skills training is the most commonly used method, because it gives concrete, objective, reliable and highly reproducible results. If we refer to the questionnaire development process in psychological skills training, we can have objective and concrete measurement tool for Yangsaeng Qigong training. In the psychological skills training measurement tool development process, there are 5 stages; test conception, test preparation, test execution, question analysis, and test modification. Furthermore, the requirements for the good survey are reliability, validity, practicality, and cultural appropriateness. Through this study, we reached the conclusion that we need to combine two methods together to develop a better method because Yangsaeng Qigong places importance on comprehensive method and realization while psychological skills training places importance on analytical method and objective evaluation. And It seems that a practical study is needed to resolve the concerete problems of Yansaeng Qigong through these concrete cases.

Plagiarism Detection among Source Codes using Adaptive Methods

  • Lee, Yun-Jung;Lim, Jin-Su;Ji, Jeong-Hoon;Cho, Hwaun-Gue;Woo, Gyun
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제6권6호
    • /
    • pp.1627-1648
    • /
    • 2012
  • We propose an adaptive method for detecting plagiarized pairs from a large set of source code. This method is adaptive in that it uses an adaptive algorithm and it provides an adaptive threshold for determining plagiarism. Conventional algorithms are based on greedy string tiling or on local alignments of two code strings. However, most of them are not adaptive; they do not consider the characteristics of the program set, thereby causing a problem for a program set in which all the programs are inherently similar. We propose adaptive local alignment-a variant of local alignment that uses an adaptive similarity matrix. Each entry of this matrix is the logarithm of the probabilities of the keywords based on their frequency in a given program set. We also propose an adaptive threshold based on the local outlier factor (LOF), which represents the likelihood of an entity being an outlier. Experimental results indicate that our method is more sensitive than JPlag, which uses greedy string tiling for detecting plagiarism-suspected code pairs. Further, the adaptive threshold based on the LOF is shown to be effective, and the detection performance shows high sensitivity with negligible loss of specificity, compared with that using a fixed threshold.

Evaluating the Contribution of Spectral Features to Image Classification Using Class Separability

  • Ye, Chul-Soo
    • 대한원격탐사학회지
    • /
    • 제36권1호
    • /
    • pp.55-65
    • /
    • 2020
  • Image classification needs the spectral similarity comparison between spectral features of each pixel and the representative spectral features of each class. The spectral similarity is obtained by computing the spectral feature vector distance between the pixel and the class. Each spectral feature contributes differently in the image classification depending on the class separability of the spectral feature, which is computed using a suitable vector distance measure such as the Bhattacharyya distance. We propose a method to determine the weight value of each spectral feature in the computation of feature vector distance for the similarity measurement. The weight value is determined by the ratio between each feature separability value to the total separability values of all the spectral features. We created ten spectral features consisting of seven bands of Landsat-8 OLI image and three indices, NDVI, NDWI and NDBI. For three experimental test sites, we obtained the overall accuracies between 95.0% and 97.5% and the kappa coefficients between 90.43% and 94.47%.

벡터 공간 모델과 HAL에 기초한 단어 의미 유사성 군집 (Word Sense Similarity Clustering Based on Vector Space Model and HAL)

  • 김동성
    • 인지과학
    • /
    • 제23권3호
    • /
    • pp.295-322
    • /
    • 2012
  • 본 연구에서는 벡터 공간 모델과 HAL (Hyperspace Analog to Language)을 적용해서 단어 의미 유사성을 군집한다. 일정한 크기의 문맥을 통해서 단어 간의 상관성을 측정하는 HAL을 도입하고(Lund and Burgess 1996), 상관성 측정에서 고빈도와 저빈도에 다르게 측정되는 왜곡을 줄이기 위해서 벡터 공간 모델을 적용해서 단어 쌍의 코사인 유사도를 측정하였다(Salton et al. 1975, Widdows 2004). HAL과 벡터 공간 모델로 만들어지는 공간은 다차원이므로, 차원을 축소하기 위해서 PCA (Principal Component Analysis)와 SVD (Singular Value Decomposition)를 적용하였다. 유사성 군집을 위해서 비감독 방식과 감독 방식을 적용하였는데, 비감독 방식에는 클러스터링을 감독 방식에는 SVM (Support Vector Machine), 나이브 베이즈 구분자(Naive Bayes Classifier), 최대 엔트로피(Maximum Entropy) 방식을 적용하였다. 이 연구는 언어학적 측면에서 Harris (1954), Firth (1957)의 분포 가설(Distributional Hypothesis)을 활용한 의미 유사도를 측정하였으며, 심리언어학적 측면에서 의미 기억을 설명하기 위한 모델로 벡터 공간 모델과 HAL을 결합하였으며, 전산적 언어 처리 관점에서 기계학습 방식 중 감독 기반과 비감독 기반을 적용하였다.

  • PDF

전처리 기반 히스토그램 거리측정에 의한 효율적인 표정인식 (An Efficient Facial Expression Recognition by Measuring Histogram Distance Based on Preprocessing)

  • 조용현
    • 한국지능시스템학회논문지
    • /
    • 제19권5호
    • /
    • pp.667-673
    • /
    • 2009
  • 본 논문에서는 전처리 기반 히스토그램 거리측정에 의한 효율적인 얼굴표정 인식기법을 제안하였다. 여기서 전처리는 중심이동과 히스토그램 평활화에 의해 인식성능을 개선하기 위함이고, 히스토그램 사이의 거리측정은 영상 상호간의 유사도를 측정하기 위함이다. 특히 중심이동은 1차 모멘트 평형에 기반을 둔 것으로 불필요한 배경을 제거시켜 위치나 크기 변화에 강건한 인식을 위함뿐만 아니라 거리의 측정부하를 줄이기 위함이다. 히스토그램 평활화는 조명의 세기에 의한 영상의 명암대비 감소에 강건한 인식을 위함이다. 제안된 기법을 320*243 픽셀의 72개(4명*18장) 표정얼굴을 대상으로 히스토그램 사이의 유사도 측정을 위해서 city-block, Euclidean, 그리고 ordinal 거리를 각각 이용하였다. 실험결과, 제안된 기법은 중심이동 및 히스토그램 평활화의 전처리를 거치지 않는 기법보다 우수한 인식성능이 있으며, ordinal 거리가 가장 높은 인식성능이 있음을 확인하였다.

바타챠랴 거리 측정법을 이용한 음소 유사율 오류 보정 개선 시스템 (Phoneme Similarity Error Correction System using Bhattacharyya Distance Measurement Method)

  • 안찬식;오상엽
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권6호
    • /
    • pp.73-80
    • /
    • 2010
  • 어휘 인식 시스템은 부정확한 어휘 제공과 유사한 음소 인식으로 인식률이 저하되며 이는 유사한 음소인식 오인식과 효율적 특징 추출 처리를 위한 방법을 필요로 한다. 따라서 본 논문에서는 음소가 갖는 특징을 기반으로 바타챠랴 거리 측정법을 이용한 음소 유사율 오류 보정 개선 시스템을 제안하였다. 음소 유사율은 모노폰으로 훈련시킨 훈련 데이터의 음소에 HMM 특징 추출 방법을 이용하였으며 유사한 음소는 바타챠랴 거리 측정법을 이용하여 정확한 음소로 인식할 수 있도록 유도하여 인식률 향상 효과를 얻을 수 있었다. 이를 유클리디안 거리 측정법과 동적타임 워핑 시스템에 비교한 시스템 성능 평가 결과 1.2%의 향상된 97.91% 인식률을 보였다.