• Title/Summary/Keyword: 유사도 평가

Search Result 5,954, Processing Time 0.037 seconds

Query Term Expansion and Reweighting using Term Co-Occurrence Similarity and Fuzzy Inference (용어 발생 유사도와 퍼지 추론을 이용한 질의 용어 확장 및 가중치 재산정)

  • Kim, Ju-Yeon;Kim, Byeong-Man
    • Journal of KIISE:Software and Applications
    • /
    • v.27 no.9
    • /
    • pp.961-972
    • /
    • 2000
  • 본 논문에서는 사용자의 적합 피드백을 기반으로 적합 문서들에서 발생하는 용어들과 초기 질의어간의 발생 빈도 유사도 및 퍼지 추론을 이용하여 용어의 가중치를 산정하는 방법에 대하여 제안한다. 피드백 문서들에서 발생하는 용어들 중에서 불용어를 제외한 모든 용어들을 질의어로 확장될 수 있는 후보 용어들로 선택하고, 발생 빈도 유사성을 이용한 초기 질의어-후보 용어의 관련 정도, 용어의 IDF, DF 정보를 퍼지 추론에 적용하여 후보 용어의 초기 질의어에 대한 최종적인 관련 정도를 산정 하였으며, 피드백 문서들에서의 가중치와 관련 정도를 결합하여 후보 용어들의 가중치를 산정 하였다. 본 논문에서는 성능을 평가하기 위하여 KT-set 1.0과 KT-set 2.0을 사용하였으며, 성능의 상대적인 평가를 위하여 Dec-Hi 방법, 용어 분포 유사도를 이용한 방법, 퍼지 추론을 이용한 방법들을 정확률-재현률을 사용하여 평가하였다.

  • PDF

A Rank-based Similarity Measure for Collaborative Filtering Systems (협력 필터링 시스템을 위한 순위 기반의 유사도 척도)

  • Lee, Soo-Jung
    • The Journal of Korean Association of Computer Education
    • /
    • v.14 no.5
    • /
    • pp.97-104
    • /
    • 2011
  • Collaborative filtering is a methodology to recommend websites by obtaining data and opinions from the other users with similar tastes. During the past few years, this method has been used in various fields such as books, food, and movies in e-commerce systems. This study addresses the computation of similarity between users to determine items to be recommended in collaborative filtering systems. Previous studies measured similarity between users by treating each user's ratings independently without considering the distribution of the user's ratings. In contrast, this study measures similarity by utilizing position and rank information of each rating in the range of the user's ratings. The result of the experiments on the real datasets demonstrated that the proposed method improves the mean absolute error significantly, compared to the previous methods, especially when the predetermined range of ratings is large.

  • PDF

Experiment and Performance Evaluation of RIFLE Algorithm (RIFLE 알고리즘에 대한 실험 및 성능평가)

  • Kim Dong-Hoi;Won Young-Sang;Ko Young-woong;Kim Jin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.11a
    • /
    • pp.697-700
    • /
    • 2004
  • 서열의 유사성 검색에 잘 알려진 도구로는 BLAST 와 FASTA 가 있으며 이들 알고리즘은 알려지지 않은 유기체를 sequencing 작업을 통하여 얻어진 염기서열과 유전자 데이터베이스를 대상으로 유사성을 검색한다. 이때 서열의 유사성을 검색하기에 앞서 선행 되어야만 하는 sequencing작업은 시간적인 면에서 상당한 비용을 요구한다. 반면 sequencing 작업을 하기 않고도 간단한 실험에 의해 얻을 수 있는 부분적인 서열정보만을 대상으로 데이터베이스에서 검색 할 수 있는 알고리즘으로 RIFLE가 있다. 본 논문에서는 RIFLE 알고리즘을 구현하고 실험데이터를 생성하여 성능에 대한 분석 평가를 하고자 한다. 성능평가 결과 RIFLE 알고리즘은 시간복잡도 $O(n^2)$으로 빠른 반면 일부 서열에 있어서 실제 유사도에 비해 정확도가 낮게 평가되는 결과가 산출되었다.

  • PDF

A Rating Range-based Prediction Method for Collaborative Filtering Systems (협력필터링 시스템을 위한 평가 등급 범위 기반의 예측방법)

  • Lee, Soo-Jung
    • The Journal of Korean Association of Computer Education
    • /
    • v.14 no.4
    • /
    • pp.63-70
    • /
    • 2011
  • Recommender systems, which predict and recommend items that may possibly draw users' interests, have been applied in various fields as e-commerce systems are widespread. Collaborative filtering, one of the major methodologies of recommender systems, recommends either items similar to those preferred by the user, or items preferred by the other similar user. Therefore, two problems determine its performance; one is correct estimation of similarity and the other is predicting the real rating of the recommended item. This study addresses the latter problem. Previous studies predict the real rating based on the mean of the ratings, but this study proposes a prediction based on the range of the ratings and investigates its performance through experiments. As a result, it is demonstrated that the proposed method improves the mean absolute error significantly, compared to the previous method.

  • PDF

Comparative Evaluation of User Similarity Weight for Improving Prediction Accuracy in Personalized Recommender System (개인화 추천 시스템의 예측 정확도 향상을 위한 사용자 유사도 가중치에 대한 비교 평가)

  • Jung Kyung-Yong;Lee Jung-Hyun
    • Journal of the Institute of Electronics Engineers of Korea CI
    • /
    • v.42 no.6
    • /
    • pp.63-74
    • /
    • 2005
  • In Electronic Commerce, the latest most of the personalized recommender systems have applied to the collaborative filtering technique. This method calculates the weight of similarity among users who have a similar preference degree in order to predict and recommend the item which hits to propensity of users. In this case, we commonly use Pearson Correlation Coefficient. However, this method is feasible to calculate a correlation if only there are the items that two users evaluated a preference degree in common. Accordingly, the accuracy of prediction falls. The weight of similarity can affect not only the case which predicts the item which hits to propensity of users, but also the performance of the personalized recommender system. In this study, we verify the improvement of the prediction accuracy through an experiment after observing the rule of the weight of similarity applying Vector similarity, Entropy, Inverse user frequency, and Default voting of Information Retrieval field. The result shows that the method combining the weight of similarity using the Entropy with Default voting got the most efficient performance.

Image Quality Assessment Considering both Computing Speed and Robustness to Distortions (계산 속도와 왜곡 강인성을 동시 고려한 이미지 품질 평가)

  • Kim, Suk-Won;Hong, Seongwoo;Jin, Jeong-Chan;Kim, Young-Jin
    • Journal of KIISE
    • /
    • v.44 no.9
    • /
    • pp.992-1004
    • /
    • 2017
  • To assess image quality accurately, an image quality assessment (IQA) metric is required to reflect the human visual system (HVS) properly. In other words, the structure, color, and contrast ratio of the image should be evaluated in consideration of various factors. In addition, as mobile embedded devices such as smartphone become popular, a fast computing speed is important. In this paper, the proposed IQA metric combines color similarity, gradient similarity, and phase similarity synergistically to satisfy the HVS and is designed by using optimized pooling and quantization for fast computation. The proposed IQA metric is compared against existing 13 methods using 4 kinds of evaluation methods. The experimental results show that the proposed IQA metric ranks the first on 3 evaluation methods and the first on the remaining method, next to VSI which is the most remarkable IQA metric. Its computing speed is on average about 20% faster than VSI's. In addition, we find that the proposed IQA metric has a bigger amount of correlation with the HVS than existing IQA metrics.

Similarity Measure based on Utilization of Rating Distributions for Data Sparsity Problem in Collaborative Filtering

  • Lee, Soojung
    • Journal of the Korea Society of Computer and Information
    • /
    • v.25 no.12
    • /
    • pp.203-210
    • /
    • 2020
  • Memory-based collaborative filtering is one of the representative types of the recommender system, but it suffers from the inherent problem of data sparsity. Although many works have been devoted to solving this problem, there is still a request for more systematic approaches to the problem. This study exploits distribution of user ratings given to items for computing similarity. All user ratings are utilized in the proposed method, compared to previous ones which use ratings for only common items between users. Moreover, for similarity computation, it takes a global view of ratings for items by reflecting other users' ratings for that item. Performance is evaluated through experiments and compared to that of other relevant methods. The results reveal that the proposed demonstrates superior performance in prediction and rank accuracies. This improvement in prediction accuracy is as high as 2.6 times more than that achieved by the state-of-the-art method over the traditional similarity measures.

A Study on Language Modeling for Korean Legal Text Processing (한국어 법률 텍스트 처리를 위한 언어 모델링 연구)

  • Ye-Jee Kang;Fei Li;Yeon-Ji Jang;Hye-Rin Kang;Seo-Yoon Park;Han-Saem Kim
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.300-304
    • /
    • 2022
  • 본 논문은 한국어 법률 텍스트 처리를 위해 세 가지 서로 다른 사전 학습 모델을 미세 조정하여 그 성능을 평가하였다. 성능을 평가하기 위해 타겟 판결 요지에 대한 판결 요지 후보를 추출하여 판결 요지 간의 유사도를 계산하였다. 또한 유사도를 바탕으로 추출된 판결 요지가 실제 법률 전문가와 일반 언어학자의 직관에 부합하는지 판단하기 위해 정성적 평가를 진행하였다. 그 결과 법률 전문가가 법률 전문 지식이 없는 일반 언어학자에 비해 판결 요지 간 유사도를 낮게 평가하였는데 법률 전문가가 법률 텍스트의 유사성을 판단하는 기준이 기계와 일반 언어학자와는 달라 전문가 자문에 기반한 한국어 법률 AI 모델 개발의 필요성을 확인하였다. 최종 연구 결과로 한국어 법률 AI 프레임워크를 제안하였다.

  • PDF

A Framework to Evaluate Communication Quality of Operators in Nuclear Power Plants Using Cosine Similarity (코사인 유사도를 이용한 원자력발전소 운전원 커뮤니케이션 품질 평가 프레임워크)

  • Kim, Seung-Hwan;Park, Jin-Kyun;Han, Sang-Yong
    • Journal of the Korea Society of Computer and Information
    • /
    • v.15 no.9
    • /
    • pp.165-172
    • /
    • 2010
  • Communication problems have been regarded as one of the biggest causes in trouble in many industries. This led to extensive research on communication as a part of human error analysis. The results of existing researches have revealed that maintaining a good quality of communication is essential to secure the safety of a large and complex process system. In this paper, we suggested a method to measure the quality of communication during off-normal situation in main control room of nuclear power plants. It evaluates the cosine similarity that is a measure of sentence similarity between two operators by finding the cosine of the angle between them. To check the applicability of the method to evaluate communication quality, we compared the result of communication quality analysis with the result of operation performance that was performed by operators under simulated environment.

Evaluating Applicability of Sediment Transport Capacity Equations through Sensitivity Analysis (민감도 분석을 통한 유사이송용량 산정식의 적용성 평가)

  • Her, Younggu;Hwang, Syewoon
    • Journal of The Korean Society of Agricultural Engineers
    • /
    • v.57 no.6
    • /
    • pp.79-90
    • /
    • 2015
  • 유사는 오염물질을 저장 또는 운반하는 매개체로 하류 수체의 물리적, 화학적, 생물학적 과정에 큰 영향을 미친다. 따라서 유사 발생 및 운송 양의 추정은 수질개선을 위한 유역관리계획을 수립하는데 중요한 자료가 된다. 이러한 유사량 및 운송과정은 주로 모형에 의해 계산되고 모의되는데, 많은 유사운송모형들이 유사이송용량 (sediment transport capacity)식을 이용하여 유사 발생량, 이송량 및 퇴적량을 산정한다. 유출에 의한 유사이송용량을 산정하기 위한 기존의 식들은 각기 다른 목적과 환경에서 개발되어 보편적으로 적용할 수 있는 식은 전무한 실정이다. 이에 본 연구는 유사이송용량을 계산하기 위해 사용되는 식들의 개발 목적과 환경을 검토하고, 경사, 유량, 유사입경 및 토성에 따른 민감도를 조사하여 각 식의 적용성을 평가하였다. 본 연구에서 적용한 8개의 유사이송용량 산정식은 모두 경사도에 가장 민감하게 변화하는 것으로 나타났다. Abraham과 Yalin식 이외의 산정식을 이용하여 계산된 유사이송용량은 경사도가 0.1 % 보다 작을 때는 0 mg/l, 경사도가 100 % 보다 클 때는 이론최대치인 2,650 mg/l 을 넘는 것으로 나타나, 이들 산정식의 적용 가능한 경사도 범위를 0.1 %-100 %로 추정할 수 있었다. Abrahams식은 유량에, Bagnold식은 유사입경 및 토성에 민감한 것으로 나타났다. Low, Rickenmann, 및 Schoklitsch식은 유량에 민감하게 반응하지 않았고, Low와 Schoklitsch식은 토성에도 민감하지 않은 것으로 나타나, 이들 식의 제한된 적용성을 확인하였다. 한편, Yang식은 계산식에 포함된 로그항으로 인해 그 적용범위가 제한되는 경우가 있었다. Abrahams과 Yalin식을 이용하여 산정된 유사운송용량은 모든 인자들에 민감하게 반응하는 것으로 나타났으며, Yalin과 Low식의 경우, silt와 clay에 적용되었을 때 유량이 클수록 유사운송용량이 다소 작아지는 경향을 보임에 따라, 전체적으로 Abraham식의 적용성이 가장 높은 것으로 평가되었다. 본 연구결과는 향후 모형을 이용한 유사량 모의 시 적용대상 지역의 특성에 가장 적합한 유사운송용량 산정식을 선정하는데 유용한 정보를 제공할 것으로 기대된다.