• 제목/요약/키워드: Similarity degree

검색결과 457건 처리시간 0.026초

개인화 추천 시스템의 예측 정확도 향상을 위한 사용자 유사도 가중치에 대한 비교 평가 (Comparative Evaluation of User Similarity Weight for Improving Prediction Accuracy in Personalized Recommender System)

  • 정경용;이정현
    • 전자공학회논문지CI
    • /
    • 제42권6호
    • /
    • pp.63-74
    • /
    • 2005
  • 전자상거래에서 최근 대부분의 개인화된 추천 시스템들은 협력적 필터링 기술을 적용하고 있다. 이 방법은 사용자의 성향에 맞는 아이템을 예측하고 추천하기 위하여 비슷한 선호도를 가지는 사용자들간의 유사도 가중치를 계산한다. 이때 일반적으로 피어슨 상관계수를 많이 사용한다. 그러나 이 방법은 두 사용자가 공통으로 선호도를 평가한 아이템들이 있을 때만 상관관계를 계산할 수 있으므로 예측의 정확도는 떨어진다. 사용자 유사도 가중치는 사용자의 성향에 맞는 아이템을 예측하는 경우 뿐만 아니라 개인화된 추천 시스템의 성능에 영향을 미칠 수 있다. 본 논문에서는 정보검색 분야의 벡터 유사도, 엔트로피, 역 사용자 빈도, 기본 선호도 평가를 적용하여 유사도 가중치 공식에 대해서 살펴보고, 추천 시스템의 예측 정확도 향상에 대해서도 실험을 통해 확인해 보았다. 실험 결과는 엔트로피를 이용한 유사도 가중치에 기본 선호도 평가를 결합하는 방법이 가장 성능이 우수함을 알 수 있다.

퍼지 유사 척도에 관한 연구 (A Study on the Fuzzy Similarity Measure)

  • 김용수
    • 한국지능시스템학회논문지
    • /
    • 제7권2호
    • /
    • pp.66-69
    • /
    • 1997
  • 본 논문에서는 퍼지 유사 척도가 제시된다. 제시된 퍼지 유사 척도는 유사도를 결정하기 위해서 유크라디안 거리와 함께 데이터와 클러스터 대표값들 사이의 상대적 거리를 고려한다. 클러스터의 경계선은 경쟁이 심한 곳에서는 축소되며 경쟁이 심하지 않은 곳에서는 확장된다. 본 논문의 결과는 상대적 거리를 유사 척도로 사용하는 가능성을 보인다.

  • PDF

Dynamic Analysis of Group Cohesiveness

  • Sohn, Tae-Won
    • 한국시스템다이내믹스학회:학술대회논문집
    • /
    • 한국시스템다이내믹스학회 1999년도 창립학술대회발표논문집
    • /
    • pp.37-58
    • /
    • 1999
  • Group cohesiveness has been one of the most important issues in the study of group dynamics. Most studies on group cohesiveness, however, have concentrated on specific investigations exploring the relationships between certain selected variables in a static mode. For example, one study examines how the degree of member similarity affects the degree of cohesiveness (Terborg, et al., 1976).(omitted)

상대적 소수 함수에 기반을 둔 새로운 유사성 측도와 언어 근사에의 응용 (A New Similarity Measure based on RMF and It s Application to Linguistic Approximation)

  • 최대영
    • 정보처리학회논문지B
    • /
    • 제8B권5호
    • /
    • pp.463-468
    • /
    • 2001
  • 상대적 소속 함수(RMF)에 기반을 둔 새로운 유사성 측도를 제안한다. 본 논문에서는 RMF는 퍼지 부분 집합간의 상대성을 쉽게 나타내기 위해 제시되었다. 이러한 RMF의 형태는 매개변수값들에 따라 결정되기 때문에 매개변수 값들만을 조정해 줌으로써 퍼지 부분 집합간의 상대성을 쉽게 나타낼 수 있다. 그러므로 퍼지 부분 집합을 이용해 주관성을 표현할 때 개인이나 문화차이간의 상대성을 쉽게 반영해 줄수 있다. 이 경우이들 매개변수들은 퍼비 부분 집합의 구조를 결정해 주는 특징점들이라고 할수 있다. 결과적으로 퍼지 부분 집합간의 유사성 정도가 RMF의 매개변수들을 이용해서 빠르게 계산될 수 있다. RMF에 의해 퍼지 부분 집합간의 유사성 정도를 계산하기 위해 유클리디안 거리를 사용한다. 한편, 제안된 유사성 측도의 응용 분야로 새로운 언어 근사 방법을 제시하고 수치적인 예를 보여준다.

  • PDF

대표 속성을 이용한 최적 연관 이웃 마이닝 (Optimal Associative Neighborhood Mining using Representative Attribute)

  • 정경용
    • 전자공학회논문지CI
    • /
    • 제43권4호
    • /
    • pp.50-57
    • /
    • 2006
  • 최근 정보 기술의 발전에 따라 다양하고 폭넓은 정보들이 디지털 형태로 빠르게 생산 및 배포되고 있다. 사용자가 이러한 정보과잉 속에서 자신이 원하는 정보를 단시간 내에 검색하는 것은 그리 쉬운 일이 아니다. 따라서 유비쿼터스 상거래에서 사용자가 정보를 효율적으로 이용할 수 있도록 제어하고 필터링하는 일을 도와주는 개인화된 추천 시스템이 등장하였으며, 더 나아가 사용자가 원하는 아이템을 예측하고 추천해주고 있으며 이를 위해 협력적 필터링을 적용하고 있다. 이는 사용자의 성향에 맞는 아이템을 예측하고 추천하기 위하여 비슷한 선호도를 가지는 사용자들간의 유사도 가중치를 계산한다. 본 연구는 정보의 속성에 대한 사용자의 선호도를 고려하지 않은 문제를 개선하기 위하여 연관 이웃 마이닝을 사용하여 대표속성에 대한 연관 사용자의 선호도를 협력적 필터링에 반영하였다. 연관 이웃 마이닝은 선호도에 가장 크게 영향을 미치는 속성을 추출하여 유사한 성향을 가진 연관 사용자를 군집한다. 제안된 방법은 사용자가 아이템에 대해서 평가한 MovieLens 데이터 집합을 대상으로 평가되었으며, 기존의 nearest neighbor model과 K-means 군집보다 그 성능이 우수함을 보인다.

문장 및 어절 유사도를 이용한 표절 탐지 시스템 구현 (Implementation of A Plagiarism Detecting System with Sentence and Syntactic Word Similarities)

  • 맹주수;박지수;손진곤
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권3호
    • /
    • pp.109-114
    • /
    • 2019
  • 기존 표절 탐지 시스템은 형태소 분석을 기반으로 공통 단어의 빈도수를 이용해 문서의 유사도를 측정한다. 그러나 주제가 같아 유사 단어가 많이 쓰인 경우, 문장 단위로 일부만 발췌 표절한 경우, 그리고 조사와 어미의 유사성이 있는 경우는 공통 단어의 빈도수만으로는 정확한 유사도를 측정하는데 한계가 있다. 따라서 본 논문에서는 공통 단어 빈도수 기반의 유사도 측정 외에 문장 유사도와 어절 유사도를 추가적으로 측정해 유사도의 정확성을 높일 수 있는 표절 탐지 시스템을 설계하고 구현하였다. 실험 결과, 문장 유사도를 측정함으로써 문장 단위로 표절이 이루어진 경우를 발견할 수 있었고, 어절 유사도를 추가로 측정함으로써 부분표절이 일어난 경우라도 조사나 어미까지 그대로 사용한 표절의 경우 등을 발견할 수 있었다.

인지지도 유사도와 정신적 작업부하와의 관계에 대한 연구 (The study of the relationship between the similarity of cognitive map and the mental workload)

  • 유승동;박범
    • 대한인간공학회지
    • /
    • 제21권3호
    • /
    • pp.47-58
    • /
    • 2002
  • The similarity of shape of shape of interface between human cognitive map and real product is the important factor to determine the human performance. Nevertheless, the degree of similarity between these has not been defined quantitatively in recent studies. Therefore, in this study, the cognitive map and the mental workload were measured by SMM(Sketch Map Method) and RNASA-TLX(Revision of NASA-Task Load Index). And the numerical expression of the accuracy point was suggested for the quantitative calculation of relative positional similarity between cognitive map and real product. In the experiment, nine subjects were participated and two kinds of vehicles were used. Mental workload was mental workload was measured immediately after the road test. The result of analysis on the relationship between accuracy and mental workload shows that the negative correlation exists on each vehicle, and the lower score of mental workloads id measured on the vehicle that has the higher score of accuracy between two vehicles.

메소드 참조 빈도와 매니페스트 정보를 이용한 안드로이드 애플리케이션들의 유사도 측정 (Measuring Similarity of Android Applications Using Method Reference Frequency and Manifest Information)

  • 김규식;마수드;조성제;김성백
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제13권3호
    • /
    • pp.15-25
    • /
    • 2017
  • 소프트웨어 가치와 중요성이 커짐에 따라 소프트웨어의 도용이 증가하고 있어 이에 대한 대책으로 소프트웨어 도용을 정확히 탐지하는 방안이 필요하다. 특히 안드로이드 앱의 경우, 소프트웨어 도용이 상대적으로 용이한 반면 안드로이드 마켓 상에서는 불법 앱에 대한 적절한 검수를 수행하지 않고 있다. 이에 본 논문에서는 소프트웨어 도용을 탐지하기 위해 실행파일 수준에서 안드로이드 앱 간의 유사도를 효과적으로 측정하는 기법을 제안한다. 제안 기법은 유사도 측정을 위한 주요 특징정보로, 안드로이드 앱의 실행파일을 정적으로 분석하여 메소드 참조 빈도와 매니페스트 정보를 추출한다. 각 앱을 이 두 가지 특징정보들의 n-차원 벡터로 표시하고, 코사인 유사도를 사용하여 두 앱의 유사도를 측정한다. 제안 기법을 검증하기 위해 대표적인 소스코드 기반의 유사도 측정 기법과 본 논문에서 제안한 기법을 비교 평가한다. 소스파일과 실행파일이 함께 주어진 안드로이드 앱을 대상으로 진행한 실험에서, 본 논문에서 제안한 실행파일 수준의 유사도 측정 결과와 기존의 잘 알려진 소스파일 수준의 유사도 측정 결과가 동등한 수준으로 나왔다.

용어 분포 유사도를 이용한 질의 용어 확장 및 가중치 재산정 (Query Term Expansion and Reweighting using Term-Distribution Similarity)

  • 김주연;김병만;박혁로
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제27권1호
    • /
    • pp.90-100
    • /
    • 2000
  • 본 논문에서는 사용자의 적합 피드백을 기반으로 피드백 문서들에서 발생하는 용어들과 초기 질의와의 관련 정도를 이용하여 용어의 가중치를 산정하는 방법에 대하여 제안한다. 피드백 문서들에서 발생하는 용어들 중에서 불용어를 제외한 모든 용어들을 질의로 확장될 수 있는 후보 용어들로 선택하고 피드백 문서들에서 발생 빈도 유사성을 이용하여 초기 질의에 대한 후보 용어의 관련 정도를 산정하며, 피드백 문서들에서의 가중치와 관련 정도를 결합하여 후보 용어들의 가중치를 산정 하였다. 본 논문에서는 성능을 평가하기 위하여 KT-set 1.0과 KT-set 2.0을 사용하였으며, 성능의 상대적인 평가를 위하여 질의어를 확장하지 않은 방법, Dec-Hi방법들을 정확률-재현율을 사용하여 평가 하였다.

  • PDF

협력필터링의 데이터 희소성 해결을 위한 자카드 지수 반영의 유사도 성능 분석 (Performance Analysis of Similarity Reflecting Jaccard Index for Solving Data Sparsity in Collaborative Filtering)

  • 이수정
    • 컴퓨터교육학회논문지
    • /
    • 제19권4호
    • /
    • pp.59-66
    • /
    • 2016
  • 협력 필터링 시스템에서 데이터 희소성 문제의 해결을 위해 공통평가항목수를 반영하는 방법이 연구되었다. 이러한 방법으로 널리 알려진 자카드 지수는 기존의 유사도 척도와 결합되어 성능을 개선할 수 있었다. 그러나, 다양한 데이터 환경에서 여러 유사도 척도들과 각각 결합했을 때의 성능 개선 효과에 대한 분석 연구는 미미하므로, 본 연구는 이에 대한 분석을 목적으로 한다. 우선 자카드 지수 자체를 유사도 척도로 사용했을때 희소한 데이터셋 상에서 전통적인 척도들보다 월등한 예측 성능을 보였고 추천 성능도 매우 우수하였다. 자카드 지수를 결합함으로써 기존 유사도 척도는 데이터 특성에 상관없이 성능이 대개 향상되었고, 특히 코사인 유사도는 희소한 데이터셋에서 가장 큰 향상을 이루었으나, 평균차이 제곱(Mean Squared Difference)의 유사도는 밀집된 데이터셋에서 오히려 저하된 예측 성능을 보였다. 따라서, 자카드 지수를 결합하여 사용하기 위해 데이터 환경 특성과 유사도 척도를 고려할 필요가 있다.