• 제목/요약/키워드: Cosine Similarity

검색결과 188건 처리시간 0.026초

사용자 유사도 기반 경로 예측 기법 (User Similarity-based Path Prediction Method)

  • 남수민;이석훈
    • 한국정보기술학회논문지
    • /
    • 제17권12호
    • /
    • pp.29-38
    • /
    • 2019
  • 라이프로그를 이용한 경로 예측 기법은 정확한 경로 예측을 위하여 많은 양의 학습 데이터를 요구하며, 학습 데이터가 부족할 경우 경로 예측 성능이 저하된다. 학습 데이터 부족은 사용자의 이동 패턴이 유사한 다른 사용자의 데이터를 이용하여 해결이 가능하다. 따라서 이 논문은 사용자 유사도 기반 경로 예측 알고리즘을 제안한다. 이를 위하여 제안 알고리즘은 경로를 3단 그리드 패턴으로 학습하고 코사인 유사도 기법을 이용하여 사용자 간 유사도를 측정한다. 이후, 측정된 유사도를 학습된 모델에 적용하여 경로를 예측한다. 평가를 위하여 기존 경로 예측 기법들과 제안 기법의 경로 예측 정확도를 측정 및 비교한다. 그 결과, 제안 기법의 정확도는 66.6%로 다른 기법들에 비해 평균 1.8% 더 높은 정확도를 가진 것으로 평가된다.

유사도를 활용한 맞춤형 보험 추천 시스템 (Personalized insurance product based on similarity)

  • 김준성;조아라;오하영
    • 한국정보통신학회논문지
    • /
    • 제26권11호
    • /
    • pp.1599-1607
    • /
    • 2022
  • 저출산과 노령화로 보험 수요가 지속해서 감소하고 있다. 나아가 언택트 소비가 주류가 되면서 기존의 대면 서비스를 중심으로 한 보험상품 마케팅은 실효성이 크게 떨어지고 있다. 그러므로 보험업계는 비대면 서비스를 기반으로 한 새로운 마케팅이 절실한 시점이다. 확보된 내 외부 및 공공데이터를 바탕으로 보험 트렌드를 반영한 맞춤형 전략을 통해 기존 고객의 로열티를 강화하고 신규 고객을 확보할 수 있는 개인 맞춤형 보험 상품 추천시스템을 제안하고자 한다. 보험회사 데이터베이스에 등록된 고객을 대상으로 공공 데이터(시군구별 총인구수, 건강생활 실천율, 고령 인구 비율, 출생률, 노인여가복지 수, 연령대별 경제활동참가율 등), 고객 개인정보 및 기 계약 정보를 사용하여 인구통계학 기반과 모델 기반 추천시스템을 설계하였다. 인구통계학 기반 추천시스템은 군집화된 고객 내 코사인 유사도를 계산하여 유사도가 높은 고객들이 많이 가입한 보험상품을 추천하였다. K-means를 이용한 군집화 방식과 고객의 지역, 성별 및 연령대 기준의 Segmentation 방식으로 각각 수행하였다. 모델 기반 추천시스템은 Decision Tree, Random Forest Classifier를 사용하여 각각 추천시스템을 설계하였다. 본 연구 결과 군집 된 고객 간 코사인 유사도를 활용한 인구통계학 기반 추천시스템의 성능이 가장 우수하였다. 이는 개인의 특성(성별, 나이 등) 및 환경적인(경제력, 직업 거주지역 등) 요소에 따라 보험 상품을 선택하기 때문에 고객 간 유사도가 보험 추천시스템의 성능에 주요 요소인 것을 보여준다.

다차원 메타데이터 공간을 활용한 학술 문헌 추천기법 연구 (A Study on the Method of Scholarly Paper Recommendation Using Multidimensional Metadata Space)

  • 감미아;이지연
    • 정보관리학회지
    • /
    • 제40권1호
    • /
    • pp.121-148
    • /
    • 2023
  • 본 연구는 '우수한 성능의 메타데이터 속성 유사도 기반의 학술 문헌추천시스템'을 제안하는 데에 목적을 두고 있다. 본 연구에서는 정보조직에서 다루는 메타데이터의 활용과 계량정보학에서 다루고 있는 동시인용, 저자-서지결합법, 동시출현 빈도, 코사인 유사도의 개념을 활용한 문헌정보학 기반의 학술 문헌 추천기법을 제안하고자 하였다. 실험을 위해 수집한 '불평등', '격차' 관련 총 9,643개의 논문 메타데이터를 정제하여 코사인 유사도를 활용한 저자, 키워드, 제목 속성 간의 상대적 좌표 수치를 도출하였고, 성능 좋은 가중치 조건 및 차원의 수를 선정하기 위해 실험을 수행하였다. 실험 결과를 제시하여 이용자의 평가를 거쳤으며, 이를 이용해 기준노드와 추천조합 특성 분석 및 컨조인트 분석, 결과 비교 분석을 수행하여 연구질문 중심의 논의를 수행하였다. 그 결과 전반적으로는 저자 관련 속성을 제한 조합 혹은 제목 관련 속성만 사용하는 경우 성능이 뛰어난 것으로 나타났다. 본 연구에서 제시한 기법을 활용하고 광범위한 표본의 확보를 이룬다면, 향후 정보서비스의 문헌 추천 분야뿐 아니라 사회의 다양한 분야에 대한 추천기법 성능 향상에 도움을 줄 수 있을 것이다.

자동초록 작성시에 발생하는 유사의미 문장요소들의 통합에 관한 연구 (A Study on the Integration of Similar Sentences in Atomatic Summarizing of Document)

  • 이태영
    • 한국문헌정보학회지
    • /
    • 제34권2호
    • /
    • pp.87-115
    • /
    • 2000
  • 유사문장의 식별 및 통합을 위하여 문장의 구성성분, 품사, 절유형, 위치 등이 미치는 영향을 조사하고 유사도측정 공식과 통합방안을 모색하였다. 문법적 요인보다는 문장간에 일치하는 단어의 수가 유사성에 영향을 미치며 표제어와 기능절도 관여되었다. 문장간의 유사도 측정 공식은 설튼의 유사도 측정식과 코싸인계수를 혼합하여 사용하였다. 유사문장들의 통합에서 절들의 대체 방법을 사용하였는데 앞으로는 단어들의 대체 방법으로 전환하여야 할 것이다.

  • PDF

비지역적 평균 필터 기반의 개선된 커널 함수를 이용한 가우시안 잡음 제거 기법 (Gaussian Noise Reduction Technique using Improved Kernel Function based on Non-Local Means Filter)

  • 임월기;최현호;정제창
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 추계학술대회
    • /
    • pp.73-76
    • /
    • 2018
  • A Gaussian noise is caused by surrounding environment or channel interference when transmitting image. The noise reduces not only image quality degradation but also high-level image processing performance. The Non-Local Means (NLM) filter finds similarity in the neighboring sets of pixels to remove noise and assigns weights according to similarity. The weighted average is calculated based on the weight. The NLM filter method shows low noise cancellation performance and high complexity in the process of finding the similarity using weight allocation and neighbor set. In order to solve these problems, we propose an algorithm that shows an excellent noise reduction performance by using Summed Square Image (SSI) to reduce the complexity and applying the weighting function based on a cosine Gaussian kernel function. Experimental results demonstrate the effectiveness of the proposed algorithm.

  • PDF

점유센서를 위한 유사성 메트릭 기반 입출입 사람 매칭 (Incoming and Outgoing Human Matching Using Similarity Metrics for Occupancy Sensor)

  • 정재준;김만배
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 추계학술대회
    • /
    • pp.33-35
    • /
    • 2018
  • 기존의 사람간의 유사성 측정 시스템은 적외선 빔이나 열 감지 영상 장치를 통해 측정하였다. 하지만 이와 같은 방법으로 측정하면 2명 이상의 객체를 분류해내는 기술은 제공하지 않는다. 이에 본 논문은 고정된 카메라를 이용하여 각 사람의 피부색과 옷차림 등의 RGB 정보를 이용한 사람 유사성 측정 기법을 제안한다. RGB카메라 영상을 통하여 객체의 RGB 히스토그램을 얻은 후 각 객체에 대해 Bhattacharyya metric, Cosine similarity, Jensen difference, Euclidean distance로 histogram similarity를 계산하여 객체 추적 및 유사성 측정을 통해 객체를 분류한다. 제안된 시스템은 C/C++를 기반으로 구현하여, 유사성 측정 성능을 평가하였다.

  • PDF

협업 필터링을 사용한 유사도 기법 및 커뮤니티 검출 알고리즘 비교 (Comparison of similarity measures and community detection algorithms using collaboration filtering)

  • 일홈존;홍민표;박두순
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.366-369
    • /
    • 2022
  • The glut of information aggravated the process of data analysis and other procedures including data mining. Many algorithms were devised in Big Data and Data Mining to solve such an intricate problem. In this paper, we conducted research about the comparison of several similarity measures and community detection algorithms in collaborative filtering for movie recommendation systems. Movielense data set was used to do an empirical experiment. We applied three different similarity measures: Cosine, Euclidean, and Pearson. Moreover, betweenness and eigenvector centrality were used to detect communities from the network. As a result, we elucidated which algorithm is more suitable than its counterpart in terms of recommendation accuracy.

Misinformation Detection and Rectification Based on QA System and Text Similarity with COVID-19

  • Insup Lim;Namjae Cho
    • Journal of Information Technology Applications and Management
    • /
    • 제28권5호
    • /
    • pp.41-50
    • /
    • 2021
  • As COVID-19 spread widely, and rapidly, the number of misinformation is also increasing, which WHO has referred to this phenomenon as "Infodemic". The purpose of this research is to develop detection and rectification of COVID-19 misinformation based on Open-domain QA system and text similarity. 9 testing conditions were used in this model. For open-domain QA system, 6 conditions were applied using three different types of dataset types, scientific, social media, and news, both datasets, and two different methods of choosing the answer, choosing the top answer generated from the QA system and voting from the top three answers generated from QA system. The other 3 conditions were the Closed-Domain QA system with different dataset types. The best results from the testing model were 76% using all datasets with voting from the top 3 answers outperforming by 16% from the closed-domain model.

하지 근육 시너지 분석 기반의 FES 시스템이 보행 시 뇌졸중 환자의 족하수 개선에 미치는 영향: 사례 연구 (The effect of lower limb muscle synergy analysis-based FES system on improvement of the foot drop of stroke patient during walking: a case study)

  • 임태현
    • 한국산업융합학회 논문집
    • /
    • 제23권3호
    • /
    • pp.523-529
    • /
    • 2020
  • Foot drop is a common symptom in stroke patients due to central nervous system (CNS) damage, which causes walking disturbances. Functional electrical stimulation (FES) is an effective rehabilitation method for stroke patients with CNS damage. Aim of this study was to determine the effectiveness of 6 weeks FES walking training based lower limb muscle synergy of stroke patients. Lower limb muscle synergies were extracted from electromyography (EMG) using a non-negative matrix factorization algorithm (NMF) method. Cosine similarity and cross correlation were calculated for similarity comparison with healthy subjects. In both stroke patients, the similarity of leg muscle synergy during walking changed to similar to that of healthy subjects due to a decrease in foot drop during. FES walking intervention influenced the similarity of muscle synergies during walking of stroke patients. This intervention has an effective method on foot drop and improving the gait performance of stroke patients.

기회적 네트워크에서의 유사도 기반의 포워딩 기법의 성능 분석 (Performance Analysis of Forwarding Schemes Based on Similarities for Opportunistic Networks)

  • 김선겸;이태석;김완종
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제24권3호
    • /
    • pp.145-150
    • /
    • 2018
  • 기회적 네트워크(Opportunistic networks)의 포워딩은 간헐적인 연결로 인하여 출발지와 목적지 간에 안정된 경로가 존재하지 않아 기존 포워딩 기법들은 성능이 저하되는 문제를 가지고 있다. 최근 소셜 네트워크 관계망을 이용한 연구가 활발히 진행되고 있으며, 유사도(Similarity)는 소셜 네트워크 분석을 위한 매우 중요한 분석 방법 중 하나이다. 본 논문은 대표적인 유사도를 이용한 포워딩 기법들을 제안하고 기회적 네트워크에서 유사도에 기반한 포워딩 기법을 적용시에 얼마나 성능 향상이 있는지 알아본다. 그 결과로, 이 기법들은 목적지와 유사도가 높은 노드를 중개 노드로 선정하여 포워딩하기 때문에 낮은 트래픽 및 홉 수를 가지게 되며, 준수한 전송 딜레이를 유지한다.