• 제목/요약/키워드: cosine similarity

검색결과 188건 처리시간 0.021초

사용자 유사도 기반 경로 예측 기법 (User Similarity-based Path Prediction Method)

  • 남수민;이석훈
    • 한국정보기술학회논문지
    • /
    • 제17권12호
    • /
    • pp.29-38
    • /
    • 2019
  • 라이프로그를 이용한 경로 예측 기법은 정확한 경로 예측을 위하여 많은 양의 학습 데이터를 요구하며, 학습 데이터가 부족할 경우 경로 예측 성능이 저하된다. 학습 데이터 부족은 사용자의 이동 패턴이 유사한 다른 사용자의 데이터를 이용하여 해결이 가능하다. 따라서 이 논문은 사용자 유사도 기반 경로 예측 알고리즘을 제안한다. 이를 위하여 제안 알고리즘은 경로를 3단 그리드 패턴으로 학습하고 코사인 유사도 기법을 이용하여 사용자 간 유사도를 측정한다. 이후, 측정된 유사도를 학습된 모델에 적용하여 경로를 예측한다. 평가를 위하여 기존 경로 예측 기법들과 제안 기법의 경로 예측 정확도를 측정 및 비교한다. 그 결과, 제안 기법의 정확도는 66.6%로 다른 기법들에 비해 평균 1.8% 더 높은 정확도를 가진 것으로 평가된다.

유사도를 활용한 맞춤형 보험 추천 시스템 (Personalized insurance product based on similarity)

  • 김준성;조아라;오하영
    • 한국정보통신학회논문지
    • /
    • 제26권11호
    • /
    • pp.1599-1607
    • /
    • 2022
  • 저출산과 노령화로 보험 수요가 지속해서 감소하고 있다. 나아가 언택트 소비가 주류가 되면서 기존의 대면 서비스를 중심으로 한 보험상품 마케팅은 실효성이 크게 떨어지고 있다. 그러므로 보험업계는 비대면 서비스를 기반으로 한 새로운 마케팅이 절실한 시점이다. 확보된 내 외부 및 공공데이터를 바탕으로 보험 트렌드를 반영한 맞춤형 전략을 통해 기존 고객의 로열티를 강화하고 신규 고객을 확보할 수 있는 개인 맞춤형 보험 상품 추천시스템을 제안하고자 한다. 보험회사 데이터베이스에 등록된 고객을 대상으로 공공 데이터(시군구별 총인구수, 건강생활 실천율, 고령 인구 비율, 출생률, 노인여가복지 수, 연령대별 경제활동참가율 등), 고객 개인정보 및 기 계약 정보를 사용하여 인구통계학 기반과 모델 기반 추천시스템을 설계하였다. 인구통계학 기반 추천시스템은 군집화된 고객 내 코사인 유사도를 계산하여 유사도가 높은 고객들이 많이 가입한 보험상품을 추천하였다. K-means를 이용한 군집화 방식과 고객의 지역, 성별 및 연령대 기준의 Segmentation 방식으로 각각 수행하였다. 모델 기반 추천시스템은 Decision Tree, Random Forest Classifier를 사용하여 각각 추천시스템을 설계하였다. 본 연구 결과 군집 된 고객 간 코사인 유사도를 활용한 인구통계학 기반 추천시스템의 성능이 가장 우수하였다. 이는 개인의 특성(성별, 나이 등) 및 환경적인(경제력, 직업 거주지역 등) 요소에 따라 보험 상품을 선택하기 때문에 고객 간 유사도가 보험 추천시스템의 성능에 주요 요소인 것을 보여준다.

다차원 메타데이터 공간을 활용한 학술 문헌 추천기법 연구 (A Study on the Method of Scholarly Paper Recommendation Using Multidimensional Metadata Space)

  • 감미아;이지연
    • 정보관리학회지
    • /
    • 제40권1호
    • /
    • pp.121-148
    • /
    • 2023
  • 본 연구는 '우수한 성능의 메타데이터 속성 유사도 기반의 학술 문헌추천시스템'을 제안하는 데에 목적을 두고 있다. 본 연구에서는 정보조직에서 다루는 메타데이터의 활용과 계량정보학에서 다루고 있는 동시인용, 저자-서지결합법, 동시출현 빈도, 코사인 유사도의 개념을 활용한 문헌정보학 기반의 학술 문헌 추천기법을 제안하고자 하였다. 실험을 위해 수집한 '불평등', '격차' 관련 총 9,643개의 논문 메타데이터를 정제하여 코사인 유사도를 활용한 저자, 키워드, 제목 속성 간의 상대적 좌표 수치를 도출하였고, 성능 좋은 가중치 조건 및 차원의 수를 선정하기 위해 실험을 수행하였다. 실험 결과를 제시하여 이용자의 평가를 거쳤으며, 이를 이용해 기준노드와 추천조합 특성 분석 및 컨조인트 분석, 결과 비교 분석을 수행하여 연구질문 중심의 논의를 수행하였다. 그 결과 전반적으로는 저자 관련 속성을 제한 조합 혹은 제목 관련 속성만 사용하는 경우 성능이 뛰어난 것으로 나타났다. 본 연구에서 제시한 기법을 활용하고 광범위한 표본의 확보를 이룬다면, 향후 정보서비스의 문헌 추천 분야뿐 아니라 사회의 다양한 분야에 대한 추천기법 성능 향상에 도움을 줄 수 있을 것이다.

자동초록 작성시에 발생하는 유사의미 문장요소들의 통합에 관한 연구 (A Study on the Integration of Similar Sentences in Atomatic Summarizing of Document)

  • 이태영
    • 한국문헌정보학회지
    • /
    • 제34권2호
    • /
    • pp.87-115
    • /
    • 2000
  • 유사문장의 식별 및 통합을 위하여 문장의 구성성분, 품사, 절유형, 위치 등이 미치는 영향을 조사하고 유사도측정 공식과 통합방안을 모색하였다. 문법적 요인보다는 문장간에 일치하는 단어의 수가 유사성에 영향을 미치며 표제어와 기능절도 관여되었다. 문장간의 유사도 측정 공식은 설튼의 유사도 측정식과 코싸인계수를 혼합하여 사용하였다. 유사문장들의 통합에서 절들의 대체 방법을 사용하였는데 앞으로는 단어들의 대체 방법으로 전환하여야 할 것이다.

  • PDF

비지역적 평균 필터 기반의 개선된 커널 함수를 이용한 가우시안 잡음 제거 기법 (Gaussian Noise Reduction Technique using Improved Kernel Function based on Non-Local Means Filter)

  • 임월기;최현호;정제창
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 추계학술대회
    • /
    • pp.73-76
    • /
    • 2018
  • A Gaussian noise is caused by surrounding environment or channel interference when transmitting image. The noise reduces not only image quality degradation but also high-level image processing performance. The Non-Local Means (NLM) filter finds similarity in the neighboring sets of pixels to remove noise and assigns weights according to similarity. The weighted average is calculated based on the weight. The NLM filter method shows low noise cancellation performance and high complexity in the process of finding the similarity using weight allocation and neighbor set. In order to solve these problems, we propose an algorithm that shows an excellent noise reduction performance by using Summed Square Image (SSI) to reduce the complexity and applying the weighting function based on a cosine Gaussian kernel function. Experimental results demonstrate the effectiveness of the proposed algorithm.

  • PDF

점유센서를 위한 유사성 메트릭 기반 입출입 사람 매칭 (Incoming and Outgoing Human Matching Using Similarity Metrics for Occupancy Sensor)

  • 정재준;김만배
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 추계학술대회
    • /
    • pp.33-35
    • /
    • 2018
  • 기존의 사람간의 유사성 측정 시스템은 적외선 빔이나 열 감지 영상 장치를 통해 측정하였다. 하지만 이와 같은 방법으로 측정하면 2명 이상의 객체를 분류해내는 기술은 제공하지 않는다. 이에 본 논문은 고정된 카메라를 이용하여 각 사람의 피부색과 옷차림 등의 RGB 정보를 이용한 사람 유사성 측정 기법을 제안한다. RGB카메라 영상을 통하여 객체의 RGB 히스토그램을 얻은 후 각 객체에 대해 Bhattacharyya metric, Cosine similarity, Jensen difference, Euclidean distance로 histogram similarity를 계산하여 객체 추적 및 유사성 측정을 통해 객체를 분류한다. 제안된 시스템은 C/C++를 기반으로 구현하여, 유사성 측정 성능을 평가하였다.

  • PDF

협업 필터링을 사용한 유사도 기법 및 커뮤니티 검출 알고리즘 비교 (Comparison of similarity measures and community detection algorithms using collaboration filtering)

  • 일홈존;홍민표;박두순
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.366-369
    • /
    • 2022
  • The glut of information aggravated the process of data analysis and other procedures including data mining. Many algorithms were devised in Big Data and Data Mining to solve such an intricate problem. In this paper, we conducted research about the comparison of several similarity measures and community detection algorithms in collaborative filtering for movie recommendation systems. Movielense data set was used to do an empirical experiment. We applied three different similarity measures: Cosine, Euclidean, and Pearson. Moreover, betweenness and eigenvector centrality were used to detect communities from the network. As a result, we elucidated which algorithm is more suitable than its counterpart in terms of recommendation accuracy.

Misinformation Detection and Rectification Based on QA System and Text Similarity with COVID-19

  • Insup Lim;Namjae Cho
    • Journal of Information Technology Applications and Management
    • /
    • 제28권5호
    • /
    • pp.41-50
    • /
    • 2021
  • As COVID-19 spread widely, and rapidly, the number of misinformation is also increasing, which WHO has referred to this phenomenon as "Infodemic". The purpose of this research is to develop detection and rectification of COVID-19 misinformation based on Open-domain QA system and text similarity. 9 testing conditions were used in this model. For open-domain QA system, 6 conditions were applied using three different types of dataset types, scientific, social media, and news, both datasets, and two different methods of choosing the answer, choosing the top answer generated from the QA system and voting from the top three answers generated from QA system. The other 3 conditions were the Closed-Domain QA system with different dataset types. The best results from the testing model were 76% using all datasets with voting from the top 3 answers outperforming by 16% from the closed-domain model.

NCS 능력단위 요소와 기존 교육과정 간 갭 분석을 위한 평가모델 (Evaluation Model for Gab Analysis Between NCS Competence Unit Element and Traditional Curriculum)

  • 김대경;김창복
    • 한국항행학회논문지
    • /
    • 제19권4호
    • /
    • pp.338-344
    • /
    • 2015
  • 국가 직무능력 표준 (NCS; national competency standards)은 직무를 수행하기 위해 요구되는 능력에 대한 체계화 및 표준화이다. NCS는 특정 직무능력인 능력단위 요소로 구체화하고 표준화하여 학습모듈을 개발한다. 기존 교육과정은 NCS 능력단위 요소를 교육 훈련에 활용하기 위해서 갭 분석 (gab analysis)이 필수적이다. 기존에 갭 분석은 전문가가 주관적으로 평가하였다. 전문가에 의한 갭 분석은 심리적 요소에 의해 주관적 결정, 정확성 결여, 시간 및 공간적 비효율성 문제가 제기되었다. 본 논문은 주관적 평가의 문제 해결을 위해 자동화 평가모델을 제시하였다. 본 논문은 기존 교육과정과 능력단위 요소 간 갭 분석을 위해, 색인어 추출, 단어빈도수-역 빈도수 기반 특징 값 추출, 코사인 유사도 알고리즘을 이용하였다. 또한, 기존 교육과정과 NCS 능력단위요소 사이 유사도 매핑 테이블을 제시하였다. 본 논문의 평가모델은 구조적 특징이나 속도 면에서 개선된 알고리즘을 통해 보완해야 한다.

조세심판 문서 검색 효율 향상 모델에 관한 연구 (A Study on the Improvement Model of Document Retrieval Efficiency of Tax Judgment)

  • 이후영;박구락;김동현
    • 한국융합학회논문지
    • /
    • 제10권6호
    • /
    • pp.41-47
    • /
    • 2019
  • 조세 심판에 대한 선결정례는 법원 판례의 경우 유사 심판례를 검색하여 파악하는 것이 매우 중요한 상황이다. 그러나 기존 심판문에 대한 검색은 사용자가 입력하는 키워드를 통하여 검색하는 방법을 사용하고 있으나, 정확한 키워드의 입력이 필요하며, 키워드를 모르는 경우 필요한 문서를 검색하는 것은 불가능하다. 또한 검색된 문서 중에는 내용이 다른 경우도 발생한다. 이에 본 논문에서는 정확한 심판례의 검색을 위하여 문서를 3차원 공간에 벡터화하고, 코사인 유사도를 계산하여, 거리상 가까운 문서를 검색하는 방법의 효율성을 향상시키기 위하여 심판례에서 사용되고 있는 단어들의 유사도를 분석한 후, 최빈값을 추출하여 본문의 텍스트에 삽입하는 방법으로 검색하고자 하는 문서의 코사인 유사도를 향상시키는 방안을 제안한다. 제안 모델을 통하여 조세와 관련된 심판례를 검색하고자 하는 사용자에게 신속하고, 정확한 검색을 제공할 수 있을 것으로 기대된다.