• 제목/요약/키워드: 평점 예측

검색결과 86건 처리시간 0.033초

유전자 알고리즘을 활용한 소셜네트워크 기반 하이브리드 협업필터링 (Social Network-based Hybrid Collaborative Filtering using Genetic Algorithms)

  • 노희룡;최슬비;안현철
    • 지능정보연구
    • /
    • 제23권2호
    • /
    • pp.19-38
    • /
    • 2017
  • 본 연구는 사용자 평점 이외에 사용자 간 직접 간접적 신뢰 및 불신 관계 네트워크의 분석 결과를 추가로 반영한 새로운 하이브리드 협업필터링(Collaborative filtering, CF) 추천방법을 제안한다. 구체적으로 사용자 간의 유사도를 계산할 때 사용자 평가점수의 유사성만을 고려하는 기존의 CF와 다르게, 사용자 신뢰 및 불신 관계 데이터의 사회연결망분석 결과를 추가적으로 고려하여 보다 정교하게 사용자 간의 유사도를 산출하였다. 이 때, 사용자 간의 유사도를 재조정하는 접근법으로 특정 이웃 사용자가 신뢰 및 불신 관계 네트워크에서 높은 신뢰(또는 불신)를 받을 때, 추천 대상이 되는 사용자와 해당 이웃 간의 유사도를 확대(강화) 또는 축소(약화)하는 방안을 제안하고, 더 나아가 최적의 유사도 확대 또는 축소의 정도를 결정하기 위해 유전자 알고리즘(genetic algorithm, GA)을 적용하였다. 본 연구에서는 제안 알고리즘의 성능을 검증하기 위해, 특정 상품에 대한 사용자의 평가점수와 신뢰 및 불신 관계를 나타낸 실제 데이터에 추천 알고리즘을 적용하였으며 그 결과, 기존의 CF와 비교했을 때 통계적으로 유의한 수준의 예측 정확도 개선이 이루어짐을 확인할 수 있었다. 또한 신뢰 관계 정보보다는 불신 관계 정보를 반영했을 때 예측 정확도가 더 향상되는 것으로 나타났는데, 이는 사회적인 관계를 추적하고 관리하는 측면에서 사용자 간의 불신 관계에 대해 좀 더 주목해야 할 필요가 있음을 시사한다.

사용자 리뷰 마이닝을 결합한 협업 필터링 시스템: 스마트폰 앱 추천에의 응용 (A Collaborative Filtering System Combined with Users' Review Mining : Application to the Recommendation of Smartphone Apps)

  • 전병국;안현철
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.1-18
    • /
    • 2015
  • 협업 필터링은 학계나 산업계에서 우수한 성능으로 인해 많이 사용되는 추천기법이지만, 정량적 정보인 사용자들의 평가점수에만 국한하여 추천결과를 생성하므로 간혹 정확도가 떨어지는 문제가 발생한다. 이에 새로운 정보를 추가로 고려하여, 협업 필터링의 성능을 개선하려는 연구들이 지금까지 다양하게 시도되어 왔다. 본 연구는 최근 Web 2.0 시대의 도래로 인해 사용자들이 구입한 상품에 대한 솔직한 의견을 인터넷 상에 자유롭게 표현한다는 점에 착안하여, 사용자가 직접 작성한 리뷰를 참고하여 협업 필터링의 성능을 개선하는 새로운 추천 알고리즘을 제안하고, 이를 스마트폰 앱 추천 시스템에 적용하였다. 정성 정보인 사용자 리뷰를 정량화하기 위해 본 연구에서는 텍스트 마이닝을 활용하였다. 구체적으로 본 연구의 추천시스템은 사용자간 유사도를 산출할 때, 사용자 리뷰의 유사도를 추가로 반영하여 보다 정밀하게 사용자간 유사도를 산출할 수 있도록 하였다. 이 때, 사용자 리뷰의 유사도를 산출하는 접근법으로 중복 사용된 색인어의 빈도로 산출하는 방안과 TF-IDF(Term Frequency - Inverse Document Frequency) 가중치 합으로 산출하는 2가지 방안을 제시한 뒤 그 성능을 비교해 보았다. 실험결과, 제안 알고리즘을 통한 추천, 즉 사용자 리뷰의 유사도를 추가로 반영하는 알고리즘이 평점만을 고려하는 전통적인 협업 필터링과 비교해 더 우수한 예측정확도를 나타냄을 확인할 수 있었다. 아울러, 중복 사용 단어의 TF-IDF 가중치의 합을 고려했을 때, 단순히 중복 사용 단어의 빈도만을 고려했을 때 보다 조금 더 나은 예측정확도를 얻을 수 있음도 함께 확인할 수 있었다.

사용자 간 신뢰관계 네트워크 분석을 활용한 협업 필터링 알고리즘의 예측 정확도 개선 (Enhancing Predictive Accuracy of Collaborative Filtering Algorithms using the Network Analysis of Trust Relationship among Users)

  • 최슬비;곽기영;안현철
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.113-127
    • /
    • 2016
  • 협업 필터링(Collaborative Filtering)은 유용성과 정교성 면에서 가장 성공적인 추천 알고리즘으로 평가받으며 산업계나 학계에서 많이 활용 및 연구되고 있지만, 기본적으로 사용자들이 평가한 점수에만 기반하여 추천결과를 생성하는 한계점이 있다. 이에 본 연구는 사용자가 상품을 구매할 때 자신이 신뢰하는 타인의 추천을 더 적극적으로 수용할 것이라는 점에 착안하여, 사용자의 평점 외에 사용자 간 신뢰관계를 소셜네트워크분석으로 분석한 결과를 추가로 반영하는 추천 알고리즘들을 제안하였다. 구체적으로 본 연구에서는 소셜네트워크분석에서 네트워크 내의 중심적 위치를 나타내는 척도인 내향 및 외향 중심성을 활용하여 사용자 간 유사도를 산출하는 알고리즘들과 사용자 신뢰 네트워크를 탐색하여 추천 대상이 되는 사용자가 직접 간접적으로 신뢰하는 사용자의 평가점수를 보다 높게 반영하는 알고리즘을 제안한 뒤 그 성능을 비교해 보았다. 실제 데이터에 적용하여 분석한 결과, 사용자 신뢰 네트워크의 내향 중심성 지수를 조건 없이 적용한 경우에는 오히려 정확도의 감소만을 야기하는 것으로 나타났고, 일정 임계치 이상의 외향 중심성을 갖는 사용자에 한해 내향 중심성 지수를 고려한 추천 알고리즘은 전통적인 협업 필터링에 비해 약간의 정확도 개선이 이루어짐을 확인할 수 있었다. 아울러, 사용자 신뢰 네트워크를 기반으로 탐색하는 알고리즘이 가장 우수한 성능을 보이는 것을 알 수 있었으며, 전통적인 협업 필터링과 비교해서도 통계적으로 유의한 수준의 정확도의 개선이 이루어짐을 확인할 수 있었다.

일반영향요인과 댓글기반 콘텐츠 네트워크 분석을 통합한 유튜브(Youtube)상의 콘텐츠 확산 영향요인 연구 (A Study on the Impact Factors of Contents Diffusion in Youtube using Integrated Content Network Analysis)

  • 박병언;임규건
    • 지능정보연구
    • /
    • 제21권3호
    • /
    • pp.19-36
    • /
    • 2015
  • 대표적 소셜미디어인 유튜브는 기존 폐쇄형 콘텐츠 서비스와는 다르게 개방형 콘텐츠 서비스로 이용자들의 참여와 공유를 통하여 많은 인기를 유지하고 있다. 콘텐츠 산업에서 중요한 위치를 차지하고 있는 유투브 상의 콘텐츠 확산 요인에 관한 기존의 연구들은 댓글 수 등과 같은 일반적 정보 특성 요인과 조회 수 간에 상관관계 등을 분석하는 것이 대부분이었다. 최근 네트워크 구조를 기반으로 한 연구들도 진행되었으나 대부분 콘텐츠를 이용하는 대상인 구독자나 지인 등을 중심으로 한 인적 관계 네트워크 구조 연구가 대부분이었다. 이에 본 연구에서는 실질적인 콘텐츠를 중심으로 한 네트워크 구조와 일반요인을 통합한 모델을 제시하고 확산요인을 분석하고자 한다. 이를 위해 통합 모델 인과관계 분석과 함께 21,307개의 유튜브 콘텐츠를 콘텐츠 기반 네트워크 구조로 분석하였다. 본 연구를 통해 기존에 알려진 일반적 요인과 네트워크 요인들이 모두 조회수에 영향을 주는 인과관계를 통계적으로 재검증하였으며 통합적으로는 등록자의 구독자 수, 경과시간, 매개 중심성, 댓글 수, 근접 중심성, 클러스터링 계수, 평균 평점 순으로 조회 수에 긍정적인 영향을 미치는 것으로 분석되었다. 하지만 네트워크 요인중 연결정도 중심성과 고유벡터 중심성은 부정적 영향을 주는 것으로 분석되었다. 본 연구를 통하여 유튜브 콘텐츠 확산에 대한 일반영향요인과 구조적인 현상을 함께 규명하였다. 본 연구는 기업들이 유튜브와 같은 콘텐츠 서비스를 통한 온라인 마케팅 활동 시 콘텐츠들의 구조적인 면을 고려할 수 있는 근거를 제공하였으며 음반산업의 수요예측이나 콘텐츠 제작 업체들의 원활한 서비스 제공을 위한 설명력있는 영향요인 및 모델이 될 수 있을 것이다.

Conditional Generative Adversarial Network(CGAN) 기반 협업 필터링 추천 시스템 (Conditional Generative Adversarial Network based Collaborative Filtering Recommendation System)

  • 강소이;신경식
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.157-173
    • /
    • 2021
  • 소비자의 욕구와 관심에 맞추어 개인화된 제품을 추천하는 추천 시스템은 비즈니스에 필수적인 기술로서의 그 중요성이 증가하고 있다. 추천 시스템의 대표적인 모형 중 협업 필터링은 우수한 성능으로 다양한 분야에서 활용되고 있다. 그러나 협업필터링은 사용자-아이템의 선호도 정보가 충분하지 않을 경우 성능이 저하되는 희소성의 문제가 있다. 또한 실제 평점 데이터의 경우 대부분 높은 점수에 데이터가 편향되어 있어 심한 불균형을 갖는다. 불균형 데이터에 협업 필터링을 적용할 경우 편향된 클래스에 과도하게 학습되어 추천 성능이 저하된다. 이러한 문제를 해결하기 위해 많은 선행연구들이 진행되어 왔지만 추가적인 외부 데이터 또는 기존의 전통적인 오버샘플링 기법에 의존한 추천을 시도하였기에 유용성이 떨어지고 추천 성능 측면에서 한계점이 있었다. 본 연구에서는 CGAN을 기반으로 협업 필터링 구현 시 발생하는 희소성 문제를 해결함과 동시에 실제 데이터에서 발생하는 데이터 불균형을 완화하여 추천의 성능을 높이는 것을 목표로 한다. CGAN을 이용하여 비어있는 사용자-아이템 매트릭스에 실제와 흡사한 가상의 데이터를 생성하여, 희소성을 가지고 있는 기존의 매트릭스로만 학습한 것과 비교했을 때 높은 정확도가 예상된다. 이 과정에서 Condition vector y를 이용하여 소수 클래스에 대한 분포를 파악하고 그 특징을 반영하여 데이터를 생성하였다. 이후 협업 필터링을 적용하고, 하이퍼파라미터 튜닝을 통해 추천 시스템의 성능을 최대화하는데 기여하였다. 비교 대상으로는 전통적인 오버샘플링 기법인 SMOTE, BorderlineSMOTE, SVM-SMOTE, ADASYN와 GAN을 사용하였다. 결과적으로 데이터 희소성을 가지고 있는 기존의 실제 데이터뿐만 아니라 기존 오버샘플링 기법들보다 제안 모형의 추천 성능이 우수함을 확인하였으며, RMSE, MAE 평가 척도에서 가장 높은 예측 정확도를 나타낸다는 사실을 증명하였다.

한국 남자 대학생을 대상으로 시행한 Cardiopulmonary Exercise Test에서 Treadmill과 Cycle Ergometer의 비교 분석 (Comparison of Treadmill and Cycle Ergometer in Male Korean College Students)

  • 장윤수;박재민;최승원;안강현;이준구;양동규;김세규;장준;안철민;김성규;이원영
    • Tuberculosis and Respiratory Diseases
    • /
    • 제47권1호
    • /
    • pp.26-34
    • /
    • 1999
  • 연구배경: 최대 산소 섭취량 ($VO_2$ max) 은 답차 운동시 자전거시 보다 높게 측정이 되는데, Hassen과 Wasserman 등에 의하면 답차 시 약 1.11배 정도 높게 측정된다고 하였다. $VO_2$ max는 나이, 성별, 키, 체중 등 뿐만 아니라 인종, 사회문화적 배경 및 운동 습관에 따라서도 영향을 받을 수 있음이 알려져 있다. 본 연구에서는 한국 대학생 연령의 성인을 대상으로 답차와 자전거 운동시 $VO_2$ max와 무산소 역치에서의 산소 섭취량 (AT)을 측정, 비교하였다. 방법: 1998 년 6월부터 9월까지 연세대학교 의과대학에 재학중인 남학생 44명을 대상 으로 하였다. 이들을 무작위로 2군으로 나누어 24명은 답차를 우선 시행 후 1주일 후 자전거로 운동을 시행하였고 20명은 자전거를 우선 시행 후 답차를 시행하였다. 증상 제한적 최대 운동 시행토록 하였으며, 최소한 호흡 교환비(RER) 가 1.1을 초과한 경우, 최대 산소 섭취량이 30초 이상 평점을 이룬 경우, 최대 운동시 심박 예비율이 15% 미만이거나 또는 호흡 예비율이 30% 미만일 경우를 최대 운동으로 정의하였고 이들 중 한가지라도 충족시키지 못한 경우에는 최대운동을 하지 않은 것으로 (submaximal exercise) 간주하여 연구에서 제외하였다. AT는 V-slope method로 구하였다. 결과: 답차 운동시의 $VO_2$ max와 AT 의 값은 각각 $45.1{\pm}6.66 m\ell$/kg/min, $26.0{\pm}6.78 m\ell$/kg/min 이었으며, 자전거 운동시에는 각각 $34.9{\pm}5.89 m\ell$/kg/min, $19.5{\pm}4.77 m\ell$/kg/min 이었다. 측정-$VO_2$ max/예측 $VO_2$ max 의 값은 답차 운동시 $98.8{\pm}13.24 %$ 이었으며, 자전거 운동시 $84.4{\pm}13.42 %$ 이었다. 자전거의 결과로 답차 운동시 $VO_2$ max 의 예측치를 구할 때 쓰이는 Hassen등의 공식을 이용하여 이를 실제 답차 운동시 얻어진 $VO_2$ max값과 비교해 보았을 때 두 값 사이의 차이는 통계적으로 유의하였다 (p<0.01). 최대 운동시 심박 예비율, 산소/맥, 호흡 예비율, $V_E$/MVV, $V_E/VCO_2$는 (답차 운동과 자전거 운동사이에 차이가 있었다 ). 그러나 $V_E/VO_2$, Vd/Vt, Ti/Ttot는 차이가 없었다. AT에서는 산소/맥, 호흡 예비율, $V_E$/MVV, Ti/Ttot값은 차이가 있었으나 나머지 값들은 그렇지 못하였다. 결론: 본 연구에서 보았듯이 답차와 자전거 사이의 차이가 크므로 결과의 해석에 이용시 유의해야 할 것이며, 향후 한국인에서 적용할 수 있는 참고치를 구하려는 노력이 필요할 것으로 여겨진다.

  • PDF