• 제목/요약/키워드: Movie Reviews

검색결과 87건 처리시간 0.022초

평점과 리뷰 텍스트 감성분석을 결합한 추천시스템 향상 방안 연구 (How to improve the accuracy of recommendation systems: Combining ratings and review texts sentiment scores)

  • 현지연;유상이;이상용
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.219-239
    • /
    • 2019
  • 개인에게 맞춤형 서비스를 제공하는 것이 중요해지면서 개인화 추천 시스템 관련 연구들이 끊임없이 이루어지고 있다. 추천 시스템 중 협업 필터링은 학계 및 산업계에서 가장 많이 사용되고 있다. 다만 사용자들의 평점 혹은 사용 여부와 같은 정량적인 정보에 국한하여 추천이 이루어져 정확도가 떨어진다는 문제가 제기되고 있다. 이와 같은 문제를 해결하기 위해 현재까지 많은 연구에서 정량적 정보 외에 다른 정보들을 활용하여 추천 시스템의 성능을 개선하려는 시도가 활발하게 이루어지고 있다. 리뷰를 이용한 감성 분석이 대표적이지만, 기존의 연구에서는 감성 분석의 결과를 추천 시스템에 직접적으로 반영하지 못한다는 한계가 있다. 이에 본 연구는 리뷰에 나타난 감성을 수치화하여 평점에 반영하는 것을 목표로 한다. 즉, 사용자가 직접 작성한 리뷰를 감성 수치화하여 정량적인 정보로 변환해 추천 시스템에 직접 반영할 수 있는 새로운 알고리즘을 제안한다. 이를 위해서는 정성적인 정보인 사용자들의 리뷰를 정량화 시켜야 하므로, 본 연구에서는 텍스트 마이닝의 감성 분석 기법을 통해 감성 수치를 산출하였다. 데이터는 영화 리뷰를 대상으로 하여 도메인 맞춤형 감성 사전을 구축하고, 이를 기반으로 리뷰의 감성점수를 산출한다. 본 논문에서 사용자 리뷰의 감성 수치를 반영한 협업 필터링이 평점만을 고려하는 전통적인 방식의 협업 필터링과 비교하여 우수한 정확도를 나타내는 것을 확인하였다. 이후 제안된 모델이 더 개선된 방식이라고 할 근거를 확보하기 위해 paired t-test 검증을 시도했고, 제안된 모델이 더 우수하다는 결론을 도출하였다. 본 연구에서는 평점만으로 사용자의 감성을 판단한 기존의 선행연구들이 가지는 한계를 극복하고자 리뷰를 수치화하여 기존의 평점 시스템보다 사용자의 의견을 더 정교하게 추천 시스템에 반영시켜 정확도를 향상시켰다. 이를 기반으로 추가적으로 다양한 분석을 시행한다면 추천의 정확도가 더 높아질 것으로 기대된다.

3D 애니메이션 제작을 위한 디자이너의 인지적 사고과정 분석 (Analysis on designer's cognitive thinking process in 3D animation design)

  • 김기수
    • 만화애니메이션 연구
    • /
    • 통권20호
    • /
    • pp.1-14
    • /
    • 2010
  • 영화 <아바타>의 영향으로 3D 입체 영상의 발전 전망에 대하여 사회적으로 많은 관심을 가지고 있으며 컴퓨터그래픽 기술을 지원하는 하드웨어 기술발전에도 지속적인 성장이 예측되고 있다. 또한 컴퓨터 인터넷 기반 3D네트워크 인프라의 저변 확대로 인터넷 상에서 3D 게임사업의 발전과 함께 2D 애니메이션의 기술적인 공유가 함께 이루어지고 있는 실정이다. 이러한 기술적인 발전으로 문화적인 디자인 제작 한계가 좁혀지고 애니메이션의 2D, 3D 저변확대가 빠르게 넓혀지고 있으나 디자이너가 작업하고자 하는 디지털 콘텐츠모양과 화면에서의 환경구조에 대한 문제해결방향을 분석하는데 있어 아직까진 한계를 보인다. 본 연구는 3D산업의 현황과 인지과학의 대표적인 연구방법인 절차 지향적인 분석을 통한 영상 애니메이션 디자이너의 작업 프로토콜을 분석하고 공통된 커뮤니케이션 및 작업도구를 사용하면서 표현 되는 행위를 관찰하여 그들의 작업 프로세스를 분석하고자 한다. 연구 결과를 도출하기 위하여 대표적인 선행연구를 고찰하고 여기서 나온 자료를 근거로 실증적인 심층 분석을 실시하였다. 분석방법으로 피험자가 3D 게임영상에 적용하기 위한 2D 아바타이미지를 스케치 하는 과정을 촬영하였으며 분석과정에서 발생되는 단계별 분석범주를 세분화하고 코드화 하여 디자이너가 문화적인 문제해결을 어떻게 극복하고 정리된 형태로 진행해 가는지를 살펴보았다.

  • PDF

Impact of Word Embedding Methods on Performance of Sentiment Analysis with Machine Learning Techniques

  • Park, Hoyeon;Kim, Kyoung-jae
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권8호
    • /
    • pp.181-188
    • /
    • 2020
  • 본 연구에서는 다양한 워드 임베딩 기법이 감성분석의 성과에 미치는 영향을 확인하기 위한 비교연구를 제안한다. 감성분석은 자연어 처리를 사용하여 텍스트 문서에서 주관적인 정보를 식별하고 추출하는 오피니언 마이닝 기법 중 하나이며, 상품평이나 댓글의 감성을 분류하는데 사용될 수 있다. 감성은 긍정적이거나 부정적인 것으로 분류될 수 있기 때문에 일반적인 분류문제 중 하나로 생각할 수 있으며, 이의 분류를 위해서는 텍스트를 컴퓨터가 인식할 수 있는 언어로 변환하여야 한다. 따라서 단어나 문서와 같은 텍스트를 자연어 처리에서 벡터로 변형하여 진행하는데 이를 워드 임베딩이라고 한다. 워드 임베딩 기법은 Bag of Words, TF-IDF, Word2Vec 등 다양한 기법이 사용되고 있는데 지금까지 감성분석에 적합한 워드 임베딩 기법에 대한 연구는 많이 진행되지 않았다. 본 연구에서는 영화 리뷰의 감성분석을 위해 다양한 워드 임베딩 기법 중 Bag of Words, TF-IDF, Word2Vec을 사용하여 그 성과를 비교 분석한다. 분석에 사용할 연구용 데이터 셋은 텍스트 마이닝에서 많이 활용되고 있는 IMDB 데이터 셋을 사용하였다. 분석 결과, TF-IDF와 Bag of Words의 성과가 Word2Vec보다 우수한 것으로 나타났으며 TF-IDF는 Bag of Words보다 성과가 우수하였으나 그 차이가 매우 크지는 않았다.

온라인 구전의 양과 방향성이 영화 관람의도에 미치는 영향: 리뷰 신뢰성의 매개효과 (The Impacts of Volume and Valence of eWOM on Purchase Intention for Movies: Mediation of Review Credibility)

  • 한승지;김중인
    • 한국콘텐츠학회논문지
    • /
    • 제21권7호
    • /
    • pp.93-104
    • /
    • 2021
  • 영화 흥행에 영향을 미치는 온라인 구전의 양과 방향성에 관한 선행연구들의 거의 대부분은 Yahoo Movies, IMDB.com, 네이버 영화 등에서 제공하는 실제 온라인 데이터(2차 데이터)를 사용하였다. 그러나 실제 온라인 데이터는 구전 제공자와 구전 수용자의 심리 변수나 특성 정보를 파악하기가 어렵기 때문에 실제 데이터를 사용한 선행연구들에서는 구전의 양 및 방향성과 소비자의 심리 변수 간의 인과관계를 파악할 수가 없었다. 본 연구에서는 선행연구의 이러한 한계를 보완하여 실제 데이터 대신에 설문조사를 통해 기존에 검증되지 않은 인과관계모형으로서 구전의 양과 방향성이 소비자 심리 변수이며 대표적인 구전 정보 특성인 리뷰 신뢰성을 매개변수로 하여 영화 관람의도에 미치는 직·간접적인 영향력을 검증하였다. 연구결과, 구전의 양과 방향성이 관람의도에 미치는 총효과는 각각 유의하였다. 그러나 구전의 양은 리뷰 신뢰성을 통해 관람의도에 미치는 간접적인 효과만이 유의한 반면에(완전매개효과), 방향성은 직접효과와 간접효과가 모두 유의한(부분매개효과) 차이가 나타났다. 이러한 연구결과에 대한 이론적, 실무적 시사점을 제시하였다.

유전자 알고리즘을 활용한 소셜네트워크 기반 하이브리드 협업필터링 (Social Network-based Hybrid Collaborative Filtering using Genetic Algorithms)

  • 노희룡;최슬비;안현철
    • 지능정보연구
    • /
    • 제23권2호
    • /
    • pp.19-38
    • /
    • 2017
  • 본 연구는 사용자 평점 이외에 사용자 간 직접 간접적 신뢰 및 불신 관계 네트워크의 분석 결과를 추가로 반영한 새로운 하이브리드 협업필터링(Collaborative filtering, CF) 추천방법을 제안한다. 구체적으로 사용자 간의 유사도를 계산할 때 사용자 평가점수의 유사성만을 고려하는 기존의 CF와 다르게, 사용자 신뢰 및 불신 관계 데이터의 사회연결망분석 결과를 추가적으로 고려하여 보다 정교하게 사용자 간의 유사도를 산출하였다. 이 때, 사용자 간의 유사도를 재조정하는 접근법으로 특정 이웃 사용자가 신뢰 및 불신 관계 네트워크에서 높은 신뢰(또는 불신)를 받을 때, 추천 대상이 되는 사용자와 해당 이웃 간의 유사도를 확대(강화) 또는 축소(약화)하는 방안을 제안하고, 더 나아가 최적의 유사도 확대 또는 축소의 정도를 결정하기 위해 유전자 알고리즘(genetic algorithm, GA)을 적용하였다. 본 연구에서는 제안 알고리즘의 성능을 검증하기 위해, 특정 상품에 대한 사용자의 평가점수와 신뢰 및 불신 관계를 나타낸 실제 데이터에 추천 알고리즘을 적용하였으며 그 결과, 기존의 CF와 비교했을 때 통계적으로 유의한 수준의 예측 정확도 개선이 이루어짐을 확인할 수 있었다. 또한 신뢰 관계 정보보다는 불신 관계 정보를 반영했을 때 예측 정확도가 더 향상되는 것으로 나타났는데, 이는 사회적인 관계를 추적하고 관리하는 측면에서 사용자 간의 불신 관계에 대해 좀 더 주목해야 할 필요가 있음을 시사한다.

RFM 다차원 분석 기법을 활용한 암시적 사용자 피드백 기반 협업 필터링 개선 연구 (A Study on Improvement of Collaborative Filtering Based on Implicit User Feedback Using RFM Multidimensional Analysis)

  • 이재성;김재영;강병욱
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.139-161
    • /
    • 2019
  • 전자상거래 시장의 이용이 보편화 되며 고객들에게 좋은 품질의 물건을 어디서, 얼마나 합리적으로 구매할 수 있는지가 중요해졌다. 이러한 구매 심리의 변화는 방대한 정보 속에서 오히려 고객들의 구매 의사결정을 어렵게 만드는 경향이 있다. 이때 추천 시스템은 고객의 구매 행동을 분석하여 정보 검색에 드는 비용을 줄이고 만족도를 높이는 효과가 있다. 하지만 대부분 추천 시스템은 책이나 영화 등 동종 상품 분류 내에서만 추천이 이뤄진다. 왜냐하면 추천 시스템은 특정 상품에 매긴 구매 평점 데이터를 기반으로 해당 상품 분류 내 유사한 상품에 대한 구매 만족도를 추정하기 때문이다. 그밖에 추천 시스템에서 사용하는 구매 평점의 신뢰성에 대한 문제도 제시되고 있으며 오프라인에선 평점 확보 자체가 어렵다. 이에 본 연구에서는 일련의 문제를 개선하기 위해 RFM 다차원 분석 기법을 활용하여 기존에 사용하던 고객의 구매 평점을 객관적으로 대체할 수 있는 새로운 지표의 활용 가능성을 제안하는 바이다. 실제 기업의 구매 이력 데이터에 해당 지표를 적용해서 검증해본 결과 높게는 약 55%에 해당하는 정확도를 기록했다. 이는 총 4,386종에 달하는 이종 상품들 중 한번도 이용해 본 적 없는 상품을 추천한 결과이기 때문에 검증 결과는 상대적으로 높은 정확도와 활용가치를 의미한다. 그리고 본 연구는 오프라인의 다양한 상품데이터에서도 적용할 수 있는 범용적인 추천 시스템의 가능성을 시사한다. 향후 추가적인 데이터를 확보한다면 제안하는 추천 시스템의 정확도 향상도 기대할 수 있다.

협력필터링과 사회연결망을 이용한 신규고객 추천방법에 대한 연구 (The Research on Recommender for New Customers Using Collaborative Filtering and Social Network Analysis)

  • 신창훈;이지원;양한나;최일영
    • 지능정보연구
    • /
    • 제18권4호
    • /
    • pp.19-42
    • /
    • 2012
  • 고객이 상품을 구매하는 패턴이 빠르게 변화하고 있다. 오프라인에서 고객이 직접 상품을 보고, 체험한 후 구매하던 패턴이 TV홈쇼핑, 인터넷 쇼핑 등 고객이 편리한 장소에서 자유롭게 구매하는 방법으로 확산되었다. 이처럼 구매 가능한 상품의 범위는 점점 더 다양해지고 있지만 이로 인하여 고객이 상품을 구매할 때 생기는 번거로움은 더욱 커지고 있다. 오프라인에서는 물건을 직접보고 구매하기 때문에 반품율이 낮은 반면에 온라인 구매 물품은 배송과 환불 등에서 복잡한 일들이 많이 발생한다. 온라인을 통해서 물건을 구매할 때 상품에 대한 사전 정보는 매우 한정적이며 실제로 물건을 구매했을 경우 고객이 생각했던 것과 다를 수 있다. 이러한 결과는 결국 고객의 불만족 및 구매취소로 이어진다. 또한 TV홈쇼핑이나 인터넷 쇼핑 등을 통해서 물건을 구매할 때 고객들은 이미 상품을 구매한 고객의 리뷰에도 관심을 기울이고 있다. 좋은 평가를 받은 상품은 더 많은 매출로 이어질 수 있기 때문에 기업은 이에 관심을 기울일 필요가 있다. 고객의 욕구를 만족시킬 수 있는 적절한 상품을 추천해 주고 이를 구매로 연결시키는 것은 기업의 이윤 창출과 직결되기 때문에 그 중요성이 강조된다. 고객을 위한 추천방법은 베스트셀러기반 추천방법, 인구통계 정보기반 추천방법, 최소질의대상 상품결정방법, 내용필터링기법, 협력필터링기법 등이 존재하며, 이에 대한 많은 연구가 활발하게 진행되고 있다. 그러나 위의 방법들을 신규고객에게 적용하는 것에는 문제가 발생할 수 있다. 신규고객은 상품에 대한 과거 구매이력이 존재하지 않기 때문이다. 이를 해결하기 위한 방안으로 가입 시, 고객의 인구통계적 정보나 선호도에 대한 응답을 유도하는 방법을 활용할 수 있다. 그러나 고객이 이에 대한 번거로움을 느낄 수도 있으며, 불완전한 답변을 하게 되면 추천의 정확도는 감소한다. 최근 이미 상품을 구매한 고객의 리뷰 및 기업에서 추천하는 제품에 의존하는 고객들이 증가하면서 이를 악용하는 사례도 자주 등장한다. 결국 추천에 대한 고객들의 신뢰는 감소하게 될 것이다. 따라서 좀 더 명확한 방식의 추천시스템이 절실하며, 이것이 개선된다면 는 곧 고객들의 신뢰 증가로 이어질 것이다. 본 연구에서는 협력필터링기법과 사회연결망기법의 중심성을 결합한 분석을 시도하였다. 중심성은 신규고객의 선호도를 기존고객들의 데이터를 통하여 유추하기 위하여 활용되는 정보이다. 기존 연구들에서는 기존고객들의 구매 가운데 구매성향이 유사한 고객들의 정보에 초점을 맞추고 있으며 구매성향이 다른 고객들의 정보에 대한 분석은 이루어지고 있지 않다. 그러나 이처럼 구매성향이 서로 다른 고객들의 정보를 활용한다면 추천의 정확성이 더 향상되지 않을까 하는 점을 기반으로 데이터들을 다양한 방식으로 분석하였다. 연구에 사용된 데이터는 미네소타대학의 GroupLens Research Project팀이 협력필터링기법을 통하여 영화를 추천하기 위해 만든 MovieLens의 데이터이다. 이는 1,684편의 영화에 대한 선호도를 943명이 응답한 정보로 총 100,000개의 데이터가 있다. 이를 시간 순으로 구분하여 초기 50,000개의 데이터를 기존고객의 데이터로, 후기 50,000개의 데이터를 신규고객의 데이터로 사용하였다. 이 때, 신규고객과 기존고객은 연구자가 임의로 구분한 것이다. 따라서 신규고객이라고 표현되는 고객의 데이터는 실제로 추천시스템을 통해 정보를 제공받은 고객이라고는 볼 수 없다. 그러나 현실적으로 실제 신규고객의 데이터를 수집하는 것이 쉽지 않기 때문에 전체 고객의 정보를 시간 순으로 구분하고 신규고객으로 분류한 것임을 밝혀둔다. 제시된 추천시스템은 [+]집단 추천시스템, [-]집단 추천시스템, 통합 추천시스템으로 총 3가지이다. [+]집단 추천시스템은 기존의 연구들과 유사한 방식으로 유사도가 높은 고객들을 신규고객의 이웃고객으로 분석하였다. 유사도가 높다는 것은 다른 고객들과 상품 구매에 대한 성향이 유사한 것을 의미한다. 또한 [-]집단 추천시스템은 유사도가 낮고 다른 고객들과 상품의 구매패턴이 반대에 가까운 고객들의 데이터를 활용하였으며, 통합 추천시스템은 [+]집단 추천시스템과 [-]집단 추천시스템을 결합한 방식이다. [+]집단 추천시스템과 [-]집단 추천시스템에서 각각 추천된 영화 가운데 중복되는 영화만을 신규고객에게 추천하는 방식이다. 다양한 방법의 시도를 통하여 적절한 추천시스템을 찾고, 추천시스템의 정확도를 향상시키는데 그 목적이 있다. 활용된 데이터의 분석 결과는 통합 추천시스템이 정확도가 가장 높았으며 [-]집단 추천시스템, [+]집단 추천시스템의 순인 것으로 나타났다. 이는 통합 추천시스템이 가장 효율적일 것이라는 연구자의 추측과 일치하는 결과이다. 각각의 추천시스템은 정확도의 변화를 쉽게 비교할 수 있도록 등고선지도 및 그래프를 이용하여 나타냈다. 연구의 한계점으로는 연구자가 제시한 통합 추천시스템과 [-]집단 추천시스템에 대한 정확도는 향상되었지만 이는 임의로 구분한 기준을 바탕으로 분석하였다는 점이다. 실제 추천된 영화를 바탕으로 신규고객이 영화를 선택 한 것이 아니라 기존고객의 데이터를 임의로 분류하였기 때문이다. 따라서 이는 추천 영화가 실제 고객에 미친 영향이 아니라는 한계가 존재한다. 또한 영화가 아닌 다른 상품에 대해서 이 추천시스템을 적용하였을 경우 추천 정확도에는 차이가 있을 수 있다. 따라서 추천시스템을 적용할 때에는 각 상품 및 고객집단의 특성에 적합한 적용이 필요하다.