• 제목/요약/키워드: 구매사이트

검색결과 220건 처리시간 0.028초

딥러닝과 머신러닝을 이용한 아파트 실거래가 예측 (Apartment Price Prediction Using Deep Learning and Machine Learning)

  • 김학현;유환규;오하영
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권2호
    • /
    • pp.59-76
    • /
    • 2023
  • 코로나 시대 이후 아파트 가격 상승은 비상식적이었다. 이러한 불확실한 부동산 시장에서 가격 예측 연구는 매우 중요하다. 본 논문에서는 다양한 부동산 사이트에서 자료 수집 및 크롤링을 통해 2015년부터 2020년까지 87만개의 방대한 데이터셋을 구축하고 다양한 아파트 정보와 경제지표 등 가능한 많은 변수를 모은 뒤 미래 아파트 매매실거래가격을 예측하는 모델을 만든다. 해당 연구는 먼저 다중 공선성 문제를 변수 제거 및 결합으로 해결하였다. 이후 의미있는 독립변수들을 뽑아내는 전진선택법(Forward Selection), 후진소거법(Backward Elimination), 단계적선택법(Stepwise Selection), L1 Regularization, 주성분분석(PCA) 총 5개의 변수 선택 알고리즘을 사용했다. 또한 심층신경망(DNN), XGBoost, CatBoost, Linear Regression 총 4개의 머신러닝 및 딥러닝 알고리즘을 이용해 하이퍼파라미터 최적화 후 모델을 학습시키고 모형간 예측력을 비교하였다. 추가 실험에서는 DNN의 node와 layer 수를 바꿔가면서 실험을 진행하여 가장 적절한 node와 layer 수를 찾고자 하였다. 결론적으로 가장 성능이 우수한 모델로 2021년의 아파트 매매실거래가격을 예측한 후 실제 2021년 데이터와 비교한 결과 훌륭한 성과를 보였다. 이를 통해 머신러닝과 딥러닝은 다양한 경제 상황 속에서 투자자들이 주택을 구매할 때 올바른 판단을 할 수 있도록 도움을 줄 수 있을 것이라 확신한다.

XAI 기법을 이용한 리뷰 유용성 예측 결과 설명에 관한 연구 (Explainable Artificial Intelligence Applied in Deep Learning for Review Helpfulness Prediction)

  • 류동엽;이흠철;김재경
    • 지능정보연구
    • /
    • 제29권2호
    • /
    • pp.35-56
    • /
    • 2023
  • 정보통신 기술의 발전에 따라 웹 사이트에는 수많은 리뷰가 지속적으로 게시되고 있다. 이로 인해 정보 과부하 문제가 발생하여 사용자들은 본인이 원하는 리뷰를 탐색하는데 어려움을 겪고 있다. 따라서, 이러한 문제를 해결하여 사용자에게 유용하고 신뢰성 있는 리뷰를 제공하기 위해 리뷰 유용성 예측에 관한 연구가 활발히 진행되고 있다. 기존 연구는 주로 리뷰에 포함된 특성을 기반으로 리뷰 유용성을 예측하였다. 그러나, 예측한 리뷰가 왜 유용한지 근거를 제시할 수 없다는 한계점이 존재한다. 따라서 본 연구는 이러한 한계점을 해결하기 위해 리뷰 유용성 예측 모델에 eXplainable Artificial Intelligence(XAI) 기법을 적용하는 방법론을 제안하였다. 본 연구는 Yelp.com에서 수집한 레스토랑 리뷰를 사용하여 리뷰 유용성 예측에 관한 연구에서 널리 사용되는 6개의 모델을 통해 예측 성능을 비교하였다. 그 다음, 예측 성능이 가장 우수한 모델에 XAI 기법을 적용하여 설명 가능한 리뷰 유용성 예측 모델을 제안하였다. 따라서 본 연구에서 제안한 방법론은 사용자의 구매 의사결정 과정에서 유용한 리뷰를 추천할 수 있는 동시에 해당 리뷰가 왜 유용한지에 대한 해석을 제공할 수 있다.

설명가능한 그래프 신경망을 활용한 리뷰 콘텐츠 기반의 유용성 예측모형 (The Prediction of the Helpfulness of Online Review Based on Review Content Using an Explainable Graph Neural Network)

  • 김은미;야오즈옌;홍태호
    • 지능정보연구
    • /
    • 제29권4호
    • /
    • pp.309-323
    • /
    • 2023
  • 온라인 리뷰의 역할이 중요해짐에 따라 유용한 리뷰를 선별하기 위해 많은 연구들이 이루어져 왔다. 유용한 리뷰는 고객들이 유용하다고 인지하는 리뷰이며, 평점, 리뷰길이, 리뷰내용 등에 영향을 받는 것으로 많은 연구에서 검증되었다. 유용한 리뷰는 소비자들의 투표에 의한 '좋아요' 수에 의해 결정되며 유용성 투표가 많을수록 소비자의 구매의사결정에 중요한 영향을 미치는 것으로 간주된다. 그러나 최근에 작성되어 많은 고객들에게 노출되지 않은 리뷰는 상대적으로 '좋아요' 수가 적을 수 있으며, 투표에 응하지 않아 '좋아요' 수가 없을 수도 있다. 따라서 유용한 리뷰를 판단하기 위해 '좋아요' 수에 의존하기 보다는 리뷰 내용을 기반으로 유용한 리뷰를 분류하고자 한다. 리뷰의 텍스트는 리뷰 유용성에 가장 큰 영향을 미치는 요인으로, 토픽 모델링, 감정분석 등 텍스트 마이닝 기법을 적용하여 리뷰 텍스트에 포함된 콘텐츠와 감정의 영향을 다양하게 분석하고 있다. 본 연구에서는 글로벌 영화정보 사이트인 IMDb의 영화리뷰를 활용하여 리뷰 콘텐츠 기반의 리뷰 유용성 예측모형을 제안한다. 설명가능한 그래프 신경망인 GNN(Graph Neural Network)을 적용하여 리뷰 유용성 예측모형을 구축하고, 설명가능한 인공지능을 통해 예측모형의 한계인 모형의 해석에 대한 문제를 해결한다. 설명가능한 그래프 신경망은 리뷰들 간의 연결관계도 확인할 수 있어 유용한 리뷰 또는 유용하지 않은 리뷰에 대해 보다 신뢰할 수 있는 정보를 제공할 수 있을 것이라 기대한다.

3D프린팅 서비스에 대한 사용자 경험 분석과 서비스 방향제안 (User Experience Analysis on 3D Printing Services and Service Direction Suggestions)

  • 이국희;조재경
    • 한국HCI학회논문지
    • /
    • 제11권1호
    • /
    • pp.47-55
    • /
    • 2016
  • 삼차원 프린팅(이하 3D프린팅)은 현대인들에게 새로움과 흥미를 줄 뿐 아니라 새로운 산업혁명을 예고할 정도로 각광받는 기술이다. 또한 다양한 3D프린팅 서비스 플랫폼의 출현으로 개인들도 3D프린팅으로 디자인한 제품을 쉽게 소유할 수 있게 되었다. 그러나 3D프린팅이 대중화되는 시대, 3D프린팅으로 누구나 원하는 제품을 디자인해서 만들 수 있는 신제조시대가 오기까지는 아직 고려할 문제들이 많아 보인다. 예를 들어, 과연 현존하는 3D프린팅 서비스들이 기존에 기계나 사람이 제작하던 제품을 3D프린팅으로도 만들 수 있다는 것 이상을 보여줄 수 있는지, 현존하는 대다수의 3D프린팅 서비스 플랫폼들처럼 넓은 범위의 제품군을 판매하는 것이 소비자들에게 어떤 의미를 제공할 것인지 등에 대한 충분한 고려와 연구가 필요하다. 이런 맥락에서 시작한 본 연구는 소비자들로 하여금 제품군의 범위가 넓은 3D프린팅 온라인 서비스 플랫폼과 상대적으로 좁은 서비스를 직접 경험해보게 한 후, 구매희망 사이트, 디자인의 다양성, 디자인 만족도, 지각된 기술력, 지각된 구매만족, 지각된 애프터서비스(A/S)를 비교하고 선택형 질문과 서술형 질문에 응답하게 함으로써 향후 3D프린팅 서비스가 나아가야할 방향이 무엇인지에 대한 통찰을 얻고자 했다. 결과적으로 제품군의 범위가 넓은 서비스(예: Shapeways)에 대한 소비자들의 선호가 좁은 서비스(예: Digital Forming)에 대한 선호보다 전반적으로 강함을 관찰하였고, 디자인의 다양성과 원하는 디자인의 구현 가능성이 3D프린팅 서비스가 고려해야할 가장 중요한 요소임을 확인할 수 있었다. 더하여 향후 경쟁력 있는 3D프린팅 서비스가 되기 위해 다양한 분야의 디자이너풀을 확보를 통한 디자인 컨설팅을 진행, 초보자들도 쉽게 디자인할 수 있는 웹기반 소프트웨어 제공, 온-오프라인 매장 병행운영에 대해 논의하였다.

온라인 리뷰 분석을 통한 상품 평가 기준 추출: LDA 및 k-최근접 이웃 접근법을 활용하여 (Product Evaluation Criteria Extraction through Online Review Analysis: Using LDA and k-Nearest Neighbor Approach)

  • 이지현;정상형;김준호;민은주;여운영;김종우
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.97-117
    • /
    • 2020
  • 상품 평가 기준은 상품에 대한 속성, 가치 등을 표현한 지표로써 사용자나 기업이 상품을 측정하고 파악할 수 있게 한다. 기업이 자사 제품에 대한 객관적인 평가와 비교를 수행하기 위해서는 적절한 기준을 선정하는 것이 필수적이다. 이때, 평가 기준은 소비자들이 제품을 실제로 구매 및 사용 후 평가할 때 고려하는 제품의 특징을 반영하여야 한다. 그러나 기존에 사용되던 평가 기준은 제품마다 상이한 소비자의 의견을 반영하지 못하고 있다. 기존 연구에서는 소비자 의견이 반영된 온라인 리뷰를 통해 상품의 특징, 주제를 추출하고 이를 평가기준으로 사용했다. 하지만 여전히 상품과 연관성이 낮은 평가 기준이 추출되거나 부적절한 단어가 정제되지 않는 한계가 있다. 본 연구에서는 이를 극복하기 위해 잠재 디리클레 할당(Latent Dirichlet Allocation, LDA) 기법으로 리뷰로부터 평가 기준 후보군을 추출하고 이를 k-최근접 이웃 접근법(k-Nearest Neighbor Approach, k-NN)을 이용해 정제하는 모델을 개발하고 검증했다. 제시하는 방법은 준비 단계와 추출 단계로 이루어진다. 준비 단계에서는 워드임베딩(Word Embedding) 모델과 평가 기준 후보군을 정제하기 위한 k-NN 분류기를 생성한다. 추출 단계에서는 k-NN 분류기와 언급 비율을 이용해 평가 기준 후보군을 정제하고 최종 결과를 도출한다. 제안 모델의 성능 평가를 위해 명사 빈도 추출 모델, LDA 빈도 추출 모델, 실제 전자상거래 사이트가 제공하는 평가 기준을 세 비교 모델로 선정했다. 세 모델과의 비교를 위해 설문을 진행하고 점수화하여 결과를 검정했다. 30번의 검정 결과 26번의 결과에서 제안 모델이 우수함을 확인했다. 본 연구의 제안 모델은 전자상거래 사이트에서 리뷰 특성을 반영한 상품군 별 차원을 도출하는데 활용될 수 있고 이를 기초로 인사이트 발굴을 위한 리뷰 분석 및 활용에 크게 기여할 것이다.

국내 프로축구 팬들의 유니폼 소비 분석: 손흥민의 토트넘 홋스퍼 FC 이적 전후 비교 (Analysis of Football Fans' Uniform Consumption: Before and After Son Heung-Min's Transfer to Tottenham Hotspur FC)

  • 최영현;이규혜
    • 지능정보연구
    • /
    • 제26권3호
    • /
    • pp.91-108
    • /
    • 2020
  • 박지성 선수의 2005년 맨체스터 유나이티드 FC 입단 이후로, 국내에서 프로축구 유니폼 시장이 본격적으로 성장하기 시작했다. 이후, 국내 선수들의 해외 리그에서 활약이 계속되면서 국내에서도 잉글랜드 프리미어리그에 대한 대중의 관심이 지속되고 있다. 이러한 시점에서 본 연구는 국내 프로축구 팬들의 유니폼 소비에 전반적인 소비자 인식을 알아보고, 선수의 영입에 따른 소비자 인식 변화를 비교하고자 했다. EPL의 토트넘에서 활동하고 있는 손흥민 선수의 영입 전후를 중심으로 소셜 미디어에 나타난 프로축구 팬들의 소비자 인식과 구매 요인을 알아보았다. 'EPL 유니폼'을 키워드로, 국내 포털사이트와 소셜 미디어의 게시글을 수집하고, 텍스트 마이닝, SNA, 회귀분석을 사용하여 분석했다. 연구 결과, 첫째, 선수의 소속 팀, 실적, 포지션과 구단의 실적, 순위, 리그의 우승 여부가 프로축구 유니폼의 구매와 탐색에 있어 주요 요인으로 확인되었다. 가격, 디자인, 사이즈, 로고 등과 같은 항목보다 유니폼의 형태, 마킹, 정품 여부, 스폰서와 더 중요하게 작용하고 있었다. 둘째, 구조적 등위성 분석과 군집분석을 통해 국내 프로축구 팬들 사이에서 유니폼과 관련되어 언급되고 있는 주요 주제를 알아본 결과, EPL에 소속된 구단과 유명 선수들이 가장 핵심적인 주제로 나타났다. 셋째, 프로축구 유니폼에 대한 시기별 주제는 월드컵과 EPL 리그에 대한 관심에서 EPL에서 활동하는 다양한 국내외 선수들에 대한 관심으로, 2015년 이후에는 유니폼 자체에 대한 것으로 주제가 변화했다. 이를 통해, 선수들의 이적에 따라 선수가 소속된 해당 구단의 유니폼이 관심을 받고 있음을 알 수 있었다. 넷째, 남녀 소비자 모두 손흥민에 대한 관심이 증가함에 따라서 토트넘이 소속된 리그인 EPL에 대한 관심도 증가하는 것으로 나타났다. 여성의 경우 손흥민에 대한 관심이 증가함에 따라 축구 유니폼에 대해서도 관심을 가지는 것으로 나타난 반면, 남성의 경우 손흥민 선수에 대한 관심과 축구 유니폼에 대한 관심 사이의 관계가 유의하게 나타나지 않았다. 각 구단은 선수와 구단의 성적과 이미지 관리, 스폰서 브랜드 관리에 집중하고, 선수의 이적이 결정되면 선수의 자국에 해당 물량의 공급을 늘리며, 인기를 끌고 있는 선수의 등번호가 부착된 유니폼의 경우에는 여성을 위한 다양한 사이즈를 제공해야 할 필요가 있다.

전자상거래의 축산물 원산지 표시실태 및 표시규정 모니터링 (Monitoring Country-of-Origin Labels and Indication Contents for Meat on Electronic On-line Trading)

  • 남정옥;남보라;박정민;이라미;구효정;서형주;장은재;김진만
    • 한국축산식품학회지
    • /
    • 제27권1호
    • /
    • pp.117-121
    • /
    • 2007
  • 21세기 정보사회로의 변화는 각 분야에 걸쳐 빠른 속도로 진전되고 있다. 그 중에서도 급속히 확산되고 있는 인터넷을 이용한 전자상거래의 발전과 전 사업분야에 걸친 파급 효과 또한 매우 확대되고 있다. 본 연구에서는 전자상거래를 통한 온라인 식육판매업소 100곳을 선정하여 구조화된 설문지를 이용하여 전자상거래 시 온라인 판매업소 표시사항 모니터링과 온라인 판매영업소의 축산물 판매 표시규정을 모니터링 하였다. 전자상거래시 표시사항의 조사 결과 상호명과 전화번호는 100% 모두 표기하여 높은 적합률을 나타내었다. 반면 영업장의 주소와 식육의 제조원 및 공급업체, 식육 판매업소, 사업자 등록번호 등의 항목은 상대적으로 낮은 적합률을 나타내었으며, 사이트 이용약관, 이메일 주소와 팩스번호의 적합률은 가장 낮게 조사되었다. 온라인 판매영업소의 축산물 판매 표시규정의 실태 조사결과는 제품명과 식육의 종류가 각각 100%의 높은 적합률을 나타냈으며 가격(96.3%) 원산지(93.6%), 용량(90.4%), 식육의 부위(80.9%)와 제품의 구성(73.4%) 정보는 상대적으로 낮은 적합률을 나타내었다. 특히 유통기간의 표시(20.2%), 제조일자(5.3%)는 가장 낮은 적합률을 기록하면서 안전성의 심각성을 나타내었다. 식품안전성을 확보하기 위해서는 식품위생과 안전성, 식품표시에 대한 홍보와 교육이 지속적으로 이루어져 소비자들의 식품안전에 대한 인식과 신뢰도를 높여야 한다. 또한 온라인 전자상거래 상에서도 축산물의 위생과 유통 및 보관을 위해 시행될 수 있는 다양한 제도들이 마련되어야 할 것으로 사료된다. 오늘날은 식품에 대한 소비자들의 욕구와 기호가 변화하여 건강과 식품안전성에 대한 관심도가 고조되고 있으며, 이는 식품을 구매하는 의사결정에 중요한 요인으로 작용하여 식품산업에 큰 영향을 미친다. 그러므로 식품안전의 문제는 생산자, 소비자, 식품가공업자, 언론, 정부, 학자들이 함께 풀어야 할 복합적인 문제이며 실제적 위험과 소비자의 인지된 위험에 대해 지속적으로 정확한 정보와 지식을 소비자에게 교육하고 홍보하는 것이 필요하다.

인터넷 패션쇼핑몰의 이메일 마케팅 활용과 반응 - 패션 전문몰을 중심으로 - (A Study on E-mail Campaigns and Feedback Analysis as Marketing Tools of Internet Fashion Shopping Malls - With Focus on Specialized Fashion Shopping Malls -)

  • 한지숙
    • 디자인학연구
    • /
    • 제19권2호
    • /
    • pp.53-62
    • /
    • 2006
  • 빠른 '통신수단 '정도로만 여겨왔던 이메일이 온라인 마케팅의 핵심으로 떠오르고 있다. 이로 인해 기업들은 고객과의 Communication을 통해 지속적인 고객관리를 해야 하는 시점에서 이메일 마케팅은 강력한 의사교환 수단이며 고객의 성향과 구매습관, 취향 등을 분석하여 개인화된 일대일(One To One) 마케팅1)을 가능케 해준다. 정확한 타겟팅이 무엇보다 중요한 패션 산업에 있어서 일대일 마케팅 도구로서 또는 고객과의 커뮤니케이션 할 수 있는 가장 효과적인 방법으로서 이메일 마케팅은 매우 중요한 전략중 하나이다. 이에 본 연구에서는 일대일(One To One) 마케팅 도구로 부각되고 있는 이메일을 대상으로 인터넷 패션쇼핑몰에서 2005년 6월 12일부터 7월 30일까지 발송한 이메일을 대상으로 실제 사례분석을 통해 이메일 발송 후 매출 신장 효과를 살펴보고 이메일 반응에 미치는 영향을 오픈율을 기준으로 세부 반응을 분석하였다. 연령대별, 성별 오픈율은 20대 후반 여성이 평균 21.66%로 가장 높게 나타났고, 평균 3.5%의 매출 신장 효과가 있었다. 매출 현황에서도 20대 후반의 매출액이 28.10%로 가장 높게 나타나 오픈율이 많은 그룹에서 매출도 많이 일어나는 것을 알 수 있었다. 이메일 제목에 따른 반응은 [케주얼] 이라는 상품 카테고리를 표시한 이메일 제목이 가장 높게 나타났고, 요일에 따른 반응은 화요일 발송 메일이 가장 높게 나타났다. 정기 메일과 섹션 메일의 연관성은 섹션 메일에서 오픈율이 더 높게 나타났고, 시간대별 오픈율은 14시(오후2시)에 20대 후반 여성에게 발송한 메일의 오픈율이 20.93%로 가장 높게 나타났다. 실용적 정보와 흥미로운 요소들로 수신자들의 관심을 끌어 사이트의 방문을 유도하는 형태로 가는 것이 바람직하다고 볼 수 있다. 결론적으로, 이메일 발송이 매출 신장에 효과적인 수단임을 알 수 있었다. 또한, 효과를 더욱 높이기 위해서는 기존 메일 발송 결과를 분석한 데이터를 차기 메일 발송에 꾸준히 적용함으로써 성공적인 이메일 마케팅 결과를 얻을 수 있을 것으로 기대된다.

  • PDF

대한민국 국민의 세대별 국내여행 방식 및 만족도 영향요인 (A Comparative Study of Domestic Travel Patterns and Determinant Factors Affecting Satisfaction by Generations)

  • 이미숙;박윤주
    • 경영정보학연구
    • /
    • 제22권2호
    • /
    • pp.137-166
    • /
    • 2020
  • 대한민국 국민의 해외여행 비율은 매년 증가 추세인데 반해, 국내여행 비율은 수년간 답보 상태에 있다. 이에, 정부에서는 다양한 국내 관광 활성화 정책을 시행하고 있으나, 이를 통한 국내관광 증진 효과는 제한적이다. 국내관광을 활성화시키기 위해서는, 여행자들별로 선호하는 여행 방식에 차이가 있음을 이해하고, 이에 맞춤화된 여행 서비스를 제공할 필요가 있다. 본 연구는 대한민국 국민들의 세대별 여행 방식의 특징을 분석한 후, 각 세대별로 맞춤화된 여행 서비스를 구성하기 위한 시사점을 도출하였다. '세대'란 같은 시대에 살면서, 비슷한 생애주기에 유사한 내/외부의 경험을 하기 때문에(김기연 등, 2003), 다른 세대와는 구별되는, 그 세대만의 관광 방식이 있을 수 있다. 본 연구는 여행상품 구성의 관점에서 세대 간 차이를 살펴보았다. 즉, 여행 상품 구성 및 마케팅에 필요한 요소인, 여행정보 수집 방식 및 출처, 사전 예약 상품의 종류, 패키지 이용 여부, 여행 시기/기간 및 장소, 여행시 주요활동 그리고, 여행만족도에 영향을 미치는 요인 등에 대한 세대 간 차이를 파악하고 시사점을 도출하였다. 본 연구에는 한국 문화체육관광연구원에서 수집한 2017년 국민 여행 실태조사 데이터 16,713건이 활용되었으며, 데이터는 패널들의 세대에 따라서, 밀레니얼(19세~34세), X세대(35세~54세), 베이비부머(55세~64세), 시니어(65세 이상) 등으로 구분하여 사용하였다. 본 연구결과, 전 세대 모두 자연경관이 수려하고, 문화유산이 풍부하며, 숙박 시설이 쾌적할 때, 여행만족도가 유의미하게 향상되었다. 또한, 전체 패키지보다는 숙박, 차량 대여 등 개별 상품을 쉽게 구매할 수 있도록 하고, 맛집 탐방 상품을 제공하는 것도 유효할 수 있을 것이다. 각 세대별로는, 밀레니얼은 여름철 성수기에 인기 방문지를 중심으로 체험 상품을 구성하는 것이 좋으며, 이들을 위한 관광 안내 시설을 잘 마련할 필요가 있겠다. 또한, 포털사이트와 소셜네트워크 서비스를 통한 마케팅도 밀레니얼 세대에게 효과적일 것으로 보인다. X세대는 자가용으로 여행하기 좋은 지역에, 자녀와 함께 할 수 있는 체험형 여행상품이 유효할 것으로 보인다. 이들에게는 교통만족도가 중요하며, 여름철 성수기에 인기 관광지로 여행을 많이 간다는 특징은 밀레니얼 세대와 유사하다. 베이비부머와 시니어 세대의 경우, 자연 감상 및 휴식, 쇼핑 등을 포함한 여행 상품을 구성하는 것이 좋을 것으로 보이며, 인터넷을 통한 마케팅보다는 구전 효과를 이용하는 것이 유효하겠다. 특히 시니어 세대의 경우, 봄가을을 중심으로, 당일 여행 패키지 상품을 구성하는 것도 효과적일 것으로 보인다. 이러한 세대별 여행 특성을 고려하여 맞춤화된 관광상품을 구성한다면, 궁극적으로 국내관광산업을 활성화에 기여할 수 있을 것으로 기대된다.

사용자 행동 기반의 사회적 관계를 결합한 사용자 협업적 여과 방법 (Incorporating Social Relationship discovered from User's Behavior into Collaborative Filtering)

  • 타이쎄타;하인애;조근식
    • 지능정보연구
    • /
    • 제19권2호
    • /
    • pp.1-20
    • /
    • 2013
  • 소셜 네트워크는 사용자들의 공통된 관심사, 경험, 그리고 일상 생활들을 함께 공유하기 위해 소셜 네트워크 상 사람들을 서로 연결시켜주는 거대한 커뮤니케이션 플랫폼이다. 소셜 네트워크상의 사용자들은 포스팅, 댓글, 인스턴스 메시지, 게임, 소셜 이벤트 외에도 다양한 애플리케이션을 통해 다른 사용자들과 소통하고 개인 정보 관리하는데 많은 시간을 소비한다. 소셜 네트워크 상의 풍부한 사용자 정보는 추천시스템이 추천 성능을 향상시키기 위해 필요한 큰 잠재력이 되었다. 대부분의 사용자들은 어떤 상품을 구매하기 전 가까운 관계이거나 같은 성향을 가진 사람들의 의견을 반영하여 의사 결정을 하게 된다. 그러므로 소셜 네트워크에서의 사용자 관계는 추천시스템을 위한 사용자 선호도 예측을 효율적으로 높이는데 중요한 요소라 할 수 있다. 일부 연구자들은 소셜 네트워크에서의 사용자와 다른 사용자들 사이의 상호작용 즉, 소셜 관계(social relationship)와 같은 소셜 데이터가 추천시스템에서 추천의 질에 어떠한 영향을 미치는가를 연구하고 있다. 추천시스템은 아마존, 이베이, Last.fm과 같은 큰 규모의 전자상거래 사이트 또한 채택하여 사용되는 시스템으로, 추천시스템을 위한 방법으로는 협업적 여과 방법과 내용 기반 여과 방법이 있다. 협업적 여과 방법은 사용자들의 선호도 학습에 의해 사용자가 아직 평가하지 않은 아이템 중 선호할 수 있는 아이템을 정확하게 제안하기 위한 추천시스템 방법 중 하나이다. 협업적 여과는 사용자들의 데이터에 초점을 맞춘 방법으로 유사한 배경과 선호도를 가지는 사용자들로부터 정보를 수집하여 사용자들의 선호도 예측을 자동으로 발생시킨다. 특히 협업적 여과는 근접한 이웃 사용자들에 의해서 목적 사용자가 선호할 수 있는 아이템을 제시하는 것으로 유사한 이웃 사용자를 찾는 것이 중요하다. 좋은 이웃 사용자 발견은 사용자와 아이템을 고려하는 방법이 일반적이다. 각 사용자는 아이템 즉, 영화, 상품, 책 등에 자신의 선호도를 나타내기 위하여 평가 값을 입력하고, 시스템은 이를 바탕으로 사용자-평가 행렬을 구축한다. 이 사용자-평가 행렬은 목적 사용자와 유사하게 아이템을 평가한 사용자 그룹을 찾기 위한 것으로, 목적 사용자가 아직 평가하지 않은 아이템에 대하여 사용자-평가 매트릭스를 통해 그 평가 값을 예측한다. 현재 이 협업적 여과 방법은 전자상거래와 정보 검색에서 적용되어 개인화 시스템에 효율적으로 사용되고 있다. 하지만 초기 사용자 문제, 데이터 희박성 문제와 확장성 그리고 예측 정확도 향상 등 해결해야 할 과제가 여전히 남아 있다. 이러한 문제들을 해소하기 위해 많은 연구자들은 하이브리드, 신뢰기반, 소셜 네트워크 기반 협업적 여과와 같은 다양한 방법을 제안하였다. 본 논문에서는 전통적인 협업적 여과 방식의 예측 정확도와 추천 성능을 향상시키기 위해 소셜 네트워크에 존재하는 소셜 관계를 이용한 협업적 여과 시스템을 제안한다. 소셜 관계는 소셜 네트워크 서비스 중 하나인 페이스북 사용자들이 남긴 포스팅과 사용자의 소셜 네트워크 친구와 의견 교류 중 남긴 코멘트와 같은 사용자 행동을 기반으로 정의된다. 소셜 관계를 구축하기 위해 소셜 네트워크 사용자의 포스팅과 댓글을 추출하고, 추출된 텍스트에 불용어 및 특수 기호 제거와 스테밍 등 전처리를 수행하였다. 특징 벡터는 TF-IDF를 이용하여 전처리된 텍스트에 나타난 각 단어에 대한 특징 점수를 계산함으로써 구축된다. 본 논문에서 이웃 사용자를 결정하기 위해 사용되는 사용자 간 유사도는 특징 벡터를 이용한 사용자 행동 유사도와 사용자의 영화 평가를 기반으로 한 전통적 방법의 유사도를 결합하여 계산된다. 제안하는 시스템은 목표 사용자와 제안한 방법을 통해 결정된 이웃 사용자 집단을 기반으로 목표 사용자가 평가하지 않은 아이템에 대한 선호도를 예측하고 Top-N 아이템을 선별하여 사용자에게 아이템을 추천하게 된다. 본 논문에서 제안하는 방법을 확인하고 평가하기 위하여 IMDB에서 제공하는 영화 정보 기반으로 영화 평가 시스템을 구축하였다. 예측 정확도를 평가하기 위해 MAE 값을 이용하여 제안하는 알고리즘이 얼마나 정확한 추천을 수행하는지에 대한 예측 정확도를 측정하였다. 그리고 정확도, 재현율 및 F1값 등을 활용하여 시스템의 성능을 평가하였으며, 시스템의 추천 품질은 커버리지를 이용하여 평가되었다. 실험 결과로부터 본 논문에서 제안한 시스템이 보다 더 정확하고 좋은 성능으로 사용자에게 아이템을 추천하는 것을 볼 수 있었다. 특히 소셜 네트워크에서 사용자 행동을 기반으로 한 소셜 관계를 이용함으로써 추천 정확도를 6% 향상시킴을 보였다. 또한 벤치마크 알고리즘과의 성능비교 실험을 통해 7% 향상된 추천 성능의 결과를 보여준다. 그러므로 사용자의 행동으로부터 관찰된 소셜 관계를 CF방법과 결합한 제안한 방법이 정확한 추천시스템을 위해 유용하며, 추천시스템의 성능과 품질을 향상시킬 수 있음을 알 수 있다.