• 제목/요약/키워드: 빅데이터시각화

검색결과 232건 처리시간 0.018초

웹검색 트래픽 정보를 활용한 유커 인바운드 여행 수요 예측 모형 및 유커마이닝 시스템 개발 (Development of Yóukè Mining System with Yóukè's Travel Demand and Insight Based on Web Search Traffic Information)

  • 최유지;박도형
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.155-175
    • /
    • 2017
  • 최근 독감 예측이나 당선인 예측, 구매 패턴, 투자 등 다방면에서 웹검색 트래픽 정보. 소셜 네트워크 내용 등 거대한 데이터를 통해 사회적 현상, 소비 패턴을 분석하는 시도가 이전보다 늘어났다. 구글, 네이버, 바이두 등 인터넷 포털 업체들의 웹검색 트래픽 정보 공개 서비스와 함께 웹검색 트래픽 정보를 활용하여 소비자나 사용자와 관련된 연구가 실시되기 시작했다. 웹검색 트래픽 정보를 활용한 사회 현상, 소비 패턴 분석을 연구는 많이 수행되었으나, 그에 비해서 도출된 여행 수요 모델을 토대로 의사결정을 위한 실질적 대책 수립으로 이어지는 연구는 많이 진행되지 않은 실정이다. 관광산업은 상대적으로 많은 고용을 가능하게 하고 외자를 유치하는 등 고부가가치를 창출하여 경제 전체에 선순환 효과를 일으키는 중요한 산업이다. 그 중에서도 국내 입국외래객중 수년간 2위와의 큰 차이로 1위를 차지해왔던 중국 국적의 관광객 '유커' 및 그들이 지출하는 1인당 평균 관광 수지는 한국 경제에 매우 중요한 한 부분이다. 관광 수요의 예측은 효율적인 자원 배분과 합리적인 의사 결정에 있어서 공공부문 및 민간부문 모두 중요하다. 적절한 관광 수요 예측을 통해서 한정된 자원을 더욱 효과적으로 활용하여 더욱 많은 부가가치를 창출하기 위한 것이다. 본 연구는 중국인 인바운드를 예측하는 방법에 있어, 이전보다 더 최신의 트렌드를 즉각적으로 반영하고 개인들의 집합의 관심도가 포함되어 예측 성능이 개선된 방법을 제안한다. 해외여행은 고관여 소비이기 때문에 잠재적 여행객들이 입국하기 전 웹검색을 통해 적극적으로 자신의 여정과 관련된 정보를 취득하기 위한 활동을 한다. 따라서 웹검색 트래픽 수치가 중국인 여행객의 관심정도를 대표할 수 있다고 보았다. 중국인 여행객들이 한국 여행을 준비하는 단계에서 검색할만한 키워드를 선정해 실제 중국인 입국자 수와 상관관계가 있음을 검증하고자 하였다. 중국 웹검색 엔진 시장에서 80%의 점유율을 가지는 중국 최대 웹검색 엔진 '바이두'에서 공개한 웹검색 데이터를 활용하여 그 관심 정도를 대표할 수 있을 것이라 추정했다. 수집에 필요한 키워드의 선정 단계에서는 잠재적 여행객이 여정을 계획하고 구체화하는 단계에서 일반적으로 검색하게 되는 키워드 후보군을 선정하였다. 키워드의 선정에는 중국 국적의 잠재적 여행객 표본과의 인터뷰를 거쳤다. 트래픽 대소 관계 확인 결과에 따라서 최종 선정된 키워드들을 한국여행이라는 주제와 직접적인 연관을 가지는 키워드부터, 간접적인 연관을 가지는 키워드까지 총 세 가지 레벨의 카테고리로 분류하였다. 분류된 카테고리 내의 키워드들은 바이두'가 제공하는 웹검색 트래픽 데이터 제공 서비스 '바이두 인덱스'를 통해 웹검색 트래픽 데이터를 수집했다. 공개된 데이터 페이지 특성을 고려한 웹 크롤러를 직접 설계하여 웹검색 트래픽 데이터를 수집하였고, 분리되어 수집된 변수에는 필요한 변수 변환 과정을 수행했다. 자동화 수집된 웹검색 트래픽 정보들을 투입하여 중국 여행 인바운드에 대한 유의한 영향 관계를 확인하여 중국인 여행객의 한국 인바운드 여행 수요를 예측하는 모형을 개발하고자 하였다. 정책 의사결정 및 관광 경영 의사결정 같은 실무적 활용을 고려하여 각 변수의 영향력을 정량적으로 설명할 수 있고 설득이 명료한 방법인 다중회귀분석방법을 적용해 선형 식을 도출하였다. 수집된 웹검색 트래픽 데이터를 기존 검증된 모형 독립변인들에 추가적으로 투입함으로써 전통적인 독립변인으로만 구성된 연구 모형과 비교하여 가장 뛰어난 성능을 보이는 모형을 확인하였다. 본 연구에서 검증하려는, 웹검색 트래픽으로 대표되는 독립변인을 투입한 최종 도출된 모형을 통해 중국인 관광 수요를 예측할 때 유의한 영향을 끼치는 웹검색 트래픽 변수를 확인할 수 있다. 최적 모형 설명력을 가지는 모형을 기반으로 최종 회귀 식을 만들었고 이를 '유커마이닝' 시스템 내부에 도입하였다. 데이터 분석에서 더 나아가 도출된 모형을 직관적으로 시각화하고, 웹검색 트래픽 정보를 활용하여 도출할 수 있는 인사이트를 함께 보여주는 데이터 분석 기반의 '유커마이닝' 솔루션의 시스템 알고리즘과 UX를 제안하였다. 본 연구가 제안하는 모형과 시스템은 관광수요 예측모형 분야에서 웹검색 트래픽 데이터라는 정보 탐색을 하는 과정에 놓인 개인들의 인터랙티브하고 즉각적인 변수를 활용한 새로운 시도이다. 실무적으로 관련 정책결정자나 관광사, 항공사 등이 활용 가능한 실제적인 가치를 가지고, 정책적으로도 효과적인 관광 정책 수립에 활용될 수 있다.

평점이 수렴되지 않는 리뷰의 제품들이 더 좋을 수도 있을까?: 제품 리뷰평점의 분산과 소비자의 조절초점 성향에 따른 소비자 태도 변화 (Could a Product with Diverged Reviews Ratings Be Better?: The Change of Consumer Attitude Depending on the Converged vs. Diverged Review Ratings and Consumer's Regulatory Focus)

  • 이은주;박도형
    • 지식경영연구
    • /
    • 제22권3호
    • /
    • pp.273-293
    • /
    • 2021
  • 팬데믹(Pandemic)으로 인해 온라인 시장의 규모가 급속하게 커졌다. 일상에서의 비대면화는그동안 기술수용에 늦은 소비자마저 온라인구매의 편리함을 경험하게 하는 계기가 되었고, 이들은 팬데믹 이후에도 온라인구매의 이점을 선호하게 될 것이다. 하지만 이러한 변화의 시기에 소비자가 취할 수 있는 제품 정보는 편평한 디스플레이상의 시각적 정보만으로 축소되었다. 회사들은 차별적이고 경쟁력 있는 정보를 제공하기 위해 AR/VR, Streaming 기술 등을 도입하고 있지만, 정직한 사용자들이 남긴 리뷰는 회사가 제공하는 잘 가공된 정보만큼 소비자에게 강력하게 인식되고, 회사의 상품개발과 마케팅 및 판매 전략을 위한 인사이트를 얻을 수 있다는 점에서 중요하게 인식될 필요가 있다. 그렇다면 소비자의 입장에서, 구매 의사결정 전에 참고하는 리뷰의 평점이 크게 어긋난다면, 소비자들은 어떻게 리뷰정보를 처리할까? 수렴되지 않은 평점은 늘 신뢰할 수 없고 가치 없는 것일까? 본 연구에서는 소비자의 개인 성향으로 볼 수 있는 조절초점 성향이 어떻게 사고방식을 지배하여 수렴되지 않은 정보를 수용하고 처리하는지 보이고자 하였다. 실험은 화장품을 대상으로 제품 리뷰 평점의 분산(높음 vs 낮음)이 소비자의 조절초점(예방초점 vs. 향상초점)에 따라 제품 태도에 어떤 영향을 미치는지 2x2 연구로 설계하였다. 연구결과, 예방초점의 소비자는 분산이 작을 때 높은 제품 태도를 보이지만, 향상초점의 소비자는 분산이 클 때 높은 제품 태도를 보인다는 것을 발견하였다. 이와 같은 연구로, 본 논문은 동일한 평균값의 평가점수를 가진 제품이라도 후기의 분산 값에 따라 소비자의 조절초점 성향이 영향을 미쳐 제품 태도가 달라진다는 것을 설명할 수 있다. 본 논문은 평점이 수렴되지 않는 정보에 대한 소비자의 정보처리의 메커니즘을 밝힌 이론적 공헌이 있으며, 실무적으로 기업은 리뷰가 축적됨에 따라 개인화되고 최적화된 상품 정보를 제공하는 등 빅데이터를 바탕으로 지식경영을 응용한 고객경험설계가 가능함을 시사한다.