• Title/Summary/Keyword: online big data

검색결과 378건 처리시간 0.026초

방한 관광객의 온라인 리뷰에 대한 빅데이터 분석 기반의 감성분석 및 평점 예측모형 (Sentiment Analysis and Star Rating Prediction Based on Big Data Analysis of Online Reviews of Foreign Tourists Visiting Korea)

  • 홍태호
    • 지식경영연구
    • /
    • 제23권1호
    • /
    • pp.187-201
    • /
    • 2022
  • 관광객이 작성한 온라인 리뷰는 관광산업의 관리 및 운영에 중요한 정보를 제공한다. 평점은 제품이나 서비스에 대한 정량적인 평가로 간편하지만 관광객의 진실한 태도를 반영하기 어려우며 평점과 리뷰내용에 대한 불일치 문제도 발생하고 있다. 불일치 문제는 잠재고객에게 혼동을 줄 수 있으며 구매의사결정에도 영향을 미칠 수 있다. 본 연구에서는 온라인 리뷰기반의 평점 예측모형을 통해 평점과 리뷰내용의 불일치 문제를 해결하고자 한다. 한국을 방문한 외국인 관광객이 작성한 관광지와 호텔에 대한 리뷰의 감성분석을 통해 평점과 감성의 차이를 비교하고 TF-IDF vectorization과 감성분석 결과로 변수를 선정하였다. 로짓, 인공신경망, SVM(Support Vector Machine)을 적용하여 평점을 분류하고, 인공신경망, SVR(Support Vector Regression)을 통해 평점을 예측하였다. 평점 분류모형과 예측모형 모두 불일치한 리뷰를 제거하고 감성분석을 반영한 모형에서 우수한 성과를 보여주었다. 본 연구에서 제안한 온라인 리뷰 기반의 평점 예측모형은 평점과 리뷰내용에 대한 불일치 문제를 해결하여 신뢰할 수 있는 정보를 제공하였으며 평점이 없는 온라인 리뷰에도 활용할 수 있을 것이다.

키워드 기반 주제중심 분석을 이용한 비정형데이터 처리 (Unstructured Data Processing Using Keyword-Based Topic-Oriented Analysis)

  • 고명숙
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권11호
    • /
    • pp.521-526
    • /
    • 2017
  • 데이터는 데이터 형식이 다양하고 방대할 뿐만 아니라 그 생성 속도가 매우 빨라 기존의 데이터 처리 방식이 아닌 새로운 관리 및 분석 방법이 요구된다. 소셜 네트워크 상의 온라인 문서에서 인간의 언어로 쓰여진 비정형 텍스트에서 Text Mining기법을 사용하여 유용한 정보를 추출할 수 있다. 소셜미디어에 남긴 정치, 경제, 문화에 대한 메시지에 대한 경향을 파악하는 것이 어떤 주제에 관심을 가지고 있는지를 파악할 수 있는 요소가 된다. 본 연구에서는 주제 중심 분석 기법을 이용하여 주어진 키워드에 관한 온라인 뉴스를 대상으로 텍스트 마이닝을 수행하였다. LDA(Latent Dirichiet Allocation)를 이용하여 웹문서로부터 정보를 추출하고 이로부터 사람들이 실제로 주어진 키워드에 대하여 어떤 주제에 관심이 있고 관련된 핵심 가치 중 어떤 주제를 중심으로 전파되고 있는지를 분석하였다.

Hot Topic Discovery across Social Networks Based on Improved LDA Model

  • Liu, Chang;Hu, RuiLin
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권11호
    • /
    • pp.3935-3949
    • /
    • 2021
  • With the rapid development of Internet and big data technology, various online social network platforms have been established, producing massive information every day. Hot topic discovery aims to dig out meaningful content that users commonly concern about from the massive information on the Internet. Most of the existing hot topic discovery methods focus on a single network data source, and can hardly grasp hot spots as a whole, nor meet the challenges of text sparsity and topic hotness evaluation in cross-network scenarios. This paper proposes a novel hot topic discovery method across social network based on an im-proved LDA model, which first integrates the text information from multiple social network platforms into a unified data set, then obtains the potential topic distribution in the text through the improved LDA model. Finally, it adopts a heat evaluation method based on the word frequency of topic label words to take the latent topic with the highest heat value as a hot topic. This paper obtains data from the online social networks and constructs a cross-network topic discovery data set. The experimental results demonstrate the superiority of the proposed method compared to baseline methods.

AR Tourism Recommendation System Based on Character-Based Tourism Preference Using Big Data

  • Kim, In-Seon;Jeong, Chi-Seo;Jung, Tae-Won;Kang, Jin-Kyu;Jung, Kye-Dong
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제13권1호
    • /
    • pp.61-68
    • /
    • 2021
  • The development of the fourth industry has enabled users to quickly share a lot of data online. We can analyze big data on information about tourist attractions and users' experiences and opinions using artificial intelligence. It can also analyze the association between characteristics of users and types of tourism. This paper analyzes individual characteristics, recommends customized tourist sites and proposes a system to provide the sacred texts of recommended tourist sites as AR services. The system uses machine learning to analyze the relationship between personality type and tourism type preference. Based on this, it recommends tourist attractions according to the gender and personality types of users. When the user finishes selecting a tourist destination from the recommendation list, it visualizes the information of the selected tourist destination with AR.

리뷰 데이터 마이닝을 이용한 하이브리드 추천시스템 개발: Amazon Kindle Store 데이터 분석사례 (Development of Hybrid Recommender System Using Review Data Mining: Kindle Store Data Analysis Case)

  • 장예화;이청용;최일영;김재경
    • 경영정보학연구
    • /
    • 제23권1호
    • /
    • pp.155-172
    • /
    • 2021
  • 최근 온라인 상품 구매의 증가로 인해 사용자의 선호에 맞는 상품을 추천해주는 시스템이 지속적으로 연구되고 있다. 추천 시스템은 사용자들에게 개인화된 상품 추천 서비스를 제공하는 시스템으로 사용자가 상품에 남긴 평점을 이용한 협업 필터링(Collaborative Filtering)이 가장 널리 쓰이는 추천 방법이다. 협업 필터링에서 상품 간의 유사도 계산은 시간이 많이 소요되는데, 특히 리뷰 데이터와 같은 빅데이터를 사용할 경우 더욱 많은 시간을 소요한다. 그래서 본 연구에서는 리뷰 데이터 마이닝을 이용하여 상품 간의 유사도 계산을 빠르게 수행할 수 있으면서 정확도를 높일 있도록 2단계(2-Phase) 방법을 이용한 하이브리드 추천시스템 방식을 제안한다. 이를 위해 온라인 전자책 상거래 상점인 아마존 킨들 스토어(Amazon Kindle Store)의 약 98만 개의 온라인 소비자 평점과 리뷰 데이터를 수집하였다. 실험 결과 본 연구에서 제안한 사용자의 평점과 리뷰를 단계적으로 반영한 하이브리드 추천 방식이 전통적인 추천 방식과 비교하여 추천 시간은 비슷하였으나 높은 정확도를 나타내는 것을 확인하였다. 따라서 제안한 방법을 사용하면 사용자가 선호하는 상품을 빠르고 정확하게 추천함으로써 고객의 만족을 높여서 기업의 매출 증대에 기여할수 있을 것으로 기대된다.

클라우드 컴퓨팅에서 Handheld Devices 기반의 M2M 및 IoT 온라인 쇼핑 서비스 프레임워크 (Framework of Online Shopping Service based on M2M and IoT for Handheld Devices in Cloud Computing)

  • 아이만 압둘라 알사파르;모하마드 아잠;박준영;허의남
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 춘계학술발표대회
    • /
    • pp.179-182
    • /
    • 2013
  • We develop Framework architecture of Online Shopping Services based on M2M and IoT for Handheld Devices in Cloud Computing. MapReduce model will be used as a method to simplify large scale data processing when user search for purchasing products online which provide efficient, and fast respond time. Therefore, providing user with a enhanced Quality of Experience (QoE) as well as Quality of Service (QoS) when purchasing/searching products Online from big data.

머신러닝 기반의 기업가치 예측 모형: 온라인 기업리뷰를 활용하여 (Machine Learning based Firm Value Prediction Model: using Online Firm Reviews)

  • 이한준;신동원;김희은
    • 인터넷정보학회논문지
    • /
    • 제22권5호
    • /
    • pp.79-86
    • /
    • 2021
  • 빅데이터 분석의 유용성이 주목을 받으면서 경영학 분야에서도 이를 활용하여 기업의 성과를 예측하고자 하는 다양한 연구들이 진행되고 있다. 이러한 선행연구들은 주로 뉴스 기사나 SNS 등 기업 외부의 자료에 의존하고 있다. 직원의 만족도나 기업에 대한 직원의 인식, 장단점 평가와 같은 기업 내부의 목소리는 기업가치에 대한 잠재적인 영향력에도 불구하고 상대적으로 확보가 어려워 관련 연구가 아직 충분치 못하다. 이에 본 연구에서는 국내 유가증권시장 상장 기업을 대상으로 임직원의 기업리뷰가 기업가치에 미치는 영향을 살펴보고, 이를 기반으로 기업가치를 예측하는 모형을 구축하고자 한다. 이를 위해 온라인 기업리뷰 사이트인 잡플래닛(Jobplanet)에 2014년부터 2019년까지 전·현직원이 남긴 97,216건의 기업리뷰를 수집하고 동 데이터에 근거하여 머신러닝 기반의 예측 모형을 제안하였다. 제안한 모형 중 LSTM 기반 모형의 정확도가 73.2%로 가장 높았고 MAE 또한 0.359로 가장 낮은 오차를 보였다. 본 연구는 국내에서 머신러닝을 활용한 기업가치 연구 분야에 유용한 사례가 될 것으로 기대한다.

영상 스토리 분석과 시청 패턴 분석 기반의 추천 시스템 구현 (Implementation of User Recommendation System based on Video Contents Story Analysis and Viewing Pattern Analysis)

  • 이현섭;김민영;이지훈;김진덕
    • 한국정보통신학회논문지
    • /
    • 제24권12호
    • /
    • pp.1567-1573
    • /
    • 2020
  • 인터넷 기술의 발전으로 1인 미디어 시대로 도래했다. 한 개인이 스스로 콘텐츠를 제작하여 관련 온라인 서비스로 업로드 하고, 많은 사용자가 온라인 서비스의 콘텐츠를 인터넷을 이용할 수 있는 장치(PC, 스마트폰, 스마트TV 등)를 이용해 시청하고 있다. 현재 대부분 사용자가 기존 온라인 서비스에서 제공하는 검색기능을 통해 원하는 콘텐츠를 찾아서 시청하고 있다. 이러한 기능은 콘텐츠를 업로드 한 사용자가 입력한 정보를 바탕으로 제공된다. 이러한 제한된 단어 데이터를 바탕으로 콘텐츠를 검색해야 하는 환경에서 잘못된 정보가 있는 경우 검색 결과의 유사도 효율 저하와 잘못된 결과를 사용자에게 제시한다. 이를 해결하기 위해 본 논문에서는 온라인 서비스에서 콘텐츠 정보를 시스템이 능동적으로 영상을 분석하고, 영상이 보유한 특성을 추출해 반영하는 방법을 제시한다. 한 동영상의 음성데이터를 근거한 스토리 내용을 근거로 형태소를 추출해 빅데이터 기술로 분석하기 위한 연구 내용을 다룬다.

빅데이터 분석을 통한 차박의 온라인 인식에 대한 연구 (A Study on the Online Perception of Chabak Using Big Data Analysis)

  • 김세훈;이환수
    • 한국전자거래학회지
    • /
    • 제26권2호
    • /
    • pp.61-81
    • /
    • 2021
  • 언택트 시대에 새로운 여행의 형태로 자동차를 숙박공간으로 활용하는 차박이 주목받고 있다. 저렴한 비용, 편의성, 안전성 등의 장점과 함께 독립적인 여행을 가능하게 하는 차박의 특징으로 인해 차박 수요는 지속적으로 증가하고 있다. 차박에 대한 인기와 관련 산업이 급격히 성장하고 있음에도 불구하고 차박 트렌드를 이해하기 위한 학술적 논의는 거의 이루어진 바가 없는 실정이다. 새로운 형태의 여행 문화로 자리 잡고 관련 산업의 지속적 성장을 위해서는 차박에 대한 대중의 인식의 이해가 필수적이다. 따라서 본 연구에서는 마케팅믹스 이론과 빅데이터 분석을 바탕으로 차박에 대한 대중의 인식을 분석한다. 분석 결과에 따르면 차박은 소비자 주도의 여행 문화로 자리 잡고 있고, 자동차 산업의 애프터마켓 성장에 기여하고 있는 것으로 나타났다. 또한 소비자들은 경제적이고 현명한 방법으로 여행을 즐기는 경향이 강해지고 있으며 소셜 미디어를 통해 정보 공유에 적극적이다는 것을 확인할 수 있었다. 본 연구 결과는 새로운 여행 트렌드인 차박에 대한 초기 연구로써 이론적 기반을 바탕으로 한 빅데이터 분석 연구라는 점에서 의의가 있으며 활성화 방안에 대한 실무적 논의를 하였다는 점에서도 의미가 있다.

LDA 토픽모델링 기법을 활용한 부산시 민원 빅데이터 분석 (Big Data Analysis of Busan Civil Affairs Using the LDA Topic Modeling Technique)

  • 박주섭;이새미
    • 정보화정책
    • /
    • 제27권2호
    • /
    • pp.66-83
    • /
    • 2020
  • 시민들은 도시 내 발생되고 있는 지역문제에 대해 큰 관심을 가지고 있다. 지방정부는 이러한 지역문제들을 해결하기 위해 노력하고 있지만 시민들의 생활 불편을 줄여주기는 쉽지 않고 이로 인한 시민들의 불만은 민원으로 이어지고 있다. 이를 해소할 수 있는 대안으로 빅데이터 활용을 통해 민원의 특성을 파악하고, 시민들에게 선제적 편의성을 제공하기 위한 노력이 절실하다. 본 논문에서는 LDA 토픽모델링 기법을 활용하여 전자민원의 동향 분석에 관한 연구를 실시한다. 이를 위해 2015~2017년 9,625건의 부산시 전자민원을 대상으로 20개의 민원토픽을 추출하였다. 도출된 민원토픽을 통해 핵심민원을 파악하고, 분기별 비중 추이 분석을 통하여 4개의 Hot 민원(버스정차, 택시기사, 칭찬, 민원처리)과 4개의 Cold 민원(cctv설치, 버스노선, 공원주차장, 축제 불만)을 도출하였다. 본 연구는 민원동향을 파악하기 위해 빅데이터 분석 방법을 제시하였고, 후속 연구를 유발하였다는 학문적 기여도가 있다. 또한 민원분석을 위해 사용한 텍스트마이닝 기법은 빅데이터 처리가 필요한 다른 행정업무에도 활용될 수 있다.