• 제목/요약/키워드: review text.

검색결과 575건 처리시간 0.026초

텍스트 마이닝 기반의 온라인 상품 리뷰 추출을 통한 목적별 맞춤화 정보 도출 방법론 연구 (A Study on the Method for Extracting the Purpose-Specific Customized Information from Online Product Reviews based on Text Mining)

  • 김주영;김동수
    • 한국전자거래학회지
    • /
    • 제21권2호
    • /
    • pp.151-161
    • /
    • 2016
  • 개방, 공유, 참여를 특징으로 하는 웹 2.0 시대로 들어서면서 인터넷 사용자들의 데이터 생산 및 공유가 쉬워졌다. 이에 따른 데이터의 기하급수적인 증가와 함께 디지털 정보의 대부분인 비정형적 데이터(Unstructured Data)의 양도 증가하고 있다. 인터넷에서 정해진 형식 없이 자연어 형태로 만들어진 비정형 데이터 중, 특정 상품들에 대해 개인이 평가한 리뷰들은 해당 기업이나 해당 상품에 관심이 있는 잠재적 고객에게 필요한 데이터이다. 많은 양의 리뷰 데이터에서 상품에 대한 유용한 정보를 얻기 위해서는 데이터 수집, 저장, 전처리, 분석, 및 결론 도출의 과정이 필요하다. 따라서 본 연구는 R을 이용한 텍스트 마이닝(Text Mining) 기법을 사용하여 텍스트 형식의 비정형 데이터에서 자연어 처리 기술 및 문서 처리 기술을 적용하여 정형화된 데이터 값을 도출하는 방법에 대해 소개한다. 또한, 도출된 정형화된 리뷰 정보를 데이터 마이닝 기법에 적용하여 목적에 맞게 맞춤화된 리뷰 정보를 도출시키는 방안을 제시하고자 한다.

사용자 의견 추출을 위한 텍스트 마이닝 기반 비정형 데이터 정량화 방안 (Unstructured Data Quantification Scheme Based on Text Mining for User Feedback Extraction)

  • 조중흠;정용택;최성욱;옥창수
    • 산업경영시스템학회지
    • /
    • 제41권4호
    • /
    • pp.131-137
    • /
    • 2018
  • People write reviews of numerous products or services on the Internet, in their blogs or community bulletin boards. These unstructured data contain important emotions and opinions about the author's product or service, which can provide important information for future product design or marketing. However, this text-based information cannot be evaluated quantitatively, and thus they are difficult to apply to mathematical models or optimization problems for product design and improvement. Therefore, this study proposes a method to quantitatively extract user's opinion or preference about a specific product or service by utilizing a lot of text-based information existing on the Internet or online. The extracted unstructured text information is decomposed into basic unit words, and positive rate is evaluated by using existing emotional dictionaries and additional lists proposed in this study. This can be a way to effectively utilize unstructured text data, which is being generated and stored in vast quantities, in product or service design. Finally, to verify the effectiveness of the proposed method, a case study was conducted using movie review data retrieved from a portal website. By comparing the positive rates calculated by the proposed framework with user ratings for movies, a guideline on text mining based evaluation of unstructured data is provided.

Text Mining in Online Social Networks: A Systematic Review

  • Alhazmi, Huda N
    • International Journal of Computer Science & Network Security
    • /
    • 제22권3호
    • /
    • pp.396-404
    • /
    • 2022
  • Online social networks contain a large amount of data that can be converted into valuable and insightful information. Text mining approaches allow exploring large-scale data efficiently. Therefore, this study reviews the recent literature on text mining in online social networks in a way that produces valid and valuable knowledge for further research. The review identifies text mining techniques used in social networking, the data used, tools, and the challenges. Research questions were formulated, then search strategy and selection criteria were defined, followed by the analysis of each paper to extract the data relevant to the research questions. The result shows that the most social media platforms used as a source of the data are Twitter and Facebook. The most common text mining technique were sentiment analysis and topic modeling. Classification and clustering were the most common approaches applied by the studies. The challenges include the need for processing with huge volumes of data, the noise, and the dynamic of the data. The study explores the recent development in text mining approaches in social networking by providing state and general view of work done in this research area.

다차원 텍스트 큐브를 이용한 호텔 리뷰 데이터의 다차원 키워드 검색 및 분석 (Multi-Dimensional Keyword Search and Analysis of Hotel Review Data Using Multi-Dimensional Text Cubes)

  • 김남수;이수안;조선화;김진호
    • 정보화연구
    • /
    • 제11권1호
    • /
    • pp.63-73
    • /
    • 2014
  • 웹의 발달로 텍스트 등으로 이루어진 비정형 데이터의 활용에 대한 관심이 높아지고 있다. 웹상에서 사용자들이 작성한 대부분의 비정형 데이터는 사용자의 주관이 담겨져 있어 이를 적절히 분석할 경우 사용자의 취향이나 주관적인 관점 등의 아주 유용한 정보를 얻을 수 있다. 이 논문에서는 이러한 비정형 텍스트 문서를 다양한 차원으로 분석하기 하는데 OLAP(온라인 분석 처리)의 다차원 데이터 큐브 기술을 활용한다. 다차원 데이터 큐브는 간단한 문자나 숫자 형태의 정형적인 데이터에 대해 다차원 분석하는데 널리 사용되었지만, 텍스트 문장으로 이루어진 비정형 데이터에 대해서는 활용되지 않았다. 이러한 텍스트 데이터베이스에 포함된 정보를 다차원으로 분석하기 위한 방법으로 텍스트 큐브 모델이 최근에 제안되었는데, 이 텍스트 큐브는 정보 검색에서 널리 사용하는 용어 빈도수(Term Frequency)와 역 인덱스(Inverted Index)를 측정값으로 이용하여 텍스트 데이터베이스에 대한 다차원 분석을 지원한다. 이 논문에서는 이러한 다차원 텍스트 큐브를 활용하여 실제 서비스되고 있는 호텔 정보 공유 사이트의 리뷰 데이터 분석에 활용하였다. 이를 위해 호텔 리뷰 데이터에 대한 다차원 텍스트 큐브를 생성하였으며, 이를 이용하여 다차원 키워드 검색 기능을 제공하여 사용자 중심의 의미있는 정보 검색이 가능한 시스템을 설계 및 구현하였다. 또한, 본 논문에서 제안하는 시스템에 대해 다양한 실험을 수행하였으며 이를 통해 제안된 시스템의 실효성을 검증하였다.

Research Trends on Literature Reviews in Scopus Journals by Authors from Indonesia, Japan, South Korea, Vietnam, Singapore, and Malaysia: A Bibliometric Analysis from 2003 to 2022

  • Prakoso Bhairawa Putera;Amelya Gustina
    • Asian Journal of Innovation and Policy
    • /
    • 제12권3호
    • /
    • pp.304-322
    • /
    • 2023
  • Text data mining ('big data methods') is one of the most widely used approaches during the COVID-19 pandemic. In particular, text data mining on Scopus databases or Web of Science (WoS). Text data mining is widely used to collect literature for later bibliometric analysis, and in the end, it becomes a literature review article. Therefore, in this article, we reveal the trend of publication of literature reviews in Scopus journals from Indonesia, Japan, South Korea, Vietnam, Singapore, and Malaysia. This article describes two essential parts, namely 1) a comparison of international publication trends and subject area of literature review publications, and 2) a comparison of Top 5 for Authors, Affiliation, Source Title, and Collaboration Country.

기업 리뷰 웹 사이트 텍스트 분석을 통한 직원 불만 표현 추출과 불만 원인 도출 및 해소 방안 (Employee's Discontent Text Analysis on Anonymous Company Review Web and Suggestions for Discontent Resolve)

  • 백혜연;박용석
    • 한국정보통신학회논문지
    • /
    • 제23권4호
    • /
    • pp.357-364
    • /
    • 2019
  • 전현직 직원에 의한 산업정보 유출 비율이 80%에 이르나 산업정보유출 사고에 대한 뉴스기사나 정보유출 행위의 원인에 대한 연구들에서는 그 원인들을 처우나 인사 불만 등으로 간략하게 설명하고 있다. 본 연구에서는 전현직 직원들이 익명 기업리뷰 웹사이트에 남긴 기업에 대한 평가 텍스트를 분석하여 기업에 대한 불만 내용들을 더욱 구체적으로 확인하였다. 이 중 어떠한 불만사항이 퇴직이나 퇴사, 나아가 산업인력유출의 결과로 이어질 수 있는지 파악하기 위해 불만 분야에 대한 의미사전목록을 제시하고 부분문법그래프(LGG)를 구축하였다. 또한 텍스트 분석 결과에서 나타난 전현직 직원들의 불만사항과 기존 연구들에서 설문을 통해 정리한 인력유출 원인을 서로 비교하였다. 추가적으로 분석된 불만을 바탕으로 기업불만 해소를 통한 인력유출 방지 방안을 간략 제시하였다. 기존 설문 위주의 산업 인력 유출에 대한 분석에 더하여, 웹 크롤링을 통한 자유롭고 솔직한 불만 분석을 제공하는 데 의의가 있다.

텍스트 마이닝을 활용한 ASMR 콘텐츠 분야에 따른 소비자 인식 및 구전효과 차이점 분석: ASMR 제품리뷰 및 ASMR How-to 콘텐츠 중심으로 (The User Perception in ASMR Marketing Content through Social Media Text-Mining: ASMR Product Review Content vs ASMR How-to Content)

  • ;최재원
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제30권4호
    • /
    • pp.1-20
    • /
    • 2021
  • Purpose Nowadays, Autonomous Sensory Meridian Response (ASMR) is rapidly growing in popularity and increasingly appearing in marketing. Not even in TV commercial advertisement, ASMR also fast growing in one-person media communication, many brands and social media influencers used ASMR for their marketing contents. The purpose of this study is to measure consumers' perceptions about the products in ASMR marketing content and compare the differences in communication effect of ASMR content creator between product review and how-to in the same Macro tier influencer - the YouTuber that has 10,000-100,000 subscribers. Design/methodology/approach The research methods selected ASMRtist that do product review content and how-to content, Text comments data was collected from 200 videos of tech-device review videos and beauty-fashion videos. A total of 52,833 text comments were analyzed by applying the LDA topic modeling algorithm and social network analysis. Findings Through the result, we can know that ASMR is good at taking attention of viewers with ASMR triggers. In the Tech device reviews field, ASMR viewers also focus on the product like product's performance and purchase. However, there are many topics related to reaction of ASMR sound, trigger, relaxation. In the Beauty-fashion field, viewers' topics mainly focus on the reaction of the ASMR trigger, response to ASMRtist and other topics are talking about makeup - fashion, product, purchase. From LDA result, many ASMR viewers comment that they feel more comfortable when watching the marketing content that uses ASMR. This result has shown that ASMR marketing contents have a good performance in terms of user watching experience, so applying ASMR can take more consumer intention. And the result of social network analysis showed that product review ASMRtist have a higher communication effectiveness than how-to ASMRtist in the same tier. As an influencer marketing strategy, this study provides information to establish an efficient advertising strategy by using influencers that create ASMR content.

전문 처리를 위한 웹 기반 정보시스템 구현 (Implementation of Web-based Information System for Full-text Processing)

  • 김상도;문병주;류근호
    • 한국정보처리학회논문지
    • /
    • 제6권6호
    • /
    • pp.1481-1492
    • /
    • 1999
  • 1990년대 웹 개념의 등장으로 인터넷을 개방형 네트?, 사용자 친근성 및 편의성이라는 특성을 바탕으로 급속히 일반화되면서 각종 정보를 제공하는 정보 시스템에서도 커다란 변화를 가져왔다. 웹은 텍스트 정보뿐만 아니라 이미지, 오디오, 비디오 등 멀티미디어 정보를 쉽게 제공함으로써 기존 정보 시스템의 웹 기반으로의 전환을 가속화시키게 되었다. 물론 정보 내용도 텍스트 위주의 단순 초록 정보에서 전문(Full-Text) 정보로 급속히 이전되기 시작하였으며, 전문 정보를 처리하는 다양한 문서 포맷들로 등장하기 시작하였다. 하지만, 전문 정보는 본질적으로 대용량의 시스템 메모리, 막대한 처리시간, 보다 많은 전송용량 등을 요구하게 되므로 웹 기반 전문 시스템의 구축시 이러한 요인들을 세밀하게 비교 평가하여야 한다. 따라서 본 연구는 웹 기반 정보 시스템에서 어떻게 전문을 처리할 것인가에 초점을 맞추어 문서의 통합 정보 기능을 제공하는 정보시스템을 설계 구현한다. 먼저 인터넷상에서 표준 문서형식으로 사용중이거나 개발중인 문서 포맷들의 특징을 검토하고, 정보 시스템의 관점에서 전문정보를 어떤 문서 포맷으로 처리하는 것이 적합한가를 실험하고 평가한다. 그리고 이를 기반으로 본 연구의 목적인 전문 정보를 PDF 문서로 제공하는 웹 기반 정보 시스템을 설계 구현한다.

  • PDF

Hierarchical Attention Network를 활용한 주제에 따른 온라인 고객 리뷰 분석 모델 (Analysis of the Online Review Based on the Theme Using the Hierarchical Attention Network)

  • 장인호;박기연;이준기
    • 한국IT서비스학회지
    • /
    • 제17권2호
    • /
    • pp.165-177
    • /
    • 2018
  • Recently, online commerces are becoming more common due to factors such as mobile technology development and smart device dissemination, and online review has a big influence on potential buyer's purchase decision. This study presents a set of analytical methodologies for understanding the meaning of customer reviews of products in online transaction. Using techniques currently developed in deep learning are implemented Hierarchical Attention Network for analyze meaning in online reviews. By using these techniques, we could solve time consuming pre-data analysis time problem and multiple topic problems. To this end, this study analyzes customer reviews of laptops sold in domestic online shopping malls. Our result successfully demonstrates over 90% classification accuracy. Therefore, this study classified the unstructured text data in the semantic analysis and confirmed the practical application possibility of the review analysis process.

장애인을 위한 해양 라이프가드 고려사항: 문헌연구 (Beach-Lifeguard Considerations for Individuals with Disabilities: A Literature Review)

  • 김재화;김혜민
    • 한국융합학회논문지
    • /
    • 제10권8호
    • /
    • pp.245-253
    • /
    • 2019
  • 한국의 해양 라이프가드들은 아직 장애인을 위한 구조 및 안전 관리를 수행할 준비가 되어있지 않다. 더욱이 대부분의 라이프가드 훈련들이 장애인 구조에 관한 정보 혹은 훈련이 제공되지 않고 있다. 본 연구의 목적은 문헌 검토를 실시하여 장애인을 위한 해양 라이프가드, 수상 안전관리와 관련하여 주요 이슈와 문제점을 찾아내는 데 있다. 데이터베이스(e.g., CINAHL Plus with Full Text, ERIC, MEDLINE, SPORTDiscus with Full Text)를 사용하여 연구논문과 해양안전과 관련한 국가/민간단체들의 문서들을 검색하였다. 사용된 검색어 혹은 키워드는 물 안전, 구조 요원, 익사 방지 등이 있었다. 주요 이슈를 파악하기 위해 수집된 문서내용을 분석(내용 분석법)을 실시하였다. 결과는 내용분석결과를 토대로 장애인 구조(rescue), 익사방지 및 수상안전과 관련된 중요한 다섯 가지 이슈들을 도출할 수 있었다.