• 제목/요약/키워드: 논문 리뷰

검색결과 463건 처리시간 0.025초

RNN과 트랜스포머 기반 모델들의 한국어 리뷰 감성분류 비교 (Comparison of Sentiment Classification Performance of for RNN and Transformer-Based Models on Korean Reviews)

  • 이재홍
    • 한국전자통신학회논문지
    • /
    • 제18권4호
    • /
    • pp.693-700
    • /
    • 2023
  • 텍스트 문서에서 주관적인 의견과 감정을 긍정 혹은 부정으로 분류하고 식별하는 자연어 처리의 한 분야인 감성 분석은 고객 선호도 분석을 통해 다양한 홍보 및 서비스에 활용할 수 있다. 이를 위해 최근 머신러닝과 딥러닝의 다양한 기법을 활용한 연구가 진행되어 왔다. 본 연구에서는 기존의 RNN 기반 모델들과 최근 트랜스포머 기반 언어 모델들을 활용하여 영화, 상품 및 게임 리뷰를 대상으로 감성 분석의 정확도를 비교 분석하여 최적의 언어 모델을 제안하고자 한다. 실험 결과 한국어 말뭉치로 사전 학습된 모델들 중 LMKor-BERT와 GPT-3가 상대적으로 좋은 정확도를 보여주었다.

CNN-LSTM 모델 기반의 감성분석을 이용한 상품기획 모델 (Product Planning using Sentiment Analysis Technique Based on CNN-LSTM Model)

  • 김도연;정진영;박원철;박구락
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.427-428
    • /
    • 2021
  • 정보통신기술의 발달로 전자상거래의 증가와 소비자들의 제품에 대한 경험과 지식의 공유가 활발하게 진행됨에 따라 소비자는 제품을 구매하기 위한 자료수집, 활용을 진행하고 있다. 따라서 기업은 다양한 기능들을 반영한 제품이 치열하게 경쟁하고 있는 현 시장에서 우위를 점하고자 소비자 리뷰를 분석하여 소비자의 정확한 소비자의 요구사항을 분석하여 제품기획 프로세스에 반영하고자 텍스트마이닝(Text Mining) 기술과 딥러닝(Deep Learning) 기술을 통한 연구가 이루어지고 있다. 본 논문의 기초자료가 되는 데이터셋은 포털사이트의 구매사이트와 오픈마켓 사이트의 소비자 리뷰를 웹크롤링하고 자연어처리하여 진행한다. 감성분석은 딥러닝기술 중 CNN(Convolutional Neural Network), LSTM(Long Short Term Memory) 조합의 모델을 구현한다. 이는 딥러닝을 이용한 제품기획 프로세스로 소비자 요구사항 반영, 경제적인 측면, 제품기획 시간단축 등 긍정적인 영향을 미칠 것으로 기대한다.

  • PDF

한국어 언어모델 파인튜닝을 통한 협찬 블로그 텍스트 생성 (Generating Sponsored Blog Texts through Fine-Tuning of Korean LLMs)

  • 김보경;변재연;차경애
    • 한국산업정보학회논문지
    • /
    • 제29권3호
    • /
    • pp.1-12
    • /
    • 2024
  • 본 논문에서는 대규모 한국어 언어모델인 KoAlpaca를 파인튜닝하고 이를 이용한 블로그 텍스트 생성 시스템을 구현하였다. 소셜 미디어 플랫폼의 블로그는 기업 마케팅 수단으로 널리 활용된다. 수집된 협찬 블로그 텍스트의 감정 분석과 정제를 통한 긍정 리뷰의 학습 데이터를 구축하고 KoAlpaca 학습의 경량화를 위한 QLoRA를 적용하였다. QLoRA는 학습에 필요한 메모리 사용량을 크게 줄이는 파인튜닝 접근법으로 파라미터 크기 12.8B 경우의 실험 환경에서 LoRA 대비 최대 약 58.8%의 메모리 사용량 감소를 확인하였다. 파인튜닝 모델의 생성 성능 평가를 위해서 학습 데이터에 포함되지 않은 100개의 입력으로 생성한 텍스트는 사전학습 모델에 비해서 평균적으로 두배 이상의 단어 수를 생성하였으며 긍정 감정의 텍스트 역시 두 배 이상으로 나타났다. 정성적 생성 성능 평가를 위한 설문조사에서 파인튜닝 모델의 생성 결과가 제시된 주제에 더 잘 부합한다는 응답이 평균 77.5%로 나타났다. 이를 통해서 본 논문의 협찬물에 대한 긍정 리뷰 생성 언어모델은 콘텐츠 제작을 위한 시간 관리의 효율성을 높이고 일관된 마케팅 효과를 보장하는 콘텐츠 제작이 가능함을 보였다. 향후 사전학습 모델의 생성 요소에 의해서 긍정 리뷰의 범주에서 벗어나는 생성 결과를 감소시키기 위해서 학습 데이터의 증강을 활용한 파인튜닝을 진행할 예정이다.

온라인 양면구전의 구성요인에 관한 내용분석 (Content Analysis on the Component of Two-sided eWOM)

  • 박현희;전중옥
    • 한국콘텐츠학회논문지
    • /
    • 제15권8호
    • /
    • pp.53-68
    • /
    • 2015
  • 본 연구는 온라인 양면구전에 대한 실제적 파악을 통해 보다 현실성 있는 유형구분에 도움을 주는 것을 연구의 목적으로 하였다. 이를 위해 제품유형을 경험재와 탐색재로 분류한 후 총 402건의 온라인 리뷰를 수집하여 기술적 특성(방향성, 리뷰길이)과 내용 구조적 특성(제품편익, 정보제시방법)에 대해서 내용분석(Content Analysis)을 실시하였다. 연구 결과, 첫째, 양면구전의 방향성으로 긍정/부정, 부정/긍정, 긍정/부정/긍정, 부정/긍정/부정의 네 가지 유형이 관찰되었다. 둘째, 양면구전의 리뷰길이가 단면구전의 리뷰길이보다 긴 것으로 나타났으며, 제품편익에서는 단면과 양면 모두 혼합유형이 가장 높은 비율을 차지하는 것으로 나타났다. 셋째, 정보제시방법에서 단면구전은 총체적 표현방식이 압도적으로 많이 나타난 반면, 양면구 전에서는 혼합적, 분석적 표현방식도 상당히 높은 비율을 차지하는 것으로 나타났다. 넷째, 단면구전과 양면 구전 모두 정보제시 방법으로는 탐색재는 총체적 표현에 많이 치우친 반면, 경험재는 분석적, 혼합적 표현도 많이 사용하고 있는 것으로 나타났다. 이와 같이 본 연구는 온라인 구전의 유형화 기준 특히 양면구전의 유형화 기준에 초점을 맞추어 연구를 진행하였다. 본 연구의 내용분석 결과를 근거로 향후 여러 가지 인과적 연구가 가능할 것이라 판단된다.

온라인 환경 하에서 제품가격의 동적인 변화에 대한 탐색적 연구 (The Exploratory Study of the Dynamic Price Changing under the On-line Context)

  • 나경수;손영석
    • 한국콘텐츠학회논문지
    • /
    • 제20권2호
    • /
    • pp.511-521
    • /
    • 2020
  • 본 연구는 온라인상에서 판매되는 동일한 제품들이 각각 다른 가격으로 판매되는 현상에 영향을 조망하는데 연구의 목적이 있다. 이를 위해서 온라인상에서 가격 분산에 대한 영향을 미치는 4가지의 요인을 중심으로 탐색적인 연구를 진행하였다. 첫째로 제품의 고유 속성인 제품의 평균가격, 최고가격, 최저가격, 둘째로 시장요인인 출시연도, 출시개월 수, 공급업체 수 셋째로는 소비자요인인 해당 제품에 대한 리뷰수와 평가태도 등의 요인들이 가격분산에 어떤 영향을 미치는지 파악하는 것을 본 연구의 초점으로 설정하였다. 연구의 분석을 위해 온라인의 가격비교 사이트 중에서 대표적인 서비스인 다나와를 통해서 대상제품군을 선정하였다. 먼저 제품군을 제품 컨셉에 따라서 효용적 개념의 제품과 쾌락적 개념의 제품군으로 구분하여 효용적 개념의 제품군으로 노트북, 세탁기 그리고 쾌락적 컨셉의 제품군으로 백팩과 운동화를 각각 200개씩 전체적으로 유효 표본을 400개를 선정하여 분석하였다. 분석 결과 효용적 컨셉의 제품은 평균가격, 최고가격, 최저가격, 출시연도, 유통점 수, 리뷰의 수가 가격분산에 유의한 영향을 미치는 것으로 나타났으며, 쾌락적 컨셉의 제품군은 평균가격, 최고가격, 최저가격, 출시연도, 유통점 수, 리뷰 및 평가가 가격 분산과 긍정적인 관계가 있는 것으로 나타났다. 본 연구를 통해서 온라인 가격분산 현상을 확인할 수 있었으며 이와 관련된 변수들도 검증할 수 있었다. 유통점 마케팅 담당자들 관점에서는 가격분산을 유지하기 위해서 역시 이러한 변수들을 고려해서 전략을 수립할 필요가 있을 것으로 보인다.

지각된 위험 및 리뷰 진단성이 배달앱 수용에 미치는 영향 (The Effects of Perceived Risk and Review Diagnosticity on the Acceptance of Food Delivery Application)

  • 노민정
    • 한국콘텐츠학회논문지
    • /
    • 제19권10호
    • /
    • pp.581-592
    • /
    • 2019
  • 본 연구는 배달앱의 수용을 촉진하거나 억제하는 요인의 탐색에 초점을 맞추고 있다. 가능한 선행 요인으로 리뷰의 진단성 및 기술적 규범, 위험의 다차원적 지각 정도를 살펴보고 있는 본 연구는 실제 배달앱 비즈니스가 활성화되어 있는 주요 광역도시 거주 사용자들을 대상으로 데이터를 수집하였다. 수집된 자료에 대해 시행한 구조방정식 모형 분석의 결과는 배달앱에 게재되어 있는 리뷰의 진단성 및 기술적 규범의 수준에 대한 인식이 향상될수록, 그리고 배달앱 사용에 수반되리라 예상되는 다차원적 위험 지각이 완화될수록 보다 우호적인 방향으로 태도가 형성되게 됨을 확인시켜 주었다. 아울러 이러한 태도가 실제 배달앱 수용의 의사에 미치는 정(+)의 영향력은 지각된 위험의 수준이 악화될수록 보다 완화되게 됨을 확인시켜 주었다. 이러한 일련의 실증결과는 최근 다양한 분야에서 부상하고 있는 O2O 서비스 플랫폼의 수용 및 확산을 촉진할 수 있는 전략적 제도적 지침의 마련에 기여하여 줄 수 있을 것이다. 즉, 최근 부상 중인 여러 신생 O2O 서비스 업체들의 시장 안착에 요구되는 전략적 고려 사항에 대한 인식 환기와 더불어 보다 신속한 사용자 저변의 확대에 이바지할 수 있는 동인들을 발견해 내는데 기여할 수 있을 것이다.

온라인 구전의 양과 방향성이 영화 관람의도에 미치는 영향: 리뷰 신뢰성의 매개효과 (The Impacts of Volume and Valence of eWOM on Purchase Intention for Movies: Mediation of Review Credibility)

  • 한승지;김중인
    • 한국콘텐츠학회논문지
    • /
    • 제21권7호
    • /
    • pp.93-104
    • /
    • 2021
  • 영화 흥행에 영향을 미치는 온라인 구전의 양과 방향성에 관한 선행연구들의 거의 대부분은 Yahoo Movies, IMDB.com, 네이버 영화 등에서 제공하는 실제 온라인 데이터(2차 데이터)를 사용하였다. 그러나 실제 온라인 데이터는 구전 제공자와 구전 수용자의 심리 변수나 특성 정보를 파악하기가 어렵기 때문에 실제 데이터를 사용한 선행연구들에서는 구전의 양 및 방향성과 소비자의 심리 변수 간의 인과관계를 파악할 수가 없었다. 본 연구에서는 선행연구의 이러한 한계를 보완하여 실제 데이터 대신에 설문조사를 통해 기존에 검증되지 않은 인과관계모형으로서 구전의 양과 방향성이 소비자 심리 변수이며 대표적인 구전 정보 특성인 리뷰 신뢰성을 매개변수로 하여 영화 관람의도에 미치는 직·간접적인 영향력을 검증하였다. 연구결과, 구전의 양과 방향성이 관람의도에 미치는 총효과는 각각 유의하였다. 그러나 구전의 양은 리뷰 신뢰성을 통해 관람의도에 미치는 간접적인 효과만이 유의한 반면에(완전매개효과), 방향성은 직접효과와 간접효과가 모두 유의한(부분매개효과) 차이가 나타났다. 이러한 연구결과에 대한 이론적, 실무적 시사점을 제시하였다.

인공지능 스피커의 세대별 온라인 리뷰 분석을 통한 사용자 경험 요인 탐색 (Exploring user experience factors through generational online review analysis of AI speakers)

  • 박정은;양동욱;김하영
    • 한국융합학회논문지
    • /
    • 제12권7호
    • /
    • pp.193-205
    • /
    • 2021
  • 인공지능 스피커 시장은 꾸준히 성장하고 있지만, 실제 스피커 사용자들의 만족도는 42%에 그치고 있다. 따라서, 본 연구에서는 인공지능 스피커의 세대별 토픽 변화와 감성 변화를 통해 사용자 경험을 저해하는 요소는 무엇인지 분석해 보고자 한다. 이를 위해 아마존 에코 닷 3세대와 4세대 모델에 대한 리뷰를 수집하였다. 토픽모델링 분석 기법을 사용하여 세대별로 리뷰를 이루는 주제 및 주제의 변화를 찾아내고, 딥러닝 기반 감성 분석을 통해 토픽에 대한 사용자 감성이 세대에 따라 어떻게 변화되었는지 살펴보았다. 토픽모델링 결과, 세대별로 5개의 토픽이 도출되었다. 3세대의 경우 스피커의 일반적 속성을 나타내는 토픽은 제품에 긍정적 반응 요인으로 작용했고, 사용자 편의 기능은 부정적 반응 요인으로 작용했다. 반대로 4세대에서는 일반적 속성은 부정적으로, 사용자 편의 기능은 긍정적으로 도출되었다. 이와 같은 분석은 방법론 측면에서 어휘적 특징뿐 아니라 문장 전체의 문맥적 특징이 고려된 분석결과를 제시할 수 있다는 것에 그 의의가 있다.

영어 리뷰데이터를 이용한 딥러닝 기반 다국어 감성분석 (Deep learning-based Multilingual Sentimental Analysis using English Review Data)

  • 성재경;김영복;김용국
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권3호
    • /
    • pp.9-15
    • /
    • 2019
  • 영어로 된 아마존과 같은 대형 글로벌 온라인 쇼핑몰은 전 세계를 대상으로 영어 또는 판매 해당국가 언어로 서비스를 하고 있다. 온라인 쇼핑몰 이용자 중, 많은 고객은 상품 리뷰평가를 참조하여 상품을 구매하고 있다. 그래서 고객들이 작성한 대량의 리뷰데이터를 이용하여 구매 상품에 대해 긍정과 부정을 판정하는 감성분석을 영어를 중심으로 활발히 연구되고 분석 결과는 고객의 타켓 마케팅에 활용되고 있다. 하지만 이와 같은 영어 중심의 감성분석 시스템을 전 세계의 다양한 언어에 그대로 적용하기는 어렵다. 따라서 본 연구에서는 영어로 된 50만개 이상의 아마존 푸드 상품 리뷰데이터를 학습과 테스트 데이터로 분리하여 딥러닝 기술 기반의 감성분석 시스템을 구현하였다. 먼저 영어 테스트데이터의 3가지 모델에 대한 감성분석 평가 실험을 한 후에, 같은 데이터를 자동번역기로 7개국(한국어, 일본어, 중국어, 베트남어, 불어, 독어, 영어) 언어로 번역 후에 다시 영어로 번역하여 실험 결과를 얻었다. 감성분석 정확성은 영어(94.35%)에 비해 각 7개국 언어의 평균(91.59%)보다 정확도가 2.77% 정도 낮게 나왔으나 번역 성능 수준에서 실용 가능성을 확인하였다.

기업의 리뷰척도 및 포스팅 정보와 구매패턴과의 관계분석 -아마존 구글 유저를 중심으로 (The Analysis of the Relationship between the Review Scale and Posting Information of Company and Purchasing Patterns -Focusing on Amazon and Google Users)

  • 김동일;최승일
    • 한국융합학회논문지
    • /
    • 제10권10호
    • /
    • pp.153-160
    • /
    • 2019
  • 본 연구는 급변하는 소셜네트워크 기반의 서비스 및 제품에 대한 평가척도와 리뷰 컨텐츠 속성이 소비자의 구매 패턴에 어떻한 영향을 주고 있는지를 분석하고자 하였다. 이러한 분석은 개인과 기업간에 밀접하고 빠르게 통합되고 있고, 네트워크와 스마트 기술이 소비활동에 다양하게 관여하고 있는 현 시점에서 리뷰와 평점의 유용성과 선험적 추정을 통해 소비 및 구매에 작용되는 변화하는 소비자의 거래 환경을 확인 할 수 있다. 본 연구를 위해 계층분석기법(AHP)과 델파이(Delphi)기법을 적용하여 상위 평가기준 변수를 유용성, 기술성, 가치성으로 분류하고, 각각의 하위변수는 3개의 요인으로 그룹화 해서 평가 가중치를 통해 중요도를 분석하였다. 분석결과 유용성의 내구요인과 기술성의 혁신요인 그리고 가치성의 비용요인 및 품질요인 등으로 중요도를 분석할 수 있었다. 따라서 본 연구는 주요 요인을 검증하면서 제공되는 리뷰 평점과 포스팅 정보의 신뢰성을 동시에 분석하여 다양한 방법으로 경제활동에 참여하는 소비자와 기업에 보완적이고 추가적인 유용한 정보를 제공할 수 있을 것으로 기대된다.