• 제목/요약/키워드: independent vector analysis

검색결과 102건 처리시간 0.016초

영화 리뷰 감성분석을 위한 텍스트 마이닝 기반 감성 분류기 구축 (A Study on Analyzing Sentiments on Movie Reviews by Multi-Level Sentiment Classifier)

  • 김유영;송민
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.71-89
    • /
    • 2016
  • 누구나 본인이 사용한 제품이나, 이용한 서비스에 대한 후기를 자유롭게 인터넷에 작성할 수 있고, 이러한 데이터의 양은 점점 더 많아지고 있다. 감성분석은 사용자가 생성한 온라인 텍스트 속에 내포된 감성 및 감정을 식별하기 위해 사용된다. 본 연구는 다양한 데이터 도메인 중 영화 리뷰를 분석 대상으로 한다. 영화 리뷰를 이용한 기존 연구에서는 종종 리뷰 평점을 관객의 감성으로 동일시하여 감성분석에 이용한다. 그러나 리뷰 내용과 평점의 실제적 극성 정도가 항상 일치하는 것은 아니기 때문에 연구의 정확성에 한계가 발생할 수 있다. 이에 본 연구에서는 기계학습 기반의 감성 분류기를 구축하고, 이를 통해 리뷰의 감성점수를 산출하여 리뷰에서 나타나는 감성의 수치화를 목표로 한다. 나아가 산출된 감성점수를 이용하여 리뷰와 영화 흥행 간의 연관성을 살펴보았다. 감성분석 모델은 지지벡터 분류기와 신경망을 이용해 구축되었고, 총 1만 건의 영화 리뷰를 학습용 데이터로 하였다. 감성분석은 총 175편의 영화에 대한 1,258,538개의 리뷰에 적용하였다. 리뷰의 평점과 흥행, 그리고 감성점수와 흥행과의 연관성은 상관분석을 통해 살펴보았고, t-검정으로 두 지표의 평균차를 비교하여 감성점수의 활용성을 검증하였다. 연구 결과, 본 연구에서 제시하는 모델 구축 방법은 나이브 베이즈 분류기로 구축한 모델보다 높은 정확성을 보였다. 상관분석 결과로는, 영화의 주간 평균 평점과 관객 수 간의 유의미한 양의 상관관계가 나타났고, 감성점수와 관객 수 간의 상관분석에서도 유사한 결과가 도출되었다. 이에 두 지표간의 평균을 이용한 t-검정을 수행하고, 이를 바탕으로 산출한 감성점수를 리뷰 평점의 역할을 할 수 있는 지표로써 활용 가능함을 검증하였다. 나아가 검증된 결론을 근거로, 트위터에서 영화를 언급한 트윗을 수집하여 감성분석을 적용한 결과를 살펴봄으로써 감성분석 모델의 활용 방안을 모색하였다. 전체적 실험 및 검증의 과정을 통해 본 연구는 감성분석 연구에 있어 개선된 감성 분류 방법을 제시할 수 있음을 보였고, 이러한 점에서 연구의 의의가 있다.

핸디사이즈 운임지수 및 스팟용선료 변화에 영향을 미치는 요인 분석 (Factor Analysis Affecting on Changes in Handysize Freight Index and Spot Trip Charterage)

  • 이충호;김태우;박근식
    • 한국항만경제학회지
    • /
    • 제37권2호
    • /
    • pp.73-89
    • /
    • 2021
  • 핸디사이즈 벌크선 시장은 중대형 선박으로 운송이 불가능한 다양한 화물을 운송할 수 있으며, Spot용·대선 시장이 활성화 되어 있고 중대형 벌크선과 독립적인 성격의 시장으로 단기간에 변화하는 시황 및 용선료 변동성에 의한 위험이 보다 많은 시장이다. 본 연구에서는 부정기 벌크선 선형에서 핸디사이즈 운임지수(BHSI)와 Spot용선료에 영향을 미치는 요인들을 검정하고 요인들의 과거 값을 이용하여 종속변수의 동태적 반응을 파악 및 단기 예측을 위하여 벡터자기회귀모형(VAR)을 이용하여 분석을 하였다. 인과성 검정 결과 핸디사이즈의 주요 선적 화물인 원료탄, 일본후판, 열연강판의 가격과 선복량, 선박유가와 인과관계가 나타났으며, VAR모형의 적정시차와 안정성을 확인 후 충격반응함수와 예측오차분해분석을 실시하였다. 충격반응함수 분석 결과 원료탄 가격, 열연강판 가격, 선박유가 3가지 변수는 신뢰구간 상한과 하한이 모두 같은 구간으로 유의하다고 나타났으며, 열연강판 가격의 충격이 가장 유의한 영향을 미치는 것으로 확인되었다. 운임지수(BHSI)와 Spot용선료 두 종속변수 모두 거의 동일한 결과로 나타났으며 t시점에서 발생한 원료탄가격의 표준편차 1단위의 충격에 양(+)의 영향, 열연강판 가격의 충격에 양(+)의 영향, 선박유가의 충격에는 음(-)의 영향의 결과를 보였다. 예측오차 분산분해분석 결과 운임지수(BHSI)와 Spot용선료에 영향을 미치는 설명력은 열연강판 가격, 원료탄 가격, 선박유가, 일본후판 가격, 선복량 순으로 동일하게 나타났으며 열연강판 가격의 설명력은 3기부터 점차 상승하여 운임지수에는 30%, Spot용선료에는 26%까지 영향을 미친다고 나타났다. 기존 선행연구와 차별화하여 단기적인 시차 영향을 알아보기 위해 주요 선적화물의 월간 가격 데이터를 사용하여 분석을 수행하였으며, 월 단위 시황 예측이 가능한 유의미한 결과를 도출하였다. 이 연구가 핸디사이즈 선박을 운항하는 선사와 핸디사이즈 용·대선 시장 관계자들에게 단기적인 시황 예측에 도움이 될 수 있다는데 의의가 있다고 생각한다.