• 제목/요약/키워드: Bayes

검색결과 925건 처리시간 0.021초

영화 리뷰 감성분석을 위한 텍스트 마이닝 기반 감성 분류기 구축 (A Study on Analyzing Sentiments on Movie Reviews by Multi-Level Sentiment Classifier)

  • 김유영;송민
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.71-89
    • /
    • 2016
  • 누구나 본인이 사용한 제품이나, 이용한 서비스에 대한 후기를 자유롭게 인터넷에 작성할 수 있고, 이러한 데이터의 양은 점점 더 많아지고 있다. 감성분석은 사용자가 생성한 온라인 텍스트 속에 내포된 감성 및 감정을 식별하기 위해 사용된다. 본 연구는 다양한 데이터 도메인 중 영화 리뷰를 분석 대상으로 한다. 영화 리뷰를 이용한 기존 연구에서는 종종 리뷰 평점을 관객의 감성으로 동일시하여 감성분석에 이용한다. 그러나 리뷰 내용과 평점의 실제적 극성 정도가 항상 일치하는 것은 아니기 때문에 연구의 정확성에 한계가 발생할 수 있다. 이에 본 연구에서는 기계학습 기반의 감성 분류기를 구축하고, 이를 통해 리뷰의 감성점수를 산출하여 리뷰에서 나타나는 감성의 수치화를 목표로 한다. 나아가 산출된 감성점수를 이용하여 리뷰와 영화 흥행 간의 연관성을 살펴보았다. 감성분석 모델은 지지벡터 분류기와 신경망을 이용해 구축되었고, 총 1만 건의 영화 리뷰를 학습용 데이터로 하였다. 감성분석은 총 175편의 영화에 대한 1,258,538개의 리뷰에 적용하였다. 리뷰의 평점과 흥행, 그리고 감성점수와 흥행과의 연관성은 상관분석을 통해 살펴보았고, t-검정으로 두 지표의 평균차를 비교하여 감성점수의 활용성을 검증하였다. 연구 결과, 본 연구에서 제시하는 모델 구축 방법은 나이브 베이즈 분류기로 구축한 모델보다 높은 정확성을 보였다. 상관분석 결과로는, 영화의 주간 평균 평점과 관객 수 간의 유의미한 양의 상관관계가 나타났고, 감성점수와 관객 수 간의 상관분석에서도 유사한 결과가 도출되었다. 이에 두 지표간의 평균을 이용한 t-검정을 수행하고, 이를 바탕으로 산출한 감성점수를 리뷰 평점의 역할을 할 수 있는 지표로써 활용 가능함을 검증하였다. 나아가 검증된 결론을 근거로, 트위터에서 영화를 언급한 트윗을 수집하여 감성분석을 적용한 결과를 살펴봄으로써 감성분석 모델의 활용 방안을 모색하였다. 전체적 실험 및 검증의 과정을 통해 본 연구는 감성분석 연구에 있어 개선된 감성 분류 방법을 제시할 수 있음을 보였고, 이러한 점에서 연구의 의의가 있다.

하나의 이상구간을 가지는 테스팅 단계에서의 소프트웨어 신뢰도 성장 모형화 (Software Reliability Growth Modeling in the Testing Phase with an Outlier Stage)

  • 박만곤;정은이
    • 한국정보처리학회논문지
    • /
    • 제5권10호
    • /
    • pp.2575-2583
    • /
    • 1998
  • 소프트웨어 산업에서 고신뢰성의 소프트웨어 시스템을 생산하고 그들의 성능을 평가하는 일이 중요한 관심사항이 되어왔다. 소프트웨어의 평가는 주로 소프트웨어 시스템의 신뢰성과 성능의 양쪽 관점에서 수행되어져 왔다. 소프트웨어신뢰도는 소프트웨어 테스팅 단계 동안에 한 고정된 시간구간에서 소프트웨어 오류가 발생하지 않을 확률을 말한다. 이들 이론적인 소프트웨어 신뢰성 모델들은 가끔 어떤 특정한 테스팅 구간에서는 하나의 어떤 소프트웨어 오류가 발생하여 소프트웨어 오류를 디버깅하여도 소프트웨어 고장율이 불완전 디버깅. 비정상적인 소프트웨어 수정 등등의 원인에 의해서 감소되어 실제적인 소프트웨어 테스팅 단계에서는 적당하지 않을 수도 있다. 이와 같이 부적당한 소프트웨어 테스팅 구간은 하나의 이상치 스테이지로 고려되어질 필요성이 있다. 이 이상치 소프트웨어 테스팅 구간에서만은 장애요인에 의해서 소프트웨어 신뢰도가개선이 되지 않는다고 가정한다. 이와 같은 가정아래서본 연구에서는 우선 소프트웨어 신뢰도 성장 모형에서 가장 많이 활용되는 Jelinski-Moranda모델을 변경하여 하나의 미지정된 이상치 소프트웨어 테스팅 구간을 고려하여 베이지안 방법에 의한 소프트웨어 신뢰도를 모형화하고 그 모형에 따른 소프트웨어 신뢰성 측도들을 추정하는 절차를 연구하였다. 그리고 제곱오차 결손함수의 조건아래 사전정보를 가정한 소프트웨어 신뢰도 모수의 베이즈 추정량을 제안하고, 제안된 소프트웨어 신뢰도 성장 모델을 하나의 이상치 소프트웨어 테스팅 구간상에 고려된 장애 모수의 값에 따라서 정확성, 바이어스, 추세 및 노이즈 등의 정량적인 평가 측도들을 사용하여 컴퓨터 시뮬레이션을 통하여 평가하였다.7배 높은 것으로 나타났다. 국내 건강기능식품공전 중 클로렐라 및 스피루리나제품의 엽록소 a b, 및 페오포르바이드 항목의 규격검사를 본 연구의 동시분석법으로 개정함으로써 각 성분 함량의 정량, 분석시간의 단축 및 비용절감 둥 시험방법을 크게 개선할 수 있을 것으로 기대된다. 잔주름 개선에 효과를 볼 수 있을 것으로 생각된다.른 Phenoxyethanol의 유/수 분배 측정 결과, Polarity가 낮은 oil에서는 $70\%$ 이상의 Phenoxyethanol이 수상에 존재한 반면, polarity가 높은 oil에서는 약 $70 {\~} 90\%$의 phenoxyethanol이 유상에 존재하였다. 또한, 미생물에 대한 항균력도 phenoxyethanol이 수상에 많이 존재할수록 증가하는 경향을 나타내었다. 따라서, 제형 내 oil tomposition을 변화시킴으로써 phenoxyethanol의 사용량을 줄일 수 있을 뿐만 아니라, 피부 투과를 감소시켜 보다 피부 자극이 적은 저자극 방부시스템 개발이 가능하리라 보여 진다. 첨가하여 제조한 curd yoghurt는 저장성과 관능적인 면에서 우수한 상품적 가치가 인정되는 새로운 기능성 신제품의 개발에 기여할 수 있을 것으로 사료되었다. 여자의 경우 0.8이상이 되어서 심혈관계 질환의 위험 범위에 속하는 수준이었다. 삼두근의 두겹 두께는 남녀 각각 $20.2\pm8.58cm,\;22.2\pm4.40mm$으로 남녀간에 유의한 차이는 없었다. 조사대상자의 식습관 상태는 전체 대상자의 $84.4\%$가 대부분이 하루 세끼 식사를 규칙적으로 하고 있었으며

  • PDF

과점산업(寡占産業)에서의 진입제한가격(進入制限價格) (Limit Pricing by Noncooperative Oligopolists)

  • 남일총
    • KDI Journal of Economic Policy
    • /
    • 제12권1호
    • /
    • pp.127-148
    • /
    • 1990
  • 이 논문의 기본목표는 Bain 이래 논란의 대상이 되어 온 기존기업들에 의한 진입제한가격(進入制限價格)의 형성이 일반적으로 가능한가, 가능하다면 어떠한 메커니즘을 통해 형성되는 가를 밝히고, 진입제한가격이론(進入制限價格理論)이 한국경제에 갖는 의의를 찾아보는데 있다, 이 논문에서 밝혀질 주요결과는 다음과 같다. 첫째, 다수의 기존기업(旣存企業)이 각자의 이윤극대화(利潤極大化)를 추구하며 카르텔을 형성하지 않는 때에도 기존기업(旣存企業)과 잠재적(潛在的) 신규기업간(新規企業間)에 정보의 불균형이 존재하는 경우 진입제한가격(進入制限價格)이 채택될 가능성이 있다. 둘째, 이러한 과점기업(寡占企業)들에 의한 진입제한가격형성(進入制限價格形成)은 암묵적 담합의 새로운 형태로 해석할 수 있다. 셋째, 진입제한가격형성(進入制限價格形成)은 각종 회계자료(會計資料)가 공표되지 않을 경우에 가능하다. 넷째, 기존기업(旣存企業)의 수(數)가 증가하여 산업(産業)이 완전경쟁산업(完全競爭産業)에 접근해 감에 따라 진입제한가격(進入制限價格)이 형성될 가능성은 사라지게 된다.

  • PDF

SVM을 이용한 VKOSPI 일 중 변화 예측과 실제 옵션 매매에의 적용 (VKOSPI Forecasting and Option Trading Application Using SVM)

  • 라윤선;최흥식;김선웅
    • 지능정보연구
    • /
    • 제22권4호
    • /
    • pp.177-192
    • /
    • 2016
  • 기계학습(Machine Learning)은 인공 지능의 한 분야로, 데이터를 이용하여 기계를 학습시켜 기계 스스로가 데이터 분석 및 예측을 하게 만드는 것과 관련한 컴퓨터 과학의 한 영역을 일컫는다. 그중에서 SVM(Support Vector Machines)은 주로 분류와 회귀 분석을 목적으로 사용되는 모델이다. 어느 두 집단에 속한 데이터들에 대한 정보를 얻었을 때, SVM 모델은 주어진 데이터 집합을 바탕으로 하여 새로운 데이터가 어느 집단에 속할지를 판단해준다. 최근 들어서 많은 금융전문가는 기계학습과 막대한 데이터가 존재하는 금융 분야와의 접목 가능성을 보며 기계학습에 집중하고 있다. 그러면서 각 금융사는 고도화된 알고리즘과 빅데이터를 통해 여러 금융업무 수행이 가능한 로봇(Robot)과 투자전문가(Advisor)의 합성어인 로보어드바이저(Robo-Advisor) 서비스를 발 빠르게 제공하기 시작했다. 따라서 현재의 금융 동향을 고려하여 본 연구에서는 기계학습 방법의 하나인 SVM을 활용하여 매매성과를 올리는 방법에 대해 제안하고자 한다. SVM을 통한 예측대상은 한국형 변동성지수인 VKOSPI이다. VKOSPI는 금융파생상품의 한 종류인 옵션의 가격에 영향을 미친다. VKOSPI는 흔히 말하는 변동성과 같고 VKOSPI 값은 옵션의 종류와 관계없이 옵션 가격과 정비례하는 특성이 있다. 그러므로 VKOSPI의 정확한 예측은 옵션 매매에서의 수익을 낼 수 있는 중요한 요소 중 하나이다. 지금까지 기계학습을 기반으로 한 VKOSPI의 예측을 다룬 연구는 없었다. 본 연구에서는 SVM을 통해 일 중의 VKOSPI를 예측하였고, 예측 내용을 바탕으로 옵션 매매에 대한 적용 가능 여부를 실험하였으며 실제로 향상된 매매 성과가 나타남을 증명하였다.

CNN-LSTM 조합모델을 이용한 영화리뷰 감성분석 (Sentiment Analysis of Movie Review Using Integrated CNN-LSTM Mode)

  • 박호연;김경재
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.141-154
    • /
    • 2019
  • 인터넷 기술과 소셜 미디어의 빠른 성장으로 인하여, 구조화되지 않은 문서 표현도 다양한 응용 프로그램에 사용할 수 있게 마이닝 기술이 발전되었다. 그 중 감성분석은 제품이나 서비스에 내재된 사용자의 감성을 탐지할 수 있는 분석방법이기 때문에 지난 몇 년 동안 많은 관심을 받아왔다. 감성분석에서는 주로 텍스트 데이터를 이용하여 사람들의 감성을 사전 정의된 긍정 및 부정의 범주를 할당하여 분석하며, 이때 사전 정의된 레이블을 이용하기 때문에 다양한 방향으로 연구가 진행되고 있다. 초기의 감성분석 연구에서는 쇼핑몰 상품의 리뷰 중심으로 진행되었지만, 최근에는 블로그, 뉴스기사, 날씨 예보, 영화 리뷰, SNS, 주식시장의 동향 등 다양한 분야에 적용되고 있다. 많은 선행연구들이 진행되어 왔으나 대부분 전통적인 단일 기계학습기법에 의존한 감성분류를 시도하였기에 분류 정확도 면에서 한계점이 있었다. 본 연구에서는 전통적인 기계학습기법 대신 대용량 데이터의 처리에 우수한 성능을 보이는 딥러닝 기법과 딥러닝 중 CNN과 LSTM의 조합모델을 이용하여 감성분석의 분류 정확도를 개선하고자 한다. 본 연구에서는 대표적인 영화 리뷰 데이터셋인 IMDB의 리뷰 데이터 셋을 이용하여, 감성분석의 극성분석을 긍정 및 부정으로 범주를 분류하고, 딥러닝과 제안하는 조합모델을 활용하여 극성분석의 예측 정확도를 개선하는 것을 목적으로 한다. 이 과정에서 여러 매개 변수가 존재하기 때문에 그 수치와 정밀도의 관계에 대해 고찰하여 최적의 조합을 찾아 정확도 등 감성분석의 성능 개선을 시도한다. 연구 결과, 딥러닝 기반의 분류 모형이 좋은 분류성과를 보였으며, 특히 본 연구에서 제안하는 CNN-LSTM 조합모델의 성과가 가장 우수한 것으로 나타났다.