• 제목/요약/키워드: opinion mining

검색결과 271건 처리시간 0.026초

소셜미디어 빅데이터의 텍스트 마이닝과 오피니언 마이닝 기법을 활용한 웹드라마 분석과 제안 (Webdrama Analysis and Recommendation using Text Mining and Opinion Mining Technique of Social Media)

  • 오세종;김치호
    • 만화애니메이션 연구
    • /
    • 통권44호
    • /
    • pp.285-306
    • /
    • 2016
  • 1인 스마트폰 사용으로 웹툰, 웹소설, TV드라마는 생산자에서 소비자에게 직접적으로 소비할 수 있는 Direct-to-Consumer로 전환되고 있다. 특히, 포털사이트의 웹드라마는 새로운 미디어로 급성장하고 있다. '연애세포', '0시의 그녀', '최고의 미래', '우리 옆집에 EXO가 산다' 등을 TV드라마의 시청률처럼 조회수, 유입자, 댓글, 좋아요 등으로 다양한 반응을 분석할 수 있다. 분석 방법은 소셜미디어 빅데이터의 텍스트 마이닝 기법과 오피니언 마이닝 기법으로 작품을 분석했다. 즉, 웹드라마 마다의 특정 키워드를 추출하고, 추출한 키워드의 긍정, 부정, 중립 등 시청자의 감정을 예측할 수도 있다. 주요 인기 웹드라마를 분석한 결과로는 이미 팬을 확보한 K-Pop 아이돌 멤버의 출현과 포털사이트의 편성 회사와의 연관성이 재생수, 유입자, 댓글, 좋아요에 큰 영향을 미치는 것으로 나타났다. 또한 TV 이외의 매체로 '모바일 TV'의 영향력을 증명하였다. 한계점으로는 모바일 특화 콘텐츠 확보와 비즈니스 모델을 정립하는 것이 필요하겠다. 이 부분을 해결한다면, 한국은 웹드라마의 콘텐츠 강국이라는 긍정적 이미지를 보여줄 수 있는 계기가 될 것이다.

뉴스와 주가 : 빅데이터 감성분석을 통한 지능형 투자의사결정모형 (Stock-Index Invest Model Using News Big Data Opinion Mining)

  • 김유신;김남규;정승렬
    • 지능정보연구
    • /
    • 제18권2호
    • /
    • pp.143-156
    • /
    • 2012
  • 누구나 뉴스와 주가 사이에는 밀접한 관계를 있을 것이라 생각한다. 그래서 뉴스를 통해 투자기회를 찾고, 투자이익을 얻을 수 있을 것으로 기대한다. 그렇지만 너무나 많은 뉴스들이 실시간으로 생성 전파되며, 정작 어떤 뉴스가 중요한지, 뉴스가 주가에 미치는 영향은 얼마나 되는지를 알아내기는 쉽지 않다. 본 연구는 이러한 뉴스들을 수집 분석하여 주가와 어떠한 관련이 있는지 분석하였다. 뉴스는 그 속성상 특정한 양식을 갖지 않는 비정형 텍스트로 구성되어있다. 이러한 뉴스 컨텐츠를 분석하기 위해 오피니언 마이닝이라는 빅데이터 감성분석 기법을 적용하였고, 이를 통해 주가지수의 등락을 예측하는 지능형 투자의사결정 모형을 제시하였다. 그리고, 모형의 유효성을 검증하기 위하여 마이닝 결과와 주가지수 등락 간의 관계를 통계 분석하였다. 그 결과 뉴스 컨텐츠의 감성분석 결과값과 주가지수 등락과는 유의한 관계를 가지고 있었으며, 좀 더 세부적으로는 주식시장 개장 전 뉴스들과 주가지수의 등락과의 관계 또한 통계적으로 유의하여, 뉴스의 감성분석 결과를 이용해 주가지수의 변동성 예측이 가능할 것으로 판단되었다. 이렇게 도출된 투자의사결정 모형은 여러 유형의 뉴스 중에서 시황 전망 해외 뉴스가 주가지수 변동을 가장 잘 예측하는 것으로 나타났고 로지스틱 회귀분석결과 분류정확도는 주가하락 시 70.0%, 주가상승 시 78.8%이며 전체평균은 74.6%로 나타났다.

교통망 관찰과 도시 특징지도를 위한 퍼지영역 온톨로지 기반 오피니언 마이닝 (Fuzzy Domain Ontology-based Opinion Mining for Transportation Network Monitoring and City Features Map)

  • 알리;곽대한;리아즈;김계현;곽경섭
    • 한국ITS학회 논문지
    • /
    • 제15권1호
    • /
    • pp.109-118
    • /
    • 2016
  • 트래픽 혼잡이 도심지역에서는 급속히 증가하고 있다. 이 문제를 해결하기 위하여 유용한 핵심 정보를 사용하여 트래픽 상황을 신속하게 인지할 수 있는 실시간 그리고 지능적인 방안이 필요하다. 본 연구는 실시간 교통망을 관찰하고 여행자를 위한 도시의 극성 지도를 구축하기 위하여 퍼지기반 오피니언 마이닝 시스템을 제안한다. 제안된 시스템은 도시의 교통 상황에 관련한 트위터 및 리뷰를 추출하고, 특징 오피니언을 추출하여, 퍼지기반 오피니언 마이닝 시스템를 사용하여 교통 및 도시의 특징적 극성을 규명한다. $Prot{\acute{e}}g{\acute{e}}$ OWL 과 자바를 사용하여 퍼지기반 오피니언 마이닝 시스템과 그 지능형 프로토타입을 개발한다. 실험을 통하여 트위트 및 리뷰의 분석과 오피니언 마이닝 측면에서 성능이 개선됨을 확인하였다.

오피니언마이닝을 이용한 사용자 맞춤 장소 추천 시스템 (Location Recommendation Customize System Using Opinion Mining)

  • 최은정;김동근
    • 한국정보통신학회논문지
    • /
    • 제21권11호
    • /
    • pp.2043-2051
    • /
    • 2017
  • 최근 빅데이터 분야의 높아진 관심과 더불어 빅데이터의 처리를 통한 응용 분야에 대한 관심도 높아지고 있다. 개인의 감성을 파악할 수 있는 오피니언마이닝은 사용자 개인 맞춤 서비스 제공 분야에서 많이 이용되고 있는 빅데이터 처리 기법이다. 이를 바탕으로 본 논문에서는 사용자들의 장소에 대한 텍스트 형태의 리뷰를 오피니언마이닝 기법으로 처리하고 k-means 클러스터링 작업을 통해 사용자의 감성을 분석하였다. 클러스터링 작업으로 분류된 비슷한 범주의 감성을 가진 사용자들끼리 동일한 수치 값을 부여한다. 부여된 수치 값으로 협업 필터링 추천 시스템을 이용해 선호도를 예측하고 예측 값이 높은 장소 순으로 지도위에 마커와 함께 내용을 표시하여 사용자에게 추천내용을 보여줄 수 있는 방안을 제안하였다.

감정분석과 오피니언 마이닝: 2007-2016 (Sentiment Analysis and Opinion Mining: literature analysis during 2007-2016)

  • 이가베;이효맹;유효문;강선경;이현창;신성윤
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 춘계학술대회
    • /
    • pp.160-161
    • /
    • 2017
  • 감정 분석 및 의견 마이닝은 지난 15 년 동안 연구 분야가 등장하면서 사람들의 의견, 감정, 평가, 태도 및 감정을 글쓰기 언어의 광산 및 감정 분석 (OMSA)에서 분석하고 계산 방법론을 제공하는 분야입니다 주로 비 구조화 된 데이터를 처리하여 의견을 추출하고 그들의 감정을 파악합니다. 상대적으로 새롭지 만 빠르게 성장하는 연구 분야는이 기간 동안 많이 바뀌 었습니다. 이 논문은 2007-2016 년 동안 OMSA에서 수행 된 연구 작업의 과학적 분석을 제시합니다. 문헌 분석을 위해 Web of Science (WoS) 데이터베이스에서 색인 된 연구 출판물을 입력 자료로 사용합니다. 출판 데이터는 계산 방식으로 분석되어 연도 별 출판 패턴, 출판물, 연구 분야의 성장률을 파악합니다. 이 간행물에서 사용되는 대중적 접근법 (기계 학습 및 어휘 기반), OMSA의 주요 응용 분야 및 정서 분석 작업의 수준 (문서, 문장 또는 측면 수준)을 식별하기 위해 데이터에 대한보다 상세한 수동 분석도 수행됩니다.

  • PDF

심리학적 감정과 소셜 웹 자료를 이용한 감성의 실증적 분류 (Empirical Sentiment Classification Using Psychological Emotions and Social Web Data)

  • 장문수
    • 한국지능시스템학회논문지
    • /
    • 제22권5호
    • /
    • pp.563-569
    • /
    • 2012
  • 소셜 웹이 확산되면서 오피니언 마이닝 혹은 감성 분석 연구가 주목을 받고 있다. 감성 분석을 위해서는 감성을 판별하기 위한 감성자원이 제공되어야 한다. 기존 감성 분석에서는 감성의 극성에 대한 강도를 표현하는 방법으로 리소스를 구축하고 이를 통하여 의견의 극성을 결정하였다. 본 논문에서는 의견의 극성뿐만 아니라 긍/부정의 근거가 되는 감성의 카테고리를 구성하고자 한다. 본 논문에서는 합리적인 분류를 위하여 심리학적 감정들을 초기 감성으로 정의한다. 그리고 실제로 소셜 웹에서 사용되는 감성의 분포를 얻기 위하여 소셜 웹의 텍스트를 분석하여 감성 정보를 추출한다. 추출한 감성 정보를 이용하여 초기 감성들을 재분류함으로써 소셜 웹을 위한 감성 카테고리를 구성한다. 본 논문에서는 이 방법을 통하여 23개의 감성 카테고리를 제시한다.

텍스트마이닝을 이용한 약물유해반응 보고자료 분석 (Analysis of Adverse Drug Reaction Reports using Text Mining)

  • 김현희;유기연
    • 한국임상약학회지
    • /
    • 제27권4호
    • /
    • pp.221-227
    • /
    • 2017
  • Background: As personalized healthcare industry has attracted much attention, big data analysis of healthcare data is essential. Lots of healthcare data such as product labeling, biomedical literature and social media data are unstructured, extracting meaningful information from the unstructured text data are becoming important. In particular, text mining for adverse drug reactions (ADRs) reports is able to provide signal information to predict and detect adverse drug reactions. There has been no study on text analysis of expert opinion on Korea Adverse Event Reporting System (KAERS) databases in Korea. Methods: Expert opinion text of KAERS database provided by Korea Institute of Drug Safety & Risk Management (KIDS-KD) are analyzed. To understand the whole text, word frequency analysis are performed, and to look for important keywords from the text TF-IDF weight analysis are performed. Also, related keywords with the important keywords are presented by calculating correlation coefficient. Results: Among total 90,522 reports, 120 insulin ADR report and 858 tramadol ADR report were analyzed. The ADRs such as dizziness, headache, vomiting, dyspepsia, and shock were ranked in order in the insulin data, while the ADR symptoms such as vomiting, 어지러움, dizziness, dyspepsia and constipation were ranked in order in the tramadol data as the most frequently used keywords. Conclusion: Using text mining of the expert opinion in KIDS-KD, frequently mentioned ADRs and medications are easily recovered. Text mining in ADRs research is able to play an important role in detecting signal information and prediction of ADRs.

의도된 의견 대상의 추출을 위한 경험적 방법 (A Heuristic Method for Extracting True Opinion Targets)

  • 소윤규;김한우;정성훈;김동주
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권9호
    • /
    • pp.39-47
    • /
    • 2012
  • 일반적으로 사람들은 특정 상품에 관한 의견을 표현할 때 그 상품이 갖는 개별속성에 대해 긍부정 성향을 표시한다. 어떤 경우에는 상품이 갖는 동질의 개별 속성에 대해 포괄적으로 긍부정 성향을 표현하거나 상품 자체에 대해 표현하기도 한다. 따라서 의견검색 분야에서 추출 대상이 되는 의견 속성명에는 상품의 개별 속성명, 이 개별 속성들을 포함하는 전체어, 그리고 상품명이 존재한다. 그러나 의견 대상을 상품명이나 전체어로 표현할 때, 경우에 따라 의견문장 표면에 나타나는 속성명과 의견 작성자가 의도한 실제 대상이 일치하지 않을 수도 있다. 본 논문에서는 의견문장으로부터 의견 대상을 추출하는 방법을 제시한다. 무엇보다 우리는 의도한 대상과 일치하지 않는 속성명으로부터 의도한 대상을 추출하기 위한 새로운 방법을 제안한다. 제시하는 방법에서는 단어간 의존관계를 이용하여 의견속성 후보쌍을 추출하고, 추출된 후보쌍들 중 의견 대상과 일반적으로 빈번히 불일치하는 속성명을 선택한다. 선택된 속성명을 작성자가 의도한 개별속성으로 변경한 뒤, 이를 포함한 전체 의견속성 후보쌍들로부터 적합한 의견속성을 추출하기 위해 사람들이 관심 있어할만한 순으로 재배열하게 된다.

속성선택방법과 워드임베딩 및 BOW (Bag-of-Words)를 결합한 오피니언 마이닝 성과에 관한 연구 (Investigating Opinion Mining Performance by Combining Feature Selection Methods with Word Embedding and BOW (Bag-of-Words))

  • 어균선;이건창
    • 디지털융복합연구
    • /
    • 제17권2호
    • /
    • pp.163-170
    • /
    • 2019
  • 과거 10년은 웹의 발달로 인한 데이터가 폭발적으로 생성되었다. 데이터마이닝에서는 대용량의 데이터에서 무의미한 데이터를 구분하고 가치 있는 데이터를 추출하는 단계가 중요한 부분을 차지한다. 본 연구는 감성분석을 위한 재표현 방법과 속성선택 방법을 적용한 오피니언 마이닝 모델을 제안한다. 본 연구에서 사용한 재표현 방법은 백 오즈 워즈(Bag-of-words)와 Word embedding to vector(Word2vec)이다. 속성선택(Feature selection) 방법은 상관관계 기반 속성선택(Correlation based feature selection), 정보획득 속성선택(Information gain)을 사용했다. 본 연구에서 사용한 분류기는 로지스틱 회귀분석(Logistic regression), 인공신경망(Neural network), 나이브 베이지안 네트워크(naive Bayesian network), 랜덤포레스트(Random forest), 랜덤서브스페이스(Random subspace), 스태킹(Stacking)이다. 실증분석 결과, electronics, kitchen 데이터 셋에서는 백 오즈 워즈의 정보획득 속성선택의 로지스틱 회귀분석과 스태킹이 높은 성능을 나타냄을 확인했다. laptop, restaurant 데이터 셋은 Word2vec의 정보획득 속성선택을 적용한 랜덤포레스트가 가장 높은 성능을 나타내는 조합이라는 것을 확인했다. 다음과 같은 결과는 오피니언 마이닝 모델 구축에 있어서 모델의 성능을 향상시킬 수 있음을 나타낸다.

소셜네트워크서비스에 활용할 비표준어 한글 처리 방법 연구 (Research on Methods for Processing Nonstandard Korean Words on Social Network Services)

  • 이종화;레환수;이현규
    • 한국산업정보학회논문지
    • /
    • 제21권3호
    • /
    • pp.35-46
    • /
    • 2016
  • 특정한 관심이나 활동을 공유하는 관계망을 구축해주는 온라인 서비스인 소셜네트워크서비스(SNS), 자신의 관심사에 따라 자유롭게 글, 사진, 동영상 등을 올릴 수 있는 공간인 블로그(Blog) 등은 자신을 알리고 표현하는 사회현상으로 자리 매김하고 있다. 이러한 SNS나 블로그를 통해 사용자들이 자유롭게 표현한 글들을 분석하여 의미있는 정보와 가치, 그리고 패턴을 찾기 위한 텍스트 마이닝(Text Mining), 오피니언 마이닝(Opinion Mining), 의미 분석(Semantic Analysis) 등의 연구가 활발히 이루어지고 있다. 또한, 연구자들의 연구 효율을 보다 높이기 위하여 키워드 기반 연구들도 이루어져있다. 하지만 대부분의 연구들은 한글의 맞춤법에 많은 한계점을 나타내고 있다. 본 연구는 어근을 찾기 힘든 이상한 외계 언어, 무분별하게 표현되는 속어, 알기 힘든 한글 이모티콘 인터넷 언어, 마이닝 처리 과정에서 파악하기 어려운 단어들을 데이터베이스에 구축하여 데이터 사전 기반 마이닝 처리 기법의 한계를 극복하고자 한다. 특정 주제에 대한 주관적 견해로 구성된 블로그를 사례 분석 대상으로 연구를 진행하였으며 유니코드를 활용한 비표준어 추출은 텍스트 마이닝 처리에 유용함을 발견할 수 있었다.