• 제목/요약/키워드: Opinion-Mining

검색결과 271건 처리시간 0.023초

휴먼 오피니언 자동 분류 시스템 구현을 위한 비결정 오피니언 형용사 구문에 대한 연구 (Study on Domain-dependent Keywords Co-occurring with the Adjectives of Non-deterministic Opinion)

  • 안애림;한용진;박세영;남지순
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.248-251
    • /
    • 2011
  • 본 연구에서는, 웹 문서로부터 특정 상품에 대한 의견 문장을 분석하는 오피니언 마이닝(Opinion Mining) 연구의 일환으로, 특히 함께 공기하는 자질 명사에 따라 그 극성 값이 달라지는 '비결정 오피니언어휘'의 처리를 위해서 도메인을 '맛집'으로 한정하여 공기하는 도메인 키워드의 목록을 결정하고, 이를 부분문법그래프(Local Grammar Graphs) 방법론을 통해서 이들 간의 어휘 통사적 관계를 결정해 주었다.

오피니언 마이닝을 이용한 여론분석 시스템 (Public opinion analysis system using opinion mining)

  • 김영아;김성권;;박두순
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 춘계학술발표대회
    • /
    • pp.291-293
    • /
    • 2015
  • 최근 스마트폰 사용자와 SNS를 이용하는 사용자들이 늘어나고 있다. 또 다양한 SNS가 등장하면서 SNS데이터의 양이 방대해지고 SNS데이터의 가치와 신뢰성도 점점 높아지고 있다. 이러한 SNS 데이터를 사용하여 특정 키워드의 여론을 분석하고 사용자들의 반응을 얻는 것은 좋은 정보로 여러 분야에 사용될 수 있을 것이다. 본 논문에서는 SNS를 기반으로 오피니언 마이닝을 사용해 특정 키워드에 대한 SNS사용자들의 여론을 분석하였다. 그 결과 실시간으로 올라오는 글들에 대하여 해당 키워드가 어떤 여론을 가지고 있는지 분석 결과를 얻었다.

베트남어 사전을 사용한 베트남어 SentiWordNet 구축 (Construction of Vietnamese SentiWordNet by using Vietnamese Dictionary)

  • 뷔쉬에손;박성배
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.745-748
    • /
    • 2014
  • SentiWordNet is an important lexical resource supporting sentiment analysis in opinion mining applications. In this paper, we propose a novel approach to construct a Vietnamese SentiWordNet (VSWN). SentiWordNet is typically generated from WordNet in which each synset has numerical scores to indicate its opinion polarities. Many previous studies obtained these scores by applying a machine learning method to WordNet. However, Vietnamese WordNet is not available unfortunately by the time of this paper. Therefore, we propose a method to construct VSWN from a Vietnamese dictionary, not from WordNet. We show the effectiveness of the proposed method by generating a VSWN with 39,561 synsets automatically. The method is experimentally tested with 266 synsets with aspect of positivity and negativity. It attains a competitive result compared with English SentiWordNet that is 0.066 and 0.052 differences for positivity and negativity sets respectively.

Opinion: Strategy of Semi-Automatically Annotating a Full-Text Corpus of Genomics & Informatics

  • Park, Hyun-Seok
    • Genomics & Informatics
    • /
    • 제16권4호
    • /
    • pp.40.1-40.3
    • /
    • 2018
  • There is a communal need for an annotated corpus consisting of the full texts of biomedical journal articles. In response to community needs, a prototype version of the full-text corpus of Genomics & Informatics, called GNI version 1.0, has recently been published, with 499 annotated full-text articles available as a corpus resource. However, GNI needs to be updated, as the texts were shallow-parsed and annotated with several existing parsers. I list issues associated with upgrading annotations and give an opinion on the methodology for developing the next version of the GNI corpus, based on a semi-automatic strategy for more linguistically rich corpus annotation.

블로그 마이닝을 활용한 행복주택의 인식 분석 (Analysis of Perception on Happy Housing Using Blog Mining Technique)

  • 황지현
    • 한국콘텐츠학회논문지
    • /
    • 제22권2호
    • /
    • pp.211-223
    • /
    • 2022
  • 본 연구는 주거정책 분야에서 여론을 수렴하기 위해 블로그의 활용 가능성을 고찰하고자 한다. 이를 위해 '행복주택'을 키워드로 관련 게시글을 수집하고 주요 키워드를 추출하여 키워드 분석과 단어 군집 분석을 통해 대중들의 인식을 파악하였다. 행복주택에 대한 사회적 논의가 확산된 2013년 5월부터 2021년 8월까지 블로그 게시글 137,002개를 분석 자료로 활용하였으며, 주요 정책과 자료 수집량을 고려하여 수집 기간을 3단계로 나누어 도출된 단어를 분석한 결과는 다음과 같다. 키워드 분석에서 전반적으로 행복주택의 위치, 세대수, 단지 및 주택 규모, 입주 가능 조건 등과 관련된 단어의 중요도가 높았다. 1단계에서는 정부 정책 시행, 2단계에서는 행복주택 신청 절차, 3단계에서는 모집공고, 입주 자격, 임대조건에 중요도가 각각 높은 것으로 나타났다. 군집 분석에서는 모든 단계에서 사업 진행, 신청 절차, 사업지역이 주요 주제로 도출되었다. 특히, 1단계에서는 정책 시행 및 추진방안, 2단계는 입주 자격 및 금융 지원, 3단계에서는 정책 시행 및 입주 자격이 주요한 주제로 도출되었다. 이러한 결과는 블로그를 통해 정책 관련 정보 공유 및 사회적 이슈 반영, 정책 전달 여부 평가, 대중의 정책 참여도 유추가 가능하며, 블로그를 여론 수렴 방법으로 활용할 가능성을 제시한 데에 의의가 있다.

오피니언 마이닝 기법을 이용한 사회적 재난의 시민 감성도 분석 (Citizen Sentiment Analysis of the Social Disaster by Using Opinion Mining)

  • 서민송;유환희
    • 대한공간정보학회지
    • /
    • 제25권1호
    • /
    • pp.37-46
    • /
    • 2017
  • 최근 우리나라는 사회적 요인에 의한 재난이 빈번하게 발생하고 있다. 어떤 위기가 도시민들을 위협할지 예측하기 어려워 우려가 높아지고 있다. 따라서 본 연구에서는 Python언어 기반 Tweepy 플러그인을 적용하여 트윗 데이터를 취득하는 프로그램을 개발하고, 자연어 처리 후 R Studio프로그램에서 텍스트 클러스터링 분석과 오피니언 마이닝 분석을 통하여 시민들의 건강에 영향을 미치는 성분이 검출된 '옥시'와 시민들에게 많은 공포감을 주었던 '묻지마 범죄'와 같은 사회적 재난에 대해 정신적 충격과 불안감을 평가하였다. 텍스트 클러스터링 분석에서 '옥시' 사건은 '정부의 대처능력이 세월호 사건과의 연관성', '옥시제품의 철수지시에도 여전한 판매' 등이 가장 높은 관심도를 보였다. 그리고 '묻지마 범죄' 사건은 '스크린 도어 사건, 세월호 사건 등 예측 못하는 사건에 대한 정부의 대응, 대책', '강남역, 부산의 범죄가 여성혐오로 인한 것' 등이 가장 높은 관심도를 보였다. 또한, 두 범죄를 비교 분석 하였을 때 묻지마 범죄에 대해 시민 감성도 평균 지수가 11.61%p 더 부정적이라는 것을 알 수 있었다.

사회지표조사에서의 3단계 복합 데이터마이닝의 적용 방안 (A study on 3-step complex data mining in society indicator survey)

  • 조광현;박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권5호
    • /
    • pp.983-992
    • /
    • 2012
  • 사회지표조사는 주민들이 생각하는 사회 상태를 총체적으로 파악할 수 있는 조사로서 다양한 시책 개발에 있어 지역의 여론을 반영할 수 있는 장점이 있다. 사회지표조사는 사회 변화를 알 수 있는 중요한 척도라고 할 수 있으며, 많은 지자체 (서울시, 인천시, 부산시, 울산시, 경상남도 등)에서 많은 예산과 시간을 들여 조사를 실시하고 있다. 그러나 조사에 대한 분석 결과가 기초통계분석 위주로 되어 있어 실제 사회지표조사 자료를 제대로 활용하고 있지 못하고 있는 실정이므로 데이터마이닝 등의 다양한 방법의 적용이 필요하다. 이에 본 논문에서는 사회지표조사의 효율적인 분석을 위하여 새로운 데이터마이닝 방법론을 제시하고자 한다. 본 논문에서는 매개연관성규칙, k-평균 군집분석, 의사결정나무를 순차적으로 적용하는 3단계 복합 데이터마이닝의 적용 방법을 제안하며, 이를 2010년에 조사된 경상남도 사회지표조사 자료에 적용하고자 한다.

텍스트마이닝을 활용한 사용자 요구사항 우선순위 도출 방법론 : 온라인 게임을 중심으로 (Analysis of User Requirements Prioritization Using Text Mining : Focused on Online Game)

  • 정미연;허선우;백동현
    • 산업경영시스템학회지
    • /
    • 제43권3호
    • /
    • pp.112-121
    • /
    • 2020
  • Recently, as the internet usage is increasing, accordingly generated text data is also increasing. Because this text data on the internet includes users' comments, the text data on the Internet can help you get users' opinion more efficiently and effectively. The topic of text mining has been actively studied recently, but it primarily focuses on either the content analysis or various improving techniques mostly for the performance of target mining algorithms. The objective of this study is to propose a novel method of analyzing the user's requirements by utilizing the text-mining technique. To complement the existing survey techniques, this study seeks to present priorities together with efficient extraction of customer requirements from the text data. This study seeks to identify users' requirements, derive the priorities of requirements, and identify the detailed causes of high-priority requirements. The implications of this study are as follows. First, this study tried to overcome the limitations of traditional investigations such as surveys and VOCs through text mining of online text data. Second, decision makers can derive users' requirements and prioritize without having to analyze numerous text data manually. Third, user priorities can be derived on a quantitative basis.

비정형 데이터 마이닝을 활용한 한국농수산대학 재학생의 학교생활 감성 분석(1) (An Analysis of School Life Sensibility of Students at Korea National College of Agriculture and Fisheries Using Unstructured Data Mining(1))

  • 주진수;이소영;김종숙;송천영;신용광;박노복
    • 현장농수산연구지
    • /
    • 제21권1호
    • /
    • pp.99-114
    • /
    • 2019
  • 본 논문은 빅 데이터 분석기법을 이용하여 한국농수산대학 학생들의 대학생활 요소에 대한 선호도를 연구하기 위하여 비정형 데이터 분석기법으로서 감성 분석(opinion mining) 기법과 텍스트 마이닝 기법을 활용하였다. 분석도구로는 RStudio를 이용하였으며, 긍정과 부정의 감성을 분류하고 선호도를 평가하기 위한 긍정어 사전과 부정어 사전을 새롭게 작성하여 프로그래밍하였다. 비정형 텍스트에 대한 분석 결과는 도표와 워드 클라우드를 이용한 시각화 자료로 나타내어 정보를 추출하였다. 학교생활 요소로는 '나의 현재', '10년 후 모습', '교우관계', '한농제(대학 축제)', '후생관(식사)', '청학관(기숙사)', '한농대', '장기현장실습' 등 학생들에게 밀접한 8가지 주제를 대상으로 하였다. 분석 결과 한농대 학생들은 '후생관 식사'과 ' 교우관계'의 주제에 대해서 85% 이상의 긍정적 감성을 나타냈으나 '장기현장실습'과 '청학관(기숙사)'에 대해서는 긍정적 감성이 60%를 넘지 않는 만족도를 갖는 것으로 나타났다. 그리고 '나의 현재', '10년 후 모습', '한농제(대학 축제)' 및 'KNCAF' 등의 주제에 대해서는 69.3~74.2% 정도의 긍정적 감성을 나타냈다. 남녀 학생별 차이를 보면 '나의 현재', '10년 후 모습', '교우관계', '청학과(기숙사)' 및 '장기현장실습' 주제에서는 남학생의 긍정적 감성이 높게 나타났으며, '한농제(대학 축제)', '후생관' 및 '한농대' 주제에서는 여학생의 긍정적 감성이 높게 나타났다. 전공별 특징을 살펴보면 학생들은 '현재'나 '10년 후'의 자신의 모습에 대하여 71% 이상 긍정적 자신감을 지니고 있는 것으로 나타났다. 특히 축산계열 학생들의 긍정적 감성이 높게 나타났으며, 화훼학과 학생들은 다른 전공의 학생들에 비하여 긍정적 감성이 낮게 나타나 자신감이 부족한 결과를 보였다. '교우관계'에 대해서는 화훼학과를 제외하고 80% 이상의 긍정적 감성을 나타냈으며, 중소가축학과 학생들은 93%를 초과하는 적극적인 교우관계를 맺고 있는 것으로 나타났다. 대학 축제인 '한농제'에 대하여 전체 학생들의 긍정적 감성은 약 70% 정도이나 과수학과와 수산양식학과 학생들의 호감도는 60% 미만으로 축제에 대한 부정적 이미지가 높게 나타났다. '후생관 식사'에 대한 전체 학생들의 긍정적 감성은 85%를 넘어 매우 높은 만족도를 나타냈으나 수산양식학과 학생(남학생)들의 만족도는 매우 낮게 나타났다. 모든 학생들이 공동생활을 하는 '청학관'에 대한 학생들의 호감도는 59.5%로 낮게 나타났으며, 과수학과와 수산양식학과 학생들의 만족도는 약 42% 미만으로 더욱 부정적인 감성을 나타냈다. 또한 자신들이 3년간 학업을 재학한 한농대에 대해서는 74% 이상이 긍정적인 평가를 하는 것으로 나타났다. 특히 학생들의 호감도가 가장 낮게 나타난 장기현장실습에 대한 화훼학과, 채소학과, 중소가축학과 학생들의 호감도는 50%를 넘지 않는 매우 부정적 감성을 나타냈다. 빅 데이터 분석 결과를 쉽게 이해할 수 있도록 시각적으로 표현하기 위하여 텍스트 마이닝 기법으로 구조화되지 않은 텍스트에서 주요 단어를 긍정어와 부정어로 나누어 추출하고 그 단어들의 word cloud를 작성하여 학생들의 감성을 시각화하였다. 한농대는 학생들에게 지금보다 더욱 긍정적인 감성을 가지고 밝고 환한 말, 힘이 되고 용기를 주는 말, 사람을 기쁘게 하는 말을 많이 할 수 있도록 여건을 제공함으로써 학생들은 삶의 활기가 넘치고 성공적인 인생을 살아가는 행복을 만들 수 있으리라 여겨진다.

빅데이터를 통한 브랜드 평가 맵 제안 : 현대자동차 제품 평가 중심으로 (Proposal of Brand Evaluation Map through Big Data : Focus on The Hyundai Motor's Product Evaluation)

  • 윤대명;이용혁;이봉규
    • 한국IT서비스학회지
    • /
    • 제19권4호
    • /
    • pp.1-11
    • /
    • 2020
  • Through text mining, sentiment analysis, and semiotics analysis, this study aims to reinterpret the meaning of user emotional words and related words to derive strategic elements of brand and design. After selecting a local car manufacturer whose user opinion on the brand is a clear topic, web-crawl the car comments of the manufacturer directly created by the users online. Then, analyze the extracted morphology and its associated words and convert them to fit the marketing mix theory. Through this process, propose a methodology that allows consumers to supplement and improve brand elements with negative sensibilities, and to inherit elements with positive sensibilities and manage brands reasonably. In particular, the Map presented in this study are considered to be fully utilized as information for overall brand management.