• 제목/요약/키워드: 감성어 분석

검색결과 99건 처리시간 0.026초

동적 토픽 모델링과 감성 분석을 활용한 전동킥보드에 대한 사회적 동향 분석 (Analysis of Social Trends for Electric Scooters Using Dynamic Topic Modeling and Sentiment Analysis)

  • 김경옥;신예랑
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권1호
    • /
    • pp.19-30
    • /
    • 2023
  • 마이크로 모빌리티 중 하나인 전동킥보드의 이용은 세계적으로 급격히 성장하고 있는 추세이다. 국내에서는 2018년 서울에서 서비스를 시작한 킥고잉을 비롯하여 서울을 포함한 일부 대도시에서 공유킥보드 서비스를 제공하는 업체가 생기면서 전동킥보드의 이용이 크게 증가했다. 하지만, 전동킥보드의 이용은 여전히 주차, 안전에 대한 문제로 인해 논란의 대상이 되고 있다. 이동수단에 대한 인식은 사용자들이 어떤 이동수단을 선택할지에도 영향을 끼치므로 전동킥보드 이용 및 공유킥보드 서비스 활성화를 위해서는 관련 이슈와 그에 대한 대중의 인식을 파악할 필요가 있다. 이에 본 연구에서는 전동킥보드 관련 이슈에 대한 사회적 동향을 파악하는 것을 목표로 시간에 따른 이슈의 변동성을 고려해 동적 토픽 모델링과 감성 분석을 활용하여 2014년에서 2020년까지의 전동킥보드 관련 뉴스 기사를 분석하였다. 토픽 모델링을 통해 마이크로 모빌리티 기술, 공유킥보드 서비스, 킥보드 관련 규제 관련 토픽을 도출하였으며, 공유킥보드 서비스 증가와 함께 안전에 대한 이슈가 크게 불거지면서 킥보드에 대한 규제 관련 토픽의 비중이 최근 들어 크게 증가함을 확인했다. 그뿐만 아니라 감성 분석을 통해 킥보드 관련 뉴스에 주로 등장하는 긍정어는 신속, 즐기다, 손쉽다, 편리 등이 있고 부정어는 위협, 불법, 침해 등으로 나타나 킥보드나 공유킥보드 서비스의 편의성에는 만족하지만, 마이크로 모빌리티 서비스에서 안전, 주차 등의 문제는 여전히 해결해야하는 이슈임을 알 수 있었다. 결론적으로, 본 연구를 통해 전동킥보드에 대한 이슈와 그에 대한 관심과 사회적 감성의 변화를 확인하고 어떤 이슈에 대한 대응이 필요한지 파악할 수 있었다. 이 연구의 분석의 틀은 향후 다양한 사회 현안에 대한 사회적 동향을 파악하고 그에 대한 대응 방안을 마련하는데 활용할 수 있을 것으로 기대된다.

BERT를 활용한 속성기반 감성분석: 속성카테고리 감성분류 모델 개발 (Aspect-Based Sentiment Analysis Using BERT: Developing Aspect Category Sentiment Classification Models)

  • 박현정;신경식
    • 지능정보연구
    • /
    • 제26권4호
    • /
    • pp.1-25
    • /
    • 2020
  • 대규모 텍스트에서 관심 대상이 가지고 있는 속성들에 대한 감성을 세부적으로 분석하는 속성기반 감성분석(Aspect-Based Sentiment Analysis)은 상당한 비즈니스 가치를 제공한다. 특히, 텍스트에 속성어가 존재하는 명시적 속성뿐만 아니라 속성어가 없는 암시적 속성까지 분석 대상으로 하는 속성카테고리 감성분류(ACSC, Aspect Category Sentiment Classification)는 속성기반 감성분석에서 중요한 의미를 지니고 있다. 본 연구는 속성카테고리 감성분류에 BERT 사전훈련 언어 모델을 적용할 때 기존 연구에서 다루지 않은 다음과 같은 주요 이슈들에 대한 답을 찾고, 이를 통해 우수한 ACSC 모델 구조를 도출하고자 한다. 첫째, [CLS] 토큰의 출력 벡터만 분류벡터로 사용하기보다는 속성카테고리에 대한 토큰들의 출력 벡터를 분류벡터에 반영하면 더 나은 성능을 달성할 수 있지 않을까? 둘째, 입력 데이터의 문장-쌍(sentence-pair) 구성에서 QA(Question Answering)와 NLI(Natural Language Inference) 타입 간 성능 차이가 존재할까? 셋째, 입력 데이터의 QA 또는 NLI 타입 문장-쌍 구성에서 속성카테고리를 포함한 문장의 순서에 따른 성능 차이가 존재할까? 이러한 연구 목적을 달성하기 위해 입력 및 출력 옵션들의 조합에 따라 12가지 ACSC 모델들을 구현하고 4종 영어 벤치마크 데이터셋에 대한 실험을 통해 기존 모델 이상의 성능을 제공하는 ACSC 모델들을 도출하였다. 그리고 [CLS] 토큰에 대한 출력 벡터를 분류벡터로 사용하기 보다는 속성카테고리 토큰의 출력 벡터를 사용하거나 두 가지를 함께 사용하는 것이 더욱 효과적이고, NLI 보다는 QA 타입의 입력이 대체적으로 더 나은 성능을 제공하며, QA 타입 안에서 속성이 포함된 문장의 순서는 성능과 무관한 점 등의 유용한 시사점들을 발견하였다. 본 연구에서 사용한 ACSC 모델 디자인을 위한 방법론은 다른 연구에도 비슷하게 응용될 수 있을 것으로 기대된다.

신문기사에 나타난 장애인스포츠에 대한 인식 -의미연결망을 활용한 빅데이터 분석- (Perceptions of Disabled Sports in Newspapers Using Semantic Networks Analysis)

  • 한민규;김원경;윤지운
    • 재활복지
    • /
    • 제20권4호
    • /
    • pp.157-175
    • /
    • 2016
  • 본 연구의 목적은 텍스트 빅데이터 분석의 일종인 의미연결망을 활용하여 신문기사에서 나타나는 장애인스포츠에 대한 인식을 알아보는 것이 목적이다. 이 목적을 위하여 '장애인스포츠'를 검색어로 네이버 포탈을 이용하여 21개 언론사 745건의 기사를 수집하였으며 Krkwic 소프트웨어 프로그램을 사용하여 자료정제와 공출현 빈도를 산출하였다. 장애인스포츠에 대한 인식은 Netminer 4.0을 활용하여 연결중앙성, 매개중앙성, 위세중앙성을 지표로 분석하였다. 의미연결망 분석을 통하여 얻은 결과는 다음과 같다. 첫째, 신문기사에서 나타난 장애인스포츠를 규정하는 핵심단어는 감동, 도전, 축제, 꿈, 희망이다. 그리고 장애인스포츠의 인식을 나타내는 핵심단어는 장애유형에 따라 차이가 있다. 둘째, 장애인스포츠에 대한 인식을 장애유형별로 구분하여 분석한 결과 크게 경기력관련 인식과 감성관련 인식으로 구분할 수 있다. 구체적으로 지체장애 스포츠 대상의 경기력관련 인식은 패럴림픽, 로봇, 감동 등이며 감성관련 인식은 행복, 희망 등이다. 지적장애 스포츠 대상의 경기력관련 인식은 패럴림픽, 스페셜올림픽, 축제 등이고 감성관련 인식은 사랑, 감동 등이다. 시각장애 스포츠 대상의 경기력관련 인식은 메달, 달리기 등이며 감성관련 인식은 희망, 나눔 등이다. 결론적으로 신문기사에서 나타나는 장애인스포츠에 대한 인식은 패럴림픽, 스페셜올림픽 등의 장애인스포츠 경기대회는 장애인들의 도전과 꿈을 이룰 수 있는 축제의 장이며 경기를 통해 일반대중들에게 감동을 선사한다고 의미화 할 수 있다.

치킨 리뷰의 이면: 텍스트 마이닝을 통한 리뷰의 탐색적 분석을 중심으로 (BEHIND CHICKEN RATINGS: An Exploratory Analysis of Yogiyo Reviews Through Text Mining)

  • 김준겸;최은솔;윤수현;이유빈;김동환
    • 한국콘텐츠학회논문지
    • /
    • 제21권11호
    • /
    • pp.30-40
    • /
    • 2021
  • 코로나 19의 영향으로 배달앱 시장이 빠르게 성장하며, 리뷰와 평점이 더욱 중요해지고 있다. 그러나 급격하게 늘어난 리뷰와 평점의 신뢰도에 의문이 제기되고 있다. 따라서 본 연구는 리뷰와 평점을 탐색적으로 분석하여 배달앱 리뷰의 신뢰도와 유용성을 파악하고, 이를 높일 방법을 탐구하였다. 텍스트 마이닝 기법을 사용하여 도출한 결과는 다음과 같다. 첫째, 요기요와 네이버 지도, 구글 지도의 음식점 평점을 분석한 결과, 요기요는 가장 우편향된 평점 분포를 보여주었다. 둘째, 요기요의 세부 평점 요인(맛, 양, 배달)간에는 모두 강한 양의 상관관계가 있었고, 이는 부정 리뷰의 단어 분석에서도 드러났다. 셋째, 리뷰의 극성에 따라 사용되는 품사와 형태소의 비율이 달랐다. 넷째, 전체 리뷰 데이터에서 367개의 부정어를 선별한 후, 이를 분류하여 치킨 전용 부정어 사전을 제작하였다. 본 연구는 치킨 리뷰의 탐색적 분석을 통해 앞으로 배달앱 리뷰에 대한 연구가 나아가야 할 방향을 제시하였다.

의료 산업에 있어 현대인의 비대면 의학 상담에 대한 관심도 분석 기법 (Analysis of interest in non-face-to-face medical counseling of modern people in the medical industry)

  • 강유성;박종훈;오하영;이세욱
    • 한국정보통신학회논문지
    • /
    • 제26권11호
    • /
    • pp.1571-1576
    • /
    • 2022
  • 코로나 바이러스의 발병 이후, 의료 산업은 침체기에 들어섰으며, 이에 대한 대응책으로 정부는 일시적으로 비대면 진료를 허용한 상태이다. 본 연구에서는, 이런 시대 흐름에 맞추어 의료 산업에 있어 현대인의 비대면 의학상담에 대한 관심도를 분석하고자 한다. 전문가에게 의학상담을 받을 수 있는 플랫폼인 지식인과, 유튜브 두가지 소셜 플랫폼에서 빅데이터를 수집해 연구를 진행했다. 전화 상담 상위 5개 키워드인 "내과", "일반의", "산경과", "정신건강의학과", "소아청소년과"와 더불어, "전문의", "의학상담", "건강정보" 총 8개의 검색어를 가지고 각 플랫폼으로부터 데이터 세트를 구축했다. 이후 크롤링 된 데이터를 바탕으로 형태소 분류, 질병 추출, 정규화 등 전처리 과정을 거쳤다. 단어 빈도수를 기준으로 한 워드 클라우드, 꺾은선 그래프, 분기별 그래프, 질병 등장 빈도별 막대 그래프 등으로 데이터 시각화를 하였다. 유튜브 데이터에 한해 감성 분류 모델을 구축하였고, GRU와 BERT 기반 모델의 성능을 비교하였다.

음악의 분위기와 폭소노미 태그의 관계 분석 (Analysis of Association between Mood of Music and Folksonomy Tag)

  • 문창배;김현수;장영완;김병만
    • 감성과학
    • /
    • 제16권1호
    • /
    • pp.53-64
    • /
    • 2013
  • 폭소노미는 폭소노미에 사용되는 태그에 대하여 유사어, 태깅 레벨, 신조어등의 문제점들이 있다. 본 연구자들은 이러한 문제점들을 해결하기 위해 음악의 분위기 강도(Arousal과 Valence의 강도)를 음악의 내부 태그로 활용하는 방법을 사용하고자 한다. 즉, A(Arousal)값과 V(Valence)값을 이용하여 음악의 분위기를 수치적으로 표현하고, 분위기 태그도 AV값으로 대응시켜 검색하게 되면 태그가 일치하지 않더라도 유사한 AV 값을 갖는 음악이 검색되어 결과적으로 분위기가 유사한 음악들을 검색할 수 있게 된다. 본 논문에서는 이의 선행연구로 AV값과 폭소노미 태그와의 관계를 정의하는 매핑테이블을 제안하고, 태그와 AV값의 연관 관계를 분석하기 위해 유명한 음악 검색 사이트인 last.fm에서 수집한 테스트 데이터에 대해 ANOVA 검증을 하였다. 검증결과, A값과 V값에 모두에 대하여 제 1종 오류확률 P가 0.0으로 귀무가설을 기각하고 대립가설을 채택할 수 있었다. 결론적으로 폭소노미 태그에 따라 AV 값 분포가 다르다는 것을 검증 할 수 있었다.

  • PDF

인공지능 검색 서비스 활용에 따른 서비스 사용성 평가: 네이버 앱을 중심으로 (Usability Evaluation of Artificial Intelligence Search Services Using the Naver App)

  • 황신희;주다영
    • 감성과학
    • /
    • 제22권2호
    • /
    • pp.49-58
    • /
    • 2019
  • 4차 산업 혁명 시대에 인공지능은 IT 기업을 중심으로 기업들의 핵심 사업 전략이 되고 있다. 그리고 국내외 주요 포탈 기업들 또한, 인공지능 기반의 검색 서비스를 출시하고 있다. 인공지능 검색 서비스는 이미지 음성과 같은 비정형 데이터를 활용하며 검색 패러다임을 확장시켰다. 하지만 기존의 텍스트 기반의 검색 서비스와 다른 인터페이스를 제공한다. 익숙하지 않은 인터페이스는 서비스의 사용성을 저해할 수 있는 요소로, 인공지능 검색 서비스를 이용에 따른 사용성에 변화를 알아볼 필요가 있다. 본 연구는 네이버앱 8.9.3 베타버전을 사례로 인공지능 검색 서비스를 실험한다. 실험은 네이버앱 사용 경험이 있는 20대와 30대 30명을 대상으로, 네이버앱의 인공지능 검색 서비스인 스마트 렌즈, 스마트 보이스, 스마트 어라운드, AiRS 추천 콘텐츠의 사용성을 기존의 네이버앱 검색과 비교하여 평가한다. 실험분석 결과, 기존의 네이버앱 검색과 비교하여 통계적으로 유의미한 사용성 변화가 있는 것으로 나타났다. 스마트 렌즈, 스마트 보이스, 스마트 어라운드는 양(+)의 상관관계가, AiRS 추천 콘텐츠는 음(-)의 상관관계가 있었다. 본 연구는 인공지능 검색 서비스를 적용에 따른 사용성 변화를 평가하고 분석한 것으로, 추후 인공지능을 활용한 서비스의 사용성 평가 연구에 유용한 자료가 될 것으로 기대한다.

빅데이터 분석을 위한 한국어 SentiWordNet 개발 방안 연구 : 분노 감정을 중심으로 (The Study of Developing Korean SentiWordNet for Big Data Analytics : Focusing on Anger Emotion)

  • 최석재;권오병
    • 한국전자거래학회지
    • /
    • 제19권4호
    • /
    • pp.1-19
    • /
    • 2014
  • 빅데이터 내에 존재하는 감정 정보를 추출하여 사용자들이 특정 대상에 대하여 갖고 있는 인식이 어떠한지를 파악하고자 하는 노력이 활발히 이루어지고 있다. 상품, 영화, 그리고 사회적 이슈 등에 대한 문장을 분석하여 사람들이 해당 주제에 어떠한 견해를 가지고 있는지를 분석하고 측정하여 구체적인 선호도를 알아내는 것이다. 문장에서 드러나는 감정 정도를 얻기 위해서는 감정어휘의 목록과 정도값을 제시할 수 있는 감정어휘사전이 필요하므로 본 연구에서는 감정어휘를 발견하는 방법과 이들의 정도값을 결정하는 문제를 다룬다. 기본적인 방법은 기초 감정어휘의 목록 수집과 이들의 정도값은 선행연구 결과와 직접 설문 방식을 이용하고, 확장된 목록의 수집과 정도값은 사전의 표제어 설명부(glosses)를 이용해 추론하는 것이다. 그 결과 발견된 감정어휘는 전형성을 띠고 있는 기본형 감정어휘, 기본형 감정어휘의 gloss에 사용된 확장형 1단계 1층위 감정어휘, 비 감정어휘 중 gloss에 기본형 또는 확장형 감정어휘를 가지고 있는 확장형 2단계 1층위 감정어휘, gloss의 gloss에 기본형 또는 확장형 감정어휘가 사용된 확장형 2단계 2층위 감정어휘의 네 종류로 나뉜다. 그리고 확장형 감정어휘의 정도값은 기본형 감정어휘의 정도값을 기초로 문형의 가중치와 강조승수를 적용하여 얻었다. 실험 결과 AND, OR 문형은 내포된 어휘의 감정 정도값을 평균내는 가중치를, Multiply 문형은 정도 부사어의 종류에 따라 1.2~1.5의 가중치를 갖는 것으로 파악되었다. 또한 NOT 문형은 사용된 어휘의 감정 정도를 일정 정도로 낮추어 역전시키는 것으로 추정된다. 또한 확장형 어휘에 적용되는 강조승수는 1층위에서 2, 2층위에서 3을 갖는 것으로 예상된다.

Web 2.0 블로그 위젯의 재미 요소에 대한 연구 (A Study on Fun Elements of Web 2.0 Blog Widget)

  • 최성규;김기성;장석현;황민철
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.785-790
    • /
    • 2009
  • 웹 2.0환경에 중심이 되고 있는 블로그 사용자들에게 있어 웹 브라우저에서 실행될 수 있는 위젯(widget)은 자신을 표현하고, 블로그의 가치를 돋보이게 하는 도구이다. 위젯은 윈도우(Window)와 가젯(Gadget)의 합성어로 응용 프로그램을 동작시키고 결과를 화면에 표시하는 그래픽 사용자 인터페이스(GUI) 도구의 일종으로써 사용자가 원하는 서비스를 받아 볼 수 있는 기능성 프로그램이다. 또한 운영 제체(OS)나, 웹, 모바일에서 사용자에게 정보 전달 및 사용 편리성과 효율성을 제공하고 있다. 그러나 현재 위젯은 정보 전달이나 현상 표현에 초점을 마주고 있어, 사용자들이 원하는 재미를 충족시켜주지 못하고 있다. 이 연구는 웹 2.0 환경에서 사용자가 많이 사용하고 있는 위젯의 재미와 흥미를 느끼는 요소가 무엇인지를 파악하고, 위젯별 재미 요소를 분류 하고자 하는 연구이다. 위젯에서의 재미 요소에 대해 아직까지 정의된 것이 없기 때문에 제품 디자인과 게임에서의 재미 요소를 분류 및 분석을 통해 추출 하였고 추출된 결과를 사용자의 감성 상태를 대표하는 감성 어휘와 매핑을 통해 파악하였다. 그리고 위젯별 재미 요소를 알아내기 위해 블로그 사용자를 대상으로 온라인 설문을 실시하였다. 위젯 선정은 사용자가 많이 이용하고 있는 국내 위젯과 일본 위젯으로 선택하였고 5점 척도를 이용해 위젯별 재미 요소를 분류하였다. 이 결과를 바탕으로 사용자가 선호하는 재미 요소를 파악할 수 있다.

  • PDF

어미변화를 고려한 감성 구문 패턴을 이용한 상품평 의견 분류 (Opinion Mining of Product Reviews using Sentiment Phrase Patterns considered the Endings of Declinable Words)

  • 김정호;차명훈;김명규;채수환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.285-290
    • /
    • 2010
  • 인터넷이 대중화됨에 따라 누구나 쉽게 자신의 의견을 온라인상에 표현할 수 있게 되었다. 그 결과 생각이나 느낌을 나타내는 의견 데이터들의 양이 급속도로 방대해졌으며, 이러한 데이터들을 이용한 여러 응용 사례들의 등장으로, 효율적인 검색 및 자동 분류 기술이 요구되고 있다. 이런 기술적 흐름에 맞추어 의견 데이터 분류에 관한 여러 연구들이 이루어져 왔다. 이러한 의견 분류에 대한 연구들을 살펴보면, 분류를 위해 자질(Feature)로서 사용한 단일어(Single word)가 아닌 2개 이상의 N-gram 단어, 어휘 구문 패턴 및 통사 구문 패턴 등을 사용한다. 특히, 패턴은 단일어나 N-gram 단어에 비해 유연하고, 언어학적으로 풍부한 정보를 표현할 수 있기 때문에 이를 주요 연구 주제로 사용되었다. 그럼에도 불구하고, 이러한 연구들은 주로 영어에 대한 연구들이었으며, 한국어에 패턴을 적용하여 주관성을 갖는 문장을 분류하거나, 극성을 분류하는 연구들은 아직 미비하다. 한국어의 특색으로 한국어는 용언의 활용이 발달되어 있어, 어미의 변화가 다양하며, 그 변화에 따라 의미가 미묘하게 변화한다. 그러나 기존 한국어에 대한 의견 분류 연구들은 단어의 핵심 의미만을 파악하기 위해 어미 부분을 제거하고 어간만을 취해서 처리하여 어미에 대한 의미변화를 고려하지 못하므로 분류 정확도가 영어권에 연구 결과에 비해 떨어진다. 그래서 본 연구는 영어에 적용된 패턴을 이용한 기존 방법들을 정리하고, 그 방법들 중에서 극성을 지닌 문장성분 패턴을 한국어에 적용하였다. 그리고 어미의 변화에 대한 패턴을 추출하여 이 변화가 의견 분류의 성능에 미치는 영향을 분석하였다.

  • PDF