• 제목/요약/키워드: 언어 감성 분석

검색결과 151건 처리시간 0.026초

자동 지표화를 위한 감성공학 분야 코퍼스 분석- 전문적 문서의 특성 정보 추출 (Analysis of Human Sensibility Ergonomic Corpora for Automatic Indexation - Extraction of informative features -)

  • 배희숙;김관웅;곽현민;이상태
    • 한국감성과학회:학술대회논문집
    • /
    • 한국감성과학회 2002년도 추계학술대회 논문집
    • /
    • pp.53-58
    • /
    • 2002
  • 본 논문은 감성공학 데이터의 지속적인 지표화를 위해 과정의 자동화를 제안하며 자동 지표화가 문서의 자동 요약과 유사하다는 점에 착안하여 문서 자동분류, 정보유형 추출, 특성언어 추출 및 문장 재구성이라는 단계별 기술의 기초가 되는 정보유형 및 핵심어, 그리고 특성표현을 통한 정보문 추출 방법에 대해 연구하였다. 감성공학 코퍼스 분석을 통한 본 연구는 감성공학 분야에서의 지식 관리 시스템과 자동 요약 시스템에 활용될 수 있다.

  • PDF

화장품 후기글의 자질기반 감성분석을 위한 다단어 표현의 유한그래프 사전 및 문법 구축 (Building Korean Multi-word Expression Lexicons and Grammars Represented by Finite-State Graphs for FbSA of Cosmetic Reviews)

  • 황창회;유광훈;최성용;신동혁;남지순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.400-405
    • /
    • 2018
  • 본 연구는 한국어 화장품 리뷰 코퍼스의 자질기반 감성 분석을 위하여, 이 도메인에서 실현되는 중요한 다단어 표현(MWE)의 유한상태 그래프 사전과 문법을 구축하는 방법론을 제시하고, 실제 구축된 사전과 문법의 성능을 평가하는 것을 목표로 한다. 본 연구에서는 자연어처리(NLP)에서 중요한 화두로 논의되어 온 MWE의 어휘-통사적 특징을 부분문법 그래프(LGG)로 형식화하였다. 화장품 리뷰 코퍼스에 DECO 한국어 전자사전을 적용하여 어휘 빈도 통계를 획득하고 이에 대한 언어학적 분석을 통해 극성 MWE(Polarity-MWE)와 화제 MWE(Topic MWE)의 전체 네 가지 하위 범주를 분류하였다. 또한 각 모듈간의 상호관계에 대한 어휘-통사적 속성을 반복적으로 적용하는 이중 증식(double-propagation)을 통해 자원을 확장하였다. 이 과정을 통해 구축된 대용량 MWE 유한그래프 사전 DECO-MWE의 성능을 테스트한 결과 각각 0.844(Pol-MWE), 0.742(Top-MWE)의 조화평균을 보였다. 이를 통해 본 연구에서 제안하는 MWE 언어자원 구축 방법론이 다양한 도메인에서 활용될 수 있고 향후 자질기반 감성 분석에 중요한 자원이 될 것임을 확인하였다.

  • PDF

Zero-shot Korean Sentiment Analysis with Large Language Models: Comparison with Pre-trained Language Models

  • Soon-Chan Kwon;Dong-Hee Lee;Beak-Cheol Jang
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권2호
    • /
    • pp.43-50
    • /
    • 2024
  • 본 논문은 GPT-3.5 및 GPT-4와 같은 대규모 언어 모델의 한국어 감성 분석 성능을 ChatGPT API를 활용한 zero-shot 방법으로 평가하고, 이를 KoBERT와 같은 사전 학습된 한국어 모델들과 비교한다. 실험을 통해 영화, 게임, 쇼핑 등 다양한 분야의 한국어 감성 분석 데이터셋을 사용하여 모델들의 효율성을 검증한다. 실험 결과, LMKor-ELECTRA 모델이 F1-score 기준으로 가장 높은 성능을 보여주었으며, GPT-4는 특히 영화 및 쇼핑 데이터셋에서 높은 정확도와 F1-score를 기록하였다. 이는 zero-shot 학습 방식의 대규모 언어 모델이 특정 데이터셋에 대한 사전 학습 없이도 한국어 감성 분석에서 높은 성능을 발휘할 수 있음을 시사한다. 그러나 일부 데이터셋에서의 상대적으로 낮은 성능은 zero-shot 기반 방법론의 한계점으로 지적될 수 있다. 본 연구는 대규모 언어 모델의 한국어 감성 분석 활용 가능성을 탐구하며, 이 분야의 향후 연구 방향에 중요한 시사점을 제공한다.

블룸 필터를 이용한 감성 웹 문서 크롤링 알고리즘 (A Bloom filter-based Sentiment-aware Web Crawling Algorithm)

  • 나철원;온병원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.69-74
    • /
    • 2018
  • 최근 빅 데이터와 인공지능의 발달과 함께 감성 분석에 대한 연구가 활발해지고 있다. 더불어 감성 분석을 위한 긍/부정 어휘가 풍부한 텍스트 문서들에 대한 수집의 필요성도 높아지고 있다. 본 논문은 긍/부정어휘가 풍부한 텍스트 문서들을 수집하는 기존의 수집 방법에 대한 문제점에 대하여 해결방안을 제시한다. 기존의 수집 방법으로 일단 모든 URL들을 저장하고 필터링 과정을 거쳐 긍/부정 어휘가 풍부한 텍스트 문서들을 수집하고자 한다면 불필요한 텍스트 문서 저장과 필터링 과정에서 메모리와 시간을 낭비하게 된다. 기존의 수집 방법에 블룸 필터라는 자료구조를 적용시켜 메모리와 시간을 낭비하게 되는 문제점을 해결하고자 한다.

  • PDF

영어 SentiWordNet을 이용하여 구축한 한국어 감성어휘사전의 성능 평가와 한계 연구 (Performance and Limitations of a Korean Sentiment Lexicon Built on the English SentiWordNet)

  • 신동혁;김새롬;조동희;뉘엔 민디오;박순강;어건주;남지순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.189-194
    • /
    • 2016
  • 본 연구는 다국어 감성사전 및 감성주석 코퍼스 구축 프로젝트인 MUSE 프로젝트의 일환으로 한국어 감성사전을 구축하기 위해 대표적인 영어 감성사전인 SentiWordNet을 이용하여 한국어 감성사전을 구축하는 방법의 의의와 한계점을 검토하는 것을 목적으로 한다. 우선 영어 SentiWordNet의 117,659개의 어휘중에서 긍정/부정 0.5 스코어 이상의 어휘를 추출하여 구글 번역기를 이용해 자동 번역하는 작업을 실시하였다. 그 중에서 번역이 되지 않거나, 중복되는 경우를 제거하고, 언어학 전문가들의 수작업으로 분류해 낸 결과 3,665개의 감성어휘를 획득할 수 있었다. 그러나 이마저도 병명이나 순수 감성어휘로 보기 어려운 사례들이 상당수 포함되어 있어 실제 이를 코퍼스에 적용하여 감성어휘를 자동 판별했을 때에 맛집 코퍼스에서의 재현율(recall)이 긍정과 부정에서 각각 47.4%, 37.7%, IT 코퍼스에서 각각 55.2%, 32.4%에 불과하였다. 이와 더불어 F-measure의 경우, 맛집 코퍼스에서는 긍정과 부정의 값이 각각 62.3%, 38.5%였고, IT 코퍼스에서는 각각 65.5%, 44.6%의 낮은 수치를 보여주고 있어, SentiWordNet 기반의 감성사전은 감성사전으로서의 역할을 수행하기에 충분하지 않은 것으로 나타났다. 이를 통해 한국어 감성사전을 구축할 때에는 한국어의 언어적 속성을 고려한 체계적인 접근이 필요함을 역설하고, 현재 한국어 전자사전 DECO에 기반을 두어 보완 확장중인 SELEX 감성사전에 대해 소개한다.

  • PDF

fMRI를 이용하여 지적능력에 따른 뇌 신경망 규명 : 언어능력 vs 공간지각능력 (Brain neural networks based on individual's verbal and visuospatial abilities)

  • 이경화;박세훈;김연희;손진훈
    • 한국감성과학회:학술대회논문집
    • /
    • 한국감성과학회 2001년도 춘계학술대회 논문집
    • /
    • pp.175-181
    • /
    • 2001
  • 본 연구의 목적은 사람들이 언어과제와 공간지각과제을 수행하는 동안 활성화되는 뇌 영역의 차이를 규명하는 것이다. 428명의 대학생을 대상으로 집단 심리실험을 수행하여, fMRI 연구를 위한 실험참여자로 17명의 오른손잡이 여대생을 선정하였다. 17명 중 8명은 언어능력은 뛰어나지만 공간지각능력이 떨어지고, 나머지 9명은 언어능력은 빈약하지만, 공간지각능력이 우수한 사람들이었다. fMRI 실험에 사용된 패러다임에는 언어과제와 공간지각과제가 각각 8block으로 구성되었으며, 각 block은 동일한 과제 3문항을 포함하였다. fMRI 이미징은 1.5T Siemens Vision Scanner로 수집되었으며, Single-shot EPI 기법으로 (TR/TE : 3840/40ms, flip angle : 90, FOV : 220, 64x64 matrix) 이미지를 스캔하였다. 자료분석은 SPM-99 소프트웨어를 사용하였다. 감산(subtraction)분석결과, 언어능력이 뛰어난 집단에서는 양측 대상회(bilateral cingulate gyri)와 좌측 상두정엽 (left superior parietal lobe)이 더 많이 활성화되었고, 언어능력이 떨어지는 집단에서는 양측 전두엽 (both frontal lobes)이 더 많이 활성화되었다. 공간지각능력이 떨어지는 집단에서는 우측 시상 (right thalamus)과 좌측 측-후두엽 (left temporooccipital)이 더 많이 활성화되었다. 언어능력이나 공간지각능력이 우수한 집단에서는 공통적으로 대상회 (cingulate gyri)가 활성화되었다.

  • PDF

병원간호사의 언어폭력 경험, 감정노동, 감성지능 및 사회적 지지와 이직의도와의 관계 (The Relation among Experience of Verbal Abuse, Emotional Labor, Emotional Intelligence, Social Support and Turnover Intention of Hospital Nurses.)

  • 박안나
    • 사물인터넷융복합논문지
    • /
    • 제4권2호
    • /
    • pp.29-46
    • /
    • 2018
  • 본 연구의 목적은 병원 간호사의 언어폭력 경험 정도를 파악하고 감정노동, 감성지능 및 사회적 지지가 이직의도에 미치는 영향을 파악하고자 실시되었다. 본 연구는 S시 소재 일개병원에 근무하는 간호사 189명을 대상으로 2015년 11월 17일부터 2015년 11월 27일까지 구조화된 설문지를 사용하여 각 병동과 외래, 특수부서들을 직접 방문하였으며, 수집된 자료는 SPSS (statisical Packageds for the Social Sciences) version 18 통계 분석 프로그램을 이용하여 분석하였다. 간호사의 언어폭력 경험, 감정노동, 감성지능, 사회적 지지 및 이직의도 간의 상관관계를 파악하기 위하여 상관관계분석을 실시한 결과 간호사의 이직 의도는 의사로부터의 언어폭력 경험, 간호사로부터의 언어폭력 경험, 환자·보호자로부터의 언어폭력 경험과 감정노동과는 유의미한 정적상관관계가 있는 것으로 나타났으며 감성지능과 사회적 지지와는 유의미한 부적상관관계가 있는 것으로 나타났다. 대상자의 이직의도에 영향을 미치는 요인을 확인하기 위해 단계별 다중회귀분석을 실시한 결과 통계적으로 유의한 영향을 미치는 변수는 감정노동으로 나타났고, 근무부서에서 응급실이 내과계 병동에 비해 이직의도가 낮은 것으로 나타났다.

영화평 감성 분석기를 대상으로 한 설명자의 성능 분석 (Performance Analysis of Explainers for Sentiment Classifiers of Movie Reviews)

  • 박천용;이공주
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.563-568
    • /
    • 2020
  • 본 연구에서는 블랙박스로 알려진 딥러닝 모델에 설명 근거를 제공할 수 있는 설명자 모델을 적용해 보았다. 영화평 감성 분석을 위해 MLP, CNN으로 구성된 딥러닝 모델과 결정트리의 앙상블인 Gradient Boosting 모델을 이용하여 감성 분류기를 구축하였다. 설명자 모델로는 기울기(gradient)을 기반으로 하는 IG와 레이어 사이의 가중치(weight)을 기반으로 하는 CAM, 그리고 설명가능한 대리 모델을 이용하는 LIME과 입력 속성에 대한 선형모델을 추정하는 SHAP을 사용하였다. 설명자 모델의 특성을 보기 위하여 히트맵과 관련성 높은 N개의 속성을 추출해 보았다. 설명자가 제공하는 기여도에 따라 입력 속성을 제거해 가며 분류기 성능 변화를 측정하는 정량적 평가도 수행하였다. 또한, 사람의 판단 근거와의 일치도를 살펴볼 수 있는 '설명 근거 정확도'라는 새로운 평가 방법을 제안하여 적용해 보았다.

  • PDF

RNN과 트랜스포머 기반 모델들의 한국어 리뷰 감성분류 비교 (Comparison of Sentiment Classification Performance of for RNN and Transformer-Based Models on Korean Reviews)

  • 이재홍
    • 한국전자통신학회논문지
    • /
    • 제18권4호
    • /
    • pp.693-700
    • /
    • 2023
  • 텍스트 문서에서 주관적인 의견과 감정을 긍정 혹은 부정으로 분류하고 식별하는 자연어 처리의 한 분야인 감성 분석은 고객 선호도 분석을 통해 다양한 홍보 및 서비스에 활용할 수 있다. 이를 위해 최근 머신러닝과 딥러닝의 다양한 기법을 활용한 연구가 진행되어 왔다. 본 연구에서는 기존의 RNN 기반 모델들과 최근 트랜스포머 기반 언어 모델들을 활용하여 영화, 상품 및 게임 리뷰를 대상으로 감성 분석의 정확도를 비교 분석하여 최적의 언어 모델을 제안하고자 한다. 실험 결과 한국어 말뭉치로 사전 학습된 모델들 중 LMKor-BERT와 GPT-3가 상대적으로 좋은 정확도를 보여주었다.

소셜 데이터의 주된 감성분석에 대한 연구 (Study on Principal Sentiment Analysis of Social Data)

  • 장필식
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권12호
    • /
    • pp.49-56
    • /
    • 2014
  • 본 논문에서는 대용량의 문서, 인터넷 댓글, 소셜 데이터, 메시지 텍스트 등으로부터 표준, 일상적 언어, 및 은어(隱語), 비속어, 약어, 이모티콘 등을 감성 분석함으로써, 복합적인 감성 중 근간이 되는 주 감성들을 측정하고 평가하는 방법을 제안한다. 제안된 방법론은 IRLBA(Implicitly Restarted Lanczos Bidiagonalization Algorithm)을 활용하여 규모가 큰 희소행렬에 대한 주성분분석을 실시하며, 데이터 취합, 메시지 분석, 감성 평가, 감성 분석 및 통합 그리고 결과물 시각화 모듈로 구성된다. 본 연구를 통해 제안된 방법론은 소셜 데이터의 감성분석의 정확도를 향상시키고 감성분석의 활용범위를 확장시키는데 있어 도움을 줄 수 있을 것으로 기대된다.