• 제목/요약/키워드: 감정동사

검색결과 19건 처리시간 0.021초

종자 어휘를 이용한 자질 추출과 지지 벡터 기계(SVM)을 이용한 문서 감정 분류 시스템의 개발 (A Sentiment Classification System Using Feature Extraction from Seed Words and Support Vector Machine)

  • 황재원;전태균;고영중
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2007년도 학술대회 1부
    • /
    • pp.938-942
    • /
    • 2007
  • 신문 기사 및 상품 평은 특정 주제나 상품을 대상으로 하여 글쓴이의 감정과 의견이 잘 나타나 있는 대표적인 문서이다. 최근 여론 조사 및 상품 의견 조사 등 다양한 측면에서 대용량의 문서의 의미적 분류 및 분석이 요구되고 있다. 본 논문에서는 문서에 나타난 내용을 기준으로 문서가 나타내고 있는 감정을 긍정과 부정의 두 가지 범주로 분류하는 시스템을 구현한다. 문서 분류의 시작은 감정을 지닌 대표적인 종자 어휘(seed word)로부터 시작하며, 자질의 선정은 한국어 특징상 감정 및 감각을 표현하는 명사, 형용사, 부사, 동사를 대상으로 한다. 가중치 부여 방법은 한글 유의어 사전을 통해 종자 어휘의 의미를 확장하여 각각의 가중치를 책정한다. 단어 벡터로 표현된 입력 문서를 이진 분류기인 지지벡터 기계를 이용하여 문서에 나타난 감정을 판단하는 시스템을 구현하고 그 성능을 평가한다.

  • PDF

강건한 한국어 상품평의 감정 분류를 위한 패턴 기반 자질 추출 방법 (A Robust Pattern-based Feature Extraction Method for Sentiment Categorization of Korean Customer Reviews)

  • 신준수;김학수
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권12호
    • /
    • pp.946-950
    • /
    • 2010
  • 기계 학습 기반의 많은 감정 분류 시스템들은 문장으로부터 언어적 자질을 추출하기 위하여 형태소 분석기를 사용한다. 그러나 온라인 상품평에는 많은 띄어쓰기 오류 및 철자 오류가 포함되어 있어서 일반적으로 형태소 분석기가 좋은 성능을 내기 어려우며, 기반 시스템의 낮은 성능은 감정 분류 시스템의 성능하락을 초래한다. 이러한 문제를 해결하기 위하여 본 논문에서는 어절 패턴과 음운 패턴의 최장 일치 매칭(matching)에 기반한 자질 추출 방법을 제안한다. 두 종류의 패턴은 대용량의 품사 부착 말뭉치로부터 자동으로 구축된다. 어절 패턴은 영사, 동사와 같은 내용어를 포함하는 어절들로 구성되며, 음운 패턴은 동사나 형용사와 같은 용언의 초성과 중성의 쌍으로 구성된다. 음운 패턴에 초성과 중성만을 사용한 이유는 철자 오류에 영향을 덜 받기 때문이다. 제안 방법을 평가하기 위하여 SVM(Support Vector Machine)을 기계 학습기로 사용하는 감정 분류 시스템을 구현하였다. 한국어 상품평에 대한 실험에서 제안 방법을 자질 추출 모듈로 사용하는 감정 분류 시스템이 형태소 분석기를 사용하는 것보다 우수한 성능을 보였다.

전국 개별토지가격 산정완료

  • 건설부
    • 주택과사람들
    • /
    • 통권14호
    • /
    • pp.66-67
    • /
    • 1991
  • [ $\circ$ ] 정부는 관계부터 합동으로 3.11부터 조사에 착수한 약 2,500만필지에 대한 개별토지가격 조사작업을 5.4(55일간)에 끝내고 지방토지평가위원회의 심의에 들어갔다. (건설부, 국세청, 지방자치단체공무원 20,500여명과 자문요원인 486명의 감정평가사 동원) $\circ$ 이번에 조사된 개별토지가격은 오는 5.20까지 지방 토지 평가 위원회의 심의를 거쳐 5.22부터 6.11까지 토지 소재지 읍$\cdot$$\cdot$동사무소에서 주민열람을 실시케 하고 토지 소유자 및 이해관계인은 조사된 지가에 대하여 이의가 있을 경우에는 의견을 제출할 수 있도록 하였으며, $\circ$ 또한 지가산정의 공평성과 정확성을 기하기 위하여 해당 지역 사정에 정통한 지역인사로 구성된 읍$\cdot$$\cdot$동 지가심의회의 심의를 거친 후, 감정평가사, 한국감정원 직원, 토지 및 세무담당공무원 등 전문가로 구성된 시$\cdot$$\cdot$읍 단위 지방토지평가위원회에서 심의하도록 하였으며, 이러한 절차를 거친 후 중앙토지평가위원회의 심의와 건설부장관의 확인을 받아 6.29까지 시장, 군수, 구청장이 지가를 결정하게 된다. $\circ$ 이렇게 하여 결정된 지가는 토지초과이득세, 양도소득세, 증여세, 상속세 등의 산정기준, 택지초과소유부담금 및 개발부담금의 산정기준, 종합토지세의 과세표준 결정자료, 기타 토지공개념관련제도 시행을 위한 지가산정기준 등으로 활용된다.

  • PDF

정신적 건강 서비스를 위한 감성구를 활용한 주관적 웰빙 지수 측정 방법론 (A Methodology of Measuring Degree of Contextual Subjective Well-Being Using Affective Predicates for Mental Health Aware Service)

  • 권오병;최석재
    • 지능정보연구
    • /
    • 제17권3호
    • /
    • pp.1-23
    • /
    • 2011
  • 상황인식 컴퓨팅 사용자의 상황적이고 주관적 웰빙(SWB) 측정은 그에 맞는 정신건강 추천, 특히 대사증후군이나 우울증을 위한 추천에 매우 도움이 될 것이다. 현존하는 자가 진단식 측정법이나 자가 센싱 방법이 주관적 웰빙정보를 모니터링 하는데 제안되고 있음에도 불구하고 시의 적절한 서비스를 제공하지 못하여 상황인식 서비스로 쓰이기에는 부적합하다. 따라서 본 논문의 목적은 상황적이고 주관적 웰빙을 추정하는 방법을 제안하는 것이다. 이 방법은 사용자가 남기는 응답 글로부터 상황 자료를 획득하기 때문에 매우 적시적이며 따라서 그때마다의 감정 상태를 파악할 수 있다. 특히 본 연구에서는 온라인 대화나 기타 텍스트 기반의 의사소통에서 노출되는 분노심 등 부정적 감정에 관련된 감정동사와 정도 부사에 초점을 두어 측정한다. 제안된 상황적이고 주관적 웰빙 추정 방법을 기반으로 하여 웰빙 생활을 위한 추천 시스템을 개발하고자 한다. 이러한 아이디어의 실현가능성을 보이기 위하여 실제 운전자들을 대상으로 제안 방법이 얼마나 실제 감정을 잘 추론하는지에 대해 실험을 수행하였다.

웨어러블 컴퓨터의 인터페이스를 위한 사용자 행동의 의미추출과 적용가능성에 관한 연구 (A Study on the Extraction of the Meaning in the User Behavior and the Possibility to Apply for the Interface of the Wearable Computer)

  • 권숙경;정지홍
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 2부
    • /
    • pp.112-117
    • /
    • 2006
  • 웨어러블 컴퓨터는 사용자를 중심으로 의복과 기술이 결합된 기기로서 직관적이며 유연한 인터페이스가 요구된다. 현재 직관적인 입력방식으로 음성인식과 동작인식에 대한 연구가 활발하게 진행되고 있다. 동작인식의 경우 손동작을 이용한 장갑형태가 가장 많으며, 대부분 사용자 행동의 의미를 고려하지 않은 인위적인 제스처로 학습을 필요로 한다. 본 연구에서는 사용자가 일상적으로 하는 행동에서 의미를 추출하고, 웨어러블 컴퓨터의 인터페이스로서 적용가능성을 보고자 한다. 행동은 자극에 대한 신체의 움직임이다. 문헌을 통하여 신체의 움직임에 대한 66개의 동사를 추출하고 구체적인 움직임에 구문조사를 실시하였다. 조사된 구문에 대한 상황과 의미를 조사한 결과 행동은 의미에 따라 감정표현, 의사전달, 정보교류, 자기제어, 기기제어, 무의식적, 의례적의 7가지로 분류할 수 있었다. 그 중 의사소통과 대상을 제어하기 위한 행동을 중심으로 접근하였다. 행동의 의미와 현재 사용되고 있는 UI의 의미를 비교하여 인터페이스를 대응시켜 보았다.

  • PDF

정보탐색과정(ISP)에 의한 스캐폴딩 전략 모형 개발 (Development of Scaffolding Strategies Model by Information Search Process (ISP))

  • 임정훈
    • 한국도서관정보학회지
    • /
    • 제54권1호
    • /
    • pp.143-165
    • /
    • 2023
  • 본 연구에서는 학습 과정의 중재 역할에 대한 설계 및 구현 전략을 제시한 Kuhlthau의 ISP 모형을 활용하여 정보탐색과정에 적용할 수 있는 스캐폴딩 전략을 제안하고자 하였다. 이를 위해 관련 문헌을 검토하여 스캐폴딩 전략을 범주화하고, 대전지역의 중학생 150명을 대상으로 ISP 모형 기반의 스캐폴딩 전략을 적용한 프로젝트 수업을 시행한 후, 이에 대한 소감문 텍스트를 수집하였다. 수집된 자료는 전처리 과정을 거쳐 분석에 적합한 형태로 가공한 후 단어 빈도를 추출하고, STM(Structural Topic Modeling)을 활용하여 토픽 분석을 수행하였다. 먼저, 최적의 토픽 개수를 결정하고 ISP 모형 각 단계별로 토픽을 추출한 후 추출된 토픽을 인지적 영역-거시적 관점, 인지적 영역-미시적 관점, 정서적 영역 관점의 3가지 유형으로 구분하였다. 이 과정에서 텍스트마이닝을 통해 추출한 단어 가운데 인지동사와 감정동사를 중점적으로 살펴보았으며, 대표 문서 사례를 검토하여 각 토픽과 관련된 스캐폴딩 전략 모형을 제시하였다. 본 연구의 결과를 토대로 정보탐색과정(ISP) 단계에서 적절한 스캐폴딩 전략이 제공된다면, 학습자들의 자기 주도적 과제해결에 긍정적인 영향을 기대할 수 있을 것이다.

소셜 빅데이터 분석을 통해 알아본 대중의 과학관에 대한 인식 및 사용 행태 (Public Perception and Usage Pattern of Science Museum by Social Media Big Data Analysis)

  • 윤은정;박윤배
    • 한국과학교육학회지
    • /
    • 제37권6호
    • /
    • pp.1005-1014
    • /
    • 2017
  • 본 연구는 대중의 과학적 소양을 함양하기 위한 기관으로서의 과학관의 역할에 주목하고, 우리나라 과학관이 대중에게 어느 정도 영향을 미치고 있는지 알아보기 위하여 소셜 빅데이터 분석을 통해 대중의 과학관에 대한 인식과 사용 행태를 알아보고자 하였다. 이를 위해 네이버 블로그와 트위터에에서 '과학관'이 포함된 게시글들을 추출한 뒤 텍스트 네트워크 분석, 빈도 분석, 공기어 분석 및 의미 분석을 실시하고 영어권의 분석 결과와 비교해 보았다. 그 결과 블로그에서는 주로 어린 자녀를 둔 부모 층에서 과학관이 이슈가 되고 있었고, 트위터에서는 단체 관람을 하는 학생 층이 다수 드러났다. 따라서 우리나라 대중들은 과학관을 주로 아이의 체험을 위한 공간으로 활용하고 있었고, 이 경우 과학관의 프로그램과 전시에 대해서는 긍정적으로 인식하고 있었다. 한편 단체 관람하는 학생들은 다소 부정적 감정을 표출하고 있는 것으로 나타났다. 과학관과 대중과의 소통, 대중의 과학에 대한 참여 등 제 3세대적 과학관의 기능적 측면에서 외국의 사례와 비교해본 결과 우리나라 대중들은 과학관 관람 이후 관람한 과학적 내용에 대한 언급이 거의 없었고, 논쟁이나 심포지움 등 과학적 의사소통과 관련된 언급 역시 거의 없었다. 또한 해설사나 직원들도 외국과는 달리 전혀 회자되지 않고 있었다. 한편, 영어권 게시글의 동사 분석에서 '배우다', '참여하다', '듣다', '읽다', '묻다', '생각하다', '그리다' 등의 유의미한 활동과 관련된 동사들이 다수 나타난 것에 비해 우리나라 게시글에서는 '물어보다', '생각하다' 가 소수 나타나는 것에 그치고 있었다. 따라서 과학관은 과학관 관람객들이 관람을 마친 뒤에 그들의 기억에 남고 대중들 사이에서 회자될 만큼 영향력 있고 다양한 내용과 활동이 일어날 수 있도록 개선할 필요가 있겠다.

Bi-LSTM 기반의 한국어 감성사전 구축 방안 (KNU Korean Sentiment Lexicon: Bi-LSTM-based Method for Building a Korean Sentiment Lexicon)

  • 박상민;나철원;최민성;이다희;온병원
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.219-240
    • /
    • 2018
  • 감성사전은 감성 어휘에 대한 사전으로 감성 분석(Sentiment Analysis)을 위한 기초 자료로 활용된다. 이와 같은 감성사전을 구성하는 감성 어휘는 특정 도메인에 따라 감성의 종류나 정도가 달라질 수 있다. 예를 들면, '슬프다'라는 감성 어휘는 일반적으로 부정의 의미를 나타내지만 영화 도메인에 적용되었을 경우 부정의 의미를 나타내지 않는다. 그렇기 때문에 정확한 감성 분석을 수행하기 위해서는 특정 도메인에 알맞은 감성사전을 구축하는 것이 중요하다. 최근 특정 도메인에 알맞은 감성사전을 구축하기 위해 범용 감성 사전인 오픈한글, SentiWordNet 등을 활용한 연구가 진행되어 왔으나 오픈한글은 현재 서비스가 종료되어 활용이 불가능하며, SentiWordNet은 번역 간에 한국 감성 어휘들의 특징이 잘 반영되지 않는다는 문제점으로 인해 특정 도메인의 감성사전 구축을 위한 기초 자료로써 제약이 존재한다. 이 논문에서는 기존의 범용 감성사전의 문제점을 해결하기 위해 한국어 기반의 새로운 범용 감성사전을 구축하고 이를 KNU 한국어 감성사전이라 명명한다. KNU 한국어 감성사전은 표준국어대사전의 뜻풀이의 감성을 Bi-LSTM을 활용하여 89.45%의 정확도로 분류하였으며 긍정으로 분류된 뜻풀이에서는 긍정에 대한 감성 어휘를, 부정으로 분류된 뜻풀이에서는 부정에 대한 감성 어휘를 1-gram, 2-gram, 어구 그리고 문형 등 다양한 형태로 추출한다. 또한 다양한 외부 소스(SentiWordNet, SenticNet, 감정동사, 감성사전0603)를 활용하여 감성 어휘를 확장하였으며 온라인 텍스트 데이터에서 사용되는 신조어, 이모티콘에 대한 감성 어휘도 포함하고 있다. 이 논문에서 구축한 KNU 한국어 감성사전은 특정 도메인에 영향을 받지 않는 14,843개의 감성 어휘로 구성되어 있으며 특정 도메인에 대한 감성사전을 효율적이고 빠르게 구축하기 위한 기초 자료로 활용될 수 있다. 또한 딥러닝의 성능을 높이기 위한 입력 자질로써 활용될 수 있으며, 기본적인 감성 분석의 수행이나 기계 학습을 위한 대량의 학습 데이터 세트를 빠르게 구축에 활용될 수 있다.

영역별 맞춤형 감성사전 구축을 통한 영화리뷰 감성분석 (Sentiment analysis on movie review through building modified sentiment dictionary by movie genre)

  • 이상훈;최정;김종우
    • 지능정보연구
    • /
    • 제22권2호
    • /
    • pp.97-113
    • /
    • 2016
  • 인터넷상의 데이터가 급속하게 증가함에 따라 막대한 양의 데이터를 목적에 맞게 적절히 활용하는 빅데이터 분석이 활발하게 진행되고 있다. 최근에는 기존의 정형 데이터분석이 가진 한계점을 보완하는 방법으로 비정형 데이터 분석 분야 중 하나인 텍스트마이닝 기법에 대한 연구들이 다수 이루어지고 있으며, 특히 텍스트를 기반으로 문장의 긍정, 부정을 판별하고 분류하는 감성분석과 관련된 연구들이 활발하게 이루어지고 있다. 이러한 연구의 연장선 상에서, 본 연구는 감성분석에 사용되는 감성사전을 데이터의 특성에 맞게 적절하게 변형하여 구축하는 방법을 시도하였다. 데이터가 속한 영역의 특성을 고려하지 않은 기존의 범용 감성사전을 감성분석에 사용할 경우, 해당 영역에서 쓰이는 단어 또는 감정 표현을 반영하지 못하므로 감성분석의 정확성이 떨어질 수 있다. 따라서 감성분석에 있어서 영역 맞춤형 감성사전의 사용 시 데이터 영역의 특성을 정확하게 반영해 분석의 정확성을 높여줄 것으로 기대할 수 있다. 본 연구에서는 영화 리뷰 데이터를 분석 대상으로 선정하였으며, 대표적 영화정보 사이트 IMDb에서 발생된 약 2년간의 영화리뷰 데이터를 수집 분석하였다. 분석에 앞서 영화 장르별 사용되는 단어의 의미가 각각 다를 것을 고려하여 영화를 '액션', '애니메이션', '코메디', '드라마', '공포', '과학공상' 6개 장르로 분류했다. 맞춤형 감성사전 구축을 위한 핵심 기법으로 SO-PMI(Semantic Orientation from Point-wise Mutual Information)를 활용하였으며, 어휘 간 극성이 뚜렷하게 구분되는 형용사에 한정하여 연구를 진행했다. 분석결과 맞춤형사전을 활용한 감성분석 예측정확도는 영화 장르별로 상이했다. '애니메이션'을 제외한 5개 장르에서 기존의 범용 감성사전대비 맞춤형 감성사전의 예측정확도가 통계적으로 유의한 수준의 성능 향상을 보였다. 본 연구에서는 데이터 영역의 특성에 맞는 맞춤형 사전 구축을 통한 감성분석의 예측의 성능 향상을 확인하였다. 향후 감성사전 구축 시 동사, 부사 등 다양한 품사의 어휘를 추가하여 감성분석 예측정확도를 높이는 방안을 모색할 수 있을 것이다.