• 제목/요약/키워드: 어휘추출

검색결과 435건 처리시간 0.025초

텍스트 마이닝을 이용한 감정 유발 요인 'Emotion Trigger'에 관한 연구 (A Study of 'Emotion Trigger' by Text Mining Techniques)

  • 안주영;배정환;한남기;송민
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.69-92
    • /
    • 2015
  • 최근 소셜 미디어의 사용이 폭발적으로 증가함에 따라 이용자가 직접 생성하는 방대한 데이터를 분석하기 위한 다양한 텍스트 마이닝(text mining) 기법들에 대한 연구가 활발히 이루어지고 있다. 이에 따라 텍스트 분석을 위한 알고리듬(algorithm)의 정확도와 수준 역시 높아지고 있으나, 특히 감성 분석(sentimental analysis)의 영역에서 언어의 문법적 요소만을 적용하는데 그쳐 화용론적 의미론적 요소를 고려하지 못한다는 한계를 지닌다. 본 연구는 이러한 한계를 보완하기 위해 기존의 알고리듬 보다 의미 자질을 폭 넓게 고려할 수 있는 Word2Vec 기법을 적용하였다. 또한 한국어 품사 중 형용사를 감정을 표현하는 '감정어휘'로 분류하고, Word2Vec 모델을 통해 추출된 감정어휘의 연관어 중 명사를 해당 감정을 유발하는 요인이라고 정의하여 이 전체 과정을 'Emotion Trigger'라 명명하였다. 본 연구는 사례 연구(case study)로 사회적 이슈가 된 세 직업군(교수, 검사, 의사)의 특정 사건들을 연구 대상으로 선정하고, 이 사건들에 대한 대중들의 인식에 대해 분석하고자 한다. 특정 사건들에 대한 일반 여론과 직접적으로 표출된 개인 의견 모두를 고려하기 위하여 뉴스(news), 블로그(blog), 트위터(twitter)를 데이터 수집 대상으로 선정하였고, 수집된 데이터는 유의미한 연구 결과를 보여줄 수 있을 정도로 그 규모가 크며, 추후 다양한 연구가 가능한 시계열(time series) 데이터이다. 본 연구의 의의는 키워드(keyword)간의 관계를 밝힘에 있어, 기존 감성 분석의 한계를 극복하기 위해 Word2Vec 기법을 적용하여 의미론적 요소를 결합했다는 점이다. 그 과정에서 감정을 유발하는 Emotion Trigger를 찾아낼 수 있었으며, 이는 사회적 이슈에 대한 일반 대중의 반응을 파악하고, 그 원인을 찾아 사회적 문제를 해결하는데 도움이 될 수 있을 것이다.

안평대군 비해당(匪懈堂) 원림의 의미경관과 조경문화 (An Interpretation of the Landscape Meaning and Culture of Anpyung-Daegun(Prince)'s Bihaedang Garden)

  • 신상섭;노재현
    • 한국전통조경학회지
    • /
    • 제29권1호
    • /
    • pp.28-37
    • /
    • 2011
  • 안평대군(1416-1453)의 비해당 원림을 대상으로 집현전 학사들이 차운한 연작시 '비해당사십팔영'의 경관 어휘소를 분석하여 조선 전기 사대부정원에 담긴 의미경관 및 정원문화를 해석한 연구결과는 다음과 같다. 첫째, 안평대군이 인왕산 기슭에 비해당 원림을 가꾸면서 제영한 '사십팔영'의 소표제는 동식물의 태생과 형태, 시간과 공간, 그리고 의미와 상징성 등을 음양의 접합과 같이 대비적으로 연작하는 규범성을 보여주고 있으며, 경물 중 38개는 식물소재를, 8개는 점경물과 동물을 대상으로 하고 있다. 둘째, 정원 명칭을 원림(園林), 정제(庭除), 임천(林泉), 화원(花園)등으로, 뜰의 밀도와 위치에 따라 공정(空庭)과 만원(滿園), 중정(中庭)과 후원(後園), 원락(院落: 안뜰)과 별원(別院) 등으로 세분하여 표현하고 있다. 한편, 누정과 수경시설은 물론 디딤돌과 계단, 그늘시렁, 평상, 화분, 석가산, 괴석, 우물, 롱(籠)(새장), 꽃밭(오(塢)), 생울타리 등이 작정 소재로 다양하게 도입되고 있으며, 뜰 관리자를 사화(司花), 정원수 심기와 가꾸기를 재배(栽培), 연못 속 섬을 부구(浮丘), 축소 경관을 조성하는 축지(縮地) 등의 명칭을 사용하였다. 셋째, 바깥뜰에는 버드나무를 심었고, 서재 앞에 매화를 심어 대나무숲길로 이어지게 했으며, 화원을 만들어 작약, 동백, 모란, 배롱나무 등을 심었다. 점경물로는 이끼 낀 괴석, 작은 석가산, 유리석과 화분을 두었고, 장방형 연못을 조성했으며, 뜰에는 사슴, 꽃 비둘기, 금계, 학 등을 사육했다. 넷째, 경물을 상징화하여 (1) 군자와 절개, (2) 부귀영화, (3) 신선 풍류, (4) 은일과 은둔, (5) 기타 효행과 덕, 성찰 등 의미경관을 취했다. 즉, 기화이초와 진금기수가 어우러진 원림을 조성하여 격물치지의 교훈, 은일과 은둔문화의 대입, 불로장생과 무릉도원을 염원하는 선경처의 구축 성향 등 의미경관 요소가 다양하게 표출되고 있다. 다섯째, 경관을 취하는 기법으로 앙경(仰景)과 부경(俯景) 그리고 저경(低景), 외부경관의 차경, 꽃을 그윽하게 바라보며 의미경관을 즐기고 (유경(幽景)), 꽃구경의 흥취를 돋우며 노닐 수 있는 요정(遼庭), 꽃가꾸기 취미인 화색향벽(花色香僻) 등이 발견되고, 사계절과 시간에 따라 감흥을 달리하며 즐기는 시어가 추출된다.

감성분석을 이용한 파프리카 소비 확대와 홍보를 위한 선호도와 충성도 평가 (Preference and Loyalty Evaluation Using Sentiment Analysis for Promotion and Consumption Expansion of Paprika)

  • 장혜숙;이중섭;방지웅;이재한
    • 생물환경조절학회지
    • /
    • 제31권4호
    • /
    • pp.343-355
    • /
    • 2022
  • 본 연구에서는 파프리카(Capsicum annuum L)의 소비증가 및 홍보를 위해 응답자 소비성향과 파프리카의 인지도를 분석하였다. 의미분별법에 따른 파프리카에 대한 감성반응을 바탕으로 선호도 및 충성도와의 상관관계를 분석하였다. 설문조사는 2022년 1월부터2월까지 일반인 155명을 대상으로 임의추출법을 통하여 조사하였으며, 잘못된답변을 한 13건을 제외하고 총 142명의 설문지를 분석하였다. 파프리카의 인지도 9개의 문항을 요인분석을 통하여 재구성한 결과 '식미성', '이용성', '경제성'의 3요인으로 구성되었다. 9가지 문항 중에서 파프리카에 대한 인지도를 문항별로 알아본 결과로 '파프리카가 건강에 좋을 것 같다'는 문항의 긍정적 답변이 92.3%의 가장 높은 비율을 나타냈다. 파프리카의 형태 선호도는 뭉툭한 유형이 가장 높았고, 그 다음은 소형(Mini) > 원뿔형(Conical) 순으로 선호하는 것으로 나타났다(p < 0.001). 색채 선호도는 노란색 파프리카를 가장 선호하는 것으로 나타났고, 그 다음은 오렌지색 > 적색 > 녹색 순으로 선호하는 것으로 나타났으며 통계적으로 유의하였다. 파프리카의 이미지를 보고 느끼는 감성 반응은 3가지 형태간, 그리고 4가지 색채간 통계적으로 유의한 차이를 보였으며, '밝은', '맑은', '활기찬'이 대표 이미지 감성어휘로 나타났다. 파프리카 이미지에 대한 감성 2요인(평가적인 요인, 정서적인 요인)과 통제변수인 인구통계학적 변수가 선호도에 미치는 영향을 알아보기 위해, 더미변수를 포함한 다중회귀분석을 실시한 결과, 파프리카 이미지에 대한 평가적인 요인이 높을수록, 그리고 주부의 경우 선호도는 높은 것으로 나타났다. 또한 파프리카의 인지도 3요인(식미성, 이용성, 경제성), 선호도, 한국판 삶의 질과 통제 변수인 인구통계학적 변수가 충성도에 미치는 영향을 알아보기 위해, 더미변수를 포함한 다중회귀분석을 실시하였다. 그 결과, 파프리카 선호도와 삶의 질이 높을수록, 파프리카 인지도 중에서 식미성 요인, 이용성 요인이 높을수록 충성도는 높은 것으로 나타났다. 또한 경제성 요인 즉 가격이 높을수록, 그리고 응답자의 월평균 소득이 낮고, 농림수산업 종사자의 경우 충성도는 낮은 것으로 나타났다. 설문 응답자들의 충청도에 영향을 미치는 변수들 중에서 파프리카 선호도는 43%로 가장 높은 설명력을 지니며 가장 영향력 있는 변수로 나타났다. 이러한 결과에서 파프리카의 형태와 색채 선호도에 대해 구명하는 것은 매우 중요한 것으로 판단되었으며, 최근 파프리카가 건강에 좋을 것이라는 인식이 높아지고 있다는 것은 앞으로 내수 증가에 긍정적 요인이 될 것으로 생각되었다. 또한 3가지 형태의 파프리카 중에서 선호도가 가장 높게 나타났던 뭉툭한 유형의 노란색 파프리카를 생산, 홍보를 지향하여 소비자의 구매 성향에 적합한 파프리카의 재배를 늘리는 것도 중요할 것으로 판단되었다. 추후 파프리카의 소비 촉진을 위하여 소비자를 대상으로 한 지속적인 연구와 홍보 지원 활동 등을 통하여 파프리카에 대한 소비자 인지도를 높일 필요가 있다고 생각된다.

완전성과 간결성을 고려한 텍스트 요약 품질의 자동 평가 기법 (Automatic Quality Evaluation with Completeness and Succinctness for Text Summarization)

  • 고은정;김남규
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.125-148
    • /
    • 2018
  • 다양한 스마트 기기 및 관련 서비스의 증가에 따라 텍스트 데이터가 폭발적으로 증가하고 있으며, 이로 인해 방대한 문서로부터 필요한 정보만을 추려내는 작업은 더욱 어려워졌다. 따라서 텍스트 데이터로부터 핵심 내용을 자동으로 요약하여 제공할 수 있는 텍스트 자동 요약 기술이 최근 더욱 주목을 받고 있다. 텍스트 요약 기술은 뉴스 요약 서비스, 개인정보 약관 요약 서비스 등을 통해 현업에서도 이미 활발하게 적용되고 있으며, 학계에서도 문서의 주요 요소를 선별하여 제공하는 추출(Extraction) 접근법과 문서의 요소를 발췌한 뒤 이를 조합하여 새로운 문장을 구성하는 생성(Abstraction) 접근법에 따라 많은 연구가 이루어지고 있다. 하지만 문서의 자동 요약 기술에 비해, 자동으로 요약된 문서의 품질을 평가하는 기술은 상대적으로 많은 진전을 이루지 못하였다. 요약문의 품질 평가를 다룬 기존의 대부분의 연구들은 사람이 수작업으로 요약문을 작성하여 이를 기준 문서(Reference Document)로 삼고, 자동 요약문과 기준 문서와의 유사도를 측정하는 방식으로 수행되었다. 하지만 이러한 방식은 기준 문서의 작성 과정에 막대한 시간과 비용이 소요될 뿐 아니라 요약자의 주관에 의해 평가 결과가 다르게 나타날 수 있다는 한계를 갖는다. 한편 이러한 한계를 극복하기 위한 연구도 일부 수행되었는데, 대표적으로 전문에 대해 차원 축소를 수행하고 이렇게 축소된 전문과 자동 요약문의 유사도를 측정하는 기법이 최근 고안된 바 있다. 이 방식은 원문에서 출현 빈도가 높은 어휘가 요약문에 많이 나타날수록 해당 요약문의 품질이 우수한 것으로 평가하게 된다. 하지만 요약이란 본질적으로 많은 내용을 줄여서 표현하면서도 내용의 누락을 최소화하는 것을 의미하므로, 단순히 빈도수에 기반한 "좋은 요약"이 항상 본질적 의미에서의 "좋은 요약"을 의미한다고 보는 것은 무리가 있다. 요약문 품질 평가의 이러한 기존 연구의 한계를 극복하기 위해, 본 연구에서는 요약의 본질에 기반한 자동 품질 평가 방안을 제안한다. 구체적으로 요약문의 문장 중 서로 중복되는 내용이 얼마나 적은지를 나타내는 요소로 간결성(Succinctness) 개념을 정의하고, 원문의 내용 중 요약문에 포함되지 않은 내용이 얼마나 적은지를 나타내는 요소로 완전성(Completeness)을 정의한다. 본 연구에서는 간결성과 완전성의 개념을 적용한 요약문 품질 자동 평가 방법론을 제안하고, 이를 TripAdvisor 사이트 호텔 리뷰의 요약 및 평가에 적용한 실험 결과를 소개한다.

공공 서비스 수출 플랫폼을 위한 온톨로지 모형 (An Ontology Model for Public Service Export Platform)

  • 이광원;박세권;류승완;신동천
    • 지능정보연구
    • /
    • 제20권1호
    • /
    • pp.149-161
    • /
    • 2014
  • 공공 서비스의 수출의 경우 수출 절차와 대상 선정에 따른 다양한 문제가 발생하며, 공공 서비스 수출 플랫폼은 이러한 문제점들을 해결하기 위하여 사용자 중심의 유연하고, 개방형 구조의 디지털 생태계를 조성할 수 있도록 구현되어야 한다. 또한 공공서비스의 수출은 다수의 이해당사자가 참여하고 여러 단계의 과정을 거쳐야 하므로 사용자의 이해 종류와 탐색 컨설팅 협상 계약 등 수출 프로세스 단계별로 맞춤형 플랫폼 서비스 제공이 필수적이다. 이를 위해서 플랫폼 구조는 도메인과 정보의 정의 및 공유는 물론 지식화를 지원할 수 있어야 한다. 본 논문에서는 공공서비스 수출을 지원하는 플랫폼을 위한 온톨로지 모형을 제안한다. 서비스 플랫폼의 핵심 엔진은 시뮬레이터 모듈이며 시뮬레이터 모듈에서는 온톨로지를 사용하여 수출 비즈니스의 여러 컨텍스트들을 파악하고 정의하여 다른 모듈들과 공유하게 된다. 온톨로지는 공유 어휘를 통하여 개념들과 그들 간의 관계를 표현할 수 있으므로 특정 영역에서 구조적인 틀을 개발하기 위한 메타 정보를 구성하는 효과적인 도구로 잘 알려져 있다. 공공서비스 수출 플랫폼을 위한 온톨로지는 서비스, 요구사항, 환경, 기업, 국가 등 5가지 카테고리로 구성되며 각각의 온톨로지는 요구분석과 사례 분석을 통하여 용어를 추출하고 온톨로지의 식별과 개념적 특성을 반영하는 구조로 설계한다. 서비스 온톨로지는 목적효과, 요구조건, 활동, 서비스 분류 등으로 구성되며, 요구사항 온톨로지는 비즈니스, 기술, 제약으로 구성 된다. 환경 온톨로지는 사용자, 요구조건, 활동으로, 기업 온톨로지는 활동, 조직, 전략, 마케팅, 시간으로 구성되며, 국가 온톨로지는 경제, 사회기반시설, 법, 제도, 관습, 인프라, 인구, 위치, 국가전략 등으로 구성된다. 수출 대상 서비스와 국가의 우선순위 리스트가 생성되면 갭(gap) 분석과 매칭 알고리즘 등의 시뮬레이터를 통하여 수출기업과 수출지원 프로그램과의 시스템적 연계가 이루어진다. 제안하는 온톨로지 모형 기반의 공공서비스 수출지원 플랫폼이 구현되면 이해당사자 모두에게 도움이 되며 특히 정보 인프라와 수출경험이 부족한 중소기업에게 상대적으로 더 큰 도움이 될 것이다. 또한 개방형 디지털 생태계를 통하여 이해당사자들이 정보교환, 협업, 신사업 기획 등의 기회를 만들 수 있을 것으로 기대한다.