• 제목/요약/키워드: semantic

검색결과 4,206건 처리시간 0.028초

감성분석을 이용한 파프리카 소비 확대와 홍보를 위한 선호도와 충성도 평가 (Preference and Loyalty Evaluation Using Sentiment Analysis for Promotion and Consumption Expansion of Paprika)

  • 장혜숙;이중섭;방지웅;이재한
    • 생물환경조절학회지
    • /
    • 제31권4호
    • /
    • pp.343-355
    • /
    • 2022
  • 본 연구에서는 파프리카(Capsicum annuum L)의 소비증가 및 홍보를 위해 응답자 소비성향과 파프리카의 인지도를 분석하였다. 의미분별법에 따른 파프리카에 대한 감성반응을 바탕으로 선호도 및 충성도와의 상관관계를 분석하였다. 설문조사는 2022년 1월부터2월까지 일반인 155명을 대상으로 임의추출법을 통하여 조사하였으며, 잘못된답변을 한 13건을 제외하고 총 142명의 설문지를 분석하였다. 파프리카의 인지도 9개의 문항을 요인분석을 통하여 재구성한 결과 '식미성', '이용성', '경제성'의 3요인으로 구성되었다. 9가지 문항 중에서 파프리카에 대한 인지도를 문항별로 알아본 결과로 '파프리카가 건강에 좋을 것 같다'는 문항의 긍정적 답변이 92.3%의 가장 높은 비율을 나타냈다. 파프리카의 형태 선호도는 뭉툭한 유형이 가장 높았고, 그 다음은 소형(Mini) > 원뿔형(Conical) 순으로 선호하는 것으로 나타났다(p < 0.001). 색채 선호도는 노란색 파프리카를 가장 선호하는 것으로 나타났고, 그 다음은 오렌지색 > 적색 > 녹색 순으로 선호하는 것으로 나타났으며 통계적으로 유의하였다. 파프리카의 이미지를 보고 느끼는 감성 반응은 3가지 형태간, 그리고 4가지 색채간 통계적으로 유의한 차이를 보였으며, '밝은', '맑은', '활기찬'이 대표 이미지 감성어휘로 나타났다. 파프리카 이미지에 대한 감성 2요인(평가적인 요인, 정서적인 요인)과 통제변수인 인구통계학적 변수가 선호도에 미치는 영향을 알아보기 위해, 더미변수를 포함한 다중회귀분석을 실시한 결과, 파프리카 이미지에 대한 평가적인 요인이 높을수록, 그리고 주부의 경우 선호도는 높은 것으로 나타났다. 또한 파프리카의 인지도 3요인(식미성, 이용성, 경제성), 선호도, 한국판 삶의 질과 통제 변수인 인구통계학적 변수가 충성도에 미치는 영향을 알아보기 위해, 더미변수를 포함한 다중회귀분석을 실시하였다. 그 결과, 파프리카 선호도와 삶의 질이 높을수록, 파프리카 인지도 중에서 식미성 요인, 이용성 요인이 높을수록 충성도는 높은 것으로 나타났다. 또한 경제성 요인 즉 가격이 높을수록, 그리고 응답자의 월평균 소득이 낮고, 농림수산업 종사자의 경우 충성도는 낮은 것으로 나타났다. 설문 응답자들의 충청도에 영향을 미치는 변수들 중에서 파프리카 선호도는 43%로 가장 높은 설명력을 지니며 가장 영향력 있는 변수로 나타났다. 이러한 결과에서 파프리카의 형태와 색채 선호도에 대해 구명하는 것은 매우 중요한 것으로 판단되었으며, 최근 파프리카가 건강에 좋을 것이라는 인식이 높아지고 있다는 것은 앞으로 내수 증가에 긍정적 요인이 될 것으로 생각되었다. 또한 3가지 형태의 파프리카 중에서 선호도가 가장 높게 나타났던 뭉툭한 유형의 노란색 파프리카를 생산, 홍보를 지향하여 소비자의 구매 성향에 적합한 파프리카의 재배를 늘리는 것도 중요할 것으로 판단되었다. 추후 파프리카의 소비 촉진을 위하여 소비자를 대상으로 한 지속적인 연구와 홍보 지원 활동 등을 통하여 파프리카에 대한 소비자 인지도를 높일 필요가 있다고 생각된다.

한돌 타래의 디아스포라 서사와 미학 (The Diaspora Narrative and Aesthetics in Handol's Tarae)

  • 신사빈
    • 대중서사연구
    • /
    • 제26권3호
    • /
    • pp.189-219
    • /
    • 2020
  • 이 글은 한돌 이흥건의 타래를 서사와 미학의 측면에서 분석한다. 이 때 등장하는 분석 요소는 자연과 인간, 소외와 관심, 분단과 통일, 디아스포라와 겨레 등 이항 대립의 현상과 본질이다. 1970년대 후반부터 1990년대 초반까지의 타래는 군사 독재 때부터 발생한 산업화와 도시화, 난개발, 서구화, 입시 위주 교육, 빈부 차, 인간 소외, 분단 갈등의 사회 문제를 무저항과 불복종의 정신으로 맞서는 상실과 고통의 체험 서사를 노래하였다. 그리고 창작 의욕이 단절된 공백기를 자기 성찰과 노력으로 극복한 이후의 타래는 '자연의 울림과 자기의 참모습', '디아스포라 의식과 겨레의 얼'을 일체화하는 디아스포라 서사시의 느낌이 두드러진다. <터>에서 시작한 조국과 국토, 겨레에 대한 서사시는 <한뫼줄기>를 전환점으로 뿌리보다 길을 찾는 디아스포라 의식이 선명해진다. 한돌은 음악보다 서사의 원천에서 영감을 얻는다. 그의 타래는 '노랫말을 위해서 리듬이 곁들어지는 것'에 치중한다. 이 때문에 타래가 갖는 기호학적 특성은 내재적 의미(슬픔의 정서)가 오묘해도 외형적 음운이 단순한 것이 한계다. 공감과 더불어 감동까지 끌어내는 데는 내포적(의미론적)인 부분과 외연적(음운론적)인 부분의 조화가 필요하다. 슬픔의 정서를 더 많은 사람이 공유하려면 음운론적 요소를 강화할 필요가 있다. 슬픔에 대한 공감과 감동은 동일한 경험의 이야기보다 비슷한 정서의 분위기에 이끌리는 경우가 더 많다. 타래 속 슬픔의 미학은 유년 시절부터 겪은 상실과 고독, 가난의 맥락에서 표출된 원초적인 체험 서사에서 출발하지만, 긴 공백기를 거치면서 심화한 슬픔의 미학은 타인(실향민, 해외 입양자, 러시아 고려인, 일본군 위안부 피해자 등)의 디아스포라 경험까지 자기화하면서 궁극적인구원 서사를 지향한다. 이로써 타래는 잠재적으로 민족의 한계를 뛰어 넘을 가능성도 지니게 되었다. '이산되는 소리'로서의 타래는 다른 세계 음악과의 접점에서 깊은 슬픔의 호소력으로 유리한 국면을 맞을 수 있다. 반다문화주의가 아닌 상호문화주의의 지향으로 글로벌 디아스포라 담론을 형성할 수도 있다. 한돌의 타래는 디아스포라 음악으로서 지속적으로 공감의 영역을 찾고 인식의 지평을 넓혀나가는 것이 향후 과제요 목표다.

전문어의 범용 공간 매핑을 위한 비선형 벡터 정렬 방법론 (Nonlinear Vector Alignment Methodology for Mapping Domain-Specific Terminology into General Space)

  • 김준우;윤병호;김남규
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.127-146
    • /
    • 2022
  • 최근 워드 임베딩이 딥러닝 기반 자연어 처리를 다루는 다양한 업무에서 우수한 성능을 나타내면서, 단어, 문장, 그리고 문서 임베딩의 고도화 및 활용에 대한 연구가 활발하게 이루어지고 있다. 예를 들어 교차 언어 전이는 서로 다른 언어 간의 의미적 교환을 가능하게 하는 분야로, 임베딩 모델의 발전과 동시에 성장하고 있다. 또한 핵심 기술인 벡터 정렬(Vector Alignment)은 임베딩 기반 다양한 분석에 적용될 수 있다는 기대에 힘입어 학계의 관심이 더욱 높아지고 있다. 특히 벡터 정렬은 최근 수요가 높아지고 있는 분야간 매핑, 즉 대용량의 범용 문서로 학습된 사전학습 언어모델의 공간에 R&D, 의료, 법률 등 전문 분야의 어휘를 매핑하거나 이들 전문 분야간의 어휘를 매핑하기 위한 실마리를 제공할 수 있을 것으로 기대된다. 하지만 학계에서 주로 연구되어 온 선형 기반 벡터 정렬은 기본적으로 통계적 선형성을 가정하기 때문에, 본질적으로 상이한 형태의 벡터 공간을 기하학적으로 유사한 것으로 간주하는 가정으로 인해 정렬 과정에서 필연적인 왜곡을 야기한다는 한계를 갖는다. 본 연구에서는 이러한 한계를 극복하기 위해 데이터의 비선형성을 효과적으로 학습하는 딥러닝 기반 벡터 정렬 방법론을 제안한다. 제안 방법론은 서로 다른 공간에서 벡터로 표현된 전문어 임베딩을 범용어 임베딩 공간에 정렬하는 스킵연결 오토인코더와 회귀 모델의 순차별 학습으로 구성되며, 학습된 두 모델의 추론을 통해 전문 어휘를 범용어 공간에 정렬할 수 있다. 제안 방법론의 성능을 검증하기 위해 2011년부터 2020년까지 수행된 국가 R&D 과제 중 '보건의료' 분야의 문서 총 77,578건에 대한 실험을 수행한 결과, 제안 방법론이 기존의 선형 벡터 정렬에 비해 코사인 유사도 측면에서 우수한 성능을 나타냄을 확인하였다.

국가통계자료를 활용한 조경산업 현황 연구 (A Study on Status of Landscape Architecture Industry with National Statistics)

  • 최자호;윤영관;구본학
    • 한국조경학회지
    • /
    • 제50권5호
    • /
    • pp.40-53
    • /
    • 2022
  • 조경산업 관련 국가기관, 조경단체, 기업 등의 정책 수립 및 입안, 결정에 타당한 근거로서, 체계적 국가통계자료 활용은 필수적이다. 이에 본 연구는 조경산업 현황을 가늠하는데 필요한 국가통계자료 활용방법론 및 기초현황 자료를 제공하고자 수행하였다. 먼저, 조경산업을 '설계', '사업관리', '시공', '유지관리', '소재', '연구', '교육', '행정' 분야로 분류하고, 각 분야별로 한국표준산업분류 및 건설관계법령에 따른 업종을 체계화하여 연계하였다. 이 중 국토교통부 소관 건설관계법령에 직접 규정된 업종을 중심으로 국가통계자료의 구축·연계·통합·보급, 중복성, 누락 등을 조사·분석하여, 통계분석 업종을 선정하였다. 그리고, 통계항목의 공통성, 해석 오류 최소화를 위해 의미분석을 수행하고, 최종적으로 업종등록수, 종사자수, 매출액을 선정하였다. 이를 기준으로 산업현황의 기초적 분석·평가에 활용가능한 분석틀을 제시하고, 실제 국가통계자료를 대입하여 분석·평가하였다. 즉 2019년에 조경산업 관련 업종에 등록된 건수는 12,160개, 업종별 종사자수는 106,296명, 업종별 매출액은 83,085억원으로 나타났다. 한편, 2017년부터 업종등록수, 종사자수는 지속 증가하는 반면, 매출액은 감소하고 있어, 산업적 발전방안 마련이 요구되는 상황이다. 본 연구는 다수 공공기관에서 구축된 국가통계자료를 기반으로 수행함에 따라 일관성 및 신뢰성 확보에 한계가 있다. 이에 「조경진흥법」에 따른 체계적·일관적 국가통계자료 구축이 필요하다. 향후, 공원녹지 등 주제별 국가통계자료 활용방안 및 발전방안 등을 연구하고자 한다.

Swin Transformer와 Sentinel-1 영상을 이용한 우리나라 저수지의 수체 탐지 (Waterbody Detection for the Reservoirs in South Korea Using Swin Transformer and Sentinel-1 Images)

  • 최소연;윤유정;강종구;김서연;정예민;임윤교;서영민;김완엽;최민하;이양원
    • 대한원격탐사학회지
    • /
    • 제39권5_3호
    • /
    • pp.949-965
    • /
    • 2023
  • 본 연구에서는 Sentinel-1 synthetic aperture radar 영상을 활용하여 딥러닝 모델인 Swin Transformer로 국내 농업용 저수지의 수표면적을 모니터링 하는 방법을 제시한다. Google Earth Engine 플랫폼을 이용하여 70만톤 급, 90만톤급, 150만톤급 저수지 7개소에 대한 2017년부터 2021년 데이터셋을 구축하였다. 저수지 4개소에 대한 영상 1,283장에 대해서 셔플링(suffling) 및 5-폴드(fold) 교차검증 기법을 적용하여 모델을 학습하였다. 시험평가 결과 모델의 윈도우 크기를 12로 설정한 Swin Transformer Large 모델은 각 폴드에서 평균적으로 99.54%의 정확도와 95.15%의 mean intersection over union (mIoU)을 기록하여 우수한 의미론적 분할 성능을 보여주었다. 최고 성능을 보여준 모델을 나머지 3개소 저수지 데이터셋에 적용하여 성능을 검증한 결과, 모든 저수지에서 정확도 99% 및 mIoU 94% 이상을 달성함을 확인했다. 이러한 결과는 Swint Transformer 모델이 국내의 농업용 저수지의 수표면적 모니터링에 효과적으로 활용될 수 있음을 보여준다.

집단적 PCK 관점에서 학생들의 지구과학 개념 이해에 대한 질적 메타 분석: 온실 효과, 지구 온난화, 기후변화 개념을 중심으로 (Qualitative Meta-analysis on Students' Understanding of Earth Science Concepts from the Perspective of Collective PCK: Focusing on the Concepts of Greenhouse Effect, Global Warming, and Climate Change)

  • 김권중;최의선;김호준;박재용;이기영
    • 한국지구과학회지
    • /
    • 제45권3호
    • /
    • pp.239-259
    • /
    • 2024
  • 본 연구에서는 지구과학 교육 연구 논문들을 대상으로 질적 메타 분석을 통해 집단적 PCK (cPCK) 중 '특정 과학 주제(온실 효과, 지구 온난화, 기후변화)에 대한 학생 이해 지식'을 도출하고자 하였다. 이를 위해 온실 효과, 지구 온난화, 기후변화에 대한 학생 대체 개념(오개념)과 관련된 지구과학 교육 연구 논문 22편을 선정하여 각각의 정의, 원인(매커니즘), 그리고 영향에 대하여 분석하였다. 분석 결과를 종합하기 위해 언어 네트워크 분석, 정신모형틀을 적용하였다. 연구 결과는 다음과 같다; (1) 온실 효과에 대한 학생들의 개념 이해를 메타 분석한 결과, 온실 효과와 지구 온난화를 같은 의미로 사용하는 것으로 분석되었으며, 온실 기체의 종류를 제한적으로 알고 있고, 온실 기체의 역할을 이해하지 못하는 것으로 나타났다. 또한 온실 효과의 발생을 환경오염이나 오존층의 변화와 관련지어 생각하고, 지표-대기의 열수지 평형과 온실 효과를 관련짓지 못하는 것으로 분석되었다. (2) 지구 온난화에 대한 학생들의 개념 이해를 메타 분석한 결과, 지구 온난화를 해수면 상승과 같은 의미로 사용하는 것으로 분석되었으며, 지구 온난화의 발생을 환경오염, 오존층의 변화, 빙하의 융해와 관련지어 생각하고, 지표-대기의 열수지 평형이 깨져 지구 온난화가 나타나는 것으로 이해하고 있었다. 또한 지구 온난화가 환경에 미치는 영향을 잘못 알고 있는 것으로 분석되었다. (3) 기후변화에 대한 학생들의 개념 이해를 메타 분석한 결과, 기후변화를 지구 온난화, 기상 변화, 기상 이변과 같은 의미로 사용하는 것으로 분석되었으며, 기후변화의 발생을 대기오염, 오존층의 파괴와 관련지어 생각하는 것으로 분석되었다. 또한 기후변화가 우리 생활과 환경에 미치는 영향을 잘못 알고 있는 것으로 분석되었다. 이에 대한 분석 결과를 언어 네트워크 분석을 통해 종합한 결과, 집단적 PCK로서 3가지 정신모형(범주적 오해, 기제적 오해, 위계적 오해)을 표현할 수 있었다. 이와 같은 연구 결과를 바탕으로 지구과학 교사 PCK 개발을 위한 함의를 논의하였다.

키키 스미스 작품에서 신체기호의 의미 분석과 해석 - 를 중심으로 - (A Study Meaning Analysis and Interpretation of Body Sign, Kiki Smith - On Pee Body -)

  • 김성희
    • 조형예술학연구
    • /
    • 제10권
    • /
    • pp.5-50
    • /
    • 2006
  • 인간의 신체는 단순한 육체적 몸을 넘어서 온갖 삶의 역사를 담은 상징체이다. 특히 예술 표현을 위해 신체를 사용하는 수많은 예들을 통해 볼 때, 즉 예술의 대상으로서 신체를 포착하거나, 자신의 생각을 전달하기 위해 신체 행위를 드러내거나 간에 시간과 장소를 포함한 삶의 지시체와 같은 역할을 해왔다. 이러한 신체에 대한 입장은 사실 그리 오래된 관점이 아니다. 1960년대 이래 이성과 사유의 힘을 중심화 하던 모더니즘의 사유 패러다임이 쇠퇴하고 감성과 감각의 중요성이 부각되면서 오랜 동안 정신의 시녀였던 신체가 탈분화적 관점에서 하나의 실체로서 주목하게 되면서부터이다. 이는 현대미술의 흐름에서 1940년대 이후 액션페인팅(Action Painting)에서부터 신체행위의 중요성이 제기되고 1960년대 액셔니즘(Actionism)과 플럭서스(Fluxus)의 빈번한 퍼포먼스(Performance)에서 신체는 표현의 중요한 매체가 되었다. 이브 클랭(Yves Kline)의 신체와 그 흔적에 의한 개념적 작업에서 시작되어, 1970년대 본격화된 바디아트(Body Art)에서 신체는 보다 확고한 예술의 매체로 부각된다. 이후 1980년대 만개한 페미니즘(Feminism)과 1990년대 파편화되고 해체된 신체미술의 경향들로 이어졌다. 이러한 흐름에서 볼 때 신체는 지시적 의미의 단계를 넘어서 개인의 정체성으로부터 세계상을 함축하여 드러낼 수 있는 단서로 간주된다. 특히 1980년대 이후 페미니즘(Feminism)적 경향의 키키 스미스(Kiki Smith)는 신체의 확장된 의미를 제시해주는 대표적 작가들로 그들의 작품을 연구 대상으로 하게 되었다. 이러한 배경 아래 키키스미스의 작품 세계를 고찰하기 위해, 신체를 통해 의미의 지평이 열리는 객관적 방법을 모색한 결과, 기호학과 신체론에 대한 고찰이 필요하다는 사실을 인식하게 되었다. 즉 신체를 객관화하여 가장 기초적인 수준에서 표현적인 부분과 내용적인 부분을 구조적으로 나누어 그 관계에 의해 의미가 발생하게 되는 과정을 기호와 텍스트의 개념에서 시작하였다. 나아가 이 표현면과 내용면의 구조적인 결합방식을 그레마스(A. J. Greimas)의 구조의미론에서 다룸으로써 의미의 확장을 위한 토대론적 작업을 구축하였다. 한편, 신체론에서는 세계와의 관계항으로서 신체를 조망하게 해준 메를로-퐁티(Maurice Merleau-Ponty)의 현상학(Phenomenology)과 애브젝션(abjection)의 개념을 통해 해체와 파편의 신체를 전달하게 해준 줄리아 크리스테바(Julia Kristeva)의 논의가 구조의미론적 분석을 해석으로 확장시키는 데 중요한 기여를 하였다. 키키 스미스는 1980년대 중반 죽음에 대한 서사에서 시작된 이중화와 파편화의 신체로부터 상처받을 수 있는 신체의 비천함이 구체적으로 드러난 1990년대 그리고 상처의 치유에 이르는 종교와 신화로 이어지는 2000년대 이후의 과정을 보여주었다.

  • PDF

FCA 기반 계층적 구조를 이용한 문서 통합 기법 (Methods for Integration of Documents using Hierarchical Structure based on the Formal Concept Analysis)

  • 김태환;전호철;최종민
    • 지능정보연구
    • /
    • 제17권3호
    • /
    • pp.63-77
    • /
    • 2011
  • 월드와이드웹(World Wide Web)은 인터넷에 연결된 컴퓨터를 통해 사람들이 정보를 공유할 수 있는 매우 큰 분산된 정보 공간이다. 웹은 1991년에 시작되어 개인 홈페이지, 온라인 도서관, 가상 박물관 등 다양한 정보 자원들을 웹으로 표현하면서 성장하였다. 이러한 웹은 현재 5천억 페이지 이상 존재할 것이라고 추정한다. 대용량 정보에서 정보를 효과적이며 효율적으로 검색하는 기술을 적용할 수 있다. 현재 존재하는 몇몇 검색 도구들은 초 단위로 gigabyte 크기의 웹을 검사하여 사용자에게 검색 정보를 제공한다. 그러나 검색의 효율성은 검색 시간과는 다른 문제이다. 현재 검색 도구들은 사용자의 질의에 적합한 정보가 적음에도 불구하고 많은 문서들을 사용자에게 검색해준다. 그러므로 대부분의 적합한 문서들은 검색 상위에 존재하지 않는다. 또한 현재 검색 도구들은 사용자가 찾은 문서와 관련된 문서를 찾을 수 없다. 현재 많은 검색 시스템들의 가장 중요한 문제는 검색의 질을 증가 시키는 것이다. 그것은 검색된 결과로 관련 있는 문서를 증가시키고, 관련 없는 문서를 감소시켜 사용자에게 제공하는 것이다. 이러한 문제를 해결하기 위해 CiteSeer는 월드와이드웹에 존재하는 논문에 대해 한정하여 ACI(Autonomous Citation Indexing)기법을 제안하였다. "Citaion Index"는 연구자가 자신의 논문에 다른 논문을 인용한 정보를 기술하는데 이렇게 기술된 논문과 자신의 논문을 연결하여 색인한다. "Citation Index"는 논문 검색이나 논문 분석 등에 매우 유용하다. 그러나 "Citation Index"는 논문의 저자가 다른 논문을 인용한 논문에 대해서만 자신의 논문을 연결하여 색인했기 때문에 논문의 저자가 다른 논문을 인용하지 않은 논문에 대해서는 관련 있는 논문이라 할지 라도 저자의 논문과 연결하여 색인할 수 없다. 또한 인용되지 않은 다른 논문과 연결하여 색인할 수 없기 때문에 확장성이 용이하지 못하다. 이러한 문제를 해결하기 위해 본 논문에서는 검색된 문서에서 단락별 명사와 동사 및 목적어를 추출하여 해당 동사가 명사 및 목적어를 취할 수 있는 가능한 값을 고려하여 하나의 문서를 formal context 형태로 변환한다. 이 표를 이용하여 문서의 계층적 그래프를 구성하고, 문서의 그래프를 이용하여 문서 간 그래프를 통합한다. 이렇게 만들어진 문서의 그래프들은 그래프의 구조를 보고 각각의 문서의 영역을 구하고 그 영역에 포함관계를 계산하여 문서와 문서간의 관계를 표시할 수 있다. 또한 검색된 문서를 트리 형식으로 보여주어 사용자가 원하는 정보를 보다 쉽게 검색할 수 있는 문서의 구조적 통합 방법에 대해 제안한다. 제안한 방법은 루씬 검색엔진이 가지고 있는 순위 계산 공식을 이용하여 문서가 가지는 중요한 단어를 문서의 참조 관계에 적용하여 비교하였다. 제안한 방법이 루씬 검색엔진보다15% 정도 높은 성능을 나타내었다.

온라인 상품평의 내용적 특성이 소비자의 인지된 유용성에 미치는 영향 (Impact of Semantic Characteristics on Perceived Helpfulness of Online Reviews)

  • 박윤주;김경재
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.29-44
    • /
    • 2017
  • 인터넷 상거래에서, 소비자들은 기존에 제품을 구매한 다른 사용자들이 작성한 상품평에 많은 영향을 받는다. 그러나, 상품평이 점차 축적되어감에 따라, 소비자들이 방대한 상품평을 일일이 확인하는데 많은 시간과 노력이 소요되고, 또한 무성의하게 작성된 상품평들은 오히려 소비자들의 불편을 초래하기도 한다. 이에, 본 연구는 온라인 상품평의 유용성에 영향을 미치는 요인들을 분석하여, 소비자들에게 실제로 도움이 될 수 있는 상품평을 선별적으로 제공하는 예측모형을 도출하는 것을 목적으로 한다. 이를 위해, 텍스트마이닝 기법을 사용하여, 상품평에 포함되어있는 다양한 언어적, 심리적, 지각적 요소들을 추출하였으며, 이러한 요소들 중에서 상품평의 유용성에 영향을 미치는 결정요인이 무엇인지 파악하였다. 특히, 경험재인 의류군과 탐색재인 전자제품군에 대한 상품평의 특성 및 유용성 결정요인이 상이할 수 있음을 고려하여, 제품군별로 상품평의 특성을 비교하고, 각각의 결정요인을 도출하였다. 본 연구에는 아마존닷컴(Amazon.com)의 의류군 상품평 7,498건과 전자제품군 상품평 106,962건이 사용되었다. 또한, 언어분석 소프트웨어인 LIWC(Linguistic Inquiry and Word Count)를 활용하여 상품평에 포함된 특징들을 추출하였고, 이후, 데이터마이닝 소프트웨어인 RapidMiner를 사용하여, 회귀분석을 통한, 결정요인 분석을 수행하였다. 본 연구결과, 제품에 대한 리뷰어의 평가가 높고, 상품평에 포함된 전체 단어 수가 많으며, 상품평의 내용에 지각적 과정이 많이 포함되어 있는 반면, 부정적 감정은 적게 포함된 상품평들이 두 제품 모두에서 유용하다고 인식되는 것을 알 수 있었다. 그 외, 의류군의 경우, 비교급 표현이 많고, 전문성 지수는 낮으며, 한 문장에 포함된 단어 수가 적은 간결한 상품평이 유용하다고 인식되고 있었으며, 전자제품의 경우, 전문성 지수가 높고, 분석적이며, 진솔한 표현이 많고, 인지적 과정과 긍정적 감정(PosEmo)이 많이 포함된 상품평이 유용하게 인식되고 있었다. 이러한 연구결과는 향후, 소비자들이 효과적으로 유용한 상품평들을 확인하는데 도움이 될 것으로 기대된다.

전역 토픽의 지역 매핑을 통한 효율적 토픽 모델링 방안 (Efficient Topic Modeling by Mapping Global and Local Topics)

  • 최호창;김남규
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.69-94
    • /
    • 2017
  • 최근 빅데이터 분석 수요의 지속적 증가와 함께 관련 기법 및 도구의 비약적 발전이 이루어지고 있으며, 이에 따라 빅데이터 분석은 소수 전문가에 의한 독점이 아닌 개별 사용자의 자가 수행 형태로 변모하고 있다. 또한 전통적 방법으로는 분석이 어려웠던 비정형 데이터의 활용 방안에 대한 관심이 증가하고 있으며, 대표적으로 방대한 양의 텍스트에서 주제를 도출해내는 토픽 모델링(Topic Modeling)에 대한 연구가 활발히 진행되고 있다. 전통적인 토픽 모델링은 전체 문서에 걸친 주요 용어의 분포에 기반을 두고 수행되기 때문에, 각 문서의 토픽 식별에는 전체 문서에 대한 일괄 분석이 필요하다. 이로 인해 대용량 문서의 토픽 모델링에는 오랜 시간이 소요되며, 이 문제는 특히 분석 대상 문서가 복수의 시스템 또는 지역에 분산 저장되어 있는 경우 더욱 크게 작용한다. 따라서 이를 극복하기 위해 대량의 문서를 하위 군집으로 분할하고, 각 군집별 분석을 통해 토픽을 도출하는 방법을 생각할 수 있다. 하지만 이 경우 각 군집에서 도출한 지역 토픽은 전체 문서로부터 도출한 전역 토픽과 상이하게 나타나므로, 각 문서와 전역 토픽의 대응 관계를 식별할 수 없다. 따라서 본 연구에서는 전체 문서를 하위 군집으로 분할하고, 각 하위 군집에서 대표 문서를 추출하여 축소된 전역 문서 집합을 구성하고, 대표 문서를 매개로 하위 군집에서 도출한 지역 토픽으로부터 전역 토픽의 성분을 도출하는 방안을 제시한다. 또한 뉴스 기사 24,000건에 대한 실험을 통해 제안 방법론의 실무 적용 가능성을 평가하였으며, 이와 함께 제안 방법론에 따른 분할 정복(Divide and Conquer) 방식과 전체 문서에 대한 일괄 수행 방식의 토픽 분석 결과를 비교하였다.