• 제목/요약/키워드: 후기글 평가분석

검색결과 5건 처리시간 0.027초

패션앱 후기글 평가분석에 기반한 의류 검색추천 챗봇 개발을 위한 학습데이터 EVAD 구축 (Construction of Evaluation-Annotated Datasets for EA-based Clothing Recommendation Chatbots)

  • 최수원;황창회;유광훈;남지순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.467-472
    • /
    • 2021
  • 본 연구는 패션앱 후기글에 나타나는 구매자의 의견에 대한 '평가분석(Evaluation Analysis: EA)'을 수행하여, 이를 기반으로 상품의 검색 및 추천을 수행하는 의류 검색추천 챗봇을 개발하는 LICO 프로젝트의 언어데이터 구축의 일환으로 수행되었다. '평가분석 트리플(EAT)'과 '평가기반요청 쿼드러플(EARQ)'의 구성요소들에 대한 주석작업은, 도메인 특화된 단일형 핵심어휘와 다단어(MWE) 핵심패턴들을 FST 방식으로 구조화하는 DECO-LGG 언어자원에 기반하여 반자동 언어데이터 증강(SSP) 방식을 통해 진행되었다. 이 과정을 통해 20여만 건의 후기글 문서(230만 어절)로 구성된 EVAD 평가주석데이터셋이 생성되었다. 여성의류 도메인의 평가분석을 위한 '평가속성(ASPECT)' 성분으로 14가지 유형이 분류되었고, 각 '평가속성'에 연동된 '평가내용(VALUE)' 쌍으로 전체 35가지의 {ASPECT-VALUE} 카테고리가 분류되었다. 본 연구에서 구축된 EVAD 평가주석 데이터의 성능을 평가한 결과, F1-Score 0.91의 성능 평가를 획득하였으며, 이를 통해 향후 다른 도메인으로의 확장된 적용 가능성이 유효함을 확인하였다.

  • PDF

오피니언 질의문의 초점 분석을 위한 언어자원 구축 (Linguistic Resource Construction for Focus Analysis of Online Queries about Human Opinion)

  • 심승혜;백혜연;남지순;박세영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.252-254
    • /
    • 2011
  • 본 연구에서는 온라인 사용자 후기글 혹은 상품평관련 사이트에서 나타나는 '질의(Ouery)'가 무엇에 대한 것인지를 분석하고, 그 초점을 제시하는 시스템의 구현을 위하여 요구되는 언어자원을 구축하는 것을 목적으로 한다. 이를 위해 개상의 상태 혹은 성질을 나타내는 의문사 '어떠하' 질의문 유형을 추출하여 여기에서 실현되는 질의초점 명사구에 대한 어휘 사전 및 통사 패턴 LGG문법을 구축하여 질의문의 초점 분석을 위한 체계적인 언어자원 구축의 필요성을 강조하였다. 이와 같이 구축된 LGG문법과 초점어휘 사전의 성능평가를 위해 실험을 수행하였고, 재현률 59%와 정확률 98%의 실험결과를 얻었다.

DECO-LGG 언어자원 및 의존파서와 LSTM을 활용한 하이브리드 자질기반 감성분석 플랫폼 DecoFESA 구현 (DecoFESA: A Hybrid Platform for Feature-based Sentiment Analysis Based on DECO-LGG Linguistic Resources with Parser and LSTM)

  • 황창회;유광훈;남지순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.321-326
    • /
    • 2020
  • 본 연구에서는 한국어 감성분석 성능 향상을 위한 DECO(Dictionnaire Electronique du COreen) 한국어 전자사전과 LGG(Local-Grammar Graph) 패턴문법 기술 프레임에 의존파서 및 LSTM을 적용하는 하이브리드 방법론을 제안하였다. 본 연구에 사용된 DECO-LGG 언어자원을 소개하고, 이에 기반하여 의미 정보를 의존파서(D-PARS)와 페어링하는 한편 OOV(Out Of Vocabulary)의 문제를 LSTM을 통해 해결하여 자질기반 감성분석 결과를 제시하였다. 부트스트랩 방식으로 반복 확장될 수 있는 LGG 언어자원 및 알고리즘을 통해 수행되는 자질기반 감성분석 프로세스는 전용 플랫폼 DecoFESA를 통해 그 범용성을 확장하였다. 실험을 위해서 네이버 쇼핑몰의 '화장품 구매 후기글'을 크롤링하였으며, DecoFESA 플랫폼을 통해 현재 구축된 DECO-LGG 언어자원 기반의 감성분석 성능을 평가하였다. 이를 통해 대용량 언어자원의 구축과 이를 활용하기 위한 어휘 시퀀스 처리 알고리즘의 구현이 보다 정확한 자질기반 감성분석 결과를 제공할 수 있음을 확인하였다.

  • PDF

명곡(明谷) 최석정(崔錫鼎)의 논설류 산문 연구 (A study about Myeonggok(明谷) Choiseokjeong(崔錫鼎)'s persuasive style(論說類) proses)

  • 권진옥
    • 동양고전연구
    • /
    • 제70호
    • /
    • pp.91-117
    • /
    • 2018
  • 본 논문은 조선 중후기의 대표적인 소론(少論) 계열 인물인 명곡(明谷) 최석정(崔錫鼎, 1646~1715)을 대상으로, 그가 남긴 산문 가운데 논설류 문장을 고찰한 글이다. 최석정은 남구만(南九萬, 1629~1711), 박세채(朴世采, 1631~1695)의 제자이면서 조선 중후기 소론의 영수로 활약한 인물이다. 남구만-최석정-조태억(趙泰億, 1675~1728)으로 이어지는 조선후기 소론의 계보를 잇는 중심인물로서 정치사와 사상사에서 중요한 역할을 하였다. 기존의 연구는 주로 정치사적, 사상사적 입지와 의의를 밝히는 데에 치중하였고, 학문적으로는 예학(禮學), 산학(算學), 어학(語學) 분야에서 주목을 받았다. 그러나 그의 문학에 대한 연구는 소략하다 못해 전무한 게 사실이다. 이러한 문제의식에서 최석정의 문학 가운데 논설류 문장에 집중하여 그 문학성을 가늠하고자 한다. 그 예비적 고찰로서 1장에서는 최석정의 문학에 대한 제 평가들을 살펴보았다. 공적으로나 사적으로나 최석정의 문학에 대한 평가는 일정 수준을 넘었으며, 그렇기 때문에 그의 문학에 대한 연구도 유의미하다는 것을 확인하였다. 2장에서는 "명곡집(明谷集)" 소재 논설류 산문을 개관하였고, 3장에서는 최석정의 논설류 문장의 특징적인 면모를 살펴보았다. 최석정이 지은 논설류 문장은 총 14편으로, 그 창작시기는 문과에 급제한 1671년 즈음부터 생의 마지막까지 걸쳐있다. 이 가운데 본 논문에서 분석 대상으로 삼은 글은 "순욱론(荀彧論)", "부자대가론(夫子待賈論)" 그리고 "문언계사변(文言系辭辨)"이다. 기존의 논의를 뒤집는 역발상이 돋보이면서 구성면에서 독특한 면모를 보이는 글이 "순욱론"이라면, 설득력을 높이는 유비(類比)를 활용하여 논의를 전개하되 기존의 시각을 전환시킨 글이 "부자대가론"이다. 또한 상대방 주장의 대전제(大前提)를 무너뜨려 반박하는 논리적 정합성을 보이면서도 어휘나 문장, 구성의 형식미에서도 그 공력을 들인 글이 "문언계사변"이다. "순욱론"은 순욱에 대한 평가를 새롭게 제시한 논설류 문장이다. 그의 재능과 행적, 처세와 절의에 대해 다양한 평가들이 있었는데, 이처럼 첨예하게 갈리는 논란 속에서 자신의 식견과 통찰로 순욱의 인물상을 새롭게 제시한 글이 바로 "순욱론"이다. 특히 이 작품은 액자식 구성을 보이는데 '재능을 구사하는 어려움[재난(才難)]'이라는 의제 안에 다시 '순욱에 대한 논의[순욱론(荀彧論)]'를 개진한 점이 특징적인 면모라 할 수 있다. "부자대가론"은 어제응제(御製應製)로 지은 글인데, 공자(孔子)의 "팔아야지, 팔아야겠지. 그러나 나는 좋은 값을 기다리는 사람이다.[고지재고지재(沽之哉沽之哉), 아대가자야(我待賈者也).]"라는 언급을 의제(議題)로 삼은 것이다. 이 글은 무엇보다도 유비(類比)를 적극 활용하였는데, 이러한 유비의 활용은 주제를 구현함에 있어 설득력을 높이는 효과적인 수단이다. 한편 최석정은 기존의 논의와 궤를 같이 하여 공자의 입장에서 논의를 전개하다가 끝부분에서는 군주의 입장에서 논의를 전환시켜 군왕에 대한 권면으로 논설류 문장을 끝맺음하였다. "문언계사변"은 "주역(周易)"의 "문언(文言)"과 "계사(系辭)"가 공자의 저술이 아니라는 구양수(歐陽修)의 논의에 정면으로 조목조목 반박한 글이다. 이 글의 특장은 반박하는 논리의 정합성도 있겠지만 어휘나 문장, 단락 구사의 측면에서도 탁월하다고 평가할 만하다. 최석정은 구양수가 대전제로 삼은 논리를 반박하는 기제로 삼았다. 또한 이 글은 구성의 측면에서 보면 총 다섯 단락으로 구성하되 각 단락은 정연하게 안배하였다. 또한 순차적으로 논거들을 제시하되, 뒤로 갈수록 논거의 중요도가 강화되는 점층법을 구사하였다.

화장품 후기글의 자질기반 감성분석을 위한 다단어 표현의 유한그래프 사전 및 문법 구축 (Building Korean Multi-word Expression Lexicons and Grammars Represented by Finite-State Graphs for FbSA of Cosmetic Reviews)

  • 황창회;유광훈;최성용;신동혁;남지순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.400-405
    • /
    • 2018
  • 본 연구는 한국어 화장품 리뷰 코퍼스의 자질기반 감성 분석을 위하여, 이 도메인에서 실현되는 중요한 다단어 표현(MWE)의 유한상태 그래프 사전과 문법을 구축하는 방법론을 제시하고, 실제 구축된 사전과 문법의 성능을 평가하는 것을 목표로 한다. 본 연구에서는 자연어처리(NLP)에서 중요한 화두로 논의되어 온 MWE의 어휘-통사적 특징을 부분문법 그래프(LGG)로 형식화하였다. 화장품 리뷰 코퍼스에 DECO 한국어 전자사전을 적용하여 어휘 빈도 통계를 획득하고 이에 대한 언어학적 분석을 통해 극성 MWE(Polarity-MWE)와 화제 MWE(Topic MWE)의 전체 네 가지 하위 범주를 분류하였다. 또한 각 모듈간의 상호관계에 대한 어휘-통사적 속성을 반복적으로 적용하는 이중 증식(double-propagation)을 통해 자원을 확장하였다. 이 과정을 통해 구축된 대용량 MWE 유한그래프 사전 DECO-MWE의 성능을 테스트한 결과 각각 0.844(Pol-MWE), 0.742(Top-MWE)의 조화평균을 보였다. 이를 통해 본 연구에서 제안하는 MWE 언어자원 구축 방법론이 다양한 도메인에서 활용될 수 있고 향후 자질기반 감성 분석에 중요한 자원이 될 것임을 확인하였다.

  • PDF