• 제목/요약/키워드: Morpheme Analyzer

검색결과 42건 처리시간 0.017초

온라인 상품 판매 성과에 영향을 미치는 상품 소개글 효과 측정 기법 (Measuring the Economic Impact of Item Descriptions on Sales Performance)

  • 이동원;박성혁;문송천
    • 지능정보연구
    • /
    • 제18권4호
    • /
    • pp.1-17
    • /
    • 2012
  • 온라인 상에서 판매되는 상품은 매우 다양하지만, 소비자에게 판매 가격을 제시하거나 소개글을 통해서 상품에 대한 구체적인 설명을 제공한다는 점은 모든 상품에 있어서 가장 기본이 되는 공통적인 특징이다. 만약, 상품의 실제 품질이나 가격과는 독립적으로 상품 소개글이 판매에 미치는 영향력을 파악할 수 있다면 어떠한 소개글이 상품의 판매를 촉진하는 측면에서 더 좋은 글인지 분별할 수 있게 된다. 이런 관점에서 본 연구는 상품 소개글과 판매 성과의 관계를 파악하기 위한 목적으로 수행되었으며, 구체적으로는 온라인 시장에서 한글로 작성된 상품 소개글에 쓰인 각각의 표현 별로 소비자가 구매를 결정하는 데에 어떤 영향을 미치는지를 분석하고자 하였다. 한글 형태소 분석기를 사용하여 국내 앱 시장에서 수집된 앱 소개글 및 판매이력 데이터로부터 상품을 설명하는 주요 속성과 그 속성에 대한 평가를 추출하였으며, 추출된 키워드를 입력 변수로 구성한 계량경제학 모형을 구축하였고, 구체적으로 특정 표현들이 판매 성과에 미치는 영향을 구축된 모형을 사용하여 계량적으로 측정하였다. 앱의 카테고리 별로 표현의 종류가 상이하게 나타남이 관찰됨에 따라, 분석은 각 카테고리 별로 수행되었다. 유료 앱과 무료 앱에 대해서 데이터 분석을 수행한 결과, 판매 성과에 영향을 미치는 '속성과 평가' 키워드를 그 영향력의 크기 별로 파악할 수 있었으며, 특히 무료 앱의 경우는 무료로 이용할 수 있음에도 불구하고 품질이 좋다는 것을 강조했을 때 판매량을 더 높일 수 있다는 것이 확인되었다. 본 연구는 모바일 앱에 대해 수행되었으나, 온라인에서 거래되는 다양한 상품에 대해서도 소개글이 판매 성과에 미치는 영향을 분석할 수 있는 모형으로 활용될 수 있다. 마지막 장에서는 기업의 마케팅 매니저가 본 연구에서 제시하는 연구 방법론과 분석 결과를 활용할 수 있는 방안을 제시하였다.

지식베이스 확장을 위한 멀티소스 비정형 문서에서의 정보 추출 시스템의 개발 (Development of Information Extraction System from Multi Source Unstructured Documents for Knowledge Base Expansion)

  • 최현승;김민태;김우주;신동욱;이용훈
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.111-136
    • /
    • 2018
  • 지식베이스를 구축하는 작업은 도메인 전문가가 온톨로지 스키마를 이해한 뒤, 직접 지식을 정제하는 수작업이 요구되는 만큼 비용이 많이 드는 활동이다. 이에, 도메인 전문가 없이 다양한 웹 환경으로부터 질의에 대한 답변 정보를 추출하기 위한 자동화된 시스템의 연구개발의 필요성이 제기되고 있다. 기존의 정보 추출 관련 연구들은 웹에 존재하는 다양한 형태의 문서 중 학습데이터와 상이한 형태의 문서에서는 정보를 효과적으로 추출하기 어렵다는 한계점이 존재한다. 또한, 기계 독해와 관련된 연구들은 문서에 정답이 있는 경우를 가정하고 질의에 대한 답변정보를 추출하는 경우로서, 문서의 정답포함 여부를 보장할 수 없는 실제 웹의 비정형 문서로부터의 정보추출에서는 낮은 성능을 보인다는 한계점이 존재한다. 본 연구에서는 지식베이스 확장을 위하여 웹에 존재하는 멀티소스 비정형 문서로부터 질의에 대한 정보를 추출하기 위한 시스템의 개발 방법론을 제안하고자 한다. 본 연구에서 제안한 방법론은 "주어(Subject)-서술어(Predicate)"로 구분된 질의에 대하여 위키피디아, 네이버 백과사전, 네이버 뉴스 3개 웹 소스로부터 수집된 비정형 문서로부터 관련 정보를 추출하며, 제안된 방법론을 적용한 시스템의 성능평가를 위하여, Wu and Weld(2007)의 모델을 베이스라인 모델로 선정하여 성능을 비교분석 하였다. 연구결과 제안된 모델이 베이스라인 모델에 비해, 위키피디아, 네이버 백과사전, 네이버 뉴스 등 다양한 형태의 문서에서 정보를 효과적으로 추출하는 강건한 모델임을 입증하였다. 본 연구의 결과는 현업 지식베이스 관리자에게 지식베이스 확장을 위한 웹에서 질의에 대한 답변정보를 추출하기 위한 시스템 개발의 지침서로서 실무적인 시사점을 제공함과 동시에, 추후 다양한 형태의 질의응답 시스템 및 정보추출 연구로의 확장에 기여할 수 있을 것으로 기대한다.