• 제목/요약/키워드: Customer management system

검색결과 1,619건 처리시간 0.026초

부정 탐지를 위한 이상치 분석 활용방안 연구 : 농수산 상장예외품목 거래를 대상으로 (A Study on the Application of Outlier Analysis for Fraud Detection: Focused on Transactions of Auction Exception Agricultural Products)

  • 김동성;김기태;김종우;박성기
    • 지능정보연구
    • /
    • 제20권3호
    • /
    • pp.93-108
    • /
    • 2014
  • 기업 의사 결정 지원을 위하여 거래 데이터를 다양한 관점에서 분석하고 활용하려는 노력과 관심들이 증가하고 있다. 이러한 노력들은 고객 관리나 마케팅에만 국한되는 것이 아니라 부정행위에 대한 감시와 탐지를 목적으로도 다양한 분석 방안들이 연구되고 있다. 부정행위는 기술의 발전을 악용하여 다양한 형태로 진화하고 있으며, 이에 따라 목적에 맞는 부정탐지 방안 연구와 적용을 통하여 탐지 효용의 극대화를 위한 노력의 필요성이 증가하고 있다. 이러한 연구 동향의 일환으로 본 연구에서는 대용량 거래 데이터가 저장 관리되고 있는 국내 최대 농수산물 유통 시장의 2008년부터 2010년까지 상장예외품목의 거래 가격을 분석하여 부정 탐지 규칙을 도출하였으며, 전문가 검증을 통하여 도출 된 규칙의 신뢰성을 확보하였다. 본 연구의 주요 부정거래 분석 방안으로는 정상적인 데이터들은 발생 확률이 높은 반면에 특이한 데이터들의 발생 확률은 낮다고 가정하는 통계적 접근을 통한 이상치 식별 방안을 활용하였다. 이에 따라 부정거래 분석 별로 정의 된 Z-Score 값보다 클 경우 부정거래 탐지 대상이 된다. 다만 상장예외품목 거래의 경우 취급 가능한 중도매인의 수가 제한되어 있으며, 일반적인 상장품목의 거래보다 거래량이 적기 때문에 소수의 이상치가 품목의 평균에 미치는 영향이 크다. 그 예로 다른 소수의 중도매인들이 해당 품목을 정상적인 가격에 거래하였더라도, 특정한 중도매인 한 명이 지나치게 비정상적인 가격에 거래할 경우 모든 거래들이 부정거래로 탐지 될 가능성도 있다. 이러한 문제를 해결하기 위하여 기존의 Z-Score의 개념을 활용하여 수정된 Z-Score(Self-Eliminated Z-Score)를 사용하였다. 또한 부정 유형별 탐지 규칙 관리와 활용을 위한 시스템 프로토타입(prototype) 개발을 수행하였다. 이를 통하여 실제 부정거래 탐지 업무에 적용할 수 있는 효과적인 방안을 제시하였고, 농수산 유통시장의 공정성 및 투명성 확보를 위한 관리 감독의 기능 강화가 가능할 것이다.

호텔 산업의 서비스 품질 향상을 위한 토픽 마이닝 기반 분석 방법 (An Analytical Approach Using Topic Mining for Improving the Service Quality of Hotels)

  • 문현실;성다윗;김재경
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.21-41
    • /
    • 2019
  • 정보 기술의 발전으로 온라인에서 활용 가능한 데이터의 양이 급속히 증대되고 있다. 이러한 빅데이터 시대에 많은 연구들이 통찰력을 발견하고 데이터의 효과를 입증하기 위해 노력하고 있다. 특히 관광 산업의 경우 정보에 민감한 사업으로 소셜 미디어의 영향력이 높고 소셜 미디어의 상품 후기에 소비자들이 영향을 많이 받아 많은 기업과 연구자들이 소셜 미디어를 분석하여 새로운 서비스 및 통찰력을 얻고자 시도하였다. 하지만 소셜 미디어의 후기는 텍스트로 이루어진 대표적인 비정형 데이터로 적절한 처리를 하지 않으면 분석에 활용할 수 없다. 또한 후기 데이터의 양이 방대함에 따라 사람이 직접 분석하기도 어려운 실정이다. 따라서, 본 연구에서는 이러한 소셜미디어 상의 온라인 후기로부터 직접 호텔의 서비스 품질 향상을 위한 통찰력을 추출할 수 있는 분석 방법을 제시하고자 한다. 이를 위해 본 연구에서는 먼저 후기 데이터에 포함되어 있는 주제어를 추출하는 토픽 마이닝 기법을 적용하였다. 토픽 마이닝은 대용량의 문서 집합으로부터 문서를 대표하는 단어 집합을 추출하는 기법을 의미하며 본 연구에서는 다양한 연구에서 활용되고 있는 LDA모형을 사용하여 토픽 마이닝을 수행하였다. 하지만, 토픽 마이닝 자체만으로는 주제어와 평점 사이의 관계를 도출할 수 없어 서비스 품질 향상을 위한 통찰력을 발견하기 어렵다. 그에 따라 본 연구에서는 토픽 마이닝의 결과값을 기반으로 의사결정나무 모형을 사용하여 주제어와 평점 사이의 관계를 도출하였다. 이러한 방법론의 유용성을 평가하기 위해 홍콩에 있는 4개 호텔의 온라인 후기를 수집하고 제안한 방법론의 분석 결과를 해석하는 실험을 진행하였다. 실험 결과 긍정 후기를 통해 각 호텔이 유지해야할 서비스 영역을 발견할 수 있었으며 부정 후기를 통해 개선해야할 서비스 영역을 도출할 수 있었다. 따라서, 본 연구에서 제안한 방법론을 사용하여 방대한 양의 후기 데이터로부터 서비스 개선 및 유지 영역을 발견할 수 있으리라 기대된다.

항공서비스 소비자 분쟁해결제도의 개선방안 (The Improvement Measurement on Dispute Resolution System for Air Service Customer)

  • 이강빈
    • 항공우주정책ㆍ법학회지
    • /
    • 제33권2호
    • /
    • pp.225-266
    • /
    • 2018
  • 2017년 한국소비자원에 접수된 항공여객운송서비스 관련 피해구제 접수건수는 1,252건으로 2016년 1,262건 대비 0.8% 감소하여 2013년 이후 처음으로 감소세를 나타냈다. 그리고 2017년 한국소비자원에 접수된 항공여객운송서비스 분야의 피해구제 접수건 가운데 444건(35.4%)이 합의가 성립되었으며, 합의가 성립되지 않은 건 중에서 정보제공 상담 기타로 종결된 경우가 588건(47.0%)으로 가장 많았고, 소비자분쟁조정위원회에 조정 신청된 경우가 186건(14.9%)이었다. 항공서비스 소비자 피해구제와 분쟁해결을 위한 규정을 두고 있는 주요입법으로는 항공사업법, 소비자기본법 등이 있는데, 항공사업법에서 항공교통사업자의 피해구제절차와 처리계획의 수립 및 이행 그리고 피해구제 신청 접수 및 처리, 항공교통이용자 보호기준의 고시 등에 관하여 규정하고 있으며, 소비자기본법에서 소비자상담기구의 실치 운영, 한국소비자원의 피해구제, 소비자분쟁의 조정, 소비자분쟁해결기준의 제정 등에 관하여 규정하고 있다. 항공서비스 소비자 피해구제 절차로는 항공교통사업자의 피해구제 접수 처리, 소비자상담센터의 상담 및 피해구제 접수 처리, 한국소비자원의 합의권고, 소비자분쟁조정위원회의 분쟁조정제도 등이 있다. 현행 항공서비스 소비자 피해구제 및 분쟁조정 제도에는 항공사업법 상 항공교통사업자의 피해구제계획 수립 및 이행 의무의 면제, 항공부문 소비자분쟁해결기준 상 운송 불이행 및 지연의 경우 면책 등에 대하여 문제점이 있고, 그리고 소비자기본법상 소비자분쟁조정의 절차진행 및 조정성립에 대하여 한계점이 있다. 따라서 항공서비스 소비자에 대한 적절한 피해구제와 원활한 분쟁조정을 위하여 관련 제도의 개선방안을 제시하면 다음과 같다. 첫째 항공서비스 소비자 피해구제 관련 법규의 정비이다. 항공사업법 상 항공교통사업자의 피해구제계획 수립과 이행 의무의 면제규정이 수정되어야 할 것이다. 또한 항공서비스 소비자 보호와 피해구제에 관한 법 규정의 체계화와 전문성 제고를 위해 미국연방규칙 14 CFR 및 EU의 EC 261/2004 규칙과 유사한 별도 입법을 마련할 필요가 있을 것이다. 둘째 항공서비스 소비자 분쟁해결기준의 개선이다. 항공부문 소비자분쟁해결기준 상 항공사업자의 운송 불이행 및 운송지연의 경우 면책사유의 발생 원인이 불가항력이었는지를 규명하여 면책여부를 판별하여야 하고, 상법 항공운송편 및 1999년 몬트리올 협약에 규정된 면책사유와 같이 수정되어야 하며, 대체편이 제공된 운송 불이행의 경우와 운송지연에 대하여 배상기준을 통일하는 것이 필요할 것이다. 셋째 항공서비스 소비자 피해구제를 위한 정보제공의 강화이다. 항공관련 정부기관 및 유관기관들은 항공사 및 공항과 협력하여 항공서비스 소비자 피해구제를 위한 법규와 정책 등 다양한 정보를 항공교통이용자에게 보다 신속 명확하게 제공해야 할 것이다. 넷째 소비자분쟁조정의 효력 등에 관한 보완이다. 분쟁조정에 대한 수락 의사표시가 없을 경우 수락한 것으로 보는 것은 부당하므로 이의신청제도를 추가할 필요가 있을 것이다. 또한 소비자분쟁조정위원회 이외 다른 분쟁조정기구에 중복으로 분쟁해결을 신청한 경우 피해구제 대상에서 제외하고 있으나 당사자가 조정기관을 선택할 수 있도록 해야 할 것이다. 그리고 소비자분쟁이 조정을 통하여 효율적으로 해결될 수 있도록 조정성립률을 높일 수 있는 제도적 방안을 강구할 필요가 있을 것이다. 다섯째 항공서비스 소비자 중재제도의 도입이다. 소비자분쟁 조정제도의 한계점을 보완할 수 있는 방안으로 소비자 중재제도를 도입하되, 소비자기본법 상 중재 도입안과 중재법 상 소비자중재 도입안이 있는데, 후자의 방안이 적합할 것으로 생각된다. 결론적으로, 정책과제로서 항공서비스 소비자의 피해 예방 및 구제를 강화하는 법 제도를 마련하고, 항공서비스 선진화를 위한 소비자 중심의 정책을 수립 추진해야 할 것이다.

정보보호 통제활동이 조직유효성에 미치는 영향 : 정보활용의 조절효과를 중심으로 (The Effect of Information Protection Control Activities on Organizational Effectiveness : Mediating Effects of Information Application)

  • 정구헌;정승렬
    • 지능정보연구
    • /
    • 제17권1호
    • /
    • pp.71-90
    • /
    • 2011
  • 본 연구는 정보보호의 통제활동(물리적 보안, 관리적 보안, 기술적 보안)이 조직유효성에 미치는 영향과 정보 활용의 조절효과를 실증적으로 분석하는데 목적을 갖고 연구하였는데 그 결과를 요약하면 다음과 같다. 첫째, 정보보호 통제활동(물리적 보안, 기술적 보안, 관리적 보안)이 조직유효성에 미치는 영향을 검증한 결과 물리적 보안, 기술적 보안, 관리적 보안요인이 조직유효성에 통계적으로 유의한 정(+)의 영향을 미치는 것으로 나타났다(p < .01). 둘째, 정보보호 통제활동(물리적 보안, 기술적 보안, 관리적 보안)이 정보 활용에 미치는 영향을 검증한 결과 기술적 보안, 관리적 보안요인이 정보 활용에 통계적으로 유의한 정(+)의 영향을 미치는 것으로 나타났다(p < .01). 셋째, 조직유효성에 영향을 미치는 정보보호 통제활동(물리적 보안, 기술적 보안, 관리적 보안)이 정보 활용에 의해 조절되는지를 검증하기 위해 정보보호 통제활동(물리적 보안, 기술적 보안, 관리적 보안)과 정보 활용의 상호작용 변수를 추가적으로 투입한 모델의 설명력은 50.6%로 4.1%가 추가적으로 증가하였고, 추가적으로 투입된 상호작용 변수들 중에는 물리적 보안과 정보 활용의 상호작용 요인(${\beta}$ = .148, p < .01), 관리적 보안과 정보 활용의 상호작용 요인(${\beta}$ = .196, p < .01)이 통계적으로 유의미한 것으로 나타나(p < .01), 정보 활용은 통제활동 중 물리적 보안, 관리적 보안요인과 조직유효성 간의 관계를 조절하는 것으로 시사해 주었다. 이상의 결과를 볼 때, 정보보호를 위한 내부 통제활동으로서 물리적, 기술적, 관리적 요인이 정보활용 정도에 따라 조직유효성에 매우 유의적인 영향을 미치는 주요 기제임을 입증시켜 주었다. 이는 정보보호 통제활동에 있어서 물리적, 기술적, 관리적 보안요인이 모두 효율적으로 잘 수행될수록 정보활용 또한 높고 효율적으로 통제되고 정보활용이 조절 되는 것으로 나타내 이들 세 가지 요인 모두 유용한 정보활용을 위한 변수임을 실증해 주었다. 이 실증된 정보활용의 조절정도나 난이도에 따른 정보보호를 위한 조직효율성에서 종사자의 내부 고객만족과 정보관리의 효율, 위험리스크 감소에 매우 유의적인 성과를 나타내 주는 촉진기제로서 작용함을 시사한 것이라 볼 수 있다.

SNS 사용특성, 대출특성, 개인특성이 신용대출 상환에 미치는 영향에 관한 연구 (A Study on the Impact of SNS Usage Characteristics, Characteristics of Loan Products, and Personal Characteristics on Credit Loan Repayment)

  • 정원훈;이재순
    • 벤처창업연구
    • /
    • 제18권5호
    • /
    • pp.77-90
    • /
    • 2023
  • 본 연구의 목적은 SNS 사용특성과 대출상품의 특성, 개인특성이 신용대출 상환에 미치는 영향력을 확인하여 SNS를 활용하는 대안신용평가가 기존 대출심사를 보완할 수 있는지를 검증하기 위함이다. 이를 위해 SNS를 활용하여 실제 대출심사에 반영하고 있는 T사 A 신용대출 프로그램 데이터를 이용하여 SNS 사용특성, 대출특성, 개인특성이 신용대출 상환에 미치는 영향력을 이항로지스틱 회귀분석을 통해 분석하였다. 분석결과 첫째, 사용자의 성격 및 개별 특성을 나타내는 프로필 사진의 경우 본인을 드러내지 않으려고 프로필 사진을 등록하지 않은 사람들과 달리 외향적인 경향의 사람이 선택할 가능성이 큰 본인 사진, 가족, 친구 등의 사적그룹 사진, 성실성의 경향이 강한 사람이 선택할 확률이 높은 취미 등 사회활동 사진, 개방성과 신경성이 높은 경향의 사람이 많이 선택하는 캐릭터·유머 사진, 개인의 사생활과 직결되는 가족·친구 등 사진을 SNS에 사용하는 사람들일수록 신용대출 상환에 적극적인 것으로 나타났다. 본인을 감추는 풍경 등의 사진 사용과 신용대출 상환과의 인과관계는 통계적으로 유의하지 않은 것으로 나타났다. 또한, SNS 사용량이 많을수록 신용대출 상환가능성이 높아지는 것으로 나타났다. 반면 SNS 소통량은 신용대출 상환가능성에 유의한 영향을 미치지 않는 것으로 나타났는데, 이는 소통량이라는 변수가 사용자가 직접 작성한 글보다는 타인의 댓글에 대한 공감을 나타내는 수동적 측면이 강하기 때문에 나타난 결과라 판단된다. 대출채권이 가진 특성을 나타내는 대출기간과 대출횟수도 신용대출 상환에 통계적으로 유의한 영향을 미치는 것으로 나타났다. 이는 대출기간과 대출횟수가 소액대출 상품에서도 중요한 영향요소로 고려되어야 함을 의미한다. 개인 특성 변수 중에서는 성별만 유의하게 나타났다. 이는 분석에 사용한 대출프로그램이 은행 등의 금융기관에서 대출이 불가능한 저신용 점수를 가진 20~30대 고객이 대부분인 상품으로 이용자의 나이와 신용점수에 있어서 차별성이 크지 않다는 것을 의미한다. 본 연구는 SNS사용량과 프로필 사진 등 기존 신용평가 연구에서 다루지 않은 변수를 사용하여 신용대출 상환과의 영향관계를 실증분석 하였다는 점에서 기존 연구와 차별성을 갖는다. SNS와 같은 주관적 비정형정보를 서민지원 대출심사에 활용한다면, 신용거래가 없어서 신용등급이 낮거나 단기적 유동성 함정에 빠진 차입자 즉 금융이력부족자(Thin filer)들이 신용거래 등의 금융 이력이 축적될 때까지의 신용비용에 대한 불이익을 감소시킬 수 있다는 점에서 의의가 있다.

  • PDF

가상현실 웨어러블 기기의 구매 촉진을 위한 태도 자신감과 사용자 저항 태도: 가상현실 헤드기어를 중심으로 (Attitude Confidence and User Resistance for Purchasing Wearable Devices on Virtual Reality: Based on Virtual Reality Headgears)

  • 손봉진;박다슬;최재원
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.165-183
    • /
    • 2016
  • 스마트폰을 넘어 차세대 IT 비즈니스의 주목할 만한 후보군으로 가상현실이 이슈가 되고 있다. 가상현실은 컴퓨터와 VR헤드셋을 통해 구현한 입체적인 가상공간을 제공함으로써 사용자의 시각을 완전히 장악하고, 청각, 촉각 등 오감과의 상호작용 및 음성, 동작인식 등을 통해 가상공간을 마치 현실처럼 느끼게 한다는 점에서 향후 주목할 만한 산업 분야로 떠오르고 있다. 많은 글로벌 대기업들이 가상현실과 관련한 사업에 투자를 하고 있으나 소비자의 관점에서 가상현실 관련 제품군은 아직 쉽게 접하거나 구매하기 어려운 제품군으로 인식된다. 그렇기 때문에 소비자의 태도 변화가 큰 변화가 발생되고 있지 않으며 Acception & Diffusion 모델의 초기단계에 지나지 않아 구매로 연결되지 않는 실정이다. 본 연구는 기존 선행연구의 관점을 바탕으로 가상현실 헤드기어 제품들의 판매 촉진을 위한 사용자 관점에서의 사용자 저항을 매개 변수로 저항을 감소시키고 사용 및 구매의도에 영향을 주는 선행요인들을 도출하고자 하였으며 사용자가 가지고 있는 태도에 대한 자신감에 영향을 주어 행동 의도까지 변화시키는 현상에 대한 분석을 하고자 하였다. 본 연구의 결과는 태도 자신감에 대한 사용 용이성과 사용 혁신성의 영향력을 확인할 수 있었다. 마찬가지로 사용자 혁신저항에 영향력을 주는 변수로는 가격, 심미적 외관, 즐거움, 콘텐츠 및 화질 관련 변수들을 도출하였다. 결과적으로 본 연구는 태도 자신감의 가상현실 혁신 수용에 대한 영향력을 제시하고 가격 이외 변수인 콘텐츠의 양과 저항감의 관계성을 바탕으로 관련 변수들을 제시하였다. 특히 초기 시장인 가상현실 제품의 특성에 따라 브랜드에 대한 선점효과의 필요성과 콘텐츠의 부족함 등이 실무적으로 해결해야 할 과제로서 확인되었다.

재래시장 환경개선 지원정책 개발에서의 지역 장소적 기능 도입 (Introduction of region-based site functions into the traditional market environmental support funding policy development)

  • 정대용;이세호
    • 한국유통학회:학술대회논문집
    • /
    • 한국유통학회 2005년도 춘계학술대회 발표논문집
    • /
    • pp.383-405
    • /
    • 2005
  • 재래시장은 지역의 중심지적인 특성과 문화적인 특성이 고스란히 반영된 지역 거점지이며 인근 지역주민의 상거래라는 1차적 장소적 기능과 사회문화적 측면의 상호 정보문화교류, 커뮤니티 공간 형성으로 유통의 집객시설과 집적시설로서 중요한 역할과 기능을 하고 있다. 5인 이하 가족 단위의 생계형으로 취급상품, 구입방범, 판매방식 등이 전근대적인 경영기법을 통해 한국의 대표적 소매업태로서의 역할을 해오고 있다. 1990년대 이후 신유통업태와 대형할인점 진출로 인해 재래시장은 급격한 경쟁력 상실과 소비자들의 생활수준의 향상, 구매패턴의 변화, 인터넷의 급속한 확산 등 외부적인 유통 환경변화에서 경쟁력을 상실하고 설 자리를 잃어가고 있다. 정부의 지역경제 활성화와 국민경제의 발전 측면에서 고령화된 재래시장에 대한 대책 중 정부의 예산지원 정책으로 환경개선사업, 연구용역, 경영현대화중심의 국고지원 사업은 2001년부터 2004년까지 총 3,853억원의 국고가 지원되었으나 활성화 사업의 실효성에는 아직 정확히 나타나고 있지 않은 상황으로 조사되었다. 또한 지원사업을 추진함에 있어 시장상인리더들의 전문성결여로 종합적인 추진전략과 중장기적 계획수립 및 자발적인 상인들의 합의점 유도 반감으로 지속적인 사업추진방향에 한계점을 나타냈다. 재래시장이 단순히 물건을 사고파는 물리적인 장소적 의미에서 벗어나 새로운 지역 장소적 생활공간으로 커뮤니티적 접근을 통한 장소적 창조전략이 필요하다. 이에 시대적 패러다임 변화에 따른 새로운 사업 방향 전환을 통해 재래시장의 장소적 기능 도입을 동해 문화적 경제적 의미를 지닌 공간으로 재조명을 동해 발전방향을 제시하고자 한다. 재래시장은 지역 기반으로 한 지역생활자들과 자연스럽게 커뮤니티를 상호 형성하고 정보와 지식 공유를 통해 부 창출 공간으로 재생되어야 할 것이다 재래시장이 부 창출 공간으로 재생하려면 시대적 장소적 환경에 맞는 시설과 교류활동을 통찬 상호신뢰구축 활동 속에서 고객이 원하는 방향으로 영업환경도 변화하여야 하며, 지역단위 중심 영국의 TCM, 미국의 BID, 일본의 TMO 등 해외 벤치마킹을 통한 단위 시장상가 점포단위의 점(點)정책에서 선(線)단위의 상가로 환경사업과 거시적인 지역단위중심인 면(面) 정책적 접근을 통한 커뮤니티적인 발상 전환이 필요하다. 국내외 사례비교 분석을 통해 사회적 정책수요 발굴과 기존의 추진방법에 대한 선진사례 연구를 통한 NPO, NGO 등의 시민기업가와 이를 수행키 위한 혁신성과 전문성조정능력을 갖춘 리더자 양성이 무엇보다 중요하다. 특히 지역자원 활용 소스 중심의 문화관린 산업의 seeds 발굴과 향토상품의 상품화와 네트워크 조직망 구축을 위한 지역중심의 복합 생활문화 공간이 필요할 것이며, 이를 촉진키 위한 mentor academy시스템 접근을 통해 점점 고령화되어 가고 있는 재래시장에 대해 차별적 특성이 반영된 종합적이고 체계적 접근 방법연구가 필요하다.

  • PDF

불균형 데이터 집합의 분류를 위한 하이브리드 SVM 모델 (A Hybrid SVM Classifier for Imbalanced Data Sets)

  • 이재식;권종구
    • 지능정보연구
    • /
    • 제19권2호
    • /
    • pp.125-140
    • /
    • 2013
  • 어떤 클래스에 속한 레코드의 개수가 다른 클래스들에 속한 레코드의 개수보다 매우 많은 경우에, 이 데이터 집합을 '불균형 데이터 집합'이라고 한다. 데이터 분류에 사용되는 많은 기법들은 이러한 불균형 데이터에 대해서 저조한 성능을 보인다. 어떤 기법의 성능을 평가할 때에 적중률뿐만 아니라, 민감도와 특이도도 함께 측정하여야 한다. 고객의 이탈을 예측하는 문제에서 '유지' 레코드가 다수 클래스를 차지하고, '이탈' 레코드는 소수 클래스를 차지한다. 민감도는 실제로 '유지'인 레코드를 '유지'로 예측하는 비율이고, 특이도는 실제로 '이탈'인 레코드를 '이탈'로 예측하는 비율이다. 많은 데이터 마이닝 기법들이 불균형 데이터에 대해서 저조한 성능을 보이는 것은 바로 소수 클래스의 적중률인 특이도가 낮기 때문이다. 불균형 데이터 집합에 대처하는 과거 연구 중에는 소수 클래스를 Oversampling하여 균형 데이터 집합을 생성한 후에 데이터 마이닝 기법을 적용한 연구들이 있다. 이렇게 균형 데이터 집합을 생성하여 예측을 수행하면, 특이도는 다소 향상시킬 수 있으나 그 대신 민감도가 하락하게 된다. 본 연구에서는 민감도는 유지하면서 특이도를 향상시키는 모델을 개발하였다. 개발된 모델은 Support Vector Machine (SVM), 인공신경망(ANN) 그리고 의사결정나무 기법 등으로 구성된 하이브리드 모델로서, Hybrid SVM Model이라고 명명하였다. 구축과정 및 예측과정은 다음과 같다. 원래의 불균형 데이터 집합으로 SVM_I Model과 ANN_I Model을 구축한다. 불균형 데이터 집합으로부터 Oversampling을 하여 균형 데이터 집합을 생성하고, 이것으로 SVM_B Model을 구축한다. SVM_I Model은 민감도에서 우수하고, SVM_B Model은 특이도에서 우수하다. 입력 레코드에 대해서 SVM_I와 SVM_B가 동일한 예측치를 도출하면 그것을 최종 해로 결정한다. SVM_I와 SVM_B가 상이한 예측치를 도출한 레코드에 대해서는 ANN과 의사결정나무의 도움으로 판별 과정을 거쳐서 최종 해를 결정한다. 상이한 예측치를 도출한 레코드에 대해서는, ANN_I의 출력값을 입력속성으로, 실제 이탈 여부를 목표 속성으로 설정하여 의사결정나무 모델을 구축한다. 그 결과 다음과 같은 2개의 판별규칙을 얻었다. 'IF ANN_I output value < 0.285, THEN Final Solution = Retention' 그리고 'IF ANN_I output value ${\geq}0.285$, THEN Final Solution = Churn'이다. 제시되어 있는 규칙의 Threshold 값인 0.285는 본 연구에서 사용한 데이터에 최적화되어 도출된 값이다. 본 연구에서 제시하는 것은 Hybrid SVM Model의 구조이지 특정한 Threshold 값이 아니기 때문에 이 Threshold 값은 대상 데이터에 따라서 얼마든지 변할 수 있다. Hybrid SVM Model의 성능을 UCI Machine Learning Repository에서 제공하는 Churn 데이터 집합을 사용하여 평가하였다. Hybrid SVM Model의 적중률은 91.08%로서 SVM_I Model이나 SVM_B Model의 적중률보다 높았다. Hybrid SVM Model의 민감도는 95.02%이었고, 특이도는 69.24%이었다. SVM_I Model의 민감도는 94.65%이었고, SVM_B Model의 특이도는 67.00%이었다. 그러므로 본 연구에서 개발한 Hybrid SVM Model이 SVM_I Model의 민감도 수준은 유지하면서 SVM_B Model의 특이도보다는 향상된 성능을 보였다.

CNN-LSTM 조합모델을 이용한 영화리뷰 감성분석 (Sentiment Analysis of Movie Review Using Integrated CNN-LSTM Mode)

  • 박호연;김경재
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.141-154
    • /
    • 2019
  • 인터넷 기술과 소셜 미디어의 빠른 성장으로 인하여, 구조화되지 않은 문서 표현도 다양한 응용 프로그램에 사용할 수 있게 마이닝 기술이 발전되었다. 그 중 감성분석은 제품이나 서비스에 내재된 사용자의 감성을 탐지할 수 있는 분석방법이기 때문에 지난 몇 년 동안 많은 관심을 받아왔다. 감성분석에서는 주로 텍스트 데이터를 이용하여 사람들의 감성을 사전 정의된 긍정 및 부정의 범주를 할당하여 분석하며, 이때 사전 정의된 레이블을 이용하기 때문에 다양한 방향으로 연구가 진행되고 있다. 초기의 감성분석 연구에서는 쇼핑몰 상품의 리뷰 중심으로 진행되었지만, 최근에는 블로그, 뉴스기사, 날씨 예보, 영화 리뷰, SNS, 주식시장의 동향 등 다양한 분야에 적용되고 있다. 많은 선행연구들이 진행되어 왔으나 대부분 전통적인 단일 기계학습기법에 의존한 감성분류를 시도하였기에 분류 정확도 면에서 한계점이 있었다. 본 연구에서는 전통적인 기계학습기법 대신 대용량 데이터의 처리에 우수한 성능을 보이는 딥러닝 기법과 딥러닝 중 CNN과 LSTM의 조합모델을 이용하여 감성분석의 분류 정확도를 개선하고자 한다. 본 연구에서는 대표적인 영화 리뷰 데이터셋인 IMDB의 리뷰 데이터 셋을 이용하여, 감성분석의 극성분석을 긍정 및 부정으로 범주를 분류하고, 딥러닝과 제안하는 조합모델을 활용하여 극성분석의 예측 정확도를 개선하는 것을 목적으로 한다. 이 과정에서 여러 매개 변수가 존재하기 때문에 그 수치와 정밀도의 관계에 대해 고찰하여 최적의 조합을 찾아 정확도 등 감성분석의 성능 개선을 시도한다. 연구 결과, 딥러닝 기반의 분류 모형이 좋은 분류성과를 보였으며, 특히 본 연구에서 제안하는 CNN-LSTM 조합모델의 성과가 가장 우수한 것으로 나타났다.