• 제목/요약/키워드: Information classification

검색결과 8,304건 처리시간 0.039초

대화식 데이터 마이닝 기법을 활용한 자동차 보험사의 인입 콜량 예측 사례 (A Case Study on Forecasting Inbound Calls of Motor Insurance Company Using Interactive Data Mining Technique)

  • 백웅;김남규
    • 지능정보연구
    • /
    • 제16권3호
    • /
    • pp.99-120
    • /
    • 2010
  • 최근 고객들의 비대면 접점 서비스 이용도가 높아짐에 따라, 비대면 채널은 다양한 데이터의 분석을 통해 고객 만족도를 향상시킬 수 있는 유용한 창구로 인식되고 있다. 이러한 비대면 채널의 대표적 영역으로 콜센터를 들 수 있으며, 콜센터 운영에서 고객 만족도에 가장 큰 영향을 미치는 요소는 상담 인력의 규모인 것으로 알려져 있다. 즉, 일정수준 이상의 고객 만족도를 유지하기 위해서는 충분한 상담 인력을 확보하는 것이 관건이지만, 불필요하게 많은 인력을 확보하는 것은 인건비 측면에서 비용의 낭비를 초래할 수 있다. 따라서 부족하지도 않고 넘치지도 않을 정도의 적정 인력을 산출하는 능력은 콜센터 운영의 핵심 경쟁력으로 인식되고 있으며, 최근 콜센터에서는 적정 인력의 규모를 예측하기 위해 WFM(Work Force Management) 업무 전담 부서를 설치하고 콜량을 정확하게 예측하기 위한 노력을 기울이고 있다. 콜량 예측을 위해 현업에서 주로 사용되는 방법은 담당자의 직관에 의존하는 방법으로, 일정기간의 콜량 평균을 담당자가 주관적 판단에 의해 보정함으로써 이루어진다. 하지만 이러한 방식은 담당자의 주관적 성향에 크게 좌우된다는 한계를 갖고 있어서, 최근에는 다양한 예측 모형을 시스템화한 WFMS(Workforce Management System) 패키지가 널리 활용되고 있다. 하지만 이 시스템은 초기 도입 시 매우 고가의 구축비용이 발생하며, 신규 요인 발굴 시 이를 즉각적으로 시스템에 반영하기 어렵다는 한계점을 갖고 있다. 이를 극복하기 위해 본 연구에서는 데이터 마이닝의 대화식 의사결정나무 기법을 이용함으로써, 객관적이면서도 업무 배경 지식을 충분히 활용할 수 있는 예측 모형을 수립하고자 한다. 또한, 본 연구에서 수립한 모형의 정확성 평가를 위해, 국내 최대 규모의 한 자동차 보험사 콜센터의 4년 8개월 간의 실 데이터를 사용한 실험을 수행하고 그 결과를 제시하였다. 실험에서는 기존의 WFMS와 본 연구에서 제안하는 두 가지 모형인 대화식 의사결정나무 기반의 예측 모형, 일반 의사결정나무 기반의 예측 모형의 세 가지 모형에 대해, 다양한 오차 허용범위 하에서의 사고콜 및 고장콜에 대한 예측 적중률을 평가하였다.

웹툰 콘텐츠 추천을 위한 소비자 감성 패턴 맵 개발 (Development of Customer Sentiment Pattern Map for Webtoon Content Recommendation)

  • 이준식;박도형
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.67-88
    • /
    • 2019
  • 웹툰은 인터넷의 특징적 요소들을 활용하여 제작되는 만화 콘텐츠를 온라인 환경에서 소비 가능한 형태로 유통하는 한국형 디지털 만화 플랫폼이다. 최근 웹툰 산업의 급격한 성장과 함께 웹툰 콘텐츠의 공급량이 기하급수적으로 증가함에 따라, 효과적인 웹툰 콘텐츠 추천 방안의 필요성이 커지고 있다. 웹툰은 회화적 요소와 문학적 요소, 디지털 요소의 복합적 산물로서, 독자로 하여금 재미를 느끼게 하고 웹툰이 연출하는 상황에 이입·공감하게 하는 등 소비자의 감성을 자극하는 디지털 콘텐츠 상품이다. 따라서 웹툰이 소비자에게 전달하는 감성이 소비자가 웹툰을 선택함에 있어 중요한 기준으로 작용할 것이라 기대할 수 있다. 본 연구는 기존에 충분히 논의되지 않았던 소비자 감성을 중심으로, 웹툰 콘텐츠의 효과적인 추천을 지원할 수 있는 소비자 감성 패턴맵의 개발을 목적으로 한다. 본 연구의 수행을 위해 '네이버 웹툰' 플랫폼에서 서비스되는 200개 작품에 대한 메타데이터와 소비자 감성어휘 정보를 수집하였다. 분석 목적에 부합하지 않는 작품을 제외한 127개 작품에 대해 488개의 감성어휘가 수집되었다. 이후 수집된 감성어휘들 간 유사감성 통합, 중복감성 배제 과정을 Bottom-up 접근으로 수행하여 총 63개 감성유형으로 축소된 웹툰 특화 감성지표를 구축하였다. 구축한 감성지표에 대한 탐색적 요인분석을 수행하여 웹툰 유형을 분류할 수 있는 3개의 중요 차원을 도출하고, 이를 기준으로 K-Means 클러스터링을 수행하여 전체 웹툰을 4개 유형으로 분류하였다. 각각의 유형에 대해 웹툰-감성 2-Mode 네트워크를 구축하여 웹툰 유형별로 나타나는 감성 패턴의 특징을 살펴보았으며, 프로파일링 분석을 통해 웹툰 유형별 인사이트와 실무적으로 의미 있는 전략적 시사점을 도출할 수 있었다. 본 연구의 결과를 통해 웹툰의 추천 및 분류의 영역에서 소비자 감성의 활용 가능성을 확인하고, 웹툰 생태계 내 구성원들이 소비자를 보다 잘 이해하고 전략을 수립할 수 있도록 돕는 가이드라인을 제시하였다는 점에서 의의가 있다.

충동성이 모바일뱅킹 사용률에 미치는 영향: 신용카드 사용 여부의 조절효과와 SNS 중독의 매개효과 (Impact of impulsiveness on mobile banking usage: Moderating effect of credit card use and mediating effect of SNS addiction)

  • 이유미;남기환
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.113-137
    • /
    • 2021
  • 모바일뱅킹의 성장세 뚜렷한 가능성에 따라 이와 관련한 연구들이 다수 진행되고 있으나, 국내의 경우 기술적인 요소나 소비자의 이용 의도 및 행동, 만족에 대한 분석으로 집중되어 있는 실정이다. 또한 20대라는 견고한 고객층을 보유하였음에도 이러한 고객 집단을 특정하여 진행된 연구는 거의 찾아볼 수 없다. 모바일뱅킹이 한 단계 도약하기 위해서는 그 자체에 대한 연구뿐만 아니라 모바일뱅킹에 영향을 미치는 외부요인에 대한 연구를 통해 다양한 관점을 확보하는 전략이 필요하다. 따라서 본 연구는 20대의 모바일뱅킹에 유의미한 영향을 미칠 수 있는 다양한 외부요인 중 충동성, 신용카드사용 여부, SNS 중독을 분석하였다. 충동성의 네 가지 하위요인인 부정긴급성, 긍정긴급성, 계획성부족, 지속성부족과 모바일뱅킹 사용률 간의 관계를 검토하고, 여기에 신용카드 사용 여부가 영향을 미치는지 확인하였다. 또한 충동성의 각 하위요인과 SNS 중독의 세 가지 하위요인인 조절실패 및 일상생활장애, 몰입 및 내성, 부정정서회피 간의 관계를 탐색하였다. 이때 모바일 기반의 SNS 중독이 충동성과 모바일뱅킹 사용률 간의 관계에서 어떠한 매개효과를 보이는지 확인하였다. 이러한 분석을 위해 20대 남녀 150명을 대상으로 설문조사를 진행하였고, 수집된 자료는 SPSS Statistics 25 프로그램을 이용하여 연구문제에 따라 상관분석, 회귀분석 등을 실시하였다. 연구결과는 다음과 같다. 첫째, 긍정긴급성은 모바일뱅킹 사용률에 유의한 정적 영향을 미치는 것으로 나타났다. 둘째, 신용카드 사용 여부는 부정긴급성과 모바일뱅킹 사용률의 관계에서 조절효과를 보였다. 셋째, 충동성의 하위요인은 모두 SNS 중독의 하위요인과 유의미한 정적 관계가 있는 것으로 나타났다. 넷째, 긍정긴급성 및 SNS 중독, 모바일뱅킹 사용률의 관계에서 총효과와 직접효과가 나타나는 것으로 확인되었다.

글로벌 금융위기가 한국 기업의 투자지출에 미치는 영향에 대한 실증적 분석: 회계보수주의를 중심으로 (The Association Between Accounting Conservatism and Corporate Investment Expenditure in Korean Listed Firms During the Global Financial Crisis)

  • 김병호
    • 국제지역연구
    • /
    • 제22권3호
    • /
    • pp.121-148
    • /
    • 2018
  • 본 연구에서는 2007-2008의 글로벌 금융위기 기간 동안에 이중차분법 설계(Differences in Differences Design)를 사용해서 회계보수주의가 한국거래소에 상장된 비금융기업들의 투자 지출에 미치는 영향을 실증적으로 분석하였다. 구체적으로 본 연구에서는 신용위기 이전의 사전적 회계보수주의의 수준이 사후적인 투자 감소 정도를 설명하는데 도움이 되는지를 분석하였다. 실증적 분석결과, 과거의 연구들과 일치하게(Campello et al. 2010; Duchin et al. 2010) 기업들은 금융위기 기간 중에 투자의 감소를 경험하였다. 이에 추가로 더 보수적인 재무보고를 하는 기업들은 덜 보수적인 재무보고를 하는 기업들에 비하여 금융위기의 시작 이후에 투자의 감소폭이 더 작게 나타났다. 또한 과소투자로부터 손실이 발생할 가능성이 더 높은 기업들에서 더 보수적인 회계방법을 사용하는 기업들의 투자가 더 작게 감소된다는 것을 제시하였다. 또한 외부 자금조달에 대하여 상대적으로 더 큰 비용을 지불해야하는 기업들(재무적으로 제약된 기업들)과 외부자금조달의 필요성이 상대적으로 더 큰 기업들(내적 재무조달 자원이 부족한 기업들)에서 보수주의의 더 높은 효익을 발견하였다. 이러한 결과들은 보수주의 재무보고가 금융위기 기간 중에 과소투자를 완화시킨다는 해석을 지지하는 것이다. 본 연구 결과가 신용공급 충격이라기보다는 수요충격에 대한 민감성을 반영할 수도 있는 가능성을 검토하기 위하여 북한의 핵실험으로 비롯된 위기에 따른 부의 수요충격에 대하여 회귀분석을 실시하였다. 분석 결과 1년 이전의 보수주의 측정치는 북한의 핵실험에 따른 이후 기간의 투자와 관련성이 없는 것으로 나타났다. 이것은 본 연구 결과가 수요 충격으로 부터 발생하지 않았고, 공급 충격으로 발행하였다는 것을 제시한다. 마지막으로, 본 연구는 금융위기 기간 중에 회계보수주의의 역할이 채권의 발행과 주식수익률에 영향을 미치는가를 분석하였다. 분석 결과, 더 높은 수준의 보수주의를 사용하는 기업들이 금융위기 기간 중에 부채를 통한 자금조달 능력의 감소폭이 더 낮게 나타났다는 것을 발견하였다. 또한 더 높은 수준의 보수주의를 사용하는 기업들의 주식 가격 하락폭이 더 낮게 나타났다. 종합하면, 이러한 결과는 보수주의가 기업의 대출능력을 향상시키고 과소투자를 완화한다는 예상과 일치하는 것이다.

디지털 문화유산 ODA 적용에 관한 시론적 연구 -미얀마 문화유산 관리시스템을 중심으로- (A Study of the Application of 'Digital Heritage ODA' - Focusing on the Myanmar cultural heritage management system -)

  • 정성미
    • 헤리티지:역사와 과학
    • /
    • 제53권4호
    • /
    • pp.198-215
    • /
    • 2020
  • 공적개발원조(ODA)란 공여국(供與國)의 정부를 비롯한 공공기관이 개발도상국의 경제 발전과 사회 복지 증진을 위해 제공하는 원조를 의미한다. 이 연구의 목적은 문화예술 역량강화 ODA 사업의 일환으로 진행 중인 '미얀마 문화유산 관리시스템의 구축 과정을 살펴보며, 디지털 문화유산 ODA의 성과와 과제를 분석하는 것이다. 디지털 문화유산 관리시스템은 유·무형 문화유산 자료의 영속적인 보존과 지속가능한 활용을 위한 것이다. 문화유산을 디지털 아카이브즈에 저장하고, 컴퓨터 분석 기술을 이용해서 새롭게 접근하여, 다차원적으로 정보를 사용할 수 있다. 디지털 문화유산 ODA의 성과는 첫째, 미얀마의 문화유산 중에서 소멸, 훼손, 변질, 왜곡될 가능성이 큰 문화유산의 '위험성'을 극복하고 기록화 함으로써 디지털화가 시급히 필요한 문화유산의 내용을 영구 보존할 수 있게 되었다. 둘째, 미얀마 문화유산 정보를 체계적으로 관리하고 자료 간 연계성을 통해 여러모로 활용할 수 있게 되었다. 셋째, 문화유산이 소재하거나 전승되고 있는 정확한 지리적 위치 정보를 기반으로 한 문화지도 구현이 가능하다. 학술적·정책적·실용적 목적으로 활용의 효용성과 편의성을 극대화할 수 있도록 다양한 문화유산을 총체적, 집약적으로 시각화했다. 넷째, 공여국과 수원국과의 관계에서 문화 ODA가 갖는 일방적일 수 있는 한계를 극복할 수 있었다. 다섯째, 문화 ODA에서 가장 핵심적이라고 할 수 있는 지속가능한 개발이 될 수 있는 수원국 담당자들의 역량강화 프로그램이 함께 운영되었다. 여섯째, 팬데믹(pandemic) 상황에서 국가 간 인력 이동 없이 비교적 원활하게 비대면으로 진행할 수 있는 ODA라는 시사점이 있다. 그러나 향후 활발한 논의와 고민을 통해 해결해야 할 다음과 같은 과제도 남겨졌다. 첫째, 시스템에 업로드 된 자료의 내용에 대한 검증이 이루어져야 한다. 둘째, 디지털 문화유산을 보존하기 위해서 여러 위협으로부터 안전하게 보호해야 한다. 예컨대 컴퓨터 바이러스, 저장된 데이터나 작동시스템에 대한 에러를 대비할 수 있는 현지 전문가 양성이 필요하다. 셋째, 컴퓨터 기술이 빠르게 변화하는 환경의 특성상 ODA 사업 종료 이후에 새로운 버전과 프로그램이 개발되거나 개발자가 지속해서 관리하지 않았을 때 뒤따르는 문제에 대한 방안도 논의되어야 한다. 넷째, 미얀마의 정치적 판단에 따라 분류 체계 기준이 정해지고, 자료 공개 여부가 결정되기 때문에 수원국 측에 문화 ODA 사업의 궁극적인 목적을 이해시켜야 한다.

인공지능의 사회적 수용도에 따른 키워드 검색량 기반 주가예측모형 비교연구 (Comparison of Models for Stock Price Prediction Based on Keyword Search Volume According to the Social Acceptance of Artificial Intelligence)

  • 조유정;손권상;권오병
    • 지능정보연구
    • /
    • 제27권1호
    • /
    • pp.103-128
    • /
    • 2021
  • 최근 주식의 수익률과 거래량을 설명하는 주요 요인으로서 투자자의 관심도와 주식 관련 정보 전파의 영향력이 부각되고 있다. 또한 인공지능과 같은 혁신 신기술을 개발보급하거나 활용하려는 기업의 경우 거시환경 및 시장 불확실성 때문에 기업의 미래 주식 수익률과 주식 변동성을 예측하기 어렵다는 문제를 가지고 있다. 이는 인공지능 활성화의 장애요인으로 인식되고 있다. 따라서 본 연구의 목적은 인공지능 관련 기술 키워드의 인터넷 검색량을 투자자의 관심 척도로 사용하여, 기업의 주가 변동성을 예측하는 기계학습 모형을 제안하는 것이다. 이를 위해 심층신경망 LSTM(Long Short-Term Memory)과 벡터자기회귀(Vector Autoregression)를 통해 주식시장을 예측하고, 기술의 사회적 수용 단계에 따라 키워드 검색량을 활용한 주가예측 성능 비교를 통해 기업의 투자수익 예측이나 투자자들의 투자전략 의사결정을 지원하는 주가 예측 모형을 구축하였다. 또한 인공지능 기술의 세부 하위 기술에 대한 분석도 실시하여 기술 수용 단계에 따른 세부 기술 키워드 검색량의 변화를 살펴보고 세부기술에 대한 관심도가 주식시장 예측에 미치는 영향을 살펴보았다. 이를 위해 본 연구에서는 인공지능, 딥러닝, 머신러닝 키워드를 선정하여, 2015년 1월 1일부터 2019년 12월 31일까지 5년간의 인터넷 주별 검색량 데이터와 코스닥 상장 기업의 주가 및 거래량 데이터를 수집하여 분석에 활용하였다. 분석 결과 인공지능 기술에 대한 키워드 검색량은 사회적 수용 단계가 진행될수록 증가하는 것으로 나타났고, 기술 키워드를 기반으로 주가예측을 하였을 경우 인식(Awareness)단계에서 가장 높은 정확도를 보였으며, 키워드별로 가장 좋은 예측 성능을 보이는 수용 단계가 다르게 나타남을 확인하였다. 따라서 기술 키워드를 활용한 주가 예측 모델 구축을 위해서는 해당 기술의 하위 기술 분류를 고려할 필요가 있다. 본 연구의 결과는 혁신기술을 기반으로 기업의 투자수익률을 예측하기 위해서는 기술에 대한 대중의 관심이 급증하는 인식 단계를 포착하는 것이 중요하다는 점을 시사한다. 또한 최근 금융권에서 선보이고 있는 빅데이터 기반 로보어드바이저(Robo-advisor) 등 투자 의사 결정 지원 시스템 개발 시 기술의 사회적 수용도를 세분화하여 키워드 검색량 변화를 통해 예측 모델의 정확도를 개선할 수 있다는 점을 시사하고 있다.

텍스트마이닝을 통한 최고경영자 대상 이러닝 콘텐츠 트렌드 분석 (Text Mining-Based Emerging Trend Analysis for e-Learning Contents Targeting for CEO)

  • 김경훈;채명신;이병태
    • 경영정보학연구
    • /
    • 제19권2호
    • /
    • pp.1-19
    • /
    • 2017
  • 본 연구는 텍스트마이닝 기법 중 토픽 분석을 활용하여 관련 업계 국내 1위 S사(社)의 최고경영자 대상 온라인 교육 콘텐츠 강의 중심으로 원문 스크립트를 분석했다. 지난 5년간(2011~2015)년 서비스된 총 4,824개 콘텐츠를 바탕으로 핵심 키워드를 추출한 다음 주제별 22가지 토픽으로 분류한 후 동향 분석을 수행했다. 이를 통해 최근 콘텐츠 비중이 급증하고 있는 토픽 주제를 확인할 수 있었다. 다음으로 토픽 분석을 통해 분류한 토픽 및 카테고리를 바탕으로 회원 평가 요인을 적용해 카테고리 및 각 토픽별 지적 관심도를 체계화 할 수 있었다. 경영·경제 분야에서는 마케팅전략, 인사/조직, 커뮤니케이션 분야 등이 높은 관심도와 만족도를 나타냈다. 인문 분야에서는 철학, 전쟁사, 역사(서양) 라이프스타일에서는 마음건강 분야가 관심도와 만족도 둘 다 높은 것으로 나타났다. 이와 함께 교육용 콘텐츠가 시대 변화에 민감하게 반응할지라도 회원의 관심과 만족도 제고에는 실패할 수 있다는 사실을 확인할 수 있었다. 최근 콘텐츠 비중은 급증했지만 평균 이하의 만족도를 기록한 IT기술 토픽이 대표적 사례라 할 수 있다. 이를 통해 최고경영자 대상 콘텐츠 제작 시 단순히 기술적 측면의 정보전달에서 끝나는 것이 아닌 기술 적용을 통한 가치혁신에 대한 깊이 있는 시사점을 도출하거나 풍부한 영상 자료를 바탕으로 다양한 볼거리를 제공하는 등 양적인 측면과 함께 질적인 측면을 고려해야 한다는 교훈을 얻을 수 있었다. 본 연구는 포털 사이트 혹은 SNS 자료가 아닌 국내 가장 영향력 있는 이러닝 기업 데이터를 토대로 분석을 진행했기에 보다 심도 있고 실용적인 결과를 도출했다. 또한 이러닝 관련 연구 분야에서 지금까지는 드물었지만 기술의 발달로 점점 연구 조사 방법론으로 기대가 높아진 텍스트마이닝 방법에 대하여 그 적용 가능성을 성공적으로 탐색해 보았다. 기존에는 콘텐츠 운영 현황 분석 시 콘텐츠 프로그램명에 입각, 표면적인 방식으로 분류할 수밖에 없는 한계가 존재했다면 텍스트마이닝 방법론을 활용하면 비정형 데이터 콘텐츠 스크립트를 바탕으로 분석하여 내용을 바탕으로 한 보다 심도 있는 콘텐츠 분류 및 주제 분류를 이끌어 낼 수 있다. 이를 바탕으로 연도에 따른 주제별 콘텐츠 서비스 현황을 도식화한다면 현재 부족한 분야와 필요한 분야에 대한 보다 심도 있는 고찰이 가능하다. 본 연구는 다양한 텍스트마이닝 기법 중에서 이러닝의 상황에서 효과적으로 연구하기 위한 새로운 방법론을 제시했으며 향후 최고경영자 교육 관련 분야별 지적 관심도에 대한 분석에 도움이 될 것으로 기대된다.

인터넷 점포에서의 구매후기 작성 동기 및 점포 고객 유형화 (Motives for Writing After-Purchase Consumer Reviews in Online Stores and Classification of Online Store Shoppers)

  • 홍희숙;류성민
    • 한국유통학회지:유통연구
    • /
    • 제17권3호
    • /
    • pp.25-57
    • /
    • 2012
  • 본 연구에서는 인터넷 점포에서 의류상품 구매후기를 작성하는 동기의 유형을 규명하는 한편 작성 동기 유형에 따라 인터넷 점포 고객들을 범주화하고, 각 집단의 작성행동, 인터넷 구매 행동, 인구사회적 특성의 차이를 규명하였다. 초점집단 면접과 온라인 서베이를 통해 연구되었으며, 정량적 연구에서는 의류상품 구매후기를 읽은 경험과 작성한 경험이 많은 국내 인터넷 점포 여성 고객 252명을 대상으로 자료가 수집되었다. 연구결과, 인터넷 점포에서 구매후기를 작성하는 동기 유형은 이타적 정보 공유, 불만해소 및 보복, 경제적 보상 추구, 상품 개발 지원, 감동 표현으로 나타났다. 특히, 작성행동에 대한 영향력이 큰 동기는 이타적 정보 공유 동기와 경제적 보상 추구 동기였다. 인터넷 점포 고객은 작성동기 유형에 따라 소비자 옹호 집단, 이익 추구 집단, 중도적 집단으로 범주화되었으며, 세 집단은 구매후기 작성행동, 인터넷 구매빈도, 인구사회적 요인들에서 차별적 특성을 보였다. 소비자 옹호 집단과 이익 추구 집단을 대상으로 인터넷 점포 구전 채널 관리 방안이 제시되었다.

  • PDF

소비자 감성 기반 뷰티 경험 패턴 맵 개발: 화장품을 중심으로 (Development of Beauty Experience Pattern Map Based on Consumer Emotions: Focusing on Cosmetics)

  • 서봉군;김건우;박도형
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.179-196
    • /
    • 2019
  • 최근의 '똑똑한 소비자(Smart Consumer)'라 불리는 소비자가 많아지고 있는데, 이들은 제조사나 광고를 통해 전달되는 정보에 의존하지 않고, 기존 사용자나 전문가들의 후기, 여러 과학 지식을 획득하여 제품에 대한 이해를 높이고, 본인 스스로가 직접 판단하여 구매하고 있다. 특히나 화장품 분야는 인체 유해성과 같은 부정적인 요소에 대한 민감도가 높고, 자신의 고유한 피부 특성과의 조화도 고려되어야 하기 때문에, 전문적인 지식과 타인의 경험, 본인의 과거 경험 등을 종합적으로 생각하여 구매 의사결정을 내려야 하고, 이에 대해서 적극적인 소비자가 많아지고 있다. 이러한 움직임은 '셀프 뷰티' 와 같은 '셀프' 문화의 열풍과 함께, 문화 현상인 '그루밍족'의 등장, 사회적 트렌드인 'K-뷰티' 와도 동행한다고 할 수 있다. 맞춤형 화장품에 대한 관심의 급부상도 이러한 현상 중 하나라 볼 수 있다. 소비자들의 맞춤형 화장품의 니즈를 충족시키기 위해, 화장품 제조사나 관련 기업들은 ICT기술과의 융합을 통하여 프리미엄 서비스를 중심으로 소비자의 니즈에 대응하고 있다. 그러나 기업 및 시장 현황이 맞춤형 화장품을 향해 진화하고 있지만, 소비자의 피부 상태, 추구하는 감성, 실제 제품이나 서비스까지 소비자 경험을 전체적으로 완전하게 다루는 지능형 데이터 플랫폼은 부재한다. 본 연구에서는 소비자 경험에 대한 지능형 데이터 플랫폼 구축을 위한 첫 단계로 소비자 언어 기반의 화장품 감성 분석을 수행하였다. 소비자들 개인의 선호나 취향이 분명한 앰플/세럼 카테고리를 중심으로 매출 순위 1위에서 99위까지의 99개 제품을 선정하여, 블로그와 트위터 등의 SNS 상에 언급되는 후기 내에 화장품 경험에 대한 소비자 감성을 수집하였다. 총 357개의 감성 형용사를 수집하였고, 고객 여정 워크샵을 통해 유사 감성을 합치고, 중복 감성을 통합하는 작업을 수행하였으며, 최종 76개 형용사를 구축했다. 구축한 형용사에 대한 SOM 분석을 통해 화장품에 대한 소비자 감성에 대한 클러스터링을 실시했다. 분석 결과, 총 8개의 클러스터를 도출했고, 클러스터 별 각 노드의 벡터 값을 기준으로 소비자 감성 Top 10을 도출했다. 소비자 감성을 기준으로 클러스터별 소비자 감성에 서로 다른 특징이 발견됐으며, 소비자에 따라 다른 소비자의 감성을 선호, 기존과는 다른 소비자 감성을 고려한 추천 및 분류 체계가 필요함을 확인했다. 연구 결과를 통해 감성 분석의 활용 도메인이 화장품만이 아닌 다양한 영역으로 확장될 수 있음 확인했으며, 감성 분석을 통한 소비자 인사이트를 도출할 수 있다는 점을 시사했다. 또한, 본 연구에서 활용한 디자인 씽킹(Design Thinking)의 방법론의 적용하여 화장품 특화된 감성 사전을 과학적인 프로세스로 구축했으며, 화장품에 대한 소비자의 인지 및 심리에 대한 이해를 도울 수 있을 것으로 기대한다.

전이학습 기반 다중 컨볼류션 신경망 레이어의 활성화 특징과 주성분 분석을 이용한 이미지 분류 방법 (Transfer Learning using Multiple ConvNet Layers Activation Features with Principal Component Analysis for Image Classification)

  • 바트후 ?바자브;주마벡 알리하노브;팡양;고승현;조근식
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.205-225
    • /
    • 2018
  • Convolutional Neural Network (ConvNet)은 시각적 특징의 계층 구조를 분석하고 학습할 수 있는 대표적인 심층 신경망이다. 첫 번째 신경망 모델인 Neocognitron은 80 년대에 처음 소개되었다. 당시 신경망은 대규모 데이터 집합과 계산 능력이 부족하여 학계와 산업계에서 널리 사용되지 않았다. 그러나 2012년 Krizhevsky는 ImageNet ILSVRC (Large Scale Visual Recognition Challenge) 에서 심층 신경망을 사용하여 시각적 인식 문제를 획기적으로 해결하였고 그로 인해 신경망에 대한 사람들의 관심을 다시 불러 일으켰다. 이미지넷 첼린지에서 제공하는 다양한 이미지 데이터와 병렬 컴퓨팅 하드웨어 (GPU)의 발전이 Krizhevsky의 승리의 주요 요인이었다. 그러므로 최근의 딥 컨볼루션 신경망의 성공을 병렬계산을 위한 GPU의 출현과 더불어 ImageNet과 같은 대규모 이미지 데이터의 가용성으로 정의 할 수 있다. 그러나 이러한 요소는 많은 도메인에서 병목 현상이 될 수 있다. 대부분의 도메인에서 ConvNet을 교육하기 위해 대규모 데이터를 수집하려면 많은 노력이 필요하다. 대규모 데이터를 보유하고 있어도 처음부터 ConvNet을 교육하려면 많은 자원과 시간이 소요된다. 이와 같은 문제점은 전이 학습을 사용하면 해결할 수 있다. 전이 학습은 지식을 원본 도메인에서 새 도메인으로 전이하는 방법이다. 전이학습에는 주요한 두 가지 케이스가 있다. 첫 번째는 고정된 특징점 추출기로서의 ConvNet이고, 두번째는 새 데이터에서 ConvNet을 fine-tuning 하는 것이다. 첫 번째 경우, 사전 훈련 된 ConvNet (예: ImageNet)을 사용하여 ConvNet을 통해 이미지의 피드포워드 활성화를 계산하고 특정 레이어에서 활성화 특징점을 추출한다. 두 번째 경우에는 새 데이터에서 ConvNet 분류기를 교체하고 재교육을 한 후에 사전 훈련된 네트워크의 가중치를 백프로퍼게이션으로 fine-tuning 한다. 이 논문에서는 고정된 특징점 추출기를 여러 개의 ConvNet 레이어를 사용하는 것에 중점을 두었다. 그러나 여러 ConvNet 레이어에서 직접 추출된 차원적 복잡성을 가진 특징점을 적용하는 것은 여전히 어려운 문제이다. 우리는 여러 ConvNet 레이어에서 추출한 특징점이 이미지의 다른 특성을 처리한다는 것을 발견했다. 즉, 여러 ConvNet 레이어의 최적의 조합을 찾으면 더 나은 특징점을 얻을 수 있다. 위의 발견을 토대로 이 논문에서는 단일 ConvNet 계층의 특징점 대신에 전이 학습을 위해 여러 ConvNet 계층의 특징점을 사용하도록 제안한다. 본 논문에서 제안하는 방법은 크게 세단계로 이루어져 있다. 먼저 이미지 데이터셋의 이미지를 ConvNet의 입력으로 넣으면 해당 이미지가 사전 훈련된 AlexNet으로 피드포워드 되고 3개의 fully-connected 레이어의 활성화 틀징점이 추출된다. 둘째, 3개의 ConvNet 레이어의 활성화 특징점을 연결하여 여러 개의 ConvNet 레이어의 특징점을 얻는다. 레이어의 활성화 특징점을 연결을 하는 이유는 더 많은 이미지 정보를 얻기 위해서이다. 동일한 이미지를 사용한 3개의 fully-connected 레이어의 특징점이 연결되면 결과 이미지의 특징점의 차원은 4096 + 4096 + 1000이 된다. 그러나 여러 ConvNet 레이어에서 추출 된 특징점은 동일한 ConvNet에서 추출되므로 특징점이 중복되거나 노이즈를 갖는다. 따라서 세 번째 단계로 PCA (Principal Component Analysis)를 사용하여 교육 단계 전에 주요 특징점을 선택한다. 뚜렷한 특징이 얻어지면, 분류기는 이미지를 보다 정확하게 분류 할 수 있고, 전이 학습의 성능을 향상시킬 수 있다. 제안된 방법을 평가하기 위해 특징점 선택 및 차원축소를 위해 PCA를 사용하여 여러 ConvNet 레이어의 특징점과 단일 ConvNet 레이어의 특징점을 비교하고 3개의 표준 데이터 (Caltech-256, VOC07 및 SUN397)로 실험을 수행했다. 실험결과 제안된 방법은 Caltech-256 데이터의 FC7 레이어로 73.9 %의 정확도를 얻었을 때와 비교하여 75.6 %의 정확도를 보였고 VOC07 데이터의 FC8 레이어로 얻은 69.2 %의 정확도와 비교하여 73.1 %의 정확도를 보였으며 SUN397 데이터의 FC7 레이어로 48.7%의 정확도를 얻었을 때와 비교하여 52.2%의 정확도를 보였다. 본 논문에 제안된 방법은 Caltech-256, VOC07 및 SUN397 데이터에서 각각 기존에 제안된 방법과 비교하여 2.8 %, 2.1 % 및 3.1 %의 성능 향상을 보였다.