• 제목/요약/키워드: 빅 데이터 패턴 분석

검색결과 195건 처리시간 0.04초

Emoticon by Emotions: 소비자 감성 기반 이모티콘 추천 시스템 개발 (Emoticon by Emotions: The Development of an Emoticon Recommendation System Based on Consumer Emotions)

  • 김건우;박도형
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.227-252
    • /
    • 2018
  • 인터넷의 발달을 통해 지속적으로 인스턴트 커뮤니케이션이 발달해왔다. 인스턴트 커뮤니케이션에서 가장 대표적인 것이 메신저 애플리케이션이다. 메신저 애플리케이션에서 이모티콘은 송신자의 감정 전달을 보완하기 위해 활용됐다. 메신저 애플리케이션 송신자의 감정 전달에 약한 모습을 보이는데 그 이유는 면대면 커뮤니케이션이 아니기 때문이다. 이모티콘은 과거 화자의 기분 상태를 나타내는 기호로만 사용됐다. 그러나 현재는 이모티콘은 감정 전달 뿐만 아니라 개인의 특성과 개성을 나타내고 싶어 하는 소비자의 심리를 반영하는 형태로 발전해가고 있다. 이모티콘의 사용 환경이 개선되었고, 이모티콘 자체가 발전함으로써 이모티콘 자체에 대한 관심도는 증가하였다. 대표적인 예로 카카오톡, 라인, 애플 등에서 서비스를 진행하고 있으며, 관련 컨텐츠 상품의 매출도 지속적으로 증가할 것으로 전망하고 있다. 이모티콘 자체의 관심도 증가와 관련 사업의 성장세에도 불구하고 현재 적절한 이모티콘 추천 시스템이 부재하다. 국내 점유율 90% 이상의 메신저 애플리케이션인 카카오톡조차 단순히 인기 순이나 최근 순, 혹은 간략한 카테고리 별로 분류한 정도이다. 소비자들은 원하는 이모티콘을 찾기 위해서 스크롤을 계속해서 내려야 하는 불편함이 있으며, 본인이 원하는 감성의 이모티콘을 찾기 어렵다. 소비자들이 편의성 향상과 기업의 이모티콘 관련 사업의 판매 매출 증가를 위해 소비자가 원하는 이모티콘을 추천해줄 수 있는 이모티콘 추천 시스템이 필요하다. 적절한 이모티콘을 추천하기 위해서 소비자가 이모티콘을 보고 느낀 감성에 대해 정량화할 필요성이 있다. 정량화를 통해 소비자가 원하는 이모티콘 셋이 가진 특징과 감성에 대해 분석할 수 있으며, 분석 결과를 토대로 소비자에게 이모티콘을 추천할 수 있다. 이모티콘은 메타데이터화의 방법으로 정량화가 가능하다. 메타데이터화 방법은 빅데이터 시대에 비정형, 반정형 데이터에 대해서 의미를 추출하기 위해 데이터를 구조화 혹은 조직화하는 작업이다. 비정형 데이터인 이모티콘을 메타데이터화를 통해 구조화한다면, 쉽게 소비자가 원하는 감성 형태로 분류할 수 있을 것으로 생각한다. 정확한 감성을 추출하기 위해 감정과 관련된 선행 연구를 통해 7개의 공통 감성 형용사와 한국어에서만 나타나는 은유 혹은 표현적 특징들을 반영하기 위해 하위 세부 표현들까지 고려했다. 이모티콘의 가장 큰 특징인 캐릭터를 기반으로 "표상", "형상", "색상"의 범주에서 세부 하위 감성들을 수집했다. 정확도 높은 추천 시스템을 설계하기 위해 감성 지표만이 아니라 객관적 지표도 고려하였다. 메타데이터화 방법을 통해 이모티콘이 갖고 있는 캐릭터의 특징을 객관적 지표로 14개, 감성 지표로 활용하기 위해 감성 형용사를 36개를 추출하였다. 추출된 감성 형용사는 대비되는 형용사로 구성하여 총 18개로 줄였으며, 18개의 감성 형용사는 카카오톡의 이모티콘을 인기 순으로 임의의 40개 셋을 대상으로 측정하였다. 측정을 위해 이모티콘을 평가할 조사 대상자 온라인으로 모집하였고, 277명의 20~30대의 이모티콘을 구매한 경험이 있는 소비자를 대상으로 설문을 진행하였다. 설문응답자에게 서로 다른 5개의 이모티콘 셋을 평가하도록 하였다. 평가 결과 수집된 18개의 감정 형용사는 요인분석을 통해 감성 지표 요인으로 추출하였다. 추출된 소비자 감성 지표의 요인은 "코믹", "부드러움", "모던함", "투명함"이었다. 이모티콘의 객관적 지표와 감성 지표 요인을 활용하여 소비자 만족과의 관계를 분석하였고, 객관적 지표와 감성 지표 간의 관계도 분석하였다. 이 과정에서 객관적 지표가 소비자 태도에 바로 영향을 주는 것이 아니라 감성 지표 요인을 통해 소비자 태도에 영향을 주는 매개 효과가 있음을 확인하였다. 분석 결과는 소비자의 감성 평가 메커니즘을 밝혀냈고, 소비자의 이모티콘 감성 평가 메커니즘은 객관적 지표가 감성 지표 요인에 영향을 미치며, 감성 지표 요인은 소비자 만족에 영향을 미치는 관계였다. 따라서 감성 지표 요인의 네 가지만으로 이모티콘 추천 시스템을 설계하였고, 추천 방법은 각 감성과의 거리를 유클리디안 거리로 측정하여 거리의 차가 0에 가까울수록 비슷한 감성으로 정의하였다. 본 연구에서 제안한 이모티콘 시스템의 검증을 위해 각 감성 지표 요인과 소비자 만족의 평균을 지표 값으로 활용하여 각 이모티콘 셋의 감성 패턴을 그래프로 비교하였고, 추천된 이모티콘들과 선택된 이모티콘이 대체로 비슷한 패턴을 그리는 것을 확인하였다. 정확한 검증을 위해 사전 조사하였던 소비자를 대상으로 이모티콘 추천 시스템이 제시한 결과와 유사하게 평가하였는지 유사 순위를 세 구간으로 나누어 비교하였고, 순위별 예측 정확도는 결과 1순위 81.02%, 2순위 76.64%, 3순위 81.63%였다. 본 연구의 결과는 학문적, 실무적으로 다양한 분야에서 활용 가능한 방법론을 제시하였으며, 기존에 없던 이모티콘 추천 시스템의 설계를 통해 소비자에게는 편의와 이모티콘을 서비스하는 기업에는 매출증대의 효과를 가져올 것으로 예상한다. 그리고 본 연구를 통해 지능형 이모티콘 시스템으로 발전할 수 있는 단초를 제공했다는 점에서 의미가 있다. 본 연구에서 제안한 감성 요인들을 활용하여 감성 라이브러리로 사용함으로써, 새로운 이모티콘 출시 시 감성 평가의 지표로 활용할 수 있다. 축적된 감성 라이브러리와 기업의 판매 데이터, 매출 정보, 소비자 데이터를 결합하여 본 연구에서 제안한 추천 시스템을 복합형 추천 시스템으로 발전시켜 단순 소비자의 편의성이나 매출 증가뿐만 아니라 기업에서 전략적으로 활용 가능한 지적 자산으로 활용할 수 있을 것으로 판단한다.

Hybrid CNN-LSTM 알고리즘을 활용한 도시철도 내 피플 카운팅 연구 (A Study on People Counting in Public Metro Service using Hybrid CNN-LSTM Algorithm)

  • 최지혜;김민승;이찬호;최정환;이정희;성태응
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.131-145
    • /
    • 2020
  • 산업혁신의 흐름에 발맞추어 다양한 분야에서 활용되고 있는 IoT 기술은 빅데이터의 접목을 통한 새로운 비즈니스 모델의 창출 및 사용자 친화적 서비스 제공의 핵심적인 요소로 부각되고 있다. 사물인터넷이 적용된 디바이스에서 누적된 데이터는 사용자 환경 및 패턴 분석을 통해 맞춤형 지능 시스템을 제공해줄 수 있어 편의 기반 스마트 시스템 구축에 다방면으로 활용되고 있다. 최근에는 이를 공공영역 혁신에 확대 적용하여 CCTV를 활용한 교통 범죄 문제 해결 등 스마트시티, 스마트 교통 등에 활용하고 있다. 그러나 이미지 데이터를 활용하는 기존 연구에서는 개인에 대한 사생활 침해 문제 및 비(非)일반적 상황에서 객체 감지 성능이 저하되는 한계가 있다. 본 연구에 활용된 IoT 디바이스 기반의 센서 데이터는 개인에 대한 식별이 불필요해 사생활 이슈로부터 자유로운 데이터로, 불특정 다수를 위한 지능형 공공서비스 구축에 효과적으로 활용될 수 있다. 대다수의 국민들이 일상적으로 활용하는 도시철도에서의 지능형 보행자 트래킹 시스템에 IoT 기반의 적외선 센서 디바이스를 활용하고자 하였으며 센서로부터 측정된 온도 데이터를 실시간 송출하고, CNN-LSTM(Convolutional Neural Network-Long Short Term Memory) 알고리즘을 활용하여 구간 내 보행 인원의 수를 예측하고자 하였다. 실험 결과 MLP(Multi-Layer Perceptron) 및 LSTM(Long Short-Term Memory), RNN-LSTM(Recurrent Neural Network-Long Short Term Memory)에 비해 제안한 CNN-LSTM 하이브리드 모형이 가장 우수한 예측성능을 보임을 확인하였다. 본 논문에서 제안한 디바이스 및 모델을 활용하여 그간 개인정보와 관련된 법적 문제로 인해 서비스 제공이 미흡했던 대중교통 내 실시간 모니터링 및 혼잡도 기반의 위기상황 대응 서비스 등 종합적 메트로 서비스를 제공할 수 있을 것으로 기대된다.

이차원 고객충성도 세그먼트 기반의 고객이탈예측 방법론 (A Methodology of Customer Churn Prediction based on Two-Dimensional Loyalty Segmentation)

  • 김형수;홍승우
    • 지능정보연구
    • /
    • 제26권4호
    • /
    • pp.111-126
    • /
    • 2020
  • CRM의 하위 연구 분야로 진행되었던 고객이탈예측은 최근 비즈니스 머신러닝 기술의 발전으로 인해 빅데이터 기반의 퍼포먼스 마케팅 주제로 더욱 그 중요도가 높아지고 있다. 그러나, 기존의 관련 연구는 예측 모형 자체의 성능을 개선시키는 것이 주요 목적이었으며, 전체적인 고객이탈예측 프로세스를 개선하고자 하는 연구는 상대적으로 부족했다. 본 연구는 성공적인 고객이탈관리가 모형 자체의 성능보다는 전체 프로세스의 개선을 통해 더 잘 이루어질 수 있다는 가정하에, 이차원 고객충성도 세그먼트 기반의 고객이탈예측 프로세스 (CCP/2DL: Customer Churn Prediction based on Two-Dimensional Loyalty segmentation)를 제안한다. CCP/2DL은 양방향, 즉 양적 및 질적 로열티 기반의 고객세분화를 시행하고, 고객세그먼트들을 이탈패턴에 따라 2차 그룹핑을 실시한 뒤, 이탈패턴 그룹별 이질적인 이탈예측 모형을 독립적으로 적용하는 일련의 이탈예측 프로세스이다. 제안한 이탈예측 프로세스의 상대적 우수성을 평가하기 위해 기존의 범용이탈예측 프로세스와 클러스터링 기반 이탈예측 프로세스와의 성능 비교를 수행하였다. 글로벌 NGO 단체인 A사의 협력으로 후원자 데이터를 활용한 분석과 검증을 수행했으며, 제안한 CCP/2DL의 성능이 다른 이탈예측 방법론보다 우수한 성능을 보이는 것으로 나타났다. 이러한 이탈예측 프로세스는 이탈예측에도 효과적일 뿐만 아니라, 다양한 고객통찰력을 확보하고, 관련된 다른 퍼포먼스 마케팅 활동을 수행할 수 있는 전략적 기반이 될 수 있다는 점에서 연구의 의의를 찾을 수 있다.

소상공인 점포의 분포와 환경요인의 공간적 영향관계에 관한 실증연구 (An Empirical Study on the Spatial Effect of Distribution Patterns between Small Business and Social-environmental factors)

  • 유무상;최돈정
    • 한국지리정보학회지
    • /
    • 제22권1호
    • /
    • pp.1-18
    • /
    • 2019
  • 본 연구에서는 천안시, 아산시의 $100m{\times}100m$격자 내에 집계된 소상공인 분포가 가지는 공간적 의존성(Spatial Dependency)과 공간적 이질성(Spatial Heterogeneity)을 전역적(Global), 국지적(Local) 공간 자기상관(Spatial Autocorrelation)을 통해 측정 및 가시화하였다. 먼저 탐색적 공간데이터 분석방법(ESDA: Explotory Spatial Data Analysis)인 Moran's I Index를 통해 연구지역에서 소상공인 분포의 정적(Positive)공간자기상관이 발생하는 것을 확인하였으며, 국지적 공간자기상관 지표(LISA : Local Indicators of Spatial Association) 중 하나인 Getis-Ord $GI{\ast}$를 통해 공간자기상관의 국지적 패턴을 가시화하였다. 이를 통해 소상공인 상가점포의 입지요인 분석 시 적용할 변수와의 관계에 대해 공간회귀모형의 적용이 타당함을 증명하였으며, 소상공인의 분포와 모바일 트래픽 기반의 시간대별 유동인구, 토지이용 혼합성 지수 그리고 주거지, 상점, 도로망, 교통결절점과의 공간영향관계를 지리가중 회귀분석(GWR : Geographically Weighted Regression)을 통해 분석하였다. 최종적으로 다중공선성(Multicollinearity)이 발생했던 버스정류장 접근성, 오후시간대 유동인구, 저녁시간대 유동인구를 제외한 6개의 변수를 적용하였고 GWR 모형이 OLS모형보다 주요통계량에서 모형 설명력이 개선됨을 도출하였다. 분석에 최종적으로 적용된 6가지 변수의 회귀계수와 국지적 결정계수(Local $R^2$)에 대해 연구지역 내에서 공간적으로 변화하는 변수별 영향력을 가시화하였다. 본 연구는 실질적으로 측정된 방식의 유동인구 정보를 적용함으로써 상권을 이용하는 도시민의 동적 정보를 반영한 것이 상권분석을 수행한 다른 연구들과 차별적인 성격을 가진다. 마지막으로 이러한 동적정보와 변수들의 공간적 상호작용을 구조화하기 위해 미시적 공간단위에서 공간통계학(Spatial Statistical)적 모형 적용을 통해 상권분석의 새로운 프레임을 제시하였다는 점에서 연구적 의의를 가진다.

러시아 음악 산업 현황과 과제 - 디지털 음원을 중심으로 - (The Present Situation and Challenges of the Russian Music Industry: Centered on the Digital Sound Sources)

  • 권기배;김세일
    • 비교문화연구
    • /
    • 제50권
    • /
    • pp.395-424
    • /
    • 2018
  • 이 논문은 최근 디지털 음원 분야에서 주목할 만한 성장을 이루고 있는 러시아 음악시장의 현재적 상황과 그 배경에 대해 살펴보는 것을 목적으로 한다. 현재 세계 10위권의 시장 규모를 가진 러시아 음악 산업은, 스트리밍 접속을 통한 디지털 음원 시장을 중심으로 빠르게 성장하는 세계 음악 산업의 최근 흐름을 따르고 있다. 러시아의 음악 산업에서 디지털 음원의 성장 배경으로는 다운로드 및 스트리밍 음원 서비스 증가, 인터넷 발전으로 인하여 모바일을 이용한 디지털 음원 접속 회수의 증가, 정부의 저작권법 개정 등이 주요 원인으로 거론된다. 특히 스트리밍 음원 매출은 2020년에 디지털 음원 전체 매출의 85%이상 점유율을 예상할 만큼 폭발적인 성장이 기대된다. 스마트폰의 보급, 이로 인한 러시아 국민들의 라이프 스타일 변화, 즉 별도의 오디오 기기나 디지털 플레이어가 없어도 누구나 쉽게 디지털 음원에 접근하고 음악을 들을 수 있는 '연결/접속'의 편리함과 4차 산업혁명의 '빅데이터' 해석을 통한 음원소비자의 성향 분석 등이 이러한 변화를 전위에서 이끌고 있다. 또한 러시아 정부의 '저작권법' 개정과 더불어 불법 복제 음원물의 유통 근절에 대한 강력한 정책이 효과를 발휘하고 있다는 것도 디지털 음원의 가파른 상승을 이끄는 중요한 요소로 꼽힌다. 음악은 문화적 자산 가운데 가장 중요한 요소이면서, 디지털 경제의 전반적인 성장을 견인하는 효자 콘텐츠이다. 현재 러시아 음악 산업은 과거와 비교했을 때 안정적으로 지속 가능한 성장을 도모할 수 있는 환경이 구축되고 있으며, 여기에 다음과 같은 다섯 가지 개선안(저작권 보호에 대한 러시아인들의 의식 강화, 디지털 음원 산업에 빅데이터 활용, 디지털 음원 유통자들의 독과점 개선, 적정한 음원 수익 분배율 제시, 러시아 음악 산업에 대한 투자 활성화)이 효과적이고 생산적으로 잘 작동되면 세계 음악시장에서 러시아의 역할과 입지가 확장될 가능성은 매우 크다. 이럴 경우 러시아 음악 산업은 디지털 음원 시대에 단순히 적응하는 단계를 지나 4차 산업혁명의 수혜업종인 '스트리밍'에 접속하여 음악을 소비하는 패턴이 시장의 중심이 되는 세계 음악 산업을 선도적으로 이끌어 갈 것이다.