• 제목/요약/키워드: 2 step cluster

검색결과 105건 처리시간 0.021초

인구통계특성 기반 디지털 마케팅을 위한 클릭스트림 빅데이터 마이닝 (Clickstream Big Data Mining for Demographics based Digital Marketing)

  • 박지애;조윤호
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.143-163
    • /
    • 2016
  • 인구통계학적 정보는 디지털 마케팅의 핵심이라 할 수 있는 인터넷 사용자에 대한 타겟 마케팅 및 개인화된 광고를 위해 고려되는 가장 기초적이고 중요한 정보이다. 하지만 인터넷 사용자의 온라인 활동은 익명으로 행해지는 경우가 많기 때문에 인구통계특성 정보를 수집하는 것은 쉬운 일이 아니다. 정기적인 설문 조사를 통해 사용자들의 인구통계특성 정보를 수집할 수도 있지만 많은 비용이 들며 허위 기재 등과 같은 위험성이 존재한다. 특히, 모바일 환경에서는 대부분의 사용자들이 익명으로 활동하기 때문에 인구통계특성 정보를 수집하는 것은 더욱 더 어려워지고 있다. 반면, 인터넷 사용자의 온라인 활동을 기록한 클릭스트림 데이터는 해당 사용자의 인구통계학적 정보에 활용될 수 있다. 특히, 인터넷 사용자의 온라인 행위 특성 중 하나인 페이지뷰는 인구통계학적 정보 예측에 있어서 중요한 요인이 된다. 본 연구에서는 기존 선행 연구를 토대로 클릭스트림 데이터 분석을 통해 인터넷 사용자의 온라인 행위 특성을 추출하고 이를 해당 사용자의 인구통계학적 정보 예측에 사용한다. 또한, 1)의사결정나무를 이용한 변수 축소, 2)주성분분석을 활용한 차원축소, 3)군집분석을 활용한 변수축소의 방법을 제안하고 실험에 적용함으로써 많은 설명변수를 이용하여 예측 모델 생성 시 발생하는 차원의 저주와 과적합 문제를 해결하고 예측 모델의 정확도를 높이고자 하였다. 실험 결과, 범주의 수가 많은 다분형 종속변수에 대한 예측 모델은 모든 설명변수를 사용하여 예측 모델을 생성했을 때보다 본 연구에서 제안한 방법론들을 적용했을 때 예측 모델에 대한 정확도가 향상됨을 알 수 있었다. 본 연구는 클릭스트림 분석을 통해 추출된 인터넷 사용자의 온라인 행위는 해당 사용자의 인구통계학적 정보 예측에 활용 가능하며, 예측된 익명의 인터넷 사용자들에 대한 인구통계학적 정보를 디지털 마케팅에 활용 할 수 있다는데 의의가 있다. 또한, 제안 방법론들을 통해 어느 종속변수에 대해 어떤 방법론들이 예측 모델의 정확도를 개선하는지 확인하였다. 이는 추후 클릭스트림 분석을 활용하여 인구통계학적 정보를 예측할 때, 본 연구에서 제안한 방법론을 사용하여 보다 높은 정확도를 가지는 예측 모델을 생성 할 수 있다는데 의의가 있다.

산지습지 치환성 양이온 함량비의 특성과 함의 (Implication of the Ratio of Exchangeable Cations in Mountain Wetlands)

  • 신영호;김성환;류호상
    • 대한지리학회지
    • /
    • 제49권2호
    • /
    • pp.221-244
    • /
    • 2014
  • 국내에서 보호되고 있는 심적습지, 장도습지, 그리고 화엄늪을 대상으로 퇴적물의 지화학적 특성을 비교하여 이에 대한 함의를 도출하였다. 치환성 양이온 자료를 중심으로 연구 대상 습지들의 지화학적 특성을 살펴본 결과, 이들 습지는 공통적으로 저층습원의 유형에 포함되었지만 치환성 양이온의 분포양상은 상이했다. 치환성 양이온의 함량비를 변수로 이단계군집분석을 한 결과 3개의 군집으로 퇴적물 유형이 구분되었다. 지질, 토양, 식생 등의 환경요인의 차이로 인해 심적습지는 Ca집중퇴적물이, 장도습지는 Ca집중퇴적물과 Mg집중퇴적물이, 화엄늪은 K집중퇴적물이 각각 주요한 유형으로 나타났다. 퇴적물의 지화학적 특성은 기후변화나 인위적 환경변화로 촉발되어지는 외부 환경요인으로 인해 변경될 수 있기 때문에 산지습지의 환경변화 지시자가 될 수 있으며, 관리적 측면에서 활용될 수 있다. 또한 치환성 양이온의 함량비를 이용한 분류는 산지습지를 분류하는 하나의 방법이 될 수 있을 것이다. 따라서 습지지형 또는 습지생태계의 변화에 대한 이해를 넓히고 적절한 산지습지의 보전을 위해서는 퇴적물의 지화학적인 특성에 대한 분석 및 유형화 시도가 지속적으로 이루어져야 한다.

  • PDF

Radial Basis 함수를 이용한 동적 - 단기 전력수요예측 모형의 개발 (The Development of Dynamic Forecasting Model for Short Term Power Demand using Radial Basis Function Network)

  • 민준영;조형기
    • 한국정보처리학회논문지
    • /
    • 제4권7호
    • /
    • pp.1749-1758
    • /
    • 1997
  • 전력수요의 예측은 예측기간에 따라 중장기 전력수요 예측과 단기 부하 예측으로 구분할 수 있다. 기존의 단기 부하예측은 주로 역전파 알고리즘(back propagation algorithm)다층퍼셉트론을 이용하여 예측을 하였으나 이는 학습시간이 많이 걸릴 뿐만 아니라 학습도중에 지역최소점(local minima)에 빠져 학습이 계속되지 못한다는 문제가 있다. 본 논문은 이러한 역전파 알고리즘의 문제점을 해결할 수 있는 방법으로 Radial Basis 함수(Radial Basis Function)를 이용하여 동적 단기부하 예측 모형을 제안한다. Radial Basis 함수는 하나의 은닉층(hidden layer)을 갖고 있으며, 전방향(feed-forward)학습을 한다는 특징이 있다. 본 논문에서 제안한 단기 부하 예측모형은 학습을 하기 위하여 시간대별 부하량을 클러스터링 하고, 이 클러스터의 중심값을 Radial Basis 함수의 은닉층으로 하여 학습을 한 다음 예측하고자 하는 패턴을 한 단위로 하여 시단대별로 예측하였다. 기존의 연구에서의 클러스터링 방법으로는 통계학의 K-Means 방법이나 Kohonen의 LVQ(Learning Vector Quantization)을 주로 이용하였으나 본 논문에서는 패턴의 분류에 있어서 다른 알고리즘보다 편차가 작은 Pal, et. al.의 GLVQ(Generalized LVQ) 알고리즘을 이용하였다. 본 논문에서 이용한 데이타는 1995년 3월 1일-3일, 6월 1일-3일, 7월 1일-3일, 9월 1일-3일, 11월 1일-3일의 72시간 데이타를 입력하여 월별 4일의 24시간의 예측시간으로 예측하였다. 실험결과 월별 1일과 3일까지의 학습데이타로 1시간 후의 부하량을 24시간동안 예측한 결과 1.3795%의 평균 오차율로 예측하였다.

  • PDF

익명상황의 운전행동과 운전분노 및 정서표현갈등과의 관계 (The Relationship between Driving Behavior, Driving Anger, and Ambivalence Over Emotional Expressiveness in an Anonymous Situation)

  • 윤보영 ;이순철
    • 한국심리학회지 : 문화 및 사회문제
    • /
    • 제17권3호
    • /
    • pp.321-341
    • /
    • 2011
  • 본 연구는 운전자가 면대면 상황에서보다 익명상황에서 난폭운전을 더 많이 하는지와 익명상황에서 난폭운전을 많이 하는 운전자와 적게 하는 운전자 사이에 운전분노, 정서표현갈등 등의 내적 특성에서 어떤 차이가 있는지 살펴보았다. 연구 1에서 운전자 총 200명을 대상으로 조사를 실시한 결과, 면대면 상황에서보다 익명상황에서 난폭운전 수준이 더 높았다. 이어, 연구 2에서 운전자 총 384명을 대상으로 조사를 실시하였는데 익명상황의 난폭운전에 대해 이단계 군집분석을 실시한 결과, 응답자는 세 군집으로 나뉘어졌다. 익명상황에서 난폭운전을 많이 하는 운전자일수록 운전분노, 정서표현갈등 전체, 정서표현갈등의 하위 요인 중 자기방어적 양가성 요인의 수준이 높았다. 따라서 익명상황에서 난폭운전을 많이 하는 운전자가 운전분노를 많이 느끼며, 평소 정서를 잘 표현하지 못하고 갈등을 하는 경향이 있다고 볼 수 있다. 본 연구 결과는 난폭운전자에게 무조건적인 교통단속만을 행하기보다는 운전자 본인이 가진 문제점을 되돌아 볼 수 있게 하는 근본적인 대책 또한 필요하다는 것을 말해준다.

  • PDF

자기조직화 지도를 활용한 성장모형 기반의 시장 성장패턴 지도 구축: ICT제품을 중심으로 (Development of Market Growth Pattern Map Based on Growth Model and Self-organizing Map Algorithm: Focusing on ICT products)

  • 박도형;정재권;정여진;이동원
    • 지능정보연구
    • /
    • 제20권4호
    • /
    • pp.1-23
    • /
    • 2014
  • 시장 예측은 일정 기간 동안 소비자에게 판매되는 동종 제품 또는 서비스의 수량 혹은 매출액의 규모를 추정하는 활동으로 정의할 수 있다. 정확한 시장 예측은 기업의 입장에서 새로운 제품의 도입시기 결정, 제품 설계, 생산계획 수립, 마케팅 전략 수립 등에 활용됨으로써 경영활동에 있어 효율적인 의사결정을 내릴 수 있게 하고, 정부의 입장에서는 발전 가능성이 있는 분야에 국가예산을 더 배분할 수 있는 효율적인 예산수립이 가능하게 한다. 본 연구는 정보통신기술(Information and Communication Technology: ICT) 분야의 제품 및 서비스에 대해서 과거의 시계열 자료를 이용하여 시장 성장곡선을 도출하고, 성장패턴이 비슷한 그룹으로 분류하여, 산업 내 시장에 대해 이해하고, 제품들의 미래 전망을 예측하는 데 목적이 있다. 다양한 아이템들을 통일되고 일관적인 방법으로 예측하기 위하여, 로지스틱 모형, 곰페르츠 모형, Bass 모형의 세 가지 전통적인 성장모형과 로지스틱 모형이나 곰페르츠 모형에서 도출되는 잠재시장 크기를 Bass 모형에 결합시킨 두 가지 하이브리드 성장모형을 개발하여 비교 분석하였다. 데이터 설명력이 우수한 로지스틱 + Bass 모형을 최적의 모형으로 선정하여 ICT 제품 및 서비스들 각각의 시장 성장곡선 모수를 확인하였다. 도출된 모수를 데이터로 하여, 자기조직화 지도 알고리즘을 통해, 5개의 의미 있는 영역으로 구분된 시장 성장패턴 지도가 구축되었는데, 각 영역별로 차별화된 특징과 성장패턴을 가지고 있었다. 본 연구에서 제안한 프로세스 및 시스템은 산업 시장 분석 시스템의 수요 예측 기능으로 활용될 수 있으며, ICT 산업뿐만 아니라 다양한 산업 및 분야에도 적용 가능할 것으로 기대된다.