• 제목/요약/키워드: technology classification system

검색결과 1,460건 처리시간 0.029초

Hybrid CNN-LSTM 알고리즘을 활용한 도시철도 내 피플 카운팅 연구 (A Study on People Counting in Public Metro Service using Hybrid CNN-LSTM Algorithm)

  • 최지혜;김민승;이찬호;최정환;이정희;성태응
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.131-145
    • /
    • 2020
  • 산업혁신의 흐름에 발맞추어 다양한 분야에서 활용되고 있는 IoT 기술은 빅데이터의 접목을 통한 새로운 비즈니스 모델의 창출 및 사용자 친화적 서비스 제공의 핵심적인 요소로 부각되고 있다. 사물인터넷이 적용된 디바이스에서 누적된 데이터는 사용자 환경 및 패턴 분석을 통해 맞춤형 지능 시스템을 제공해줄 수 있어 편의 기반 스마트 시스템 구축에 다방면으로 활용되고 있다. 최근에는 이를 공공영역 혁신에 확대 적용하여 CCTV를 활용한 교통 범죄 문제 해결 등 스마트시티, 스마트 교통 등에 활용하고 있다. 그러나 이미지 데이터를 활용하는 기존 연구에서는 개인에 대한 사생활 침해 문제 및 비(非)일반적 상황에서 객체 감지 성능이 저하되는 한계가 있다. 본 연구에 활용된 IoT 디바이스 기반의 센서 데이터는 개인에 대한 식별이 불필요해 사생활 이슈로부터 자유로운 데이터로, 불특정 다수를 위한 지능형 공공서비스 구축에 효과적으로 활용될 수 있다. 대다수의 국민들이 일상적으로 활용하는 도시철도에서의 지능형 보행자 트래킹 시스템에 IoT 기반의 적외선 센서 디바이스를 활용하고자 하였으며 센서로부터 측정된 온도 데이터를 실시간 송출하고, CNN-LSTM(Convolutional Neural Network-Long Short Term Memory) 알고리즘을 활용하여 구간 내 보행 인원의 수를 예측하고자 하였다. 실험 결과 MLP(Multi-Layer Perceptron) 및 LSTM(Long Short-Term Memory), RNN-LSTM(Recurrent Neural Network-Long Short Term Memory)에 비해 제안한 CNN-LSTM 하이브리드 모형이 가장 우수한 예측성능을 보임을 확인하였다. 본 논문에서 제안한 디바이스 및 모델을 활용하여 그간 개인정보와 관련된 법적 문제로 인해 서비스 제공이 미흡했던 대중교통 내 실시간 모니터링 및 혼잡도 기반의 위기상황 대응 서비스 등 종합적 메트로 서비스를 제공할 수 있을 것으로 기대된다.

일부 농촌지역의 일차의료이용실태와 그 관련요인에 관한 연구 (A Study on Status of Utilization and The Related Factors of Primary Medical Care in a Rural Area)

  • 위자형
    • 농촌의학ㆍ지역보건
    • /
    • 제20권2호
    • /
    • pp.157-168
    • /
    • 1995
  • This study was carried out, through analyzing the annual reports(year of 1973-1993) on health status of Su Dong-Myun, and specific survey data of 332 households(Su Dong-Myun 209, Byul Nae-Myun 123), located in Nam Yang Ju-Si, Kyung Gi-Do, from July 20 to July 31, 1995, to find out more effective means for primary medical care in a rural area. The results were as fellows : 1. Number of population in Su Dong-Myun was 5,419 in 1973, 4,591(the lowest) in 1987 and 5,707 in 1995. In the composition rate of population, "0-14" of age group showed markedly decreasing tendency from 43.1% in 1975, to 19.1% in 1995, however "65 and over" markedly in creasing tendency form 5.3% in 1975 to 9.8% in 1995. 2. Annual utilization rate per 1,000 inhabitants in Su Dong-Myun showed markedly increasing tendency from 1973 to 1977 such as 343 in 1973, 540 in 1975, 900 in 1977. However, since 1979, the rate showed rapidly decreasing tendency, such as 846 in 1979, 519 in 1985, 190 in 1991 and 1993. 3. The morbid household rate per year was 53.6% of respondents and the rate per 15 days was 48.2%. In disease classification rate of morbid household per year, Arthralgia & Neuralgia was the highest rate(33.9%) and gastro-intestinal disorder(19.3%), Cough(11,9%), Hypertension(7.8%), Accident(3.2%) in next order. 4. In the utilizing facilities for Primary Medical Care, Medical facilities was showed the highest rate(58.1% of respondents) and Pharmacy and Drug Shp(33.1%), Tradition Method(4.0%) in next order. In the Medical facilities, General private clinic was showed the highest rate(34.3%) and specific private Clinic(22.3%), Hospital(19.0%), Health (Sub)center(16.3%), Nurse practitioner (3.3%), Oriental hospital and clinic(2.7%) in next order. 5. Experience rate, utilizing health subcenter was 51.8% of the respondents, and it was 55.0% in Su Dong-Myun and 46.3% in Byul Nae-Myun. In utilization times of health subcenter, times-rate showed next orders such as 1-2 times/6months(31.6%), 1-2 times/year (22.1%), 1-2 times/months(19.2%), 1-2 times/3months(15.6%). 6. In objectives, visiting Health Subcenter, Medical Care was the highest rate(59.8% of the respondents) and health control(23.3%) was in next order. In Medical Care, Primary Care by general physician was higher rate(51.1%) almost all. In the Health control, Immunization too was high rate(18.0%) in health control activities. 7. The reasons rate, utilizing health subcenter showed next order, such as distance to Medical facilities(33.0% of the respondents), Medical Cost(28.1%), Simple process of consultation (10.8%), Effectiveness of cure(7.6%), Function of primary medical care(7.0%) and Attitude of physician(6.5%). 8. In the affecting factors to utilization of primary medical facilities, medical needs was showed the highest rate(29.5% of the respondents) and medical cost(15.4%), distance to medical facilities(14.2%), traffic vehicle(14.2%) and farm work(6.9%) in next order. 9. In the priority between 'daily farm work,' and 'primary medical care', only 46.4% of respondents answered that primary health care is more important than the daily farm work The 22.6% of respondents answered 'daily farm work', and the 12.3% answered 'the equal of the both'. 10. In the criterion of medical facilities choice, medical knowledge and technical quality was showed the highest rate(56.3%), distance or time to medical facilities(10.9%), sincerity and kindness of physician(9.4%), medical cost(8.7%) and traffic vehicle(6.5%) in next order 11. In the advise for improvement of health subcenter function, the 36.1% of respondents answered that 'enforcement of medical personnel and equipment' was required, and then 'improved medical technology'(25.5%), 'good attitude of physician'(14.9%), 'improved medical system'(13.3%), 'enforced drug'(6.7%) in next order. 12. The study on affecting factors to utilization of primary medical facilities was very difficult subject to systematize the analyzed results, due to a prejudice of protocol planner, surveyer and respondent, and variety and overlapping of subject matter.

  • PDF

ITS 염기서열 분석 및 CAPS를 이용한 조이시아 속(Zoysia) 들잔디와 갯잔디의 구별 (Molecular Identification of Zoysia japonica and Zoysia sinica (Zoysia Species) Based on ITS Sequence Analyses and CAPS)

  • 홍민지;양대화;정옥철;김양지;박미영;강홍규;선현진;권용익;박신영;양바오로;송필순;고석민;이효연
    • 원예과학기술지
    • /
    • 제35권3호
    • /
    • pp.344-360
    • /
    • 2017
  • Zoysia 속 잔디는 학교운동장 및 공원, 골프장, 스포츠경기장과 같이 다양한 장소에 식재되고 있는 중요한 잔디이다. 해안가에서 자생하는 Zoysia 속 들잔디와 갯잔디는 외부 형태적 특성이 유사하여 외부 형태적 분류 뿐 만 아니라 분자생물학적 분류도 필요하다. 본 연구에서는 nrDNA-ITS(Internal Transcribed Spacer)의 DNA 바코드 분석을 통해서 자생하는 들잔디와 갯잔디의 분자생물학적 신속한 분류체계를 확립하고자 하였다. 이를 위해 난지형 잔디인 Zoysia 속 들잔디(Z. japonica) 및 갯잔디(Z. sinica)와 한지형 대표 잔디인 크리핑 벤트그라스(A. stolonifera) 및 켄터키 블루그라스(P. pratensis)의 nrDNA-ITS 염기서열을 확보하였다. 확보된 들잔디및 갯잔디, 크리핑 벤트그라스, 켄터키 블루그라스의 ITS 염기서열 전체 구간은 각 686bp와 687bp, 683bp, 681bp으로 확인되었으며, nrDNA-ITS 내부 염기서열구간 분석 결과, ITS1의 크기는 248-249bp, ITS2는 270̵-274bp, 5.8S rDNA는 163-164bp의 차이로, 각 4종의 잔디가 ITS 염기서열을 이용하여 식별되었다. 특히, 들잔디와 갯잔디 nrDNA-ITS 염기서열은 19 염기(2.8%) 차이를 나타냈으며, ITS1과 ITS2의 G + C 함량은 55.4-63.3% 임을 확인하였다. 이러한 들잔디와 갯잔디의 ITS 염기서열 차이를 바탕으로 CAPS 마커로 전환하여 대조구 및 수집된 자생 Zoysia 속 잔디 영양체 62개체를 분석한 결과, 외부형태학적 분류법으로 들잔디 개체, 갯잔디 개체로 동정되었지만, ITSCAPS 마커를 이용한 분자생물학적 분류법으로 들잔디 36개체와 갯잔디 22개체 뿐만 아니라 들잔디와 갯잔디간의 자연교배종 4개체도 식별하였다. 이상의 결과에서 들잔디와 갯잔디는 ITS 염기서열 및 ITS 기반 CAPS를 통하여 식별할 수 있을 것으로 판단된다.

Real-time PCR 분석법을 이용한 옥돔과 옥두어의 종 판별법 개발 (Development and Validation of Real-time PCR to Determine Branchiostegus japonicus and B. albus Species Based on Mitochondrial DNA)

  • 정인영;서용배;양지영;김군도
    • 생명과학회지
    • /
    • 제27권11호
    • /
    • pp.1331-1339
    • /
    • 2017
  • 미토콘드리아 게놈에 존재하는 시토크롬C 산화효소 서브유닛 I (cytochrome C oxidase subunit I, COI) 유전자의 DNA 염기서열을 기반으로 하는 종 판별은 수산물 자원의 지속적인 개발과 어류 다양성 보존을 위해 폭넓게 적용되고 있다. 본 연구에서는 한국에서 소비되는 옥돔과 가짜 옥돔으로 둔갑하는 옥두어의 종 판별을 위한 분석법을 개발하였다. 옥돔과 옥두어, 두 종의 종 판별과 검증을 위해 미토콘드리아 게놈의 DNA 염기서열 차이를 이용하여 real-time PCR법에 의해 분석하였다. 미토콘드리아 DNA 서열의 생물정복학적 분석에서 옥돔과 형태학적 옥돔 유사종인 옥두어, 두 종 사이에 COI 유전자 내에서 상당히 유사한 DNA 서열 부분과 일부 서열 변화 부분이 확인되었다. 명확하게 종 판별을 하기 위해 COI 유전자 내에서 일부 변화된 서열에서 종 특이적 프라이머를 디자인하였다. 10 개체의 옥돔과 옥두어에서 게놈 DNA을 추출하여 옥돔과 옥두어의 종 특이적 프라이머를 이용하여 real-time PCR 시스템에 의해 분석되었다. 이러한 real-time PCR 시스템을 이용한 genomic DNA 기반의 분자 기술은 동물 조직의 분류학적 분류를 위한 신뢰할 수 있는 방법을 제공한다. 옥돔판별을 위해, 옥돔 DNA에서 옥돔 종 특이적 프라이머를 이용한 Ct 평균값($21.85{\pm}3.599$)과 옥두어 DNA에서 옥돔 종 특이 프라아머를 이용한 Ct 평균값($33.49{\pm}1.183$) 차이를 나타내었다. 그리고 옥두어판별을 위해, 옥두어 DNA에서 옥두어 종 특이적 프라이머를 이용한 Ct 평균값($22.49{\pm}0.908$)과 옥돔 DNA에서 옥두어 종 특이 프라아머를 이용한 Ct 평균값($33.93{\pm}0.479$)을 통해 옥돔과 옥두어의 각 종 특이 프라이머의 효율성, 특이성 및 교차 반응성 측정은 통계적으로 유의한 차이를 보여 주었다. 제안된 방법은 10개의 상용 샘플로 검증이 되었다. 따라서, threshold cycle (Ct) value와 같은 real-time PCR 결과 분석에 의해 종 판별이 가능하였다.

Support Vector Regression에서 분리학습을 이용한 고객의 구매액 예측모형 (The Prediction of Purchase Amount of Customers Using Support Vector Regression with Separated Learning Method)

  • 홍태호;김은미
    • 지능정보연구
    • /
    • 제16권4호
    • /
    • pp.213-225
    • /
    • 2010
  • 본 연구에서는 기업의 마케팅 프로모션에 따른 반응고객의 구매액 예측을 위한 방법을 제시하고 SVR의 효과적인 학습방법을 제시하였다. 프로모션에 의한 고객의 구매액을 기반으로 고객을 5등급으로 등급화하고 각 등급 내에서 SVR을 적용하여 고객의 구매액을 예측하였다. 본 연구에서 제안하는 예측된 고객의 등급 내에서 고객 구매액을 예측하는 분리데이터 학습법이 프로모션에 반응한 모든 고객을 대상으로 구매액을 예측하는 전체데이터 학습법보다 높은 예측성과를 보여주었다. 일반적으로 세분화된 고객집단을 하나의 집단으로 보고 동일한 마케팅 전략을 제시하나 본 연구를 통해 구매액에 따라 등급화 된 고객의 등급 내에서 다시 고객의 거래 구매액을 예측하여 동일한 집단 내에서도 차별화된 마케팅 전략을 제시할 수 있는 기반을 제시하였다. 즉 동일한 등급에서도 고객 구매액에 따라 고객의 우선순위를 정할 수 있으며, 이는 마케팅 담당자가 프로모션을 제시할 고객을 선정할 때 유용한 정보로 활용될 수 있다.

사전과 말뭉치를 이용한 한국어 단어 중의성 해소 (Korean Word Sense Disambiguation using Dictionary and Corpus)

  • 정한조;박병화
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.1-13
    • /
    • 2015
  • 빅데이터 및 오피니언 마이닝 분야가 대두됨에 따라 정보 검색/추출, 특히 비정형 데이터에서의 정보 검색/추출 기술의 중요성이 나날이 부각되어지고 있다. 또한 정보 검색 분야에서는 이용자의 의도에 맞는 결과를 제공할 수 있는 검색엔진의 성능향상을 위한 다양한 연구들이 진행되고 있다. 이러한 정보 검색/추출 분야에서 자연어처리 기술은 비정형 데이터 분석/처리 분야에서 중요한 기술이고, 자연어처리에 있어서 하나의 단어가 여러개의 모호한 의미를 가질 수 있는 단어 중의성 문제는 자연어처리의 성능을 향상시키기 위해 우선적으로 해결해야하는 문제점들의 하나이다. 본 연구는 단어 중의성 해소 방법에 사용될 수 있는 말뭉치를 많은 시간과 노력이 요구되는 수동적인 방법이 아닌, 사전들의 예제를 활용하여 자동적으로 생성할 수 있는 방법을 소개한다. 즉, 기존의 수동적인 방법으로 의미 태깅된 세종말뭉치에 표준국어대사전의 예제를 자동적으로 태깅하여 결합한 말뭉치를 사용한 단어 중의성 해소 방법을 소개한다. 표준국어대사전에서 단어 중의성 해소의 주요 대상인 전체 명사 (265,655개) 중에 중의성 해소의 대상이 되는 중의어 (29,868개)의 각 센스 (93,522개)와 연관된 속담, 용례 문장 (56,914개)들을 결합 말뭉치에 추가하였다. 품사 및 센스가 같이 태깅된 세종말뭉치의 약 79만개의 문장과 표준국어대사전의 약 5.7만개의 문장을 각각 또는 병합하여 교차검증을 사용하여 실험을 진행하였다. 실험 결과는 결합 말뭉치를 사용하였을 때 정확도와 재현율에 있어서 향상된 결과가 발견되었다. 본 연구의 결과는 인터넷 검색엔진 등의 검색결과의 성능향상과 오피니언 마이닝, 텍스트 마이닝과 관련한 자연어 분석/처리에 있어서 문장의 내용을 보다 명확히 파악하는데 도움을 줄 수 있을 것으로 기대되어진다.

데이터 크기에 따른 k-NN의 예측력 연구: 삼성전자주가를 사례로 (The Effect of Data Size on the k-NN Predictability: Application to Samsung Electronics Stock Market Prediction)

  • 천세학
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.239-251
    • /
    • 2019
  • 본 논문은 학습데이터의 크기에 따른 사례기반추론기법이 주가예측력에 어떻게 영향을 미치는지 살펴본다. 삼성전자 주가를 대상을 학습데이터를 2000년부터 2017년까지 이용한 경우와 2015년부터 2017년까지 이용한 경우를 비교하였다. 테스트데이터는 두 경우 모두 2018년 1월 1일부터 2018년 8월 31일까지 이용하였다. 시계 열데이터의 경우 과거데이터가 얼마나 유용한지 살펴보는 측면과 유사사례개수의 중요성을 살펴보는 측면에서 연구를 진행하였다. 실험결과 학습데이터가 많은 경우가 그렇지 않은 경우보다 예측력이 높았다. MAPE을 기준으로 비교할 때, 학습데이터가 적은 경우, 유사사례 개수와 상관없이 k-NN이 랜덤워크모델에 비해 좋은 결과를 보여주지 못했다. 그러나 학습데이터가 많은 경우, 일반적으로 k-NN의 예측력이 랜덤워크모델에 비해 좋은 결과를 보여주었다. k-NN을 비롯한 다른 데이터마이닝 방법론들이 주가 예측력 제고를 위해 학습데이터의 크기를 증가시키는 것 이외에, 거시경제변수를 고려한 기간유사사례를 찾아 적용하는 것을 제안한다.

머신러닝을 활용한 수도권 약수터 수질 예측 모델 개발 (Development of a water quality prediction model for mineral springs in the metropolitan area using machine learning)

  • 임영우;엄지연;곽기영
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.307-325
    • /
    • 2023
  • 코로나19 팬데믹의 장기화로 인해 실내 생활에 지쳐가는 사람들이 우울감, 무기력증 등을 해소하기 위해 근거리의 산과 국립공원을 찾는 빈도가 폭발적으로 증가하였다. 자연으로 나온 수많은 사람들이 오가는 걸음을 멈추고 숨을 돌리며 쉬어가는 장소가 있는데 바로 약수터이다. 산이나 국립공원이 아니더라도 근린공원 또는 산책로에서도 간간이 찾아볼 수 있는 약수터는 수도권에만 약 6백여개가 위치해 있다. 하지만 불규칙적이고 수작업으로 수행되는 수질검사로 인해 사람들은 실시간으로 검사 결과를 알 수 없는 상태에서 약수를 음용하게 된다. 따라서 본 연구에서는 약수터 수질에 영향을 미치는 요인을 탐색하고 다양한 곳에 흩어져 있는 데이터를 수집하여 실시간으로 약수터 수질을 예측할 수 있는 모델을 개발하고자 한다. 데이터 수집의 한계로 인해 서울과 경기로 지역을 한정한 후 데이터 관리가 잘 이루어지고 있는 18개 시의 약 300여개 약수터를 대상으로 2015~2020년의 수질 검사 데이터를 확보하였다. 약수터 수질 적합 여부에 영향을 미칠 것으로 여겨지는 다양한 요인들 중 두 차례의 검토를 거쳐 총 10개의 요인을 최종 선별하였다. 최근 주목받고 있는 자동화 머신러닝 기술인 AutoML 기법을 활용하여 20여가지의 머신러닝 기법들 중 예측 성능 기준 상위 5개의 모델을 도출하였으며 그 중 catboost 모델이 75.26%의 예측 분류 정확도로 가장 높은 성능을 가지고 있음을 확인하였다. 추가로 SHAP 기법을 통해 분석에 사용한 변인들이 예측에 미치는 절대적인 영향력을 살펴본 결과 직전 수질 검사에서 부적합 판정을 받았는지 여부가 가장 중요한 요인이었으며 그 외 평균 기온, 과거 연속 2번 수질 부적합 판정 기록 유무, 수질 검사 당일 기온, 약수터 고도 등이 수질 부적합 여부에 영향을 미치고 있음을 확인하였다.

소비자 감성 기반 뷰티 경험 패턴 맵 개발: 화장품을 중심으로 (Development of Beauty Experience Pattern Map Based on Consumer Emotions: Focusing on Cosmetics)

  • 서봉군;김건우;박도형
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.179-196
    • /
    • 2019
  • 최근의 '똑똑한 소비자(Smart Consumer)'라 불리는 소비자가 많아지고 있는데, 이들은 제조사나 광고를 통해 전달되는 정보에 의존하지 않고, 기존 사용자나 전문가들의 후기, 여러 과학 지식을 획득하여 제품에 대한 이해를 높이고, 본인 스스로가 직접 판단하여 구매하고 있다. 특히나 화장품 분야는 인체 유해성과 같은 부정적인 요소에 대한 민감도가 높고, 자신의 고유한 피부 특성과의 조화도 고려되어야 하기 때문에, 전문적인 지식과 타인의 경험, 본인의 과거 경험 등을 종합적으로 생각하여 구매 의사결정을 내려야 하고, 이에 대해서 적극적인 소비자가 많아지고 있다. 이러한 움직임은 '셀프 뷰티' 와 같은 '셀프' 문화의 열풍과 함께, 문화 현상인 '그루밍족'의 등장, 사회적 트렌드인 'K-뷰티' 와도 동행한다고 할 수 있다. 맞춤형 화장품에 대한 관심의 급부상도 이러한 현상 중 하나라 볼 수 있다. 소비자들의 맞춤형 화장품의 니즈를 충족시키기 위해, 화장품 제조사나 관련 기업들은 ICT기술과의 융합을 통하여 프리미엄 서비스를 중심으로 소비자의 니즈에 대응하고 있다. 그러나 기업 및 시장 현황이 맞춤형 화장품을 향해 진화하고 있지만, 소비자의 피부 상태, 추구하는 감성, 실제 제품이나 서비스까지 소비자 경험을 전체적으로 완전하게 다루는 지능형 데이터 플랫폼은 부재한다. 본 연구에서는 소비자 경험에 대한 지능형 데이터 플랫폼 구축을 위한 첫 단계로 소비자 언어 기반의 화장품 감성 분석을 수행하였다. 소비자들 개인의 선호나 취향이 분명한 앰플/세럼 카테고리를 중심으로 매출 순위 1위에서 99위까지의 99개 제품을 선정하여, 블로그와 트위터 등의 SNS 상에 언급되는 후기 내에 화장품 경험에 대한 소비자 감성을 수집하였다. 총 357개의 감성 형용사를 수집하였고, 고객 여정 워크샵을 통해 유사 감성을 합치고, 중복 감성을 통합하는 작업을 수행하였으며, 최종 76개 형용사를 구축했다. 구축한 형용사에 대한 SOM 분석을 통해 화장품에 대한 소비자 감성에 대한 클러스터링을 실시했다. 분석 결과, 총 8개의 클러스터를 도출했고, 클러스터 별 각 노드의 벡터 값을 기준으로 소비자 감성 Top 10을 도출했다. 소비자 감성을 기준으로 클러스터별 소비자 감성에 서로 다른 특징이 발견됐으며, 소비자에 따라 다른 소비자의 감성을 선호, 기존과는 다른 소비자 감성을 고려한 추천 및 분류 체계가 필요함을 확인했다. 연구 결과를 통해 감성 분석의 활용 도메인이 화장품만이 아닌 다양한 영역으로 확장될 수 있음 확인했으며, 감성 분석을 통한 소비자 인사이트를 도출할 수 있다는 점을 시사했다. 또한, 본 연구에서 활용한 디자인 씽킹(Design Thinking)의 방법론의 적용하여 화장품 특화된 감성 사전을 과학적인 프로세스로 구축했으며, 화장품에 대한 소비자의 인지 및 심리에 대한 이해를 도울 수 있을 것으로 기대한다.

이차원 고객충성도 세그먼트 기반의 고객이탈예측 방법론 (A Methodology of Customer Churn Prediction based on Two-Dimensional Loyalty Segmentation)

  • 김형수;홍승우
    • 지능정보연구
    • /
    • 제26권4호
    • /
    • pp.111-126
    • /
    • 2020
  • CRM의 하위 연구 분야로 진행되었던 고객이탈예측은 최근 비즈니스 머신러닝 기술의 발전으로 인해 빅데이터 기반의 퍼포먼스 마케팅 주제로 더욱 그 중요도가 높아지고 있다. 그러나, 기존의 관련 연구는 예측 모형 자체의 성능을 개선시키는 것이 주요 목적이었으며, 전체적인 고객이탈예측 프로세스를 개선하고자 하는 연구는 상대적으로 부족했다. 본 연구는 성공적인 고객이탈관리가 모형 자체의 성능보다는 전체 프로세스의 개선을 통해 더 잘 이루어질 수 있다는 가정하에, 이차원 고객충성도 세그먼트 기반의 고객이탈예측 프로세스 (CCP/2DL: Customer Churn Prediction based on Two-Dimensional Loyalty segmentation)를 제안한다. CCP/2DL은 양방향, 즉 양적 및 질적 로열티 기반의 고객세분화를 시행하고, 고객세그먼트들을 이탈패턴에 따라 2차 그룹핑을 실시한 뒤, 이탈패턴 그룹별 이질적인 이탈예측 모형을 독립적으로 적용하는 일련의 이탈예측 프로세스이다. 제안한 이탈예측 프로세스의 상대적 우수성을 평가하기 위해 기존의 범용이탈예측 프로세스와 클러스터링 기반 이탈예측 프로세스와의 성능 비교를 수행하였다. 글로벌 NGO 단체인 A사의 협력으로 후원자 데이터를 활용한 분석과 검증을 수행했으며, 제안한 CCP/2DL의 성능이 다른 이탈예측 방법론보다 우수한 성능을 보이는 것으로 나타났다. 이러한 이탈예측 프로세스는 이탈예측에도 효과적일 뿐만 아니라, 다양한 고객통찰력을 확보하고, 관련된 다른 퍼포먼스 마케팅 활동을 수행할 수 있는 전략적 기반이 될 수 있다는 점에서 연구의 의의를 찾을 수 있다.