• 제목/요약/키워드: design parameters

검색결과 11,783건 처리시간 0.032초

비정형 정보와 CNN 기법을 활용한 이진 분류 모델의 고객 행태 예측: 전자상거래 사례를 중심으로 (Customer Behavior Prediction of Binary Classification Model Using Unstructured Information and Convolution Neural Network: The Case of Online Storefront)

  • 김승수;김종우
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.221-241
    • /
    • 2018
  • 최근 딥러닝 기술이 주목을 받고 있다. 대중들의 관심을 받았던 국제 이미지 인식 기술 대회(ILSVR)와 알파고(AlphaGo)에서 사용된 딥러닝 기술이 바로 합성곱 신경망(CNN; Convolution Neural Network)이다. 합성곱 신경망은 입력 이미지를 작은 구역으로 나누어 부분적인 특징을 인식하고 이것을 결합하여 전체를 인식하는 특징을 가진다. 이러한 딥러닝 기술이 우리의 생활에 있어 많은 변화를 야기할 것이라는 기대를 주고 있지만 현재까지는 이미지 인식과 자연어 처리 등에 그 성과가 국한되어 있다. 비즈니스 문제에 대한 딥러닝 활용은 아직까지 초기 연구 단계로 향후 마케팅 응답 예측이나 허위 거래 식별, 부도 예측과 같은 전통적 비즈니스 문제들에 대해 보다 깊게 활용되고 그 성능이 입증된다면 딥러닝 기술의 활용 가치가 보다 더 주목받게 될 것으로 기대된다. 이러한 때 비교적 고객 식별이 용이하고 활용 가치가 높은 빅데이터를 보유하고 있는 전자상거래 기업의 사례를 바탕으로 하여 딥러닝 기술의 비즈니스 문제 해결 가능성을 진단해보는 것은 학술적으로 매우 의미 있는 시도라 할 수 있겠다. 이에 본 연구에서는 전자상거래 기업의 고객 행태 예측력을 높이기 위한 방안으로 합성곱 신경망을 활용한 '이종 정보 결합(Heterogeneous Information Integration)의 CNN 모델'을 제시한다. 이는 정형과 비정형 정보를 결합하여 다층 퍼셉트론 구조의 합성곱 신경망에서 학습시키는 모델로서 최적의 성능을 발휘하도록 '이종 정보 결합'과 '비정형 정보의 벡터 전환', 그리고 '다층 퍼셉트론 설계'로 하는 3개의 내부 아키텍처를 정의하고 각 아키텍처 단위로 구성되는 방식에 따른 성능을 평가하여 그 결과를 바탕으로 제안 모델을 확정하고 그 성능을 평가해보고자 한다. 고객 행태 예측을 위한 목표 변수는 전자상거래 기업에서 중요하게 관리하고 있는 재구매 고객, 이탈 고객, 고빈도 구매 고객, 고빈도 반품 고객, 고단가 구매 고객, 고할인 구매 고객 등 모두 6개의 이진 분류 문제로 정의한다. 제안한 모델의 유용성을 검증하기 위해서 국내 특정 전자상거래 기업의 실제 데이터를 활용하여 실험을 수행하였다. 실험 결과 정형과 비정형 정보를 결합하여 CNN을 활용한 제안 모델이 NBC(Naïve Bayes classification)과 SVM(Support vector machine), 그리고 ANN(Artificial neural network)에 비해서 예측 정확도와 F1 Measure가 높게 평가되었다. 또 NBC, SVM, ANN에서 정형 정보만을 사용할 때 보다 정형과 비정형 정보를 결합하여 입력 변수로 함께 활용한 경우에 예측 정확도가 향상되는 것으로 나타났다. 따라서 실험 결과로부터 비정형 정보의 활용이 고객 행태 예측의 정확도 향상에 기여한다는 점과 CNN 기법의 특징 추출 알고리즘이 VOC에 사용된 단어들의 분포와 위치 정보를 해석하여 문장의 의미를 파악하는데 효과적이라는 점을 실증적으로 확인하였다는데 그 의미가 있다고 할 수 있겠다. 이를 통해서 CNN 기법이 지금까지 소개된 이미지 인식이나 자연어 처리 분야 외에 비즈니스 문제 해결에도 활용 가치가 높다는 점을 확인하였다는데 이 연구의 의의가 있다 하겠다.

감정예측모형의 성과개선을 위한 Support Vector Regression 응용 (Application of Support Vector Regression for Improving the Performance of the Emotion Prediction Model)

  • 김성진;유은정;정민규;김재경;안현철
    • 지능정보연구
    • /
    • 제18권3호
    • /
    • pp.185-202
    • /
    • 2012
  • 오늘날 정보사회에서는 정보에 대한 가치를 인식하고, 이를 위한 정보의 활용과 수집이 중요해지고 있다. 얼굴 표정은 그림 하나가 수천개의 단어를 표현할 수 있듯이 수천 개의 정보를 지니고 있다. 이에 주목하여 최근 얼굴 표정을 통해 사람의 감정을 판단하여 지능형 서비스를 제공하기 위한 시도가 MIT Media Lab을 필두로 활발하게 이루어지고 있다. 전통적으로 기존 연구에서는 인공신경망, 중회귀분석 등의 기법을 통해 사람의 감정을 판단하는 연구가 이루어져 왔다. 하지만 중회귀모형은 예측 정확도가 떨어지고, 인공신경망은 성능은 뛰어나지만 기법 자체가 지닌 과적합화 문제로 인해 한계를 지닌다. 본 연구는 사람들의 자극에 대한 반응으로서 나타나는 얼굴 표정을 통해 감정을 추론해내는 지능형 모형을 개발하는 것을 목표로 한다. 기존 얼굴 표정을 통한 지능형 감정판단모형을 개선하기 위하여, Support Vector Regression(이하 SVR) 기법을 적용하는 새로운 모형을 제시한다. SVR은 기존 Support Vector Machine이 가진 뛰어난 예측 능력을 바탕으로, 회귀문제 영역을 해결하기 위해 확장된 것이다. 본 연구의 제안 모형의 목적은 사람의 얼굴 표정으로부터 쾌/불쾌 수준 그리고 몰입도를 판단할 수 있도록 설계되는 것이다. 모형 구축을 위해 사람들에게 적절한 자극영상을 제공했을 때 나타나는 얼굴 반응들을 수집했고, 이를 기반으로 얼굴 특징점을 도출 및 보정하였다. 이후 전처리 과정을 통해 통계적 유의변수를 추출 후 학습용과 검증용 데이터로 구분하여 SVR 모형을 통해 학습시키고, 평가되도록 하였다. 다수의 일반인들을 대상으로 수집된 실제 데이터셋을 기반으로 제안모형을 적용해 본 결과, 매우 우수한 예측 정확도를 보임을 확인할 수 있었다. 아울러, 중회귀분석이나 인공신경망 기법과 비교했을 때에도 본 연구에서 제안한 SVR 모형이 쾌/불쾌 수준 및 몰입도 모두에서 더 우수한 예측성과를 보임을 확인할 수 있었다. 이는 얼굴 표정에 기반한 감정판단모형으로서 SVR이 상당히 효과적인 수단이 될 수 있다는 점을 알 수 있었다.

대두육종에 있어서의 선발에 관한 실험적연구 -속보 : 유전력ㆍ유전상관, 그리고 선발지수의 재검토- (Studies on the selection in soybean breeding. -II. Additional data on heritability, genotypic correlation and selection index-)

  • 장권열
    • 한국작물학회지
    • /
    • 제3권
    • /
    • pp.89-98
    • /
    • 1965
  • 대두증산의 중요성에 미추어 대두의 다수계통 선발을 위하여 전년에 공시한 22품종을 재료로 각 형질의 유전력, 각 형질상호간의 유전상관, 그리고 선발지수 등을 재검토하기 위하여 선발시험을 한 바 대체로 전보 전년의 결과와 같다. 1. 유전력 : 유전력을 추정하기 위하여 파종기별로 각 형질의 평균치의 변동을 보면 제1표와 같이 파종기가 지연됨에 따라 형질의 평균치는 감소하고 (Table 1), 형질중에는 환경에 따라 크게 영향을 받는 것도 있으며(Table 2), 각 형질별 유전력을 추정한 바 그 결과는 제3표와 같다. 즉 개화일수ㆍ결실일수ㆍ생육일수 등 생유기간에 관계되는 형질은 그의 유전력이 높고 형태적 특성에 관계되는 형질중에서도 경장 100입중은 높으나 수량에 관여하는 형질 등은 낮았다. 그리고 파종기에 따라서도 변동을 하며 대체로 파종기가 늦어짐에 따라 감소하는 경향이 보인다(Table 3). 2. 유전상관 : 각 형질 상호간의 유전상관ㆍ표현형상관을 알기 위하여 각 형질의 표현형분산과 각 형질 상호간의 표현형공분산ㆍ유전공분산. 그리고 환경공분산을 산출한 바 그 결과는 제4,5표와 같고(Table 4,5), 그들의 유전상관과 표현형상관은 제6표와 같다(Table 6). 대체로 유전사관의 정도는 표현형상관보다높으나 파종기에 따라서도 변동하고 있다. 일주입중 즉 수랴오가 타형질과의 상관을 보면 대체로 전보와 같이 100입중이외의 제형질은 정의 상관을 보이며, 파종기에 따라서도 그 값이 변동을 하나 전보에서는 일주입중과 분지수 사이에 고도의 상관관계가 보였으나, 본실험에 있어서는 상관의 경향이 보였을 따름이다. 그리고 본실험에 있어서는 일주협수와 일주입수간에서 유전상관이 1이상의 이상치를 보였다. 3. 선발지수 : 선발이 최종 대상형질을 일주입중(형질 Y)으로 하여 여기에 어려 형질을 조합한 선발지수(Selection index A)와 최종 대상형질을 수량과 높은 유전상관이 있는 일주협수(형질 Y')로 하여 여기에 여러 형질을 조합한 선발지수(Selection index B)를 Robinson et al.의 방법에 의하여 작성하여 본 바 제7표와 같다(Table 7). 전보의 결과와 같이 대두의 선발에 있어서는 최종 대상형질을 일주입중 대신에 일주협수로써 선발하여도 대차가 없고, 선발대상형질을 4개형질이상인 경우에는 그 효과가 조사와 산출에 요하는 노력에 비하여 크게 기대될 정도가 못된다. 이와 같은 점에서 다수확을 목표로 하는 선발은 탈곡조제 전에 일주협수ㆍ분지수ㆍ경직경 등에 대하여 조사를 하고 선발지수를 산출하여 Selection score가 큰 계통부터 선발하여 가면 될 것으로 믿는다. 그리고 선발을 위한 대상형질로는 생육일수(X$_1$)ㆍ분지수(X$_2$)ㆍ경직경(X$_3$), 그리고 일주협수(X$_4$)의 4개형질 혹은 분지수(X$_2$)ㆍ경직경(X$_3$), 그리고 일주협수(X$_4$)의 3개형질로 할 것이 요망되고, 이들 형질의 측정치로 선발지수를 작성하여 그 지수에서 산출된 Selection score가 큰 계통부터 선발해 나가는 것이 선발지수의 이용상 실용적이고 효과적인 방법이라 하겠다.

  • PDF