• 제목/요약/키워드: binary pattern

검색결과 392건 처리시간 0.018초

주부의 연령대별 농식품 소비 특성 비교 (Comparison of Housewives' Agricultural Food Consumption Characteristics by Age)

  • 홍준호;김진실;유연주;이경희;조완섭
    • 한국빅데이터학회지
    • /
    • 제6권1호
    • /
    • pp.83-89
    • /
    • 2021
  • 라이프스타일이 빠르게 변화하고 있고, 식생활과 식품가공 기술의 발전에 따라 가구별로 식품 소비패턴이 매우 다양하다. 본 논문은 가구 단위의 농식품 구매 정보를 담고 있는 농촌진흥청이 구축하고 있는 소비자 패널 데이터의 식품군을 재분류하고 농식품 소비행위 주체인 패널 대표자의 연령대별로 그룹화하여 농식품 소비 특성 비교를 하였다. 연령대 구분의 기준은 대사질환 유병률로 20% 이상인 60대 이상 그룹과 10% 미만인 30~40대 그룹으로 나누었다. LightGBM 알고리즘을 사용하여 30~40대와 60대 이상의 식품 소비패턴의 차이를 분류 분석한 결과 정밀도는 0.85, 재현율은 0.71, F1_score는 0.77로 나타났다. 변수중요도의 결과는 과자류, 엽경채나물류, 조미채류, 과채류, 수산물류 순이었으며, SHAP 지표의 상위 5개 값은 과자류, 수산물류, 조미채류, 과채류, 엽경채나물류 순이었다. 이상치에 민감한 평균을 대신한 중앙값으로 소비패턴을 이진 분류한 결과 과자류의 경우 30~40대가 60대보다 두 배 이상 높은 것을 알 수 있었다. 이외의 변수에서도 30~40대와 60대 이상 사이에서 유의미한 차이를 보였다. 연구 결과 30~40대는 60대보다 과자류를 두 배 이상 소비하는 패턴을 보였으며, 60대의 경우 30~40대보다 수산물, 조미채류, 과채류, 엽경채나물류를 두 배 이상 섭취하였다. 상위 5개 품목 외에도 밀가공식품인 과자, 빵류, 면류에서 30~40대의 소비가 높았으며, 이는 60대의 식품 소비패턴과 차이를 보였다.

효과적인 입력변수 패턴 학습을 위한 시계열 그래프 기반 합성곱 신경망 모형: 주식시장 예측에의 응용 (A Time Series Graph based Convolutional Neural Network Model for Effective Input Variable Pattern Learning : Application to the Prediction of Stock Market)

  • 이모세;안현철
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.167-181
    • /
    • 2018
  • 지난 10여 년간 딥러닝(Deep Learning)은 다양한 기계학습 알고리즘 중에서 많은 주목을 받아 왔다. 특히 이미지를 인식하고 분류하는데 효과적인 알고리즘으로 알려져 있는 합성곱 신경망(Convolutional Neural Network, CNN)은 여러 분야의 분류 및 예측 문제에 널리 응용되고 있다. 본 연구에서는 기계학습 연구에서 가장 어려운 예측 문제 중 하나인 주식시장 예측에 합성곱 신경망을 적용하고자 한다. 구체적으로 본 연구에서는 그래프를 입력값으로 사용하여 주식시장의 방향(상승 또는 하락)을 예측하는 이진분류기로써 합성곱 신경망을 적용하였다. 이는 그래프를 보고 주가지수가 오를 것인지 내릴 것인지에 대해 경향을 예측하는 이른바 기술적 분석가를 모방하는 기계학습 알고리즘을 개발하는 과제라 할 수 있다. 본 연구는 크게 다음의 네 단계로 수행된다. 첫 번째 단계에서는 데이터 세트를 5일 단위로 나눈다. 두 번째 단계에서는 5일 단위로 나눈 데이터에 대하여 그래프를 만든다. 세 번째 단계에서는 이전 단계에서 생성된 그래프를 사용하여 학습용과 검증용 데이터 세트를 나누고 합성곱 신경망 분류기를 학습시킨다. 네 번째 단계에서는 검증용 데이터 세트를 사용하여 다른 분류 모형들과 성과를 비교한다. 제안한 모델의 유효성을 검증하기 위해 2009년 1월부터 2017년 2월까지의 약 8년간의 KOSPI200 데이터 2,026건의 실험 데이터를 사용하였다. 실험 데이터 세트는 CCI, 모멘텀, ROC 등 한국 주식시장에서 사용하는 대표적인 기술지표 12개로 구성되었다. 결과적으로 실험 데이터 세트에 합성곱 신경망 알고리즘을 적용하였을 때 로지스틱회귀모형, 단일계층신경망, SVM과 비교하여 제안모형인 CNN이 통계적으로 유의한 수준의 예측 정확도를 나타냈다.