• 제목/요약/키워드: Sales data prediction

검색결과 108건 처리시간 0.024초

회귀나무 모형을 이용한 패널데이터 분석 (Panel data analysis with regression trees)

  • 장영재
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권6호
    • /
    • pp.1253-1262
    • /
    • 2014
  • 회귀나무 (regression tree)는 독립변수로 이루어진 공간을 재귀적으로 분할하고 해당 영역에서 종속변수의 최선의 예측값을 찾고자 하는 비모수적 방법론이다. 회귀나무 모형이 제안된 이래 로지스틱 회귀나무모형이나 분위수 회귀나무모형과 같이 유연하고 다양한 모형적합을 위한 연구가 진행되어 왔다. 최근에 들어서는 Sela와 Simonoff (2012)의 RE-EM 알고리즘, Loh와 Zheng (2013)의 GUIDE 등 패널데이터와 관련하여 진일보한 나무모형 알고리즘도 제안되었다. 본 논문에서는 각 알고리즘을 소개하고 특징을 살펴보는 한편, 실험 데이터를 생성하여 평균제곱오차 (mean squared error)를 바탕으로 예측력을 비교하였다. 분석결과, RE-EM 알고리즘의 예측력이 상대적으로 우수하게 나타났다. 이 알고리즘을 통해 기업경기실사지수 업종별 패널자료를 분석한 결과 최근의 업황에 가장 큰 영향을 미치는 요소는 매출 실적으로 나타났으며 매출 상위 그룹의 경우 비제조업이 제조업에 비해 업황에 대한 판단이 긍정적인 것으로 나타났다.

소비자 사이의 중고 태블릿PC 거래 가격의 통계적 예측 (Statistical Prediction of Used Tablet PC Transaction Price among Consumers)

  • 고영희;김소형;정유진
    • 산업융합연구
    • /
    • 제20권12호
    • /
    • pp.179-186
    • /
    • 2022
  • 본 연구에서는 태블릿PC 중고제품의 거래 시, 판매자와 구매자 모두에게 판매가격을 제시할 수 있는 예측모형을 개발하는 것을 목표로 한다. 모형 개발을 위하여 실제 태블릿PC 중고거래 데이터와 제품에 대한 상세 정보를 추가 수집한 데이터를 사용하였다. 데이터 분석을 통하여 여러 가지 예측모형을 개발하였으며, 이 중 태블릿PC 중고가격 예측 성능이 가장 뛰어난 모형을 최종 예측모형으로 선택하였다. 구체적으로 중고 태블릿의 판매가격을 종속변수로 하고, 통합된 데이터에서 판매가격과 연관성이 있는 변수들을 독립변수로 한 다중선형회귀모형, 교호작용을 포함한 다중선형회귀모형, 그리고 각 모형에서 단계적 변수 선택법을 통해 얻은 모형들을 고려하였다. 이들 모형 중 교차타당성을 통해 최종적으로 예측 성능이 가장 뛰어난 모형을 태블릿PC 중고가격을 예측하는 모형으로 선택하였다. 본 연구를 통하여 중고제품 판매가격을 예측하고 판매자와 구매자에게 적절한 중고 거래 가격을 제시해 볼 수 있을 것이다.

광주광역시 아파트 매매가 영향요인 분석 (An Analysis of the Key Factors Affecting Apartment Sales Price in Gwangju, South Korea)

  • 임성연;고창완;정영선
    • 스마트미디어저널
    • /
    • 제11권3호
    • /
    • pp.62-73
    • /
    • 2022
  • 국내 아파트 매매가 예측에 관한 연구는 현재까지 지속적으로 수행되어 왔지만, 아파트 가격은 다양한 특성이 복합적으로 작용하기 때문에 예측하는데 어려움을 겪고 있다. 아파트 매매가를 예측하는데 앞서 정확도를 높이기 위해서는 주요 변수 선정 및 영향요인 분석이 무엇보다 중요하다. 이에 본 연구는 현재 꾸준한 상승률을 보이는 광주광역시를 대상으로 아파트 매매가에 영향을 주는 요인을 분석해보고자 한다. 이를 위해 6년간의 광주광역시 아파트 실거래가와 각종 사회적 요인 데이터를 토대로, 다중회귀분석, 랜덤 포레스트, 심층인공신경망 알고리즘을 적용하여 각 모델에서 주요 영향요인을 파악하였으며, 모델의 성능은 평균 제곱근 오차, 평균 절대 오차 그리고 결정계수를 통해 비교 분석하였다. 본 연구에서는 딥러닝의 일종인 심층인공신경망의 성능이 가장 우수함을 보였고, 매매가에 영향을 미치는 주요 요인으로 건축경과연수, 계약연도, 적용면적, 양도성예금증서, 주택담보대출금리, 선행지수, 생산자물가지수, 동행지수 등이 도출되었다.

농업 공공 빅데이터를 이용한 머신러닝 기반 생산량 및 판매 수익금 예측 (Machine Learning-based Production and Sales Profit Prediction Using Agricultural Public Big Data)

  • 이현조;김용기;구현정;채철주
    • 스마트미디어저널
    • /
    • 제11권4호
    • /
    • pp.19-29
    • /
    • 2022
  • IoT 기술의 발전에 따라 스마트팜을 활용하는 농가가 증가하고 있다. 스마트팜은 환경을 모니터링하고, 원격 또는 자동으로 최적의 내부 환경을 조성하여 작물의 생산량 및 품질을 향상시킨다. 이를 위해 수집되는 농업 디지털 데이터를 활용하여 작물의 생산성을 예측하는 기술에 대한 연구가 활성화되고 있다. 그러나 생산량 예측을 위한 연구에서는 기존의 통계자료를 바탕으로 하는 통계모델 기반의 연구가 대부분이며, 이에 따라 예측 정확도가 낮은 문제점이 존재한다. 본 연구에서는 시설 원예 스마트팜에 수집된 농업 디지털 데이터를 활용하여 다양한 머신러닝 모델을 통해 생산량 및 판매 수익금을 예측하고, 성능을 비교하였다. 성능을 비교한 모델은 다중선형회귀, 서포트벡터머신, 인공신경망, 순환신경망, LSTM, ConvLSTM이다. 성능 비교 결과 ConvLSTM가 R2 값 및 RMSE 값에서 가장 우수한 성능을 나타내었다.

소비자 구매행동 예측을 위한 이질적인 모형들의 통합

  • 배재권;김진화
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2007년도 추계학술대회
    • /
    • pp.489-498
    • /
    • 2007
  • For better predictions and classifications in customer recommendation, this study proposes an integrative model that efficiently combines the currently-in-use statistical and artificial intelligence models. In particular, by integrating the models such as Association Rule, Frequency Matrix, and Rule Induction, this study suggests an integrative prediction model. The data set for the tests is collected from a convenience store G, which is the number one in its brand in S. Korea. This data set contains sales information on customer transactions from September 1, 2005 to December 7, 2005. About 1,000 transactions are selected for a specific item. Using this data set, it suggests an integrated model predicting whether a customer buys or not buys a specific product for target marketing strategy. The performance of integrated model is compared with that of other models. The results from the experiments show that the performance of integrated model is superior to that of all other models such as Association Rule, Frequency Matrix, and Rule Induction.

  • PDF

Analysis of Market Trajectory Data using k-NN

  • Park, So-Hyun;Ihm, Sun-Young;Park, Young-Ho
    • Journal of Multimedia Information System
    • /
    • 제5권3호
    • /
    • pp.195-200
    • /
    • 2018
  • Recently, as the sensor and big data analysis technology have been developed, there have been a lot of researches that analyze the purchase-related data such as the trajectory information and the stay time. Such purchase-related data is usefully used for the purchase pattern prediction and the purchase time prediction. Because it is difficult to find periodic patterns in large-scale human data, it is necessary to look at actual data sets, find various feature patterns, and then apply a machine learning algorithm appropriate to the pattern and purpose. Although existing papers have been used to analyze data using various machine learning methods, there is a lack of statistical analysis such as finding feature patterns before applying the machine learning algorithm. Therefore, we analyze the purchasing data of Songjeong Maeil Market, which is a data gathering place, and finds some characteristic patterns through statistical data analysis. Based on the results of 1, we derive meaningful conclusions by applying the machine learning algorithm and present future research directions. Through the data analysis, it was confirmed that the number of visits was different according to the regional characteristics around Songjeong Maeil Market, and the distribution of time spent by consumers could be grasped.

A Study on a car Insurance purchase Prediction Using Two-Class Logistic Regression and Two-Class Boosted Decision Tree

  • AN, Su Hyun;YEO, Seong Hee;KANG, Minsoo
    • 한국인공지능학회지
    • /
    • 제9권1호
    • /
    • pp.9-14
    • /
    • 2021
  • This paper predicted a model that indicates whether to buy a car based on primary health insurance customer data. Currently, automobiles are being used to land transportation and living, and the scope of use and equipment is expanding. This rapid increase in automobiles has caused automobile insurance to emerge as an essential business target for insurance companies. Therefore, if the car insurance sales are predicted and sold using the information of existing health insurance customers, it can generate continuous profits in the insurance company's operating performance. Therefore, this paper aims to analyze existing customer characteristics and implement a predictive model to activate advertisements for customers interested in such auto insurance. The goal of this study is to maximize the profits of insurance companies by devising communication strategies that can optimize business models and profits for customers. This study was conducted through the Microsoft Azure program, and an automobile insurance purchase prediction model was implemented using Health Insurance Cross-sell Prediction data. The program algorithm uses Two-Class Logistic Regression and Two-Class Boosted Decision Tree at the same time to compare two models and predict and compare the results. According to the results of this study, when the Threshold is 0.3, the AUC is 0.837, and the accuracy is 0.833, which has high accuracy. Therefore, the result was that customers with health insurance could induce a positive reaction to auto insurance purchases.

패스트 패션을 위한 지능형 신속대응시스템(IQRS-FF)에 관한 연구 (A Study on the Intelligent Quick Response System for Fast Fashion(IQRS-FF))

  • 박현성;박광호
    • 지능정보연구
    • /
    • 제16권3호
    • /
    • pp.163-179
    • /
    • 2010
  • 최근 패션산업에서는 고객의 니즈가 다양해지고 공급 리드타임이 크게 단축됨에 따라 최신 유행을 즉각 반영한 디자인, 빠른 상품 회전율로 승부하는 패스트 패션이 각광받고 있다. 또한, 기업간 경쟁도 심화되면서 얼마나 신속하게 효율적으로 고객의 니즈를 만족시킬 것인가가 패션산업의 중요한 성공요인으로 강조되고 있다. 따라서, 다품종 소량 신속생산이 강조되는 패스트 패션 산업에서는 트랜드 변화에 신속 대응을 지원하는 지능형 신속대응시스템(Intelligent Quick Response System : IQRS) 구축 및 지원을 절실히 요구하고 있다. 본 논문은 패스트 패션 산업 IQRS 구축에서 요구되는 신속대응 프로세스 수립, 지능적 판단을 지원하는 신속대응 기준 및 실행, 신속대응 물량 산정 및 시기 의사결정 모델을 제시하였다. 또한, 신속대응 의사결정의 합리성을 검증할 수 있는 KPI(Key Performance Indicator)를 설계하여 모델의 신뢰도를 향상시켰다. 제시된 각 모델은 A사의 ERP 구현사례를 통해 실용성을 검증하였다.

인공지능을 이용하여 매출성장성과 거시지표 분석을 통한 주가 예측 연구 (A study on stock price prediction through analysis of sales growth performance and macro-indicators using artificial intelligence)

  • 홍성혁
    • 융합정보논문지
    • /
    • 제11권1호
    • /
    • pp.28-33
    • /
    • 2021
  • 주가는 그 기업의 미래 가치의 척도이기 때문에 주가를 분석할 때 기업의 성장성인 매출과 이익 등을 고려하여 주식을 투자한다. 기관투자자들은 종목 선정 기준을 잡기 위해서 현재 산업의 트렌드와 거시경제 지표를 보고 성장 가능한 관련 분야를 먼저 정하고 관련 기업을 선정한 후 기업에 대한 분석을 하고 목표가를 설정 후에 매수를 하고 목표가에 도달하면 매도하는 방식으로 주식 매매를 실시한다. 하지만, 일반 개인 투자자들은 경제에 대한 지식이 기관이나 외국인 투자자에 비교하여 부족하고, 기업에 대한 재무재표 분석이나 성장성에 대한 분석 없이 전문가나 지인의 추천종목을 따라 투자를 하여 기관투자자나 외국인 투자자들 보다 수익률 면에서 낮은 편이다. 따라서, 본 연구에서는 기업의 성장성인 매출과 이익 등을 고려한 지표인 ROE를 분석하여 저평가된 종목을 선택하고, 선택된 종목의 주가 흐름을 딥러닝 알고리즘을 통하여 예측하는 연구방법을 제안하여 투기가 아닌 건전한 투자에 도움이 되기 위해 본 연구를 진행한다.

빅데이터 분석을 통한 영화 관객수, 매출액 예측 모델 (Movie attendance and sales forecast model through big data analysis)

  • 이응환;우종필
    • 한국빅데이터학회지
    • /
    • 제4권2호
    • /
    • pp.185-194
    • /
    • 2019
  • 한국영화 100년 역사 속에 한국영화는 2012년부터 해마다 총 관객 수 1억 명을 넘고 있고, 총 매출액은 1조를 바라보고 있다. 이러한 한국영화의 흥행가도에 영향을 준 것이 스마트폰 보급률 60%와 가입자 수 3천만 명을 넘은 2012년과 상관이 있을 것이라 추정을 해 본다. 이에 따라 2012년 전후로 영화흥행 요인변수에도 변화가 필요했고, 새로운 독립변수로 훈련시킨 예측모델을 가지고 실전데이터에 적용하여 예측해 보았다.

  • PDF