• 제목/요약/키워드: Sales data prediction

검색결과 108건 처리시간 0.025초

래퍼 기반 경제 데이터 수집 시스템 설계 및 구현 (Wrapper-based Economy Data Collection System Design And Implementation)

  • 박철호;구영현;유성준
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2015년도 춘계학술대회
    • /
    • pp.227-230
    • /
    • 2015
  • 경제의 흐름, 주가 등을 분석, 예측을 위해 경제 뉴스, 주가 등 데이터 수집이 필요하다. 일반적인 웹 크롤러는 자동적으로 웹서버를 방문하면서 웹페이지 내용을 분석하고 URL들을 추출하면서 웹 문서를 수집한다. 반면 특정한 주제의 문서만을 수집할 수 있는 크롤러 형태도 있다. 특정 사이트에서 경제 뉴스 정보만 수집하기 위하여 사이트의 구조를 분석하고 직접적으로 데이터를 수집해올 수 있는 래퍼 기반 웹 크롤러 설계가 필요하다. 본 논문에서는 빅데이터를 기반으로, 경제뉴스 분석 시스템을 위한 크롤러 래퍼를 설계, 구현하여 경제 전문 분야의 뉴스 데이터를 수집하였다. 2000년부터 현재까지 미국 자동차 시장의 주식 데이터를 래퍼 기반으로 가져오고, 사이트 상에서의 데이터가 업데이트되는 주기를 판단하여 주기적으로 업데이트 함으로써 중복되지 않게 하였다. 그리고 미국, 한국의 경제 기사를 래퍼 기반의 웹 크롤러를 사용하여 수집하고, 향후 분석이 쉽게 데이터를 정형화 시켜 저장한다.

  • PDF

캠페인 효과 제고를 위한 자기 최적화 변수 선택 알고리즘 (Self-optimizing feature selection algorithm for enhancing campaign effectiveness)

  • 서정수;안현철
    • 지능정보연구
    • /
    • 제26권4호
    • /
    • pp.173-198
    • /
    • 2020
  • 최근 온라인의 비약적인 활성화로 캠페인 채널들이 다양하게 확대되면서 과거와는 비교할 수 없을 수준의 다양한 유형들의 캠페인들이 기업에서 수행되고 있다. 하지만, 고객의 입장에서는 중복 노출로 인한 캠페인에 대한 피로감이 커지면서 스팸으로 인식하는 경향이 있고, 기업입장에서도 캠페인에 투자하는 비용은 점점 더 늘어났지만 실제 캠페인 성공률은 오히려 더 낮아지고 있는 등 캠페인 자체의 효용성이 낮아지고 있다는 문제점이 있어 실무적으로 캠페인의 효과를 높이고자 하는 다양한 연구들이 지속되고 있다. 특히 최근에는 기계학습을 이용하여 캠페인의 반응과 관련된 다양한 예측을 해보려는 시도들이 진행되고 있는데, 이 때 캠페인 데이터의 다양한 특징들로 인해 적절한 특징을 선별하는 것은 매우 중요하다. 전통적인 특징 선택 기법으로 탐욕 알고리즘(Greedy Algorithm) 중 SFS(Sequential Forward Selection), SBS(Sequential Backward Selection), SFFS(Sequential Floating Forward Selection) 등이 많이 사용되었지만 최적 특징만을 학습하는 모델을 생성하기 때문에 과적합의 위험이 크고, 특징이 많은 경우 분류 예측 성능 하락 및 학습시간이 많이 소요된다는 한계점이 있다. 이에 본 연구에서는 기존의 캠페인에서의 효과성 제고를 위해 개선된 방식의 특징 선택 알고리즘을 제안한다. 본 연구의 목적은 캠페인 시스템에서 처리해야 하는 데이터의 통계학적 특성을 이용하여 기계 학습 모델 성능 향상의 기반이 되는 특징 부분 집합을 탐색하는 과정에서 기존의 SFFS의 순차방식을 개선하는 것이다. 구체적으로 특징들의 데이터 변형을 통해 성능에 영향을 많이 끼치는 특징들을 먼저 도출하고 부정적인 영향을 미치는 특징들은 제거를 한 후 순차방식을 적용하여 탐색 성능에 대한 효율을 높이고 일반화된 예측이 가능하도록 개선된 알고리즘을 적용하였다. 실제 캠페인 데이터를 이용해 성능을 검증한 결과, 전통적인 탐욕알고리즘은 물론 유전자알고리즘(GA, Genetic Algorithm), RFE(Recursive Feature Elimination) 같은 기존 모형들 보다 제안된 모형이 보다 우수한 탐색 성능과 예측 성능을 보임을 확인할 수 있었다. 또한 제안 특징 선택 알고리즘은 도출된 특징들의 중요도를 제공하여 예측 결과의 분석 및 해석에도 도움을 줄 수 있다. 이를 통해 캠페인 유형별로 중요 특징에 대한 분석과 이해가 가능할 것으로 기대된다.

아파트 매매가격 예측에 관한 연구: 경기도 S시 아파트 기본속성과 경제·교육·문화·교통 속성을 중심으로 (A Study on the Prediction for Apartment Sales Price: Focusing on the Basic Property, Economy, Education, Culture and Transportation Properties in S city, Gyeonggi-do)

  • 김성훈;이중목;이향섭;우수한;신우진;우종필
    • 한국빅데이터학회지
    • /
    • 제5권1호
    • /
    • pp.109-124
    • /
    • 2020
  • 한국사회에서 부동산에 대한 많은 관심에도 불구하고 가격예측은 쉽지 않으며, 그중에서도 아파트는 주거공간인 동시에 투자의 의미도 지니고 있어 더욱 가격예측은 쉽지 않다. 아파트 가격에 영향을 주는 요인은 매우 다양하며 지역에 따른 특성도 있다. 본 연구는 경기도 S시 아파트 매매가격에 영향을 주는 요인들과 특성을 도출하기 위해 수행되었다. 일반적으로 지하철 접근성이 좋을수록 아파트 가격이 높다고 파악되나, S시의 경우 1호선과는 가까울수록 오히려 가격이 소폭 하락하는 현상이 있었으며, 신분당선은 지하철 접근성이 높을수록 매우 가격이 높게 나타났다. 국고채5년평균과 매매가격이 반비례관계였고, M2평잔과 매매가격과 비례관계로 파악이 되었다. 용적률과 총주차대수가 매매가격에 많은 영향을 미쳤으며, 1.5Km 이내의 백화점과 할인마트 존재 여부가 가장 중요한 요인이었다.

A Study on Financial Ratio and Prediction of Financial Distress in Financial Markets

  • Lee, Bo-Hyung;Lee, Sang-Ho
    • 유통과학연구
    • /
    • 제16권11호
    • /
    • pp.21-27
    • /
    • 2018
  • Purpose - This study investigates the financial ratio of savings banks and the effect of the ratio having influence upon bankruptcy by quantitative empirical analysis of forecast model to give material of better management and objective evidence of management strategy and way of advancement and risk control. Research design, data, and methodology - The author added two growth indexes, three fluidity indexes, five profitability indexes, and four activity indexes CAMEL rating to not only the balance sheets but also the income statement of thirty savings banks that suspended business from 2011 to 2015 and collected fourteen financial ratio indexes. IBMSPSS VER. 21.0 was used. Results - Variables having influence upon bankruptcy forecast models included total asset increase ratio and operating income increase ratio of growth index and sales to account receivable ratio, and tangible equity ratio and liquidity ratio of liquidity ratio. The study selected total asset operating ratio, and earning and expenditure ratio from profitability index, and receivable turnover ratio of activity index. Conclusions - Financial supervising system should be improved and financial consumers should be protected to develop saving bank and to control risk, and information on financial companies should be strengthened.

아파트시장예측을 위한 신경망분석 적응가능성에 대한 연구 (A Study on the Applicability of Neural Network Model for Prediction of tee Apartment Market)

  • 남영우;이정민
    • 한국건설관리학회논문집
    • /
    • 제7권2호
    • /
    • pp.162-170
    • /
    • 2006
  • 부동산분야에서 전통적인 예측방법과 비교하여 보다 예측력을 높일 수 있는 방법을 찾으려 한다. 이에 앞서 신경망 모형의 적용가능성을 살펴보고, 기존의 연구를 토대로 한 신경망 이론의 정의, 구조, 장단점 등을 살펴본다. 구체적인 적용가능성을 확인하기 위하여 동일 데이터로 회귀분석과 신경망분석을 통한 모형을 구축하고, 예측정확도 측면에서 신경망모형의 적용 가능성을 검토한다. 부동산학에서 기존에 회귀분석에 치우쳐 있던 연구방법을 신경망분석까지 확장하고, 특히 예측정확도 측면에서 우수성이 검증되고 있는 신경망모형에 대한 연구를 활성화 하고자 하는데 본 연구의 목적이 있다. 연구방법으로는 분양가격에 영향을 주는 거시경제변수를 모형화 한다. 그 모형설정 후 회귀분석과 신경망분석으로 결과를 비교하여 보다 예측 정확도가 높은 것을 찾는다. 그 결과 신경망모형의 예측정확도가 상당히 높게 나타났다.

이동통신 환경 하에서의 고객관계관리를 위한 지역광고 추천 모형 (Location-based Advertisement Recommendation Model for Customer Relationship Management under the Mobile Communication Environment)

  • 안현철;한인구;김경재
    • Asia pacific journal of information systems
    • /
    • 제16권4호
    • /
    • pp.239-254
    • /
    • 2006
  • Location-based advertising or application has been one of the drivers of third-generation mobile operators' marketing efforts in the past few years. As a result, many studies on location-based marketing or advertising have been proposed for recent several years. However, these approaches have two common shortcomings. First. most of them just suggested the theoretical architectures, which were too abstract to apply it to the real-world cases. Second, many of these approaches only consider service provider (seller) rather than customers (buyers). Thus, the prior approaches fit to the automated sales or advertising rather than the implementation of CRM. To mitigate these limitations, this study presents a novel advertisement recommendation model for mobile users. We call our model MAR-CF (Mobile Advertisement Recommender using Collaborative Filtering). Our proposed model is based on traditional CF algorithm, but we adopt the multi-dimensional personalization model to conventional CF for enabling location-based advertising for mobile users. Thus, MAR-CF is designed to make recommendation results for mobile users by considering location, time, and needs type. To validate the usefulness of our recommendation model. we collect the real-world data for mobile advertisements, and perform an empirical validation. Experimental results show that MAR-CF generates more accurate prediction results than other comparative models.

A Study on the Improving Measures of Private Brand Clothing Products in Domestic Department Stores

  • Kim, Wan-Joo;Kim, Moon-Sook
    • The International Journal of Costume Culture
    • /
    • 제4권1호
    • /
    • pp.44-60
    • /
    • 2001
  • The purpose of this study is to present suggestions to improve the problems the domestic department stores face by analyzing and comparing the status of the development of PB which is absolutely critical for the specialized domestic department stores to survive, and to search for the future course which may lead to boosting sales and profit by developing the strategic PB products. Selected for this study were atotal of 20 PB's out of domestic as well s foreign PB's in the 4 big department stores. The data were analyzed with SAS package employed as per the by items frequency, percent, mean and standard deviation. From the above study, following viewpoints can be taken into account for the future development of PB ; First, the active will of the excutive is basically necessary for successful development of PB, by relying on long-term investment. Second, the existing mid or low-price goods should be in line with the mid or high price one's development for domestic merchandising with focus on middle or high class society. Third, the stock burden, biggest problem of PB, can be solved by discount policy at optimum prices and success rate of merchandising prediction.

  • PDF

Application of a Hybrid System of Probabilistic Neural Networks and Artificial Bee Colony Algorithm for Prediction of Brand Share in the Market

  • Shahrabi, Jamal;Khameneh, Sara Mottaghi
    • Industrial Engineering and Management Systems
    • /
    • 제15권4호
    • /
    • pp.324-334
    • /
    • 2016
  • Manufacturers and retailers are interested in how prices, promotions, discounts and other marketing variables can influence the sales and shares of the products that they produce or sell. Therefore, many models have been developed to predict the brand share. Since the customer choice models are usually used to predict the market share, here we use hybrid model of Probabilistic Neural Network and Artificial Bee colony Algorithm (PNN-ABC) that we have introduced to model consumer choice to predict brand share. The evaluation process is carried out using the same data set that we have used for modeling individual consumer choices in a retail coffee market. Then, to show good performance of this model we compare it with Artificial Neural Network with one hidden layer, Artificial Neural Network with two hidden layer, Artificial Neural Network trained with genetic algorithms (ANN-GA), and Probabilistic Neural Network. The evaluated results show that the offered model is outperforms better than other previous models, so it can be use as an effective tool for modeling consumer choice and predicting market share.

빅데이터 분석을 통한 피자 판매량 예측 (Pizza Sales Prediction by Using Big Data Analysis.)

  • 이대범;김경섭;이영수;김하나한;변동삼;박성철;전화성;김준태
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.890-893
    • /
    • 2014
  • IT산업의 새로운 패러다임으로 빅데이터 분석이 주요한 기술로 부각되고 있다. 본 논문에서는 빅데이터를 수집, 분석하여 이를 통해 피자 판매량을 예측하는 모델을 제안한다. 판매량 예측을 위하여 과거 판매 데이터와 함께 공휴일, 날씨, 뉴스기사, 경제지표, 트렌드, 스포츠 이벤트 등의 데이터를 수집하여 이용하였으며, 판매량 예측 방법으로는 회기분석과 인공신경망 학습 등을 사용하여 빅데이터를 사용하지 않은 경우와 정확도를 비교하였다. 실험 결과 빅데이터를 이용함으로써 예측 오차율이 5%이상 향상됨을 확인하였다.

A Study on the Numerical Approach for Industrial Life Cycle: Empirical Evidence from Korea

  • LEE, Kangsun;CHOI, Kyujin;CHO, Daemyeong
    • The Journal of Asian Finance, Economics and Business
    • /
    • 제8권5호
    • /
    • pp.667-678
    • /
    • 2021
  • The industrial life cycle theory was extended to the product life cycle theory and the corporate life cycle theory, but a conceptual life cycle was presented, and quantitative empirical evidence for this was insufficient. It is intended to improve appropriate resource planning and resource allocation by quantitatively predicting the industrial cycle and its position (age) in the cycle. Human resources, tangible assets, and industrial output analysis were conducted based on 28 years of actual data of 39 industries in Korea by applying the Gompertz model, which is a population ecology prediction model. By predicting with the Gompertz model, the coefficient of determination R2 value was 97% or more, confirming the high suitability with the actual cumulative sales value of the industry. A numerical model for calculating the life cycle of each industry, calculating the saturation of input resources for each industry, and diagnosing the financial stability of the industry was presented. These results will contribute to the decision-making of industrial policy officers for budget planning appropriately for each stage of industry development. Future research will apply the numerical model of this study to foreign national industries, complete an inter-industry convergence diagnostic model (e.g. ease of convergence, suitability of convergence, etc.) for renewal of fading industries.