• Title/Summary/Keyword: 회귀분석기법

Search Result 1,080, Processing Time 0.03 seconds

A Study on the Performance Evaluation of Machine Learning for Predicting the Number of Movie Audiences (영화 관객 수 예측을 위한 기계학습 기법의 성능 평가 연구)

  • Jeong, Chan-Mi;Min, Daiki
    • The Journal of Society for e-Business Studies
    • /
    • v.25 no.2
    • /
    • pp.49-63
    • /
    • 2020
  • The accurate prediction of box office in the early stage is crucial for film industry to make better managerial decision. With aims to improve the prediction performance, the purpose of this paper is to evaluate the use of machine learning methods. We tested both classification and regression based methods including k-NN, SVM and Random Forest. We first evaluate input variables, which show that reputation-related information generated during the first two-week period after release is significant. Prediction test results show that regression based methods provides lower prediction error, and Random Forest particularly outperforms other machine learning methods. Regression based method has better prediction power when films have small box office earnings. On the other hand, classification based method works better for predicting large box office earnings.

A Nonlinear Regression Analysis Method for Frame Erasure Concealment in VoIP Networks (VoIP 망에서의 프레임손실은닉을 위한 비선형 회귀분석 기법)

  • Choi, Seung-Ho;Sung, Ho-Sang
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.9 no.5
    • /
    • pp.129-132
    • /
    • 2009
  • Frame erasure is one of the most difficult problems in voice over IP (VoIP) networks and is a major source of speech quality degradation. In this paper, a frame erasure concealment algorithm based on nonlinear regression analysis is presented to minimize speech quality deterioration in code-excited linear prediction (CELP) based coders. We applied the proposed scheme to the ITU-T G.729 standard and obtained improved perceptual evaluation of speech quality (PESQ) scores compared to the conventional methods.

  • PDF

Load forecasting for the holidays on Saturday or Monday using a fuzzy linear regression and a rotative coefficient algorithm (퍼지 선형회귀분석법과 상대계수법을 이용한 토요일과 월요일의 특수일 예측)

  • Ku, Bon-Suk;Baek, Young-Sik;Song, Kyung-Bin;Hong, Dug-Hun
    • Proceedings of the KIEE Conference
    • /
    • 2001.05a
    • /
    • pp.52-54
    • /
    • 2001
  • 전력 수요 예측은 전력 수급 안정과 양질의 전력을 공급하기 위한 필수 기법이며 경쟁적인 전력 시장에서 전력요금과 밀접한 관련이 있다. 그러므로, 경쟁적인 전력시장 구조하의 시장 참여자에게 있어서 전력수요 예측은 매우 관심 있는 사항이다. 최근의 전력 수요 예측 기법으로 예측한 오차율을 살펴보면 특수일의 전력 수요 예측의 정확도가 평일 예측에 비해 낮으며 특히, 토요일 또는 월요일에 특수일이 오는 경우 예측의 정확도가 낮아지는 경향이 있다. 따라서, 찬 논문은 퍼지 선형회귀 분석법과 상대계수법을 병행하여 예측함으로써 특수일 수요 예측의 정확도를 개선하는 방법을 제시한다.

  • PDF

Improvement of Search Method of Genetic Programing for Wind Prediction MOS (풍속 예측 보정을 위한 Genetic Programing 탐색 기법의 개선)

  • Oh, Seungchul;Seo, Kisung
    • Proceedings of the KIEE Conference
    • /
    • 2015.07a
    • /
    • pp.1349-1350
    • /
    • 2015
  • 풍속은 다른 기상요소들보다 순간 변동이 심하고 국지성이 강하여 수치 예보 모델만으로 예측의 정확성을 높이기가 어렵다. 기상청의 단기 풍속 예보는 전 지구적 통합 예보모델인 UM(Unified Model)의 예측값에 MOS(Model Output Statictics)를 통한 보정을 수행하며, 보정식의 생성에 다중선형회귀분석 방법을 사용한다. 본 연구자는 유전프로그래밍(Genetic Programming)을 이용한 비선형 회귀분석 기반의 보정식 생성을 통하여 이를 개선한 바 있는데, 본 연구에서는 보다 향상된 성능을 얻기 위하여 GP 기법 측면에서 Automatically Defined Functions과 다군집(Multiple Populations) 수행을 통해 성능을 높이고자 한다.

  • PDF

Development of optimizing method to crimp high current terminal for wiring harness in vehicle (자동차용 대전류 단자 압착 최적화 기법 개발)

  • Kim, Seong-Woo;Oh, Shin-Jong;Jung, Won-Wook
    • Journal of Applied Reliability
    • /
    • v.6 no.4
    • /
    • pp.307-315
    • /
    • 2006
  • 차량 전장품 중 와이어링 하네스에서 큰 전류가 흐르는 회로의 연결 단자가 가지는 전기적 내구 성능 및 기계적 성능을 확보하기 위하여 단자 압착부의 압축율 최적화 기법을 개발하였다. 우선 단자 제작 과정을 표준화한 후 압착부의 주요 인자인 기계적 인장강도와 내부 부식 정도에 의한 전기적 저항 중대로 화재가 발생 가능성 관점에서 접근하였다. 여러 가지 실험을 통하여 얻어진 DATA를 분석한 결과 회귀 2차 모형을 사용하여 대전류 단자 압착부의 전기적/기계적 내구 성능 최적화 구간을 설정 하였으며, 이의 과정을 제시 하였다.

  • PDF

Realtime Fuel Consumption Prediction using ln-Vehicle Data from OBDII and Regression Methods (OBDII 데이터 기반의 회귀 분석을 통한 실시간 연료 소비량 예측)

  • Yang, Hee-Eun;Kim, Do-Hyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.05a
    • /
    • pp.497-499
    • /
    • 2020
  • 자율주행 차량이 많아지고 차량의 ECU가 고도화되면서 정확한 차량의 데이터를 획득하고 분석하여 활용하는 것이 중요해지고 있다. 현재에는 내연 기관 차량의 ECU 데이터를 얻기 위해서 OBDII 포트(규격)에 기반한 CAN동선을 주로 이용하고 있다. 하지만 OBDII 규격을 통해서 연비와 같은 중요한 차량 정보를 얻는 경우, 변환식 (MAF 센서(흡입 공기량 센서)와 공기/연료 비율을 이용)의 오차 범위가 커서 데이터의 정확도가 낮다. 본 연구에서는 머신 러닝 기법 중에 하나인 회귀 기법을 통해서 기존의 계산보디 더 정확한 연비를 구할 수 있는 모델을 개발하였다. 이러한 모델 개발을 통하여 차량의 RAW 데이터를 기반으로 필요한 차량 데이터를 정확하게 구할 수 있게 되었으며 20회가 넘는 실 도로주행을 통해서 본 모델의 정확도를 검증하였다.

A Study on Cost-Benefit Analysis Techniques in GIS Applications (GIS의 활용에 따른 비용-이익 산정기법에 관한 소고)

  • Kim, Jung-Ok;Yu, Ki-Yun;Kim, Yong-Il
    • 한국지형공간정보학회:학술대회논문집
    • /
    • 2002.03a
    • /
    • pp.130-136
    • /
    • 2002
  • GIS의 구축과 활용에 있어서 비용과 그에 따른 효과의 산정에 관하여는 활발한 연구가 이루어지지 못하고 있는 실정이다. 이는 상당부분 적절한 산정방법론의 부재에 기인한다. 본 연구에서는 그간의 학제적 연구과정을 거쳐 온 전통적인 비용-효과 분석의 틀을 고찰해보고 이를 토대로 최근 미국 지질조사국(USGS)에서 제안한 모델링 기법을 분석해 보았다. 전통적인 비용-효과 분석의 틀은 다수의 고안된 계량적 지표에 의거하는데 이는 모델링 기법에 의한 분석에서도 역시 준거체로서 작용한다. 특히 모델링 기법에서는 효과의 산정에 있어 활용된 GIS의 복잡도를 기본 요소로서 인식하고 이를 다중회귀분석에 의해 분석하여 그 효과를 산정하였다.

  • PDF

A Study for Improving the Performance of Data Mining Using Ensemble Techniques (앙상블기법을 이용한 다양한 데이터마이닝 성능향상 연구)

  • Jung, Yon-Hae;Eo, Soo-Heang;Moon, Ho-Seok;Cho, Hyung-Jun
    • Communications for Statistical Applications and Methods
    • /
    • v.17 no.4
    • /
    • pp.561-574
    • /
    • 2010
  • We studied the performance of 8 data mining algorithms including decision trees, logistic regression, LDA, QDA, Neral network, and SVM and their combinations of 2 ensemble techniques, bagging and boosting. In this study, we utilized 13 data sets with binary responses. Sensitivity, Specificity and missclassificate error were used as criteria for comparison.

A study on estimating the quick return flow from irrigation canal of agricultural water using watershed model (유역모델을 이용한 농업용수 신속회귀수량 산정 연구)

  • Lee, Jiwan;Jung, Chunggil;Kim, Daye;Maeng, Seungjin;Jeong, Hyunsik;Jo, Youngsik;Kim, Seongjoon
    • Journal of Korea Water Resources Association
    • /
    • v.55 no.5
    • /
    • pp.321-331
    • /
    • 2022
  • In this study, we tried to present a method for calculating the amount of regression using a watershed modeling method that can simulate the hydrological mechanism of water balance analysis and agricultural water based on watershed unit. Using the soil water assessment tool (SWAT), a watershed water balance analysis was conducted considering the simulation of paddy fields for the Manbongcheon Standard Basin (97.34 km2), which is a representative agricultural area of the Yeongsan river basin. Before evaluating return flow, the SWAT was calibrated and validated using the daily streamflow observation data at Naju streamflow gauge station (NJ). The coefficient of determination (R2), Nash-Sutcliffe Efficiency (NSE), Root-Mean-Square Error (RMSE) of NJ were 0.73, 0.70, 0.64 mm/day. Based on the calibration results for three years (2015-2017), the quick return flow and the return rate compared to the water supply amount for the irrigation period (April 1 to September 30) were calculated, and the average return flow rate was 53.4%. The proposed method of this study may be used as foundation data to optimal agricultural water supply plan for rational watershed management.

Flood Risk Forecasting using Logistic Regression for the Han River Basin (로지스틱 회귀분석을 활용한 한강권역 홍수위험 예보기법 개발)

  • Lee, Seon Mi;Choi, Youngje;Yi, Jaeeung
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2021.06a
    • /
    • pp.354-354
    • /
    • 2021
  • 2020년은 장마기간이 49일간 지속됨에 따라 침수, 산사태 등 많은 홍수피해가 발생하였다. 특히 서울에서는 한강 본류의 수위가 급격하게 증가함에 따라 둔치 및 도로 침수 피해가 발생하였다. 이처럼 하천의 수위증가로 인한 홍수피해에 대응하기 위해 홍수통제소 및 기초지자체에서는 홍수특보를 발령한다. 이 홍수특보는 수위관측소 지점별 계획홍수량의 50 %, 70 % 이상의 홍수량이 발생할 경우 홍수주의보와 홍수경보가 발령되며, 이 기준은 각 권역별로 동일하다. 하지만 2017년 의정부시에서는 중랑천 수위증가로 인해 주변 지역에 침수피해가 발생하였지만, 이때 홍수량은 계획홍수량 대비 약 30 %에 불과하였다. 이처럼 한강권역 내 하천수위 증가로 인한 홍수피해는 계획홍수량의 50 % 이내에서 발생하기도 한다. 이에 본 연구에서는 한강권역을 대상으로 현재 2단계로 발령되는 홍수특보를 3단계로 세분화하고자 하였다. 단계별 홍수량 위험기준을 산정하기 위해 과거 홍수피해 발생 이력이 있는 한강권역 내 43개의 수위관측소 지점을 선정하였으며, 지점별 홍수기 동안의 홍수량 및 피해액 자료를 수집하였다. 각 단계별 홍수량 기준을 산정하기 위해서는 로지스틱 회귀분석 방법을 활용하여 피해발생 확률을 산정하였다. 1단계 기준은 계획홍수량 대비 홍수량 비율과 홍수피해 발생여부를 고려한 이항 로지스틱 회귀분석 모델을 구축한 후 3계 도함수에 적용하여 홍수피해 발생확률이 급격하게 증가하는 특이점을 산정하였다. 2단계와 3단계 기준은 다항 로지스틱 회귀분석 중 계층형 로지스틱 회귀분석을 활용하여 지점별 피해액 비율이 60 ~ 80 %, 80 ~ 100 % 구간에 속할 확률을 산정하고, 1단계와 동일한 방법으로 특이점을 산정하였다. 그 결과 지점별로 기존 제공되고 있는 홍수특보 기준을 과거 발생한 홍수피해를 고려하여 세분화할 수 있었으며, 이 결과는 지역별 홍수피해 저감대책에 활용될 수 있을 것으로 판단된다.

  • PDF