• Title/Summary/Keyword: 선형회귀 모델

Search Result 440, Processing Time 0.028 seconds

Self-Organizing Fuzzy Modeling using Creation of Clusters (클러스터 생성을 이용한 자기구성 퍼지 모델링)

  • 고택범
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2002.05a
    • /
    • pp.245-251
    • /
    • 2002
  • 본 논문에서는 상대적으로 큰 퍼지 엔트로피를 갖는 입력-출력 데이터 집단에 다중 회귀 분석을 적용하여 다차원 평면 클러스터를 생성하고, 이 클러스터를 새로운 퍼지 모델의 규칙으로 추가한 후 퍼지 모델 파라미터의 개략 동조와 정밀 동조를 수행하는 자기구성 퍼지 모델링을 제안한다. Weighted recursive least squared 알고리즘과 fuzzy C-regression model 클러스터링에 의해 퍼지 모델의 파라미터를 개략적으로 동조한 후 gradient descent 알고리즘에 의해 파라미터를 정밀 동조하면서 감수분열 유전 알고리즘을 이용하여 최적의 학습률을 탐색한다. 그리고 자기 구성 퍼지 모델링 기법을 이용하여 Box-Jenkins의 가스로 데이터, 다변수비선형 정적 함수의 데이터와 하수 처리 활성오니 공정의 모델링을 수행하고, 기존의 방법에 의한 모델링 결과와 비교하여 그 성능을 입증한다.

  • PDF

A Study on the HIC15 Estimating Model Using Frontal Crash Pulses (정면충돌 가속도곡선을 이용한 HIC15 예측모델에 관한 고찰)

  • Ha, Tae-Woong;Lim, Jaemoon
    • Journal of Auto-vehicle Safety Association
    • /
    • v.14 no.1
    • /
    • pp.62-67
    • /
    • 2022
  • This study is to construct the simple estimating model for the HIC15 of the driver dummy using the frontal impact test results. Test results of 9 vehicles of Hyundai Sonata from the MY2002~MY2020 USNCAP are utilized for constructing the linear regression model. The average accelerations extracted from the vehicle crash pulses are handled as the main factors. The average accelerations of 10 ms interval within 0~100 ms are calculated from the crash pulse data of 9 vehicles. The present estimating model of the HIC15 using the average accelerations of 10 ms interval in the 0~80 ms range shows good agreement with the tested value within 2.4% maximum error.

Predictive Optimization Adjusted With Pseudo Data From A Missing Data Imputation Technique (결측 데이터 보정법에 의한 의사 데이터로 조정된 예측 최적화 방법)

  • Kim, Jeong-Woo
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.20 no.2
    • /
    • pp.200-209
    • /
    • 2019
  • When forecasting future values, a model estimated after minimizing training errors can yield test errors higher than the training errors. This result is the over-fitting problem caused by an increase in model complexity when the model is focused only on a given dataset. Some regularization and resampling methods have been introduced to reduce test errors by alleviating this problem but have been designed for use with only a given dataset. In this paper, we propose a new optimization approach to reduce test errors by transforming a test error minimization problem into a training error minimization problem. To carry out this transformation, we needed additional data for the given dataset, termed pseudo data. To make proper use of pseudo data, we used three types of missing data imputation techniques. As an optimization tool, we chose the least squares method and combined it with an extra pseudo data instance. Furthermore, we present the numerical results supporting our proposed approach, which resulted in less test errors than the ordinary least squares method.

Construction of Urban Crime Prediction Model based on Census Using GWR (GWR을 이용한 센서스 기반 도시범죄 특성 분석 및 예측모델 구축)

  • YOO, Young-Woo;BAEK, Tae-Kyung
    • Journal of the Korean Association of Geographic Information Studies
    • /
    • v.20 no.4
    • /
    • pp.65-76
    • /
    • 2017
  • The purpose of this study was to present a prediction model that reflects crime risk area analysis, including factors and spatial characteristics, as a precursor to preparing an alternative plan for crime prevention and design. This analysis of criminal cases in high-risk areas revealed clusters in which approximately 25% of the cases within the study area occurred, distributed evenly throughout the region. This means that using a multiple linear regression model might overestimate the crime rate in some regions and underestimate in others. It also suggests that the number of deserted houses in an analyzed region has a negative relationship with the dependent variable, based on the multiple linear regression model results, and can also have different influences depending on the region. These results reveal that closure signs in a study area affect the dependent variable differently, depending on the region, rather than a simple or direct relationship with the dependent variable, as indicated by the results of the multiple linear regression model.

Excursion-Set Modeling of the Splashback Mass Function and its Cosmological Usefulness (Splashback 질량함수의 Excursion-Set Modeling과 우주론적 유용성)

  • Ryu, Suho;Lee, Jounghun
    • The Bulletin of The Korean Astronomical Society
    • /
    • v.46 no.2
    • /
    • pp.44.3-45
    • /
    • 2021
  • 일반화된 excursion set 이론과 자기 유사 구형 유입(Self-similar spherical infall) 모형에 기반하여 Splashback 질량함수에 대한 해석적 단일 매개변수 모델을 착안하였다. Planck/WMAP7 관측결과를 토대로 구축된 EREBOS N-Body 시뮬레이션의 수치적 결과의 해석적 모델을 이용한 회귀분석을 통해 단일 매개변수이자 Splashback 경계의 확산적 특성을 수치화하는 확산계수(Diffusion Coefficient)의 추정치를 계산하였다. 계산된 확산계수를 적용한 해석적 모델과 수치적 결과가 5 ≤ M/(1012h-1 M) < 103의 질량범위에서 매우 근접히 일치하는 것을 보였으며 Baysian and Akaike Information Criterion 검정을 통해 0.3 ≤ z ≤ 3의 범위에서 기존의 모델들보다 본 모델이 선호 돼야함을 확인하였다. 또한 확산계수가 적색편이에 대하여 선형진화에 근접한 변화를 보임을 발견하였으며, 특정 임계 적색편이(zc)를 기준으로 확산계수가 0에 수렴함을 발견하였다. 더 나아가 두 Planck모델과 WMAP7모델에서 도출된 확산계수는 서로 상당한 차이를 보였다. 이 결과는 암흑물질 헤일로의 splashback 질량함수가 z ≥ zc에서 매개변수가 없는 온전한 해석적 모델로 설명되고 zc가 독립적으로 우주의 초기조건을 독립적으로 특정지을 수 있는 가능성을 지님을 시사한다. 이 초록은 The Astrophysical Journal의 Ryu & Lee 2021, ApJ, 917, 98 (arxiv:2103.00730) 논문을 바탕으로 작성되었다.

  • PDF

Consumer Credit Scoring Model with Two-Stage Mathematical Programming (통합 수리계획법을 이용한 개인신용평가모형)

  • Lee, Sung-Wook;Roh, Tae-Hyup
    • The Journal of Information Systems
    • /
    • v.16 no.1
    • /
    • pp.1-21
    • /
    • 2007
  • 신용평점을 위한 부도예측의 분류 문제를 다루는데 있어서 통계적 판별분석 및 인공신경망 및 유전자알고리즘 등을 이용한 데이터 마이닝의 방법들이 일반적으로 고려되어왔다. 이 연구에서는 수리계획법을 응용하여 classification gap을 고려한 이단계 수리계획 접근방법을 신용평가에 적용하는 방법론을 제안하여 수리계획법을 통한 신용평가모형 구축의 가능성을 제시한다. 1단계에서는 선형계획법을 이용해서 대출 신청자에게 대출을 허가할 것 인지의 여부를 결정하게 되는 대출 심사 filtering으로의 적용단계이고, 2단계에서는 정수계획법을 이용하여 오분류 비용이 최소가 되도록 하는 판별점수를 찾는 과정으로 모형을 구성한다. 개인 대출 신청자의 데이터(German Credit Data)에 대하여 피셔의 선형 판별함수, 로지스틱 회귀모형 및 기존의 수리계획 기법들과의 비교를 통해서 제안된 모델의 성능을 평가한다. 이단계 수리계획 접근법의 평가 결과를 통하여 신용평가모형에의 적용가능성을 기존 통계적인 접근방법 및 수리계획 접근법과 비교하여 제시하고 있다.

  • PDF

Model Development and Analysis of the Car Interior Sound Quality (차량 실내 소음의 음질 분석 및 모델화)

  • Hur, Deog-Jae;Cho, Yeon;Kim, Hee-Seok;Lee, Keun-Soo;Park, Tae-Won
    • Journal of KSNVE
    • /
    • v.10 no.2
    • /
    • pp.254-260
    • /
    • 2000
  • the reduction of the interior nosie level has been the main interest of NVH engineers in the development of vehicles. However, the consumer's perception on the car noise is affected largely by the psychoacoustic characteristics of the noise, as well as the sound pressure level. In this study, the quality of the vehicle interior nosie is analyzed by employing the subjective evaluations and by representing them in temrs of the objective quantities. The subjective evaluatins were performed for the seven vehicles in the range of subcompact to luxury cars. The methods of paired comparisons and semantic differential were used to study the preference, the quality of interior noise and their correlation. The linear regression models were obtained for the subjective evaluation and the sound quality metrics.

  • PDF

The Measurement and Analysis of Path Loss in Millimeter-Wave Band for Different Progation Environments (전파환경에 따른 밀리미터파 대역 경로손실 측정 및 분석)

  • 정남호;백정기;김준철;황정환;한동필
    • The Journal of Korean Institute of Electromagnetic Engineering and Science
    • /
    • v.11 no.3
    • /
    • pp.410-418
    • /
    • 2000
  • In this paper, path losses in millimeter-wave band for different propagation environments are measured, and the results are analyzed by modeling the median, maximum, and minimum values of the measurement data for each site, which are recorded for 5 minutes, with a linear regression model. The measurement data shows that in urban and suburban environments, extra path loss must be taken into account for line-of-sight path, even in millimeter wave band.

  • PDF

Estimating soil moisture using machine learning approach: A Case Study to Yongdam watershed (기계학습 기반의 토양함수 예측 기법 개발 (용담댐 시험유역을 중심으로))

  • Huy, Nguyen Dinh;Kwon, Hyun-Han
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2018.05a
    • /
    • pp.167-167
    • /
    • 2018
  • 토양수분은 토양에 포함된 평균 수분량을 나타내며 수문 순환 관점에서 매우 중요한 수문변량 중 하나이다. 본 연구에서는 대표적인 기계학습 방법인 Support Vector Machine (SVM)을 이용한 토양 함수 예측 기법을 개발하고자 하며, 예측인자로서 원격 탐측 기반의 토양함수자료, 강수량, 온도 등을 활용하고자 한다. SVM은 Kernel 함수를 이용하여 복잡한 비선형 관계를 선형 가정을 통해서 해석하는 기계학습 방법으로서 전역모델(global model)로서 다양한 수문기상분야에 적용이 이루어지고 있다. SVM의 장점은 일정 부분의 오차를 허용함으로서 모형의 일반화 측면에서 기존 인공신경망(artificial neural network, ANN)에 비해 우수한 성능을 나타내며, 특히 예측모형으로서 적용성이 매우 크다. 본 연구에서는 과거 토양 함수 자료와 강수, 온도, 위성 관측 기반 정보 등을 이용하여 모형을 적합시키고 이를 미계측 유역으로 확장하는데 연구의 목적이 있으며, 본 연구를 통해 제안된 모형은 용담댐 시험유역을 대상으로 적용되며 기존 ANN 모형 및 다중회귀분석 결과와 비교를 통해 모형의 적합성을 평가하고자한다.

  • PDF

Analysis and Design for Improving Read Performance on NAND Flash Memory Storage (낸드 플래시 메모리 저장장치에서 읽기 성능 향상을 위한 분석 및 설계)

  • Su-Mi Song;Hyun-Seob Lee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.05a
    • /
    • pp.525-526
    • /
    • 2023
  • 최근 빅데이터를 처리하기 위한 고용량의 저장장치의 연구가 활발하게 진행되고 있다. 특히 낸드 플래시 메모리 기반 저장장치인 SSD(Solid State Drive)는 고속 데이터 처리가 가능하기 때문에 다양한 저장 시스템에서 사용되고 있다. 그러나 낸드 플래시 메모리는 읽기 속도가 빠르고 쓰기 속도가 느린 비대칭 구조를 가지고 있어 데이터 쓰기 작업이 진행 중일 때 다른 작업이 대기하게 되어 전체적인 시스템 성능에 영향을 미칠 수 있다. 이에 대해 대부분의 연구에서는 쓰기 성능을 개선하기 위한 버퍼 관리 정책들이 제안되었다. 기술의 발전으로 쓰기 성능은 개선되었지만, 그에 비해 읽기 성능이 저조한 문제가 있다. 본 논문에서는 읽기 성능이 쓰기 성능보다 취약한 점을 분석하고 플래시 메모리 내에 저장장치 속도를 개선하기 위해 앞으로 읽기 요청 가능성이 있는 예상 데이터를 선형회귀 모델을 적용하여 전송 대기 시간 중 미리 읽는 정책을 제안한다.