• Title/Summary/Keyword: 이산자료

Search Result 240, Processing Time 0.043 seconds

Predication of win/lose of Professional baseball using Heuristic model (Heuristic model를 이용한 프로야구 승패 예측)

  • Kim, Dong-Sik;Hong, Seok-Mi;Jung, Tae-Chung
    • Annual Conference of KIPS
    • /
    • 2000.10a
    • /
    • pp.325-328
    • /
    • 2000
  • 프로야구경기의 승패 예측의 문제는 그리 쉬운 일이 아니다. 왜냐하면 경기에 영향을 미치는 요소가 무한하기 때문이다. 예를 들어, 경기당일의 선수들의 컨디션이나 사기, 경기당일의 날씨, 구장요건, 상대팀에 대한 심리적 요인등 사전에 경기영향을 미치는 요소가 무한하다. 본 연구실에서는 과거 경기기록 자료를 기반으로 유용한 규칙을 찾아내어 분류트리를 만들어 학습하는 ID3 알고리즘을 프로야구 승패예측 시스템 구성에 사용하여 보았으나, 이산적인 자료의 처리로 인해 연속적인 경기자료를 고려하지 못하는 문제로 예측율이 더이상 향상되지 않았다. 따라서, 본 논문에서는 휴리스틱 방법을 이용한 경기전 예측과 경기중 예측을 이닝별 득점으로 세분화하여, 실제 경기상황을 고려한 일반적인 예측모형을 만들어 예측율을 향상시키고자 한다. 향후에는 더욱 세분화시켜 Case-based에 의한 예측을 하고자 한다.

  • PDF

Study on Interpolation Methods for Discontinuous Grids in Preprocessing and Postprocessing of Numerical Modeling (수치모의의 전처리와 후처리를 위한 불연속 격자에서의 보간법에 대한 고찰)

  • Kim, Tae Beom;Kim, Il-Hwan;Lee, Jae-Beom;Yang, Jeong-Seok
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.289-289
    • /
    • 2017
  • 자연 현상을 연구 대상으로 하는 공학적인 접근법이나 과학적인 접근법에 있어서 컴퓨터를 활용한 수치모의는 이제 거의 모든 분야에서 활용되고 있으며, 복잡한 자연 현상을 해석하고 예측하기 위한 필수적인 하나의 도구로 자리매김하고 있다. 하지만, 컴퓨팅 기술의 눈부신 발전에도 불구하고, 과거에 개발되어 현재까지도 활용되고 있는 기술의 보완점은 항상 제기되고 있으며, 또한 필요성에 의한 새로운 기술들이 끊임없이 새롭게 개발되고 있다. 하천 또는 지하수 모의를 위해서 모형을 구축할 때 가장 기본적이며, 가장 중요한 준비 과정은 모의 영역에 대한 격자 형성이다. 연속성을 지닌 모의 대상을 수치적으로 접근하기 위해서는 연속성을 가정한 불연속적인 격자를 생성하는 과정이 반드시 필요하며, 연속성을 지닌 자료로부터 이산적인 자료를 얻어 내삽과정을 통해 격자점에 할당하게 된다. 모의준비 과정뿐만 아니라 모의 결과의 활용과정에서도 내삽이 필요할 수 있다. 따라서, 본 연구에서는 trend-surfaces법, 역거리 가중치법, spline법 등 기존에 알려진 공간자료 보간법들을 지형 자료 또는 지하수위 자료 등의 2차원 공간 자료에 적용하여 비교, 분석하며, 보다 효과적인 내삽기술에 대해서 알아보고자 한다.

  • PDF

A study of spatial scaling approach for regionalization of streamflow data at ungaged watershed (공간적 scaling 기법을 적용한 미계측유역 하천자료의 지역화에 관한 연구)

  • Kim, Jin-Guk;Kwon, Duk-Soon;Choi, Byoung-Han;Kwon, Hyun-Han
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2016.05a
    • /
    • pp.36-36
    • /
    • 2016
  • 하천정비나 유역종합 치수계획 등 수자원계획을 수립하는 과정에 있어 하천의 설계홍수량 추정은 필수적이며, 하천의 수공구조물의 안전성과 수문학적 위험도를 산정하는데도 활용되고 있다. 그러나 매년 관측되는 강우량 자료에 비해 유출량 자료의 길이가 비교적 짧아 신뢰성 있는 홍수량자료의 구축이 어려운 실정이며, 미계측 유역에 위치한 중소규모 하천의 설계홍수량과 같은 수문학적 자료는 매우 제한적이다. 이러한 이유로 본 연구에서는 기 수립된 하천정비기본계획의 자료들을 활용하여 유역의 특성(면적, 경사, 고도)이 고려되는 새로운 홍수량 산정식을 개발하였으며, Bayesian GLM(generalized linear method) 기법을 활용하여 미계측 유역의 지역화를 통한 홍수량의 추정이 가능하도록 하였다. 또한 Hierarchical Bayesian 기법을 활용하여 개발된 공식에 활용되는 매개변수의 불확실성을 구간을 산정하였다. Bayesian 기법의 도입으로 산정되는 홍수량의 불확실성 구간을 정량적으로 제시할 수 있었으며, 제안된 연구 결과는 미계측 유역의 홍수량을 추정하는 도구로서 활용성이 높을 것으로 기대된다.

  • PDF

A study of regionalization of streamflow data at ungaged watershed by watershed characteristics (유역특성을 활용한 빈도별 미계측 유역 홍수량 지역화)

  • Kim, Jin-Guk;Lee, Jeong-Ju;Park, Rea-Kon;Kwon, Hyun-Han
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2018.05a
    • /
    • pp.13-13
    • /
    • 2018
  • 우리나라의 하천 홍수량 자료는 대부분 댐 상류나 홍수위험 지역 등 유역 내 하천관리가 필요한 주요 지점에서만 측정되고 있다. 그러나 매년 관측되는 강우량 자료에 비해 유출량 자료는 유역의 크기가 작아질수록 매우 제한적이며, 신뢰성 있는 홍수량자료의 구축이 어려운 실정이다. 이에 본 연구에서는 유역특성인자(유역면적, 유역경사)를 매개변수로 활용하여 권역별 설계홍수량 자료에 대한 지역화 분석을 수행하였으며, 미계측 유역에서 홍수량 추정이 가능하도록 모형을 개발 하였다. 모형에서 발생하는 불확실성을 고려하기 위하여 Bayesian GLM(generalized linear method)기법을 활용하였으며, 최종적으로 모형의 매개변수와 산정되는 홍수량 결과에 대한 불확실성 구간을 정량적으로 제시하였다. 제안된 모형을 통해 일부 유역을 미계측 유역으로 가정하여 홍수량을 추정하였으며, 통계적 지표를 활용하여 기수립된 설계홍수량 자료와의 비교를 통해 모형의 적합성을 평가하였다. 본 연구를 통해 제안된 모형은 검증과정과 도출된 결과를 통해 유역특성에 따른 재현기간별 홍수량을 효과적으로 재현하는데 유리할 뿐만 아니라, Bayesian 기법을 도입하여 매개변수와 도출된 결과에 대한 불확실성의 정량적인 평가가 가능한 장점을 확인하였다.

  • PDF

Marginal Effect Analysis of Travel Behavior by Count Data Model (가산자료모형을 기초로 한 통행행태의 한계효과분석)

  • 장태연
    • Journal of Korean Society of Transportation
    • /
    • v.21 no.3
    • /
    • pp.15-22
    • /
    • 2003
  • In general, the linear regression model has been used to estimate trip generation in the travel demand forecasting procedure. However, the model suffers from several methodological limitations. First, trips as a dependent variable with non-negative integer show discrete distribution but the model assumes that the dependent variable is continuously distributed between -$\infty$ and +$\infty$. Second, the model may produce negative estimates. Third, even if estimated trips are within the valid range, the model offers only forecasted trips without discrete probability distribution of them. To overcome these limitations, a poisson model with a assumption of equidispersion has frequently been used to analyze count data such as trip frequencies. However, if the variance of data is greater than the mean. the poisson model tends to underestimate errors, resulting in unreliable estimates. Using overdispersion test, this study proved that the poisson model is not appropriate and by using Vuong test, zero inflated negative binomial model is optimal. Model reliability was checked by likelihood test and the accuracy of model by Theil inequality coefficient as well. Finally, marginal effect of the change of socio-demographic characteristics of households on trips was analyzed.

Heat-Wave Data Analysis based on the Zero-Inflated Regression Models (영-과잉 회귀모형을 활용한 폭염자료분석)

  • Kim, Seong Tae;Park, Man Sik
    • Journal of the Korean Data Analysis Society
    • /
    • v.20 no.6
    • /
    • pp.2829-2840
    • /
    • 2018
  • The random variable with an arbitrary value or more is called semi-continuous variable or zero-inflated one in case that its boundary value is more frequently observed than expected. This means the boundary value is likely to be practically observed more than it should be theoretically under certain probability distribution. When the distribution considered is continuous, the variable is defined as semi-continuous and when one of discrete distribution is assumed for the variable, we regard it as zero-inflated. In this study, we introduce the two-part model, which consists of one part for modelling the binary response and the other part for modelling the variable greater than the boundary value. Especially, the zero-inflated regression models are explained by using Poisson distribution and negative binomial distribution. In real data analysis, we employ the zero-inflated regression models to estimate the number of days under extreme heat-wave circumstances during the last 10 years in South Korea. Based on the estimation results, we create prediction maps for the estimated number of days under heat-wave advisory and heat-wave warning by using the universal kriging, which is one of the spatial prediction methods.

Bayesian Analysis for Categorical Data with Missing Traits Under a Multivariate Threshold Animal Model (다형질 Threshold 개체모형에서 Missing 기록을 포함한 이산형 자료에 대한 Bayesian 분석)

  • Lee, Deuk-Hwan
    • Journal of Animal Science and Technology
    • /
    • v.44 no.2
    • /
    • pp.151-164
    • /
    • 2002
  • Genetic variance and covariance components of the linear traits and the ordered categorical traits, that are usually observed as dichotomous or polychotomous outcomes, were simultaneously estimated in a multivariate threshold animal model with concepts of arbitrary underlying liability scales with Bayesian inference via Gibbs sampling algorithms. A multivariate threshold animal model in this study can be allowed in any combination of missing traits with assuming correlation among the traits considered. Gibbs sampling algorithms as a hierarchical Bayesian inference were used to get reliable point estimates to which marginal posterior means of parameters were assumed. Main point of this study is that the underlying values for the observations on the categorical traits sampled at previous round of iteration and the observations on the continuous traits can be considered to sample the underlying values for categorical data and continuous data with missing at current cycle (see appendix). This study also showed that the underlying variables for missing categorical data should be generated with taking into account for the correlated traits to satisfy the fully conditional posterior distributions of parameters although some of papers (Wang et al., 1997; VanTassell et al., 1998) presented that only the residual effects of missing traits were generated in same situation. In present study, Gibbs samplers for making the fully Bayesian inferences for unknown parameters of interests are played rolls with methodologies to enable the any combinations of the linear and categorical traits with missing observations. Moreover, two kinds of constraints to guarantee identifiability for the arbitrary underlying variables are shown with keeping the fully conditional posterior distributions of those parameters. Numerical example for a threshold animal model included the maternal and permanent environmental effects on a multiple ordered categorical trait as calving ease, a binary trait as non-return rate, and the other normally distributed trait, birth weight, is provided with simulation study.

Subscription to the Internet Telephony : An Econometric Analysis of Stated-Preference Data (인터넷전화 가입의향분석: Stated-Preference 자료의 계량경제학적 분석)

  • Kim, Ho
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 2005.05a
    • /
    • pp.814-821
    • /
    • 2005
  • 본 연구에서는 인터넷전화의 잠재 가입자를 대상으로 이들의 전화 사용 행태 및 사회-인구 통계적 특성 검토하여 이를 인터넷전화의 가입 확률로 연결하는 모형을 개발한다. 이때 가입 예측모형은 설문결과에 이산 프로빗 모형을 적용함으로써 구축하였다. 모형의 결과에 따르면 인터넷전화서비스 가입에 통계적으로 유의한 영향을 미치는 변수는 월 전화요금, 월 전화사용회수, 채택하고 있는 전화요금제, 현재 가입 중인 전화회사, 가구 의사결정자의 나이 등인 것으로 분석되었다. 또한 위의 각 요인의 부호는 관련 분야의 전문가들의 일반적인 견해 및 상식과 일치하는 것으로 나타났다.

  • PDF

Performance analysis of traffic shaper for an MPEG video source (MPEG 비디오원을 대상으로 한 트래픽 쉐이퍼의 성능 분석)

  • 이상천;이명용;홍정식;이창훈
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 1995.04a
    • /
    • pp.418-433
    • /
    • 1995
  • 본 연구에서는 MPEG 트래픽과 같이 셀 흐름에 주기성을 갖는 비디오 트래픽 모형에 대한 쉐이핑 정책을 제시하고, 쉐이퍼에서의 셀손실율, 셀지연, 및 완만화 효과를 분석하였다. 분석 모형으로는 이산 상태 마코프 연쇄를 사용하였으며, 예제를 통해 시뮬레이션 결과와 비교하므로서 분석모형을 검증하였다. 분석 결과 셀지연 및 완만화 효과 사이에는 서비스율의 증가에 따라 trade off가 존재함이 나타났다. 본 연구는 ATM 트래픽관리에 있어서 다중화 장치에서의 성능분석과 병행하여 쉐이퍼의 설계에 있어서 정량화된 기초자료를 제공할 수 있을 것이라 여겨진다.

  • PDF

양식장 수차의 수치모델 개발 및 적용

  • 강윤호
    • Proceedings of the Korean Society of Fisheries Technology Conference
    • /
    • 2001.05a
    • /
    • pp.307-308
    • /
    • 2001
  • 축제식 양식장 호지의 노령화를 방지하기 위해 수차를 이용하여 호지에 폭기 및 순환작용을 활성화하여 수질과 저질을 개선하는 방법이 널리 사용되고 있다. 본 연구에서는 이차원 수심적분 Reynolds 방정식을 지배방정식으로 하였고 이를 유한차분식으로 이산화한 수치모형(PDM)을 개발하였다. PDM은 수차 1대에 의한 유속발생에 적용하여 수차로부터 l0m 거리마다 층별 유속을 측정한 자료와 비교하여 검증하였다. (중략)

  • PDF