• 제목/요약/키워드: multivariate simulation

검색결과 176건 처리시간 0.023초

설명변수가 랜덤인 성형 프로파일 연구 (Linear profile monitoring with random covariate)

  • 김다은;이성임;임요한
    • 응용통계연구
    • /
    • 제35권3호
    • /
    • pp.335-346
    • /
    • 2022
  • 통계적 공정관리에서 프로파일 관리도란 다수의 품질 특성치 간 함수관계의 변화를 탐지하는 것을 말한다. 두 변수 간 선형의 관계가 있는 경우, 선형 프로파일을 가정하고 절편과 기울기가 일정한지 모니터링한다. 이때 선형 프로파일에 관한 대부분의 기존 연구에서는 모든 프로파일에서 설명변수의 관측치가 동일하다고 가정한다. 그러나 프로파일마다 설명변수의 값이 랜덤하게 관측되는 경우도 존재한다. 본 논문에서는 단순 선형 프로파일 모니터링에서 설명변수가 프로파일마다 랜덤하게 관측된다는 가정하에 기존의 방법을 확장 적용하고자 한다. 모의실험을 통해 제안한 방법의 탐지 성능을 확인하고 네트워크 침입 탐지 알고리즘 성능을 비교하기 위한 NSL-KDD 데이터를 이용하여 제안된 침입 탐지 결과를 비교해 보았다.

AANN-기반 센서 고장 검출 기법의 방재시스템에의 적용 (Application of Sensor Fault Detection Scheme Based on AANN to Risk Measurement System)

  • 김성호;이영삼
    • 한국해양학회지:바다
    • /
    • 제11권2호
    • /
    • pp.92-96
    • /
    • 2006
  • 비선형 주성분 분석은 기존에 널리 알려져 있는 주성분 분석기법과 유사한 다변수 데이터 분석을 위한 새로운 접근 방법이다. 비선형 주성분 분석은 AANN(Auto Associative Neural Network)으로 PCA와 마찬가지로 변수들 간에 존재하는 상관관계를 제거함으로써 고차의 다변수 데이터를 정보의 손실을 최소화하면서 최소 차원의 데이터로 변환하는 기법이다. AANN기반 센서 고장 검출 기법을 실제 방재시스템에 적용하여 봄으로써 센서 드리프트 등과 같은 센서 고장의 검출 및 유효한 센서 보정 성능을 확인하였다.

추계학적 강우변동생성 기법과 GIS를 연계한 2차원 침수해석 (Two-dimensional Inundation Analysis Using Stochastic Rainfall Variation and Geographic Information System)

  • 이진영;조완희;한건연;안기홍
    • 한국지리정보학회지
    • /
    • 제13권1호
    • /
    • pp.101-113
    • /
    • 2010
  • 최근에 발생하는 강우양상은 강우일수는 감소하고, 강우강도는 증가해 홍수발생 빈도 역시 증가하는 추세이다. 이를 반영하기 위한 기존의 방법은 수공구조물의 설계홍수량을 산정할 때 가능최대강우량을 도입하거나, 설계빈도를 높이는 등의 확정론적 방법에 의존한다. 그러나 이렇게 설계기준을 상향 조정한 경우, 설계빈도의 강우가 발생하지 않으면 수공구조물의 경제성 측면에서 문제가 될 소지가 있다. 또한 수공구조물의 규모가 클수록 인근 주민과의 마찰이 커지고, 환경 문제의 발생 역시 고려하지 않을 수 없다. 이에 따라 설계빈도의 무조건적인 상향조정에 의존하기보다 추계학적 방법을 도입한 수문량의 확충 및 매개변수의 불확실성을 수공구조물 설계 시에 고려하기 위한 연구가 활발히 진행되고 있다. 본 연구에서는 강우발생의 불확실성을 반영하여 제내지에서의 침수범위를 GIS상에서 검토하였다. 이를 위해 log-ratio 방법, Johnson 시스템, 직교변환을 활용한 다변량 Monte Carlo 기법으로 추계학적 시간에 따른 강우변동을 생성하였다. 생성된 강우변동 결과를 토대로 수문분석, 홍수위 분석 등을 실시하고 FLUMEN 모형을 적용하여 해당유역에 대한 홍수범람시 침수범위를 산정하였다. 본 연구결과는 실제 강우의 불확실성을 반영하고 있어 시 공간적 강우특성이 반영된 유역별 주민대피지도, 홍수위험지도 등을 제작하는데 활용될 수 있을 것으로 판단된다.

유역 및 기상상태를 고려한 Clark 단위도의 매개변수 평가: 2. 매개변수의 변동성 추정 (Evaluation of the Clark Unit Hydrograph Parameters Depending on Basin and Meteorological Condition: 2. Estimation of Parameter Variability)

  • 유철상;이지호;김기욱
    • 한국수자원학회논문집
    • /
    • 제40권2호
    • /
    • pp.171-182
    • /
    • 2007
  • 본 연구에서는 Clark 합성단위도의 매개변수 추정치에 대한 신뢰구간을 좁힐 수 있는 방안으로, 이들을 강우, 기상, 및 유역 특성인자로 다변량 회귀분석한 후 이를 Monte Carlo 모의기법을 통하여 분석하였다. 아울러 이렇게 얻은 결과는 Bootstrap 기법으로 분석한 결과 및 기존에 많이 사용되어 왔던 경험식과도 비교 검토하였다. 이상과 같은 과정을 통해 얻은 결과는 다음과 같다. (1) 관측된 호우사상의 수가 제한적인 경우, 유출특성에 미치는 인자들을 복합적으로 고려하여 유역의 평균유출특성을 추정하는 것이 가능하다. (2) Monte Carlo 모의기법을 적용하여 추정된 집중시간 및 저류상수의 신뢰도 평가가 가능하다. 이렇게 추정한 신뢰구간은 유철상 등(2006)에서의 신뢰구간에 비해 훨씬 좁은 것으로 파악되었다. (3) Bootstrap을 통한 관측자료의 분석에서도 위의 결과를 지지하는 결론을 얻을 수 있었다. 그러나 어느 정도 신뢰도 있는 집중시간 및 저류상수의 추정을 위해서는 최소 20개 정도 이상의 독립된 호우사상이 필요할 것으로 파악되었다. (4) 기존의 경험공식과의 비교에서는 어떤 공식도 본 유역의 유출특성을 잘 대변하지는 못하는 것으로 파악되었다. 그러나 집중시간의 경우 Kraven(I)과 Kraven(II)이 저류상수의 경우 Linsley 공식이 유사한 값을 주는 것으로 나타났다. 그러나 이 값 역시 상한과 하한의 범위에 크므로 사용 시 주의할 필요가 있음을 파악할 수 있었다.

한우의 도체중, 배장근단면적 및 근내지방도의 유전모수 추정방법 (Methods for Genetic Parameter Estimations of Carcass Weight, Longissimus Muscle Area and Marbling Score in Korean Cattle)

  • 이득환
    • Journal of Animal Science and Technology
    • /
    • 제46권4호
    • /
    • pp.509-516
    • /
    • 2004
  • 한우 종모우 선발을 위한 유전능력 평가에서 고려되는 형질들 중 이산형 형태로 조사되는 근내지방도의 유전변이가 추정방법에 따라 어느 정도 차이가 있는지 알아보기 위한 모의실험을 실시하였다. 모의실험 자료는 연속변량으로 간주되는 도체중 및 배장근단면적과 근내지방도의 잠재변수를 다변량 정규분포함수에서 생성하였고 근내지방도의 잠재변수를 이용하여 특정 임계값을 중심으로 순서화된 근내지방도 점수로 변화 하였따. 근내지방도의 점수 부여방법으로써 비거세우에서 조사된 근내지방도의 점수 1${\sim}$5점 사이에 정규분포에서 크게 어긋나는 분포특성을 갖도록 자료(DSI)를 생성하였고 또한 한우 거세우에서 현재 조사되고 있는 점수 1${\sim}$7점 사이에 정규 분포에 좀더 접근한 분포특성을 갖는 모의 자료(DS2)를 생성하였다. 분석방법간에 유전변이 추정의 정확도를 알아보기 위하여 1) 생성된 이들 자료를 선형으로 간주하고 다형질 혼합 선형 개체모형에서 REML 분석방법으로 유전변이를 추정하였고 2) 특정 임계치를 중심으로 잠재변수가 존재한다는 가정하에 다형질 임계 개체 혼합모형을 설정하여 Gibbs sampling 방법으로 유전변이를 추정하였다. 여기서 추정된 유전변이(유전력, 유전상관 및 잔차상관)에 대하여 모수와의 차이를 검정함으로써 편의되는 정도를 알아보았다. 모의실험은 각 자료에 대하여 10회 실시하였다. 분석결과, 근내지방도의 유전력 추정치는 DS1에서는 다형질 임계개체혼합모형을 설정하여 Gibbs sampling 방법으로 모수에 대한 사후분포의 평균으로 계산한 결과 참값과 유의적인 차이가 없는 것으로 분석되었다. 반면에 근내지방도를 선형으로 간주하고 다형질 선형 개체혼합모형에 의한 유전력 추정치는 모수보다 매우 낮은 유전력을 보였다(0.500 vs 0.315). 유전상관 추정치는 선형모형에서의 REML 방법 또는 임계모형에서의Gibbs sampling 방법에서 모두 모수와 유의적인 차이가 없는 것으로 분석되었으나 근내지방도의 잔차상관에 있어서 REML 방법으로 분석하였을 경우에 모수보다 낮게 추정되었다. 반면에 범주형 모형에서는 모수와 추정치 간에 유의적인 차이가 없는 것으로 분석되었다. 또한 7개의 범주형으로 조사된 자료(DS2)에서 이들 추정치는 DS1에서와 동일한 경향을 보였는데 그 편의 정도는 다소 적어지는 경향을 보였다. 따라서 이산형으로 조사되는 근내지방도에 대한 유전변이를 추정하기 위해서는 범주형 임계모형이 선형모형 보다 사소 정확한 추정을 할 수 있을 것으로 판단 되었다.

The extension of the largest generalized-eigenvalue based distance metric Dij1) in arbitrary feature spaces to classify composite data points

  • Daoud, Mosaab
    • Genomics & Informatics
    • /
    • 제17권4호
    • /
    • pp.39.1-39.20
    • /
    • 2019
  • Analyzing patterns in data points embedded in linear and non-linear feature spaces is considered as one of the common research problems among different research areas, for example: data mining, machine learning, pattern recognition, and multivariate analysis. In this paper, data points are heterogeneous sets of biosequences (composite data points). A composite data point is a set of ordinary data points (e.g., set of feature vectors). We theoretically extend the derivation of the largest generalized eigenvalue-based distance metric Dij1) in any linear and non-linear feature spaces. We prove that Dij1) is a metric under any linear and non-linear feature transformation function. We show the sufficiency and efficiency of using the decision rule $\bar{{\delta}}_{{\Xi}i}$(i.e., mean of Dij1)) in classification of heterogeneous sets of biosequences compared with the decision rules min𝚵iand median𝚵i. We analyze the impact of linear and non-linear transformation functions on classifying/clustering collections of heterogeneous sets of biosequences. The impact of the length of a sequence in a heterogeneous sequence-set generated by simulation on the classification and clustering results in linear and non-linear feature spaces is empirically shown in this paper. We propose a new concept: the limiting dispersion map of the existing clusters in heterogeneous sets of biosequences embedded in linear and nonlinear feature spaces, which is based on the limiting distribution of nucleotide compositions estimated from real data sets. Finally, the empirical conclusions and the scientific evidences are deduced from the experiments to support the theoretical side stated in this paper.

시간에 따라 변화하는 로그-정규분포와 파레토 합성 분포의 모형 추정 (Time-varying modeling of the composite LN-GPD)

  • 박소진;백창룡
    • 응용통계연구
    • /
    • 제31권1호
    • /
    • pp.109-122
    • /
    • 2018
  • 임계값을 기준으로 그 보다 작은 값은 로그정규분포(lognormal distribution; LN)를, 큰 값은 일반화파레토분포(generalized Pareto distribution; GPD)를 따르는 합성 분포를 LN-GPD 합성분포라 한다. Scollnik (2007)은 LN-GPD 합성분포가 로그정규분포와 GPD를 합성 시킴으로써 자료의 손실 없이 꼬리가 두꺼운 분포에서 좋은 적합력을 가진다고 밝혔다. 본 논문에서는 시간에 따라 변하는 LN-GPD 평균모형을 다루었으며 방법론으로는 국소 다항최대우도법을 기반으로 추정하는 방법에 대해서 연구하였다. 시간에 따라 변하는 분포를 추정함으로써 자료에 대한 훨씬 자세한 이해가 가능하며 이는 곧 상담원 배치나 자원배분과 같은 운영관리에 큰 도움을 줄 수 있다. 본 연구는 GPD 분포만을 고려한 Beirlant와 Goegebeur (2004)를 확장하여 절삭한 로그정규분포를 추가하여 자료의 손실 없이 자료의 특징을 살펴볼 수 있다는데도 의의가 있다. 모의실험을 통해 제안한 방법론의 적절함을 살펴 보았고 실증 자료 분석으로 이스라엘 은행의 콜센터 서비스 시간에 대해 분석하여 상담원 배치와 관련된 흥미로운 결과를 찾을 수 있었다.

Iterative LBG Clustering for SIMO Channel Identification

  • Daneshgaran, Fred;Laddomada, Massimiliano
    • Journal of Communications and Networks
    • /
    • 제5권2호
    • /
    • pp.157-166
    • /
    • 2003
  • This paper deals with the problem of channel identification for Single Input Multiple Output (SIMO) slow fading channels using clustering algorithms. Due to the intrinsic memory of the discrete-time model of the channel, over short observation periods, the received data vectors of the SIMO model are spread in clusters because of the AWGN noise. Each cluster is practically centered around the ideal channel output labels without noise and the noisy received vectors are distributed according to a multivariate Gaussian distribution. Starting from the Markov SIMO channel model, simultaneous maximum ikelihood estimation of the input vector and the channel coefficients reduce to one of obtaining the values of this pair that minimizes the sum of the Euclidean norms between the received and the estimated output vectors. Viterbi algorithm can be used for this purpose provided the trellis diagram of the Markov model can be labeled with the noiseless channel outputs. The problem of identification of the ideal channel outputs, which is the focus of this paper, is then equivalent to designing a Vector Quantizer (VQ) from a training set corresponding to the observed noisy channel outputs. The Linde-Buzo-Gray (LBG)-type clustering algorithms [1] could be used to obtain the noiseless channel output labels from the noisy received vectors. One problem with the use of such algorithms for blind time-varying channel identification is the codebook initialization. This paper looks at two critical issues with regards to the use of VQ for channel identification. The first has to deal with the applicability of this technique in general; we present theoretical results for the conditions under which the technique may be applicable. The second aims at overcoming the codebook initialization problem by proposing a novel approach which attempts to make the first phase of the channel estimation faster than the classical codebook initialization methods. Sample simulation results are provided confirming the effectiveness of the proposed initialization technique.

독립성분분석을 이용한 혼합물의 미지성분비율 예측 (Predicting Unknown Composition of a Mixture Using Independent Component Analysis)

  • 이혜선;송재기;박해상;전치혁
    • 응용통계연구
    • /
    • 제19권1호
    • /
    • pp.135-148
    • /
    • 2006
  • 독립성분분석은 차원이 높은 다변량데이타로부터 기저구조를 형성하는 독립성분을 분리하는데 사용되는 기법으로서 패턴인식, 예측 등 2차적 분석을 위한 1차 분석단계에서 사용할 수 있다. 본 연구에서는 독립성분분석을 이용하여 여러 혼합물 데이터로부터 독립성분을 분리한 다음 각 구성성분의 혼합비율을 예측하는 절차를 제안한다. 적용예로서 도금강판의 엑스선 회절강도값으로부터 여러가지 상을 분리한 다음 비음최소자승법을 이용하여 각 상의 분율을 예측하였으며, 이러한 제안방안의 타당성 평가를 위하여 모의 실험을 실시하였다.

물성치의 공간분포를 고려한 빙 시험편의 확률론적 강도평가 (Probabilistic Strength Assessment of Ice Specimen considering Spatial Variation of Material Properties)

  • 김호준;김유일
    • 대한조선학회논문집
    • /
    • 제57권2호
    • /
    • pp.80-87
    • /
    • 2020
  • As the Arctic sea ice decreases due to various reasons such as global warming, the demand for ships and offshore structures operating in the Arctic region is steadily increasing. In the case of sea ice, the anisotropy is caused by the uncertainty inside the material. For most of the research, nevertheless, estimating the ice load has been treated deterministically. With regard to this, in this paper, a four-point bending strength analysis of an ice specimen was attempted using a stochastic finite element method. First, spatial distribution of the material properties used in the yield criterion was assumed to be a multivariate Gaussian random field. After that, a direct method, which is a sort of stochastic finite element method, and a sensitivity method using the sensitivity of response for random variables were proposed for calculating the probabilistic distribution of ice specimen strength. A parametric study was conducted with different mean vectors and correlation lengths for each material property used in the above procedure. The calculation time was about ten seconds for the direct method and about three minutes for the sensitivity methods. As the cohesion and correlation length increased, the mean value of the critical load and the standard deviation increased. On the contrary, they decreased as the friction angle increased. Also, in all cases, the direct and sensitivity methods yielded very similar results.