• 제목/요약/키워드: parametric statistical modeling

검색결과 36건 처리시간 0.023초

2007 한국 소아청소년 성장곡선 및 정상혈압 분포 개발 방법론 (The methodology for developing the 2007 Korean growth charts and blood pressure nomogram in Korean children and adolescents)

  • 이순영;김윤남;강연지;장명진;김진흠;문진수;이종국;오경원;김영택;남정모
    • Clinical and Experimental Pediatrics
    • /
    • 제51권1호
    • /
    • pp.26-32
    • /
    • 2008
  • 목 적 : 1998년과 2005년 신체발육표준 제정사업 자료를 이용하여 2007년 소아청소년 성장곡선의 개발과정에서에 이용된 성장곡선 및 혈압분포 개발 방법론을 제시하고자 하였다. 방 법 : 성장곡선은 1998년과 2005년 자료를 이용해서 각 백분위수의 성장곡선 모형을 추정하고 LMS를 방법을 이용하여 최종 성장곡선을 생산하였다. 연령과 신장별 혈압 성장곡선은 2005년 자료를 이용하여 남녀별로 고정효과 회귀모형을 적용하여 산출하였다. 결 과 : 2007 소아청소년 성장곡선 및 혈압분포 표를 제시할 수 있었다. 결 론 : 2007년 성장곡선과 혈압분포 표는 현재 가용한 자료와 최신의 통계적 방법을 최대한 활용한 국내 최초의 결과로서 향후 지속적인 발전을 위한 논의와 연구가 필요하다.

개수형 자료에 대한 학습곡선효과의 모형화 (Modeling of The Learning-Curve Effects on Count Responses)

  • 최민지;박만식
    • 응용통계연구
    • /
    • 제27권3호
    • /
    • pp.445-459
    • /
    • 2014
  • 일반적으로 특정한 작업에 익숙해진다는 것은 그 작업에 투입되는 노력에 비해 산출되는 성과가 보다 뚜렷해진다는 것을 의미한다. 동일한 양이나 정도의 노력을 들여 특정한 작업을 반복적으로 수행하게 되면 초기 시점보다 원하는 성과를 기대 이상으로 얻게 된다는 것을 의미한다. 이를 학습곡선효과(learning-curve effects)'라고 한다. 본 연구에서는 특정한 작업을 반복시행한 결과가 개수형인 형태로 측정되는 변수에 대해 (역)S자 형태를 가지는 통계적 모형을 적용하고자 한다. 다양한 모의실험 하에서의 모형의 성능을 평가하고 특정질환으로 인한 사망자 자료에 적합하였다.

Prediction of ultimate load capacity of concrete-filled steel tube columns using multivariate adaptive regression splines (MARS)

  • Avci-Karatas, Cigdem
    • Steel and Composite Structures
    • /
    • 제33권4호
    • /
    • pp.583-594
    • /
    • 2019
  • In the areas highly exposed to earthquakes, concrete-filled steel tube columns (CFSTCs) are known to provide superior structural aspects such as (i) high strength for good seismic performance (ii) high ductility (iii) enhanced energy absorption (iv) confining pressure to concrete, (v) high section modulus, etc. Numerous studies were reported on behavior of CFSTCs under axial compression loadings. This paper presents an analytical model to predict ultimate load capacity of CFSTCs with circular sections under axial load by using multivariate adaptive regression splines (MARS). MARS is a nonlinear and non-parametric regression methodology. After careful study of literature, 150 comprehensive experimental data presented in the previous studies were examined to prepare a data set and the dependent variables such as geometrical and mechanical properties of circular CFST system have been identified. Basically, MARS model establishes a relation between predictors and dependent variables. Separate regression lines can be formed through the concept of divide and conquers strategy. About 70% of the consolidated data has been used for development of model and the rest of the data has been used for validation of the model. Proper care has been taken such that the input data consists of all ranges of variables. From the studies, it is noted that the predicted ultimate axial load capacity of CFSTCs is found to match with the corresponding experimental observations of literature.

${H_2}^{15}O$ PET을 이용한 뇌혈류 파라메트릭 영상 구성을 위한 알고리즘 비교 (Comparison of Algorithms for Generating Parametric Image of Cerebral Blood Flow Using ${H_2}^{15}O$ PET Positron Emission Tomography)

  • 이재성;이동수;박광석;정준기;이명철
    • 대한핵의학회지
    • /
    • 제37권5호
    • /
    • pp.288-300
    • /
    • 2003
  • 목적: ${H_2}^{15}O$ PET의 정량화를 위하여 1-조직 구획모델이 쓰이며, 뇌혈류와 조직/혈액 분배계수를 구하기 위하여 nonlinear least squares (NLS) 방법이 사용되나 계산 시간이 긴 등의 문제로 파라미터를 각화소마다 구해야 하는 파라메트릭 영상 구성에는 적합하지 않다. 이 연구에서는 이와 같은 NLS 문제점을 극복하여 파라메트릭 영상을 빠르게 구성하기 위하여 제안된 파라미터 추정 알고리즘들을 구현하고, 이 방법들의 통계적 신뢰도와 계산의 효율성을 비교하였다. 대상 및 방법: 이 연구에서 이용한 방법들은 linear least squares (LLS), linear weighted least squares (LWLS), linear generalized least squares (GLS), linear generalized weighted least squares (GWLS), weighted integration (WI), 그리고 model-based clustering method (CAKS)이다. 노이즈 정도에 따른 각 파라메트릭 영상법의 정확성 및 통계적 신뢰성을 알아보기 위하여 Zubal 뇌모형(brain phantom)으로부터 동적 PET 영상을 모사하고 포아송노이즈를 더한 후 각 파라메트릭 영상 구성 방법을 적용하였다. 또한 정상인 16명에 대하여 얻은 실제 자료에 대하여 이 방법들을 적용하고 결과를 비교하였다. 결과: 뇌혈류와 분배계수에 대한 평균 오차는 방법에 따라 크게 다르지 않았으며 모든 방법이 뇌혈류 및 분배계수 추정에 있어 무시할 만한 바이어스를 보였다. 파라메트릭 영상의 정성적 특성 또한 유사하였으나 CAKS 방법의 계산 속도가 월등하여 NLS 방법의 약 1/500, LLS 방법의 약 1/25의 계산시간을 보였다. 결론: 뇌혈류 파라메트릭 영상 구성을 위한 빠른 파라미터 추정 알고리즘들 중에 보다 개선되어 제안된 LWS, GLS, GLWS, CAKS 방법들이 단순하고 빠른 LLS, WI 방법들에 비하여 통계적 신뢰성을 크게 향상시키지는 못하나 CAKS 방법은 계산 시간을 유의하게 단축시키므로 가장 적합한 파라메트릭 영상 구성방법이라 할 수 있을 것이다.

항공기 날개의 통계적 중량 예측식 도출 연구 (A Study on Deriving the Statistical Weight Estimation Formula for an Aircraft Wing)

  • 김석범;정한규;황호연
    • 한국항공우주학회지
    • /
    • 제46권1호
    • /
    • pp.32-40
    • /
    • 2018
  • 본 논문에서는 개념설계 단계에서 주로 사용되는 통계적 중량 예측식 도출 방법에 관한 연구를 수행하였으며 Microsoft Excel을 이용해 이를 프로그램화하고 제트 여객기에 적용하여 검증하였다. 기존 중량 예측식들의 변수들을 참고하여 데이터베이스를 구축하였고 이를 사용하여 제트 여객기 날개 중량 예측식을 모델링하였다. 모델의 과적합 문제를 해결하기 위해 K-fold cross validation 방법을 사용하여 모델을 평가하였다.

Construction of bivariate asymmetric copulas

  • Mukherjee, Saikat;Lee, Youngsaeng;Kim, Jong-Min;Jang, Jun;Park, Jeong-Soo
    • Communications for Statistical Applications and Methods
    • /
    • 제25권2호
    • /
    • pp.217-234
    • /
    • 2018
  • Copulas are a tool for constructing multivariate distributions and formalizing the dependence structure between random variables. From copula literature review, there are a few asymmetric copulas available so far while data collected from the real world often exhibit asymmetric nature. This necessitates developing asymmetric copulas. In this study, we discuss a method to construct a new class of bivariate asymmetric copulas based on products of symmetric (sometimes asymmetric) copulas with powered arguments in order to determine if the proposed construction can offer an added value for modeling asymmetric bivariate data. With these newly constructed copulas, we investigate dependence properties and measure of association between random variables. In addition, the test of symmetry of data and the estimation of hyper-parameters by the maximum likelihood method are discussed. With two real example such as car rental data and economic indicators data, we perform the goodness-of-fit test of our proposed asymmetric copulas. For these data, some of the proposed models turned out to be successful whereas the existing copulas were mostly unsuccessful. The method of presented here can be useful in fields such as finance, climate and social science.

다중 자료 변환을 이용한 구성 자료의 지구통계학적 시뮬레이션 (Geostatistical Simulation of Compositional Data Using Multiple Data Transformations)

  • 박노욱
    • 한국지구과학회지
    • /
    • 제35권1호
    • /
    • pp.69-87
    • /
    • 2014
  • 이 논문에서는 구성 자료의 지구통계학적 시뮬레이션을 위해 다중 자료 변환 기반 조건부 시뮬레이션 틀을 제안하였다. 우선 일반적인 통계 기법의 적용이 가능하도록 구성 자료에 로그비 변환을 적용하였다. 다음 변환들로는 최소/최대 자기상관 인자 변환과 지시자 변환을 순차적으로 적용하였다. 독립적인 새로운 변수의 생성을 위해 최소/최대 자기상관 인자 변환을 적용하였으며, 적용 결과 개별 변수들의 독립적인 시뮬레이션이 가능해진다. 그리고 다중 가우시안 확률 모델을 따르지 않는 변수들의 비모수적 조건부 누적 확률 분포 모델링을 위해 지시자 변환을 적용하였다. 최종적으로는 적용한 변환 방법들의 역순으로 역 변환을 적용하였다. 간석지 표층 퇴적물 성분 자료를 대상으로 제안 시뮬레이션 기법의 적용 가능성을 예시하였다. 모든 시뮬레이션 결과들은 구성 자료의 제한 조건을 만족하면서 샘플 자료의 통계 특성을 잘 반영하였다. 구성 자료의 다수의 시뮬레이션 결과들을 이용한 표층 퇴적물 분류를 통해 기존 크리깅에서는 얻을 수 없는 분류 결과의 확률론적 평가가 가능하였다. 따라서 제안 시뮬레이션 틀은 다양한 구성 자료의 지구통계학적 시뮬레이션에 효과적으로 이용될 수 있을 것으로 기대된다.

High-precision modeling of uplift capacity of suction caissons using a hybrid computational method

  • Alavi, Amir Hossein;Gandomi, Amir Hossein;Mousavi, Mehdi;Mollahasani, Ali
    • Geomechanics and Engineering
    • /
    • 제2권4호
    • /
    • pp.253-280
    • /
    • 2010
  • A new prediction model is derived for the uplift capacity of suction caissons using a hybrid method coupling genetic programming (GP) and simulated annealing (SA), called GP/SA. The predictor variables included in the analysis are the aspect ratio of caisson, shear strength of clayey soil, load point of application, load inclination angle, soil permeability, and loading rate. The proposed model is developed based on well established and widely dispersed experimental results gathered from the literature. To verify the applicability of the proposed model, it is employed to estimate the uplift capacity of parts of the test results that are not included in the modeling process. Traditional GP and multiple regression analyses are performed to benchmark the derived model. The external validation of the GP/SA and GP models was further verified using several statistical criteria recommended by researchers. Contributions of the parameters affecting the uplift capacity are evaluated through a sensitivity analysis. A subsequent parametric analysis is carried out and the obtained trends are confirmed with some previous studies. Based on the results, the GP/SA-based solution is effectively capable of estimating the horizontal, vertical and inclined uplift capacity of suction caissons. Furthermore, the GP/SA model provides a better prediction performance than the GP, regression and different models found in the literature. The proposed simplified formulation can reliably be employed for the pre-design of suction caissons. It may be also used as a quick check on solutions developed by more time consuming and in-depth deterministic analyses.

Merlin 툴킷을 이용한 한국어 TTS 시스템의 심층 신경망 구조 성능 비교 (Performance comparison of various deep neural network architectures using Merlin toolkit for a Korean TTS system)

  • 홍준영;권철홍
    • 말소리와 음성과학
    • /
    • 제11권2호
    • /
    • pp.57-64
    • /
    • 2019
  • 본 논문에서는 음성 합성을 위한 오픈소스 시스템인 Merlin 툴킷을 이용하여 한국어 TTS 시스템을 구성한다. TTS 시스템에서 HMM 기반의 통계적 음성 합성 방식이 널리 사용되고 있는데, 이 방식에서 문맥 요인을 포함시키는 음향 모델링 구성의 한계로 합성 음성의 품질이 저하된다고 알려져 있다. 본 논문에서는 여러 분야에서 우수한 성능을 보여 주는 심층 신경망 기법을 적용하는 음향 모델링 아키텍처를 제안한다. 이 구조에는 전연결 심층 피드포워드 신경망, 순환 신경망, 게이트 순환 신경망, 단방향 장단기 기억 신경망, 양방향 장단기 기억 신경망 등이 포함되어 있다. 실험 결과, 문맥을 고려하는 시퀀스 모델을 아키텍처에 포함하는 것이 성능 개선에 유리하다는 것을 알 수 있고, 장단기 기억 신경망을 적용한 아키텍처가 가장 좋은 성능을 보여주었다. 그리고 음향 특징 파라미터에 델타와 델타-델타 성분을 포함하는 것이 성능 개선에 유리하다는 결과가 도출되었다.

한국어 text-to-speech(TTS) 시스템을 위한 엔드투엔드 합성 방식 연구 (An end-to-end synthesis method for Korean text-to-speech systems)

  • 최연주;정영문;김영관;서영주;김회린
    • 말소리와 음성과학
    • /
    • 제10권1호
    • /
    • pp.39-48
    • /
    • 2018
  • A typical statistical parametric speech synthesis (text-to-speech, TTS) system consists of separate modules, such as a text analysis module, an acoustic modeling module, and a speech synthesis module. This causes two problems: 1) expert knowledge of each module is required, and 2) errors generated in each module accumulate passing through each module. An end-to-end TTS system could avoid such problems by synthesizing voice signals directly from an input string. In this study, we implemented an end-to-end Korean TTS system using Google's Tacotron, which is an end-to-end TTS system based on a sequence-to-sequence model with attention mechanism. We used 4392 utterances spoken by a Korean female speaker, an amount that corresponds to 37% of the dataset Google used for training Tacotron. Our system obtained mean opinion score (MOS) 2.98 and degradation mean opinion score (DMOS) 3.25. We will discuss the factors which affected training of the system. Experiments demonstrate that the post-processing network needs to be designed considering output language and input characters and that according to the amount of training data, the maximum value of n for n-grams modeled by the encoder should be small enough.