• Title/Summary/Keyword: statistical analysis method

검색결과 4,999건 처리시간 0.039초

Training for Huge Data set with On Line Pruning Regression by LS-SVM

  • Kim, Dae-Hak;Shim, Joo-Yong;Oh, Kwang-Sik
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2003년도 추계 학술발표회 논문집
    • /
    • pp.137-141
    • /
    • 2003
  • LS-SVM(least squares support vector machine) is a widely applicable and useful machine learning technique for classification and regression analysis. LS-SVM can be a good substitute for statistical method but computational difficulties are still remained to operate the inversion of matrix of huge data set. In modern information society, we can easily get huge data sets by on line or batch mode. For these kind of huge data sets, we suggest an on line pruning regression method by LS-SVM. With relatively small number of pruned support vectors, we can have almost same performance as regression with full data set.

  • PDF

경락경혈학회지에 게재된 논문의 통계적 오류에 관한 고찰(2007~2011년) (Analysis of the Statistical Errors in Articles of The Korean Journal of Meridian and Acupuncture)

  • 이민희;강경원;김정은;최선미;이상훈
    • Korean Journal of Acupuncture
    • /
    • 제29권4호
    • /
    • pp.573-580
    • /
    • 2012
  • Objectives : This study was to investigate statistical validities and trends of previously reported papers that used various statistical techniques such as t-test and analysis of variance. Methods : To analyze the statistical procedures, 54 original articles using those statistical methods were selected from The Korean Journal of Acupuncture published from 2007 to 2011. Results : T-test and analysis of variance were used in 23(25.27%), and 18 papers(19.78%) out of 54 papers, respectively. Seven articles(12.96%) did not report alpha values and 26(48.15%) out of 54 studies were not tested for normal distribution. One paper(1.85%) misused t-test and 7 papers(38.89%) did not carry out the multiple comparison. Conclusions : To improve the quality of KJA, statistician involvement in research design would be necessary to reduce errors in statistical methods and interpretation of the results.

인구추계 데이터의 이상점과 통계적 분석

  • 김종태;서효민
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2009년도 춘계학술대회 미래 IT융합기술 및 전략
    • /
    • pp.153-159
    • /
    • 2009
  • The purpose of this paper is to suggest the problems of basic population data(1960-2005) and the data(2006-2050) of population projections reported by Korean National Statistical Office in November 2006. The errors on the basic population data can be easily checked by using the graphical analysis and the method of linear regression analysis. It is necessary to revise the population projections reported by Korean National Statistical Office.

  • PDF

A Technique and software of analysis and control for measurement process

  • Zhao, Fengyu;Xu, Jichao;Bergman, Bo
    • International Journal of Quality Innovation
    • /
    • 제1권1호
    • /
    • pp.97-105
    • /
    • 2000
  • In this paper, a two-section method for measuring is introduced and the variation sources of measurement process are analysed. Measuring is a special process in general process. Various variation source must be firstly decomposed so that the statistical distribution law of measuring process can be established, and then implement monitoring control of the measuring process. A special method to obtain the measuring variation is discussed, and a monitoring control technique for measuring process is studied based statistical distribution. Towards the end, we briefly introduce software design for the analysis and control of a measurement process.

  • PDF

통계기법을 이용한 무한궤도형 군용 장갑차량의 신뢰성, 가용성 및 정비성 분석 사례 연구 (A case study on RAM analysis for a military full-tracked armored vehicle using a statistical method)

  • 김상원
    • 경영과학
    • /
    • 제11권1호
    • /
    • pp.117-128
    • /
    • 1994
  • This paper describes a case study on the analysis of RAM(Reliability, Availability, and Maintainability) factors obtained from the Endurance-Test for a military full-tracked armored vehicle. In analysing RAM factors of the vehicle we used such a statistical technique as method of Maximum-Likelihood for estimating parameters.

  • PDF

표준 핵연료집합체 또는 최적 핵연료집합체가 장전된 원자력 1호기 원자로심의 열적여유도 분석 (Thermal Margin Analysis of the Korea Nuclear Unit 1 Reactor Core Consisting of Standard or Optimized Fuel Assemblies)

  • Hyun Koon Kim;Ki In Han
    • Nuclear Engineering and Technology
    • /
    • 제16권3호
    • /
    • pp.155-160
    • /
    • 1984
  • 표준 핵연료집합체나 최적 핵연료집합체로 구성된 원자력 1호기 원자로심의 열적여유도를 기존 열설계 방법과 통계적 열설계 방법을 이용하여 분석하였다. 통계적 열설계 방법은 노심내 운전변수들의 불확실도를 통계적으로 처리함으로써 기존 방법에 비하여 열적여유도를 증가시킨다. 계산을 위하여 정상상태와 과도시 열수력분석 전산코드인 COBRA-IV-i를 사용하였다. 계산결과 통계적 설계방법은 열적여유도를 크게 증가시키며, 표준 핵 연료집 합체는 물론 최적 핵 연료집 합체가 장전된 원자력 1호기의 열설계기준을 만족시키는 것으로 밝혀졌다. 그러나 기존 열설계 방법은 원자력 1호기 노심에 최적 핵연료집합체가 장전된 경우 열설계기준을 만족시키지 못하는 것으로 밝혀졌다.

  • PDF

Statistical Method for Implementing the Experimenter Effect in the Analysis of Gene Expression Data

  • Kim, In-Young;Rha, Sun-Young;Kim, Byung-Soo
    • Communications for Statistical Applications and Methods
    • /
    • 제13권3호
    • /
    • pp.701-718
    • /
    • 2006
  • In cancer microarray experiments, the experimenter or patient which is nested in each experimenter often shows quite heterogeneous error variability, which should be estimated for identifying a source of variation. Our study describes a Bayesian method which utilizes clinical information for identifying a set of DE genes for the class of subtypes as well as assesses and examines the experimenter effect and patient effect which is nested in each experimenter as a source of variation. We propose a Bayesian multilevel mixed effect model based on analysis of covariance (ANACOVA). The Bayesian multilevel mixed effect model is a combination of the multilevel mixed effect model and the Bayesian hierarchical model, which provides a flexible way of defining a suitable correlation structure among genes.

공기괴 역궤적 모델의 통계 분석을 통한 이산화탄소 배출 지역 추정 (Statistical Back Trajectory Analysis for Estimation of CO2 Emission Source Regions)

  • 이선란;박선영;박미경;조춘옥;김재연;김지윤;김경렬
    • 대기
    • /
    • 제24권2호
    • /
    • pp.245-251
    • /
    • 2014
  • Statistical trajectory analysis has been widely used to identify potential source regions for chemically and radiatively important chemical species in the atmosphere. The most widely used method is a statistical source-receptor model developed by Stohl (1996), of which the underlying principle is that elevated concentrations at an observation site are proportionally related to both the average concentrations on a specific grid cell where the observed air mass has been passing over and the residence time staying over that grid cell. Thus, the method can compute a residence-time-weighted mean concentration for each grid cell by superimposing the back trajectory domain on the grid matrix. The concentration on a grid cell could be used as a proxy for potential source strength of corresponding species. This technical note describes the statistical trajectory approach and introduces its application to estimate potential source regions of $CO_2$ enhancements observed at Korean Global Atmosphere Watch Observatory in Anmyeon-do. Back trajectories are calculated using HYSPLIT 4 model based on wind fields provided by NCEP GDAS. The identified $CO_2$ potential source regions responsible for the pollution events observed at Anmyeon-do in 2010 were mainly Beijing area and the Northern China where Haerbin, Shenyang and Changchun mega cities are located. This is consistent with bottom-up emission information. In spite of inherent uncertainties of this method in estimating sharp spatial gradients within the vicinity of the emission hot spots, this study suggests that the statistical trajectory analysis can be a useful tool for identifying anthropogenic potential source regions for major GHGs.

통계분석 기법과 머신러닝 기법의 비교분석을 통한 건물의 지진취약도 공간분석 (A Spatial Analysis of Seismic Vulnerability of Buildings Using Statistical and Machine Learning Techniques Comparative Analysis)

  • 김성훈;김상빈;김대현
    • 산업융합연구
    • /
    • 제21권1호
    • /
    • pp.159-165
    • /
    • 2023
  • 최근 지진 발생 빈도가 증가하고 있는 반면 국내 지진 대응 체계는 취약한 현실에서, 본 연구의 목적은 통계분석 기법과 머신러닝 기법을 활용한 공간분석을 통해 건물의 지진취약도를 비교분석 하는 것이다. 통계분석 기법을 활용한 결과, 최적화척도법을 활용해 개발된 모델의 예측정확도는 약 87%로 도출되었다. 머신러닝 기법을 활용한 결과, 분석된 4가지 방법 중, Random Forest의 정확도가 Train Set의 경우 94%, Test Set의 경우 76.7%로 가장 높아, 최종적으로 Random Forest가 선정되었다. 따라서, 예측정확도는 통계분석 기법이 약 87%, 머신러닝 기법이 76.7%로, 통계분석 기법의 예측정확도가 더 높은 것으로 분석되었다. 최종 결과로, 건물의 지진취약도는 분석된 건물데이터 총 22,296개 중, 1,627(0.1%)개의 건물데이터는 통계분석 기법 사용 시 더 위험하다고 도출되었고, 10,146(49%)개의 건물데이터는 동일하게 도출되었으며, 나머지 10,523(50%)개의 건물데이터는 머신러닝 기법 사용 시 더 위험하게 도출되었다. 기존 통계분석 기법에 첨단 머신러닝 기법활용결과가 추가로 비교검토 됨으로써 공간분석 의사결정에 있어서, 좀더 신뢰도가 높은 지진대응책 마련에 도움이 되길 기대한다.

배관의 유동 유발 진동 및 음향 유발 진동 기인 광대역 방사 소음 예측을 위한 수치 해석 기법 개발 (Development of numerical method to predict broadband radiation noise resulting in fluid-induced vibration and acoustic-induced vibration of pipe)

  • 이상헌;정철웅;이송준
    • 한국음향학회지
    • /
    • 제43권1호
    • /
    • pp.112-121
    • /
    • 2024
  • 배관시스템은 유체를 장거리로 이송시키는 장비로서 많은 산업군에서 사용되고 있다. 고압의 배관에서는 빠른 유속으로 인하여 소음이 크게 발생하고 있으며, 이러한 소음을 저감 시키기 위한 많은 연구가 수행되고 있다. 이 논문에서는 고온·고압의 배관내 밸브 유동을 원인으로 발생하는 유동유발진동과 음향유발진동을 설계단계에서 예측하고 정량적으로 분석을 위한 배관 소음 해석 기법을 개발하였다. 이를 위하여 배관의 내부 유동 예측을 위한 고정밀 유동 해석기법을 개발하였으며, 파수-주파수 분석법을 이용하여 주파수 대역별 압축성/비압축성 압력의 기여도를 평가하였다. 그리고 유한요소 해석법(Finite Element Method, FEM)을 기반으로 한 저·중 주파수 대역의 진동소음 해석기법을 개발하였으며, 통계적 에너지 분석법(Statistical Energy Analysis, SEA)을 기반으로 한 중·고 주파수 대역에서의 방사소음해석 기법을 개발하였다.