• 제목/요약/키워드: Multivariate simulation

검색결과 175건 처리시간 0.029초

단일 클래스 분류와 특징 선택에 기반한 향상된 이상 감지 (Improved Fault Detection Based on One-Class Classification and Feature Selection)

  • 조현우
    • 한국산학기술학회논문지
    • /
    • 제20권8호
    • /
    • pp.216-223
    • /
    • 2019
  • 생산 공정에서 발생되는 공정 이상을 적시에 감지하는 것은 생산 공정의 안전하고 일관된 조업 및 운영에 필수적인 요소 중 하나로서 반드시 필요하다. 예측되지 못하거나 적절하게 감지되지 못한 공정 이상은 전체 생산 공정과 공정에서 생산되는 최종 제품의 품질에 심각한 영향을 줄 수 있기 때문이다. 또한 이러한 상황은 공정 기능 불량과 고장으로 이어지게 된다. 이러한 공정 이상을 신뢰성 있게 적시에 검출하기 위해 본 연구에서는 새로운 단일 클래스 분류에 기반한 공정 이상 감지 기법을 제안한다. 본 연구의 제안된 방법은 잡음 필터링, 특징 선택, 비선형 표현 및 특이치 검출의 네단계로 구성된다. 본 연구에서는 시뮬레이션 공정의 측정치를 활용하여 제안된 방법의 성능을 평가하였다. 그 결과 제안된 공정 이상 탐지 기법이 신뢰할 수 있는 모니터링 결과를 산출하였으며 기존 비교 대상 방법들보다 평균 25.4% 향상된 성능을 보여 주었다. 또한 적합한 특징 선택을 통하여 보다 향상된 이상 감지 성능을 얻을 수 있었다.

표본조사에서 크론바흐알파값을 사용한 신뢰성 (Reliability using Cronbach alpha in sample survey)

  • 박현아
    • 응용통계연구
    • /
    • 제34권1호
    • /
    • pp.1-8
    • /
    • 2021
  • 사회조사에서 추상적 개념은 타당성과 신뢰성이 보장된 측정도구를 사용하여야 한다. 그와 같은 측정도구에 의해 도출된 관측점수는 타당한 관측점수와 편향된 관측점수와 오차로 나눌 수 있으며 편향된 값의 유무가 타당성과 연관되어 있으며 오차값의 유무가 신뢰성과 연관되어 있다. 측정도구가 타당도 및 신뢰도를 만족하는 지를 보기 위한 기법들이 많이 존재한다. 예를 들면 요인분석을 통한 구성타당도, 크론바흐 알파 값에 의한 내적일치도 등을 들 수 있다. 본 연구에서 크론바흐알파값의 계산은 표본을 통해서 도출되는 데 복잡한 표본설계와 무응답이 발생했을 때 크론바흐알파값의 추정법에 대해 살펴본다. 제안된 기법에 대한 모의실험으로 다변량정규분포를 사용하여 기존의 여러 다른 크론바흐알파값의 추정기법과 비교분석한다.

무시할 수 없는 무응답에서 편향 보정을 이용한 무응답 대체 (Bias corrected imputation method for non-ignorable non-response)

  • 이민하;신기일
    • 응용통계연구
    • /
    • 제35권4호
    • /
    • pp.485-499
    • /
    • 2022
  • 표본오차와 비표본오차를 포함하는 총오차(total survey error)를 관리하는 것은 표본설계에서 매우 중요하다. 무응답으로 인해 발생한 비표본오차는 총오차에서 차지하는 비중이 매우 크며 이를 해결하는 방법인 무응답 대체에 관한 다수의 연구가 수행되었다. 최근 전통적 통계학 관련 기법에 추가하여 기계학습 관련 기법을 이용한 무응답 대체법이 다수 연구되고 실질적으로 사용되고 있다. 기존에 발표된 다수의 방법은 MCAR(missing completely at random) 또는 MAR(missing at random) 가정을 사용하고 있다. 그러나 관심변수에 영향을 받는 MNAR(missing not at random) 또는 무시할 수 없는 무응답(non-ignorable non-response; NN)은 편향을 발생시켜 대체 결과의 정확성을 크게 떨어뜨리지만 이에 관한 연구는 상대적으로 미미하다. 본 연구에서는 무시할 수 없는 무응답이 발생한 경우에 적용 가능한 무응답 대체법을 제안하였다. 특히 편향을 추정한 후 이를 제거하는 방법을 이용하여 무응답 대체 결과의 정확성을 향상하는 방법을 제안하였다. 또한, 모의실험을 이용하여 제안된 방법의 타당성을 확인하였다.

선박 추진용 2행정 저속엔진의 고장모드 데이터 개발 및 LSTM 알고리즘을 활용한 특성인자 신뢰성 검증연구 (The Study of Failure Mode Data Development and Feature Parameter's Reliability Verification Using LSTM Algorithm for 2-Stroke Low Speed Engine for Ship's Propulsion)

  • 박재철;권혁찬;김철환;장화섭
    • 대한조선학회논문집
    • /
    • 제60권2호
    • /
    • pp.95-109
    • /
    • 2023
  • In the 4th industrial revolution, changes in the technological paradigm have had a direct impact on the maintenance system of ships. The 2-stroke low speed engine system integrates with the core equipment required for propulsive power. The Condition Based Management (CBM) is defined as a technology that predictive maintenance methods in existing calender-based or running time based maintenance systems by monitoring the condition of machinery and diagnosis/prognosis failures. In this study, we have established a framework for CBM technology development on our own, and are engaged in engineering-based failure analysis, data development and management, data feature analysis and pre-processing, and verified the reliability of failure mode DB using LSTM algorithms. We developed various simulated failure mode scenarios for 2-stroke low speed engine and researched to produce data on onshore basis test_beds. The analysis and pre-processing of normal and abnormal status data acquired through failure mode simulation experiment used various Exploratory Data Analysis (EDA) techniques to feature extract not only data on the performance and efficiency of 2-stroke low speed engine but also key feature data using multivariate statistical analysis. In addition, by developing an LSTM classification algorithm, we tried to verify the reliability of various failure mode data with time-series characteristics.

초모집단 모형의 오차가 이분산일 때 무시할 수 없는 무응답에서 편향수정 무응답 대체 (Bias-corrected imputation method for non-ignorable nonresponse with heteroscedasticity in super-population model)

  • 이유진;신기일
    • 응용통계연구
    • /
    • 제37권3호
    • /
    • pp.283-295
    • /
    • 2024
  • 무응답을 적절히 처리하기 위한 많은 방법이 연구되었다. 최근 다수의 무응답 대체법이 개발되고 실질적으로 사용되고 있다. 기존에 발표된 다수의 방법은 MCAR (missing completely at random) 또는 MAR (missing at random) 가정을 사용하고 있다. 그러나 관심변수에 영향을 받는 MNAR (missing not at random) 또는 무시할 수 없는 무응답(non-ignorable non-response; NN)은 편향을 발생시켜 대체 결과의 정확성을 크게 떨어뜨리지만 이에 관한 연구는 상대적으로 미미하다. Lee와 Shin (2022)은 등분산 가정하에서 무시할 수 없는 무응답을 적절히 처리할 수 있는 편향수정 무응답 대체법을 제안하였다. 본 연구에서는 Lee와 Shin (2022)이 제안한 방법을 확장한 무응답 대체법으로 초모집단 모형의 오차가 이분산인 경우에서 편향을 제거함으로써 추정의 정확성을 향상하는 방법을 제안하였다. 모의실험을 이용하여 제안된 방법의 타당성을 확인하였다.

경제활동인구조사 자료를 위한 다중대체 방식 연구 (A study on multiple imputation modeling for Korean EAPS)

  • 박민정;배윤종;김정연
    • 응용통계연구
    • /
    • 제34권5호
    • /
    • pp.685-696
    • /
    • 2021
  • 경제활동인구조사는 고용 관련 통계를 생성하는 국가조사로서, 국민의 경활상태(취업/실업/비경활)를 파악하는 것이 주요 목적이다. 정확한 통계를 내기 위해 무응답률을 낮추는 것이 중요하고, 이미 발생한 무응답을 보완하기 위한 방법으로 무응답 대체가 가능하다. 경제활동인구조사는 응답 방식이 순차적 흐름을 따라가기 때문에 구조적인 무응답이 존재한다. 또한 전체 가구원내 무응답 항목이 하나라도 있으면 해당 가족 구성원 전체를 무응답 처리하기에 최종 자료에는 항목 무응답이 아닌 단위 무응답만 존재한다는 특징이 있다. 본 연구에서는 구조적 무응답 이해 및 연계자료를 통한 과거 자료의 활용 등을 통해 기존의 방법보다 효과적인 무응답 대체 모형을 제시하고자 한다. 대체 모형의 성능을 일치도/비일치도를 기반으로 평가한다. 이를 위해, 2019년 11월 경제활동인구조사 자료를 기반으로 모의실험을 실시한다. 총 59,996명의 응답자 중 일부를 랜덤하게 선택한 뒤, 경활상태를 판정하는데 결정적인 설명변수 6개와 경활상태를 무응답 처리한다. 기존 무응답 대체 모형에서 사용하였던 설명 변수 이외에 산업변수와 종사상지위 변수를 추가함으로써 모형을 개선한다. 이는 과거자료의 연계 및 활용을 가정한 것으로, 기존의 모형모다 성능이 향상되는 것을 확인한다. 또한, 경활상태별 무응답자 수에 대한 다양한 시나리오를 고려한다.

Water Quality Assessment and Turbidity Prediction Using Multivariate Statistical Techniques: A Case Study of the Cheurfa Dam in Northwestern Algeria

  • ADDOUCHE, Amina;RIGHI, Ali;HAMRI, Mehdi Mohamed;BENGHAREZ, Zohra;ZIZI, Zahia
    • 공업화학
    • /
    • 제33권6호
    • /
    • pp.563-573
    • /
    • 2022
  • This work aimed to develop a new equation for turbidity (Turb) simulation and prediction using statistical methods based on principal component analysis (PCA) and multiple linear regression (MLR). For this purpose, water samples were collected monthly over a five year period from Cheurfa dam, an important reservoir in Northwestern Algeria, and analyzed for 12 parameters, including temperature (T°), pH, electrical conductivity (EC), turbidity (Turb), dissolved oxygen (DO), ammonium (NH4+), nitrate (NO3-), nitrite (NO2-), phosphate (PO43-), total suspended solids (TSS), biochemical oxygen demand (BOD5) and chemical oxygen demand (COD). The results revealed a strong mineralization of the water and low dissolved oxygen (DO) content during the summer period. High levels of TSS and Turb were recorded during rainy periods. In addition, water was charged with phosphate (PO43-) in the whole period of study. The PCA results revealed ten factors, three of which were significant (eigenvalues >1) and explained 75.5% of the total variance. The F1 and F2 factors explained 36.5% and 26.7% of the total variance, respectively and indicated anthropogenic pollution of domestic agricultural and industrial origin. The MLR turbidity simulation model exhibited a high coefficient of determination (R2 = 92.20%), indicating that 92.20% of the data variability can be explained by the model. TSS, DO, EC, NO3-, NO2-, and COD were the most significant contributing parameters (p values << 0.05) in turbidity prediction. The present study can help with decision-making on the management and monitoring of the water quality of the dam, which is the primary source of drinking water in this region.

초음파측정 활용 고급육형 한우개량을 위한 선발반응 Monte Carlo 모의실험 (Monte Carlo Simulations of Selection Responses for Improving High Meat Qualities Using Real Time Ultrasound in Korean Cattle)

  • 이득환
    • Journal of Animal Science and Technology
    • /
    • 제45권3호
    • /
    • pp.343-354
    • /
    • 2003
  • 고급육형 한우개량을 위하여 현행 실시하고 있는 한우 후대검정에서 조사되는 배장근단면적, 등지방두께 및 근내지방도 등에 대한 유전적 개량량과 초음파 측정장치를 이용한 해당 형질들의 육질판정자료에 의한 간접선발시 유전적 개량량을 모의실험을 통하여 추정하고 상호 그 효율성을 비교하였다. 본 연구에 적용된 Monte Carlo 모의실험은 각 설정 모형별, 표현형 선발 및 다형질 BLUP 추정방법에 의한 육종가 추정치에 의한 선발을 적용하여 각각 10반복씩 반복 실험하였다. 각 모형별 모의실험방법은 종축집단의 크기 및 세대 수 그리고 설정모형을 동일하게 설계하였으며 수컷 100두와 암컷 2,000두의 기초집단으로부터 매 세대 수컷 20두와 암컷 1,000두를 3가지 형질에 동일한 가중치를 두어 10세대 동안 선발하였다. 최종 생성된 자료를 이용하여 유전적 개량량을 추정하였고 이를 각 모형별, 선발방법별로 비교, 분석하였다. 분석결과 현행 실시하고 있는 한우 후대검정과 유사한 모의실험에서의 각 형질별 육종가 추정치에 의한 선발시 유전적 개량량과 비교한 결과, 초음파 측정치와 도축 실측치 간의 유전상관을 0.81-0.97으로 가정하고 암, 수 모두 초음파 측정자료를 조사한다는 가정으로 초음파 측정치의 육종가에 의한 선발을 실시할 때, 1.66${\sim}$2.44 배의 개량 효율성이 있는 것으로 추정되었으며 이들 상관을 0.63${\sim}$0.68으로 가정한 모의실험에서는 1.18${\sim}$2.08 배의 개량 효율성이 있는 것으로 추정되었다. 따라서 고급육형 한우개량을 위한 초음파 측정치를 이용한 검정방법을 활용하고 이를 이용한 종축선발을 실시할 때 개량효율을 크게 향상시킬 수 있을 것으로 사료되었다. 반면에 각 형질별 개량효율성을 살펴보면 개량효율성이 가장 낮은 형질은 근내지방도로써 이는 표현형 변이가 상대적으로 낮은 형질에 선발의 가중치를 동일하게 가정한 것에 기인된 것으로 사료되며 따라서 근내지방도의 변이를 크게 할 수 있는 자료조사방법의 변경, 또는 선발의 가중치를 높이는 방법에 대한 연구가 필요할 것으로 사료되었다.

하수처리장의 고도처리 upgrading 설계와 공정 최적화를 위한 다변량 통계분석 (Design of a Wastewater Treatment Plant Upgrading to Advanced Nutrient Removal Treatment Using Modeling Methodology and Multivariate Statistical Analysis for Process Optimization)

  • 김민정;김민한;김용수;유창규
    • Korean Chemical Engineering Research
    • /
    • 제48권5호
    • /
    • pp.589-597
    • /
    • 2010
  • 하수처리 시스템에서의 생물학적 영양염류 기준이 강화됨에 따라, 표준활성슬러지공법으로 운전 중인 하수처리장의 고도처리 공법으로의 개보수 필요성이 증가하고 있다. 그러나 실제 하수처리 시스템에서의 다양한 유입조건 및 운전조건의 복잡한 반응 구성으로 인해 실험을 통하여 개보수된 고도처리공법의 최적조건을 찾는 것은 쉽지 않은 일이며, 이는 많은 시간과 비용을 소모하여 비효율적이다. 따라서 본 연구에서는 활성슬러지공정모델(ASMs)을 기반으로 한 하수처리장의 모델링 및 시뮬레이션 기법을 통하여 하수처리장의 고도처리공법으로의 upgrading 설계를 수행하며, 이를 통계적이며 체계적으로 접근하기 위해 반응표면분석법(Response surface method)을 통한 고도처리공법의 설계 최적화를 수행하였다. 또한 실규모 하수처리장에서의 운전 최적화를 위해서는 하수처리의 동력학적 매개변수에 대한 정확한 분석이 수행되어야 한다. 본 연구에서는 다변량 통계분석 기법인 부분최소승자법(PLS)을 통하여 하수처리 시스템의 동력학적 매개변수 간의 상관관계를 파악하며, 고도처리공법 하수처리장의 운전 결과에 가장 큰 영향을 미치는 매개변수를 도출하였다. 본 연구를 통해 하수처리장의 고도처리공법 upgrading 설계 및 운전 최적화를 위한 방법론을 제시하였으며, 이를 통하여 설계시간 및 경비 절감 등 고도처리공법으로의 고효율적인 개보수가 가능할 것으로 예상된다.

지리정보시스템을 이용한 새만금 해양환경정보시스템 구축 (Implementation of Saemangeum Coastal Environmental Information System Using GIS)

  • 김진아;김창식;박진아
    • 한국지리정보학회지
    • /
    • 제14권4호
    • /
    • pp.128-136
    • /
    • 2011
  • 새만금 방조제 건설 및 토지 개발사업에 따른 해양환경변화 모니터링 및 예측을 위하여 2002년부터 실시간 또는 정기 해양관측 및 수치모델 시뮬레이션을 수행하고 있다. 새만금 해양환경자료는 크게 해양기상, 해양물리/해수유동, 해양수질, 해양생태계, 해저 지형/지질 분야로 분류되며, 각 분야별 관측 및 예측을 통해 지속적으로 생산되는 자료는 10여년에 걸쳐 축적되고 있다. 수집된 해양환경자료는 대용량의 다차원 다변수 시 공간적 분포 특성을 갖는 이질적 자료이기 때문에 이러한 특성을 고려하여 효과적으로 자료의 수집 처리 관리 제공이 가능한 정보시스템 개발은 필수적이다. 이에 본 논문에서는 지리정보시스템과 연계된 웹 기반 새만금 해양환경정보시스템 구축을 통하여 분야별로 축적된 새만금 해양환경정보를 통합적으로 수집 관리하며, 직관적이고 효율적인 웹 사용자 인터페이스 구성과 statistical graphs 및 thematic cartography를 적용한 자료의 과학적 가시화를 통해 방대하고 복잡한 자료의 효과적인 조회 및 분석이 가능하다. 나아가 지오프로세싱을 통한 공간분석을 통해 장기간에 걸친 변화 양상에 대한 정량적 분석을 통하여 새만금의 친환경적 개발을 위한 과학적 근거 제시 및 의사결정 지원을 위한 도구로 활용되고 있다. 또한 원활한 웹 기반 정보 서비스를 위해 다중 맵 캐쉬, 다중 레이어, 공간 데이터베이스 구축 등도 병행되었다.