• Title/Summary/Keyword: 데이터 불확실성 분석

Search Result 281, Processing Time 0.025 seconds

Multidimensional data generation of water distribution systems using adversarially trained autoencoder (적대적 학습 기반 오토인코더(ATAE)를 이용한 다차원 상수도관망 데이터 생성)

  • Kim, Sehyeong;Jun, Sanghoon;Jung, Donghwi
    • Journal of Korea Water Resources Association
    • /
    • v.56 no.7
    • /
    • pp.439-449
    • /
    • 2023
  • Recent advancements in data measuring technology have facilitated the installation of various sensors, such as pressure meters and flow meters, to effectively assess the real-time conditions of water distribution systems (WDSs). However, as cities expand extensively, the factors that impact the reliability of measurements have become increasingly diverse. In particular, demand data, one of the most significant hydraulic variable in WDS, is challenging to be measured directly and is prone to missing values, making the development of accurate data generation models more important. Therefore, this paper proposes an adversarially trained autoencoder (ATAE) model based on generative deep learning techniques to accurately estimate demand data in WDSs. The proposed model utilizes two neural networks: a generative network and a discriminative network. The generative network generates demand data using the information provided from the measured pressure data, while the discriminative network evaluates the generated demand outputs and provides feedback to the generator to learn the distinctive features of the data. To validate its performance, the ATAE model is applied to a real distribution system in Austin, Texas, USA. The study analyzes the impact of data uncertainty by calculating the accuracy of ATAE's prediction results for varying levels of uncertainty in the demand and the pressure time series data. Additionally, the model's performance is evaluated by comparing the results for different data collection periods (low, average, and high demand hours) to assess its ability to generate demand data based on water consumption levels.

Diagnosis by Rough Set and Information Theory in Reinforcing the Competencies of the Collegiate (러프집합과 정보이론을 이용한 대학생역량강화 진단)

  • Park, In-Kyoo
    • Journal of Digital Convergence
    • /
    • v.12 no.8
    • /
    • pp.257-264
    • /
    • 2014
  • This paper presents the core competencies diagnosis system which targeted our collegiate students in an attempt to induce the core competencies for reinforcing the learning and employment capabilities. Because these days data give rise to a high level of redundancy and dimensionality with time complexity, they are more likely to have spurious relationships, and even the weakest relationships will be highly significant by any statistical test. So as to address the measurement of uncertainties from the classification of categorical data and the implementation of its analytic system, an uncertainty measure of rough entropy and information entropy is defined so that similar behaviors analysis is carried out and the clustering ability is demonstrated in the comparison with the statistical approach. Because the acquired and necessary competencies of the collegiate is deduced by way of the results of the diagnosis, i.e. common core competencies and major core competencies, they facilitate not only the collegiate life and the employment capability reinforcement but also the revitalization of employment and the adjustment to college life.

Assessing the Impact of Bias Correction on Runoff simulation according to CMIP6 GCMs climate (CMIP6 GCMs 기후에 따른 유출 모의에 대한 편의보정 방법의 영향 평가)

  • Seung Taek Chae;Jin Hyuck Kim;Eun-Sung Chung
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2023.05a
    • /
    • pp.91-91
    • /
    • 2023
  • General circulation models(GCMs)은 여러 국가 기관들의 물리적 기후 모의 프로세스를 기반으로 과거 및 미래 기후변화의 영향을 정량화하기 위해 개발되었으며 현재 미래 기후변화를 예측하는데 가장 효과적인 도구이다. 그러나 GCMs에 내포된 여러 불확실성 요소 및 넓은 격자형식의 기후 데이터는 GCMs 기후 데이터를 사용한 지역적 기후 모의 시 주요 걸림돌로 인식되어지고 있다. 편의보정 방법은 GCMs을 사용한 지역적 기후 모의 시 기후 모의 성능을 향상시키기 위해 여러 연구에서 사용되어져 왔으나 다른 연구에서는 이러한 편의보정 방법의 문제점을 언급했다. 따라서 본 연구는 편의보정 방법이 GCMs 기후 모의 결과에 미치는 영향을 정량화하고 더 나아가 GCMs 기후 변수에 따른 유량 모의 결과에 미치는 영향을 분석했다. 연구대상지 과거 기간 기후 모의를 위해 coupled model intercomparison project(CMIP)6의 GCMs을 사용했으며, 미래 기후 모의를 위해 shared socioeconomic pathway(SSP) 시나리오를 사용했다. 편의보정 방법으로는 분위사상법을 사용했으며, 편의보정 전후 GCMs 기후 모의 성능평가를 위해 5개 평가 지표를 사용했다. 연구대상지 장기 유출 모의를 위해 storm water management model(SWMM)이 사용되었으며, 기후 입력 자료로는 일 단위 강수량, 최고 및 최저온도를 고려했다. 미래 기후 및 유량 모의 결과의 불확실성은 square root of error variance(SREV) 방법을 통해 정량화됐다. 결과적으로 과거 기간 GCMs 기후 및 유량 모의성능은 편의보정 전보다 편의보정 후에서 향상되었으며 특히, 강수 및 유량 모의 성능이 크게 향상되었다. 미래 기간의 경우 편의보정 후에서 기후 및 유량의 극값을 더 잘 반영함을 확인했다. 본 연구의 결과는 GCMs 기후 변수를 사용한 지역적 기후 및 유량 모의 시 편의보정 방법이 미치는 영향에 대한 구체적인 정보를 제공할 수 있다.

  • PDF

A Study on the Reliability Evaluation of the Cross-well Seismic Travel-time Tomography (시추공 탄성파 주시 토모그래피의 신뢰도 평가에 관한 연구)

  • Lee, Doo-Sung
    • Geophysics and Geophysical Exploration
    • /
    • v.13 no.4
    • /
    • pp.330-335
    • /
    • 2010
  • In order to estimate the confidence level of the velocity distribution shown in a velocity image reconstructed from a travel-time tomography, the ray coverage and the inversion characteristics of the system matrix were investigated. The targets of the analysis is the first arrival travel-time, the raypath information, and the resulting velocity model. The ray coverage, degree of ray and model coupling, was estimated by the number of rays and total ray length in a velocity grid, and information regarding the resolution and uncertainties involved in the reconstructed velocity model was derived from the results of the SVD analysis of the system matrix that relates the data space (first arrival travel times) to the model space (velocity distribution in tomogram).

Polynomial Type-2 TSK FLS Architecture;Design and Analysis (다항식 Type-2 TSK FLS 구조;설계 및 분석)

  • Kim, Gil-Seong;O, Seong-Gwon
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2008.04a
    • /
    • pp.329-332
    • /
    • 2008
  • Type-2 퍼지 집합은 언어적인 불확실성을 다루기 위하여 Zadeh에 의해 제안되었고 Mendel과 Kamik에 의해 이론이 체계화 되었다. TSK 퍼지 로직 시스템(TSK Fuzzy Logic Systems; TSK FLS)은 Mamdni 모델과 함께 가장 널리 사용되는 퍼지 로직 시스템이다. 본 논문에서는 Type-2 퍼지 집합을 이용하여 전반부 멤버쉽 함수를 구성하고 후반부 다항식 함수를 상수와 1차식, 2차식으로 확장한 다항식 Type-2 TSK FLS 설계한다. 또한 가스로 공정 데이터에 응용하여 후반부 다항식의 변화에 따른 Type-2 TSK FLS의 특징을 비교 분석 할 뿐 만 아니라 테스트 데이터에 노이즈를 첨가하여 노이즈에 따른 Type-l TSK FLS과 Type-2 TSK FLS의 특성을 분석한다.

  • PDF

A Purchase Pattern Analysis Using Bayesian Network and Neural Network (베이지안 네트워크와 신경망을 이용한 구매 패턴 분석)

  • Hwang Jeong-Sik;Pi Su-Young;Son Chang-Sik;Chung Hwan-Mook
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2005.04a
    • /
    • pp.323-326
    • /
    • 2005
  • 실세계에서 일어나는 문제는 매우 복잡하고 다양하기 때문에 예측하기가 어렵고 다양한 상황들이 발생한다. 특히, 소비자의 구매에 따르는 행동을 분석하고 소비자의 다양한 기호를 예측하기 위해서는 구매자의 심리적 요인과 내적 요인이 많은 영향을 미치게 된다. 이러한 요인들은 직접적인 정보 처리가 어렵기 때문에 정보의 불확실성을 취급하는 기술이 필요하다. 따라서 본 논문에서는 상품 구매에 따르는 소비자의 구매행동 패턴을 분석하기 위해 판매자의 노하우와 소비자의 구매의식을 조사하여 이 데이터를 바탕으로 베이지안 네트워크를 구성하고 구매패턴을 분류하는 방법을 제안하였다. 특히, 베이지안 네트워크를 이용하여 불필요한 속성을 가진 데이터를 제거한 후 코호넨의 SOM을 이용하여 소비자의 구매 패턴을 분류하도록 하였다.

  • PDF

Intervention analysis for spread of COVID-19 in South Korea using SIR model (SIR 모형을 이용한 한국의 코로나19 확산에 대한 개입 효과 분석)

  • Cho, Sumin;Kim, Jaejik
    • The Korean Journal of Applied Statistics
    • /
    • v.34 no.3
    • /
    • pp.477-489
    • /
    • 2021
  • COVID-19 has spread seriously around the world in 2020 and it is still significantly affecting our whole daily life. Currently, the whole world is still undergoing the pandemic and South Korea is no exception to it. During the pandemic, South Korea had several events that prevented or accelerated its spread. To establish the prevention policies for infectious diseases, it is very important to evaluate the intervention effect of such events. The susceptible-infected-removed (SIR) model is often used to describe the dynamic behavior of the spread of infectious diseases through ordinary differential equations. However, the SIR model is a deterministic model without considering the uncertainty of observed data. To consider the uncertainty in the SIR model, the Bayesian approach can be employed, and this approach allows us to evaluate the intervention effects by time-varying functions of the infection rate in the SIR model. In this study, we describe the time trend of the spread of COVID-19 in South Korea and investigate the intervention effects for the events using the stochastic SIR model based on the Bayesian approach.

Telco's Technology Deployment Strategy Using Real Options - Wireless LAN Service Case (실물옵션이론을 활용한 통신서비스 도입 전략 -무선 LAN 서비스 사례)

  • 최재경;김호
    • Proceedings of the Korean Operations and Management Science Society Conference
    • /
    • 2002.05a
    • /
    • pp.1030-1037
    • /
    • 2002
  • 통신서비스의 성패를 좌우하는 다양한 선택의 문제 중 하나는 신규 서비스를 제공하는 데 있어서, 어떤 기술을 도입하고 언제 상용화할 것인가를 결정하는 것이다 이러한 결정에는 서비스를 제공하는데 수반되는 투자와 비용, 시장 규모의 예측, 경쟁사업자 동향, 기존 또는 유사 기술과의 호환성이나 경쟁 관계 등이 고려되어야 하며, 이를 위해 다양한 경제성분석 방법이 활용되어 오고 있다. 그러나, 전통적인 현금흐름할인법의 경우, 현재 획득 가능하거나 추정할 수 있는 데이터를 이용해서 의사결정을 내리는 방식을 취하고 있으며 유연한 사고를 통해 수시로 변화하는 사업환경을 동태적 입장에서 의사결정을 지원할 수 없다는 한계를 지니고 있다. 최근, 이에 대한 대안으로 실물옵션이론을 활용한 경제성분석 방법이 소개되고 있다. 이는 금융옵션의 특성에 기반을 둔 방법으로, 주변 여건의 변화에 대해 유연한 의사결정을 지원할 수 있다는 측면이 통신서비스와 같은 불확실성이 큰 사업환경에 적합한 방법이 될 것으로 판단된다. 이에 본 논문에서는 새롭게 부각되고 있는 무선 LAN 서비스의 제공을 위한 통신 사업자의 서비스 도입 전략을 실물옵션이론을 활용해서 분석해 보고자 한다. 이를 통해, 통신사업자의 관점에서 무선 LAW 서비스의 제공을 추진할 때 가능성이 높은 몇 가지 시나리오에 대한 대응 방안과 유의점에 대해 고찰한다.

  • PDF

An Index for Efficient Processing of Uncertain Data in Ubiquitous Sensor Networks (유비쿼터스 센서 네트워크에서 불확실한 데이타의 효율적인 처리를 위한 인덱스)

  • Kim, Dong-Oh;Kang, Hong-Koo;Hong, Dong-Suk;Han, Ki-Joon
    • Journal of Korea Spatial Information System Society
    • /
    • v.8 no.3
    • /
    • pp.117-130
    • /
    • 2006
  • With the rapid development of technologies related to Ubiquitous Sensor Network (USN), sensors are being utilized in various application areas. In general, the data sensed by each sensor node on ubiquitous sensor networks are stored into the central server for efficient search. Because update is delayed to reduce the cost of update in this environment, uncertain data can be stored in the central server. In addition, Uncertain data make query processing produce wrong results in the central server. Thus, this paper examines how to process uncertain data in ubiquitous sensor networks and suggests a new index for efficient processing of uncertain data. The index reduces the cost of update by delaying update in uncertainty areas. Uncertainty areas are areas where uncertain data are likely to exist. In addition, it solves the problem of low accuracy in search resulting from update delay by delaying update only for specific update areas. Lastly, we analyze the performance of the index and prove the superiority of its performance by comparing its performance evaluation.

  • PDF

Clustering Algorithm for Data Mining using Posterior Probability-based Information Entropy (데이터마이닝을 위한 사후확률 정보엔트로피 기반 군집화알고리즘)

  • Park, In-Kyoo
    • Journal of Digital Convergence
    • /
    • v.12 no.12
    • /
    • pp.293-301
    • /
    • 2014
  • In this paper, we propose a new measure based on the confidence of Bayesian posterior probability so as to reduce unimportant information in the clustering process. Because the performance of clustering is up to selecting the important degree of attributes within the databases, the concept of information entropy is added to posterior probability for attributes discernibility. Hence, The same value of attributes in the confidence of the proposed measure is considerably much less due to the natural logarithm. Therefore posterior probability-based clustering algorithm selects the minimum of attribute reducts and improves the efficiency of clustering. Analysis of the validation of the proposed algorithms compared with others shows their discernibility as well as ability of clustering to handle uncertainty with ACME categorical data.