• 제목/요약/키워드: Kernel estimate

검색결과 140건 처리시간 0.034초

비선형 모델을 이용한 결측 대체 방법 비교 (A comparison of imputation methods using nonlinear models)

  • 김혜인;송주원
    • 응용통계연구
    • /
    • 제32권4호
    • /
    • pp.543-559
    • /
    • 2019
  • 자료에는 다양한 원인에 의해 결측이 발생한다. 만약 결측치를 제외하고 완전히 관찰된 자료만으로 분석을 실시한다면 결측자료 메커니즘이 완전임의결측이 아닌 경우 결과에 편향이 발생하거나 제외된 개체로 인한 정보의 손실로 추정의 정밀도가 약화된다. 결측이 하나의 변수에서만 일어나지 않기 때문에, 자료에 변수가 많을 수록 이 문제는 심화된다. 문제를 개선하기 위해 결측치를 대체하는 여러가지 방법들이 제안되었다. 하지만 모수적인 모형을 이용한 대체 방법들은 가정에 위배되는 현실 데이터에는 적합하지 않다. 따라서 본 연구에서는 자료의 분포 가정에 덜 영향을 받는 커널, 리샘플링, 스플라인 방법을 활용한 비선형 대체 방법들을 리뷰하고 필요한 경우 기존의 비선형 대체 방법에 대체클래스를 사용하여 대체값의 정확도를 높이거나 랜덤성을 가지는 오차를 더해주어 추정치의 분산이 적게 추정되는 문제를 개선하는 확장된 결측 대체 방법을 제안한다. 본 연구에서 고려한 여러 가지 대체 방법들은 다양한 모의자료 설계 하에서 성능을 비교하였다. 모의실험 결과, 비선형 대체 방법들은 각 설계 하에 다른 성능을 보이며 전반적으로 커널 회귀나 스플라인을 활용한 대체 방법들이 좋은 성능을 보였다. 더불어, 확장된 대체 방법은 기존의 대체 방법이 가지는 문제점을 개선함을 확인할 수 있었다.

국소 선형 복합 분위수 회귀에서의 평활계수 선택 (Selection of bandwidth for local linear composite quantile regression smoothing)

  • 전명식;강종경;방성완
    • 응용통계연구
    • /
    • 제30권5호
    • /
    • pp.733-745
    • /
    • 2017
  • 국소복합분위수 회귀모형을 활용한 비모수적 함수 추정방법이 높은 효율성과 더불어 활발히 연구되고 있다. 이러한 추정과정에 커널을 사용한 자료 평활방법이 대표적으로 사용되고 있으며, 그 성능은 커널보다는 평활계수의 선택 크게 의존한다. 한편, 회귀함수 추정방법의 성능을 평가하는 기준으로는 통상적으로 $L_2$-노름이 사용되어 평균제곱오차 또는 평균적분제곱오차를 최소화하는 평활계수의 선택에 대한 많은 연구가 진행되어 왔다. 본 논문에서는 국소선형 복합 분위수 회귀방법을 활용한 비모수 회귀모형 추정량의 성능을 결정하는 평활계수 선택의 최적성에 관해 연구하였다. 특히, 여러 장점을 가졌으나 수리적 어려움으로 연구가 미흡한 평균절대오차 및 평균적분절대오차를 최적의 기준으로 삼아 최적의 평활계수를 구하고 그 유일성에 관해 연구하였다. 나아가 기존의 평가기준인 평균제곱오차 및 평균적분제곱오차를 사용한 선택과의 관계를 파악하고 그 성능을 비교하였다. 이러한 과정에서 다양한 상황에서의 모의실험을 통해 제안한 방법의 특성을 규명하였다.

강우사상의 지속기간별 분포 특성을 고려한 일강우 모의 기법 개발 (Development of methodology for daily rainfall simulation considering distribution of rainfall events in each duration)

  • 정재원;김수전;김형수
    • 한국수자원학회논문집
    • /
    • 제52권2호
    • /
    • pp.141-148
    • /
    • 2019
  • 기존의 Markov Chain 모형으로 일강우량 모의시에 강우의 발생여부를 모의하고 강우일의 강우량은 Monte Carlo 시뮬레이션을 통해 일강우 분포 특성에 맞는 분포형에서 랜덤으로 강우량을 추정하는 것이 일반적이다. 이때 강우 지속기간에 따른 강도 및 강우의 시간별 분포 등의 강우 사상의 특성을 반영할 수 없다는 한계가 있다. 본 연구에서는 이를 개선하기 위해 강우 사상을 1일 지속강우, 2일 지속강우, 3일 지속강우, 4일이상 지속강우로 구분하여 강우의 지속기간에 따라 강우량을 추정하였다. 즉 강우 사상의 강우 지속일별로 총강우량의 분포형을 비매개변수 추정이 가능한 핵밀도추정(Kernel Density Estimation, KDE)를 적용하여 각각 추정하였고, 강우가 지속될 경우에 지속일별로 해당하는 분포형에서 강우량을 구하였다. 각 강우사상에 대해 추정된 총 강우량은 k-최근접 이웃 알고리즘(k-Nearest Neighbor algorithm, KNN)을 통해 관측 강우자료에서 가장 유사한 강우량을 가지는 강우사상의 강우량 일분포 형태에 따라 각 일강우량으로 분배하였다. 본 연구는 기존의 강우량 추정 방법의 한계점을 개선하고자 하였으며, 연구 결과는 미래 강우에 대한 예측에도 활용될 수 있으며 수자원 설계에 있어서 기초자료로 활용될 수 있을 것으로 기대된다.

Nonparametric Detection of a Discontinuity Point in the Variance Function with the Second Moment Function

  • Huh, Jib
    • Journal of the Korean Data and Information Science Society
    • /
    • 제16권3호
    • /
    • pp.591-601
    • /
    • 2005
  • 지금까지 회귀모형에서 불연속점의 추정은 주로 평균함수에 대해 연구되어져 왔다. 분산함수는 평균함수와 더불어 회귀모형의 연구에 매우 중요한 함수이며 이 함수가 불연속일 때의 연구는 활발히 이루어지지 않았다. Delgado와 Hidalgo (2000)와 Perron(2001)은 시계열모형에서는 비모수적 추정법에 의해 분산함수의 추정을 연구하였다. Huh와 Kang (2004)은 Perron의 추정법을 회귀모형에 적용하여 분산함수의 불연속점의 추정에 대하여 연구하였고, Perron의 추정량보다 수렴속도가 개선된 불연속점 추정량을 제안하였다 이러한 분산함수의 추정들은 잔차의 제곱을 이용한 것으로 평균함수의 추정이 필수적이다. 결국, 전체적인 계산량이 늘어나게 되고, 늘어난 만큼 불연속점 추정의 정도가 벌어지게 될 것이다. 만약, 평균함수가 연속이고 분산함수만 불연속이라면 굳이 잔차를 이용하여 분산함수의 불연속점을 추정할 필요 없다. 분산함수만 불연속점을 가지므로 이차적률함수의 불연속점이 곧 분산함수의 불연속점이므로 이차함수의 불연속점을 추정하는 것으로 충분하다. 평균함수와 분산함수 모두 불연속이라면 불연속점의 위치가 같으므로 평균함수의 불연속점의 위치를 추정하면 분산함수의 불연속점의 위치를 추정하게 되는 것이다. 따라서 이 논문에서는 이차적률함수의 불연속점을 추정하는 방법을 제안하였고 이 제안된 추정량들의 수렴속도가 잔차를 이용한 Huh와 Kang의 분산함수의 불연속점 추정량의 수렴속도와 같음을 보였고, 모의실험 결과에서는 우수함을 보여주었다.

  • PDF

실시간 임베디드 리눅스에서 다양한 주기적 타스크의 실시간 메커니즘 성능 분석 (On Benchmarking of Real-time Mechanisms in Various Periodic Tasks for Real-time Embedded Linux)

  • 고재환;최병욱
    • 로봇학회논문지
    • /
    • 제7권4호
    • /
    • pp.292-298
    • /
    • 2012
  • It is a real-time system that the system correctness depends not only on the correctness of the logical result of the computation but also on the result delivery time. Real-time Operating System (RTOS) is a software that manages the time of a microprocessor to ensure that the most important code runs first so that it is a good building block to design the real-time system. The real-time performance is achieved by using real-time mechanisms through data communication and synchronization of inter-task communication (ITC) between tasks. Therefore, test on the response time of real-time mechanisms is a good measure to predict the performance of real-time systems. This paper aims to analysis the response characteristics of real-time mechanisms in kernel space for real-time embedded Linux: RTAI and Xenomai. The performance evaluations of real-time mechanism depending on the changes of task periods are conducted. Test metrics are jitter of periodic tasks and response time of real-time mechanisms including semaphore, real-time FIFO, Mailbox and Message queue. The periodicity of tasks is relatively consistent for Xenomai but RTAI reveals smaller jitter as an average result. As for real-time mechanisms, semaphore and message transfer mechanism of Xenomai has a superior response to estimate deterministic real-time task execution. But real-time FIFO in RTAI shows faster response. The results are promising to estimate deterministic real-time task execution in implementing real-time systems using real-time embedded Linux.

표면 파라미터 계산시 모델링 인자에 따른 조정계산 추정 성능의 사전 비교분석 (A-priori Comparative Assessment of the Performance of Adjustment Models for Estimation of the Surface Parameters against Modeling Factors)

  • 서수영
    • Spatial Information Research
    • /
    • 제19권2호
    • /
    • pp.29-36
    • /
    • 2011
  • 본 연구는 표면 파라미터 추정시 고려하는 주요 인자별로 각 조정모델들을 분류하고 그들의 추정정확도를 사전분석함으로써 이들 모델링 인자들이 각 대상파라미터의 추정에 주는 영향을 정량적으로 분석하였다. 현재 지표면형상에 대한 정보를 취득하기 위하여 라이다영상, 항공영상, SAR영상 등 다양한 자료가 활용되고 있고, 이들로부터 지표면 형상을 정량적으로 분석하기 위해서는 임의지점 주위의 관측값들을 이용하여 해당 지점의 형상을 구체적으로 파악하게 된다. 이러한 형상정보는 관측값 범위지정, 가중치방식, 그리고 수학적모델링 등 여러 인자들을 선정하여 산정할 수 있지만, 각 선정인자에 따라 표면의 형상정보는 다르게 산정되고 또한 그 정확도도 상이하게 된다. 따라서, 본 연구에서는 표면의 형상정보추출시 조정계산 인자들 따른 이러한 정확도를 비교함으로써 인자별 추정 정확도 변화 경향에 대한 진단을 실시하였다. 본 연구에서는 표면형상정보로 표고, 경사, 곡면의 2차계수를 대상으로 하고, 수학적함수, 커널크기, 가중유형별로 조정계산모델들을 구성하여 사전통계량을 계산하였고, 이에 따라 전통계량 변화를 비교 분석함으로써, 각 조정모델의 추정성능을 조정계산인자에 따라 정량적으로 비교분석하였다.

비동질성 Markov 모형의 시간강수량 모의 발생을 이용한 IDF 곡선 및 홍수빈도곡선의 유도 (Derivation of Intensity-Duration-Frequency and Flood Frequency Curve by Simulation of Hourly Precipitation using Nonhomogeneous Markov Chain Model)

  • 최병규;오태석;박래건;문영일
    • 한국수자원학회논문집
    • /
    • 제41권3호
    • /
    • pp.251-264
    • /
    • 2008
  • 본 연구에서는 비동질성 Markov 모형을 이용한 시간강수량의 모의발생을 수행하였다. 즉, 대상유역을 선정하고 시간강수량을 모의하여, 모의된 시간강수량을 이용한 확률강수량 및 확률홍수량을 산정하여 관측자료와 비교함으로써 비동질성 Markov 모형의 적용성을 평가하였다. 모의발생된 강수자료와 관측강수자료의 통계적 특성은 매우 유사한 것으로 나타났으며, 특히 모의년수가 증가할수록 극치값이 증가하는 경향을 나타냈다. 또한, 모의자료를 이용해 산정한 확률홍수량은 관측강수량을 이용해 산정한 결과보다 큰 재현기간에서 관측유입량 자료를 빈도해석하여 산정한 확률홍수량과 더 근사한 결과를 보였다. 따라서, 비동질성 Markov 모형을 이용하여 보다 신뢰성 있는 수공구조물의 설계수문량 산정 등에 많이 활용될 수 있을 것으로 판단되며 수자원 개발시 불확실성 분석을 위한 입력 자료인 강수자료로도 활용이 가능할 것으로 판단된다.

엿기름의 효소활성과 관련한 보리의 품질특성 (Quality Characteristics of Barley Varieties Related to Enzymatic Activity in Malt)

  • 이영택;서세정;장학길
    • 한국식품과학회지
    • /
    • 제31권6호
    • /
    • pp.1421-1426
    • /
    • 1999
  • 엿기름의 품질 요소인 당화력(DP)은 보리품종에 따라 큰 차이를 나타내 $139{\sim}220^{\circ}L$의 범위에 있었다. 당화력은 ${\alpha}-amylase$ 보다 ${\beta}-amylase$와 높은 상관관계가 있어 엿기름의 ${\beta}-amylase$ 활성이 매우 중요한 인자였으며, 엿기름 첨가에 따른 amylograph 전분기질 점도 감소는 ${\alpha}-amylase$와 관련이 있는 것으로 확인되었다. 보리품종들의 품질요소들을 분석하여 엿기름 당화력과의 상관관계를 조사한 결과 엿기름의 당화력은 원맥의 품질인자와 상관관계가 별로 높지 않았으나 중량이 낮은 품종이나 덜 풍만한 품종에서 당화력이 높은 경향을 보여주었다. 보리원맥이 지니고 있는 ${\beta}-amylase$ 활성은 엿기름의 당화력과 상관관계가 있는 것으로 평가되었으며 엿기름의 당화력을 예측할 수 있는 잠재적인 당화력으로서 엿기름 제조에 매우 유용한 품질인자인 것으로 판단되었다.

  • PDF

Indoor Path Recognition Based on Wi-Fi Fingerprints

  • Donggyu Lee;Jaehyun Yoo
    • Journal of Positioning, Navigation, and Timing
    • /
    • 제12권2호
    • /
    • pp.91-100
    • /
    • 2023
  • The existing indoor localization method using Wi-Fi fingerprinting has a high collection cost and relatively low accuracy, thus requiring integrated correction of convergence with other technologies. This paper proposes a new method that significantly reduces collection costs compared to existing methods using Wi-Fi fingerprinting. Furthermore, it does not require labeling of data at collection and can estimate pedestrian travel paths even in large indoor spaces. The proposed pedestrian movement path estimation process is as follows. Data collection is accomplished by setting up a feature area near an indoor space intersection, moving through the set feature areas, and then collecting data without labels. The collected data are processed using Kernel Linear Discriminant Analysis (KLDA) and the valley point of the Euclidean distance value between two data is obtained within the feature space of the data. We build learning data by labeling data corresponding to valley points and some nearby data by feature area numbers, and labeling data between valley points and other valley points as path data between each corresponding feature area. Finally, for testing, data are collected randomly through indoor space, KLDA is applied as previous data to build test data, the K-Nearest Neighbor (K-NN) algorithm is applied, and the path of movement of test data is estimated by applying a correction algorithm to estimate only routes that can be reached from the most recently estimated location. The estimation results verified the accuracy by comparing the true paths in indoor space with those estimated by the proposed method and achieved approximately 90.8% and 81.4% accuracy in two experimental spaces, respectively.

VALIDATION OF ON-LINE MONITORING TECHNIQUES TO NUCLEAR PLANT DATA

  • Garvey, Jamie;Garvey, Dustin;Seibert, Rebecca;Hines, J. Wesley
    • Nuclear Engineering and Technology
    • /
    • 제39권2호
    • /
    • pp.133-142
    • /
    • 2007
  • The Electric Power Research Institute (EPRI) demonstrated a method for monitoring the performance of instrument channels in Topical Report (TR) 104965, 'On-Line Monitoring of Instrument Channel Performance.' This paper presents the results of several models originally developed by EPRI to monitor three nuclear plant sensor sets: Pressurizer Level, Reactor Protection System (RPS) Loop A, and Reactor Coolant System (RCS) Loop A Steam Generator (SG) Level. The sensor sets investigated include one redundant sensor model and two non-redundant sensor models. Each model employs an Auto-Associative Kernel Regression (AAKR) model architecture to predict correct sensor behavior. Performance of each of the developed models is evaluated using four metrics: accuracy, auto-sensitivity, cross-sensitivity, and newly developed Error Uncertainty Limit Monitoring (EULM) detectability. The uncertainty estimate for each model is also calculated through two methods: analytic formulas and Monte Carlo estimation. The uncertainty estimates are verified by calculating confidence interval coverages to assure that 95% of the measured data fall within the confidence intervals. The model performance evaluation identified the Pressurizer Level model as acceptable for on-line monitoring (OLM) implementation. The other two models, RPS Loop A and RCS Loop A SG Level, highlight two common problems that occur in model development and evaluation, namely faulty data and poor signal selection