• Title/Summary/Keyword: 커널 밀도 추정

Search Result 48, Processing Time 0.028 seconds

확률밀도함수의 미분에 대한 커널추정법에 관한 연구

  • Seok, Gyeong-Ha;Kim, Dae-Hak
    • Journal of the Korean Data and Information Science Society
    • /
    • v.7 no.2
    • /
    • pp.211-217
    • /
    • 1996
  • 본 논문은 확률밀도함수의 l 번째 도함수의 커널추정법에 관하여 다루고 있다. 확률밀도함수 도함수의 커널추정에 사용될 수 있는 두가지 평활량의 선택법, 교차타당성방법과 삽입방법에 의한 평활량의 점근분포를 규명하고 이들의 상대적 수렴속도를 각각 밝히고 삽입방법의 우수성을 소표본 모의실험을 통하여 확인하였다.

  • PDF

Bandwidth selection for discontinuity point estimation in density (확률밀도함수의 불연속점 추정을 위한 띠폭 선택)

  • Huh, Jib
    • Journal of the Korean Data and Information Science Society
    • /
    • v.23 no.1
    • /
    • pp.79-87
    • /
    • 2012
  • In the case that the probability density function has a discontinuity point, Huh (2002) estimated the location and jump size of the discontinuity point based on the difference between the right and left kernel density estimators using the one-sided kernel function. In this paper, we consider the cross-validation, made by the right and left maximum likelihood cross-validations, for the bandwidth selection in order to estimate the location and jump size of the discontinuity point. This method is motivated by the one-sided cross-validation of Hart and Yi (1998). The finite sample performance is illustrated by simulated example.

Initial Prototype Selection in Fuzzy C-Means Using Kernel Density Estimation (커널 밀도 추정을 이용한 Fuzzy C-means의 초기 원형 설정)

  • Cho, Hyun-Hak;Heo, Gyeong-Yong;Kim, Kwang-Beak
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2011.01a
    • /
    • pp.85-88
    • /
    • 2011
  • Fuzzy C-Means (FCM) 알고리듬은 가장 널리 사용되는 군집화 알고리듬 중 하나로 다양한 응용 분야에서 사용되고 있다. 하지만 FCM은 여러 가지 문제점을 가지고 있으며 초기 원형 설정이 그 중 하나이다. FCM은 국부 최적해에 수렴하므로 초기 원형 설정에 따라 클러스터링 결과가 달라진다. 이 논문에서는 이러한 FCM의 초기 원형 설정 문제를 개선하기 위하여 커널밀도 추정 (kernel density estimation) 기법을 활용하는 방법을 제안한다. 제안한 방법에서는 먼저 커널 밀도 추정을 수행한 후 밀도가 높은 지역에 클러스터의 초기 원형을 설정하고 원형이 설정된 영역의 밀도를 감소시키는 과정을 반복함으로써 효율적으로 초기 원형을 설정할 수 있다. 제안된 방법이 일반적으로 사용되는 무작위 초기화 방법에 비해 효율적이라는 사실은 실험결과를 통해 확인할 수 있다.

  • PDF

The Bending Constant in Huber’s Function in Terms of a Bandwidth in Density Estimator (HUBER의 M-추정함수의 조율상수와 커널추정함수의 평활계수의 관계)

  • 박노진
    • The Korean Journal of Applied Statistics
    • /
    • v.14 no.2
    • /
    • pp.357-367
    • /
    • 2001
  • Huber의 M-추정함수의 형태는 조율상수가 주어질 때 비로소 그 형태가 결정된다. 조율상수를 커널밀도함수추정량의 평활계수를 이용하여 구하여 보았고, 모의실험을 통해 기존에 상요되는 조율상수들과 그 성능을 비교하여 보았다. 그 결과 새로운 방법에 의해 구해진 조율상수가 기존의 조율상수를 사용하는 경우 보다 모의실험을 통해 얻은 추정치의 분산이 작게되는 경우가 있음을 알았다.

  • PDF

Initialization of Fuzzy C-Means Using Kernel Density Estimation (커널 밀도 추정을 이용한 Fuzzy C-Means의 초기화)

  • Heo, Gyeong-Yong;Kim, Kwang-Baek
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.15 no.8
    • /
    • pp.1659-1664
    • /
    • 2011
  • Fuzzy C-Means (FCM) is one of the most widely used clustering algorithms and has been used in many applications successfully. However, FCM has some shortcomings and initial prototype selection is one of them. As FCM is only guaranteed to converge on a local optimum, different initial prototype results in different clustering. Therefore, much care should be given to the selection of initial prototype. In this paper, a new initialization method for FCM using kernel density estimation (KDE) is proposed to resolve the initialization problem. KDE can be used to estimate non-parametric data distribution and is useful in estimating local density. After KDE, in the proposed method, one initial point is placed at the most dense region and the density of that region is reduced. By iterating the process, initial prototype can be obtained. The initial prototype such obtained showed better result than the randomly selected one commonly used in FCM, which was demonstrated by experimental results.

Design of New Density Estimator with Entropy Maximization (엔트로피 최대화를 이용한 새로운 밀도추정자의 설계)

  • Kim, Woong-Myung;Lee, Hyon-Soo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11b
    • /
    • pp.796-798
    • /
    • 2005
  • 본 연구에서는 엔트로피 이론을 사용하여 ICA(Independent Component Analysis) 점수함수를 생성하는 새로운 밀도추정자(Density Estimator)를 제안한다. 원 신호에 대한 밀도함수의 추정은 적당한 점수함수를 생성하기 위해 필요하고, 미분 가능한 밀도함수인 커널을 이용한 밀도추정법(Kernel Density Estimation)을 이용하여 점수함수를 생성하였다. 보다 빠른 점수함수의 생성을 위해서 식의 형태를 convolution 형태로 표현하였으며, ICA 학습을 위해서 결합엔트로피를 최대화(Joint Entropy Maximization)하는 방향으로 커널의 폭을 학습하였다. 이를 위해서 기울기 강하법(Gradient descent method)를 사용하였으며, 이러한 제약 사항은 새로운 밀도 추정자를 설계하기 위한 기본적인 개념을 나타낸다. 실험결과, 커널의 폭을 담당하는 smoothing parameters들이 일정한 값으로 학습함을 알 수 있었다.

  • PDF

커널 확률밀도함수 추정량을 이용한 적합도 검정에 관한 연구

  • Seok, Gyeong-Ha;Kim, Dae-Hak
    • Journal of the Korean Data and Information Science Society
    • /
    • v.5 no.2
    • /
    • pp.1-9
    • /
    • 1994
  • 확률밀도함수의 적합도 검정을 위한 새로운 검정 통계량을 소개하고 커널확률밀도함수 추정량을 이용한 제안된 검정 통계량의 점근 정규성을 규명하였다. 제안된 통계량과 콜모고르프-스미르노프 통계량과의 소표본 모의 실험비고를 통하여 제안된 통계량의 우수성을 입증하였다.

  • PDF

Historical Study on Density Smoothing in Nonparametric Statistics (비모수 통계학에서 밀도 추정의 평활에 관한 역사적 고찰)

  • 이승우
    • Journal for History of Mathematics
    • /
    • v.17 no.2
    • /
    • pp.15-20
    • /
    • 2004
  • We investigate the unbiasedness and consistency as the statistical properties of density estimators. We show histogram, kernel density estimation, and local adaptive smoothing as density smoothing in this paper. Also, the early and recent research on nonparametric density estimation is described and discussed.

  • PDF

Development of MKDE-ebd for Estimation of Multivariate Probabilistic Distribution Functions (다변량 확률분포함수의 추정을 위한 MKDE-ebd 개발)

  • Kang, Young-Jin;Noh, Yoojeong;Lim, O-Kaung
    • Journal of the Computational Structural Engineering Institute of Korea
    • /
    • v.32 no.1
    • /
    • pp.55-63
    • /
    • 2019
  • In engineering problems, many random variables have correlation, and the correlation of input random variables has a great influence on reliability analysis results of the mechanical systems. However, correlated variables are often treated as independent variables or modeled by specific parametric joint distributions due to difficulty in modeling joint distributions. Especially, when there are insufficient correlated data, it becomes more difficult to correctly model the joint distribution. In this study, multivariate kernel density estimation with bounded data is proposed to estimate various types of joint distributions with highly nonlinearity. Since it combines given data with bounded data, which are generated from confidence intervals of uniform distribution parameters for given data, it is less sensitive to data quality and number of data. Thus, it yields conservative statistical modeling and reliability analysis results, and its performance is verified through statistical simulation and engineering examples.

Analysis of Roadkill Hotspot According to the Spatial Clustering Methods (공간 군집지역 탐색방법에 따른 로드킬 다발구간 분석)

  • Song, Euigeun;Seo, Hyunjin;Kim, Kyungmin;Woo, Donggul;Park, Taejin;Choi, Taeyoung
    • Journal of Environmental Impact Assessment
    • /
    • v.28 no.6
    • /
    • pp.580-591
    • /
    • 2019
  • This study analyzed roadkill hotspots in Yeongju, Mungyeong-si Andong-si and Cheongsong-gun to compare the method of searching the area of the spatial cluster for selecting the roadkill hotspots. The local spatial autocorrelation index Getis-Ord Gi* statistics were calculated by different units of analysis, drawing hotspot areas of 9% from 300 m and 14% from 1 km on the basis of the total road area. The rating of Z-score in the 1km hotspot area showed the highest Z-score in the 28th National Road section on the border between Yecheon-gun and Yeongj-si. The kernel density method performed general kernel density estimation and network kernel density estimation analysis, both of which made it easier to visualize roadkill hotspots than district unit analysis, but there were limitations that it was difficult to determine statistically significant priority. As a result, local hotspot areas were found to be different according to the cluster analysis method, and areas that are in common need of reduction measures were found to be the hotspot of 28th National Road through Yeongju-si and Yecheon-gun. It is deemed that the results of this study can be used as basic data when identifying roadkill hotspots and establishing measures to reduce roadkill.