• 제목/요약/키워드: Kernel density function

검색결과 98건 처리시간 0.028초

An Overview of Unsupervised and Semi-Supervised Fuzzy Kernel Clustering

  • Frigui, Hichem;Bchir, Ouiem;Baili, Naouel
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제13권4호
    • /
    • pp.254-268
    • /
    • 2013
  • For real-world clustering tasks, the input data is typically not easily separable due to the highly complex data structure or when clusters vary in size, density and shape. Kernel-based clustering has proven to be an effective approach to partition such data. In this paper, we provide an overview of several fuzzy kernel clustering algorithms. We focus on methods that optimize an fuzzy C-mean-type objective function. We highlight the advantages and disadvantages of each method. In addition to the completely unsupervised algorithms, we also provide an overview of some semi-supervised fuzzy kernel clustering algorithms. These algorithms use partial supervision information to guide the optimization process and avoid local minima. We also provide an overview of the different approaches that have been used to extend kernel clustering to handle very large data sets.

GIS 기반의 상권분석 모형 연구 - Huff 확률모형을 중심으로 - (A Study on the Trade Area Analysis Model based on GIS - A Case of Huff probability model -)

  • 손영기;안상현;신영철
    • 한국지리정보학회지
    • /
    • 제10권2호
    • /
    • pp.164-171
    • /
    • 2007
  • 본 연구는 GIS공간분석기법과 Huff의 확률모형을 이용하여 근린생활권중심의 상권분석을 수행하였다. 연구에 사용된 기본도는 청주시 복대동을 대상으로 하여 업종, 세대수 등을 현장 조사하여 구축하였으며, 기 구축된 LMIS에 있는 연속지적도를 활용하였다. 분석에서는 커널밀도함수(Kernel Density Function)와 최근린지수(Nearest Neighbor Index)를 활용하여 근린생활권내 점포분포 중심권역을 설정하였다. 상권분석을 수행하기 위하여 설정된 중심권역에 따라 중심지(점)와 규모를 산출한 후 상권분석의 모형인 Huff 확률모형에 적용하여 중심권역별 상권을 추출하였으며, 추출된 상권을 지도로 도식하였다. 따라서 본 연구에서는 GIS 공간분석기법 중 커널밀도함수와 최근린지수를 통해 Huff 확률모형에 적용할 수 있는 방법을 제시하였다. 이러한 방법들을 이용함으로써 보다 정확하게 상권분석을 할 수 있으며, 향후 창업하고자 하는 소상공인들에 도움이 될 수 있으리라 사료된다.

  • PDF

비동질성 Markov 모형에 의한 시간강수량 모의 발생과 천이확률을 이용한 강우의 시간분포 유도 (Simulation of Hourly Precipitation using Nonhomogeneous Markov Chain Model and Derivation of Rainfall Mass Curve using Transition Probability)

  • 최병규;오태석;박래건;문영일
    • 한국수자원학회논문집
    • /
    • 제41권3호
    • /
    • pp.265-276
    • /
    • 2008
  • 수공구조물의 설계를 위해서는 충분한 기간의 관측자료가 필요하지만, 우리나라의 수문자료는 대부분 충분한 수의 관측자료를 보유하고 있지 못하는 실정이다. 따라서 본 연구에서는 핵밀도함수를 이용한 비동질성 Markov 모형을 통해 시간강수량 자료를 모의하였다. 첫 번째로 시간강수량 자료에 변동핵밀도함수를 이용하여 천이확률을 산정하였으며, 두 번째로 난수와 천이확률을 통해 강수가 발생하는 시간을 결정하였다. 세 번째로 강수가 발생한 시간의 강수량의 크기를 핵밀도함수를 통해 추정하였다. 분석결과에서 모의된 시간강수량은 관측시간강수량과 비슷한 통계적 특성을 보이고 있는 것으로 나타났다. 또한, 시간강수량의 모의발생을 위하여 산정한 천이확률을 이용해 강수의 무차원시간분포곡선을 유도하였다.

Data Clustering Method Using a Modified Gaussian Kernel Metric and Kernel PCA

  • Lee, Hansung;Yoo, Jang-Hee;Park, Daihee
    • ETRI Journal
    • /
    • 제36권3호
    • /
    • pp.333-342
    • /
    • 2014
  • Most hyper-ellipsoidal clustering (HEC) approaches use the Mahalanobis distance as a distance metric. It has been proven that HEC, under this condition, cannot be realized since the cost function of partitional clustering is a constant. We demonstrate that HEC with a modified Gaussian kernel metric can be interpreted as a problem of finding condensed ellipsoidal clusters (with respect to the volumes and densities of the clusters) and propose a practical HEC algorithm that is able to efficiently handle clusters that are ellipsoidal in shape and that are of different size and density. We then try to refine the HEC algorithm by utilizing ellipsoids defined on the kernel feature space to deal with more complex-shaped clusters. The proposed methods lead to a significant improvement in the clustering results over K-means algorithm, fuzzy C-means algorithm, GMM-EM algorithm, and HEC algorithm based on minimum-volume ellipsoids using Mahalanobis distance.

커널 밀도 추정과 시공간 일치성을 이용한 동영상 객체 분할 (Video Object Segmentation using Kernel Density Estimation and Spatio-temporal Coherence)

  • 안재균;김창수
    • 전기전자학회논문지
    • /
    • 제13권4호
    • /
    • pp.1-7
    • /
    • 2009
  • 본 논문에서는 고정되지 않은 배경의 동영상에서 객체를 추출하는 방법을 제안한다. 제안하는 알고리즘은 추적에 기반을 둔 기법으로 크게 세 단계의 과정으로 이루어져 있다. 첫 번째 단계는 초기 분할로서, 사용자의 반응을 이용하여 첫 프레임의 분할 결과를 획득하는 과정이다. 초기 분할을 통해 획득된 결과 샘플은 커널 밀도 추정을 이용하여 각 매크로 블록별 컬러 확률 밀도 함수를 생성하는데 사용된다. 두 번째 단계에서는 각 프레임에 대해 이전 프레임의 경계 정보와 움직임 벡터를 이용하여 일치성 띠를 생성하고, 생성된 띠에 대한 시공간 확률을 추정한다. 마지막 단계에서는 각 픽셀별 컬러, 시공간, 스무드항의 합으로 구성된 에너지 함수를 최소화하여 최종 결과를 획득한다. 실험 결과를 통해서 본 논문에서 제안하는 기법이 정확한 분할 결과를 추출하는 지 다양한 테스트 영상을 통해 확인한다.

  • PDF

셰일 저류층에서의 핵밀도 함수를 이용한 확률론적 궁극가채량 예측 (Probabilistic Prediction of Estimated Ultimate Recovery in Shale Reservoir using Kernel Density Function)

  • 신효진;황지유;임종세
    • 한국가스학회지
    • /
    • 제21권3호
    • /
    • pp.61-69
    • /
    • 2017
  • 생산성을 증대시키는 기술의 발달로 상업적인 생산이 가능해진 비전통 가스에 대한 개발이 북미를 중심으로 진행되고 있다. 셰일 저류층은 유체투과도가 낮으며, 일반적인 석유자원과 달리 수압파쇄로부터 생성된 균열을 통해 가스 생산이 이루어지므로 초기의 생산 감퇴율이 큰 반면 후반부에서는 감퇴하는 변화율이 매우 작은 특징을 나타낸다. 이러한 셰일가스의 생산량 변동성으로 인해 단일 예측값을 산출하는 생산감퇴곡선분석기법을 생산량 자료 분석에 적용할 경우 불확실성을 고려하기 어렵다. 이 연구에서는 미국 Eagle Ford 지역의 생산정 자료에 대하여 확률론적 기법 중 하나인 몬테카를로 시뮬레이션을 적용하였으며, 생산감퇴곡선인자에 대한 난수발생 시 핵밀도 함수를 활용하여 분포에 대한 가정 없이 자료의 특성을 반영한 확률분포를 도출하였다. 또한, 일반적으로 사용되고 있는 Arps 쌍곡선함수와 치밀/셰일층의 특성을 고려하여 생산량 예측이 가능한 Modified SEPD 적용에 있어 단일값이 아닌 확률에 따른 궁극가채량을 예측함으로써 불확실성을 최소화하고자 하였다.

Robustness of Minimum Disparity Estimators in Linear Regression Models

  • Pak, Ro-Jin
    • Journal of the Korean Statistical Society
    • /
    • 제24권2호
    • /
    • pp.349-360
    • /
    • 1995
  • This paper deals with the robustness properties of the minimum disparity estimation in linear regression models. The estimators defined as statistical quantities whcih minimize the blended weight Hellinger distance between a weighted kernel density estimator of the residuals and a smoothed model density of the residuals. It is shown that if the weights of the density estimator are appropriately chosen, the estimates of the regression parameters are robust.

  • PDF

핵밀도 함수를 이용한 지역빈도해석의 적용에 관한 연구 (The Study on Application of Regional Frequency Analysis using Kernel Density Function)

  • 오태석;김종석;문영일;유승연
    • 한국수자원학회논문집
    • /
    • 제39권10호
    • /
    • pp.891-904
    • /
    • 2006
  • 합리적인 수공구조물의 설계를 위해서 확률강우량의 산정은 필수적이며, 확률 강우량을 산정하는 기법은 크게 지점빈도해석과 지역빈도해석으로 구분 지을 수 있다 이 중에서 지역빈도해석은 지점의 부족한 강우자료를 보완하기 위해서 L-모멘트로 확률분포형의 매개변수를 추정하고, 강우 계열의 동질성이 검정된 자료를 빈도분석하여 확률 강우량을 결정하는 기법이다. 이와 같은 지역빈도해석 기법은 매개변수를 선형조합하여 확률분포형의 종류와 크기 및 형상을 결정하여 확률 강우량을 산정하게 된다. 여기서 각 지점별 강우 자료들이 동질성 검정을 통과하였다 하더라도 지점별로 최적의 분포형이 다를 수 있으나, 부족한 강우자료를 보완하기 위해서 동일한 분포형을 따르는 것으로 가정하고 빈도해석을 수행하게 된다. 그러므로 지역빈도해석기법은 확률 분포형을 가정하고 강우자료를 적용하는 과정에서 기존에 매개변수적 빈도해석의 약점을 갖게 된다 따라서 본 연구에서는 변동핵밀도 함수를 동질성이 확보된 강우자료에 적용하여 빈도해석을 수행함으로써 기존의 빈도해석이 가지는 약점을 극복하고자 하였다. 본 연구에서는 기상청에서 관리하는 16개 강우관측소의 강우자료를 수집하여 매년최대 연강우량 계열을 구성해 지점빈도해석과 지역빈도해석을 수행하였다. 지점빈도해석은 매개변수적 기법과 비매개변수적 기법을 모두 적용하였으며, 지역빈도채석은 Index Flood 기법과 L-모멘트 기법을 적용하였다. 또한 변동핵밀도함수를 지역빈도해석에 적용하였으며, 각 기법별로 산정된 확률강우량을 비교 분석하였다.

교차타당성을 이용한 확률밀도함수의 불연속점 추정의 띠폭 선택 (Bandwidth selections based on cross-validation for estimation of a discontinuity point in density)

  • 허집
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권4호
    • /
    • pp.765-775
    • /
    • 2012
  • 교차타당성은 커널추정량의 평활모수인 띠폭의 선택 방법으로 흔히 활용되고 있다. 연속인 확률밀도함수의 커널추정량의 띠폭 선택으로 널리 쓰이는 교차타당성 방법으로는 최대가능도교차타당성과 더불어 최소제곱교차타당성과 편의교차타당성이 있다. 확률밀도함수가 하나의 불연속점을 가질 때, Huh (2012)는 불연속점 추정을 위한 커널추정량의 띠폭 선택으로 최대가능도교차타당성을 이용한 방법을 제시하였다. 본 연구에서는 Huh (2012)에 의해 최대가능도교차타당성으로 제안된 띠폭선택의 방법과 같이 한쪽방향커널함수를 이용한 최소제곱교차타당성과 편의교차타당성으로 띠폭 선택 방법을 제시하고, 이들 띠폭 선택 방법들과 Huh (2012)의 최대가능도교차타당성을 이용한 띠폭 선택 방법을 모의실험을 통하여 비교연구 하고자 한다.

An Automatic Spectral Density Estimate

  • Park, Byeong U.;Cho, Sin-Sup;Kee H. Kang
    • Journal of the Korean Statistical Society
    • /
    • 제23권1호
    • /
    • pp.79-88
    • /
    • 1994
  • This paper concerns the problem of estimating the spectral density function in the analysis of stationary time series data. A kernel type estimate is considered, which entails choice of bandwidth. A data-driven bandwidth choice is proposed, and it is obtained by plugging some suitable estimates into the unknown parts of a theoretically optimal choice. A theoretical justification is give for this choice in terms of how far it is from the theoretical optimum. Furthermore, an empirical investigation is done. It shows that the data-driven choice yields a reliable spectrum estimate.

  • PDF