• 제목/요약/키워드: Kernel density function

검색결과 98건 처리시간 0.024초

분포변화 검정에서 경험확률과정과 커널밀도함수추정량의 검정력 비교 (Power Comparison between Methods of Empirical Process and a Kernel Density Estimator for the Test of Distribution Change)

  • 나성룡;박현아
    • Communications for Statistical Applications and Methods
    • /
    • 제18권2호
    • /
    • pp.245-255
    • /
    • 2011
  • 자료의 분포변화를 검정하는 비모수적 방법으로 경험분포함수를 이용하거나 확률밀도함수 추정량을 이용하는 두 가지 방법을 고려할 수 있다. 이 논문에서는 분포변화 검정을 위한 두가지 방법을 자세히 살펴보고 기존 연구의 결과를 정리한다. 여러 확률모형을 가정하고 분포변화 검정에 대한 모의 실험을 실시하여 두 방법에 대한 이론적 극한 성질이잘 성립하는가를 살펴본다. 검정력 비교를 통하여 모형에 따른 적절한 변화점 분석 방법을 알아본다.

호흡곤란 환자의 입퇴원 결정을 위한 간편 통계모형 (A simple statistical model for determining the admission or discharge of dyspnea patients)

  • 박철용;김태윤;권오진;박형섭
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권2호
    • /
    • pp.279-289
    • /
    • 2010
  • 이 논문에서는 호흡곤란을 주호소로 내원한 668명의 환자를 대상으로 입퇴원 결정을 위한 간편한 통계모형을 제안한다. 이것을 위해 55개 변수 중 임상전문가에 의해 중요하다고 선택된 11개 변수를 설명변수로 이용하였다. 먼저 변환과정으로 11개 연속형 변수 각각에 대해 실제 입원과 퇴원 환자의 커널밀도함수에 의해 퇴원구간을 설정하였다. 다음으로 11개 설명변수 중 퇴원구간에 속한 변수의 개수를 가지고 환자의 퇴원여부를 결정하는 최적 모형을 선택하였다. 입원과 퇴원 환자수의 불균형 때문에 최적 모형의 선택기준으로는 민감도와 특이도의 산술평균과 민감도와 정확률의 조화평균을 이용하였다. 그 결과 11개의 검사결과 중 7개 이상에서 퇴원구간이 나오면 퇴원을 결정하는 것이 최적 모형이 되었다.

분산커널 기반의 퍼지 c-평균을 이용한 음악 데이터의 장르 분류 (Classification of Music Data using Fuzzy c-Means with Divergence Kernel)

  • 박동철
    • 전자공학회논문지CI
    • /
    • 제46권3호
    • /
    • pp.1-7
    • /
    • 2009
  • 본 논문은 효율적인 음악 데이터의 분류를 위한 방법으로 분산커널 기반의 퍼지 c-평균을 이용한 분류기 모델을 제안한다. 분산 커널 기반의 퍼지 c-평균은 주어진 오디오 데이터에서 추출된 특징벡터의 평균과 공분산 정보를 동시에 이용하여 기존의 평균값만을 사용하는 방식에 비해 성능을 월등히 향상시킬 수 있는 장점이 있다. 사용된 방식은 확률적 분포로 주어지는 데이터 사이의 거리를 분산거리척도로 측정하고, 복잡한 분류 경계를 단순화 시키는데 효율적인 커널 개념을 사용함으로서 분류의 정확도를 극대화 시킬 수 있는 장점이 있다. 제안하는 분류기의 성능을 평가하기 위하여 고전음악, 컨트리음악, 힙합, 재즈의 4개의 장르 음악데이터를 총 1200개 수집하여 실험을 진행하였다. 실험의 결과 제안된 분산커널 기반의 퍼지 c-평균을 이용하는 분류기는 기존의 방식과 비교하여 분류정확도에서 평균적으로 17.73%-21.84%의 성능향상을 보여준다.

용액중에서의 화학반응에 관한 동역학적 이론 (Kinetic Theory for Chemical Reactions in Liquids)

  • 신국조
    • 대한화학회지
    • /
    • 제25권5호
    • /
    • pp.291-299
    • /
    • 1981
  • 용액중에서 화학반응을 설명하기 위하여 한개의 대표적인 입자의 반복적 충돌현상까지 고려한 동역학적인 이론을 경구모델을 사용하여 연구하였다. 반응성을 지닌 대표적인 입자의 상공간 밀도의 시간상관함수가 만족시키는 동역학방정식을 유도하였고 이로부터 비활성 용매 S중에서 일어나는 A + B ${\rightleftharpoons$ C + D 형태의 가역반응에 관계되는 반응속도 계수의 인자를 투영연산자방법으로 구하였다.

  • PDF

Sensitivity Study of Smoothed Particle Hydrodynamics

  • Kim, Yoo-Il;Nam, Bo-Woo;Kim, Yong-Hwan
    • Journal of Ship and Ocean Technology
    • /
    • 제11권4호
    • /
    • pp.29-54
    • /
    • 2007
  • Systematic sensitivity analysis of smoothed particle hydrodynamics method (SPH), a gridless Lagrangian particle method, was carried out in this study. Unlike traditional grid-based numerical schemes, systematic sensitivity study for computational parameters is very limited for SPH. In this study, the effect of computational parameters in SPH simulation is explored through two-dimensional dam-breaking and sloshing problem. The parameters to be considered are the speed of sound, the type of kernel function, the frequency of density re-initialization, particle number, smoothing length and pressure extraction method. Through a series of numerical test, detailed information was obtained about how SPH solution can be more stabilized and improved by adjusting computational parameters.

Spectral clustering based on the local similarity measure of shared neighbors

  • Cao, Zongqi;Chen, Hongjia;Wang, Xiang
    • ETRI Journal
    • /
    • 제44권5호
    • /
    • pp.769-779
    • /
    • 2022
  • Spectral clustering has become a typical and efficient clustering method used in a variety of applications. The critical step of spectral clustering is the similarity measurement, which largely determines the performance of the spectral clustering method. In this paper, we propose a novel spectral clustering algorithm based on the local similarity measure of shared neighbors. This similarity measurement exploits the local density information between data points based on the weight of the shared neighbors in a directed k-nearest neighbor graph with only one parameter k, that is, the number of nearest neighbors. Numerical experiments on synthetic and real-world datasets demonstrate that our proposed algorithm outperforms other existing spectral clustering algorithms in terms of the clustering performance measured via the normalized mutual information, clustering accuracy, and F-measure. As an example, the proposed method can provide an improvement of 15.82% in the clustering performance for the Soybean dataset.

비모수 핵밀도 함수를 이용한 지하수위 거동분석 (Groundwater level behavior analysis using kernel density estimation)

  • 정지혜;김종욱;이정주;전근일
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.381-381
    • /
    • 2017
  • 수자원 분야에 대한 기후변화의 영향은 홍수, 가뭄 등 극치 수문사상의 증가와 변동성 확대를 초래하는 것으로 알려져 있으며, 이에 따라 예년에 비해 발생빈도 및 심도가 증가한 가뭄에 대한 모니터링 및 피해경감을 위해 정부에서는 국민안전처를 비롯한 관계기관 합동으로 생활 공업 농업용수 등 분야별 가뭄정보를 제공하고 있다. 국토교통부와 환경부는 생활 및 공업용수 분야의 가뭄정보 제공을 위해 광역 지방 상수도를 이용하는 급수 지역과 마을상수도, 소규모급수시설 등 미급수지역의 용수수급 정보를 분석하여 가뭄 분석정보를 제공 중에 있다. 하지만, 미급수지역에 대한 가뭄 예?경보는 기준이 되는 수원정보의 부재로 기상 가뭄지수인 SPI6를 이용하여 정보를 생산하고 있다. 기상학적 가뭄 상황과 물부족에 의한 체감 가뭄은 차이가 있으며, 미급수 지역의 경우 지하수를 주 수원으로 사용하는 지역이 대부분으로 기상학적 가뭄지수인 SPI6를 이용한 가뭄정보로 실제 물수급 상황을 반영하기는 부족한 실정이다. 따라서 본 연구에서는 미급수지역의 주요 수원인 지하수의 수위 상황을 반영한 가뭄모니터링 기법을 개발하고자 하였으며, 가용량 분석이 현실적으로 어려운 지하수의 특성을 고려하여 수위 거동의 통계적 분석을 통해 가뭄을 모니터링 할 수 있는 방법으로 접근하였다. 국가지하수관측소 중 관측기간이 10년 이상이고 강우와의 상관성이 높은 관측소들을 선정한 후, 일수위 관측자료를 월별로 분리하여 1월~12월 각 월에 대해 핵밀도 함수 추정기법(kernel densitiy estimation)을 적용하여 월별 지하수위 분포 특성을 도출하였다. 각 관측소별 관측수위 분포에 대해 백분위수(percentile)를 이용하여, 25%~100% 사이는 정상, 10%~25% 사이는 주의단계, 5%~10% 사이는 심한가뭄, 5% 이하는 매우심함으로 가뭄의 단계를 구분하였다. 각 백분위수에 해당하는 수위 값은 추정된 Kernel Density와 Quantile Function을 이용하여 산정하였고, 최근 10일 평균수위를 현재의 수위로 설정하여 가뭄의 정도를 분류하였다. 분석된 결과는 관측소를 기점으로 역거리가중법(inverse distance weighting)을 통해 공간 분포를 시켰으며, 수문학적, 지질학적 동질성을 반영하기 위하여 유역도 및 수문지질도를 중첩한 공간연산을 통해 전국 지하수 가뭄상태를 나타내는 지하수위 등급분포도를 작성하였다. 실제 가뭄상황과의 상관성을 분석하기 위해 언론기사를 통해 확인된 가뭄시기와 백문위수 25%이하로 분석된 지하수 가뭄시기를 ROC(receiver operation characteristics) 분석을 통해 비교 검증하였다.

  • PDF

분단위 강우자료를 이용한 극치강우의 최적 시간분포 연구: 서울지점을 중심으로 (A Study on Optimal Time Distribution of Extreme Rainfall Using Minutely Rainfall Data: A Case Study of Seoul)

  • 윤선권;김종석;문영일
    • 한국수자원학회논문집
    • /
    • 제45권3호
    • /
    • pp.275-290
    • /
    • 2012
  • 본 연구에서는 극치강우의 시간분포 연구를 위하여 서울지점 우량관측소의 자기기록지를 1분단위로 독취한 MMR(minutely data using the magnetic recording)자료와 최근 들어 관측을 시작한 AWS (automatic weather system) 분단위기상관측 자료를 이용하여 연최대치 계열의 중앙값을 기준으로 한 POT(peaks over threshold) 계열 추출을 통하여 강우의 최적 시간분포 모형을 개발하였다. 기존 Huff 방법에서의 최대 단점인 지속기간별 시간분포 변화 특성을 고려하지 못하는 점과 강우사상별 강우총량에 대한 기준강우량의 일괄적용 등의 문제를 개선하였으며, 분단위 관측자료의 가중치 적용을 통한 순위결정으로 최빈분위를 선택하고 IQR (interquartile range) matrix의 적용을 통한 Quartile별 호우사상을 추출하는 방법을 제안하였다. 마지막으로 추출된 분단위 무차원 단위우량주상도에 핵밀도함수를 적용하여 자료의 크기와 분포 특성을 고려한 지속기간별 최적 시간분포형을 유도하였다.

퍼지 원 클래스 서포트 벡터 머신 (Fuzzy One Class Support Vector Machine)

  • 김기주;최영식
    • 인터넷정보학회논문지
    • /
    • 제6권3호
    • /
    • pp.159-170
    • /
    • 2005
  • OC-SVM(One Class Support Vector Machine)은 주어진 전체 데이터의 분포를 측정하는 대신에. 데이터 분포의 서포트(support)를 측정하는 기술로서 주어진 데이터를 가장 잘 설명할 수 있는 최적의 서포트 벡터(support vector)를 구하는 기술이다. OC-SVM은 데이터 분포의 표현에 아주 뛰어난 접근 방법이지만, 사람의 주관적인 중요도를 반영하는 것은 힘들다. 본 논문에서는 각 데이터에 퍼지 맴버쉽(fuzzy membership)을 적용하여 기존의 OC-SVM에 사용자의 주관적인 중요도를 표현할 수 있는 FOC-SVM(Fuzzy One class Support Vector Machine)을 유도 하였다. FOC-SVM은 데이터들을 동등하게 다루는 것이 아니라, 데이터 객체의 중요도에 따라 데이터를 다룬다. 즉, 덜 중요한 데이터의 특징 벡터는 OC-SVM의 처리과정에 덜 기여하도록 하기 위하여, 객체의 중요도에 따라 특징 벡터의 크기를 조정하였다. 이를 증명하기 위하여 가상의 데이터를 가지고 실험을 하였고, 실험 결과는 예측된 결과를 보여 주었다.

  • PDF

Landslide risk zoning using support vector machine algorithm

  • Vahed Ghiasi;Nur Irfah Mohd Pauzi;Shahab Karimi;Mahyar Yousefi
    • Geomechanics and Engineering
    • /
    • 제34권3호
    • /
    • pp.267-284
    • /
    • 2023
  • Landslides are one of the most dangerous phenomena and natural disasters. Landslides cause many human and financial losses in most parts of the world, especially in mountainous areas. Due to the climatic conditions and topography, people in the northern and western regions of Iran live with the risk of landslides. One of the measures that can effectively reduce the possible risks of landslides and their crisis management is to identify potential areas prone to landslides through multi-criteria modeling approach. This research aims to model landslide potential area in the Oshvand watershed using a support vector machine algorithm. For this purpose, evidence maps of seven effective factors in the occurrence of landslides namely slope, slope direction, height, distance from the fault, the density of waterways, rainfall, and geology, were prepared. The maps were generated and weighted using the continuous fuzzification method and logistic functions, resulting values in zero and one range as weights. The weighted maps were then combined using the support vector machine algorithm. For the training and testing of the machine, 81 slippery ground points and 81 non-sliding points were used. Modeling procedure was done using four linear, polynomial, Gaussian, and sigmoid kernels. The efficiency of each model was compared using the area under the receiver operating characteristic curve; the root means square error, and the correlation coefficient . Finally, the landslide potential model that was obtained using Gaussian's kernel was selected as the best one for susceptibility of landslides in the Oshvand watershed.