• Title/Summary/Keyword: 대치

Search Result 1,033, Processing Time 0.043 seconds

On the Use of Sequential Adaptive Nearest Neighbors for Missing Value Imputation (순차 적응 최근접 이웃을 활용한 결측값 대치법)

  • Park, So-Hyun;Bang, Sung-Wan;Jhun, Myoung-Shic
    • The Korean Journal of Applied Statistics
    • /
    • v.24 no.6
    • /
    • pp.1249-1257
    • /
    • 2011
  • In this paper, we propose a Sequential Adaptive Nearest Neighbor(SANN) imputation method that combines the Adaptive Nearest Neighbor(ANN) method and the Sequential k-Nearest Neighbor(SKNN) method. When choosing the nearest neighbors of missing observations, the proposed SANN method takes the local feature of the missing observations into account as well as reutilizes the imputed observations in a sequential manner. By using a Monte Carlo study and a real data example, we demonstrate the characteristics of the SANN method and its potential performance.

On the use of weighted adaptive nearest neighbors for missing value imputation (가중 적응 최근접 이웃을 이용한 결측치 대치)

  • Yum, Yunjin;Kim, Dongjae
    • The Korean Journal of Applied Statistics
    • /
    • v.31 no.4
    • /
    • pp.507-516
    • /
    • 2018
  • Widely used among the various single imputation methods is k-nearest neighbors (KNN) imputation due to its robustness even when a parametric model such as multivariate normality is not satisfied. We propose a weighted adaptive nearest neighbors imputation method that combines the adaptive nearest neighbors imputation method that accounts for the local features of the data in the KNN imputation method and weighted k-nearest neighbors method that are less sensitive to extreme value or outlier among k-nearest neighbors. We conducted a Monte Carlo simulation study to compare the performance of the proposed imputation method with previous imputation methods.

A Missing Data Imputation by Combining K Nearest Neighbor with Maximum Likelihood Estimation for Numerical Software Project Data (K-NN과 최대 우도 추정법을 결합한 소프트웨어 프로젝트 수치 데이터용 결측값 대치법)

  • Lee, Dong-Ho;Yoon, Kyung-A;Bae, Doo-Hwan
    • Journal of KIISE:Software and Applications
    • /
    • v.36 no.4
    • /
    • pp.273-282
    • /
    • 2009
  • Missing data is one of the common problems in building analysis or prediction models using software project data. Missing imputation methods are known to be more effective missing data handling method than deleting methods in small software project data. While K nearest neighbor imputation is a proper missing imputation method in the software project data, it cannot use non-missing information of incomplete project instances. In this paper, we propose an approach to missing data imputation for numerical software project data by combining K nearest neighbor and maximum likelihood estimation; we also extend the average absolute error measure by normalization for accurate evaluation. Our approach overcomes the limitation of K nearest neighbor imputation and outperforms on our real data sets.

A New Method for Imputation of Missing Genotype using Linkage Disequilibrium and Haplotype Information (결측치가 존재하는 유전형 자료에서의 연관불균형과 일배체형을 사용한 결측치 대치 방법)

  • Park Yun-Ju;Kim Young-Jin;Park Jung-Sun;Kim Kuchan;Koh Insong;Jung Ho-Youl
    • Journal of KIISE:Software and Applications
    • /
    • v.32 no.2
    • /
    • pp.99-107
    • /
    • 2005
  • In this paper, wc propose a now missing imputation method for minimizing loss of information linkage disequilibrium-based and haplotype-based imputation method, which estimate missing values of the data based on the specificity of Single Nucleotide Polymorphism(SNP) genotype data. Method for imputing data is needed to minimize the loss of information caused by experimental missing data. In general, missing imputation of biological data has used major allele imputation method. but this approach is not optima]. 1'his method has high error rates of missing values estimation since the characteristics of the genotype data are not considered not take into consideration the specific structure of the data. In this paper, we show the results of the comparative evaluation of our model methods and major imputation method for the estimation of missing values.

Memory Replacement Scheme for Linux-based Soft Real-t ice System (리눅스 기반의 연성 실시간 시스템을 위한 메모리 대체 기법)

  • 서의성;오승택;이준원
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04a
    • /
    • pp.55-57
    • /
    • 2002
  • Linux는 페이지 기반의 가상 메모리 시스템이다. 따라서 메모리가 부족할 때에는 페이지 대치 알고리즘(page replacement algorithm)에 의해 선택된 페이지가 하드디스크로 대치되게 된다. 실시간 시스템에서 이와 같은 페이지 대치가 발생하면 실시간 제약조건을 만족하지 못할 가능성이 크므로 실시간 시스템에서는 이에 맞는 대치 알고리즘이 개발되어야 한다. 본 논문에서는 연성 실시간 시스템에 적합한 N-Chance 기법을 이용한 새로운 페이지 대치 알고리즘을 제안하고 성능을 평가하였다. 새로운 페이지 대치 알고리즘은 기존의 Linux에서 사용하는 second chance 알고리즘을 수정한 것이다. 기존의 알고리즘은 페이지를 대치함에 있어서 사용되지 않는 페이지에 2번의 기회를 준 후 하드디스크로 쫓아내는 방법인데 반하여 본 논문에서 제안하는 방법은 페이지를 사용하는 프로세스가 실시간 프로세스인지 아닌지에 따라서 기회를 주는 횟수를 달리하는 방법이다. N-chance 알고리즘을 사용했을 경우 실시간 제약 조건을 비교적 충족시키면서도 무조건적인 lock으로 인한 메모리 사용의 부담을 줄일 수 있다.

  • PDF

A Comparative study between annual maximum series and annual independent rainfall series (연최대치 계열과 연최대치 독립 호우사상 계열의 비교 연구)

  • Yoo, Chul-Sang;Park, Cheol-Soon
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2011.05a
    • /
    • pp.281-285
    • /
    • 2011
  • 본 연구에서는 연최대치 독립 호우사상 계열과 연최대치 계열의 차이를 살펴보았다. 이를 위해 본 연구에서는 몇 가지 경우의 IETD 및 절단값을 적용하여 독립 호우사상을 결정하고, 그 특성을 살펴보았다. 이어 연최대치 계열과 연 최대치 독립 호우사상 계열을 비교하였다. 본 연구는 1961년부터 2010년까지 서울지점의 시강우 자료를 분석대상으로 사용하였다. 그 결과, IETD의 증가에 따라서 독립 호우사상의 발생빈도 및 평균 강우강도는 감소하고, 평균 지속기간은 증가하였다. 절단값의 증가에 따라 독립 호우사상의 발생빈도 및 평균 지속기간은 감소하고, 평균 강우강도는 증가하였다. 호우사상의 평균 강우강도는 강우 지속기간에 관계없이 거의 일정한 것으로 나타났다. 이러한 결과를 통해 지속기간이 짧은 호우사상의 최대 강우강도는 지속기간이 긴 호우사상의 최대 강우강도보다 매우 작을 것으로 파악되었다. 지속 기간이 짧은 경우, 연 최대치 계열과 연 최대치 독립 호우사상 계열의 차이는 매우 크며, 강우 지속기간이 길게 적용한 경우에는, 두 계열의 차이는 매우 줄어드는 것으로 나타났다.

  • PDF

Adaptive Nearest Neighbors를 활용한 결측치 대치

  • 전명식;정형철
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2004.11a
    • /
    • pp.185-190
    • /
    • 2004
  • 비모수적 결측치 대치 방법으로 널리 사용되는 k-nearest neighbors(KNN) 방법은 자료의 국소적(local) 특징을 고려하지 않고 전체 자료에 대해 균일한 이웃의 개수 k를 사용하는 단점이 있다. 본 연구에서는 KNN의 대안으로 자료의 국소적 특징을 고려하는 adaptive nearest neighbors(ANN) 방법을 제안하였다. 나아가 microarray 자료의 경우에 대하여 결측치 대치를 통해 KNN과 ANN의 성능을 비교하였다.

  • PDF

Deferred Substitution Form of Lamba Expression for Speculative Paralle Graph Reduction (투기적 병렬 그래프 감축을 위한 대치과정이 지연된 람다 연산식)

  • Lee, Yong-Hak;Jeon, Seo-Hyeon
    • Journal of KIISE:Computer Systems and Theory
    • /
    • v.26 no.1
    • /
    • pp.9-23
    • /
    • 1999
  • 병렬 그래프 감축 모델에 있어서 투기적 연산(speculative evaluation)모델은 병렬성을 증가시키지만 불필요한 연산으로 인해 자원을 낭비할 수 있다. 투기적 태스크가 람다 연산식을 WHNF(Weak Head Normal Form)로 감축할 때, 대치과정은 그래프를 증가시킬 수 있고, 많은 복사과정을 요구할 수 있다. 이러한 투기적 태스크는 나중에 불필요한 연산이 될 수있고 이 경우 이러한 투기적 태스크에서 발생한 다른 모든 투기적 태스크들을 종료해야 하는 부담이 있다. 또한 불필요하게 된 복사과정으로 인한 기억 공간을 재사용이 가능한 상태로 만들어 주어야 한다. 본 논문은 WHNF 또는 HNF 로 감축할 대 발생할수 있는 불필요한 대치과정으로 인한 오버헤드를 줄이기 위해 대치과정이 지연된 람다 연산식 형태 (DSF : Deferred Substitution Form)를 제안한다. 이 형태는 대치과정을 필수적 태스크(mandatory task)가 수행될 때 까지 지연시키기 위한 람다 연산식 형태이다. 대치과정이 지연된 람다 연산식 형태로의 감축을 수행하는 투기적 태스크에서 , 대치과정이 존재하지 않기 때문에 그래프의 크기가 증가하지 않고 또한 복사과정을 요구하지 않는다. 따라서 연산식에 대한 대치과정이 지연된 람다 연산식 형태로의 감축이 불필요하게 된 경우 부담이 줄어들게 된다. 아울러 병렬성을 증가시키기 위한 연산모델을 제안한다.

The Failure of Polyethylene Lock of MUTARS Distal Femur Tumor Endoprostheses: A Case Report (원위 대퇴골 종양 금속 대치물(MUTARS$^{(R)}$)의 폴리에틸렌 잠김(LOCK)부 파손: 증례 보고)

  • Jeong, Won-Ju;Park, Il-Hyung
    • The Journal of the Korean bone and joint tumor society
    • /
    • v.19 no.2
    • /
    • pp.74-77
    • /
    • 2013
  • The guidelines for the treatment of massive bone defects caused by bone resection due to tumors have changed from amputation to limb salvaging surgery. Limb salvaging surgery using endoprotheses is a well-established procedure. However, Aseptic loosening, infection, and mechanical defect remain significant problems. Among them, we experienced the case with a breakage of polyethylene lock of MUTARS$^{(R)}$ distal femur tumor Endoprostheses.

A method for improving the accuracy of privacy-preserving technique based on random substitutions (랜덤대치 기반 프라이버시 보호 기법의 정확성 개선 방법)

  • Lee, Chang Woo;Kang, Ju-Sung
    • Annual Conference of KIPS
    • /
    • 2009.04a
    • /
    • pp.1377-1380
    • /
    • 2009
  • 랜덤대치 기법은 프라이버시 손상 관점에서 높은 프라이버시를 보존하면서 원본 데이터의 분포를 재구축하여 데이터 유용성을 확보한다. 데이터 유용성을 위한 랜덤대치 기법의 정확성을 높이는 문제는 그동안 면밀히 연구되지 않았다. 본 논문에서는 랜덤대치 기법이 대부분의 데이터에 대해서 상대적으로 낮은 정확성을 보임을 실험을 통해 밝히고, 이론적인 분석과 실험을 바탕으로 정확성을 높일 수 있는 실용적인 알고리즘 개선 방법을 제안한다.