• Title/Summary/Keyword: 분할-정복

Search Result 43, Processing Time 0.046 seconds

Model selection via Bayesian information criterion for divide-and-conquer penalized quantile regression (베이즈 정보 기준을 활용한 분할-정복 벌점화 분위수 회귀)

  • Kang, Jongkyeong;Han, Seokwon;Bang, Sungwan
    • The Korean Journal of Applied Statistics
    • /
    • v.35 no.2
    • /
    • pp.217-227
    • /
    • 2022
  • Quantile regression is widely used in many fields based on the advantage of providing an efficient tool for examining complex information latent in variables. However, modern large-scale and high-dimensional data makes it very difficult to estimate the quantile regression model due to limitations in terms of computation time and storage space. Divide-and-conquer is a technique that divide the entire data into several sub-datasets that are easy to calculate and then reconstruct the estimates of the entire data using only the summary statistics in each sub-datasets. In this paper, we studied on a variable selection method using Bayes information criteria by applying the divide-and-conquer technique to the penalized quantile regression. When the number of sub-datasets is properly selected, the proposed method is efficient in terms of computational speed, providing consistent results in terms of variable selection as long as classical quantile regression estimates calculated with the entire data. The advantages of the proposed method were confirmed through simulation data and real data analysis.

A Divide_and _Conquer Algorithm for Drawing General Trees Aesthetically (일반 트리를 미적으로 도시하기 위한 분할-정복 알고리즘)

  • Lee, Yu-Jin;Jeong, Gyun-Rak
    • Journal of KIISE:Computer Systems and Theory
    • /
    • v.26 no.1
    • /
    • pp.117-124
    • /
    • 1999
  • 트리는 계층적인 구조를 표현하는 데 편리한 자료 구조로서 그 응용 분야가 정렬, 탐색, 컴파일러, 계층적 데이터베이스 모델, 조직 차트 등 매우 광범위하다. 트리를 시각적으로 도시하는 것은 단순히 노드를 나열하는 것보다 구조적 관계를 표현하는데 효과적이다. 트리를 크기가 제한된 하면세 도시할 경우에는 시각적 측면을 고려하여 가능한 한 최소의 면적에 도시하는 것이 필요하다. Tilford가 제안한 트리 도시 알고리즘은 왼쪽 알고리즘은 왼쪽부터 최소 간격을 유지하면서 노드의 위치를 결정하는 알고리즘의 특성 때문에 두 개의 높이가 큰 서브 트리가 양쪽으로 있을 때, 두 서브 트리 사이의 작은 서브트리들이 오른쪽에 공간이 있음에도 불구하고 왼쪽으로 치우치게 위치되는 단점을 가지고 있다. 본 논문에서는 노드들의 균형을 고려하여 배치하는 분할-정복 알고리즘을 개발하였고 알고리즘의 정확성을 증명하였다.

An Efficient Multidimensional Scaling Method based on CUDA and Divide-and-Conquer (CUDA 및 분할-정복 기반의 효율적인 다차원 척도법)

  • Park, Sung-In;Hwang, Kyu-Baek
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.16 no.4
    • /
    • pp.427-431
    • /
    • 2010
  • Multidimensional scaling (MDS) is a widely used method for dimensionality reduction, of which purpose is to represent high-dimensional data in a low-dimensional space while preserving distances among objects as much as possible. MDS has mainly been applied to data visualization and feature selection. Among various MDS methods, the classical MDS is not readily applicable to data which has large numbers of objects, on normal desktop computers due to its computational complexity. More precisely, it needs to solve eigenpair problems on dissimilarity matrices based on Euclidean distance. Thus, running time and required memory of the classical MDS highly increase as n (the number of objects) grows up, restricting its use in large-scale domains. In this paper, we propose an efficient approximation algorithm for the classical MDS based on divide-and-conquer and CUDA. Through a set of experiments, we show that our approach is highly efficient and effective for analysis and visualization of data consisting of several thousands of objects.

A divide-oversampling and conquer algorithm based support vector machine for massive and highly imbalanced data (불균형의 대용량 범주형 자료에 대한 분할-과대추출 정복 서포트 벡터 머신)

  • Bang, Sungwan;Kim, Jaeoh
    • The Korean Journal of Applied Statistics
    • /
    • v.35 no.2
    • /
    • pp.177-188
    • /
    • 2022
  • The support vector machine (SVM) has been successfully applied to various classification areas with a high level of classification accuracy. However, it is infeasible to use the SVM in analyzing massive data because of its significant computational problems. When analyzing imbalanced data with different class sizes, furthermore, the classification accuracy of SVM in minority class may drop significantly because its classifier could be biased toward the majority class. To overcome such a problem, we propose the DOC-SVM method, which uses divide-oversampling and conquers techniques. The proposed DOC-SVM divides the majority class into a few subsets and applies an oversampling technique to the minority class in order to produce the balanced subsets. And then the DOC-SVM obtains the final classifier by aggregating all SVM classifiers obtained from the balanced subsets. Simulation studies are presented to demonstrate the satisfactory performance of the proposed method.

Effect of Learning a Divide-and-conquer Algorithm on Creative Problem Solving (분할 정복 알고리즘 학습이 창의적 문제 해결에 미치는 효과)

  • Kim, Yoon Young;Kim, Yungsik
    • The Journal of Korean Association of Computer Education
    • /
    • v.16 no.2
    • /
    • pp.9-18
    • /
    • 2013
  • In secondary education, learning a computer science subject has the purpose to improve creative problem solving ability of students by learning computational thinking and principles. In particular, learning algorithm has been emphasized for this purpose. There are studies that learning algorithm has the effect of creative problem solving based on the leading studies that learning algorithm has the effect of problem solving. However, relatively the importance of the learning algorithm can weaken, because these studies depend on creative problem solving model or special contents for creativity. So this study proves that learning algorithm has the effect of creative problem solving in the view that common problem solving and creative problem solving have the same process. For this, analogical reasoning was selected among common thinking skills and divide-and-conquer algorithm was selected among abstractive principles for analogical reasoning in sorting algorithm. The frequency which solves the search problem by using the binary search algorithm was higher than the control group learning only sequence of sorting algorithm about the experimental group learning divide-and-conquer algorithm. This result means that learning algorithm including abstractive principle like divide-and-conquer has the effect of creative problem solving by analogical reasoning.

  • PDF

Divide and conquer kernel quantile regression for massive dataset (대용량 자료의 분석을 위한 분할정복 커널 분위수 회귀모형)

  • Bang, Sungwan;Kim, Jaeoh
    • The Korean Journal of Applied Statistics
    • /
    • v.33 no.5
    • /
    • pp.569-578
    • /
    • 2020
  • By estimating conditional quantile functions of the response, quantile regression (QR) can provide comprehensive information of the relationship between the response and the predictors. In addition, kernel quantile regression (KQR) estimates a nonlinear conditional quantile function in reproducing kernel Hilbert spaces generated by a positive definite kernel function. However, it is infeasible to use the KQR in analysing a massive data due to the limitations of computer primary memory. We propose a divide and conquer based KQR (DC-KQR) method to overcome such a limitation. The proposed DC-KQR divides the entire data into a few subsets, then applies the KQR onto each subsets and derives a final estimator by aggregating all results from subsets. Simulation studies are presented to demonstrate the satisfactory performance of the proposed method.

Improving Haskell GC-Tuning Time Using Divide and Conquer (분할 정복법을 이용한 Haskell GC 조정 시간 개선)

  • An, Hyungjun;Byun, Sugwoo;Woo, Gyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2017.04a
    • /
    • pp.83-86
    • /
    • 2017
  • 단일 코어 프로세스의 성능 향상은 전력 소모, 발열 등의 이유로 한계에 달했다. 이에 대한 대안으로 멀티 코어가 등장했으며 매니 코어 기술에 대한 연구가 활발히 진행 중에 있다. 이렇듯 멀티 코어 환경이 보편화됨에 따라 병렬 프로그래밍의 중요성이 더욱 커졌다. 한편, 순수 함수형 언어 Haskell은 부수효과가 없고 다양한 병렬화 도구를 지원함으로써 다가오는 병렬 프로그래밍 시대에 적합한 언어라 할 수 있다. 이때 Haskell 병렬 프로그램의 성능은 메모리 재사용(Garbage Collection) 시간에 큰 영향을 받는다. 그래서 Haskell 병렬 프로그램의 성능 향상, 분석을 위한 메모리 프로파일링 도구가 필요하다. 이미 Haskell이 제공하는 메모리 프로파일링 도구로 ghc-gc-tune이 있지만 실행 속도 측면에서 개선이 필요하다. 본 연구에서는 분할 정복법을 이용해서 매 단계마다 탐색 영역을 4분의 1로 줄이도록 ghc-gc-tune을 개선했다. 개선된 ghc-gc-tune을 극대 독립 집합 프로그램과 K-means 프로그램에 적용한 결과, 평균 98%의 정확도로 실행 시간을 평균 7.78배 단축했다.

Improving Haskell GC-Tuning Time Using Divide-and-Conquer (분할 정복법을 이용한 Haskell GC 조정 시간 개선)

  • An, Hyungjun;Kim, Hwamok;Liu, Xiao;Kim, Yeoneo;Byun, Sugwoo;Woo, Gyun
    • KIPS Transactions on Computer and Communication Systems
    • /
    • v.6 no.9
    • /
    • pp.377-384
    • /
    • 2017
  • The performance improvement of a single core processor has reached its limit since the circuit density cannot be increased any longer due to overheating. Therefore, the multicore and manycore architectures have emerged as viable approaches and parallel programming becomes more important. Haskell, a purely functional language, is getting popular in this situation since it naturally supports parallel programming owing to its beneficial features including the implicit parallelism in evaluating expressions and the monadic tools supporting parallel constructs. However, the performance of Haskell parallel programs is strongly influenced by the performance of the run-time system including the garbage collector. Though a memory profiling tool namely GC-tune has been suggested, we need a more systematic way to use this tool. Since GC-tune finds the optimal memory size by executing the target program with all the different possible GC options, the GC-tuning time takes too long. This paper suggests a basic divide-and-conquer method to reduce the number of GC-tune executions by reducing the search area by one-quarter for every searching step. Applying this method to two parallel programs, a maximally independent set and a K-means programs, the memory tuning time is reduced by 7.78 times with accuracy 98% on average.

Hypercube Diagnosis Algorithm Using Syndrome Analysis of Sub-Ring (서브-링의 신드롬 분석을 이용한 하이퍼큐브 진단 알고리즘)

  • 김학원;김동균;최문석;이충세
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10a
    • /
    • pp.583-585
    • /
    • 2001
  • 하이퍼큐브의 정규적이며 계층적인 구조적 특성은 효율적인 진단 알고리즘 개발에 유리하게 적용될 수 있다. Feng et al.의 HADA/IHADA와 Choi와 Rhee의 적응적 큐브 분할 방법은 하이퍼큐브의 전체 노드를 하나의 링으로 임베딩하여 링의 진단 특성을 이용하기 위하여 분할 및 정복 방법을 이용하였다. 또한 Kranakis와 Pelc는 결함을 모두 포함하는 최소의 서브링을 하나의 노드로 하는 하이퍼큐브의 형태로 분할하는 HYP-DIAG 알고리즘을 제안하였다. 또한 최악의 경우에, 테스트 수만을 고려하여 2$^n$+3n/2의 테스트 수를 갖는 FAST-HYP-DIAG 알고리즘과 병렬 시간만을 고려하여 많아야 11테스트 라운드 이내에 진단을 수행하는 EXPRESS-HYF-DIAG 알고리즘을 제안하였다. 본 논문에서는 HYP-DIAG의 첫 번째 단계에서 얻어진 서브링들의 신드롬을 분석하여 테스트의 수와 테스트 라운드를 모두 고려하는 알고리즘을 제안한다.

  • PDF

Stabilization Analysis for Switching-Type Fuzzy-Model-Based Controller (스위칭 모드 퍼지 모델 기반 제어기를 위한 안정화 문제 해석)

  • 김주원;주영훈;박진배
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2001.12a
    • /
    • pp.149-152
    • /
    • 2001
  • 본 논문은 연속 시간과 이산 시간에서의 스위칭 모드 퍼지 모델 기반 제어기의 새로운 설계 기법에 대해서 논의한다. 스위칭 모드 퍼지 모델 기반 제어기의 설계에는 Takagi-Sugeno(75) 퍼지 시스템이 사용된다. 이 스위칭 모드 퍼지 모델 기반 제어기는 "정복-분할(divide and conquer)"이라는 하향식 접근 방식을 이용한다. 이 방법은 여러 개의 규칙을 가지고 있는 시스템에서 유한의 하위 시스템으로 시스템을 분할하여 각각의 부분 해를 구하고 이들을 결합하여 전체 시스템의 해를 구하는 방법이다. 제어기의 설계 조건은 주어진 75 퍼지 시스템의 안정화를 보장하는 선형 행렬 부등식들(LMls)에 의해 결정된다. 적절한 시뮬레이션 예제를 통한 성능 비교를 통해 본 논문의 우수성을 입증한다.

  • PDF