• 제목/요약/키워드: Data Partition Algorithm

검색결과 128건 처리시간 0.027초

동적 분할 평균을 이용한 새로운 메모리 기반 학습기법 (A New Memory-based Learning using Dynamic Partition Averaging)

  • 이형일
    • 한국지능시스템학회논문지
    • /
    • 제18권4호
    • /
    • pp.456-462
    • /
    • 2008
  • 분류란 새로운 자료를 주어진 클래스 중의 하나로 구분하는 것으로 가장 일반적으로 사용되는 데이터마이닝 기법 중의 하나이다. 그중 메모리기반 추론(MBR : Memory-Based Reasoning)은 추론 규칙 없이 특징들의 최초의 벡터 형태에 의해 표현된 학습패턴을 단순히 저장한다. 그리고 분류 시에 새로운 자료가 메모리에 저장된 학습패턴들과의 거리를 계산하여 가장 가까운 거리에 있는 학습패턴의 클래스로 분류하는 기법이다. MBR 기법에서 학습패턴이 커지면 저장에 필요한 메모리의 크기도 커질 뿐만 아니라 추론을 위한 계산도 많아지는 문제점을 가지고 있다. 이러한 문제를 해결하기 위한 대표적인 방법으로 초월평면을 이용하는 NGE 이론과 대표패턴을 추출하여 학습하는 FPA 기법과 RPA 기법 등을 들을 수 있다. 본 논문에서는 학습패턴 공간을 GINI-Index값을 이용하여 일련의 최적 분할점을 찾아 가변크기로 분할하는 동적분할평균(DPA : Dynamic Partition Averaging)기법을 제안하였다. 제안한 기법의 성능을 검증하기 위하여 MBR기법 중 널리 사용되는 k-NN 기법과 비교하였다. 제안한 기법이 k-NN기법에 비해 대표패턴 개수는 줄이고 분류성능은 유사하게 유지시킨 것을 보여주었다. 또한, 제안한 기법은 NGE 이론을 구현한 EACH 시스템과 대표패턴 기법인 FPA기법과 RPA기법 등과 비교하여 탁월한 분류 성능을 보여주었다.

Building a Fuzzy Model with Transparent Membership Functions through Constrained Evolutionary Optimization

  • Kim, Min-Soeng;Kim, Chang-Hyun;Lee, Ju-Jang
    • International Journal of Control, Automation, and Systems
    • /
    • 제2권3호
    • /
    • pp.298-309
    • /
    • 2004
  • In this paper, a new evolutionary scheme to design a TSK fuzzy model from relevant data is proposed. The identification of the antecedent rule parameters is performed via the evolutionary algorithm with the unique fitness function and the various evolutionary operators, while the identification of the consequent parameters is done using the least square method. The occurrence of the multiple overlapping membership functions, which is a typical feature of unconstrained optimization, is resolved with the help of the proposed fitness function. The proposed algorithm can generate a fuzzy model with transparent membership functions. Through simulations on various problems, the proposed algorithm found a TSK fuzzy model with better accuracy than those found in previous works with transparent partition of input space.

Dynamic Hysteresis Model Based on Fuzzy Clustering Approach

  • Mourad, Mordjaoui;Bouzid, Boudjema
    • Journal of Electrical Engineering and Technology
    • /
    • 제7권6호
    • /
    • pp.884-890
    • /
    • 2012
  • Hysteretic behavior model of soft magnetic material usually used in electrical machines and electronic devices is necessary for numerical solution of Maxwell equation. In this study, a new dynamic hysteresis model is presented, based on the nonlinear dynamic system identification from measured data capabilities of fuzzy clustering algorithm. The developed model is based on a Gustafson-Kessel (GK) fuzzy approach used on a normalized gathered data from measured dynamic cycles on a C core transformer made of 0.33mm laminations of cold rolled SiFe. The number of fuzzy rules is optimized by some cluster validity measures like 'partition coefficient' and 'classification entropy'. The clustering results from the GK approach show that it is not only very accurate but also provides its effectiveness and potential for dynamic magnetic hysteresis modeling.

통계적 정보기반 계층적 퍼지-러프 분류기법 (Statistical Information-Based Hierarchical Fuzzy-Rough Classification Approach)

  • 손창식;서석태;정환묵;권순학
    • 한국지능시스템학회논문지
    • /
    • 제17권6호
    • /
    • pp.792-798
    • /
    • 2007
  • 본 논문에서는 학습기법을 사용하지 않고 패턴분류의 성능을 최대화하면서 규칙의 수를 줄일 수 있는 통계적 정보기반 계층적 퍼지-러프 분류방법을 제안한다. 제안된 방법에서 통계적 정보는 계층적 퍼지-러프 분류 시스템에서 각 계층의 입력부 퍼지집합의 분할 구간을 추출하기 위해서 사용되었고, 러프집합은 통계적 정보로부터 추출된 분할 구간들과 연관된 퍼지 if-then 규칙의 수를 최소화하기 위해서 사용되었다. 제안된 방법의 효과성을 보이기 위해 Fisher의 IRIS 데이터를 사용한 기존 패턴분류 방법의 분류 정확도와 규칙들의 수를 비교하였다. 그 결과, 제안된 방법은 기존 방법들의 분류 성능과 유사함을 확인할 수 있었다.

비선형 공정에서의 입력 공간 분할에 의한 퍼지 추론 시스템의 특성 분석 (Characteristics of Fuzzy Inference Systems by Means of Partition of Input Spaces in Nonlinear Process)

  • 박건준;이동윤
    • 한국콘텐츠학회논문지
    • /
    • 제11권3호
    • /
    • pp.48-55
    • /
    • 2011
  • 본 논문은 비선형 공정의 퍼지 모델을 동정하기 위해 전체 입력의 공간 분할 및 퍼지 추론 방법에 따른 퍼지 추론 시스템의 입출력 특성을 분석하며, 퍼지 모델의 입력 변수와 퍼지 입력 공간 분할 및 후반부 다항식 함수에 의한 구조 동정과 파라미터 동정을 통해 비선형 공정을 표현한다. 퍼지 규칙에서 전반부 파라미터의 동정에는 입출력 데이터의 최소 값과 최대 값을 이용하는 최소-최대 방법 및 입출력 데이터를 군집으로 형성하는 C-Means 클러스터링 알고리즘을 사용하여 입력 공간을 분할한다. 또한 전반부 멤버쉽 함수는 삼각형 멤버쉽 함수를 사용하여 입력 공간을 형성한다. 후반부 동정에서 퍼지 추론 방법은 간략 추론 및 선형 추론에 의해 시스템을 표현한다. 또한, 각 규칙의 후반부 파라미터들, 즉 후반부 다항식의 계수를 동정하기 위해 표준 최소자승법을 사용한다. 마지막으로, 비선형 공정으로는 널리 이용되는 가스로 데이터를 사용하며 이 공정에 대해 성능을 평가한다.

Iterative SAR Segmentation by Fuzzy Hit-or-Miss and Homogeneity Index

  • Intajag Sathit;Chitwong Sakreya;Tipsuwanporn Vittaya
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2004년도 Proceedings of ISRS 2004
    • /
    • pp.111-114
    • /
    • 2004
  • Object-based segmentation is the first essential step for image processing applications. Recently, SAR (Synthetic Aperture Radar) segmentation techniques have been developed, however not enough to preserve the significant information contained in the small regions of the images. The proposed method is to partition an SAR image into homogeneous regions by using a fuzzy hit-or-miss operator with an inherent spatial transformation, which endows to preserve the small regions. In our algorithm, an iterative segmentation technique is formulated as a consequential process. Then, each time in iterating, hypothesis testing is used to evaluate the quality of the segmented regions with a homogeneity index. The segmentation algorithm is unsupervised and employed few parameters, most of which can be calculated from the input data. This comparative study indicates that the new iterative segmentation algorithm provides acceptable results as seen in the tested examples of satellite images.

  • PDF

개선된 공간 해쉬 조인 알고리즘을 이용한 편중 데이터 처리 기법 (Skewed Data Handling Technique Using an Enhanced Spatial Hash Join Algorithm)

  • 심영복;이종연
    • 정보처리학회논문지D
    • /
    • 제12D권2호
    • /
    • pp.179-188
    • /
    • 2005
  • 지난 수년 동안 공간 데이터의 조인 연산에 대한 많은 연구가 진행되어 왔다. 본 논문에서는 공간 조인연산 시 인덱스가 존재하지 않을 경우, 후보 객체의 여과 단계 처리에 중점을 둔다. 이 분야에 대한 여러 알고리즘들이 제안되었으며 대부분의 경우 공간 데이터의 조인 연산 시 우수한 성능을 나타내고 있다. 하지만, 조인을 위한 입력 테이블의 객체들이 편중되어 분포할 경우 조인 성능이 급격히 저하되는 문제점을 가지고 있으며 이 문제를 해결하려는 연구는 미흡한 실정이다. 따라서, 본 논문에서는 공간 데이터의 편중 문제를 개선하기 위해 기존의 공간 조인 알고리즘 중 Spatial Hash Join 알고리즘과 SSSJ 알고리즘의 장점을 결합한 Spatial Hash Sip Join 알고리즘을 제안한다. 이 알고리즘을 SHJ 알고리즘의 객체 분포에 기반한 공간 분할 특성과 공간 조인 시 SSSJ 알고리즘의 우수한 I/O 특성을 이용한다. 본 논문에서 제안한 SHSJ 알고리즘의 성능 평가를 위해 Tiger/line 데이터를 사용하여 기존 SHJ 알고리즘과 성능을 비교 평가 하였으며 평가 결과 인덱스가 존재하지 않는 입력 테이블에 대한 공간 조인 연산 시 모든 평가 파라미터에 대해 기존의 SHJ 알고리즘보다 우수함이 검증되었다.

Partitioning likelihood method in the analysis of non-monotone missing data

  • Kim Jae-Kwang
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2004년도 학술발표논문집
    • /
    • pp.1-8
    • /
    • 2004
  • We address the problem of parameter estimation in multivariate distributions under ignorable non-monotone missing data. The factoring likelihood method for monotone missing data, termed by Robin (1974), is extended to a more general case of non-monotone missing data. The proposed method is algebraically equivalent to the Newton-Raphson method for the observed likelihood, but avoids the burden of computing the first and the second partial derivatives of the observed likelihood Instead, the maximum likelihood estimates and their information matrices for each partition of the data set are computed separately and combined naturally using the generalized least squares method. A numerical example is also presented to illustrate the method.

  • PDF

선형의 시간 복잡도를 가지는 휴리스틱 k-방향 네트워크 분할 알고리즘 (A Linear-Time Heuristic Algorithm for k-Way Network Partitioning)

  • 최태영
    • 한국멀티미디어학회논문지
    • /
    • 제7권8호
    • /
    • pp.1183-1194
    • /
    • 2004
  • 네트워크 분할 문제는 주어진 네트워크를 여러 개의 블록으로 분할하되 절단집합의 크기를 최소화하는 동시에 블록들의 크기는 균일하도록 하는 문제이다. 많은 네트워크 분할 알고리즘들 중에서 반복 알고리즘 부류는 간단하면서도 효과적이라는 것이 알려져 있다. 대표적인 반복 알고리즘은 Fiduccia와 Mattheyses가 제안한 셀 단위의 이동을 하는 알고리즘, 이의 개량형인 Sanchis가 제안한 k-방향 분할 알고리즘이 있다. 이들 알고리즘은 '블록들의 균일한 크기'를 반드시 만족되어야 하는 조건으로 고정하고 있으며, 이 조건은 비효율적인 셀 이동을 유발하는 원인이 된다. Park과 Park은 블록들의 균일한 크기를 제한 조건으로 두는 대신 '균형 비용'으로 정하고, 균형 비용의 크기를 조절하는 균형 계수 R을 제안했다. 하지만 그 알고리즘은 셀 개수의 제곱에 해당하는 상당히 높은 시간복잡도를 가진다는 문제가 있다. 본 논문에서는 셀 개수의 선형에 해당하는 시간복잡도를 가지면서도 균형 비용의 장점을 이용하는 bucket 알고리즘을 제안한다. MCNC 테스트 셋을 통한 실험은 Sanchis가 제안한 알고리즘에 비해서 제안된 알고리즘이 만들어낸 분할에서의 절단 집합의 크기가 63.33%에서 92.38%로 줄어들었으며, 균형 조건을 명시하지 않았음에도 불구하고 결과 분할들은 균형 조건을 만족함을 보여준다.

  • PDF

역공학을 위한 측정점의 영역화 (Segmentation of Measured Point Data for Reverse Engineering)

  • 양민양;이응기
    • 한국CDE학회논문집
    • /
    • 제4권3호
    • /
    • pp.173-179
    • /
    • 1999
  • In reverse engineering, when a shape containing multi-patched surfaces is digitized, the boundaries of these surfaces should be detected. The objective of this paper is to introduce a computationally efficient segmentation technique for extracting edges, ad partitioning the 3D measuring point data based on the location of the boundaries. The procedure begins with the identification of the edge points. An automatic edge-based approach is developed on the basis of local geometry. A parametric quadric surface approximation method is used to estimate the local surface curvature properties. the least-square approximation scheme minimizes the sum of the squares of the actual euclidean distance between the neighborhood data points and the parametric quadric surface. The surface curvatures and the principal directions are computed from the locally approximated surfaces. Edge points are identified as the curvature extremes, and zero-crossing, which are found from the estimated surface curvatures. After edge points are identified, edge-neighborhood chain-coding algorithm is used for forming boundary curves. The original point set is then broke down into subsets, which meet along the boundaries, by scan line algorithm. All point data are applied to each boundary loops to partition the points to different regions. Experimental results are presented to verify the developed method.

  • PDF