• 제목/요약/키워드: Technique of Discretization

검색결과 115건 처리시간 0.021초

이산화 알고리즘을 이용한 계층적 클러스터링의 실험적 성능 평가 (Performance Comparison of Clustering using Discritization Algorithm)

  • 원재강;이정찬;정용규;이영호
    • 서비스연구
    • /
    • 제3권2호
    • /
    • pp.53-60
    • /
    • 2013
  • 데이터로부터 의미있는 형태의 정보를 얻기 위한 여러 가지 기법들이 개발되어 왔지만, 최근 들어 가장 각광받는 분야 중 하나는 패턴인식과 기계학습 방법이다. 기존의 학습 알고리즘은 대부분 범주 형 속성에 기반 한 규칙 또는 의사 결정 모델을 생성한다. 그런데, 실세계의 데이터는 보통 범주 형 속성 외에도 수치 값을 갖는 속성을 포함하고, 또 많은 경우에 있어 수치 형 속성으로만 구성되기도 한다. 따라서 이러한 경우, 데이터를 학습에 사용하기 위해서는 수치형 속성에 대한 적절한 처리 과정이 필요하다. 본 논문에서는, 수치형 속성의 도메인을 여러 개의 분절된 부분으로 나누어 학습 알고리즘에 사용하는 방법인 이산화 기법을 설명하고 또한 데이터마이닝의 기법으로 사용되는 클러스터링(Clustering)을 사용한다. 클러스터란 대량의 데이터베이스로부터 유사한 레코드 특성을 지닌 작은 그룹으로 여러 개를 분할하는 것으로 패턴 공간에 주어진 유한 개의 패턴들이 서로 가깝게 모여서 무리를 이루고 있는 패턴 집합이다. 그 집합들 중에서 특정한 카테고리를 지정하지 않고 주어진 데이터들에서 어떤 패턴을 추출하여, 비슷한 데이터들을 묶어서 데이터를 분류하는 기법인 클러스터링에 대해 실험한다.

  • PDF

지하다공질(地下多孔質) 매체(媒體)속에서의 오염물질이동(汚染物質移動) 해석(解析)을 위한 지하수(地下水)흐름 모형(模型) (Groundwater Flow Model for the Pollutant Transport in Subsurface Porous Media Theory and Modeling)

  • 조원철
    • 대한토목학회논문집
    • /
    • 제9권3호
    • /
    • pp.97-106
    • /
    • 1989
  • 본(本) 연구(硏究)는 유한요소법(有限要素法)(FEM)을 이용(利用)하여 2차원(次元) 지하수(地下水) 흐름모형(模型)을 확립(確立)한 것으로 지하수계(地下水界)에서의 오염물질이동(汚染物質移動)에 관한 종합적(綜合的)인 동적(動的)시스템 모형(模型)을 개발(開發)하는 연구(硏究)의 첫 단계(段階)이다. 이 흐름모형(模型)은 보다 많은 실재문제(實在問題)를 다를 수 있는 융통성(融通性)과 유연성(柔軟性)을 가지도록 하고 있다. 시간(時間)의 함수(函數)로 나타나는 Sources/Sinks, Dirichlet 형(形)의 경계조건(境界條件), Neumann 형(形) 혹은 Cauchy 형(形)의 유동(流動) 경계조건(境界條件), 누수성피압상(漏水性被壓床) (leaky confining beds) 등(等)의 조건(條件)을 가진 지하수(地下水)흐름을 모의발생(模擬發生 수 있으며, 또 복잡(複雜)한 경계조건(境界條件)을 잘 나타내기 위하여 삼각형요소(三角形要素)와 사각형요소(四角形要素)를 혼합(混合)하여 쓸 수 있는 지하수(地下水)흐름 FEM 모형(模型)을 확립(確立)한 것이다.

  • PDF

전단변형(剪斷變形)과 회전관성(回轉慣性)을 고려(考慮)한 Timoshenko 보의 자유진동(自由振動) 해석(解析) (Free Vibration Analysis of a Degenerated Timoshenko Beam Including the Effect of Shear Deformation and Rotatory Inertia)

  • 변동균;신영식;장종탁
    • 대한토목학회논문집
    • /
    • 제3권4호
    • /
    • pp.109-122
    • /
    • 1983
  • 본(本) 연구(硏究)에서는 전단변형(剪斷變形)(Shear deformation)과 회전관성(回轉慣性)(Rotatory inertia)의 영향(影響)을 고려(考慮)한 4절점(節點) 8자유도(自由度)를 갖는 Timoshenko 보 요소(要素)(TB4)를 3차원(次元) 연속체(連續體)로부터 유도(誘導)하고 있다. TB4보 요소(要素)는 3차(次) 보간함수(補間凾數)(Interpolation function)로 표시(表示)되는 연직(鉛直)처짐(Transverse deflection) W와 평면회전(平面回轉)(Plane rotation) ${\theta}$를 절점(節點)의 자유도(自由度)로 취(取)하고 있다. TB4요소(要素)의 강도(剛度)매트릭스와 질량(質量)매트릭스는 보의 운동방정식(運動方程式)을 Galerkin 가중잔차법(加重殘差法)(Weighted residual method)으로 Discretization하여 3개(個)의 Gauss점(點)을 이용(利用)한 RSI(Reduced shear integration)기법(技法)에 의한 수치적분(數値積分)으로 구해진다. TB4보 요소(要素)의 정확성(正確性)과 수감상태(收歛狀態)를 고찰(考察)하기 위하여 여러 가지 예제(例題)를 해석(解析)한 결과(結果), 보의 L/h 비(比)에 관계없이 보의 정적해석(靜的解析)(Static analysis)이라 자유진동해석(自由振動解析)(Free vibration analysis)에 있어서 TB4보 요소(要素)는 다른 Timoshenko보 요소(要素)들 보다 월등(越等)히 우수(優秀)한 정확도(正確度)와 수감현상(收歛現象)을 보여 주고 있다.

  • PDF

공간확장자료를 이용한 지역빈도분석 : II. 미계측 유역의 홍수빈도 추론 (Regional frequency analysis using spatial data extension method : II .Flood frequency inference for ungaged watersheds)

  • 김남원;이정은;이정우;정용
    • 한국수자원학회논문집
    • /
    • 제49권5호
    • /
    • pp.451-458
    • /
    • 2016
  • 본 연구에서는 미계측유역에서의 빈도홍수량을 추정하기 위해 지역홍수빈도분석의 표준방법인 지수홍수법을 이용하였다. 이를 위해 충주댐 상류유역을 대상으로 공간확장한 22개 지점의 연최대홍수량 자료을 활용하였으며, 구축된 다지점의 자료계열을 이용하여 지수홍수법의 주요인자인 평균홍수량의 지역화 과정를 수행하였다. 지역화를 위한 방법으로는 홍수량과 유역면적과의 관계가 멱함수 법칙(power law)를 따른다는 이론에 근거한 경험관계를 유도하였다. 충주댐 상류유역 전체를 하나의 그룹, 3개의 중권역을 각각 하나의 그룹으로 구분하여 분석하였다. 도출된 결과에 따르면 평균홍수량과 유역면적과의 관계를 멱함수 법칙으로 설명할 수 있었다. 또한, 미계측 지점의 홍수량 추정시에는 가까운 계측지점 즉, 직상하류 유역의 비유량의 관계를 사용하는 것이 타당함을 증명하였다. 따라서, 미계측 유역을 위한 지역빈도해석은 지역홍수빈도해석 절차 자체도 중요하지만, 지역의 세밀한 구분과 그에 따른 지역화 경험관계 개발과정도 중요한 절차임을 확인할 수 있었다.

Memory Organization for a Fuzzy Controller.

  • Jee, K.D.S.;Poluzzi, R.;Russo, B.
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 1993년도 Fifth International Fuzzy Systems Association World Congress 93
    • /
    • pp.1041-1043
    • /
    • 1993
  • Fuzzy logic based Control Theory has gained much interest in the industrial world, thanks to its ability to formalize and solve in a very natural way many problems that are very difficult to quantify at an analytical level. This paper shows a solution for treating membership function inside hardware circuits. The proposed hardware structure optimizes the memoried size by using particular form of the vectorial representation. The process of memorizing fuzzy sets, i.e. their membership function, has always been one of the more problematic issues for the hardware implementation, due to the quite large memory space that is needed. To simplify such an implementation, it is commonly [1,2,8,9,10,11] used to limit the membership functions either to those having triangular or trapezoidal shape, or pre-definite shape. These kinds of functions are able to cover a large spectrum of applications with a limited usage of memory, since they can be memorized by specifying very few parameters ( ight, base, critical points, etc.). This however results in a loss of computational power due to computation on the medium points. A solution to this problem is obtained by discretizing the universe of discourse U, i.e. by fixing a finite number of points and memorizing the value of the membership functions on such points [3,10,14,15]. Such a solution provides a satisfying computational speed, a very high precision of definitions and gives the users the opportunity to choose membership functions of any shape. However, a significant memory waste can as well be registered. It is indeed possible that for each of the given fuzzy sets many elements of the universe of discourse have a membership value equal to zero. It has also been noticed that almost in all cases common points among fuzzy sets, i.e. points with non null membership values are very few. More specifically, in many applications, for each element u of U, there exists at most three fuzzy sets for which the membership value is ot null [3,5,6,7,12,13]. Our proposal is based on such hypotheses. Moreover, we use a technique that even though it does not restrict the shapes of membership functions, it reduces strongly the computational time for the membership values and optimizes the function memorization. In figure 1 it is represented a term set whose characteristics are common for fuzzy controllers and to which we will refer in the following. The above term set has a universe of discourse with 128 elements (so to have a good resolution), 8 fuzzy sets that describe the term set, 32 levels of discretization for the membership values. Clearly, the number of bits necessary for the given specifications are 5 for 32 truth levels, 3 for 8 membership functions and 7 for 128 levels of resolution. The memory depth is given by the dimension of the universe of the discourse (128 in our case) and it will be represented by the memory rows. The length of a world of memory is defined by: Length = nem (dm(m)+dm(fm) Where: fm is the maximum number of non null values in every element of the universe of the discourse, dm(m) is the dimension of the values of the membership function m, dm(fm) is the dimension of the word to represent the index of the highest membership function. In our case then Length=24. The memory dimension is therefore 128*24 bits. If we had chosen to memorize all values of the membership functions we would have needed to memorize on each memory row the membership value of each element. Fuzzy sets word dimension is 8*5 bits. Therefore, the dimension of the memory would have been 128*40 bits. Coherently with our hypothesis, in fig. 1 each element of universe of the discourse has a non null membership value on at most three fuzzy sets. Focusing on the elements 32,64,96 of the universe of discourse, they will be memorized as follows: The computation of the rule weights is done by comparing those bits that represent the index of the membership function, with the word of the program memor . The output bus of the Program Memory (μCOD), is given as input a comparator (Combinatory Net). If the index is equal to the bus value then one of the non null weight derives from the rule and it is produced as output, otherwise the output is zero (fig. 2). It is clear, that the memory dimension of the antecedent is in this way reduced since only non null values are memorized. Moreover, the time performance of the system is equivalent to the performance of a system using vectorial memorization of all weights. The dimensioning of the word is influenced by some parameters of the input variable. The most important parameter is the maximum number membership functions (nfm) having a non null value in each element of the universe of discourse. From our study in the field of fuzzy system, we see that typically nfm 3 and there are at most 16 membership function. At any rate, such a value can be increased up to the physical dimensional limit of the antecedent memory. A less important role n the optimization process of the word dimension is played by the number of membership functions defined for each linguistic term. The table below shows the request word dimension as a function of such parameters and compares our proposed method with the method of vectorial memorization[10]. Summing up, the characteristics of our method are: Users are not restricted to membership functions with specific shapes. The number of the fuzzy sets and the resolution of the vertical axis have a very small influence in increasing memory space. Weight computations are done by combinatorial network and therefore the time performance of the system is equivalent to the one of the vectorial method. The number of non null membership values on any element of the universe of discourse is limited. Such a constraint is usually non very restrictive since many controllers obtain a good precision with only three non null weights. The method here briefly described has been adopted by our group in the design of an optimized version of the coprocessor described in [10].

  • PDF