• 제목/요약/키워드: entropy measure

검색결과 203건 처리시간 0.028초

K-평균 군집화의 재현성 평가 및 응용 (Reproducibility Assessment of K-Means Clustering and Applications)

  • 허명회;이용구
    • 응용통계연구
    • /
    • 제17권1호
    • /
    • pp.135-144
    • /
    • 2004
  • K-평균 군집화(K-means clustering)는 고객 세분화(customer segmentation) 등 데이터 마이닝에서 중요한 한 몫을 하는 비지도 학습방법 (unsupervised learning method)이다. K-평균 군집화가 재현성(reproducibility)이 있는가를 보기 위하여, 다수의 기존 연구에서는 관측 자료를 2개 셋으로 나눈 자료 분할(data partitioning) 방법이 활용되고 있다. 본 교신에서 우리는 이보다 개념적으로 명확한 새로운 자료 분할 방법을 제안한다. 이 방법은 관측 자료를 3개 셋으로 나누어 그 중 2개 자료 셋을 독립적인 군집화 규칙을 생성하는 데 사용하고 나머지 1개의 자료 셋을 규칙간 일치성을 테스트하는데 사용한다. 또한 2개의 군집화 규칙간 일치성 평가를 위한 지표로서 엔트로피 기준의 환용 방법을 제시한다.

Dynamic deflection monitoring of high-speed railway bridges with the optimal inclinometer sensor placement

  • Li, Shunlong;Wang, Xin;Liu, Hongzhan;Zhuo, Yi;Su, Wei;Di, Hao
    • Smart Structures and Systems
    • /
    • 제26권5호
    • /
    • pp.591-603
    • /
    • 2020
  • Dynamic deflection monitoring is an essential and critical part of structural health monitoring for high-speed railway bridges. Two critical problems need to be addressed when using inclinometer sensors for such applications. These include constructing a general representation model of inclination-deflection and addressing the ill-posed inverse problem to obtain the accurate dynamic deflection. This paper provides a dynamic deflection monitoring method with the placement of optimal inclinometer sensors for high-speed railway bridges. The deflection shapes are reconstructed using the inclination-deflection transformation model based on the differential relationship between the inclination and displacement mode shape matrix. The proposed optimal sensor configuration can be used to select inclination-deflection transformation models that meet the required accuracy and stability from all possible sensor locations. In this study, the condition number and information entropy are employed to measure the ill-condition of the selected mode shape matrix and evaluate the prediction performance of different sensor configurations. The particle swarm optimization algorithm, genetic algorithm, and artificial fish swarm algorithm are used to optimize the sensor position placement. Numerical simulation and experimental validation results of a 5-span high-speed railway bridge show that the reconstructed deflection shapes agree well with those of the real bridge.

확장된 평균 엔트로피에 기반한 명도 영상 필기 데이터의 품질 자동 평가 (Automatic Quality Measurement of Gray-scale Handwriting Based on Extended Average Entropy)

  • 박정선
    • 인지과학
    • /
    • 제10권3호
    • /
    • pp.77-83
    • /
    • 1999
  • 1990년대 OCR에 대한 관심이 고조되면서, 다양한 필기 데이터베이스가 전 세계적으로 구축되었다. 그러나, 현재 연구분야에서 직면한 문제는 필기 품질을 포함하여 각기 다양한 방법으로 구축된 데이터베이스 내에서 필기 문자의 품질을 평가하는 것이다. 본 논문은 다양한 필기 데이터베이스를 비교하고, 문자 인식기의 성능을 객관적으로 평가하는데 사용할 수 있는 필기 품질을 측정하는 방법을 제안한다. 여기서 사용된 핵심 아이디어는 각각의 문자 샘플을 필기 품질에 따라 여러 개의 그룹으로 나누는 것이다. 제안된 방법의 성능을 평가하기 위하여, 대용량 필기 한글 데이터베이스인 KU-1 데이터베이스에 대한 실험을 수행한 결과, 제안된 방법이 필기 데이터베이스를 비교하고, 인식기의 성능을 객관적으로 평가하는데 유용하게 사용할 수 있는 가능성을 확인하였다.

  • PDF

데이터 마이닝을 위한 제어규칙의 생성 (The Generation of Control Rules for Data Mining)

  • 박인규
    • 디지털융복합연구
    • /
    • 제11권11호
    • /
    • pp.343-349
    • /
    • 2013
  • 러프집합에서는 동치류와 근사공간의 개념을 이용하여 데이터 마이닝 분야에서 중복되는 정보로부터 특징점을 효율적으로 추출하여 최적화된 제어규칙을 유도할 수 있다. 이러한 추출과정에서 가장 중요하게 고려되어져야 할 부분은 많은 속성에 대한 감축이다. 본 논문에서는 속성간의 관계에서 러프엔트로피를 이용하여 가장 신뢰도가 우수한 속성을 구할 수 있는 정보이론적인 척도를 제시한다. 제안된 방법은 러프엔트로피를 기반으로 불필요한 속성을 제거함으로써 유용한 리덕트를 생성하고 이들에 대한 코어를 형성한다. 결과적으로 원시정보의 내용은 변하지 않으면서 지식감축을 통하여 간소화된 제어규칙을 구축할 수 있음을 보인다.

영상 향상을 위한 자동 임계점 선택 및 대비 강화 기법 (Automatic Threshold Selection and Contrast Intensification Technique for Image Enhancement)

  • 이금분;조범준
    • 한국멀티미디어학회논문지
    • /
    • 제11권4호
    • /
    • pp.462-470
    • /
    • 2008
  • 본 논문은 저대비에 의한 영상 정보의 불확실성이 화소가 가지고 있는 명암도의 모호성과 애매성에 근거한다는 점에서 퍼지 변환 함수를 적용하여 영상 향상을 기하고자 한다. 명암도 분포가 한쪽으로 치우친 저대비 영상의 문제를 해결하고자 k-means 알고리즘을 사용하여 물체와 배경을 구분할 수 있는 자동 임계점을 찾고 이를 기준으로 영상의 밝은 부분과 어두운 부분의 대비 향상을 가져올 수 있도록 퍼지 변환 함수를 적용한다. 퍼지 변환 함수는 영상 향상을 위해 3단계-입력 영상을 퍼지 영역으로 변환시키는 퍼지화 단계와 대비를 향상시키는 대비 강화 단계 그리고 퍼지 영역을 다시 영상 영역으로 변환시키는 비퍼지화 단계로 제시된다. 향상된 영상의 성능을 평가하고자 퍼지성 지수와 엔트로피 지수를 제시하여 이를 히스토그램 균등화 기법과 비교하고 실험결과로 성능의 우수함을 보여준다.

  • PDF

Characterization of New Two Parametric Generalized Useful Information Measure

  • Bhat, Ashiq Hussain;Baig, M. A. K.
    • Journal of Information Science Theory and Practice
    • /
    • 제4권4호
    • /
    • pp.64-74
    • /
    • 2016
  • In this paper we define a two parametric new generalized useful average code-word length $L_{\alpha}^{\beta}$(P;U) and its relationship with two parametric new generalized useful information measure $H_{\alpha}^{\beta}$(P;U) has been discussed. The lower and upper bound of $L_{\alpha}^{\beta}$(P;U), in terms of $H_{\alpha}^{\beta}$(P;U) are derived for a discrete noiseless channel. The measures defined in this communication are not only new but some well known measures are the particular cases of our proposed measures that already exist in the literature of useful information theory. The noiseless coding theorems for discrete channel proved in this paper are verified by considering Huffman and Shannon-Fano coding schemes on taking empirical data. Also we study the monotonic behavior of $H_{\alpha}^{\beta}$(P;U) with respect to parameters ${\alpha}$ and ${\beta}$. The important properties of $H_{{\alpha}}^{{\beta}}$(P;U) have also been studied.

A Hill-Sliding Strategy for Initialization of Gaussian Clusters in the Multidimensional Space

  • Park, J.Kyoungyoon;Chen, Yung-H.;Simons, Daryl-B.;Miller, Lee-D.
    • 대한원격탐사학회지
    • /
    • 제1권1호
    • /
    • pp.5-27
    • /
    • 1985
  • A hill-sliding technique was devised to extract Gaussian clusters from the multivariate probability density estimates of sample data for the first step of iterative unsupervised classification. The underlying assumption in this approach was that each cluster possessed a unimodal normal distribution. The key idea was that a clustering function proposed could distinguish elements of a cluster under formation from the rest in the feature space. Initial clusters were extracted one by one according to the hill-sliding tactics. A dimensionless cluster compactness parameter was proposed as a universal measure of cluster goodness and used satisfactorily in test runs with Landsat multispectral scanner (MSS) data. The normalized divergence, defined by the cluster divergence divided by the entropy of the entire sample data, was utilized as a general separability measure between clusters. An overall clustering objective function was set forth in terms of cluster covariance matrices, from which the cluster compactness measure could be deduced. Minimal improvement of initial data partitioning was evaluated by this objective function in eliminating scattered sparse data points. The hill-sliding clustering technique developed herein has the potential applicability to decomposition of any multivariate mixture distribution into a number of unimodal distributions when an appropriate diatribution function to the data set is employed.

A Novel Image Segmentation Method Based on Improved Intuitionistic Fuzzy C-Means Clustering Algorithm

  • Kong, Jun;Hou, Jian;Jiang, Min;Sun, Jinhua
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권6호
    • /
    • pp.3121-3143
    • /
    • 2019
  • Segmentation plays an important role in the field of image processing and computer vision. Intuitionistic fuzzy C-means (IFCM) clustering algorithm emerged as an effective technique for image segmentation in recent years. However, standard fuzzy C-means (FCM) and IFCM algorithms are sensitive to noise and initial cluster centers, and they ignore the spatial relationship of pixels. In view of these shortcomings, an improved algorithm based on IFCM is proposed in this paper. Firstly, we propose a modified non-membership function to generate intuitionistic fuzzy set and a method of determining initial clustering centers based on grayscale features, they highlight the effect of uncertainty in intuitionistic fuzzy set and improve the robustness to noise. Secondly, an improved nonlinear kernel function is proposed to map data into kernel space to measure the distance between data and the cluster centers more accurately. Thirdly, the local spatial-gray information measure is introduced, which considers membership degree, gray features and spatial position information at the same time. Finally, we propose a new measure of intuitionistic fuzzy entropy, it takes into account fuzziness and intuition of intuitionistic fuzzy set. The experimental results show that compared with other IFCM based algorithms, the proposed algorithm has better segmentation and clustering performance.

엔트로피 개념을 이용한 개수로에서 등류 및 부등류 흐름의 전단응력 산정 (The Estimation of Shear Stress in Uniform and Nonuniform Flow by the Entropy Concept)

  • 추연문;추태호;양다운;김중훈
    • 한국습지학회지
    • /
    • 제19권2호
    • /
    • pp.202-210
    • /
    • 2017
  • 전단응력은 여러 분야에서 사용하는 매우 중요한 역학 인자 중 하나이며, 인공수로의 설계를 위해서 중요하다. 현재 전단응력은 과거에 정해진 계산법을 사용하고 있지만, 사용되는 식에서 바닥전단응력과 에너지경사와 같이 실제로 측정하거나 계산하기 어려운 요소들이 존재한다. 특히, 에너지경사는 산정하기 매우 어려운 인자이며, 전단응력분포를 구하기위해서는 에너지경사가 있어야만 산정할 수 있지만, 경계층의 유속기울기와 유속을 측정하는 것은 현실적으로 어려운 부분이다. 또한 전단응력분포 중 바닥전단응력은 직접 측정하기 매우 어렵고, 유속에 비해 연구가 다소 더딘 실정이다. 전단응력분포를 정확하게 산정할 수 있다면, 바닥전단응력과 에너지경사를 손쉽게 산정할 수 있다. 본 연구에서는 에너지경사를 반영하지 않고 엔트로피 M을 이용하여 평균유속과 전단응력분포를 간단히 산정하는 연구를 진행하였고, 적용한 식의 효용성을 증명하기 위해 기존의 실험실 실측 자료를 사용하였다. 이는 그래프를 통해 응력분포를 나타내어 비교분석을 하였으며, 등류와 부등류에서 각각 결정계수는 0.930-0.998까지로 거의 일치하였다.

DEA결합모형을 활용한 아세안(ASEAN)지역 항만의 효율성 분석 (Efficiency Analysis of ASEAN Ports Using DEA & Shannon's Entropy)

  • 박선율;김상열;박호
    • 한국항만경제학회지
    • /
    • 제33권4호
    • /
    • pp.1-16
    • /
    • 2017
  • 아세안(ASEAN) 국가 총 컨테이너 처리량은 경제발전에 따라 계속해서 증가할 것으로 전망된다. 하지만, 증가하는 물동량 대비 아세안(ASEAN) 국가 대부분의 항만인프라는 아직 미비한 수준이다. 세계은행 보고서에 따르면 싱가포르와 말레이시아를 제외한 항만들은 항만인프라 순위에서 낮은 순위를 기록하고 있다. 아세안(ASEAN) 항만개발사업 참여는 아세안(ASEAN) 국가의 항만인프라를 개선하여 물류효율성을 증가시켜 우리나라와의 무역 활성화로 이어질 수 있다. 또한 우리나라 정부와 기업이 항만개발사업에 진출하여 우리나라 항만 관련 산업을 활성화시킬 수 있다. 항만효율성 측정은 이러한 항만개발 및 계획수립에 기초자료로 활용하기에 본 연구에서는 아세안(ASEAN) 항만 효율성 분석을 수행하였다. 본 연구에서는 여러 모형 중 가장 효율적인 DEA모형을 알 수 없다는 한계점을 극복하고자, DEA와 Shannon's Entropy를 결합한 모형을 활용하여 아세안(ASEAN) 항만의 효율성을 측정하였다. CCR, 투입기준 BCC, 산출기준 BCC, SBM 모형 등 네 개의 모형의 가중치를 구한 뒤에 가중치를 고려하여 항만별 효율성을 측정하였다. 결과적으로 세계 주요 항만인 싱가포르, 말레이시아 항만의 효율성이 가장 높은 것으로 나타났으며, 물동량 증가율이 가장 높은 베트남의 항만효율성은 상대적으로 낮은 것으로 나타나, 항만개발이 필요한 것으로 나타났다. 태국의 림차방(Leam Chabang), 베트남의 호치민(Ho Chi Minh City), 인도네시아 탄중 프리옥(Tanjung Priok)항만은 물동량 처리실적과 효율성이 역의 관계로 나타나 경쟁력 유지를 위해서는 효율성 개선이 필요 한 것으로 보인다. 캄보디아, 미얀마, 브루나이 등 아직 경제발전이 미숙한 항만은 경제발전을 위해서라도 인프라 확장을 위주로 하는 항만개발이 필요한 것으로 분석되었다.