• 제목/요약/키워드: entropy-based test

검색결과 67건 처리시간 0.027초

A Modified Error Function to Improve the Error Back-Propagation Algorithm for Multi-Layer Perceptrons

  • Oh, Sang-Hoon;Lee, Young-Jik
    • ETRI Journal
    • /
    • 제17권1호
    • /
    • pp.11-22
    • /
    • 1995
  • This paper proposes a modified error function to improve the error back-propagation (EBP) algorithm for multi-Layer perceptrons (MLPs) which suffers from slow learning speed. It can also suppress over-specialization for training patterns that occurs in an algorithm based on a cross-entropy cost function which markedly reduces learning time. In the similar way as the cross-entropy function, our new function accelerates the learning speed of the EBP algorithm by allowing the output node of the MLP to generate a strong error signal when the output node is far from the desired value. Moreover, it prevents the overspecialization of learning for training patterns by letting the output node, whose value is close to the desired value, generate a weak error signal. In a simulation study to classify handwritten digits in the CEDAR [1] database, the proposed method attained 100% correct classification for the training patterns after only 50 sweeps of learning, while the original EBP attained only 98.8% after 500 sweeps. Also, our method shows mean-squared error of 0.627 for the test patterns, which is superior to the error 0.667 in the cross-entropy method. These results demonstrate that our new method excels others in learning speed as well as in generalization.

  • PDF

사후확률에 기반한 근사 규칙의 생성 (Creation of Approximate Rules based on Posterior Probability)

  • 박인규;최규석
    • 한국인터넷방송통신학회논문지
    • /
    • 제15권5호
    • /
    • pp.69-74
    • /
    • 2015
  • 본 논문에서는 데이터베이스의 정보시스템을 구성하는 속성을 감축하여 빠른 검색을 보장하는 제어규칙의 생성에 관한 연구이다. 일반적으로 정보시스템에는 불필요한 많은 속성들이 존재하고 있다. 이때 정보시스템의 객체들이 비일관적일 경우에는 응답의 정확성을 기대하기 어렵게 된다. 그러므로 본 논문에서는 러프엔트로피의 개념과 베이지언 사후확률을 적용하여 불필요한 속성을 제거하여 정보시스템을 간결화 하는데 주안점을 두었다. 제안된 알고리즘에서는 러프이론에 기반한 최적의 리덕트를 생성하는 과정에서 사후확률을 적용하여 결정속성에 대한 조건속성의 함의를 러프엔트로피의 척도로 비교하여 영향력이 약한 속성을 제거하여 제어규칙을 간결하게 표현할 수 있다. 제안된 알고리즘을 신입사원의 채용에 적용하여 지식감축의 효용성을 보인다.

엔트로피 지수를 이용한 기계학습 기반의 배터리의 건강 상태 예측 알고리즘 (Machine Learning Based State of Health Prediction Algorithm for Batteries Using Entropy Index)

  • 김상진;임현근;장병훈;우성민
    • 전기전자학회논문지
    • /
    • 제26권4호
    • /
    • pp.531-536
    • /
    • 2022
  • 배터리를 효율적으로 관리하기 위해서는 배터리의 건강 상태와 잔여 수명을 정확하게 추정하고 관리하는 것이 중요하다. 배터리는 같은 종류여도 설비용량 및 전압 등의 특성이 다르며 학습용 모델을 위한 배터리와 모델을 통한 예측을 위한 배터리가 서로 다를 경우에는 정확도 측정에 한계가 있다. 본 논문에서는 전압의 분포와 방전 시간을 이용한 엔트로피 지수를 일반화하고 4개의 배터리를 각각 1개씩 교차적으로 훈련 집합과 테스트 집합으로 정의하여 기계학습의 선형회귀 분석을 통하여 배터리의 건강 상태를 예측하는 방법을 제안하였다. 제안된 방법은 평균 절대값 퍼센트 오차를 이용하여 95% 이상의 높은 정확도를 나타내었다.

양자 특성 기반 칩을 활용한 엔트로피 소스 모델 수립 방법에 관한 연구 (A Study on the Establishment of Entropy Source Model Using Quantum Characteristic-Based Chips)

  • 김대형;김주빈;지동화
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 추계학술대회
    • /
    • pp.140-142
    • /
    • 2021
  • 5세대 이후의 이동통신 기술은 초고속, 초연결, 초저지연 등을 요구하고 있다. 이 중, 안전한 초연결의 기술적 요구사항을 만족하기 위해서는 IoT 서비스의 말단에 해당하는 저사양 IoT 기기들도 고사양 서버와 동일한 수준의 보안 기능을 제공할 수 있어야 한다. 이러한 보안 기능을 수행하기 위하여 암호 알고리즘에서 필요한 정도의 안전성을 가진 암호키들이 요구되고, 암호키는 보통 암호학적 난수 발생기로부터 생성된다. 이때 난수 생성을 위해서는 좋은 잡음원들이 필요한데, 저사양 기기 환경 특성상 충분한 잡음원을 확보하기 어렵기 때문에 TRNG와 같은 하드웨어 난수 발생기를 사용한다. 이 논문에서는 방사성 동위원소의 붕괴를 예측할 수 없다는 양자의 특성을 기반으로 한 칩을 사용하였으며, 이 칩이 출력하는 신호를 기반으로 이진 비트열 형태의 엔트로피 소스를 얻는 여러 방법(TRNG)을 제시하였다. 또한, 각각의 TRNG에서 출력된 값의 엔트로피에 대해 NIST SP 800-90B 테스트를 이용하여 각 방법에 대한 엔트로피 양을 비교하였다.

  • PDF

Mutual Information and Redundancy for Categorical Data

  • Hong, Chong-Sun;Kim, Beom-Jun
    • Communications for Statistical Applications and Methods
    • /
    • 제13권2호
    • /
    • pp.297-307
    • /
    • 2006
  • Most methods for describing the relationship among random variables require specific probability distributions and some assumptions of random variables. The mutual information based on the entropy to measure the dependency among random variables does not need any specific assumptions. And the redundancy which is a analogous version of the mutual information was also proposed. In this paper, the redundancy and mutual information are explored to multi-dimensional categorical data. It is found that the redundancy for categorical data could be expressed as the function of the generalized likelihood ratio statistic under several kinds of independent log-linear models, so that the redundancy could also be used to analyze contingency tables. Whereas the generalized likelihood ratio statistic to test the goodness-of-fit of the log-linear models is sensitive to the sample size, the redundancy for categorical data does not depend on sample size but its cell probabilities itself.

Optimization-based Image Watermarking Algorithm Using a Maximum-Likelihood Decoding Scheme in the Complex Wavelet Domain

  • Liu, Jinhua;Rao, Yunbo
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권1호
    • /
    • pp.452-472
    • /
    • 2019
  • Most existing wavelet-based multiplicative watermarking methods are affected by geometric attacks to a certain extent. A serious limitation of wavelet-based multiplicative watermarking is its sensitivity to rotation, scaling, and translation. In this study, we propose an image watermarking method by using dual-tree complex wavelet transform with a multi-objective optimization approach. We embed the watermark information into an image region with a high entropy value via a multiplicative strategy. The major contribution of this work is that the trade-off between imperceptibility and robustness is simply solved by using the multi-objective optimization approach, which applies the watermark error probability and an image quality metric to establish a multi-objective optimization function. In this manner, the optimal embedding factor obtained by solving the multi-objective function effectively controls watermark strength. For watermark decoding, we adopt a maximum likelihood decision criterion. Finally, we evaluate the performance of the proposed method by conducting simulations on benchmark test images. Experiment results demonstrate the imperceptibility of the proposed method and its robustness against various attacks, including additive white Gaussian noise, JPEG compression, scaling, rotation, and combined attacks.

Grouting effects evaluation of water-rich faults and its engineering application in Qingdao Jiaozhou Bay Subsea Tunnel, China

  • Zhang, Jian;Li, Shucai;Li, Liping;Zhang, Qianqing;Xu, Zhenhao;Wu, Jing;He, Peng
    • Geomechanics and Engineering
    • /
    • 제12권1호
    • /
    • pp.35-52
    • /
    • 2017
  • In order to evaluate the grouting effects of water-rich fault in tunnels systematically, a feasible and scientific method is introduced based on the extension theory. First, eight main influencing factors are chosen as evaluation indexes by analyzing the changes of permeability, mechanical properties and deformation of surrounding rocks. The model of evaluating grouting effects based on the extension theory is established following this. According to four quality grades of grouting effects, normalization of evaluation indexes is carried out, aiming to meet the requirement of extension theory on data format. The index weight is allocated by adopting the entropy method. Finally, the model is applied to the grouting effects evaluation in water-rich fault F4-4 of Qingdao Jiaozhou Bay Subsea Tunnel, China. The evaluation results are in good agreement with the test results on the site, which shows that the evaluation model is feasible in this field, providing a powerful tool for systematically evaluating the grouting effects of water-rich fault in tunnels.

러프집합을 통한 취업의사결정 분석시스템 (Decision Analysis System for Job Guidance using Rough Set)

  • 이희태;박인규
    • 디지털융복합연구
    • /
    • 제11권10호
    • /
    • pp.387-394
    • /
    • 2013
  • 데이터 마이닝은 예측이나 분석을 위해서 많은 양의 데이터에 존재하는 여러 가지의 관계를 추출하는 과정이라고 할 수 있다. 그러한 데이터에는 매우 많은 변수로 인한 차원의 증가로 인하여 계산상의 어려움이 수반되어지고 변수의 중복성과 중요도에 있어서 다양한 통계적 관계가 존재한다. 따라서 동일하거나 유사한 데이터를 같은 그룹으로 형성하는 클러스터 해석은 데이터 마이닝에서 필수적인 요소이다. 본 연구는 범주형 데이터의 분류에서 발생하는 불확실성의 처리를 위해 러프집합을 이용하여 정보 엔트로피를 이용한 새로운 척도를 정의하고 연구 대상에 대한 유사행동을 분석하는 시스템 구현에 그 의의가 있다. 데이터는 평택공업고등학교에서 채집되었고 이를 토대로 제안된 방법이 학생들의 유사행동에 대한 보다 정확한 결과를 보임을 알 수 있었다. 또한 속성의 개수가 10개 이상인 경우에 기본 방법과의 차이를 보이며 취업의사결정에서 학생들의 의식을 기존 방법보다 효과적으로 반영하였다.

스팸성 자질과 URL 자질의 공동 학습을 이용한 최대 엔트로피 기반 스팸메일 필터 시스템 (A Spam Filter System Based on Maximum Entropy Model Using Co-training with Spamminess Features and URL Features)

  • 공미경;이경순
    • 정보처리학회논문지B
    • /
    • 제15B권1호
    • /
    • pp.61-68
    • /
    • 2008
  • 본 논문에서는 스팸메일에 나타나는 스팸성 자질과 URL 자질의 공동 학습을 이용한 최대엔트로피모델 기반 스팸 필터 시스템을 제안한다. 스팸성 자질은 스패머들이 스팸메일에 인위적으로 넣는 강조 패턴이나 필터 시스템을 통과하기 위해 비정상적으로 변형시킨 단어들을 말한다. 스팸성 자질 외에 반복적으로 나타나는 URL과 비정상적인 URL도 자질로 사용하였다. 메일에 나타난 정상적인 URL과 필터 시스템을 피하기 위해 변형된 비정상적인 URL들이 스팸 메일을 걸러내는데 도움을 줄 수 있기 때문이다. 또한 스팸성 자질과 URL자질을 이용한 공동 학습을 하였다. 공동 학습은 학습 과정에서 두 자질을 독립적으로 이용한 비지도 학습 방법으로 정답을 모르는 문서를 이용할 수 있다는 장점을 갖는다. 실험을 통해 스팸성 자질과 URL을 이용함으로써 스팸 필터 시스템의 성능을 향상시킬 수 있음을 확인하였으며 두 자질 집합을 이용한 공동 학습이 필요한 학습 문서의 수를 감소시키면서, 정확도는 일괄 학습 정확도에 근접한다는 것을 확인하였다.

쿨백-레이블러 정보함수에 기초한 와이블분포와 극단값 분포에 대한 적합도 검정 (A Test for Weibull Distribution and Extreme Value Distribution Based on Kullback-Leibler Information)

  • 김종태;이우동
    • 응용통계연구
    • /
    • 제11권2호
    • /
    • pp.351-362
    • /
    • 1998
  • 공학의 응용분야인 신뢰수명론에서 와이블분포는 매우 중요한 역할을 해왔다. 그러나 와이블분포는 분포자체가 가지고 있는 형상모수의 영향으로 인하여 적합도 청정에 있어서 어려움의 대상이 되어 왔다. 이 논문은 쿨백-레이블러 정보 (Kullback-Leibler Information)을 이용한, 와이블 분포의 모수들에 영향을 받지 않은 검정 통계량을 제시함으로 위의 문제점을 해결하고, 제시된 검정 통계량에 대한 점근적 성질들과 결정력을 분석하였다. 제시된 검정 통계량은 기존의 결정 통계량들보다 검정력 비교에 있어서 더 우수한 검정력들을 보였고, 또한 실제 자료에 의한 적합도 검정의 예제를 보였다.

  • PDF