• 제목/요약/키워드: entropy-based test

검색결과 67건 처리시간 0.02초

최대 엔트로피 기반 문서 분류기의 학습 (Text Categorization Based on the Maximum Entropy Principle)

  • 장정호;장병탁;김영택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.57-59
    • /
    • 1999
  • 본 논문에서는 최대 엔트로피 원리에 기반한 문서 분류기의 학습을 제안한다. 최대 엔트로피 기법은 자연언어 처리에서 언어 모델링(Language Modeling), 품사 태깅 (Part-of-Speech Tagging) 등에 널리 사용되는 방법중의 하나이다. 최대 엔트로피 모델의 효율성을 위해서는 자질 선정이 중요한데, 본 논문에서는 자질 집합의 선택을 위한 기준으로 chi-square test, log-likelihood ratio, information gain, mutual information 등의 방법을 이용하여 실험하고, 전체 후보 자질에 대한 실험 결과와 비교해 보았다. 데이터 집합으로는 Reuters-21578을 사용하였으며, 각 클래스에 대한 이진 분류 실험을 수행하였다.

  • PDF

확장된 평균 엔트로피에 기반한 명도 영상 필기 데이터의 품질 자동 평가 (Automatic Quality Measurement of Gray-scale Handwriting Based on Extended Average Entropy)

  • 박정선
    • 인지과학
    • /
    • 제10권3호
    • /
    • pp.77-83
    • /
    • 1999
  • 1990년대 OCR에 대한 관심이 고조되면서, 다양한 필기 데이터베이스가 전 세계적으로 구축되었다. 그러나, 현재 연구분야에서 직면한 문제는 필기 품질을 포함하여 각기 다양한 방법으로 구축된 데이터베이스 내에서 필기 문자의 품질을 평가하는 것이다. 본 논문은 다양한 필기 데이터베이스를 비교하고, 문자 인식기의 성능을 객관적으로 평가하는데 사용할 수 있는 필기 품질을 측정하는 방법을 제안한다. 여기서 사용된 핵심 아이디어는 각각의 문자 샘플을 필기 품질에 따라 여러 개의 그룹으로 나누는 것이다. 제안된 방법의 성능을 평가하기 위하여, 대용량 필기 한글 데이터베이스인 KU-1 데이터베이스에 대한 실험을 수행한 결과, 제안된 방법이 필기 데이터베이스를 비교하고, 인식기의 성능을 객관적으로 평가하는데 유용하게 사용할 수 있는 가능성을 확인하였다.

  • PDF

철계 비동일분율 고엔트로피 합금의 인장 강도에 미치는 소결 조건 영향 (Effect of Sintering Condition on Tensile Strength of Fe-based Non-equiatomic High Entropy Alloy)

  • 서남혁;전준협;김광훈;박정빈;손승배;이석재
    • 한국분말재료학회지
    • /
    • 제28권3호
    • /
    • pp.221-226
    • /
    • 2021
  • We fabricate the non-equiatomic high-entropy alloy (NE-HEA) Fe49.5Mn30Co10Cr10C0.5 (at.%) using spark plasma sintering under various sintering conditions. Each elemental pure powder is milled by high-energy ball milling to prepare NE-HEA powder. The microstructure and mechanical properties of the sintered samples are investigated using various methods. We use the X-ray diffraction (XRD) method to investigate the microstructural characteristics. Quantitative phase analysis is performed by direct comparison of the XRD results. A tensile test is used to compare the mechanical properties of small samples. Next, electron backscatter diffraction analysis is performed to analyze the phase fraction, and the results are compared to those of XRD analysis. By combining different sintering durations and temperature conditions, we attempt to identify suitable spark plasma sintering conditions that yield mechanical properties comparable with previously reported values. The samples sintered at 900 and 1000℃ with no holding time have a tensile strength of over 1000 MPa.

Diversity and Genotypic Structure of ECOR Collection Determined by Repetitive Extragenic Palindromic PCR Genome Fingerprinting

  • HWANG KEUM-OK;JANG HYO-MI;CHO JAE-CHANG
    • Journal of Microbiology and Biotechnology
    • /
    • 제15권3호
    • /
    • pp.672-677
    • /
    • 2005
  • The standard reference collection of strains for E. coli, the ECOR collection, was analyzed by a genome-based typing method. Seventy-one ECOR strains were subjected to repetitive extragenic palindromic PCR genome fingerprinting with BOX primers (BOX-PCR). Using a similarity value of 0.8 or more after cluster analysis of BOX-PCR fingerprinting patterns to define the same genotypes, we identified 28 genotypes in the ECOR collection. Shannon's entropy-based diversity index was 3.07, and the incident-based coverage estimator indicated potentially 420 genotypes among E. coli populations. Chi-square test of goodness-of-fit showed statistically significant association between the genotypes defined by BOX-PCR fingerprinting and the groups previously defined by multi-locus enzyme electrophoresis. This study suggests that the diversification of E. coli strains in natural populations is actively ongoing, and rep-PCR fingerprinting is a convenient and reliable method to type E. coli strains for the purposes ranging from ecology to quarantine.ine.

지수분포의 검정을 위한 쿨백-레이블러 정보함수 (Tests for Exponentiality by Kullback-Leibler Information)

  • 김종태;이우동;강석복
    • 한국산업정보학회논문지
    • /
    • 제5권2호
    • /
    • pp.39-46
    • /
    • 2000
  • 최근 엔트로피 추정에 대하여 개발된 새로운 방법들을 이용함으로서 쿨백-레이블러 정보함수를 사용하여 지수분포에 대한 적합도 검정통계량들을 제시하고 그 검정력들과 기존의 검정 통계량들의 검정력들과 비교 조사하는데 목적이 있다. 또한 제시된 검정통계량들에 대한 점근적 성질들을 소개하고, 기각영역들에 대하여 표를 제시하였다. 제시된 검정통계량들은 기존의 검정통계량들보다 검정력 비교에 있어서 우수한 검정력을 보였다.

  • PDF

H.264용 Context-Based Adaptive Variable Length Coder(CAVLC) 설계 (A design of Context-Based Adaptive Variable Length Coder For H.264)

  • 이홍식;서기범
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 추계종합학술대회
    • /
    • pp.237-240
    • /
    • 2005
  • 본 논문에서는 AMBA 기반으로 사용될 수 있는 H.264용 CAVLC모듈의 새로운 구조와 설계를 하였다. 설계된 모듈은 Annex B.1 의 long-start code방식과 RTP 방식을 지원하며, 한 매크로 블록당 최대 420 cycle내에 동작한다. 제안된 구조를 검증하기위하여 JM 8.5부터 reference C를 개발하였으며, reference C로부터 test vector를 추출하여 개발된 회로를 검증하였다. 제안된 회로는 54MHz clock에서 동작하며, 합성결과 hynix 0.35 um TLM 공정에 14096 gate크기이다.

  • PDF

TAKES: Two-step Approach for Knowledge Extraction in Biomedical Digital Libraries

  • Song, Min
    • Journal of Information Science Theory and Practice
    • /
    • 제2권1호
    • /
    • pp.6-21
    • /
    • 2014
  • This paper proposes a novel knowledge extraction system, TAKES (Two-step Approach for Knowledge Extraction System), which integrates advanced techniques from Information Retrieval (IR), Information Extraction (IE), and Natural Language Processing (NLP). In particular, TAKES adopts a novel keyphrase extraction-based query expansion technique to collect promising documents. It also uses a Conditional Random Field-based machine learning technique to extract important biological entities and relations. TAKES is applied to biological knowledge extraction, particularly retrieving promising documents that contain Protein-Protein Interaction (PPI) and extracting PPI pairs. TAKES consists of two major components: DocSpotter, which is used to query and retrieve promising documents for extraction, and a Conditional Random Field (CRF)-based entity extraction component known as FCRF. The present paper investigated research problems addressing the issues with a knowledge extraction system and conducted a series of experiments to test our hypotheses. The findings from the experiments are as follows: First, the author verified, using three different test collections to measure the performance of our query expansion technique, that DocSpotter is robust and highly accurate when compared to Okapi BM25 and SLIPPER. Second, the author verified that our relation extraction algorithm, FCRF, is highly accurate in terms of F-Measure compared to four other competitive extraction algorithms: Support Vector Machine, Maximum Entropy, Single POS HMM, and Rapier.

피드백 구조를 갖는 Self-Timed Ring 기반의 경량 TRNG (A Self-Timed Ring based Lightweight TRNG with Feedback Structure)

  • 최준영;신경욱
    • 한국정보통신학회논문지
    • /
    • 제24권2호
    • /
    • pp.268-275
    • /
    • 2020
  • 정보보안 응용에 적합한 self-timed 링 (ring) 기반 TRNG (true random number generator)의 경량 하드웨어 설계에 관해 기술한다. TRNG의 하드웨어 복잡도를 줄이기 위해 피드백 구조의 엔트로피 추출기를 제안하였으며, 이를 통해 링 스테이지 수를 최소화 하였다. 본 논문의 FSTR-TRNG는 동작 주파수와 엔트로피 추출 회로를 고려하여 링 스테이지 수가 11의 배수가 되도록 결정되었으며, 링 발진기가 등간격 모드로 진동할 수 있도록 토큰 (token)과 버블(bubble) 개수의 비를 결정하였다. FSTR-TRNG는 FPGA 디바이스에 구현하여 난수 생성 동작을 검증하였다. Spartan-6 FPGA 디바이스에 구현된 FSTR-TRNG로부터 2,000만 비트의 데이터를 추출하여 NIST SP 800-22에 규정된 통계학적 무작위성 테스트를 수행한 결과, 15개의 테스트가 모두 기준을 만족하는 것으로 확인되었다. Spartan-6 FPGA 디바이스로 합성한 FSTR-TRNG는 46 슬라이스로 구현이 되었으며, 180 nm CMOS 표준셀로 합성하는 경우에는 약 2,500 등가 게이트로 구현되었다.

산업제어시스템 취약성 분석을 위한 무작위성 기반 퍼징 테스트 케이스 평가 기법 (Randomness Based Fuzzing Test Case Evaluation for Vulnerability Analysis of Industrial Control System)

  • 김성진;손태식
    • 정보보호학회논문지
    • /
    • 제28권1호
    • /
    • pp.179-186
    • /
    • 2018
  • 사물인터넷 시대의 도래로 인터넷에 연결되는 매체가 급격히 증가하고 있다. 사물인터넷은 삶의 편리성을 향상 시켰지만, 사생활 침해와 같은 보안 이슈를 야기하였다. 따라서 사물인터넷 시대의 시작인 현시점에서 가장 중점적으로 논의되어야 하는 부분은 사이버 보안이다. 특히 사물인터넷 제품 시장이 급격히 형성되고, 다양한 프로토콜이 혼재되어 사용됨으로써 생기는 보안 위협에 대응하기 위해 프로토콜에 빠르게 적용 할 수 있는 취약성 분석 방법이 필요한 상황이다. 본고에서는 분산과 엔트로피를 이용하는 새로운 무작위성 기반의 테스트 케이스 평가 방법론을 제안하여 사물인터넷 보안에 기여하고자 한다. 본고에서 제안하는 테스트 케이스 평가 방법은 기존 기법과는 달리 테스트 셋 크기에 상관없이 빠른 속도로 테스트 케이스의 평가를 수행할 수 있다.

Multiple Path Based Vehicle Routing in Dynamic and Stochastic Transportation Networks

  • Park, Dong-joo
    • 대한교통학회:학술대회논문집
    • /
    • 대한교통학회 2000년도 제37회 학술발표회논문집
    • /
    • pp.25-47
    • /
    • 2000
  • In route guidance systems fastest-path routing has typically been adopted because of its simplicity. However, empirical studies on route choice behavior have shown that drivers use numerous criteria in choosing a route. The objective of this study is to develop computationally efficient algorithms for identifying a manageable subset of the nondominated (i.e. Pareto optimal) paths for real-time vehicle routing which reflect the drivers' preferences and route choice behaviors. We propose two pruning algorithms that reduce the search area based on a context-dependent linear utility function and thus reduce the computation time. The basic notion of the proposed approach is that ⅰ) enumerating all nondominated paths is computationally too expensive, ⅱ) obtaining a stable mathematical representation of the drivers' utility function is theoretically difficult and impractical, and ⅲ) obtaining optimal path given a nonlinear utility function is a NP-hard problem. Consequently, a heuristic two-stage strategy which identifies multiple routes and then select the near-optimal path may be effective and practical. As the first stage, we utilize the relaxation based pruning technique based on an entropy model to recognize and discard most of the nondominated paths that do not reflect the drivers' preference and/or the context-dependency of the preference. In addition, to make sure that paths identified are dissimilar in terms of links used, the number of shared links between routes is limited. We test the proposed algorithms in a large real-life traffic network and show that the algorithms reduce CPU time significantly compared with conventional multi-criteria shortest path algorithms while the attributes of the routes identified reflect drivers' preferences and generic route choice behaviors well.

  • PDF