• 제목/요약/키워드: 최소 표본수

검색결과 121건 처리시간 0.029초

NIST SP 800-90B의 최소 엔트로피 추정 알고리즘에 대한 고속 구현 및 효율적인 메모리 사용 기법 (High-Speed Implementation and Efficient Memory Usage of Min-Entropy Estimation Algorithms in NIST SP 800-90B)

  • 김원태;염용진;강주성
    • 정보보호학회논문지
    • /
    • 제28권1호
    • /
    • pp.25-39
    • /
    • 2018
  • 최근 NIST에서는 암호학적 난수발생기의 핵심 요소인 엔트로피 소스의 안전성을 평가하기 위한 방법을 다루고 있는 SP 800-90B 문서의 두 번째 수정안과 이를 Python으로 구현한 코드를 제공하였다. SP 800-90B에서의 엔트로피 소스에 대한 안전성 평가는 엔트로피 소스의 출력 표본 수열로부터 도출한 여러 가지 추정량(estimator)에 기반 하여 최소 엔트로피를 추정하는 과정이다. 최소 엔트로피 추정 과정은 IID 트랙과 non-IID 트랙으로 대별되어 진행된다. IID 트랙의 경우 MCV 추정량만을 사용하여 속도 측면에서 무리가 없다. 반면 non-IID 트랙에서는 MCV를 포함한 총 10 가지의 추정량을 적용해 최소 엔트로피를 추정하게 된다. NIST의 코드에서 non-IID 트랙의 1 회 구동 시간은 약 20 분이 소요되고, 사용되는 메모리는 5.5 GB를 넘긴다. 이는 다양한 잡음원으로 반복적인 평가를 수행해야 하는 평가 기관 또는 여러 환경에서 실험을 수행해야 하는 개발자나 연구자 입장에서는 NIST에서 제공한 Python 코드를 이용하는 것이 불편할 수 있으며, 환경에 따라 실행이 불가할 수도 있다. 본 논문에서는 SP 800-90B의 최소 엔트로피 추정 방법에 대한 고속 구현과 효율적인 메모리 사용 기법을 제시한다. 주요 연구 결과로 MultiMCW 추정 방법에 C++ 코드의 장점을 적용한 고속화 방법, MultiMMC 추정 방법의 데이터 저장 방식을 재구성하여 메모리 사용량을 현저하게 감소시킴과 동시에 고속화한 방법, LZ78Y 추정 방법에 데이터 저장 방식의 재구성을 통한 고속화 기법 등을 제안한다. 우리의 개선된 방법이 종합적으로 적용된 C++ 코드는 NIST에서 제공한 기존의 Python 코드와 비교할 때, 속도는 14 배 빠르고 메모리 사용량은 1/13로 감소하는 효과를 보인다.

경기도 지방하천에서의 보, 낙차공 및 교량 시설물의 실태 및 개선 방안 제시 (Improvement plan and factual survey for weirs, drop structures and bridges in medium scale streams of Kyonggi province)

  • 노희성;안태진
    • 한국습지학회지
    • /
    • 제22권1호
    • /
    • pp.31-38
    • /
    • 2020
  • 보는 하천수량을 확보하고 낙차공은 하상안정을 위한, 그리고 교량은 차량 등의 이동을 위한 하천횡단시설물이다. 그러한 시설물의 안정성을 확보하기 위하여 하천설계기준에서는 시설물의 최소 규모에 관한 지침을 제시하고 있으나 실태 조사 결과에 의하면, 기존 보 및 낙차공의 물받이 및 바닥보호공의 규모는 설계기준을 만족시키지 못하는 경우가 대부분이고 교량의 교각은 일부만 만족시키는 것으로 나타났다. 기존 보 및 낙차공의 수리적 안정성을 제고하기 위해서는 설계기준에서 제시한 바닥보호공에 대한 물받이의 비율인 3.3을 최소값으로 확보해줄 필요가 있다. 표본하천 시설물 실태조사에 의하면 기존 보 및 낙차공을 자연형 여울공으로 개량할 경우 적용하는 종단경사는 1:20이 가장 적정한 것으로 나타났다. 또한, 교량의 철거 또는 재가설에 관한 결정에서 교각의 여유고 및 경간장 위배사항만 고려하고 있지만, 향후 교량 노후도 및 경간장 완화 규정 등을 종합적으로 검토하여 결정하는 것이 바람직하다. 본 연구에서는 설계기준, 하천실태 조사결과, 일본사례 등을 통하여 기존 보, 낙차공 및 교각의 수리적 안정성을 제고하는 종합적인 방안을 제시하였다. 하천횡단시설물의 안정화 노력은 정부 차원의 예산 지원과 적극적인 하천관리를 통하여 이룰 수 있으며, 이를 통하여 하천재해를 예방하고 건전한 하천 환경을 유지할 수 있을 것이다.

설진 유효 영역 추출의 시스템적 접근 방법 (Systematic Approach to The Extraction of Effective Region for Tongue Diagnosis)

  • 김근호;도준형;유현희;김종열
    • 전자공학회논문지SC
    • /
    • 제45권6호
    • /
    • pp.123-131
    • /
    • 2008
  • 한의학에서 혀의 상태는 인체 내부의 생리적 병리적 변화와 같은 건강 상태를 진단하는 중요한 지표로 활용된다. 혀의 상태를 진단하는 방법(설진)은 편리할 뿐 아니라 비침습적이므로, 한의학에서 널리 활용되고 있다. 하지만, 설진은 광원이나 환자의 자세, 의사의 건강 조건과 같은 검사 환경에 따라 많은 영향을 받는다. 객관적이고 표준화된 진단을 위한 자동 설진 시스템을 개발하기 위하여 촬영된 얼굴 영상으로부터 혀를 영역분할하고 설태를 분류하는 것은 필수적이지만 혀와 입술, 입 근처의 피부색이 서로 유사하므로 쉽지 않은 일이다. 제안된 방법은 전처리 과정과 영역분할, 혀의 구조로부터 발생하는 음영 영역의 지역 최소값 위치 검색, 지역 최소값의 교정, 컬러의 차이를 최대로 하는 위치를 찾는 컬러 경계면 탐색, 척의 기하적인 특성에 일치하는 경계면 선택, 경계면 평활화로 구성되어 있으며, 여기서 전처리 과정은 계산량의 감소를 위한 부 표본화, 히스토그램 평활화, 경계면 강화를 수행한다. 이러한 시스템적인 과정을 거치면, 영역분할된 혀를 획득할 수 있게 된다. 제안된 방법으로 분할된 영역은 초과적으로 혀가 아닌 영역을 제외해 낼 뿐 아니라 정확한 진단을 위해 중요한 정보를 제공함을 한의사의 진단 유효도 평가점수를 통해 확인할 수 있었다. 제안된 방법은 진단의 객관화와 표준화에 기여할 뿐만 아니라 u-Healthcare 시스템에도 활용 가능하다.

삼림군집구조 조사를 위한 조사구 크기에 관한 연구(III) -주왕산지역 소나무림의 관목층 적정 조사구 면적- (Plot Size for Investigating Forest Community Structure(III) -Adequate Plot Area of Shrub Stratum in a Pinus densiflora Forest at Chuwangsan Area-)

  • 박인협;문광선
    • 한국환경생태학회지
    • /
    • 제8권2호
    • /
    • pp.150-153
    • /
    • 1995
  • 단일 조사구에 의한 삼림군집구조 조사시 관목층의 적정 조사구 면적을 결정하기 위하여 주왕산지역 소나무림의 관목층을 대상으로 nested design에 의하여 19개의 조사구를 설치한 후 종수-면적 곡선, performance curve 등을 적용하였다. 종수-면적 곡선에 있어서 조사구 면적의 증가율보다 출현종수의 증가율이 낮은 최소 조사구 면적은 900$m^2$이었으며, 조사구 면적의 증가율에 비하여 출현종수의 증가율이 1/2 이하인 최소 조사구 면적은 1,500$m^2$이었다. Performance curve를 작성한 결과 조사구 면적 1,400$m^2$ 이상에서 주요 수종의 중요치가 일정한 경향으로 구분되었다. 전체 조사구 면적에 대한 유사도지수는 조사구 면적 900$m^2$, 625$m^2$ 이상에서 각각 90, 85% 이상의 값을 보였다. 이상의 결과를 종합하면 보다 정확성을 요구할 경우 관목층의 적정 조사구 면적은 대체로 1,500$m^2$라고 할 수 있었다.

  • PDF

인구총조사의 방법과 평가 (Methods and Evaluation of Korean Population Census)

  • 김태헌
    • 한국인구학
    • /
    • 제20권1호
    • /
    • pp.27-46
    • /
    • 1997
  • 일반적으로 우리나라의 인구 총조사 자료는 질적으로 매우 우수한 것으로 알려져 있다. 조사의 완전성이 최소 97% 이상을 유지하고 있으며 연령보고의 오류도 세계에서 가장 낮은 그룹에 속하고 있다. 그러나 연령계층별 오차율의 차이, 조사방법의 비경제성 등은 앞으로 개선되어야할 분야이다. 그러므로 우리나라의 장래 발전을 위하여 실제 고려 할 수 있는 주요 사항을 다음과 같이 정리하였다. 1. 국민 모두 기초 교육을 받은 우리 사회에서 자계식 조사의 재시도를 적극 검토하여 면접 타계식 조사의 한계를 극복하고, 경비를 절약할수있는 방안을 강구할때이다. 2. 정확한 연령을 파악하기 위하여는 4개의 조사사항(보통나이, 띠, 생년월일,양음력)을 질문하여 연령조사방법은 노력에 비하여 실효성이 높지 않으므로 조사 항목의 단순화를 검토할때이다. 3. 사후 조사를 더욱 연구하여 연령 자료만이 아니라 그외 주요조사항목에 대한 정확한 평가 결과를 공표하여 활용하면 총 조사의 발전과 좋은 결과를 얻을수 있는 계기가 될것이다. 4. 영유아인구와 이동이 많은 연령계층의 순 누락이 많은것은 총조사가 반복되어도 계속나타나는 현상이므로 특히 이 연령계층에 해당되는 인구의 확인을 위한 조사항목을 두어서라도 조사의 정확성을 높이는데 노력하여야 한다. 5. 표본 조사 자료를 중심으로 1995년 총조사 2% 표본 Data File을 조기에 편집하여 일반에 공개함으로써 특성별 자료의 활용가치를 높여야 할것이다. 또한 통계자료의 효율성은 시계열 축적에 있으므로 1985년 이전 총조사 2% 자료의 File화와 시계열의 축적이 가능해질때 우리나라 사회과학연구의 발전에 직접적인 도움이 될것이다.

  • PDF

러프집합분석을 이용한 매매시점 결정 (Rough Set Analysis for Stock Market Timing)

  • 허진영;김경재;한인구
    • 지능정보연구
    • /
    • 제16권3호
    • /
    • pp.77-97
    • /
    • 2010
  • 매매시점결정은 금융시장에서 초과수익을 얻기 위해 사용되는 투자전략이다. 일반적으로, 매매시점 결정은 거래를 통한 초과수익을 얻기 위해 언제 매매할 것인지를 결정하는 것을 의미한다. 몇몇 연구자들은 러프집합분석이 매매시점결정에 적합한 도구라고 주장하였는데, 그 이유는 이 분석방법이 통제함수를 이용하여 시장의 패턴이 불확실할 때에는 거래를 위한 신호를 생성하지 않는다는 점 때문이었다. 러프집합은 분석을 위해 범주형 데이터만을 이용하므로, 분석에 사용되는 데이터는 연속형의 수치값을 이산화하여야 한다. 이산화란 연속형 수치값의 범주화 구간을 결정하기 위한 적절한 "경계값"을 찾는 것이다. 각각의 구간 내에서의 모든 값은 같은 값으로 변환된다. 일반적으로, 러프집합 분석에서의 데이터 이산화 방법은 등분위 이산화, 전문가 지식에 의한 이산화, 최소 엔트로피 기준 이산화, Na$\ddot{i}$ve and Boolean reasoning 이산화 등의 네 가지로 구분된다. 등분위 이산화는 구간의 수를 고정하고 각 변수의 히스토그램을 확인한 후, 각각의 구간에 같은 숫자의 표본이 배정되도록 경계값을 결정한다. 전문가 지식에 의한 이산화는 전문가와의 인터뷰 또는 선행연구 조사를 통해 얻어진 해당 분야 전문가의 지식에 따라 경계값을 정한다. 최소 엔트로피 기준 이산화는 각 범주의 엔트로피 측정값이 최적화 되도록 각 변수의 값을 재귀분할 하는 방식으로 알고리즘을 진행한다. Na$\ddot{i}$ve and Boolean reasoning 이산화는 Na$\ddot{i}$ve scaling 후에 그로 인해 분할된 범주값을 Boolean reasoning 방법으로 종속변수 값에 대해 최적화된 이산화 경계값을 구하는 방법이다. 비록 러프집합분석이 매매시점결정에 유망할 것으로 판단되지만, 러프집합분석을 이용한 거래를 통한 성과에 미치는 여러 이산화 방법의 효과에 대한 연구는 거의 이루어지지 않았다. 본 연구에서는 러프집합분석을 이용한 주식시장 매매시점결정 모형을 구성함에 있어서 다양한 이산화 방법론을 비교할 것이다. 연구에 사용된 데이터는 1996년 5월부터 1998년 10월까지의 KOSPI 200데이터이다. KOSPI 200은 한국 주식시장에서 최초의 파생상품인 KOSPI 200 선물의 기저 지수이다. KOSPI 200은 제조업, 건설업, 통신업, 전기와 가스업, 유통과 서비스업, 금융업 등에서 유동성과 해당 산업 내의 위상 등을 기준으로 선택된 200개 주식으로 구성된 시장가치 가중지수이다. 표본의 총 개수는 660거래일이다. 또한, 본 연구에서는 유명한 기술적 지표를 독립변수로 사용한다. 실험 결과, 학습용 표본에서는 Na$\ddot{i}$ve and Boolean reasoning 이산화 방법이 가장 수익성이 높았으나, 검증용 표본에서는 전문가 지식에 의한 이산화가 가장 수익성이 높은 방법이었다. 또한, 전문가 지식에 의한 이산화가 학습용과 검증용 데이터 모두에서 안정적인 성과를 나타내었다. 본 연구에서는 러프집합분석과 의사결정 나무분석의 비교도 수행하였으며, 의사결정나무분석은 C4.5를 이용하였다. 실험결과, 전문가 지식에 의한 이산화를 이용한 러프집합분석이 C4.5보다 수익성이 높은 매매규칙을 생성하는 것으로 나타났다.

간략화된 메쉬에서 보간된 법선 벡터의 분포를 이용한 3차원 모델 검색 (3D Model Retrieval using Distribution of Interpolated Normal Vectors on Simplified Mesh)

  • 김아미;송주환;권오봉
    • 한국멀티미디어학회논문지
    • /
    • 제12권11호
    • /
    • pp.1692-1700
    • /
    • 2009
  • 본 논문에서는 메쉬 법선 벡터들의 방향 분포를 3차원 모델의 특징 기술자로 제안한다. 특징 기술자로써 요구되는 회전 불변을 주성분 분석법(PCA)으로 처리하고 잡음첨가에 강건하도록 메쉬 간략화를 수행한다. 표면적이 작은 면에 대한 정보가 특징 기술자를 구성하는데 더 적게 반영되도록 법선 벡터의 분포를 각 다각형의 면적에 비례하게 표본을 뽑아 법선 벡터에 가중치를 적용하고 보간하여 변별력을 높인다. 모델간의 유사도는 특징 기술자의 거리를 정규화한 확률 밀도 히스토그램의 L1-norm으로 측정한다. 제안한 방법이 기존 방법에 비해 검색 순위 평균(ANMRR)으로 나타낸 검색 성능이 약 17.2%, 정량적 변별 척도로 나타낸 검색 성능이 최소 9.6%에서 최대 17.5%까지 향상되었음을 알 수 있었다.

  • PDF

팔당산 호밀(Secale cereale) B 염색체의 출현빈도에 대하여 (Frequency of B-chromosomes in Rye (Secale cereale) Cultivated in Paldang)

  • 이웅직
    • Journal of Plant Biology
    • /
    • 제24권4호
    • /
    • pp.181-190
    • /
    • 1981
  • 1963년부터 1977년까지 팔당산 호밀의 B 염색체의 출현빈도를 조사한 결과는 다음과 같다. 2%(1963), 8%(1964), 8%(1965), 15%(1966), 11.5%(1968), 11.7%(1969), 20%(1975), 19.6%(1976), 12.8%(1977). $x^2$검정의 결과는 각 년도에 있어서의 B'의 출현빈도 사이에 유의차가 없음을 나타내고 있다. 1976년과 1977년에는 호밀 밭을 10개 구로 나누어 재료를 수집하여 B'의 분포와 표본채취의 결과를 분석하였다. 호밀의 B'는 집단내에서 비교적 균일하게 분포되고 있으며 최소 50개체를 관찰하면 호밀 집단의 B'의 출현빈도를 대략 알 수가 있었다. 팔당산 호밀 집단에서 1966년부터 1977년까지 계속하여 전좌이형접합체(T.H)에 의한 사가염색체를 가진 개체가 1~7%의 빈도로 관찰되었다.

  • PDF

JPEG 및 JPEG2000을 이용한 영상 압축과 색역 변화의 관계 (Relationship between Image Compression and Gamut Variation Using JPEG and JPEG2000)

  • 고경우;박태용;하영호
    • 대한전자공학회논문지SP
    • /
    • 제46권4호
    • /
    • pp.1-8
    • /
    • 2009
  • JPEG 및 JPEG2000과 같은 영상 압축 알고리즘은 고유의 손실 특성으로 인하여 영상 복원 시 화질을 열화시켜 색역(gamut)을 변화시킨다. 따라서 본 논문에서는 JPEG과 JPEG2000을 이용하여 압축률과 색역 변화의 관계를 연구하였다. 압축률과 색역 변화의 관계를 분석하기 위해 우선 표준 컬러 차트(Macbeth ColorChecker)의 18가지 색 표본을 이용하여 균일한 색 좌표계 내에서의 색상과 채도 변화를 조사하였다. 이를 근거로 12개의 자연 영상을 4가지 속성에 따라 2개의 그룹으로 분류하고 실험을 반복하였다. 그 결과 압축률과 색역 변화의 상관관계를 도출하고, 최소 자승법을 이용하여 근사화 곡선을 유도할 수 있었다.

모수적 엔트로피 추정량과 비모수적 엔트로피 추정량에 기초한 정규분포에 대한 적합도 검정 (Goodness-of-fit test for normal distribution based on parametric and nonparametric entropy estimators)

  • 최병진
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권4호
    • /
    • pp.847-856
    • /
    • 2013
  • 본 논문에서는 모수적과 비모수적 엔트로피 추정량들에 기초한 정규분포에 대한 적합도 검정을 다룬다. 정규분포의 엔트로피에 대한 모수적 추정량으로 사용할 최소분산비편향추정량을 유도한다. 이 추정량과 대립가설 하에서의 자료생성분포에 대한 비모수적 엔트로피 추정량으로 표본엔트로피와 이것의 변형된 추정량들을 이용하여 검정통계량들을 구축했고 이 검정통계량들을 사용하는 새로운 엔트로피 기반 적합도 검정들을 제시한다. 제안한 검정들의 기각값들을 모의실험을 통해 추정해서 표의 형태로 제시한다. 성능의 조사를 위해 수행한 모의실험에서 제안한 검정들이 기존의 Vasicek (1976) 검정보다는 더 좋은 검정력을 가지는 것으로 나타난다. 응용에서 새로운 검정들이 정규성 검정을 위한 경쟁적인 도구로 시용될 수 있을 것으로 기대된다.