• 제목/요약/키워드: 검증집합

검색결과 364건 처리시간 0.027초

대용량 훈련 데이타의 점진적 학습에 기반한 얼굴 검출 방법 (Face Detection Based on Incremental Learning from Very Large Size Training Data)

  • 박지영;이준호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권7호
    • /
    • pp.949-958
    • /
    • 2004
  • 본 연구는 대용량 훈련 데이타를 사용하는 얼굴 검출 분류기의 학습과정에서 새로운 데이터의 추가 학습이 가능한 새로운 방법을 제안한다. 추가되는 데이타로부터 새로운 정보를 학습하여 이미 습득된 기존의 지식을 갱신하는 것이 점진적 학습의 목표이다. 이러한 학습 기법에 기반한 분류기의 설계에서는 최종 분류기가 전체 훈련 데이타 집합의 특성을 반영하는 것이 매우 중요한 문제이다. 제안하는 알고리즘은 최적화된 최종 분류기 획득을 위하여 훈련 집합의 전역적인 특성을 대표하는 검증집합을 생성하고, 이 집단 내에서의 분류성능을 기준으로 중간단계 분류기들의 가중치를 결정한다. 각 중간단계 분류기는 개변 데이타 집합의 학습 결과로써 가중치 기반 결합 방식에 의해 최종 분류기로 구성된다. 반복적인 실험을 통해, 제안한 알고리즘을 사용하여 학습한 얼굴 검출 분류기의 성능이 AdaBoost 및 Learn++기반의 분류기보다 우수한 검출 성능을 보임을 확인하였다.

검증자 집합 형성 방법에 따른 블록체인 시스템 비교 분석 (Comparative Analysis of Blockchain Systems According to Validator Set Formation Method)

  • 김삼택
    • 한국융합학회논문지
    • /
    • 제10권11호
    • /
    • pp.41-46
    • /
    • 2019
  • 최근에 작업 증명(PoW) 블록체인 합의 알고리즘들이 에너지 낭비, 확장성 부족 등의 문제점들이 나타나면서 비잔틴 장애 허용(BFT) 계열 합의 알고리즘들이 주목을 받고 있다. BFT 계열 합의 알고리즘들의 큰 특징 중 하나는 검증자 집합을 형성하여 그 안에서 합의를 이루는 것이다. 본 논문에서는 BFT 계열 합의 알고리즘들 중에서도 알고랜드, 스텔라, 이오스의 검증자 집합 형성 방법들의 확장성, 목표가 설정된 공격 가능 여부, 시빌 공격 가능 여부에 대해서 비교, 분석하였다. 또한 데이터 분석을 통한 각 검증자 형성 방법들의 문제점들을 발견하였고, 해당 합의 알고리즘들은 공통적으로 소수의 권력 있는 노드들이 전체 시스템을 지배하는 중앙화 현상이 나타남을 밝혔다.

지진 및 배관파단에 대한 핵연료집합체의 동적 검증 (Dynamic Qualification of Fuel Assembly for Earthquake and Pipe Break)

  • 정명조;박윤원
    • 한국지진공학회논문집
    • /
    • 제4권1호
    • /
    • pp.51-62
    • /
    • 2000
  • 핵연료집합체 검증 프로그램의 일환으로 본 연구에서는 지진과 배과파단이 핵연료집합체의 건선성에 미치는 영향을 검토하였다 원자로 노심의 상세 동적해석을 이용하여 지진 및 배과파단시 핵연료 집합체에 발생하는 전단력 굽힘 모우멘트 및 변위를 계산하였고 또한 집합체를 지지하고 있는 지지격자체의 충격력을 검토하였다 이들 하중에 대한 핵연료집합체의 응력해석을 수행하여 사고조건하에서의 구조적 건전성에 대하여 언급하였고 추후 설계시 고려할 사항을 제시하였다.

  • PDF

독립된 데이터셋을 활용한 효율적인 딥러닝 기반 비프로파일링 부채널 분석 방안 (Efficient Non-Profiled Deep Learning-based Side-Channel Analysis with Independent Dataset)

  • 김주환;문혜원;김연재;박아인;한동국
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.169-172
    • /
    • 2020
  • 비프로파일링 부채널 분석은 프로파일링 장비가 없는 환경에서 부채널 정보를 이용해 비밀정보를 분석하는 방법이다. 기존에 알려진 Timon의 비프로파일링 분석은 학습 데이터 집합만을 이용해 공격하므로 전력 파형의 수가 제한된다면 과적합이 발생하여 키 분석 성능이 떨어질 수 있다. 본 논문에서는 비프로파일링 환경에서의 딥러닝 기반 부채널 분석 성능을 향상시키기 위해 학습 데이터 집합과 독립적인 검증 데이터 집합을 활용해야 하는 실증적 근거를 제시한다. 이에 대한 실험으로 기존 기법과 제시한 기법의 성능을 비교해 봤을 때, 검증 데이터를 활용하면 더 적은 데이터로 비밀키 추출이 가능함을 보인다.

매개변항, 부분집합원리, 재귀대명사습득 (Parameter. Subset Principle, and the Acquisition of Korean Reflexive Anaphora)

  • 조숙환
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
    • /
    • pp.296-301
    • /
    • 1989
  • 본 논문의 목적은 매개변항(parameter)과 부분집합원리(subset principle)를 재귀대명사 구조분석 및 습득에 적용하여 보편문법(Universal Grammar)과 언어습득의 상호관계를 검토하는 데에 있다. 본 논문은 첫째, 재귀대명사 '자기'를 매개변항이론에 근거하여 분석하고, 둘째, 재귀사의 구조를 부분집합원리에 적용하여 '자기'의 습득과정을 관찰한다. 본 논문의 목적을 위해 두 가지 가설을 세워 실험적으로 검증하였다. 실험결과, 선행사자격 습득단계의 가설이 확증되었으며, 지배변항 습득단계의 가설은 결정적 증거가 미비해 앞으로의 과제로 남아 있다.

  • PDF

어절 빈도 조사에 의한 최적의 고빈도 어절 집합 추출 (Extracting High-Frequency Optimal Korean Word Set by Word Frequency Statistics)

  • 강승식
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.85-88
    • /
    • 2001
  • 1500만, 700만, 10만 어절 크기의 세 가지 원시 말뭉치로부터 한국어 어절 빈도를 조사하였다. 각 말뭉치에 대한 어절 빈도 결과를 비교-분석하여 활용가치가 높은 고빈도 어절 집합을 구하였다. 고빈도 어절 집합의 효용성을 검증하기 위해 일반문서에 대한 어절 적중률을 실험하였다. 그 결과로 고빈도 563 어절이 24.5%, 9484 어절이 51.5%, 184246 어절이 81.6%의 어절 적중률을 보였다.

  • PDF

러프 집합과 퍼지 집합에 기반한 프로그램 재사용 가능도 측정 (Program Reuse Possibility Measurement Based on Rough and Fuzzy Sets)

  • 김혜경;김미경;최완규;이성주
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 1998년도 추계학술대회 학술발표 논문집
    • /
    • pp.145-149
    • /
    • 1998
  • 소프트웨어의 유지보수면에서, 재사용이 매우 중요시되고 있는 가운데, 사용자가 최소 노력으로 필요한 컴포넌트들을 선택 및 유사 컴포넌트들을 평가할 수 있는 방법이 필요하다. 따라서, 본 논문에서는 현업에서의 많은 연구와 실험을 통해서 그 타당성이 검증된 척도들을 측정 인자로 설정, 여기에 러프 집합으로써 각 측정 인자들의 중요도를 측정하고, 이러한 측정값들을 Sugeno의 퍼지 적분으로써 종합하여 컴포넌트의 재사용 가능도를 평가하여 재사용이 용이한 컴포넌트 순으로 사용자에게 제공할 수 있는 재사용 가능도 평가 방법을 제안한다.

  • PDF

시간열 마이크로어레이 데이터를 이용한 질병 관련 유의한 패스웨이 유전자 집합의 검출 (A Method of Identifying Disease-related Significant Pathways Using Time-Series Microarray Data)

  • 김재영;신미영
    • 전자공학회논문지CI
    • /
    • 제47권5호
    • /
    • pp.17-24
    • /
    • 2010
  • 최근 특정 질병의 진단이나 예후 예측을 위해 마이크로어레이 실험 데이터를 이용한 질병 관련 바이오마커 검출 연구가 활발히 진행되고 있다. 특히 정상인에 비해 질병 환자군에서 특이하게 발현되는 개별 유전자를 바이오 마커로 이용하는 기존의 방식과는 달리 동일한 생물학적 패스웨이에 관여하는 유전자 집합의 변화를 분석하여 특이하게 발현되는 패스웨이 유전자 집합을 바이오 마커로 사용하는 유전자 집합 분석(Gene-set analysis) 연구가 주목받고 있다. 본 논문에서는 다양한 실험 조건 요인을 가지는 시간열 마이크로어레이 실험 데이터를 이용한 유의한 패스웨이 유전자 집합을 검출하는 방법에 대해 제안한다. 시간열 마이크로어레이 데이터을 이용하여 유전자 집합 분석을 수행하기 위해서는 시간에 따른 유전자 발현값의 변화에 따라 개별 유전자의 유의성을 나타내는 스코어를 maSigPro (microarray Significant Profiles)를 이용하여 계산한 후, 이를 기반으로 전체 유전자의 순위를 결정하여 후보 유전자 집합에 대한 유의성 검증을 윌콕슨 순위합 검증을 통해 수행한다. 후보 유전자 집합의 생성을 위해서는 MSigDB (Molecular Signatures Database)의 패스웨이 정보를 이용하였으며, 본 논문에서 제안한 방법의 검증을 위해 공개된 전립선 암 관련 시간열 마이크로어레이 실험 데이터에 적용한 결과 실제로 전립선암과 관련된 것으로 밝혀진 7개의 패스웨이 중 6개의 패스웨이를 정확하게 검출할 수 있었다.

TV 제어 메뉴의 다국적 언어 인식을 위한 특징 선정 기법 (A Feature Selection Technique for Multi-lingual Character Recognition)

  • 강근석;박현정;김호준
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2005년도 학술대회
    • /
    • pp.199-202
    • /
    • 2005
  • TV OSD(On Screen Display) 메뉴 자동검증 시스템에서 다국적 언어의 문자 인식은 표준패턴의 구조적 분석이 쉽지 않을 뿐만 아니라 학습패턴 집합의 규모와 특징의 수가 증가함으로 인하여 특징추출 및 인식 과정에서 방대한 계산량이 요구된다. 이에 본 연구에서는 학습 데이터에 포함되는 다량의 특징 집합으로부터 인식에 필요한 효과적인 특징을 선별함으로써 패턴 분류기의 효율성을 개선하기 위한 방법론을 고찰한다. 이를 위하여 수정된 형태의 Adaboost 기법을 제안하고 이를 적용한 실험 결과로부터 그 유용성을 고찰한다. 제안된 알고리즘은 초기의 특징 집합을 취약한 성능을 갖는 다수의 분류기(classifier)로서 고려하며, 이로부터 반복학습을 통하여 개선된 분류기를 점진적으로 선별해 나가게 된다. 학습의 원리는 주어진 학습패턴 집합에 기초하여 일종의 교사학습(supervised learning) 방식으로 이루어진다. 각 패턴에 할당된 가중치 값은 각 단계에서 산출되는 분류결과에 따라 적응적으로 수정되어 반복학습이 진행됨에 따라 점차 보완적 성능을 갖는 분류기를 선택할 수 있게 한다. 즉, 주어진 각 학습패턴에 대하여 초기에 균등한 가중치가 부여되며, 반복학습의 각 단계에서 적용되는 분류기의 출력을 분석하여 오분류된 패턴의 가중치 분포를 증가시켜 나간다. 본 연구에서는 실제 응용으로서 OSD 메뉴검증 시스템을 대상으로 제안된 이론을 적용하고 그 타당성을 평가한다.

  • PDF

중앙값을 필터로 이용한 유사도 조인 알고리즘 (A Similarity Join Algorithm Using a Median as a Filter)

  • 박종수
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권2호
    • /
    • pp.71-76
    • /
    • 2015
  • 유사도 조인 처리에서 일반적인 기법은 생성-검증 구조를 사용하여, 첫 번째 생성 단계는 레코드들의 집합에서 후보 쌍들의 집합을 생성하고 두 번째 단계는 실제 유사도를 계산하여 각 후보 쌍을 검증한다. 검증 단계에서 후보 쌍들의 개수를 줄이기 위하여 본 논문에서는 각 후보 쌍의 한 레코드의 중앙값을 다른 레코드와 공통되는 토큰들의 개수가 적절하게 가질 수 있는지를 검사하는 필터로 사용한다. 중앙값 필터를 가지는 유사도 조인 알고리즘을 제안하고 제안된 알고리즘이 실세계 데이터집합에서 여러 실험을 통해 중앙값 필터를 갖지 않는 최근의 알고리즘들에 비해 실행시간에서 더 좋은 성능을 가진다는 것을 보여준다.