• 제목/요약/키워드: 테스트 데이터 생성

검색결과 342건 처리시간 0.025초

평가와 선택기법에 기반한 대표패턴 생성 알고리즘 (A Representative Pattern Generation Algorithm Based on Evaluation And Selection)

  • 이형일
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권3호
    • /
    • pp.139-147
    • /
    • 2009
  • 메모리 기반 추론 기법은 단순히 학습패턴이나 대표패턴의 형태로 메모리에 저장하며 테스트 패턴과의 거리 계산을 통하여 분류한다. 이 기법의 가장 큰 문제점은 학습 패턴 전체를 메모리에 저장하거나 학습 패턴들을 대표 패턴으로 대체하는 방법을 사용함으로 다른 기계학습 방법에 비하여 많은 메모리 공간을 필요로 하며, 저장되는 학습패턴이 증가할수록 분류에 필요한 시간도 많이 소요된다는 단점을 갖는다. 본 논문은 효율적인 메모리 사용과 분류 성능의 향상을 위한 EAS 기법을 제안하였다. 즉, 학습패턴에 대해 분할공간을 생성한 후 생성된 각 분할공간을 MDL기법과 PM기법으로 평가하였다. 그리고 평가 결과 가장 우수한 분할공간만을 취하여 대표패턴으로 삼고 나머지는 다시 분할하여 평가를 반복하는 기법이다. UCI Machine Learning Repository에서 벤치마크 데이터를 발췌한 실험 자료를 사용하여 제안한 기법의 성능과 메모리 사용량에 있어 우수함을 입증하였다.

국토관측센서 기반 수재해 정보 플랫폼 개발현황 및 전망 (Development Status and Prospect of Water Hazard Information Platform)

  • 유완식;박광하;이용현;황의호;채효석
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2020년도 학술발표회
    • /
    • pp.383-383
    • /
    • 2020
  • 한반도를 비롯한 전 세계를 대상으로 가뭄과 홍수 등 물관련 재해정보를 체계적으로 수집·분석하고 이를 정부부처 및 민간에서도 제공 가능한 국가 차원의 과학적이고 효율적인 수재해 대응 및 관리 위하여 현재 수재해 정보플랫폼 융합기술 연구단이 2014년 7월 1일 출범하여 수행중에 있다. 정보플랫폼 융합기술 연구단은 국토관측센서(위성, 레이더, 지상관측자료) 기반 광역 및 지역 수재해 정보 허브 구축 및 운영기술 개발로 행복한 안심국토 및 물산업 강국 실현이라는 연구비전 아래, 고정밀 수문레이더 기반 도시홍수 관리기술, 가뭄/하천건천화 평가 및 예측 기술 개발, 홍수재해 평가 및 예측 기술 개발, 빅데이터기반 광역 및 지역 수자원정보 서비스 플랫폼 기술 개발이라는 4대 연구성과 목표로 X-Net 실증 테스트베드 구축을 통해 획득된 자료를 기반으로 수재해 감시·평가·예측 등에 필요한 관련 수문정보를 생성하고 있으며, 생성된 위성영상 및 수문레이더 등의 수문정보를 활용하여 미계측 유역에 대한 수자원 변동 감시 및 가뭄과 하천 건천화를 효율적으로 평가·예측함으로써 물안보 대응체계를 강화하기 위한 기술을 확보하고 있다. 또한 광역 및 국지 홍수 피해 범위와 규모 등을 평가·산정하고 정확히 예측함으로써 홍수재해를 저감할 수 있는 기술 개발을 추진하고 있으며, 최종적으로는 광역 및 지역 수문자료와 수재해 관련 분석정보를 체계적으로 관리하고 맞춤형 수재해 정보를 제공할 수 있는 수재해정보플랫폼 및 포털시스템을 개발 글로벌 물 정보 허브로써 기반을 조성해 나가고 있다. 이에 수재해 정보플랫폼 융합기술 연구단에서 개발하여 운영중에 있는 수재해 정보플랫폼의 고정밀 수문레이더 기반 도시홍수 관리시스템, 위성기반 가뭄 모니터링 시스템, 미계측 지역 수문정보 및 수자원 모니터링 시스템, 한국형 지표 수문정보 생성 시스템 개발현황 등 그간의 노력에 대해 소개하고자 한다.

  • PDF

과학데이터에 관한 입법례와 관리정책 그리고 대응방안 -호주, 미국, 중국을 중심으로- (Legislation Cases, Management Policies and Countermeasures on Scientific Data -Focusing Australia, the United States and China-)

  • 윤종민;김규빈
    • 기술혁신학회지
    • /
    • 제16권1호
    • /
    • pp.63-100
    • /
    • 2013
  • 과학데이터는 사실, 관찰, 이미지, 컴퓨터프로그램결과, 기록, 측량 또는 경험(논거, 이론, 테스트 또는 가설 또는 기타 연구물에 기초한)의 형태에서 생성되는 데이터를 의미한다. 연구패러다임이 데이터 중심의 연계 융합연구로 전환되면서 이러한 과학데이터에 대한 중요성과 그 가치는 매우 높아지고 있다. 과학데이터가 창의적인 연구개발을 위해 효율적으로 재사용될 수 있기 위해서는 공유와 활용을 위한 관리체계의 구축이 필수적이다. 과학데이터의 공유와 활용을 위한 관리체제의 구축은 국가적 차원에서 이루어져야 하지만, 우리나라의 경우 관리체제의 수준은 호주, 미국, 중국 또는 유럽에 비해서 연계성으로나 효율성으로나 내실을 기하지 못하고 있다. 호주, 미국, 중국 등은 국가차원에서 관련 기관을 통해 과학데이터를 수집, 관리 및 유지하는 등 데이터 활용을 적극적으로 추진하기 위하여 중장기적인 정책수립, 법제도 정비, 기반시설에 대한 투자를 지속적으로 확대하고 있다. 본 연구는 효율적이고 공정한 과학데이터의 공유 및 활용을 위한 국가적인 관리체계구축 및 이를 뒷받침할 수 있는 법제도를 정비함에 있어서 해외 관련 입법례 및 정책동향에 관하여 살펴보고, 향후 우리나라의 대응방안을 제시하였다.

  • PDF

Generative optical flow based abnormal object detection method using a spatio-temporal translation network

  • Lim, Hyunseok;Gwak, Jeonghwan
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권4호
    • /
    • pp.11-19
    • /
    • 2021
  • 이상 객체란 일반적이고 평범한 행동을 취하는 객체가 아닌 비정상적이고 흔하지 않은 행동을 하여 관찰이나 감시·감독을 필요로 하는 사람, 물체, 기계 장치 등을 뜻한다. 이를 사람의 지속적인 개입 없이 인공지능 알고리즘을 통해 탐지하기 위해서 광학 흐름 기법을 활용한 시간적 특징의 특이도를 관찰하는 방법이 많이 활용되고 있으며, 이 기법은 정해진 표현 범위가 없는 수많은 이상 행동을 식별하기에 적합하다. 본 연구에서는 생성적 적대 신경망(Generative Adversarial Network, GAN)으로 입력 영상 프레임을 광학 흐름 영상으로 변환하는 알고리즘을 학습시켜 비정상적인 상황을 식별한다. 특히 생성적 적대 신경망 모델이 입력 영상에 대한 중요한 특징 정보를 학습하고, 그 외 불필요한 이상치를 제외시키기 위한 전처리 과정과 학습 후 테스트 데이터셋에서 식별 정확도를 높이기 위한 후처리 과정을 고도화하여 전체적인 모델의 이상 행동 식별 성능을 향상시키는 기법을 제안한다. 이상 행동을 탐지하기 위한 학습 데이터셋으로 UCSD Pedestrian, UMN Unusual Crowd Activity를 활용하였으며, UCSD Ped2 데이터셋에서 프레임 레벨 AUC 0.9450, EER 0.1317의 수치를 보이며 이전 연구에서 도출된 성능 지표 대비 성능 향상이 확인되었다.

오픈소스 프로젝트의 테스트 주도 개발 채택여부가 사용자만족도에 미치는 영향에 관한 연구 (Test-Driven Development Adoption influence to User Satisfaction on OpenSource Project development)

  • 손효정;이민규;성백민;김종배
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2015년도 추계학술대회
    • /
    • pp.1075-1078
    • /
    • 2015
  • 애자일 개발방법론의 가치를 반영한 대표적인 관행으로 웹 2.0 협업도구를 이용한 의사소통, 테스트 주도 개발(TDD, Test-Driven Development)방법 채택, 리팩토링 등 3가지를 이전 연구에서 선정하였다. 본 연구에서는 테스트 주도개발을 채택한 오픈소스 프로젝트의 경우 프로젝트 사용자만족도가 높을 것이라는 가설을 설정해 연구하였다. 최대의 오픈소스 호스팅 사이트인 소스포지(sourceforge.net)에서 100개 프로젝트(개발자 7명이상, 발생 버그수 100개 이상, 2000년 이후 생성된 프로젝트)를 선정하고 CVS 및 SVN log분석을 통해 TDD의 자동화 개발툴인 xUnit의 이용여부를 확인하였다. FLOSSmole의 데이터를 이용해 해당 프로젝트의 사용자만족도를 평가하였다. 사용자만족도는 각 프로젝트의 Rating, 버그수정 주기, 다운로드수와 페이지뷰수 등 4가지이다. 이를 통해 TDD의 채택여부와 사용자만족도의 상관관계를 분석하여 기존의 오픈소스 개발방법론에서 애자일 관행을 반영한 프로젝트가 사용자만족도가 높음을 밝혀, 결과적으로 오픈소스 커뮤니티 성숙도를 높이는데 기여하고자 한다.

  • PDF

데이터 증강을 통한 딥러닝 기반 주가 패턴 예측 정확도 향상 방안 (Increasing Accuracy of Stock Price Pattern Prediction through Data Augmentation for Deep Learning)

  • 김영준;김여정;이인선;이홍주
    • 한국빅데이터학회지
    • /
    • 제4권2호
    • /
    • pp.1-12
    • /
    • 2019
  • 인공지능 기술이 발전하면서 이미지, 음성, 텍스트 등 다양한 분야에 적용되고 있으며, 데이터가 충분한 경우 기존 기법들에 비해 좋은 결과를 보인다. 주식시장은 경제, 정치와 같은 많은 변수에 의해 영향을 받기 때문에, 주식 가격의 움직임 예측은 어려운 과제로 알려져 있다. 다양한 기계학습 기법과 인공지능 기법을 이용하여 주가 패턴을 연구하여 주가의 등락을 예측하려는 시도가 있어왔다. 본 연구는 딥러닝 기법 중 컨볼루셔널 뉴럴 네트워크(CNN)를 기반으로 주가 패턴 예측률 향상을 위한 데이터 증강 방안을 제안한다. CNN은 컨볼루셔널 계층을 통해 이미지에서 특징을 추출하여 뉴럴 네트워크를 이용하여 이미지를 분류한다. 따라서, 본 연구는 주식 데이터를 캔들스틱 차트 이미지로 만들어 CNN을 통해 패턴을 예측하고 분류하고자 한다. 딥러닝은 다량의 데이터가 필요하기에, 주식 차트 이미지에 다양한 데이터 증강(Data Augmentation) 방안을 적용하여 분류 정확도를 향상 시키는 방법을 제안한다. 데이터 증강 방안으로는 차트를 랜덤하게 변경하는 방안과 차트에 가우시안 노이즈를 적용하여 추가 데이터를 생성하였으며, 추가 생성된 데이터를 활용하여 학습하고 테스트 집합에 대한 분류 정확도를 비교하였다. 랜덤하게 차트를 변경하여 데이터를 증강시킨 경우의 분류 정확도는 79.92%였고, 가우시안 노이즈를 적용하여 생성된 데이터를 가지고 학습한 경우의 분류 정확도는 80.98%이었다. 주가의 다음날 상승/하락으로 분류하는 경우에는 60분 단위 캔들 차트가 82.60%의 정확도를 기록하였다.

  • PDF

영한 기계번역에서의 영어 품사결정 모델 (A Model of English Part-Of-Speech Determination for English-Korean Machine Translation)

  • 김성동;박성훈
    • 지능정보연구
    • /
    • 제15권3호
    • /
    • pp.53-65
    • /
    • 2009
  • 영한 기계번역에서 영어 단어의 품사결정은 번역할 문장에 사용된 어휘의 품사 모호성을 해소하기 위해 필요하다. 어휘의 품사 모호성은 구문 분석을 복잡하게 하고 정확한 번역을 생성하는 것을 어렵게 한다. 본 논문에서는 이러한 문제점을 해결하기 위해 어휘 분석 이후 구문 분석 이전에 품사 모호성을 해소하려 하였으며 품사 모호성을 해소하기 위한 CatAmRes 모델을 제안하고 다른 품사태깅 방법과 성능 비교를 하였다. CatAmRes는 Penn Treebank 말뭉치를 이용하여 Bayesian Network를 학습하여 얻은 확률 분포와 말뭉치에서 나타나는 통계 정보를 이용하여 영어 단어의 품사를 결정을 한다. 본 논문에서 제안한 영어 품사결정 모델 CatAmRes는 결정할 품사의 적정도 값을 계산하는 Calculator와 계산된 적정도 값에 근거하여 품사를 결정하는 POSDeterminer로 구성된다. 실험에서는 CatAmRes의 동작과 성능을 테스트 하기 위해 WSJ, Brown, IBM 영역의 말뭉치에서 추출한 테스트 데이터를 이용하여 품사결정의 정확도를 평가하였다.

  • PDF

피드백 구조를 갖는 Self-Timed Ring 기반의 경량 TRNG (A Self-Timed Ring based Lightweight TRNG with Feedback Structure)

  • 최준영;신경욱
    • 한국정보통신학회논문지
    • /
    • 제24권2호
    • /
    • pp.268-275
    • /
    • 2020
  • 정보보안 응용에 적합한 self-timed 링 (ring) 기반 TRNG (true random number generator)의 경량 하드웨어 설계에 관해 기술한다. TRNG의 하드웨어 복잡도를 줄이기 위해 피드백 구조의 엔트로피 추출기를 제안하였으며, 이를 통해 링 스테이지 수를 최소화 하였다. 본 논문의 FSTR-TRNG는 동작 주파수와 엔트로피 추출 회로를 고려하여 링 스테이지 수가 11의 배수가 되도록 결정되었으며, 링 발진기가 등간격 모드로 진동할 수 있도록 토큰 (token)과 버블(bubble) 개수의 비를 결정하였다. FSTR-TRNG는 FPGA 디바이스에 구현하여 난수 생성 동작을 검증하였다. Spartan-6 FPGA 디바이스에 구현된 FSTR-TRNG로부터 2,000만 비트의 데이터를 추출하여 NIST SP 800-22에 규정된 통계학적 무작위성 테스트를 수행한 결과, 15개의 테스트가 모두 기준을 만족하는 것으로 확인되었다. Spartan-6 FPGA 디바이스로 합성한 FSTR-TRNG는 46 슬라이스로 구현이 되었으며, 180 nm CMOS 표준셀로 합성하는 경우에는 약 2,500 등가 게이트로 구현되었다.

AR 방식을 이용한 밸브바디의 나사 조립 상태 검지 (Detecting the screw-assembly state of a valve-body using the AR method)

  • 강문호
    • 한국산학기술학회논문지
    • /
    • 제22권1호
    • /
    • pp.24-30
    • /
    • 2021
  • 본 연구에서는 자동차 밸브 바디 (valve body) 나사의 조립 상태를 검지하고 조립 작업을 보조하기 위한 증강현실 (AR) 앱을 개발하고 테스트를 통해 유효성을 보인다. 조립할 나사의 조립 위치와 순서 및 조립 상황들을 표시하는 컨텐츠들을 생성한 후 스마트 폰 화면의 밸브 바디 영상 위에 정합하여, 조립 도중에 작업자에게 보여준다. 이를 위해, 밸브 바디의 2차원 이미지로부터 특징 데이터를 추출하고 밸브 바디의 포즈를 알아낸다. 밸브 바디 위의 각 나사들이 조립될 영역의 영상을 추출하고 주기적으로 해당 영역의 휘도를 판별하며, 밸브 바디 위의 정해진 위치에 순서에 따라 각 나사들이 조립되고 있는 지를 확인한다. 미조립 또는 조립 순서 오류 등 조립 에러가 검지되면 경고 음이 발생되어, 작업자가 스마트 폰 화면에서 즉시 조립 상태를 확인하고 에러를 처리할 수 있다. 테스트를 통해 5개 나사의 조립 상태를 검지하는데 약 65ms가 걸리고 1시간 동안 오류 없이 조립 상태가 검지되는 것을 확인했다.

DSP용 코드 생성에서 주소 포인터 할당 성능 향상 기법 (Improvement of Address Pointer Assignment in DSP Code Generation)

  • 이희진;이종열
    • 전자공학회논문지CI
    • /
    • 제45권1호
    • /
    • pp.37-47
    • /
    • 2008
  • DSP에서 제공되는 주소 생성 유닛은 데이터 패스와 병렬적으로 주소 연산을 수행할 수 있게 해 줌으로써, DSP 코드 생성에 중요한 역할을 한다. 프로그램 변수들의 메모리 레이아웃을 결정하는 문제는 주소 생성 유닛의 기능을 이용하여 주소 연산용 명령어를 줄이는 최적화이다. 메모리 레이아웃 생성 단계와 주소 포인터 할당 단계로 구분 되는 이 최적화에서 본 논문은 주소 연산 코드의 수가 최소가 되도록 DSP용 코드 생성의 효과적인 주소 포인터 할당 문제를 다룬다. 제안하는 알고리즘은 고정된 메모리 레이아웃을 가질 때 주소 포인터 할당을 수행하는 기존의 알고리즘의 시간 복잡도를 줄이는 기법이다. 메모리 크기와 수행 시간을 줄이기 위해 알고리즘을 수행할 때 핵심적인 요소들만을 고려하도록 강한 가지치기 방법을 사용하였다. 또한 주소 포인터 할당 문제는 메모리 레이아웃에 영향을 크게 받는 문제이기 때문에 본 논문은 주어진 메모리 레이아웃을 갱신하여 반복적으로 성능을 개선하는 방법을 제안한다. 약 3,000여개의 실제 프로그램으로부터 얻은 변수 접근 시퀀스를 제공하는 OffsetStone 벤치마크를 이용한 실험결과를 통해 본 논문에서 제안한 기법과 알고리즘을 테스트 했다. 제안한 방법은 전통적인 방법보다 평균 25.9%의 적은 주소 코드를 생성해 냄을 보인다.