• 제목/요약/키워드: 데이터 평가 모델

검색결과 2,458건 처리시간 0.035초

ESPER 엔진 기반의 CEP 모델 설계 및 평가 (CEP Model Design and Revaluation Using ESPER Engine)

  • 김환;황부현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 춘계학술발표대회
    • /
    • pp.1113-1115
    • /
    • 2012
  • IT 기술이 성장함에 따라 발생되는 데이터의 양이 많아지고 기존의 방식으로 처리하기 힘든 빅 데이터가 이슈가 되고 있으며 이에 따른 대용량 데이터 처리기술 또한 발전하고 있다. 이 논문에서는 실시간 대용량 데이터 처리를 위한 Complex Event Processing을 소개하고 ESPER 엔진 기반의 Complex Event Processing 모델을 설계하고 이에 대한 성능을 평가했다.

종합적 품질평가 기법을 이용한 국내 GPS 상시관측소의 데이터 품질 분석 (Data Quality Analysis of Korean GPS Reference Stations Using Comprehensive Quality Check Algorithm)

  • 김민찬;이지윤
    • 한국항공우주학회지
    • /
    • 제41권9호
    • /
    • pp.689-699
    • /
    • 2013
  • 전리층 폭풍 시 발생할 수 있는 극심한 전리층 이상현상은 GNSS 보강시스템 사용자의 안전을 위협하는 대표적인 요인이므로 전리층 위협모델을 기반으로 한 지상 모니터링을 통해 적시에 감지 및 경보가 이루어 져야한다. GNSS 관측 데이터를 기반으로 전리층 분석을 수행하고 그 결과로 위협모델을 개발하기 때문에 각 관측소의 데이터 품질은 시스템 성능에 큰 영향을 미칠 수 있다. 전 세계적으로 GNSS 상시관측소 수가 많이 증가함에 따라 품질이 떨어지는 데이터를 산출하는 관측소 또한 증가하였다. 본 연구에서는 GNSS 데이터 품질평가 기법 이용하여 국내 GPS 상시관측소 데이터의 품질을 비교하고 품질이 떨어지는 데이터가 전리층 지연오차 및 기울기 추정치에 미치는 영향을 분석하였다. 품질평가 결과 국내 상시관측소간 데이터 품질에 큰 차이를 보였고 이 품질은 일정기간 유지된다는 것을 확인하였다. 본 연구에서 분석한 결과를 바탕으로 전리층 위협모델 개발을 위한 GNSS 데이터 품질 기준을 제시할 수 있다.

멀티미디어 데이터 검색을 위한 스키마 설계 및 시스템 구현 (Schema Design and Implementation for Multimedia Data Retrieval)

  • 노승민;황인준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (3)
    • /
    • pp.490-492
    • /
    • 2002
  • 본 논문에서는 효과적인 멀티미디어 데이터 검색을 위하여 기존의 주석과 내용 기반 검색 기법을 보완한 새로운 멀티미디어 데이터 검색 기법과 멀티미디어 데이터 모델을 사용한 통합 멀티미디어 검색 및 주석 시스템을 제안한다. 데이터 모델로는 MPEG-7 표준에 정의 되어있는 멀티미디어 기술 구조(MDS)와 기술 정의 언어인 XML Schema를 사용하였다. 이러한 모델을 기반으로 멀티미디어 데이터를 XML의 계층구조를 이용하여 주석 처리하고 다양한 방법을 통하여 검색을 할 수 있는 멀티미디어 검색 시스템을 구현하여, 실제 실험을 통하여 성능을 평가하였다.

  • PDF

BEGAN을 통해 한국인 얼굴 데이터 생성을 하는데 최적의 HyperParameter (Optimal Hyper Parameter for Korean Face Data Generation with BEGAN)

  • 조규철;김산
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.459-460
    • /
    • 2021
  • 본 논문에서는 BEGAN을 활용한 한국인 얼굴 데이터 생성을 위한 최적의 Hyper Parameter를 제안한다. 연구에서는 GAN의 발전된 모델인 BEGAN을 이용한다. 위의 모델을 작성하기 위하여 본 논문에서는 Anaconda 기반의 Jupyter Notebook에서 Python Tensorflow 모델을 작성하여 테스트하고, 만들어진 모델을 FID를 통해 모델의 성능을 비교한다. 본 연구에서는 제안하는 방법들을 통해서 만들어진 모델을 이용해 한국인 얼굴 데이터를 구하고, 생성된 이미지에 대한 정량적인 평가를 진행한다.

  • PDF

생성적 적대 네트워크로 자동 생성한 감성 텍스트의 성능 평가 (Evaluation of Sentimental Texts Automatically Generated by a Generative Adversarial Network)

  • 박천용;최용석;이공주
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권6호
    • /
    • pp.257-264
    • /
    • 2019
  • 최근 자연언어처리 분야에서 딥러닝 모델이 좋은 성과를 보이고 있다. 이러한 딥러닝 모델의 성능을 향상시키기 위해서는 많은 양의 데이터가 필요하다. 하지만 많은 양의 데이터를 모으기 위해서는 많은 인력과 시간이 소요되기 때문에 데이터 확장을 통해 이와 같은 문제를 해소할 수 있다. 그러나 문장 데이터의 경우 이미지 데이터에 비해 데이터 변형이 어렵기 때문에 다양한 문장을 생성할 수 있는 생성 모델을 통해 문장 데이터 자동 확장을 해보고자 한다. 본 연구에서는 최근 이미지 생성 모델에서 좋은 성능을 보이고 있는 생성적 적대 신경망 중 하나인 CS-GAN을 사용하여 학습 데이터로부터 새로운 문장들을 생성해 보고 유용성을 다양한 지표로 평가하였다. 평가 결과 CS-GAN이 기존의 언어 모델을 사용할 때보다 다양한 문장을 생성할 수 있었고 생성된 문장을 감성 분류기에 학습시켰을 때 감성 분류기의 성능이 향상됨을 보였다.

데이터 길이에 대한 강우-유출 모델 적용범위 평가 (Evaluation of the Coverage Assessment of Rainfall-Runoff Model for Data Length)

  • 전성재;신문주;정용
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.383-383
    • /
    • 2023
  • 오늘날 수문학 분야에서는 유역에 대한 강우-유출 시뮬레이션을 머신 러닝(ML: Machine Learning)을 활용하여 다양한 연구를 실행하고 있다. 본 연구에서는 시간별 강우-유출 예측 모델인 GR4H(Génie Rural à 4 paramètres Horaires)를 사용하여 충주댐 유역을 대상으로 연구를 수행하였다. 유역의 속성에 따라서 모델의 성능이 어떻게 달라지는지 비교하여 특성에 맞는 모델을 알아내고. 또한 이 과정에서 기상 및 유출 데이터의 보정 길이를 가지고 어느 정도의 데이터 기간이 모델에서 좋은 성능을 보이는지 파악하였다. 뿐만 아니라 모델에 필요한 선행기간의 데이터가 있는 경우와 없는 경우를 비교하여 어떠한 차이를 보이는지, 그리고 선행기간은 얼마나 필요한지 연구를 통하여 알아냈다. 본 연구를 통하여 충주댐 유역에 대한 모델의 적용성 및 성능을 파악하고 수문 모형 구축에 제한이 있는 유역에 대해서도 사용이 가능한지 판단한다. 실험 유역의 관측 값을 모델에 입력한 후 각 모델에 해당하는 매개변수의 최적값을 찾아내는 과정을 거쳐 시뮬레이션을실 행했다. 본 연구에서 사용한 강우-유출 모델인 GR4H는 프랑스의 INRAE-Antony(Institut National de la recherche agronomique-Antony)에서 만들어진 airGR의 일종으로, 시간별 강우-유출 예측을 위해 개발된 공정 기반(process-based)의 집중적, 개념적 수문학 모델이다. 4개의 매개변수(parameter)가 있으며 이는 유역의 특정 속성을 나타낸다. GR4H를 시뮬레이션 하는 과정에서 매개변수의 최적화를 위해 적절한 보정 길이를 파악하여야 한다. 이러한 과정은 4년, 5년, 6년 등 1년씩 데이터의 양을 늘려가며 매개변수를 최적화한다. 이 과정에서 기상 및 유출 데이터의 적절한 보정 길이를 찾아낸다. 시뮬레이션을 통해 얻은 데이터를 관측 값과 비교하여 모델의 성능을 평가하고 다른 관측 값을 통해 시뮬레이션을 실행하여 검증을 거친다.

  • PDF

Show, Attend and Tell 모델을 이용한 한국어 캡션 생성 (Korean Image Caption Generator Based on Show, Attend and Tell Model)

  • 김다솔;이계민
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 추계학술대회
    • /
    • pp.258-261
    • /
    • 2022
  • 최근 딥러닝 기술이 발전하면서 이미지를 설명하는 캡션을 생성하는 모델 또한 발전하였다. 하지만 기존 이미지 캡션 모델은 대다수 영어로 구현되어있어 영어로 캡션을 생성하게 된다. 따라서 한국어 캡션을 생성하기 위해서는 영어 이미지 캡션 결과를 한국어로 번역하는 과정이 필요하다는 문제가 있다. 이에 본 연구에서는 기존의 이미지 캡션 모델을 이용하여 한국어 캡션을 직접 생성하는 모델을 만들고자 한다. 이를 위해 이미지 캡션 모델 중 잘 알려진 Show, Attend and Tell 모델을 이용하였다. 학습에는 MS-COCO 데이터의 한국어 캡션 데이터셋을 이용하였다. 한국어 형태소 분석기를 이용하여 토큰을 만들고 캡션 모델을 재학습하여 한국어 캡션을 생성할 수 있었다. 만들어진 한국어 이미지 캡션 모델은 BLEU 스코어를 사용하여 평가하였다. 이때 BLEU 스코어를 사용하여 생성된 한국어 캡션과 영어 캡션의 성능을 평가함에 있어서 언어의 차이에 인한 결과 차이가 발생할 수 있으므로, 영어 이미지 캡션 생성 모델의 출력을 한국어로 번역하여 같은 언어로 모델을 평가한 후 최종 성능을 비교하였다. 평가 결과 한국어 이미지 캡션 생성 모델이 영어 이미지 캡션 생성 모델을 한국어로 번역한 결과보다 좋은 BLEU 스코어를 갖는 것을 확인할 수 있었다.

  • PDF

순차적 베이지안 진화 연산을 이용한 시계열 예측 (Sequential Bayesian Evolutionary Computations for Time Series Prediction)

  • 조동연;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.311-313
    • /
    • 2000
  • 본 논문에서는 시간이 흐름에 따라 관측되는 시계열 데이터에 대한 예측을 위한 순차적 베이지안 진화 연산기법을 제안한다. 이 방법에서는 이전 세대의 모델을 바탕으로 예측을 수행하고 새로운 데이터가 주어지면 현재의 예측 모델을 평가하여 더 좋은 모델을 생성하도록 한다. 제안된 방법을 시계열 데이터에 적용한 결과 기조의 방법보다 데이터에 적합한 모델을 학습하고 성공적인 예측을 수행함을 확인하였다.

  • PDF

딥러닝 회귀 모델 개발을 위한 센서 데이터 윈도우 사이즈 최적화 기법 (Optimization of Sensor Data Window Size for Deep Learning Regression Model)

  • 최민서;유동연;이정원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.610-613
    • /
    • 2022
  • 센서 데이터의 중요성이 커지면서 센서 데이터 처리 연구의 수요가 증가하고 있다. 센서 데이터 기반의 딥러닝 모델 개발 시, 센서 데이터 단일 값에 의한 출력이 아닌 시계열적인 특성을 반영하여 연속적인 데이터 간의 연관성을 파악할 수 있는 슬라이딩 윈도우 기법을 통해 효율적으로 데이터를 분석하고 처리할 수 있다. 하지만, 기존의 방법들은 학습 성능(학습 시간 및 모델 성능)에 미치는 영향을 평가하는 기준 없이 입력 데이터의 윈도우 사이즈를 임의로 설정하여 데이터를 처리해 왔다. 따라서, 본 논문은 학습 시간과 모델 성능을 기준으로 센서 데이터의 윈도우 사이즈 최적화 기법을 제안한다. 제안한 방법은 전류를 이용하여 스위치와 다이오드 온도를 추정하는 가상 센서(virtual sensor) 실험 테스트베드에 적용하여, 학습 시간 중심으로는 5%의 윈도우 사이즈를, 모델 성능 중심으로는 R2 SCORE 의 값을 0.9295 로 갖는 8%의 윈도우 사이즈가 최적으로 도출되었다.

소프트웨어 오류 데이터를 기반으로 한 소프트웨어 신뢰성 성장 모델 제안 (The Software Reliability Growth Model base on Software Error Data)

  • 정혜정;한군희
    • 한국융합학회논문지
    • /
    • 제10권3호
    • /
    • pp.59-65
    • /
    • 2019
  • 본 연구에서는 기존에 소프트웨어 품질 평가를 위해서 사용되었던 ISO/IEC 9126-2와의 차이점을 비교하기 위해서 소프트웨어 품질 평가를 위해서 새롭게 제시된 ISO/IEC 25023의 소프트웨어 품질 측정 메트릭을 제시하고 제시된 메트릭에 대해서 품질을 측정하는 방안을 제시한다. ISO/IEC 25023에 제시된 8가지 품질 특성 중에서 신뢰성에 대한 품질 측정 방안을 소프트웨어 신뢰성 성장 모델을 기반으로 평가하는 방안을 제시한다. ISO/IEC 25023을 기반으로 소프트웨어 품질을 평가하게 되어지면 신뢰성에 대한 평가에 있어 다소 리스크가 있을 수 있음을 데이터를 기반으로 하여 입증한다.