• 제목/요약/키워드: 데이터생성

검색결과 7,159건 처리시간 0.036초

XML 데이터베이스 시스템 성능 평가를 위한 통합 XML 데이터 생성기의 설계 (Design of an Integrated XML Data Generator for the Performance Evaluation of XML DBMSs)

  • 신선미;정회진;이상호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.7-10
    • /
    • 2004
  • XML 데이터베이스 시스템이 개발되면 다른 XML 데이터베이스 시스템과의 성능 비교, 또는 자체 기능에 대한 성능 평가를 수행한다. 성능 평가를 수행하기 위해서는 해당 성능 평가에 적합한 XML 데이터를 생성하는 XML 데이터 생성기가 필요하다. 본 논문에서는 지금까지 개발되었던 다양한 XML 데이터 생성기들의 특징 및 장단점을 살펴보고, 이를 기반으로 하나의 사용자 인터페이스를 이용하여 XML 데이터를 생성하는 통합 XML 데이터 생성기의 설계 내용을 기술한다. 통합 XML 데이터 생성기는 레코드 단위의 텍스트 데이터 파일의 내용을 기반으로 XML 데이터를 생성한다. 통합 XML 데이터 생성기는 관계형 데이터베이스 시스템의 데이터를 이용하여 XML 데이터로 생성하는 등 사용자가 제공하는 데이터 활용이 가능하며, 타 XML 데이터 생성기에 비해 다양한 XML 데이터를 생성함으로써 광범위한 XML 데이터베이스 시스템 성능 평가에 이용될 수 있다.

  • PDF

확장된 시공간 데이터 집합 생성기 (The Extended Generator of Spatiotemporal Datasets)

  • 이선준;김상호;류근호;이성호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (상)
    • /
    • pp.67-70
    • /
    • 2002
  • 시공간 접근 방법들을 위한 효율적인 성능평가 환경은 최소한 다음과 같은 모듈들을 포함해야 한다. 종합적인 데이터집합의 생성, 데이터집합의 저장, 접근 구조들의 수집과 실행, 실험적인 결과의 시각화 등이다. 데이터집합 저장 모듈에 초점을 맞추어서 다양한 실제 세계 시나리오를 실험하기 위한 종합적인 데이터의 생성이 요구된다. 과거의 여러 알고리즘들은 작업공간에서 미리 분배된 정적인 공간데이터를 생성하기 위하여 구현되어져왔다. 하지만 시간에 따라 변화하는 공간객체인 시공간 데이터를 생성하기에는 어렵다. 이 논문에서 시공간 데이터 타입의 데이터 생성기에서 고려하여야 할 매개변수들에 대하여 논의한다. "Generate_Spatio_Temporal_Data"라는 알고리즘은 움직이는 점 또는 사각형데이터를 생성하고 거래시간과 유효시간을 구별하지 않았으며 시간 점만을 표현하였다. 이 논문에서는 정확한 시간적 개념을 표현하기 위하여 거래시간과 유효시간간격 모두를 지원하는 데이터 생성기에 관하여 논의하기 위한 알고리즘을 제시하고 실제적인 데이터집합 생성을 위한 매개변수들을 나타낸다.

  • PDF

MPEG-2 TS 형태의 테스트 데이터 자동 생성기의 구현 (Implementation of Testdata Generation Tool for MPEG-2 TS)

  • 염선화;최병주;박기웅
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.427-429
    • /
    • 2000
  • 멜티미디어 표준인 MPEG-2 TS 형태의 테스트 데이터를 자동 생성하는 도구인 TDGT(Test Data Generation Tool)를 설계하고 구현하였다. TDGT는 테스터로부터 기본적인 입력사항을 받아들이고 이를 기반으로 테스트 데이터를 자동 생성한 후 결과물로 테스트 데이터 스크립트 파일과 테스트 데이터 시나리오 파일, 테스트 데이터 커버리지 분석 결과를 테스터에게 제공한다. TDGT는 복잡하고 방대한 테스트 데이터를 생성하는데 요구되는 노력, 시간을 상당히 줄여주며 전문적인 지식이 없는 이도 쉽게 테스트 데이터를 생성할 수 있게 한다. 본 논문은 TDGT가 테스트 데이터를 자동 생성하는 구조와 TDGT의 분석을 제시하였으며 이 시스템의 prototype을 기술한다.

  • PDF

데이터베이스 벤치마크를 위한 데이터 생성기와 성능 평가 (A Data Generator for Database Benchmarks and its Performance Evaluation)

  • 옥은택;정회진;이상호
    • 정보처리학회논문지D
    • /
    • 제10D권6호
    • /
    • pp.907-916
    • /
    • 2003
  • 데이터베이스 벤치마크는 많은 양의 데이터에 대한 효과적 생성을 요구한다. 본 논문은 개발된 데이터 생성기의 시스템 구성도, 데이터 생성 동작, 특성을 기술한다. 본 데이터 생성기 특성은 대용량 데이터 생성 지원, 칼럼 단위 데이터 생성, 다양항 데이터 분포 지원 및 검증, 실데이터 생성 등이다. 또한 타 데이터 생성기들과 기능 관점에서 비교하였다. 마지막으로 대용량 데이터 생성시의 입출력 병목현상 해결을 위해 RAID 시스템과 비 RAID 시스템간의 성능을 실험적으로 비교하였으며, 실험 결과에 근거하여 시스템 구성 가이드를 제시한다.

온톨로지 기반 개인 미디어 메타데이터 자동 생성 (Ontology-based Metadata Automated Generation for Personal Media)

  • 최정화;서희철;박영택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (B)
    • /
    • pp.340-345
    • /
    • 2006
  • 개인 디지털 콘텐츠 증가에 따른 개인 미디어의 관리를 위해 대량의 메타데이터를 자동으로 생성하는 연구가 반드시 필요하다. 본 논문에서는 온톨로지 기반의 추론을 이용하여 개인 미디어 메타데이터를 자동으로 생성하는 방법을 제안한다. 제안한 방법은 부족한 정보로부터 적합한 의미를 추출하여 메타데이터를 자동 생성하므로 콘텐츠관리의 어려운 문제점을 해결한다. 본 논문에서 제안하는 방법을 사용자가 메모를 부착하기만 하면, 온톨로지 기반 추론을 통해 메타데이터를 자동 생성하는 방법으로 다음과 같은 세가지 기술과 특징을 갖는다. 첫째, 개인 미디어 온톨로지를 정의한다. 둘째, 미디어 메타데이터 표준을 정의한다. 미디어의 종류가 다르더라도 정의한 표준의 키워드만 추출할 수 있다면 미디어의 통합관리가 가능하다. 셋째, 메타데이터 자동 생성 기술을 연구한다. 단순히 온톨로지에 정의된 키워드의 의미만을 보지 않고, 온톨로지 기반의 추론엔진을 이용하여 사용자를 중심으로 관련 키워드의 관계를 고려한 메타데이터 생성의 정확성을 높인다. 이러한 기술을 기반으로 시맨틱 검색도 가능하며, 기존의 메타데이터 저작도구와 비교하여 보다 정확한 메타데이터 자동생성과 검색이 가능하다.

  • PDF

사용자 지정 시나리오에 기반 한 차량 위치 데이터 생성기 설계 (Design of Vehicle Location Data Generator based on a User defined Scenario)

  • 정홍진;정영진;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.142-144
    • /
    • 2004
  • 다양한 지리 관측 기술 및 GPS 그리고 무선통신 기술의 발달로 인해, 해수의 흐름 변화 관측이나 PDA를 장착한 물류 차량 관리와 같이 시간에 따라 이동하는 여러 객체들의 변화를 추적하고 관리하는 것이 용이해지고 있다. 그리고. 이로 인해 지능형 교통 시스템. 물류 차량 관리 시스템 등이 활발히 개발되고 있다. 그러나 개발된 시스템에서 차량 운송 계획 평가 및 테스트를 할 경우 차량의 실제 데이터가 부족하기 때문에 적절한 평가 및 다양한 테스트를 하기 힘들고, 실생활에 알맞은 시스템을 만들기 어려움 점이 있다. 이렇게 부족한 차량 데이터를 보충하기 위해, 대부분의 연구에서는 몇몇의 이동 객체 위치 데이터 생성기를 활용하고 있다. 그러나 기존의 이동 객체 데이터 생성기는 단순히 정규 분포, 가우스 분포. 랜덤 데이터. 도로 정보 등을 고려하여 데이터를 생성하기 때문에. 사용자가 물류 수송 계획 등에 활용하기 위해 의도한 시나리오에 따른 데이터를 생성하지 못하고 있다. 따라서, 이 논문에서는 차량 위치 데이터 생성기에 사용자가 지정한 시나리오를 생성, 저장하는 이동 객체 패턴 제공기를 추가하여. 사용자 지정 시나리오를 지원하는 차량 위치 데이터 생성기를 설계한다 이 논문에서 설계된 차랑 위치 데이터 생성기는 사용자가 원하는 계획대로 차량의 위치 정보를 생성함으로써, 물류 수송 및 도로 건설계획 등을 검토할 때 도움이 될 수 있을 것이다.

  • PDF

생성모델의 시각적 최적화를 위한 학습데이터 제작기법 (Learning data production technique for visual optimization of generative models)

  • 조형래;박구만
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.13-14
    • /
    • 2021
  • 본 논문은 생성모델의 학습데이터 제작기법에 대한 실험 및 결과와 향후 관련 연구의 방향을 기술한다. GAN으로 대표되는 생성모델이 아티스트에게 얼마만큼의 만족도와 영감을 주는지를 비교 실험 및 평가하기 위해서는 정제된 학습데이터가 필요하다. 하지만 현실적으로 아티스트의 작품은 데이터 세트를 만들기에는 그 수가 적고 인공지능이 학습하기에도 정제되어있지 않다. 2차 가공작업을 통하여 아티스트의 원본 작업과 유사한 데이터 세트의 구축은 생성모델의 성능향상을 위해 매우 중요하다. 연구의 결과 생성모델이 표현하기 어려운 스타일의 작가 작품을 선정한 뒤 최적의 학습데이터를 만들기 위한 다양한 실험과 기법을 통해 구축한 데이터 세트를 생성모델 알고리즘에 적용하고 실험을 통해 창작자의 작품제작 의도인 작가 진술에 최대한 유사한 이미지의 생성과 더 나아가 작가가 생각하지 못했던 창조적 모방의 결과물을 도출하였고 작가평가를 통해 높은 만족도를 얻었다.

  • PDF

메타데이터 레지스트리 기반의 XML 스키마 생성 기법 (XML Schema Generating Technique based on Metadata Registry)

  • 이태웅;권주흠;백두권
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.181-183
    • /
    • 2002
  • 데이터베이스 개발에 있어서 다른 도구에 의한 다양한 스키마의 생성은 데이터베이스간의 통합을 어렵게 만들고 있다. 이러한 이질적 문제를 해결하고자 메타데이터 레지스트리를 이용한 방안이 활발히 연구되고 있다. 메타데이터 레지스트리(Metadata Registry)는 공유와 전달 목적으로 한 메타데이터를 표준화시킨 것이다. 이는 정보 통합 측면에 대하여 로컬 스키마를 공유화된 메타데이터를 가지고 생성함으로써 글로벌 스키마로의 통합이 가능하다. 따라서 이러한 메타데이터를 기반으로 하여 공유할 수 있는 로컬스키마의 작성 기법이 필요하다. 본 논문에서 메타데이터 레지스트리를 이용하여 XML 스키마를 생성하는 방안을 제안한다. 메타데이터를 XML 스키마로 변환하는 규칙을 제시하고 이를 기반으로 한 XML 스키마 생성 시스템을 설계하였다.

  • PDF

WeXGene: 웹 기반 XML 데이터 생성기 (WeXGene: Web-based XML Data Generator)

  • 신선미;정회진;이상호
    • 정보처리학회논문지D
    • /
    • 제12D권2호
    • /
    • pp.199-210
    • /
    • 2005
  • XML 데이터베이스 시스템 성능 평가를 수행하기 위해서는 다양한 형태의 XML 데이터 생성을 필요로 한다. 기존 XML 데이터 생성기들은 특정 성능 평가에 적용 가능한 데이터만을 생성하고, 그 기능 또한 매우 제한적이다. 본 논문에서는 기존 XML 데이터 생성기들의 제한된 기능을 보완하고 동시에 새로운 기능들을 추가한 새로운 XML 데이터 생성기인 "WeXGene"을 제안한다. WeXGene은 열 단위 또는 행 단위의 데이터를 포함하는 사용자 데이터 화일 및 "SDTD(Symbolic DTD)" 또는 입력 파라미터를 명시한 구조 정의 화일을 이용하여 XML 데이터를 생성한다. 또한 사용자 데이터 화일 없이도 임의의 데이터론 포함하는 XML 데이터 생성이 가능하다. 본 논문은 WeXGene의 구체적인 설계 내용, 구조, 데이터 생성과정 등을 기술한다. 또한 타 XML 데이터 생성기와 기능을 비교 분석하였다.

생성적 적대 네트워크를 이용한 감성인식 학습데이터 자동 생성 (Automatic Generation of Training Corpus for a Sentiment Analysis Using a Generative Adversarial Network)

  • 박천용;최용석;이공주
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.389-393
    • /
    • 2018
  • 딥러닝의 발달로 기계번역, 대화 시스템 등의 자연언어처리 분야가 크게 발전하였다. 딥러닝 모델의 성능을 향상시키기 위해서는 많은 데이터가 필요하다. 그러나 많은 데이터를 수집하기 위해서는 많은 시간과 노력이 소요된다. 본 연구에서는 이미지 생성 모델로 좋은 성능을 보이고 있는 생성적 적대 네트워크(Generative adverasarial network)를 문장 생성에 적용해본다. 본 연구에서는 긍/부정 조건에 따른 문장을 자동 생성하기 위해 SeqGAN 모델을 수정하여 사용한다. 그리고 분류기를 포함한 SeqGAN이 긍/부정 감성인식 학습데이터를 자동 생성할 수 있는지 실험한다. 실험을 수행한 결과, 분류기를 포함한 SeqGAN 모델이 생성한 문장과 학습데이터를 혼용하여 학습할 경우 실제 학습데이터만 학습 시킨 경우보다 좋은 정확도를 보였다.

  • PDF