• 제목/요약/키워드: 데이터 구성요소

검색결과 1,555건 처리시간 0.033초

청소년 과학정보 메타데이터 요소 및 데이터베이스 구축 연구 (A Study on Developing Metadata Elements and Database of the Science Information for Youth)

  • 곽승진
    • 한국문헌정보학회지
    • /
    • 제38권1호
    • /
    • pp.263-279
    • /
    • 2004
  • 본 연구는 메타데이터 시스템이 가지는 효율성을 기반으로 청소년을 대상으로 하는 인터넷 상의 과학정보 메타데이터 요소 추출 및 데이터베이스 시스템을 구축하여 이용자 중심의 타당성 평가를 목적으로 한다. 청소년 과학정보 메타데이터 기술요소 추출은 더블린코어 요소를 기준으로 국내외 주요 메타데이터 프로젝트의 연구 자료를 비교하여 6개의 필수요소와 4개의 부가요소로 구성된 청소년 대상 과학정보 메타데이터 기술요소를 도출하였다. 이를 토대로 청소년을 대상으로 하는 과학정보 메타데이터 데이터베이스를 구축하였으며, 이용자 중심의 평가를 통해 피실험자 대부분이 과학문제 해결에 도움이 된다고 하였다. 이는 본 연구에서 제시하는 청소년 과학정보 메타데이터 서비스 시스템이 청소년들의 과학정보에 대한 접근성을 향상시킬 수 있음을 보여준다고 할 수 있다.

한글 조합성에 기반한 최소 글자를 사용하는 한글 폰트 생성 모델 (Few-Shot Korean Font Generation based on Hangul Composability)

  • 박장경;;최재영
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권11호
    • /
    • pp.473-482
    • /
    • 2021
  • 최근 딥러닝을 이용한 한글 생성 모델이 연구되고 있으나, 한글 폰트의 구조가 복잡하고 많은 폰트 데이터가 필요하여 상당한 시간과 자원을 필요로 할 뿐 아니라 스타일이 제대로 변환되지 않는 경우도 발생한다. 이러한 문제점을 보완하기 위하여, 본 논문에서는 한글의 초성, 중성, 종성의 구성요소를 기반으로 최소 글자를 사용하는 한글 폰트 생성 모델인 CKFont 모델을 제안한다. CKFont 모델은 GAN을 사용하는 한글 자동 생성 모델로, 28개의 글자와 초/중/종성 구성요소를 이용하여 다양한 스타일의 모든 한글을 생성할 수 있다. 구성요소로부터 로컬 스타일 정보를 획득함으로써, 글로벌 정보 획득보다 정확하고 정보 손실을 줄일 수 있다. 실험 결과 스타일을 자연스럽게 변환되지 못하는 경우를 감소시키고 폰트의 품질이 향상되었다. 한글 폰트를 생성하는 다른 모델들과 비교하여, 본 연구에서 제안하는 CKFont는 최소 글자를 사용하는 모델로, 모델의 구조가 간결하여 폰트를 생성하는 시간과 자원이 절약되는 효율적인 모델이다. 구성요소를 이용하는 방법은 다른 언어 폰트의 변환은 물론 다양한 이미지 변환과 합성에도 사용될 수 있다.

이자율 스프레드의 경기 예측력: 문헌 서베이 및 한국의 사례 분석 (Predicting Economic Activity via the Yield Spread: Literature Survey and Empirical Evidence in Korea)

  • 윤재호
    • 경제분석
    • /
    • 제26권3호
    • /
    • pp.1-47
    • /
    • 2020
  • 본 연구는 이자율 스프레드 혹은 이자율 스프레드의 각 구성요소인 기대 스프레드와 기간 프리미엄의 경기 예측력에 관한 1990년대 이후 선행연구를 서베이하고, 한국의 국고채 현물이자율 데이터를 이용하여 이자율 스프레드 및 각 구성요소의 산업생산 증가율, 소비자물가 상승률, 생산갭 등에 대한 예측력에 관한 실증분석을 수행하였다. 먼저 주로 미국 경제를 대상으로 한 선행 연구들을 서베이한 결과 이자율 스프레드는 주요 경제변수들에 대하여 유의한 예측력을 갖고 있으나 1980년대 중반 이후 인플레이션 타깃팅 강화 경향 등에 따라 이자율 스프레드의 경기 예측력이 저하되고 있는 것으로 나타났다. 다음으로 한국 데이터를 대상으로 산업생산 증가율, 소비자물가 상승률, 생산갭 등에 대한 이자율 스프레드 및 각 구성요소의 예측력을 분석한 결과, 특히 이자율 스프레드의 구성요소 중 기간 프리미엄이 유의한 예측력을 갖는 것으로 나타났다. 이자율 스프레드를 이용하여 표본외 분석을 수행한 결과, 예측방정식이 구조적으로 불안정한 것으로 나타났으며, 특히 산업생산지수 예측에 있어서 이자율 스프레드의 분해가 유의한 기여를 하는 것으로 나타났다.

이동 환경에서의 위치 데이터에 기반한 마이닝 시스템 (A Mining System Based on Location Data in Mobile Environments)

  • 백옥현;이준욱;이금우;김영균;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.319-321
    • /
    • 2001
  • 이동 컴퓨팅 환경에서의 응용은 사용자의 위치 정보를 이용해서 개개인의 위치에 따른 서비스를 제공할 것이 요구된다. 기존의 데이터 마이닝 분야에서는 이동 환경에서 발생하는 데이터는 고려되지 않았다. 이 논문에서는 이동 컴퓨팅 환경에서 발생하는 위치 데이터를 기반으로 한 마이닝 기술과 요구사항을 논의하고, 이를 기반으로 위치 데이터에서 유용한 지식을 추출할 수 있는 데이터 마이닝 시스템을 제안한다. 이 시스템은 위치 데이터베이스와 GIS, 사용자 데이터베이스, 컨텐츠 데이터베이스와 통합.연계되어 유기적으로 데이터 마이닝을 수행한다. 또한 사용자와의 상호작용이 가능한 인터페이스와 가시화 도구를 제공한다. 시스템을 구성하는 각각의 구성요소에 대해 기술하며, 마이닝된 결과를 응응할 수 있는 부분을 보인다.

  • PDF

에이전트 기반 3-계층 정보통합 시스템 (An Agent-based 3-Tier Information Integration System)

  • 최요한;정동원;이정욱;김창화;백두권
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.88-90
    • /
    • 2002
  • 정보를 공유하고 표준화하기 위한 MdR(Metadata Registry)은 데이터요소 개념과 데이터요소로 구성되지만 개념간의 관계를 설정하는 방법을 제시하고 있지 않기 때문에 정보통합시 유연성이 제한된다. 반면, 온톨로지(Ontology)는 도메인에 기반한 개념과 이들 개념간의 관계를 설정할 수 있다 그러나 새로운 개념의 추가에 따른 온톨로지 재구성은 시간이나 비용적으로 많은 오버헤드를 초래한다. 이러한 문제점을 해결하기 위하여, 본 논문에서는 위에서 언급한 MdR과 온톨로지의 특징을 결합하여 새로운 데이터 소스의 추가시 유연한 확장성을 제공하는 에이전트 기반의 3-계층 정보 통합 시스템을 제안한다.

  • PDF

전통적 환경과 빅데이터 환경의 데이터 자원 관리 비교 연구 (A Study on Data Resource Management Comparing Big Data Environments with Traditional Environments)

  • 박주석;김인현
    • 한국빅데이터학회지
    • /
    • 제1권2호
    • /
    • pp.91-102
    • /
    • 2016
  • 전통적인 환경에서 데이터 생명주기는 데이터-정보-지식-지혜 전환과정으로 요약된다. 반면에 빅데이터 환경에서 데이터 생명주기는 데이터-통찰-실행 전환과정으로 요약된다. 이러한 전환과정의 차이점은 데이터 생명주기를 지원하는 데이터 자원 관리에도 변화를 요구한다. 본 논문에서는 전통적인 데이터 자원 관리와 비교하여 빅데이터 환경을 위한 데이터 자원 관리를 연구한다. 특히 빅데이터 자원관리를 위한 주요 구성요소를 제안한다.

  • PDF

3차원 인체 포즈 추적을 위한 가려짐에 강인한 관측치 모델 (An Occlusion Robust Observation Model for 3D Human Pose Tracking)

  • 조남규;이성환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.390-392
    • /
    • 2011
  • 가려진 상태에 있는 인체 구성요소에 대한 관측치 모델은 영상에서 인체 구성요소가 차지하고 있는 화소들에 대한 정확한 평가를 해야 하는 저수준에서의 문제와, 권투 동작과 같이 역동적으로 변화하는 인체 구성요소 간의 가려짐 관계에 대한 문맥적인 상황을 같이 고려해야 하는 어려움을 갖고 있다. 본 논문에서는 자체 가려짐이 발생한 상황에서도 강인하게 인체 포즈 추적을 하기 위한 가려짐에 강인한 관측치 모델을 제안한다. 포즈 추적 성능을 비교평가 할 수 있는 HumanEva 데이터 셋을 이용하여 제안하는 관측치 모델의 강인함을 확인하였으며, 기존 방법과의 성능 비교에서도 우수한 추적 성능을 보였다.

CRF를 이용한 영어작문 구성요소 자동분류기법 (Classification of Essay Discourse Elements Using Conditional Random Fields)

  • 이한남;곽동민;박세원;엄진희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 춘계학술발표대회
    • /
    • pp.787-790
    • /
    • 2015
  • 본 연구에서는 글의 구성요소를 추측하는 가장 높은 성능을 나타내는 알고리즘을 제시한다. 실험 방법은 글의 각 문장에 대한 자질을 추출, 자질 선택, 그리고 데이터에 대해 여러 기계학습 알고리즘을 학습시킨 후 성능을 비교하여 진행하였다. 또한 이 중 가장 높은 성능을 보이는 CRF를 기존에 연구되어 있는 성능과도 비교하였다. 마지막으로 CRF가 구성요소를 추측하는 데 있어서 가장 높은 성능을 보이는 이유에 대해 분석하였다. 국내의 유명 어학원 및 토플 웹사이트를 통해 1969개의 토플 에세이를 수집했으며 2명의 전문 평가자를 통해 각 문장을 8개의 분류로 나누었다. 이를 CRF를 적용한 결과 87.2%의 F score가 나왔으며 기존 연구결과, 그리고 다른 알고리즘보다 높은 성능을 보였다.

GLOVE: 대용량 과학 데이터를 위한 분산공유메모리 기반 병렬 가시화 도구 (GLOVE: Distributed Shared Memory Based Parallel Visualization Tool for Massive Scientific Dataset)

  • 이중연;김민아;이세훈;허영주
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권6호
    • /
    • pp.273-282
    • /
    • 2016
  • 가시화 도구는 데이터 입출력, 시각적 변환, 상호작용적인 렌더링의 세 구성요소로 구분할 수 있다. 본 논문에서는 거대용량의 과학 데이터를 실시간으로 가시화하기 위해 가시화 도구의 세 구성요소에 대한 요구사항을 분석, 정의하고 이를 만족시키기 위한 방안을 제시하고자 한다. 특히, 효율적인 가시화 도구의 개발을 위해 공개 소프트웨어 도구를 최대한 활용하고자 하였으며, 서로 다른 용도로 개발된 각 공개 소프트웨어 도구를 통합하여 하나의 가시화 도구로 개발하는 방안과 시공간적인 과학 데이터의 실시간 가시화를 위한 최적화 방법에 대해 논한다. 이를 통해 분산공유메모리 기반의 과학 데이터 병렬 가시화 도구인 GLOVE를 제안하였으며, 유동해석 분야 과학 데이터를 이용한 실험을 통해 GLOVE와 다른 데이터 가시화 소프트웨어와의 성능을 비교 분석했다.

확장된 데이터의 특성과 맥락을 반영한 데이터 리터러시의 재개념화 (Re-conceptualization of data literacy reflecting the expanded data characteristics and context)

  • 최경희;조동성
    • 정보화정책
    • /
    • 제30권3호
    • /
    • pp.49-68
    • /
    • 2023
  • 본 연구는 일반 시민이 지녀야 할 데이터에 대한 이해와 데이터 인력 양성 정책에 필요한 기본 개념 틀을 제공하기 위해 데이터 리터러시를 재개념화했다. 이를 위해 확장된 데이터의 특성을 고찰하였고 데이터 리터러시에 관한 선행연구를 분석하여 전문가 검토를 거친 후, 재개념화된 데이터 리터러시를 제시했다. 재개념화된 데이터 리터러시에는 지식, 기술, 맥락의 세 범주와 범주별 하위 요소로 구성되어 있다. 주로 데이터를 다루는 기술 범주를 강조하였던 기존의 데이터 리터러시의 개념에 데이터의 맥락 범주를 추가하여 맥락의 범위, 시간성, 가치 지향 요소도 명시했다. 또한 지식 범주에도 요소를 구체적으로 제시했다. 재개념화된 데이터 리터러시는 정보화, 인력 양성, 행정 등의 분야에서 교육과정과 교육 프로그램 개발 등에 활용될 수 있을 것이다.