• Title/Summary/Keyword: 참조데이터

Search Result 823, Processing Time 0.023 seconds

과학기술데이터 신뢰성 평가를 통한 참조표준 확립에 관한 연구

  • Chae, Gyun-Sik
    • STIMA Bulletin
    • /
    • s.5
    • /
    • pp.24-37
    • /
    • 2006
  • 과학기술테이터는 엄격한 평가기준에 의해 신뢰성과 정확성이 보장된 참조표준(standard reference data)값을 지닐 수 있어야 한다. 참조표준은 측정표준을 바탕으로 구하여진 결과 값을 표준화시키는 작업으로서 테잍의 생산조건, 실험환경, 측정방법, 데이터 처리 등이 검토되어 참조데이터(reference data)와 구분된다. 참조표준은 '공인된 수치데이터'로 표현되고 이는 측정결과의 신뢰도를 정량적으로 나타내는 불확도(uncertainty)로 표기된다.본고에서는 참조표준에 대한 의미를 이해하고,평가되지 않은 과학기술 데이터가 어떤 평가 과정을 거쳐 참조표준으로 분류되는지를 알아보기 위해 소재물성분야를 예로 살펴보았다.

  • PDF

Design of XML Schema for Plasma Properties Reference Data (Plasma 물성 참조데이터를 위한 XML Schema 설계)

  • Park, Jun-Hyoung;Hwang, Sung-Ha;Song, Mi-Young;Yoon, Jung-Sik
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06c
    • /
    • pp.63-65
    • /
    • 2012
  • 플라즈마 물성데이터는 플라즈마 내에서 일어나는 입자(전자, 원자, 이온분자 등) 들의 충돌에 의해 발생되는 데이터로써 플라즈마 현상을 이해하는 필수 데이터이며, 다양한 분야에서 응용되고 있다. 플라즈마 물성데이터를 산업계에서 지속적으로 참조하여 사용할 수 있도록 만든 수치데이터나 통계자료를 플라즈마 물성 참조데이터라고 한다. 기존 플라즈마 물성데이터 센터의 플라즈마 물성 참조데이터 수집평가 시스템은 사용자가 이용하고자 하는 플라즈마 물성 참조데이터를 일일이 자신의 시스템에 맞춰 데이터를 다시 가공해야 하는 어려움이 있어 데이터를 효율적인 관리하고 다양한 분야에 적용하기 위한 XML Schema 설계 대해 논의한다.

Scalar First Replacement Strategy for Reference Prediction Table Used in Prefetching Streaming Data (스트리밍 데이터의 선인출에 사용되는 참조예측표의 스칼라 우선 교체 전략)

  • Lim, Chul-hoo;Chon, Young-Suk;Kim, Suk-il;Jeon, Joong-nam
    • The KIPS Transactions:PartA
    • /
    • v.11A no.3
    • /
    • pp.163-172
    • /
    • 2004
  • Multimedia applications tend to access their data as a streaming pattern with regular intervals. This characteristic can be utilized in prefetching the multimedia data into cache memory so as to reduce their execution speeds. The reference-prediction prefetch algorithm predicts the memory address that seems to be used in the next time based on the previous history of memory references stored in the prediction reference table. This paper proposes a strategy to manipulate the reference prediction table which contains all of the data reference instructions to scalar and streaming data. We have recognized that the scalar reference instructions do not contribute to the data prefetching algorithm. Therefore, when replacing an element in the reference prediction table, the proposed algorithm preferentially selects the scalar reference instruction before the stream reference instruction. It makes the stream reference instruction to stay for a long time compared to the FIFO replacement policy, and eventually improves the performance of data prefetching.

Development of Standard Reference Data for Industrial Application (산업에서 활용되는 참조표준 개발 현황)

  • Kim, Chang-Geun;Park, Ju-Geun;Chae, Gyun-Sik;Bang, Geon-Ung
    • Proceedings of the Korean Society for Emotion and Sensibility Conference
    • /
    • 2009.05a
    • /
    • pp.19-20
    • /
    • 2009
  • 국가참조표준센터가 2006년에 설립된 이후 우리나라에서 필요로 하는 참조표준 개발이 궤도에 오르기 시작하였다. 일차적으로 참조표준을 개발하기 위한 기본 체제로서 국가참조표준체계가 지경부 고시에 의해 확립되었고 이 체계에 따라 현재 12개의 데이터센터가 지정되어 각기 분야별로 참조표준을 확립하고 있다. 본 논문에서는 참조표준 개발 현황을 간략하게 소개함과 동시에 산업계에서 이것이 실제적으로 어떻게 활용되고 있는지 제시하였다.

  • PDF

과학기술데이터의 신뢰성

  • Kim, Chang-Geun;Bang, Geon-Ung;Chae, Gyun-Sik;Park, Ju-Geun
    • Proceedings of the Korean Vacuum Society Conference
    • /
    • 2010.08a
    • /
    • pp.31-31
    • /
    • 2010
  • 국가표준기본법에 명시되어 있는 3대 표준분야는 측정표준, 성문표준, 참조표준이다. 특히, 참조표준은 엄밀한 평가 과정을 거쳐 그 신뢰성이 보장된 수치 데이터를 의미한다. 데이터의 신뢰성을 보장하기 위해서는 데이터의 평가기준 수립, 평가기준에 의거한 데이터 평가 과정을 거쳐야 한다. 이러한 체계를 갖추기 위하여 국가참조표준센터가 2006년에 설립되었으며 2010년 현재 17개의 데이터센터가 지정되어 각 담당 분야별로 참조표준을 확립하기 위한 작업을 수행하고 있다. 본 발표에서는 참조표준의 개념, 체계 그리고 현황에 대해 알아보고자 한다.

  • PDF

BERT-based Data Augmentation Techniques for Korean Coreference Resolution (한국어 상호참조해결을 위한 BERT 기반 데이터 증강 기법)

  • Kim, Kihun;Lee, Changki;Ryu, Jihee;Lim, Joonho
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.249-253
    • /
    • 2020
  • 상호참조해결은 문서 내에 등장하는 모든 멘션 중에서 같은 의미를 갖는 대상(개체)들을 하나의 집합으로 묶어주는 자연어처리 태스크이다. 한국어 상호참조해결의 학습 데이터는 영어권에 비해 적은 양이다. 데이터 증강 기법은 부족한 학습 데이터를 증강하여 기계학습 기반 모델의 성능을 향상시킬 수 있는 방법 중 하나이며, 주로 규칙 기반 데이터 증강 기법이 연구되고 있다. 그러나 규칙 기반으로 데이터를 증강하게 될 경우 규칙 조건을 만족하지 못했을 때 데이터 증강이 힘들다는 문제점과 임의로 단어를 변경 혹은 삭제하는 과정에서 문맥에 영향을 주는 문제점이 발생할 수 있다. 따라서 본 논문에서는 BERT의 MLM(Masked Language Model)을 이용하여 기존 규칙기반 데이터 증강 기법의 문제점을 해결하고 한국어 상호참조해결 데이터를 증강하는 방법을 소개한다. 실험 결과, ETRI 질의응답 도메인 상호참조해결 데이터에서 CoNLL F1 1.39% (TEST) 성능 향상을 보였다.

  • PDF

Domain adaptation of Korean coreference resolution using continual learning (Continual learning을 이용한 한국어 상호참조해결의 도메인 적응)

  • Yohan Choi;Kyengbin Jo;Changki Lee;Jihee Ryu;Joonho Lim
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.320-323
    • /
    • 2022
  • 상호참조해결은 문서에서 명사, 대명사, 명사구 등의 멘션 후보를 식별하고 동일한 개체를 의미하는 멘션들을 찾아 그룹화하는 태스크이다. 딥러닝 기반의 한국어 상호참조해결 연구들에서는 BERT를 이용하여 단어의 문맥 표현을 얻은 후 멘션 탐지와 상호참조해결을 동시에 수행하는 End-to-End 모델이 주로 연구가 되었으며, 최근에는 스팬 표현을 사용하지 않고 시작과 끝 표현식을 통해 상호참조해결을 빠르게 수행하는 Start-to-End 방식의 한국어 상호참조해결 모델이 연구되었다. 최근에 한국어 상호참조해결을 위해 구축된 ETRI 데이터셋은 WIKI, QA, CONVERSATION 등 다양한 도메인으로 이루어져 있으며, 신규 도메인의 데이터가 추가될 경우 신규 데이터가 추가된 전체 학습데이터로 모델을 다시 학습해야 하며, 이때 많은 시간이 걸리는 문제가 있다. 본 논문에서는 이러한 상호참조해결 모델의 도메인 적응에 Continual learning을 적용해 각기 다른 도메인의 데이터로 모델을 학습 시킬 때 이전에 학습했던 정보를 망각하는 Catastrophic forgetting 현상을 억제할 수 있음을 보인다. 또한, Continual learning의 성능 향상을 위해 2가지 Transfer Techniques을 함께 적용한 실험을 진행한다. 실험 결과, 본 논문에서 제안한 모델이 베이스라인 모델보다 개발 셋에서 3.6%p, 테스트 셋에서 2.1%p의 성능 향상을 보였다.

  • PDF

A Study on the Quality Control and Operating System of Standard Reference Data(SRD) (참조표준데이터 품질관리 및 운영체계에 관한 연구)

  • Chae Kyun-shik;Lee Eung-Bong
    • Journal of Korean Library and Information Science Society
    • /
    • v.36 no.2
    • /
    • pp.283-305
    • /
    • 2005
  • Data produced during scientific and technical activities usually have value as standard reference data (SRD) which is a well-documented numeric value assessed for reliability and accuracy. The main criteria in the evaluation for SRD is how well their production is documented including a sample preparation, measurement method, data processing and so on, other than reference data. SRD is represented as a certified numeric value with uncertainty. In this study, the SRD in the area of material properties was introduced to provide understanding of SRD and its evaluation method. Also the national SRD system was studied. The national SRD system is composed of the center for the SRD, the data centers, and the committee. The role and task of those components were studied. The legislational and systematic supports for the system were proposed in this study.

  • PDF

Design of Web based Plasma Properties Reference Data Collection and Evaluation System (Web기반 Plasma 물성 참조데이터 수집평가 시스템 설계)

  • Park, Jun-Hyoung;Hwang, Sung-Ha;Jang, Won-Suk;Kwon, Duek-Chul;Song, Mi-Young;Yoon, Jung-Sik
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.04a
    • /
    • pp.1062-1065
    • /
    • 2010
  • Plasma 물성 데이터는 Plasma내에서 일어나는 입자(전자, 원자, 이온, 분자 등)들의 충돌에 대한 데이터로써 Plasma 발생 장치 설계 및 제어의 핵심 요소이며, Plasma 공정조건 확립을 위한 필수 정보가 된다. 참조표준은 과학기술데이터나 정보에 대하여 정확도와 신뢰도에 대한 분석 및 평가가 이루어진 공인데이터를 말한다. 이러한 플라즈마 물성 정보를 체계적으로 관리하고 신뢰성 있는 데이터를 필요로 하는 산업체에 지원하기 위하여 특정 참조표준과 참조데이터로 제정, 보급하는 Plasma 물성 참조표준 수집평가 시스템이 필요하고, 이에 대한 설계가 필요하다.

Expected-Cost-based Cache Replacement Algorithm (기대비용기반 캐쉬교체 알고리즘)

  • 이정준;황규영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.240-242
    • /
    • 1999
  • 웹 데이터는 기존의 페이지를 기반으로 한 교체 알고리즘이 고려하지 않은 다양한 데이터 아이템의 크기, 네트워크 밴드위쓰 등으로 인한 다양한 참조 비용과 데이터의 만기시간(expiration time)을 갖는다. 그러나, 기존의 연구에서는 만기시간이 미치는 영향에 대한 연구가 초보적인 수준이다. 본 논문에서는 만기시간이 참조비용에 미치는 영향을 반영한 기대비용기반 캐쉬교체 알고리즘을 제안한다. 제안한 알고리즘은 만기시간내에 참조되어 캐쉬효과를 얻을 확률을 이용하여 참조비용의 기대값을 구하고, 이 값을 비교하여 교체대상을 선정한다. 제안한 알고리즘은 데이터의 크기, 참조비용 뿐만 아니라 만기시간의 영향을 확률적으로 정확히 반영하므로, 기존의 교체 알고리즘보다 우수한 성능을 보인다.

  • PDF