• 제목/요약/키워드: data repository

검색결과 435건 처리시간 0.026초

XDBox : XML 객체 저장소의 구현 (XDBox : Implementation of XML object repository)

  • 김종익;최일환;이현숙;김형주
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.572-574
    • /
    • 2003
  • XML은 반 구조 데이터(semi-structured data)의 일종으로 데이터들이 정형화된 구조를 가지고 있지 않다는 것이 특징이다. 기존의 데이터베이스 시스템은 고정된 스키마를 통해 데이터를 저장 관리하기 때문에 정형화된 구조를 가지지 않는 XML 문서를 저장하기에는 한계가 있다. 본 논문에서는 정형화된 구조를 가지지 못하는 XML문서를 효과적으로 저장하고 관리할 수 있는 저장장치를 구현하고 구현 사항에 대해 설명한다. 본 논문의 저장 장치는 XML을 DOM트리로 표현한 후 DOM트리의 각 노드를 객체로 만들어 저장한다. 본 논문의 저장 장치는 다중 사용자를 지원하기 위해 클라이언트 서버 구조로 구성되어 있으며 각 객체는 전용 파일, 관계형 시스템의 LDB등 다양한 하부 구조에 저장될 수 있다.

  • PDF

공공데이터포털 이용자 서비스 현황 분석 및 개선방안 - 시민참여형 데이터포털을 중심으로 - (Analysis of Current Status and Improvement Plans of the User Service in Open Data Portal - Focusing on Citizen Participation Data Portal -)

  • 한희정;황성욱;이정민;오효정
    • 한국도서관정보학회지
    • /
    • 제51권1호
    • /
    • pp.255-279
    • /
    • 2020
  • 최근 공공데이터를 활용하는 이용자의 범위가 전문가부터 학생, 정부 관계자, 일반 시민까지 확대됨에 따라, 공공데이터포털의 역할도 변화하고 있다. 과거의 포털은 단순한 데이터 저장소(Data Repository)로서의 역할에 치우쳐 시민의 참여를 통한 데이터 활용을 높이는 데에는 다소 소홀하였다면, 현재는 이용자가 적극적으로 데이터를 활용할 수 있도록 이해·협업·공유 가치에 방점을 두는 추세이다. 이러한 사회적 흐름에 부응하기 위해 공공데이터 포털은 시민의 참여를 장려할 수 있는 이용자 중심의 서비스 개선 방안을 모색할 필요가 있다. 이에 본 연구는 공공데이터포털에 시민참여를 위한 주요 기능을 규명하고 현재 운영 중인 공공데이터포털 이용자 서비스의 현황을 분석하여 그에 따른 개선방안 제시를 최종 목적으로 한다. 이를 위해 먼저, 문헌 조사를 통해 시민참여를 위해 포털 서비스에서 제공되고 있는 기능들을 조사하고 분류하여 이용자 서비스 유형을 도출한 후, 이를 기준으로 국내외 공공데이터포털 이용자 서비스 현황을 분석하였다. 이를 통해 공공데이터포털이 제공하는 이용자 서비스의 문제점과 방향성에 대한 시사점을 도출한 후 시민참여를 위한 이용자 중심의 공공데이터 포털 서비스 개선방안을 제안하였다.

비정형자료로부터의 평화지수 분석을 통한 한반도 정세 파악 방법 (Interpretation and Prediction of Situations on the Korean Peninsula by Peace Index Analysis from Unstructured Data)

  • 권오병;박다솔;최지혜;이재윤
    • 한국IT서비스학회지
    • /
    • 제12권4호
    • /
    • pp.423-434
    • /
    • 2013
  • Since acquiring intelligence about political situations around the Korea Peninsular in a direct manner is nearly impossible, it is inevitable for the individuals or companies to rely on open and indirect data such as newspapers. However, since the contents in the newspapers are substantially unstructured and very large, conventional content analysis is time-consuming and hence very costly. Hence, this paper aims to propose a sentimental analysis method which computes daily 'peace index' from unstructured data in the newspapers. From the content analysis, words and phrases which represent the sentiment of a nation are carefully identified. To show the feasibility of the idea proposed in this paper, a prototype system with vocabulary repository about political situations was developed for estimating peace index automatically.

Linked Data 기반의 메타데이타 모델을 활용한 소프트웨어 모델 통합 (Software Model Integration Using Metadata Model Based on Linked Data)

  • 김대환;정찬기
    • 한국IT서비스학회지
    • /
    • 제12권3호
    • /
    • pp.311-321
    • /
    • 2013
  • In the community of software engineering, diverse modeling languages are used for representing all relevant information in the form of models. Also many different models such as business model, business process model, product models, interface models etc. are generated through software life cycles. In this situation, models need to be integrated for enterprise integration and enhancement of software productivity. Researchers propose rebuilding models by a specific modeling language, using a intemediate modeling language and using common reference for model integration. However, in the current approach it requires a lot of cost and time to integrate models. Also it is difficult to identify common objects from several models and to update objects in the repository of common model objects. This paper proposes software model integration using metadata model based on Linked data. We verify the effectiveness of the proposed approach through a case study.

Support Vector Machine based on Stratified Sampling

  • Jun, Sung-Hae
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제9권2호
    • /
    • pp.141-146
    • /
    • 2009
  • Support vector machine is a classification algorithm based on statistical learning theory. It has shown many results with good performances in the data mining fields. But there are some problems in the algorithm. One of the problems is its heavy computing cost. So we have been difficult to use the support vector machine in the dynamic and online systems. To overcome this problem we propose to use stratified sampling of statistical sampling theory. The usage of stratified sampling supports to reduce the size of training data. In our paper, though the size of data is small, the performance accuracy is maintained. We verify our improved performance by experimental results using data sets from UCI machine learning repository.

EPCIS Event 데이터 크기의 정량적 모델링에 관한 연구 (A Study on Quantitative Modeling for EPCIS Event Data)

  • 이창호;조용철
    • 대한안전경영과학회지
    • /
    • 제11권4호
    • /
    • pp.221-228
    • /
    • 2009
  • Electronic Product Code Information Services(EPCIS) is an EPCglobal standard for sharing EPC related information between trading partners. EPCIS provides a new important capability to improve efficiency, security, and visibility in the global supply chain. EPCIS data are classified into two categories, master data (static data) and event data (dynamic data). Master data are static and constant for objects, for example, the name and code of product and the manufacturer, etc. Event data refer to things that happen dynamically with the passing of time, for example, the date of manufacture, the period and the route of circulation, the date of storage in warehouse, etc. There are four kinds of event data which are Object Event data, Aggregation Event data, Quantity Event data, and Transaction Event data. This thesis we propose an event-based data model for EPC Information Service repository in RFID based integrated logistics center. This data model can reduce the data volume and handle well all kinds of entity relationships. From the point of aspect of data quantity, we propose a formula model that can explain how many EPCIS events data are created per one business activity. Using this formula model, we can estimate the size of EPCIS events data of RFID based integrated logistics center for a one day under the assumed scenario.

Data Framework Design of EDISON 2.0 Digital Platform for Convergence Research

  • Sunggeun Han;Jaegwang Lee;Inho Jeon;Jeongcheol Lee;Hoon Choi
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제17권8호
    • /
    • pp.2292-2313
    • /
    • 2023
  • With improving computing performance, various digital platforms are being developed to enable easily utilization of high-performance computing environments. EDISON 1.0 is an online simulation platform widely used in computational science and engineering education. As the research paradigm changes, the demand for developing the EDISON 1.0 platform centered on simulation into the EDISON 2.0 platform centered on data and artificial intelligence is growing. Herein, a data framework, a core module for data-centric research on EDISON 2.0 digital platform, is proposed. The proposed data framework provides the following three functions. First, it provides a data repository suitable for the data lifecycle to increase research reproducibility. Second, it provides a new data model that can integrate, manage, search, and utilize heterogeneous data to support a data-driven interdisciplinary convergence research environment. Finally, it provides an exploratory data analysis (EDA) service and data enrichment using an AI model, both developed to strengthen data reliability and maximize the efficiency and effectiveness of research endeavors. Using the EDISON 2.0 data framework, researchers can conduct interdisciplinary convergence research using heterogeneous data and easily perform data pre-processing through the web-based UI. Further, it presents the opportunity to leverage the derived data obtained through AI technology to gain insights and create new research topics.

익명화 방법을 적용한 임상진료문서 등록 기법 연구 (A New Method of Registering the XML-based Clinical Document Architecture Supporting Pseudonymization in Clinical Document Registry Framework)

  • 김일광;이재영;김일곤;곽연식
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권10호
    • /
    • pp.918-928
    • /
    • 2007
  • 진료기관 사이뿐 아니라 국가 경계를 넘어선 환자진료 정보 교류에 대한 요구사항이 세계적으로 증가되고 있으며 이에 대한 연구가 활발하게 진행되고 있다. 본 논문에서는 임상진료문서 등록 저장소에서의 임상진료문서 등록, 조회 방법에 관한 두 가지 기법을 제안한다. 그 첫 번째는, 임상진료문서 관련부속파일에 대한 참조와 처리를 위해 적하목록(Manifest)을 구성하고 사용을 제안하는 것이다. 두 번째는 한층 강화된 임상진료문서 보안전략을 통해 환자 익명성을 제공할 수 있는 방법이다. 전자는 네트워크 장애와 같은 외부요인에도 임상진료문서 관련 부속자료에 대한 로컬 참조를 가능케 하여 끊김 없는 뷰(view)를 구성할 수 있게 한다. 후자는 환자의 신상정보를 담은 임상진료문서 헤더와 진단과 처치 정보를 담은 임상진료문서 바디가 지리적으로 분산된 하나 이상의 저장소에 분리 저장되기 때문에 어느 하나의 저장소가 공격 당하더라도 공격자는 환자의 단편적인 정보만 획득하게 된다. 이는, 결국 환자의 신상정보와 병력정보를 단절시킴으로써 사생활침해의 소지를 줄이고 개인정보보호 효과를 가져올 수 있게 한다.

연구데이터 관리를 위한 OAK 메타데이터 확장 방안 연구 (A Preliminary Study on Extending OAK Metadata for Research Data)

  • 이미화;이은주;노지현
    • 한국도서관정보학회지
    • /
    • 제51권3호
    • /
    • pp.27-51
    • /
    • 2020
  • 본 연구는 국립중앙도서관의 오픈액세스 리포지토리인 OAK에서 연구데이터를 기술할 수 있도록 OAK 메타데이터에 확장 방안을 제안하는데 목적이 있다. 이를 위한 연구방법으로 문헌연구, 사례조사, 관계자와의 면담을 실시하였다. 연구데이터 기술을 위한 기존 OAK 메타데이터의 확장 방안을 다음과 같이 도출하였다. 첫째, 연구데이터를 위한 모델링으로 컬렉션 > 아이템 > 파일로 구성된 기존 구조를 그대로 유지하되 컬렉션은 해당 연구데이터를 묶을 수 있는 상위 그룹으로 두고, 아이템에는 연구데이터의 메타데이터와 파일을 묶어 제공하는 구조를 제안하였다. 둘째, 표준, 사례 기관의 메타데이터를 기존 OAK 메타데이터와 매핑하여 연구데이터의 기술을 위해 OAK에 추가할 필요가 있다고 판단되는 요소를 선별하여 OAK 확장 요소를 도출하였다. 셋째, 구조화된 데이터를 통해 검색이나 추후 통계 등에 활용할 수 있도록 통제어휘집과 구문에 대한 사항도 제시하였다. 본 연구는 연구데이터의 기술을 위해 OAK 메타데이터를 확장함으로써 국내에서 산출되는 연구데이터가 공식적으로 수집·저장·활용될 수 있는 기반을 제공함으로써 국가적으로 연구의 중복을 방지하고 연구 산출물을 공유 및 재활용할 수 있는 정보환경을 구축하는데 기여하였다.

HL7 임상문서구조의 기반 한 간호과정을 위한 간호기록지의 설계 및 구현 (Design and Implementation of a Nursing Records for the Nursing Process for Use Within the Health Level 7 Clinical Document Architecture)

  • 김화선;트란퉁;김형회;이은주;조훈
    • 한국멀티미디어학회논문지
    • /
    • 제9권8호
    • /
    • pp.1054-1066
    • /
    • 2006
  • 본 연구는 의료기관 간 정보공유를 위해 간호분류체계를 기반으로 임상문서구조(Clinical Document Architecture, CDA)의 생성과 새로운 패러다임의 병원정보시스템을 제안하였다. 간호정보 CDA는 간호진단, 간호중재 및 수행과 관련된 코딩시스템을 포함하였고 표준문서의 생성을 위해 CDA생성도구를 개발하였다. 본 연구의 목표는 개인의 필요한 간호정보를 간호전문가에게 실시간으로 제공하여 적정 간호를 제공하며 건강 증진을 도와 생산적인 삶의 질을 향상하는 것이다. 본 연구가 가지는 의의는 첫째, 국제 표준인 HL7 임상문서구조를 사용하기 위한 확장과 정제과정의 연구를 했으며, 둘째, 임상문서구조를 사용할 수 있는 웹 기반의 차세대 병원정보시스템의 구조를 제안하였다. 결론적으로, 임상문서구조에 대한 본 연구로 말미암아 평생전자의무기록(Electronic Health Record)과 임상데이터저장소(Clinical Data Repository)를 포함하여 다양한 보건의료기관 간 간호정보 공유의 기반이 될 것이다.

  • PDF