• 제목/요약/키워드: Data Repository Registry

검색결과 16건 처리시간 0.022초

Global Data Repository Status and Analysis: Based on Korea, China and Japan Data in re3data.org

  • Kim, Suntae
    • International Journal of Knowledge Content Development & Technology
    • /
    • 제8권1호
    • /
    • pp.79-89
    • /
    • 2018
  • We collected and analyzed data from e3data.org, which is a global registry of data repository services. We analyzed data profile for three leading Asian economies-Korea, China, and Japan-against the reference data for other participating countries. In particular, we examined how individual countries contribute to the repository, organizational type, versioning and product quality management, and subject tagging. We come to the conclusion that all three Asian countries still fall short in terms of involvement. As for participating institutions, there are 7 from Korea, 64 from China, and 120 from Japan. Among Chinese organizations, 3 are profit, 61 non-profit, and 37 organizations (which yields 1.8%) are involved in repository building. In Japan, there is 1 is commercial and 119 non-profit organizations, of which 57 (3.0%) are involved in repository building. All 7 organizations from Korea are non-profit, and 6 of them (0.3%) are involved in repository building. As regards versioning and product quality management, Korea, China, and Japan are up to par with other countries. Subject analysis reveals that Korea contributes more to geosciences, Japan to physics and geosciences, while China, unlike Korea and Japan, is more active in life sciences. It is hoped that this study will help planning domestic infrastructure for research data repositories with proper consideration for specific research domains and national characteristics.

Registry Metadata Quality Assessment by the Example of re3data.org Schema

  • Kim, Suntae;Choi, Myung-Seok
    • International Journal of Knowledge Content Development & Technology
    • /
    • 제7권2호
    • /
    • pp.41-51
    • /
    • 2017
  • Nowadays, research data repositories (RDR) have become progressively widespread all over the world. To expand repository services and build up inbound linking strategy, organizations list their repositories with so called Global Registries. Accordingly, such registries should be carefully described by the related data. In this study, I explore the metadata schema of re3data.org. I collect and analyze descriptions from the listed repositories, and come up with some suggestions concerning possible improvements to the metadata schema. To accomplish this, I develop a crawler program, which collects necessary data from the re3data.org. Based on the analysis results, I have identified two issues that required elements is missing, one issue that required element value is missing when the corresponding property is applied, five inconsistency issues with re3data controlled vocabulary, six issues with undescribed optional elements, and two inconsistency issues between the elements and their attributes which do not pair with. I believe this discussion can facilitate improvements to the existing re3data.org schema and further help researchers who analyze data repository trends.

Analysis of the Current Status of Data Repositories in the Field of Ecological Research

  • Kim, Suntae
    • Proceedings of the National Institute of Ecology of the Republic of Korea
    • /
    • 제2권2호
    • /
    • pp.139-143
    • /
    • 2021
  • In this study, data repository information registered in re3data (re3data.org), a research data registry, was collected. Based on collected data, the current status was analyzed for 354 repositories (approximately 14% of total repositories) in the field using keywords in the ecological field suggested by two experts. Major metadata formats used to describe data in ecological research data repositories include Federal Geographic Data Committee Content Standard for Digital Geospatial Metadata (FGDC/CSDGM), Dublin Core, ISO 19115, Ecological Metadata Language (EML), Directory Interchange Format (DIF), Darwin Core, Data Documentation Initiative (DDI), and DataCite Metadata Schema. The number of ecological repositories according to country is 102 in the US, 34 in Germany, 31 in Canada, and one in Korea. A total of 771 non-profit organizations and 12 for-profit organizations are involved in the construction of the ecological field research data repository. Data version control ratio of the ecological field research data repositories registered in re3data was analyzed to be somewhat higher (86.6%) than the total ratio (83.9%). Results of this study can be used to establish policies to build and operate a research data repository in the ecological field.

XMDR 기반의 통합 검색을 위한 데이터 그리드 Wrapper 설계 (The Design of Data Grid Wrapper for Integrated Retrieve based on XMDR)

  • 황치곤;정계동;최영근
    • 한국정보통신학회논문지
    • /
    • 제12권5호
    • /
    • pp.921-929
    • /
    • 2008
  • 최근 데이터 통합을 위한 방안으로 데이터 이질성을 해결하기 위한 많은 연구가 진행되고 있다. 우리가 제안하는 시스템의 구성요소는 XMDR 래퍼와 XMDR 저장소이다. XMDR 래 퍼는 XMDR의 표준 정보를 기반으로 인터페이스를 생성하고, 표준 정보와 로컬스키마 간의 매핑정보를 이용하여 글로벌 XMDR 쿼리와 로컬 쿼리 간의 상호변환을 수행함으로써 기존 시스템의 이질성을 해결한다. XMDR 저장소는 표준 정보와 로컬간의 매핑정보를 관리하는 XMDR과 수행된 결과를 저장하는 Proxy DB로 구성되어 있다. 사용자는 동일한 인터페이스를 사용하고, XMDR 래퍼가 XMDR의 메타 시멘틱 온톨로지를 이용하여 스키마의 이질성을 해결뿐만 아니라 인스턴스 시멘틱 온톨로지를 통한 값의 의미에 따른 이질성도 고려함으로써 중복된 질의를 수행하지 않아도 된다. 따라서 본 논문에서는 이러한 데이터 이질성을 해결하고 효율적인 데이터 통합을 위한 데이터 그리드 래퍼를 제안한다.

메타데이터 레지스트리 기반의 분산 정보 통합 시스템 설계 및 구현 (Design and Implementation of A Distributed Information Integration System based on Metadata Registry)

  • 김종환;박혜숙;문창주;백두권
    • 정보처리학회논문지D
    • /
    • 제10D권2호
    • /
    • pp.233-246
    • /
    • 2003
  • 중개기 기반 정보 통합 시스템은 서로 다른 지역 정보 시스템의 유연한 통합을 지원하나, 질의 처리시 최적화 측면과 지역 스키마 정보에 관한 메타데이터 표준화 측면에는 그리 큰 비중을 두지 않았다. 이러한 점을 개선하기 위해 제안된 분산 정보 통합 시스템은 질의 처리시 최적화 측면을 위해 질의 캐싱을 사용하며, 지역 스키마 정보에 관한 메타데이터 표준화 측면을 위해 ISO/IEC 11179 기반의 메타데이터 레지스트리를 사용한다. 이 시스템은 분산된 이기종의 비즈니스 정보 시스템들을 논리적으로 통합하여 사용자가 필요로 하는 통합된 정보를 웹 기반으로 제공한다. 이러한 시스템을 시스템 재사용성의 향상과 유지보수의 용이함을 위해 계층적 패턴을 사용하여 3계층 표현 방식 아키텍처로 표현하였고, 3계층 아키텍처의 핵심 요소들의 기능성과 흐름을 효과적으로 표현하기 위하여 UML 방법론을 확장한 EPEM 방법론을 이용하여 설계하였다. 또한 제안한 시스템의 구체적인 한 예로서, 공급망 관리 도메인에 적용하여 웹 기반으로 구현하였다. 따라서 분산 정보 통합 시스템은 질의 처리 속도 향상을 위해 질의 함수 관리기와 질의 함수 저장소를 통하여 질의 캐싱 기능을 제공하였고, 의미 이질성 해결을 위해 ISO/IEC 11179 기반의 메타데이터 레지스트리와 스키마 레파지토리를 이용함으로써 스키마 이질성과 데이터 이질성을 해결하였다.

효율적인 비즈니스 프로세스 운용을 위한 XMDR 데이터 허브 설계 (The Design of XMDR Data Hub for Efficient Business Process Operation)

  • 황치곤;정계동;최영근
    • 정보처리학회논문지D
    • /
    • 제18D권3호
    • /
    • pp.149-156
    • /
    • 2011
  • 최근 기업의 시스템들은 데이터 공유와 협업을 위해 통합의 필요성을 제기하고 있다. 통합을 위한 방법론으로 서비스 통합을 위한 서비스 지향 아키텍처와 서비스에 사용되는 데이터의 통합을 위한 마스터 데이터가 등장했다. 본 논문은 BP(Business Process)를 효율적으로 운용하기 위한 방안을 제시한다. 우리는 BP를 지원하기 위한 지식 저장소로 XMDR(eXtended Meta Data Registry)과 이를 운용하기 위한 데이터 허브를 구성한다. XMDR은 데이터 통합을 위한 MDM(Master Data Management)을 관리하고, 데이터 간의 이질성을 해결하고, 업무 간의 연관관계를 효율적으로 제공한다. 이것은 MDR(Meta Data Registry), 온톨로지, BR(Business Relations)으로 구성된다. MDR은 구조적 이질성을 해결하기 위한 메타 데이터간의 관계성을 기술한다. 온톨로지는 의미적 이질성과 데이터 간의 관계성을 기술한다. BR은 업무 간의 관계성을 기술한다. XMDR 데이터 허브는 마스터 데이터의 관리를 지원하고, 프로세스 간의 상호작용을 효율적으로 지원할 수 있다.

생태 분야 데이터 리포지터리 운영 현황 분석 및 EcoBank 서비스 제안 (Analysis of Ecological Data Repository Operation Status and EcoBank Service Proposal)

  • 김주섭;강효숙;김선태
    • 한국문헌정보학회지
    • /
    • 제57권4호
    • /
    • pp.289-310
    • /
    • 2023
  • 데이터 공유 및 재사용은 필수가 되었다. 데이터 리포지터리는 이러한 데이터 공유 및 재사용을 위한 핵심 도구이다. 본 연구의 목적은 국립생태원이 구축 및 운영 중인 EcoBank의 서비스를 제안하기 위함이다. 연구 목적을 달성하기 위하여 re3data.org에 등록된 생태 분야 해외 데이터 리포지터리 123개 중 10개를 선정하여 조사 및 분석하였다. 분석 결과 3가지 서비스가 공통으로 도출되었다. 3가지 서비스는 첫째, 연구데이터 정책, 둘째, 연구데이터 품질 검토 그리고 연구데이터 관리 교육 및 워크숍으로 구성된다. 여기에 EcoBank의 글로벌한 데이터 공유를 위해서는 re3data.org와 같은 데이터 리포지터리 레지스트리에 등록을 해야 하며 리포지터리의 신뢰성 및 품질 확보를 위한 인증을 추진할 것을 제안해 본다.

익명화 방법을 적용한 임상진료문서 등록 기법 연구 (A New Method of Registering the XML-based Clinical Document Architecture Supporting Pseudonymization in Clinical Document Registry Framework)

  • 김일광;이재영;김일곤;곽연식
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권10호
    • /
    • pp.918-928
    • /
    • 2007
  • 진료기관 사이뿐 아니라 국가 경계를 넘어선 환자진료 정보 교류에 대한 요구사항이 세계적으로 증가되고 있으며 이에 대한 연구가 활발하게 진행되고 있다. 본 논문에서는 임상진료문서 등록 저장소에서의 임상진료문서 등록, 조회 방법에 관한 두 가지 기법을 제안한다. 그 첫 번째는, 임상진료문서 관련부속파일에 대한 참조와 처리를 위해 적하목록(Manifest)을 구성하고 사용을 제안하는 것이다. 두 번째는 한층 강화된 임상진료문서 보안전략을 통해 환자 익명성을 제공할 수 있는 방법이다. 전자는 네트워크 장애와 같은 외부요인에도 임상진료문서 관련 부속자료에 대한 로컬 참조를 가능케 하여 끊김 없는 뷰(view)를 구성할 수 있게 한다. 후자는 환자의 신상정보를 담은 임상진료문서 헤더와 진단과 처치 정보를 담은 임상진료문서 바디가 지리적으로 분산된 하나 이상의 저장소에 분리 저장되기 때문에 어느 하나의 저장소가 공격 당하더라도 공격자는 환자의 단편적인 정보만 획득하게 된다. 이는, 결국 환자의 신상정보와 병력정보를 단절시킴으로써 사생활침해의 소지를 줄이고 개인정보보호 효과를 가져올 수 있게 한다.

ebXML 환경에서의 지식기반 검색 시스템 (Knowledge Based Search System In the ebXML Environment)

  • 최형림;김현수;최현덕
    • 한국전자거래학회지
    • /
    • 제7권3호
    • /
    • pp.75-91
    • /
    • 2002
  • As B2B (Business to business) develops swiftly, at home as well as in other advanced countries, plans for activating Electronic business are made and proceeded in a national viewpoint. However, it is essential task for the construction, advancement and activation of B2B framework to make an efficient search for differently built -up data from B2C and thus to look for optimal business partner suitable for his/her own business. For this, in the last Aug. of 2001, government has also referred to ebXML, the exchange model for electronic business data based on XML, as a suggestion for B2B framework. The purpose of this study is to develop search system for efficient choice of business partner and this will play an important role for data processing and competitiveness strengthening of small and medium enterprises. Meanwhile, this system is built up by using systemic characteristics registered in ebXML Registry/Repository and ‘question-expanding’ searching ways based on the particulars of business profiles for both objectiveness and maximum efficiency of search result.

  • PDF

Service Discovery Using Broadcasting Data Channel

  • Hasan, Md. Kamrul;Rubaiyeat, Husne Ara;Lee, Sungyoung;Lee, Young-Koo
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.312-313
    • /
    • 2010
  • Traditional service discovery mechanisms so far necessitate centralized registry containing all the service descriptions. Though centralized service registration is intuitive, it does not facilitate users in their usual ways of doing things. Moreover, centralized repository is not scalable for high query rate. We propose that service description be broadcast through the advertising data channels so that computers can parse and queue the service descriptions interesting to the users. The current technologies such as Digital Media Broadcast (DMB), Car Navigation Systems and Wireless Broadband can bring our idea to reality.