• 제목/요약/키워드: standard metadata

검색결과 303건 처리시간 0.023초

맵리듀스 기반 대량 RDF 데이터셋 압축 변환 및 저장 방법 (Compression Conversion and Storing of Large RDF datasets based on MapReduce)

  • 김인아;이경하;이규철
    • 한국정보통신학회논문지
    • /
    • 제26권4호
    • /
    • pp.487-494
    • /
    • 2022
  • 최근 데이터를 활용한 분석에 대한 수요와 함께 분석 데이터인 지식 그래프의 크기는 점차 증가하여, 웹에서 수집한 데이터를 지식 그래프로 추출하였을 때 약 820억개의 엣지(Edge)를 가지는 수준까지 도달하였다. 많은 지식 그래프들은 웹 자원에 대한 메타데이터를 표현하기 위한 W3C 표준인 RDF(Resource Description Framework) 형식으로 표현되며, RDF 특성으로 인해 기존의 RDF 저장소들은 대량 RDF 데이터를 압축하고 저장할 때 처리 시간의 오버헤드가 발생하는 문제점을 가진다. 본 논문은 이러한 문제점을 개선하기 위해, 맵리듀스를 사용하여 대량 RDF 데이터를 정수 ID로 압축 변환하고, 수직 분할하여 저장하는 방법을 제안한다. 본 논문에서 제안한 방법은 RDF-3X와 비교하였을 때 최대 25.2배, H2RDF+와 비교하였을 때 최대 3.7배까지의 높은 성능 향상을 보였다.

공공데이터 포털과 개별 포털 간의 데이터 연계방안 연구 (A Study on Data Linkage Between Public Data Portals and Individual Portals)

  • 박진호 ;한상우
    • 한국비블리아학회지
    • /
    • 제33권4호
    • /
    • pp.249-269
    • /
    • 2022
  • 공공데이터 포털(data.go.kr)은 우리나라 공공데이터 검색과 활용을 위한 통합창구이다. 2021년 행정안전부는 개별 포털 정비방안을 수립한 바 있다. 개별 포털은 공공데이터 외 국내 공공기관들이 구축한 포털을 통칭하는 표현이다. 정비방안에 따라 공공데이터 포털 운영 주체인 한국지능정보사회진흥원은 공공데이터 포털과 개별 포털을 연계하기 위한 운영 및 데이터 연계방안 수립이 필요하다. 이에 본 연구에서는 우리나라 공공데이터 포털, 미국, 영국, 프랑스 데이터 포털 운영현황과 데이터 연계방식을 조사하여 데이터 연계 시 상향식 방법 채택이 효율적임을 제안하였다. 또한, 연계 시 추진해야 하는 구체적인 절차를 데이터 연동 표준방식 결정, 메타데이터 현황분석, 운영 인프라 확충, 데이터 반입 확인, 서비스 개시 5단계로 나누어 제시하였다.

온라인지식정보서비스 품질 향상을 위한 온라인지식정보원 확보 및 연계전략에 관한 연구 (A Study on Gathering & Connecting Online Reference Resources for Improving the Quality of Online Knowledge Service)

  • 노영희
    • 한국비블리아학회지
    • /
    • 제20권2호
    • /
    • pp.17-30
    • /
    • 2009
  • 본 연구에서는 세계 여러 나라에서 이루어지고 있는 지식정보서비스(참고봉사)의 품질을 향상시키기 위한 것으로, 전문사서가 신속 정확하게 정보자원을 검색해서 제공할 수 있도록 하는 정보접근 환경의 조성방안, 즉 온라인 정보자원의 확보 및 효과적 연계방안을 제안하고 있다. 이를 위해 지금까지 논의되었던 이론적 논의와 국내외 온라인참고정보원 구축사례를 분석하고 이로부터 시사점을 도출하였으며, 이를 기반으로 한 본 연구의 제안 내용은 다음과 같다. 1) 온라인참고정보원의 공동 구축 및 공동활용, 2) 분류체계 개발 및 정보원의 주제별 세분화, 3) 메타데이터 등 표준화된 데이터포맷 개발, 4) 온라인참고정보원 선정기준 개발, 5) '질의/응답DB'를 주제별로 분류 제공, 6) 각종 국가 DB 및 오픈액세스 저널 등 연계 가능한 모든 자료를 연계.

효율적인 질의 기반 XML 접근제어 수행 메커니즘 (An Efficient Query-based XML Access Control Enforcement Mechanism)

  • 변창우;박석
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권1호
    • /
    • pp.1-17
    • /
    • 2007
  • 다양한 사용자 및 응용 프로그램들이 XML을 기반으로 정보의 분산과 공유를 요구함에 따라 안전하고 효율적으로 XML 데이타를 접근하는 요구가 중요한 이슈로 부각되고 있다. 특히, 접근제어 규칙을 XPath로 표현함으로써 문서 단위 접근 범위의 한계를 극복하고 문서의 일부분 단위의 접근을 해결하면서 접근제어를 수행할 때 발생될 수 있는 충돌에 대한 해결책을 마련하는 안전성에 초점을 둔 연구들은 많았으나 접근제어를 수행할 때의 효율성에 초점을 둔 연구는 미비하다. 본 논문은 안정성뿐만 아니라 효율성을 고려한 XML 접근제어 시스템을 내용으로 하고 있다. 제안하는 방법은 사용자의 질의와 그 사용자의 접근제어 규칙들 중에 질의와 관련된 접근제어 규칙들만을 선택하게 하고 XPath 2.0에서 지원하고 있는 집합 연산을 적절히 연결시켜 접근 제어 정책을 준수하는 새로운 대체 질의로 변경하는 선처리 방법이다. 본 논문에서 제안하고 있는 방법은 어떠한 XML 데이타베이스 관리 시스템에도 적용가능하며 최소 단위의 접근제어 수행, 구현의 용이성, 낮은 실행시간, 그리고 안전하고 정확한 대체 질의 생성을 보장한다. 이와 같은 장점들을 실험을 통해 분석한다.

국회기록정보 통합관리시스템 개발 방향에 관한 연구 (A Study on the Development of the National Assembly Archives and Records Integrated Management System)

  • 김장환;이은별
    • 한국기록관리학회지
    • /
    • 제15권2호
    • /
    • pp.103-136
    • /
    • 2015
  • 국회기록보존소는 국가기록원에서 개발한 표준기록관리시스템에 보존기록관리 기능을 일부 추가한 형태의 '국회기록관리시스템'을 개발하여 사용하고 있다. 그러나 시스템의 근간이 되는 표준기록관리시스템은 기록관 기능 수행을 위해 개발 보급되었기 때문에 영구기록물관리기관 기능을 동시에 수행하는 국회기록보존소의 업무 기능을 모두 반영하기에는 한계가 있다. 더구나 현행 국회기록관리시스템은 법규에 따라 이관받는 공문서 관리 중심이기 때문에 의정활동과 관련하여 수집한 국회의원 기록물, 역대 국회의장 등으로부터 채록한 구술기록, 영상회의록 등 다양한 유형의 기록물을 등록하여 관리하는 데에 어려움이 있다. 이에 본 연구에서는 현행 국회기록관리시스템의 문제점 분석과 국가기록원, 대통령기록관, 창원시, 문화재청에서 운용 중인 시스템 사례연구를 통해 향후 개발 예정인 국회기록정보 통합관리시스템의 기능 구성, 메타데이터, 목표시스템 등을 제안하였다.

RiC에 대한 기록공동체의 리뷰를 통해 본 기록물 기술표준 개선을 위한 제안 (Improving Archival Descriptive Standard Based on the Analysis of the Reviews by Archival Communities on RiC-CM Draft)

  • 박지영
    • 기록학연구
    • /
    • 제54호
    • /
    • pp.81-109
    • /
    • 2017
  • 본 연구에서는 ICA EGAD의 RiC-CM 초안에 대한 각국 기록 공동체의 검토의견을 통해 ICA EGAD의 의도와 산출물 초안에 대한 중간평가를 알아보고, 국내 기록관리환경에 필요한 시사점을 도출하였다. RiC-CM에 대한 검토의견 중 일부는 웹을 통해 공개되어 접근할 수 있었다. 이 중에는 이탈리아의 경우와 같이 국가차원에서 기록공동체가 모여 논의하고 그 결과를 정리한 경우도 있었고, InterPARES Trust의 대표인 Duranti와 같이 디지털보존과 관련된 전문가 공동체의 의견도 있었다. 또한 AtoM 이용자에게 검토의견을 공개했던 Artefactual과 같이 시스템 구현 측면의 관점을 가진 공동체도 있었고, 호주의 기록관리 노하우를 가진 RecordKeeping Innovation의 대표인 Reed의 의견도 확인할 수 있었다. 그리고 검토의견을 분석하여 현재 국내 환경에서 필요한 세 가지 과제를 제시하였다. 우선 RiC의 유용성을 우리의 환경에서 진단하기 위한 테스트베트 구축을 제안하였다. 그리고 기록물 기술정보를 통해 진본성과 무결성을 확보하기 위한 최소 수준의 데이터 요소 선정 필요성에 대해서 논의할 필요가 있음을 제시하였다. 마지막으로 통합된 기록물 기술 표준의 활용을 위해 행위자와 기능에 관한 충실한 전거 데이터를 구축할 것을 제안하였다.

전자문서 정보패키지 구축 사례 연구 - '공인전자문서보관소 전자문서 정보패키지 기술규격 개발 연구'를 중심으로- (A Study on the Establishment Case of Technical Standard for Electronic Record Information Package)

  • 김성겸
    • 기록학연구
    • /
    • 제16호
    • /
    • pp.97-146
    • /
    • 2007
  • 업무 과정에서 생산되는 모든 기록들은 대부분 종이 형태로 작성, 관리해 왔다. 그러나 최근에는 전자적 형태의 기록이 종이를 대신하는 추세이다. 전자기록은 종이기록과 달리 생산과 보관의 편리성을 갖고 있어서 업무 효율성 극대화에 기여한다. 그러나 종이기록처럼 원본과 사본의 뚜렷한 구분이 어렵고 전자적 환경에서 외부 영향에 의해 변경, 훼손될 수 있으며 S/W, H/W 환경이 변화할 때 마다 즉각적인 조치를 취함에 있어 어느 경우에는 막대한 인력과 비용이 발생하기도 한다. 그럼에도 불구하고 업무의 편리성과 생산비용의 효율성으로 인해서 현재 업무 환경에서 전자기록 생산이 차지하는 비중은 날로 높아지고 있다. 이에 정부와 민간, 학계에서는 전자적 형태의 기록이 가지고 있는 장점을 극대화하면서 위험을 최소화할 수 있는 방안 마련에 노력하고 있다. 그 방법 중의 하나가 본 글에서 소개하고 있는 공인전자문서 보관소 사업(이하 공전소 사업)이다. 원활한 공전소 사업를 위해서 행정적으로는 전자기록의 법적 효력 보장과 기술적으로는 전자기록의 신뢰성, 진본성 보장을 우선적으로 확보해야 했다. 그래서 공전소 사업 주체인 산업자원부와 한국전자거래진흥원은 2005년 전자거래법 개정을 통해서 전자기록의 법적 효력 보장 규정을 보완하고 2006년에는 공전소 이용자의 요구인 전자기록의 장기보존과 신뢰성 확보를 위한 연구가 진행됐다. 이러한 공전소의 목적 달성을 위해 공전소 전자문서 정보패키지 연구에서는 디지털 형태의 장기보존을 위한 표준인 ISO 14721 정보패키지 모델을 적용하여, 전자기록이 생산 시점의 SIP, 보관 시점의 AIP, 이용자 활용 시점의 DIP 메타데이터 기능을 마련하고 이들이 공전소 정책에 따라 구현될 수 있도록 정보패키지를 생성, 관리하는 프로세스를 제시하고 있다. 이에 본 글에서는 그동안 진행되었던 연구 내용을 바탕으로 공전소 전자문서 정보패키지의 생성, 진행 과정과 적용 방법, 패키지 간의 흐름도를 소개하고 이를 바탕으로 기록관리 영역에서 지속적으로 연구해야 할 이슈에 대해 제시하고자 한다.

교수법적 설계 모델링에 기반한 학습 컨텐츠의 XML 웹 서비스 구축 (XML Web Services for Learning ContentsBased on a Pedagogical Design Model)

  • 신행자;박경환
    • 한국멀티미디어학회논문지
    • /
    • 제7권8호
    • /
    • pp.1131-1144
    • /
    • 2004
  • 본 논문에서는 분산 컴퓨팅 환경에서 이기종 교육 시스템들 간의 통합의 어려움, 상호 운영성 결여, 시스템 확장성 부족, 시스템 구축과 유지보수의 비용 증가 등의 문제점을 해결하기 위해 재사용 가능한 학습객체를 CBD방법으로 설계하고 이를 XML 웹 서비스를 이용하여 구축한 방법을 소개한다. 특히 학습 객체를 교수법적 설계 개념을 근거로 재사용 단위를 추출한 후 LIO 학습 객체로 모델링하였다. 모델링을 통해 설정된 LIO 학습 객체는 개요, 사실, 해보기, 퀴즈, 탐구학습, 토론 및 평가의 요소로 구성되고 각 LIO요소별로 재사용할 수 있도록 구축하였다. 이러한 모델링은 학습자에게 학습 활동과 관련한 연관성을 쉽게 얻어 학습 효과를 높일 수 있으며, 수업의 전과정을 설계하는 교수자 혹은 교수 설계자에게 학습 영역이 명확하게 드러나 다른 학습 컨텍스트에서 학습 컨텐츠를 효과적으로 재사용할 수 있어 적시적격의 학습 코스 변경이 가능하게 한다. 또한 분산 환경을 위한 e-러닝 시스템을 구축해야 하는 교육 기관은 인터넷에 접속되어 있는 어떠한 컴퓨터라도 위치하여 호출 및 등록이 가능한 XML 웹 서비스로 구축되어 빠른 비즈니스 변화를 수용하고 협업함으로써 시스템 구축 및 통합 기간이 단축되며 시스템 확장성도 증가시킬 수 있다.

  • PDF

국가 과학기술 표준분류 체계 기반 연구보고서 문서의 자동 분류 연구 (Research on Text Classification of Research Reports using Korea National Science and Technology Standards Classification Codes)

  • 최종윤;한혁;정유철
    • 한국산학기술학회논문지
    • /
    • 제21권1호
    • /
    • pp.169-177
    • /
    • 2020
  • 과학기술 분야의 연구·개발 결과는 연구보고서 형태로 국가과학기술정보서비스(NTIS)에 제출된다. 각 연구보고서는 국가과학기술 표준 분류체계 (K-NSCC)에 따른 분류코드를 가지고 있는데, 보고서 작성자가 제출 시에 수동으로 입력하게끔 되어있다. 하지만 2000여 개가 넘는 세분류를 가지고 있기에, 분류체계에 대한 정확한 이해가 없이는 부정확한 분류코드를 선택하기 십상이다. 새로이 수집되는 연구보고서의 양과 다양성을 고려해 볼 때, 이들을 기계적으로 보다 정확하게 분류할 수 있다면 보고서 제출자의 수고를 덜어줄 수 있을 뿐만 아니라, 다른 부가 가치적인 분석 서비스들과의 연계가 수월할 것이다. 하지만, 국내에서 과학기술표준 분류체계에 기반을 둔 문서 자동 분류 연구 사례는 거의 없으며 공개된 학습데이터도 전무하다. 본 연구는 KISTI가 보유하고 있는 최근 5년간 (2013년~2017년) NTIS 연구보고서 메타정보를 활용한 최초의 시도로써, 방대한 과학기술표준 분류체계를 기반으로 하는 국내 연구보고서들을 대상으로 높은 성능을 보이는 문서 자동 분류기법을 도출하는 연구를 진행하였다. 이를 위해, 과학기술 표준분류 체계에서 과학기술 분야의 연구보고서를 분류하기에 적합한 중분류 210여 개를 선별하였으며, 연구보고서 메타 데이터의 특성을 고려한 전처리를 진행하였다. 특히, 가장 영향력 있는 필드인 과제명(제목)과 키워드만을 이용한 TK_CNN 기반의 딥러닝 기법을 제안한다. 제안 모델은 텍스트 분류에서 좋은 성능을 보이고 있는 기계학습법들 (예, Linear SVC, CNN, GRU등)과 비교하였으며, Top-3 F1점수 기준으로 1~7%에 이르는 성능 우위를 확인하였다.

블록체인기술을 적용한 기록관리 모델 구축 방법 연구 (A Study on the Application of Blockchain Technology to the Record Management Model)

  • 홍덕용
    • 한국기록관리학회지
    • /
    • 제19권3호
    • /
    • pp.223-245
    • /
    • 2019
  • 4차 산업혁명의 기반으로서 블록체인은 다양한 산업에서 신성장 동력을 만들어내는 중요한 핵심 인프라이면서 기술로 자리를 잡아가고 있다. 세계적으로 블록체인에 대한 관심이 기업과 기관의 환경으로 빠르게 확산되고 있다. 본 연구에서는 블록체인 기술의 특성 및 동향을 조사 및 정리하고 공공기관 기록관리부분에 블록체인 기술의 적용이 필요한지 알아보았으며 공공기관의 기록관리분야의 구축절차 및 구축방법을 문헌으로 연구하였다. 최종적으로 기록물관리분야에 블록체인 기술을 적용하여 아카이브체인(Archivechain)모델을 제안하고 어떠한 기대가 예상되는지 기술하고자 하였다. 전자문서의 기록관리 과정을 기록한 트랜잭션이 블록체인에 탑재되게 되면 단편적으로 비연계되었던 기록관리 표준업무처리 과정에 모든 단계 정보를 한 번에 확인 할 수 있다. 전자기록관리시스템에 블록체인기능이 탑재된다면 문서를 획득 등록하여 문서를 생산한 자가 메타데이터 및 정보를 입력한 후 모든 내용을 저장하고 분류한다. 그렇게 되면 생산현황보고의 절차가 간결하게 될 것이고 원문정보공개서비스를 통해 실시간으로 정보를 제공할 수 있다. 아카이브체인(Archivechain)은 전자문서생산시스템과 기록관리시스템이 일체되었다는 가정하에 하이퍼레저 플랫폼을 적용하여 BaaS형 클라우드 인프라를 적용한 모델이다. 스마트하고 전자 정부로 진보하는 기록관리 체계를 만들기 위해 공공 기록물관리의 모든 생애주기에 블록체인에 배치함으로써 흩어져 있는 정보를 하나로 모을 수 있는 문제를 해결 할 수 있다.