• 제목/요약/키워드: metadata management

검색결과 605건 처리시간 0.021초

온라인 신문 아카이브 연구 국내외 구축 사례를 중심으로 (A Study on the Online Newspaper Archive : Focusing on Domestic and International Case Studies)

  • 송주형
    • 기록학연구
    • /
    • 제48호
    • /
    • pp.93-139
    • /
    • 2016
  • 신문의 역할은 정부의 비판과 감시다. 공공의 문제에 해설과 논평을 하는가 하면 다양한 여론을 형성하고 전달한다. 메타데이터가 확실한 사진 기록물을 담고 있으며, 지역신문의 경우 로컬리티 확보의 중요한 도구다. 신문에 실린 광고와 신문의 편집 역시도 시대의 단면을 보여준다. 이런 신문의 기록학적 가치 때문에 도큐멘테이션 전략을 수립할 때도 신문은 늘 우선적으로 수집이 고려되는 기록물이다. 신문을 보존하고 관리하기 위한 신문 아카이브는 여러모로 중요한 의미를 지닌다. 기자들이 기사를 작성하기 위해 이용하기도 하고, 다양한 학문 분야의 연구를 위한 자료로도 활용이 된다. 신문의 교육적 활용인 NIE에도 이용되지만 신문 아카이브는 디지털 시대에 들어와 더욱 중요한 위치를 차지한다. 미디어 자산을 통합 관리하는 MAM의 핵심에 아카이브가 위치하기 때문이다. 신문 제작뿐만 아니라 신문사 경영 등 전 영역에 걸쳐 새로운 역할을 온라인 아카이브가 하게 될 거라는 전망들이 나오고 있다. 한국에서도 이미 1991년 기사통합 DB인 KINDS가 서비스를 시작했고, 네이버에서는 뉴스 라이브러리라는 온라인 신문 아카이브를 구축해 운영하고 있다. KINDS의 경우 초기에는 뜨거운 반응이 있었으나, 현재는 이용률이 저조한 상태이다. "조선일보", "중앙일보" 등 주요 신문사가 빠져 있고, 이용자 인터페이스도 불편한 점이 많기 때문이다. 하지만 공공예산이 투입되어 무료로 이용할 수 있다는 점이나, 지방지에 대한 접근성 등은 큰 장점이다. 고신문의 경우 국립중앙도서관에서 지속적으로 디지타이징을 하고 있다. 개별 신문사들의 경우도 아카이브라고 하기 민망한 수준이자만 서비스를 제공하고 있다. 미국의 경우 의회도서관에서 국립인문기금과 함께 역사적 신문을 디지타이징 하는 'CHRONICLING AMERICA' 프로젝트를 진행 중이다. 각 주의 대학과 역사협회, 공공 도서관에 기금을 줘 매년 10만 페이지의 지역신문을 디지타이징하고 있다. 영국 역시도 국립도서관이 중심이 되어 'The British NEWSPAPER Archive'라는 온라인 신문 아카이브를 구축하고 있는데, 미국과 달리 유료로 운영된다. 이곳 역시도 합동정보시스템위원회의 공공예산이 투입되었으며, 지금도 구축을 계속 이어가고 있다. 개별 신문사들은 아카이브 솔루션을 구매해 온라인 아카이브를 구축하는 경우가 많다. ProQuest Archiver, Gale Cengage-NewsVault가 대표적인 아카이브 플랫폼으로 신문 자체가 표준화되고 규격화되어 있는 만큼 이를 통한 아카이브 구축도 효율적인 방법으로 보인다. 국내의 온라인 신문 아카이브를 개선하기 위해서는 아카이브에 대한 인식의 전환과 함께 과감한 투자 등이 요구된다.

계산과학공학 플랫폼을 위한 실행-이력 기반의 시뮬레이션 데이터 관리 프레임워크 설계 및 구현 (Design and Implementation of an Execution-Provenance Based Simulation Data Management Framework for Computational Science Engineering Simulation Platform)

  • 마진;이식;조금원;서영균
    • 인터넷정보학회논문지
    • /
    • 제19권1호
    • /
    • pp.77-86
    • /
    • 2018
  • 지난 수년간 KISTI는 EDISON이라는 온라인 시뮬레이션 실행 플랫폼을 통해 사용자들이 다양한 계산과학공학 분야에서 제공된 사이언스 애플리케이션에 대한 시뮬레이션을 수행할 수 있는 서비스를 제공하고 있다. 일반적으로 이러한 시뮬레이션은 대규모 계산을 수반하므로 대용량의 출력 데이터를 생산해 낸다. 온라인 플랫폼에서 이러한 시뮬레이션을 수행 할 때 발생하는 중요한 문제 중 하나는 많은 사용자가 동일한 (또는 거의 변하지 않는) 입력 매개 변수 또는 파일을 사용하여 시뮬레이션 요청 (또는 작업)을 플랫폼에 동시에 제출함으로써 플랫폼에 상당한 부담을 준다는 점이다. 다시 말해, 동일한 컴퓨팅 작업으로 인해 중복 컴퓨팅 및 스토리지 리소스가 빠른 속도로 소모된다는 점이다. 이와 같은 동일한 시뮬레이션 요청으로 인한 과도한 자원 사용 문제를 극복하기 위해, 본 논문은 실행 메타 데이터, 즉 프로비넌스를 기반으로 시뮬레이션 데이터를 효율적으로 관리하기 위한 IceSheet라는 새로운 프레임 워크를 제안한다. IceSheet 프레임워크는 시뮬레이션 실행과 관련된 프로비넌스를 수집하여 저장한다. 수집된 프로비넌스 정보는 중복 시뮬레이션 요청을 제외할 뿐만 아니라 오픈소스 검색 엔진인 ElasticSearch를 통해 기존 시뮬레이션 결과를 검색하는 데도 사용된다. 특히 본 논문은 IceSheet 프레임워크에서 저장된 시뮬레이션 결과를 검색하고 재사용할 수 있는 핵심 구성 요소에 대해 자세히 설명한다. 우리는 온라인 시뮬레이션 실행 플랫폼과 함께 연동하는 검색 엔진을 기반으로 제안된 프레임워크의 프로토타입을 구현하였다. 플랫폼에서 수집된 실제 시뮬레이션 실행 프로비넌스를 기반으로 제안된 프레임워크의 성능 평가를 수행하였다. 플랫폼과 완벽히 연동된 IceSheet 프레임워크는 사용자로 하여금 선택된 시뮬레이션 소프트웨어에 대해 과거에 입력된 매개 변수 값을 빠르게 검색하고 동일한 입력 매개 변수 값이 존재하는 경우 기존의 결과를 곧바로 반환할 수 있도록 할 것으로 기대된다. 따라서 제안된 프레임워크를 통해 이전에 실행된 시뮬레이션과 동일한 요청에 대해 중복 자원 소모를 없애고 실행 시간을 크게 단축시키는 데 도움이 될 것으로 기대한다.

웹툰 콘텐츠 추천을 위한 소비자 감성 패턴 맵 개발 (Development of Customer Sentiment Pattern Map for Webtoon Content Recommendation)

  • 이준식;박도형
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.67-88
    • /
    • 2019
  • 웹툰은 인터넷의 특징적 요소들을 활용하여 제작되는 만화 콘텐츠를 온라인 환경에서 소비 가능한 형태로 유통하는 한국형 디지털 만화 플랫폼이다. 최근 웹툰 산업의 급격한 성장과 함께 웹툰 콘텐츠의 공급량이 기하급수적으로 증가함에 따라, 효과적인 웹툰 콘텐츠 추천 방안의 필요성이 커지고 있다. 웹툰은 회화적 요소와 문학적 요소, 디지털 요소의 복합적 산물로서, 독자로 하여금 재미를 느끼게 하고 웹툰이 연출하는 상황에 이입·공감하게 하는 등 소비자의 감성을 자극하는 디지털 콘텐츠 상품이다. 따라서 웹툰이 소비자에게 전달하는 감성이 소비자가 웹툰을 선택함에 있어 중요한 기준으로 작용할 것이라 기대할 수 있다. 본 연구는 기존에 충분히 논의되지 않았던 소비자 감성을 중심으로, 웹툰 콘텐츠의 효과적인 추천을 지원할 수 있는 소비자 감성 패턴맵의 개발을 목적으로 한다. 본 연구의 수행을 위해 '네이버 웹툰' 플랫폼에서 서비스되는 200개 작품에 대한 메타데이터와 소비자 감성어휘 정보를 수집하였다. 분석 목적에 부합하지 않는 작품을 제외한 127개 작품에 대해 488개의 감성어휘가 수집되었다. 이후 수집된 감성어휘들 간 유사감성 통합, 중복감성 배제 과정을 Bottom-up 접근으로 수행하여 총 63개 감성유형으로 축소된 웹툰 특화 감성지표를 구축하였다. 구축한 감성지표에 대한 탐색적 요인분석을 수행하여 웹툰 유형을 분류할 수 있는 3개의 중요 차원을 도출하고, 이를 기준으로 K-Means 클러스터링을 수행하여 전체 웹툰을 4개 유형으로 분류하였다. 각각의 유형에 대해 웹툰-감성 2-Mode 네트워크를 구축하여 웹툰 유형별로 나타나는 감성 패턴의 특징을 살펴보았으며, 프로파일링 분석을 통해 웹툰 유형별 인사이트와 실무적으로 의미 있는 전략적 시사점을 도출할 수 있었다. 본 연구의 결과를 통해 웹툰의 추천 및 분류의 영역에서 소비자 감성의 활용 가능성을 확인하고, 웹툰 생태계 내 구성원들이 소비자를 보다 잘 이해하고 전략을 수립할 수 있도록 돕는 가이드라인을 제시하였다는 점에서 의의가 있다.

전자문서 정보패키지 구축 사례 연구 - '공인전자문서보관소 전자문서 정보패키지 기술규격 개발 연구'를 중심으로- (A Study on the Establishment Case of Technical Standard for Electronic Record Information Package)

  • 김성겸
    • 기록학연구
    • /
    • 제16호
    • /
    • pp.97-146
    • /
    • 2007
  • 업무 과정에서 생산되는 모든 기록들은 대부분 종이 형태로 작성, 관리해 왔다. 그러나 최근에는 전자적 형태의 기록이 종이를 대신하는 추세이다. 전자기록은 종이기록과 달리 생산과 보관의 편리성을 갖고 있어서 업무 효율성 극대화에 기여한다. 그러나 종이기록처럼 원본과 사본의 뚜렷한 구분이 어렵고 전자적 환경에서 외부 영향에 의해 변경, 훼손될 수 있으며 S/W, H/W 환경이 변화할 때 마다 즉각적인 조치를 취함에 있어 어느 경우에는 막대한 인력과 비용이 발생하기도 한다. 그럼에도 불구하고 업무의 편리성과 생산비용의 효율성으로 인해서 현재 업무 환경에서 전자기록 생산이 차지하는 비중은 날로 높아지고 있다. 이에 정부와 민간, 학계에서는 전자적 형태의 기록이 가지고 있는 장점을 극대화하면서 위험을 최소화할 수 있는 방안 마련에 노력하고 있다. 그 방법 중의 하나가 본 글에서 소개하고 있는 공인전자문서 보관소 사업(이하 공전소 사업)이다. 원활한 공전소 사업를 위해서 행정적으로는 전자기록의 법적 효력 보장과 기술적으로는 전자기록의 신뢰성, 진본성 보장을 우선적으로 확보해야 했다. 그래서 공전소 사업 주체인 산업자원부와 한국전자거래진흥원은 2005년 전자거래법 개정을 통해서 전자기록의 법적 효력 보장 규정을 보완하고 2006년에는 공전소 이용자의 요구인 전자기록의 장기보존과 신뢰성 확보를 위한 연구가 진행됐다. 이러한 공전소의 목적 달성을 위해 공전소 전자문서 정보패키지 연구에서는 디지털 형태의 장기보존을 위한 표준인 ISO 14721 정보패키지 모델을 적용하여, 전자기록이 생산 시점의 SIP, 보관 시점의 AIP, 이용자 활용 시점의 DIP 메타데이터 기능을 마련하고 이들이 공전소 정책에 따라 구현될 수 있도록 정보패키지를 생성, 관리하는 프로세스를 제시하고 있다. 이에 본 글에서는 그동안 진행되었던 연구 내용을 바탕으로 공전소 전자문서 정보패키지의 생성, 진행 과정과 적용 방법, 패키지 간의 흐름도를 소개하고 이를 바탕으로 기록관리 영역에서 지속적으로 연구해야 할 이슈에 대해 제시하고자 한다.

디지털기록유산 평가·수집 모형에 대한 연구 캐나다 'Whole-of-Society 접근법'을 중심으로 (A Study on the Model of Appraisal and Acquisition for Digital Documentary Heritage : Focused on 'Whole-of-Society Approach' in Canada)

  • 박지애;임진희
    • 기록학연구
    • /
    • 제44호
    • /
    • pp.51-99
    • /
    • 2015
  • 기록평가의 목적은 점차 기록의 선별에서 일종의 주제기반의 수집으로 옮겨가고 있다. 특히 현재의 디지털 기술과 웹의 양 질적 발달은 물리적 수집이 아닌 의미적 수집, 즉 데이터의 연계를 통한 수집을 가능하게 하는 원동력이 되고 있다. 이러한 환경하에서 유네스코를 필두로 국제적으로 '기록유산'에 대한 개념정립이 이루어지고 있다. 이러한 동향을 반영하고 있는 것이 캐나다의 LAC인데, 최근 토탈아카이브즈 정신을 부흥시키고자 새로운 평가방법이자 수집방법을 개발하고 있다. 이것이 'Whole-of-Society 접근법'이다. 이 접근법의 특징은 크게 세가지이다. 첫 번째, 기록유산을 대상으로 하며, 물리적 수집이 아니라 의미적 수집을 목적으로 한다. 또한 그 대상이 기록유산이기 때문에 반드시 기록유산기관 간의 협력이 전제되어야 한다. 마지막으로 이미 발생한 사건에 대한 기록화뿐만 아니라 동시대적 사건에 대한 기록화도 가능하다는 것이다. 평가방법으로서의 'Whole-of-Society 접근법'은 사회이론에 착안하여 사회 구성요소를 식별하는 방식이다. 수집방법으로서의 'Whole-of-Society 접근법'은 디지털기록을 대상으로 하나, 아날로그기록의 소장주체로 안내하는 방식으로 그 대상이 확장된다. 이때의 디지털기록이란 '디지털화된(Digitized)' 기록유산과 '본래 디지털인(Born-Digital)' 기록유산을 포함한다. 그리고 평가 단계에서 식별한 사회 구성요소를 메타데이터 요소로 매핑한 다음, 링크드오픈 데이터로 구축함으로써 데이터 간의 연계를 통한 의미적 수집을 실현한다. 마지막으로 이 연구에서는 국내 평가체계는 그 목적이 선별에 비교적 국한되어 있어 사회의 기록화를 실현하기 어렵다는 한계를 지적하였다. 이러한 한계를 극복하기 위하여 Whole-of-Society 접근법을 적용하여 가이드라인을 제시한다. 가이드라인은 총 8단계를 거치는데, 1단계부터 4단계는 기록화 대상의 선정과 기술이며 5단계부터 8단계는 디지털 환경에서 의미적 수집을 위한 준비절차라 할 수 있다. 한편 가이드라인의 실행을 위한 선행과제를 점검하며 국가기록원의 역할을 촉구한다.