• 제목/요약/키워드: Metadata Management System

검색결과 346건 처리시간 0.022초

기술과학 분야 학술문헌에 대한 학습집합 반자동 구축 및 자동 분류 통합 연구 (Semi-automatic Construction of Learning Set and Integration of Automatic Classification for Academic Literature in Technical Sciences)

  • 김선우;고건우;최원준;정희석;윤화묵;최성필
    • 정보관리학회지
    • /
    • 제35권4호
    • /
    • pp.141-164
    • /
    • 2018
  • 최근 학술문헌의 양이 급증하고, 융복합적인 연구가 활발히 이뤄지면서 연구자들은 선행 연구에 대한 동향 분석에 어려움을 겪고 있다. 이를 해결하기 위해 우선적으로 학술논문 단위의 분류 정보가 필요하지만 국내에는 이러한 정보가 제공되는 학술 데이터베이스가 존재하지 않는다. 이에 본 연구에서는 국내 학술문헌에 대해 다중 분류가 가능한 자동 분류 시스템을 제안한다. 먼저 한국어로 기술된 기술과학 분야의 학술문헌을 수집하고 K-Means 클러스터링 기법을 활용하여 DDC 600번 대의 중분류에 맞게 매핑하여 다중 분류가 가능한 학습집합을 구축하였다. 학습집합 구축 결과, 메타데이터가 존재하지 않는 값을 제외한 총 63,915건의 한국어 기술과학 분야의 자동 분류 학습집합이 구축되었다. 이를 활용하여 심층학습 기반의 학술문헌 자동 분류 엔진을 구현하고 학습하였다. 객관적인 검증을 위해 수작업 구축한 실험집합을 통한 실험 결과, 다중 분류에 대해 78.32%의 정확도와 72.45%의 F1 성능을 얻었다.

RiC에 대한 기록공동체의 리뷰를 통해 본 기록물 기술표준 개선을 위한 제안 (Improving Archival Descriptive Standard Based on the Analysis of the Reviews by Archival Communities on RiC-CM Draft)

  • 박지영
    • 기록학연구
    • /
    • 제54호
    • /
    • pp.81-109
    • /
    • 2017
  • 본 연구에서는 ICA EGAD의 RiC-CM 초안에 대한 각국 기록 공동체의 검토의견을 통해 ICA EGAD의 의도와 산출물 초안에 대한 중간평가를 알아보고, 국내 기록관리환경에 필요한 시사점을 도출하였다. RiC-CM에 대한 검토의견 중 일부는 웹을 통해 공개되어 접근할 수 있었다. 이 중에는 이탈리아의 경우와 같이 국가차원에서 기록공동체가 모여 논의하고 그 결과를 정리한 경우도 있었고, InterPARES Trust의 대표인 Duranti와 같이 디지털보존과 관련된 전문가 공동체의 의견도 있었다. 또한 AtoM 이용자에게 검토의견을 공개했던 Artefactual과 같이 시스템 구현 측면의 관점을 가진 공동체도 있었고, 호주의 기록관리 노하우를 가진 RecordKeeping Innovation의 대표인 Reed의 의견도 확인할 수 있었다. 그리고 검토의견을 분석하여 현재 국내 환경에서 필요한 세 가지 과제를 제시하였다. 우선 RiC의 유용성을 우리의 환경에서 진단하기 위한 테스트베트 구축을 제안하였다. 그리고 기록물 기술정보를 통해 진본성과 무결성을 확보하기 위한 최소 수준의 데이터 요소 선정 필요성에 대해서 논의할 필요가 있음을 제시하였다. 마지막으로 통합된 기록물 기술 표준의 활용을 위해 행위자와 기능에 관한 충실한 전거 데이터를 구축할 것을 제안하였다.

효율적인 질의 기반 XML 접근제어 수행 메커니즘 (An Efficient Query-based XML Access Control Enforcement Mechanism)

  • 변창우;박석
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권1호
    • /
    • pp.1-17
    • /
    • 2007
  • 다양한 사용자 및 응용 프로그램들이 XML을 기반으로 정보의 분산과 공유를 요구함에 따라 안전하고 효율적으로 XML 데이타를 접근하는 요구가 중요한 이슈로 부각되고 있다. 특히, 접근제어 규칙을 XPath로 표현함으로써 문서 단위 접근 범위의 한계를 극복하고 문서의 일부분 단위의 접근을 해결하면서 접근제어를 수행할 때 발생될 수 있는 충돌에 대한 해결책을 마련하는 안전성에 초점을 둔 연구들은 많았으나 접근제어를 수행할 때의 효율성에 초점을 둔 연구는 미비하다. 본 논문은 안정성뿐만 아니라 효율성을 고려한 XML 접근제어 시스템을 내용으로 하고 있다. 제안하는 방법은 사용자의 질의와 그 사용자의 접근제어 규칙들 중에 질의와 관련된 접근제어 규칙들만을 선택하게 하고 XPath 2.0에서 지원하고 있는 집합 연산을 적절히 연결시켜 접근 제어 정책을 준수하는 새로운 대체 질의로 변경하는 선처리 방법이다. 본 논문에서 제안하고 있는 방법은 어떠한 XML 데이타베이스 관리 시스템에도 적용가능하며 최소 단위의 접근제어 수행, 구현의 용이성, 낮은 실행시간, 그리고 안전하고 정확한 대체 질의 생성을 보장한다. 이와 같은 장점들을 실험을 통해 분석한다.

온라인 신문 아카이브 연구 국내외 구축 사례를 중심으로 (A Study on the Online Newspaper Archive : Focusing on Domestic and International Case Studies)

  • 송주형
    • 기록학연구
    • /
    • 제48호
    • /
    • pp.93-139
    • /
    • 2016
  • 신문의 역할은 정부의 비판과 감시다. 공공의 문제에 해설과 논평을 하는가 하면 다양한 여론을 형성하고 전달한다. 메타데이터가 확실한 사진 기록물을 담고 있으며, 지역신문의 경우 로컬리티 확보의 중요한 도구다. 신문에 실린 광고와 신문의 편집 역시도 시대의 단면을 보여준다. 이런 신문의 기록학적 가치 때문에 도큐멘테이션 전략을 수립할 때도 신문은 늘 우선적으로 수집이 고려되는 기록물이다. 신문을 보존하고 관리하기 위한 신문 아카이브는 여러모로 중요한 의미를 지닌다. 기자들이 기사를 작성하기 위해 이용하기도 하고, 다양한 학문 분야의 연구를 위한 자료로도 활용이 된다. 신문의 교육적 활용인 NIE에도 이용되지만 신문 아카이브는 디지털 시대에 들어와 더욱 중요한 위치를 차지한다. 미디어 자산을 통합 관리하는 MAM의 핵심에 아카이브가 위치하기 때문이다. 신문 제작뿐만 아니라 신문사 경영 등 전 영역에 걸쳐 새로운 역할을 온라인 아카이브가 하게 될 거라는 전망들이 나오고 있다. 한국에서도 이미 1991년 기사통합 DB인 KINDS가 서비스를 시작했고, 네이버에서는 뉴스 라이브러리라는 온라인 신문 아카이브를 구축해 운영하고 있다. KINDS의 경우 초기에는 뜨거운 반응이 있었으나, 현재는 이용률이 저조한 상태이다. "조선일보", "중앙일보" 등 주요 신문사가 빠져 있고, 이용자 인터페이스도 불편한 점이 많기 때문이다. 하지만 공공예산이 투입되어 무료로 이용할 수 있다는 점이나, 지방지에 대한 접근성 등은 큰 장점이다. 고신문의 경우 국립중앙도서관에서 지속적으로 디지타이징을 하고 있다. 개별 신문사들의 경우도 아카이브라고 하기 민망한 수준이자만 서비스를 제공하고 있다. 미국의 경우 의회도서관에서 국립인문기금과 함께 역사적 신문을 디지타이징 하는 'CHRONICLING AMERICA' 프로젝트를 진행 중이다. 각 주의 대학과 역사협회, 공공 도서관에 기금을 줘 매년 10만 페이지의 지역신문을 디지타이징하고 있다. 영국 역시도 국립도서관이 중심이 되어 'The British NEWSPAPER Archive'라는 온라인 신문 아카이브를 구축하고 있는데, 미국과 달리 유료로 운영된다. 이곳 역시도 합동정보시스템위원회의 공공예산이 투입되었으며, 지금도 구축을 계속 이어가고 있다. 개별 신문사들은 아카이브 솔루션을 구매해 온라인 아카이브를 구축하는 경우가 많다. ProQuest Archiver, Gale Cengage-NewsVault가 대표적인 아카이브 플랫폼으로 신문 자체가 표준화되고 규격화되어 있는 만큼 이를 통한 아카이브 구축도 효율적인 방법으로 보인다. 국내의 온라인 신문 아카이브를 개선하기 위해서는 아카이브에 대한 인식의 전환과 함께 과감한 투자 등이 요구된다.

웹툰 콘텐츠 추천을 위한 소비자 감성 패턴 맵 개발 (Development of Customer Sentiment Pattern Map for Webtoon Content Recommendation)

  • 이준식;박도형
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.67-88
    • /
    • 2019
  • 웹툰은 인터넷의 특징적 요소들을 활용하여 제작되는 만화 콘텐츠를 온라인 환경에서 소비 가능한 형태로 유통하는 한국형 디지털 만화 플랫폼이다. 최근 웹툰 산업의 급격한 성장과 함께 웹툰 콘텐츠의 공급량이 기하급수적으로 증가함에 따라, 효과적인 웹툰 콘텐츠 추천 방안의 필요성이 커지고 있다. 웹툰은 회화적 요소와 문학적 요소, 디지털 요소의 복합적 산물로서, 독자로 하여금 재미를 느끼게 하고 웹툰이 연출하는 상황에 이입·공감하게 하는 등 소비자의 감성을 자극하는 디지털 콘텐츠 상품이다. 따라서 웹툰이 소비자에게 전달하는 감성이 소비자가 웹툰을 선택함에 있어 중요한 기준으로 작용할 것이라 기대할 수 있다. 본 연구는 기존에 충분히 논의되지 않았던 소비자 감성을 중심으로, 웹툰 콘텐츠의 효과적인 추천을 지원할 수 있는 소비자 감성 패턴맵의 개발을 목적으로 한다. 본 연구의 수행을 위해 '네이버 웹툰' 플랫폼에서 서비스되는 200개 작품에 대한 메타데이터와 소비자 감성어휘 정보를 수집하였다. 분석 목적에 부합하지 않는 작품을 제외한 127개 작품에 대해 488개의 감성어휘가 수집되었다. 이후 수집된 감성어휘들 간 유사감성 통합, 중복감성 배제 과정을 Bottom-up 접근으로 수행하여 총 63개 감성유형으로 축소된 웹툰 특화 감성지표를 구축하였다. 구축한 감성지표에 대한 탐색적 요인분석을 수행하여 웹툰 유형을 분류할 수 있는 3개의 중요 차원을 도출하고, 이를 기준으로 K-Means 클러스터링을 수행하여 전체 웹툰을 4개 유형으로 분류하였다. 각각의 유형에 대해 웹툰-감성 2-Mode 네트워크를 구축하여 웹툰 유형별로 나타나는 감성 패턴의 특징을 살펴보았으며, 프로파일링 분석을 통해 웹툰 유형별 인사이트와 실무적으로 의미 있는 전략적 시사점을 도출할 수 있었다. 본 연구의 결과를 통해 웹툰의 추천 및 분류의 영역에서 소비자 감성의 활용 가능성을 확인하고, 웹툰 생태계 내 구성원들이 소비자를 보다 잘 이해하고 전략을 수립할 수 있도록 돕는 가이드라인을 제시하였다는 점에서 의의가 있다.

디지털기록유산 평가·수집 모형에 대한 연구 캐나다 'Whole-of-Society 접근법'을 중심으로 (A Study on the Model of Appraisal and Acquisition for Digital Documentary Heritage : Focused on 'Whole-of-Society Approach' in Canada)

  • 박지애;임진희
    • 기록학연구
    • /
    • 제44호
    • /
    • pp.51-99
    • /
    • 2015
  • 기록평가의 목적은 점차 기록의 선별에서 일종의 주제기반의 수집으로 옮겨가고 있다. 특히 현재의 디지털 기술과 웹의 양 질적 발달은 물리적 수집이 아닌 의미적 수집, 즉 데이터의 연계를 통한 수집을 가능하게 하는 원동력이 되고 있다. 이러한 환경하에서 유네스코를 필두로 국제적으로 '기록유산'에 대한 개념정립이 이루어지고 있다. 이러한 동향을 반영하고 있는 것이 캐나다의 LAC인데, 최근 토탈아카이브즈 정신을 부흥시키고자 새로운 평가방법이자 수집방법을 개발하고 있다. 이것이 'Whole-of-Society 접근법'이다. 이 접근법의 특징은 크게 세가지이다. 첫 번째, 기록유산을 대상으로 하며, 물리적 수집이 아니라 의미적 수집을 목적으로 한다. 또한 그 대상이 기록유산이기 때문에 반드시 기록유산기관 간의 협력이 전제되어야 한다. 마지막으로 이미 발생한 사건에 대한 기록화뿐만 아니라 동시대적 사건에 대한 기록화도 가능하다는 것이다. 평가방법으로서의 'Whole-of-Society 접근법'은 사회이론에 착안하여 사회 구성요소를 식별하는 방식이다. 수집방법으로서의 'Whole-of-Society 접근법'은 디지털기록을 대상으로 하나, 아날로그기록의 소장주체로 안내하는 방식으로 그 대상이 확장된다. 이때의 디지털기록이란 '디지털화된(Digitized)' 기록유산과 '본래 디지털인(Born-Digital)' 기록유산을 포함한다. 그리고 평가 단계에서 식별한 사회 구성요소를 메타데이터 요소로 매핑한 다음, 링크드오픈 데이터로 구축함으로써 데이터 간의 연계를 통한 의미적 수집을 실현한다. 마지막으로 이 연구에서는 국내 평가체계는 그 목적이 선별에 비교적 국한되어 있어 사회의 기록화를 실현하기 어렵다는 한계를 지적하였다. 이러한 한계를 극복하기 위하여 Whole-of-Society 접근법을 적용하여 가이드라인을 제시한다. 가이드라인은 총 8단계를 거치는데, 1단계부터 4단계는 기록화 대상의 선정과 기술이며 5단계부터 8단계는 디지털 환경에서 의미적 수집을 위한 준비절차라 할 수 있다. 한편 가이드라인의 실행을 위한 선행과제를 점검하며 국가기록원의 역할을 촉구한다.