• 제목/요약/키워드: Digital Libraries

검색결과 508건 처리시간 0.026초

매체 플랫폼 기반 자료의 수집 및 적용 방안 연구 (A Study on the Collection and Application Measures for Media Platform Based Materials)

  • 노영희;정영미;손애경;장인호;차현주
    • 한국도서관정보학회지
    • /
    • 제55권1호
    • /
    • pp.193-214
    • /
    • 2024
  • 본 연구에서는 국립중앙도서관에서의 매체 플랫폼 기반 자료의 수집 및 이를 적용하기 위한 방안을 제안하였다. 이를 위해 첫째, 국립중앙도서관을 포함한 국내 매체 플랫폼 기반 자료수집 현황 및 한계를 분석하였다. 둘째, 문헌조사를 통해 매체 플랫폼 기반의 디지털 콘텐츠 현황 및 유형을 조사하였다. 셋째, 해외 주요 도서관 사례에서 현재 국립중앙도서관 온라인 자료수집 지침에 포함되어 있지 않은 매체 플랫폼 기반의 자료 유형을 도출하고 해당 자료에 대한 정책을 검토하였다. 넷째, 연구결과를 기반으로 매체별 수집대상 및 범위 정의, 수집 방법 등 수집 개요(안)을 제시하였다. 다섯째, 수집 개요(안)을 적용하기 위한 다음의 방안을 제안하였다: 1) 매체 플랫폼 기반 자료수집의 명확한 법적 근거 마련이 요구된다, 2) 매체 플랫폼 기반 자료별 수집 지침 개발 및 제시가 필요하다, 3) 매체 플랫폼 기반 자료의 수집 도구 개발 및 인프라 구축이 필요하다, 4) 매체 플랫폼 기반 자료수집을 위한 유관기관과의 연계를 위해 소셜 미디어 수집대상 기관의 수집 허락과, 실감콘텐츠 제작 및 서비스 기관과의 연계 협력이 필요하다, 5) 매체 플랫폼 기반 자료의 서비스 활성화를 위해 이용 활성화를 위한 접근성 제고, 실감콘텐츠 등 e-deposit 시스템의 콘텐츠 확장성 및 사용의 용이성 제고, 그리고 실감콘텐츠 재현 공간 첨단화가 요구된다.

콘텐츠를 통해 전통을 잇는 방식 - 단원미술관 전시사례를 중심으로 (The Way of Connecting to Tradition through Content)

  • 김상미
    • 트랜스-
    • /
    • 제9권
    • /
    • pp.17-36
    • /
    • 2020
  • 본 논문은 안산문화재단에서 운영하는 단원미술관의 전시 사례를 중심으로 콘텐츠 제작과 활용 그리고 확장 가능성에 대해 논의하는 데 그 목적을 가진다. 1991년 당시 문화체육관광부는 조선 후기 화원이자 풍속화의 대가로 알려진 단원 김홍도(檀園 金弘道, 1745~ ? )의 고향으로 추정되는 안산을 '단원의 도시'로 명명했다. 이에 안산은 단원 김홍도를 지역 고유의 자원으로 활용하고자 다각적인 노력을 기울이고 있다. 관광자원이자 문화콘텐츠로 단원 김홍도를 활용하여 단원조각공원 조성과 단원미술관 운영, 단원 김홍도 축제 기획 등 대내외적인 활동을 통해 단원 김홍도를 안산의 대표 브랜드화하고자 했다. 단원미술관은 단원 김홍도의 미술관이라고 지칭하기에 턱없이 부족한 수의 작품을 소장하고 있다. 2009년 <사슴과 동자>를 첫 매입하고 2016년 <화조도>를 매입한 이후 올해까지 단원 김홍도의 작품을 총 6점 소장하게 됐다.1 단원 김홍도의 작품을 수집하는데 현실적으로 많은 어려움이 따르기 때문이다. 이에 2015년 10월 개관한 단원콘텐츠관의 역할과 방향은 단원 김홍도의 진본을 소장하지 않아도 미술관의 역할과 기능이 가능하도록 하는 것이었다. 단원콘텐츠관을 단원 김홍도와 관련된 다양한 시각예술자료를 체계적으로 수집과 보존, 전시가 가능하도록 운영하고 디지털 자료 중심으로 고급 정보를 생산하여 이를 제공할 수 있도록 하는 비전을 설정했다. 다시 말해 도서관과 아카이브, 미술관(Library + Archive + Museum)의 기능이 결합된 One-Source Multi-Use의 복합문화 정보기관으로 단원콘텐츠관을 찾는 관람객의 욕구를 충족시킬 수 있도록 구축하고자 했다. 이는 소장품의 문제와 고서화(古書畫)가 가지는 전시의 한계를 극복하고 미술관의 역할과 기능을 충족시키는 등 동시대의 흐름을 반영하고 있어 여러 방면에서 시사하는 바가 크다. 단원 김홍도의 작품을 관람하고자 단원콘텐츠관을 찾는 관람객들에게 터치스크린과 딥 줌(Deep Zoom)의 기술을 이용하여 단원 김홍도의 디지털 아카이브를 실감형 서비스로 제공하고, 단원 김홍도의 원작을 그대로 해석하여 미디어 콘텐츠로 제작한 콘텐츠 전시를 통해 조선 시대 천재 화가 단원 김홍도의 작품세계를 쉽고 재미있게 접할 수 있도록 사업을 확장하고 있다.

  • PDF

조선시대 선생안 온톨로지 설계 (Ontology Design for the Register of Officials(先生案) of the Joseon Period)

  • 김사현
    • 동양고전연구
    • /
    • 제69호
    • /
    • pp.115-146
    • /
    • 2017
  • 본고는 조선시대 선생안의 디지털 아카이브를 위한 온톨로지(Ontology) 설계에 관한 연구이다. 선생안(先生案)은 조선시대 각 관청에서 소속 관원(官員)의 인적사항 및 인사이동을 기록한 일종의 인명부(人名簿)이다. 일반적으로 관원의 성명(姓名), 생년(生年), 자(字), 본관(本貫) 등의 인적사항 정보와 관직(官職), 제배일(除拜日), 도임일(到任日), 체임일(遞任日), 체임사유(遞任事由) 등의 인사이동 정보가 기록되어 있다. 현전(現傳)하고 있는 선생안은 국 내외 도서관 및 박물관에 소장되어 있으며 그 수는 176종으로 알려져 있다. 이 중에서 한국학중앙연구원 장서각에 소장된 47건의 선생안을 대상으로 선생안의 내용 및 구조를 검토하고, 선생안의 소장처, 선생안 기록 주체인 관청, 기록된 관직, 관원 등 관련 있는 주변의 내용을 담아낼 수 있는 온톨로지를 설계한다. 조선시대 선생안 온톨로지는 실물자료인 선생안 소장정보와 선생안에 기록된 내용의 특징을 반영해 관원, 관청, 인사이동에 초점을 맞추어 설계하였다. 온톨로지 설계는 대상자원을 클래스(Class)로 범주화 하고, 범주에 속하는 개체들(Individuals)은 공통의 속성(Attribute)를 갖도록 하였다. 그리고 각각의 개체들은 다른 개체와의 관계(Relation)를 명시적으로 표현할 수 있는 의미적인 관계어를 정의하였다. 클래스는 '선생안', '인물', '관청', '관직', '장소', '과거(科擧)', '기록', '개념' 등 8개로 범주화하였다. 관계, 속성의 설계는 기존에 설계되어 활용되고 있는 '더블린코어(Doublin Core)', '유로피아나데이터모델(Europeana Data Mode)', 'CIDOC-CRM', '과거 합격자 데이터베이스를 위한 데이터 모델' 등의 어휘를 참조하여 설계하였다. 기존 데이터모델에서 설계한 어휘를 사용한 경우에는 해당 데이터모델의 이름 공간(Namespace)을 사용하였으며, 필요한 경우 필자가 관계를 정의하였다. 설계한 온톨로지는 명릉선생안(明陵先生案)으로 구현 예시를 보이고, 하나의 선생안에서 다수의 선생안으로 대상을 확대하여 정보를 입력하였을 때 기대되는 효과와 활용 방안에 대해 모색해 보았다. 조선시대 선생안 온톨로지는 현전하는 선생안 176종 모두를 검토하여 설계된 것이 아니기 때문에 완벽한 온톨로지로써 기능하기에는 무리가 있다. 지속적으로 선생안의 정보가 입력되는 과정에서 온톨로지 모델의 수정 및 보완이 필요하며, 그 지향점은 선생안에 기록된 정보들을 체계적으로 정리하기 위한 것도 있지만, 선생안에서 확인되는 인물, 관직 등의 정보 요소가 이미 서비스 구축 되었거나, 향후 제작될 조선시대 인물에 관한 데이터베이스 혹은 아카이브와 연계될 수 있는 것도 고려해야 할 것이다. 조선시대 선생안 온톨로지로 입력된 정보는 조선시대 관청 운영과 인사시스템을 볼 수 있는 일면으로 활용되고, 이미 구축된 여타 조선시대와 관련된 데이터베이스와 연계되어 조선시대의 정치 경제 사회 문화를 종합적으로 이해하는 자료의 하나로 기능하기를 기대한다.

FCA 기반 계층적 구조를 이용한 문서 통합 기법 (Methods for Integration of Documents using Hierarchical Structure based on the Formal Concept Analysis)

  • 김태환;전호철;최종민
    • 지능정보연구
    • /
    • 제17권3호
    • /
    • pp.63-77
    • /
    • 2011
  • 월드와이드웹(World Wide Web)은 인터넷에 연결된 컴퓨터를 통해 사람들이 정보를 공유할 수 있는 매우 큰 분산된 정보 공간이다. 웹은 1991년에 시작되어 개인 홈페이지, 온라인 도서관, 가상 박물관 등 다양한 정보 자원들을 웹으로 표현하면서 성장하였다. 이러한 웹은 현재 5천억 페이지 이상 존재할 것이라고 추정한다. 대용량 정보에서 정보를 효과적이며 효율적으로 검색하는 기술을 적용할 수 있다. 현재 존재하는 몇몇 검색 도구들은 초 단위로 gigabyte 크기의 웹을 검사하여 사용자에게 검색 정보를 제공한다. 그러나 검색의 효율성은 검색 시간과는 다른 문제이다. 현재 검색 도구들은 사용자의 질의에 적합한 정보가 적음에도 불구하고 많은 문서들을 사용자에게 검색해준다. 그러므로 대부분의 적합한 문서들은 검색 상위에 존재하지 않는다. 또한 현재 검색 도구들은 사용자가 찾은 문서와 관련된 문서를 찾을 수 없다. 현재 많은 검색 시스템들의 가장 중요한 문제는 검색의 질을 증가 시키는 것이다. 그것은 검색된 결과로 관련 있는 문서를 증가시키고, 관련 없는 문서를 감소시켜 사용자에게 제공하는 것이다. 이러한 문제를 해결하기 위해 CiteSeer는 월드와이드웹에 존재하는 논문에 대해 한정하여 ACI(Autonomous Citation Indexing)기법을 제안하였다. "Citaion Index"는 연구자가 자신의 논문에 다른 논문을 인용한 정보를 기술하는데 이렇게 기술된 논문과 자신의 논문을 연결하여 색인한다. "Citation Index"는 논문 검색이나 논문 분석 등에 매우 유용하다. 그러나 "Citation Index"는 논문의 저자가 다른 논문을 인용한 논문에 대해서만 자신의 논문을 연결하여 색인했기 때문에 논문의 저자가 다른 논문을 인용하지 않은 논문에 대해서는 관련 있는 논문이라 할지 라도 저자의 논문과 연결하여 색인할 수 없다. 또한 인용되지 않은 다른 논문과 연결하여 색인할 수 없기 때문에 확장성이 용이하지 못하다. 이러한 문제를 해결하기 위해 본 논문에서는 검색된 문서에서 단락별 명사와 동사 및 목적어를 추출하여 해당 동사가 명사 및 목적어를 취할 수 있는 가능한 값을 고려하여 하나의 문서를 formal context 형태로 변환한다. 이 표를 이용하여 문서의 계층적 그래프를 구성하고, 문서의 그래프를 이용하여 문서 간 그래프를 통합한다. 이렇게 만들어진 문서의 그래프들은 그래프의 구조를 보고 각각의 문서의 영역을 구하고 그 영역에 포함관계를 계산하여 문서와 문서간의 관계를 표시할 수 있다. 또한 검색된 문서를 트리 형식으로 보여주어 사용자가 원하는 정보를 보다 쉽게 검색할 수 있는 문서의 구조적 통합 방법에 대해 제안한다. 제안한 방법은 루씬 검색엔진이 가지고 있는 순위 계산 공식을 이용하여 문서가 가지는 중요한 단어를 문서의 참조 관계에 적용하여 비교하였다. 제안한 방법이 루씬 검색엔진보다15% 정도 높은 성능을 나타내었다.

키워드 자동 생성에 대한 새로운 접근법: 역 벡터공간모델을 이용한 키워드 할당 방법 (A New Approach to Automatic Keyword Generation Using Inverse Vector Space Model)

  • 조원진;노상규;윤지영;박진수
    • Asia pacific journal of information systems
    • /
    • 제21권1호
    • /
    • pp.103-122
    • /
    • 2011
  • Recently, numerous documents have been made available electronically. Internet search engines and digital libraries commonly return query results containing hundreds or even thousands of documents. In this situation, it is virtually impossible for users to examine complete documents to determine whether they might be useful for them. For this reason, some on-line documents are accompanied by a list of keywords specified by the authors in an effort to guide the users by facilitating the filtering process. In this way, a set of keywords is often considered a condensed version of the whole document and therefore plays an important role for document retrieval, Web page retrieval, document clustering, summarization, text mining, and so on. Since many academic journals ask the authors to provide a list of five or six keywords on the first page of an article, keywords are most familiar in the context of journal articles. However, many other types of documents could not benefit from the use of keywords, including Web pages, email messages, news reports, magazine articles, and business papers. Although the potential benefit is large, the implementation itself is the obstacle; manually assigning keywords to all documents is a daunting task, or even impractical in that it is extremely tedious and time-consuming requiring a certain level of domain knowledge. Therefore, it is highly desirable to automate the keyword generation process. There are mainly two approaches to achieving this aim: keyword assignment approach and keyword extraction approach. Both approaches use machine learning methods and require, for training purposes, a set of documents with keywords already attached. In the former approach, there is a given set of vocabulary, and the aim is to match them to the texts. In other words, the keywords assignment approach seeks to select the words from a controlled vocabulary that best describes a document. Although this approach is domain dependent and is not easy to transfer and expand, it can generate implicit keywords that do not appear in a document. On the other hand, in the latter approach, the aim is to extract keywords with respect to their relevance in the text without prior vocabulary. In this approach, automatic keyword generation is treated as a classification task, and keywords are commonly extracted based on supervised learning techniques. Thus, keyword extraction algorithms classify candidate keywords in a document into positive or negative examples. Several systems such as Extractor and Kea were developed using keyword extraction approach. Most indicative words in a document are selected as keywords for that document and as a result, keywords extraction is limited to terms that appear in the document. Therefore, keywords extraction cannot generate implicit keywords that are not included in a document. According to the experiment results of Turney, about 64% to 90% of keywords assigned by the authors can be found in the full text of an article. Inversely, it also means that 10% to 36% of the keywords assigned by the authors do not appear in the article, which cannot be generated through keyword extraction algorithms. Our preliminary experiment result also shows that 37% of keywords assigned by the authors are not included in the full text. This is the reason why we have decided to adopt the keyword assignment approach. In this paper, we propose a new approach for automatic keyword assignment namely IVSM(Inverse Vector Space Model). The model is based on a vector space model. which is a conventional information retrieval model that represents documents and queries by vectors in a multidimensional space. IVSM generates an appropriate keyword set for a specific document by measuring the distance between the document and the keyword sets. The keyword assignment process of IVSM is as follows: (1) calculating the vector length of each keyword set based on each keyword weight; (2) preprocessing and parsing a target document that does not have keywords; (3) calculating the vector length of the target document based on the term frequency; (4) measuring the cosine similarity between each keyword set and the target document; and (5) generating keywords that have high similarity scores. Two keyword generation systems were implemented applying IVSM: IVSM system for Web-based community service and stand-alone IVSM system. Firstly, the IVSM system is implemented in a community service for sharing knowledge and opinions on current trends such as fashion, movies, social problems, and health information. The stand-alone IVSM system is dedicated to generating keywords for academic papers, and, indeed, it has been tested through a number of academic papers including those published by the Korean Association of Shipping and Logistics, the Korea Research Academy of Distribution Information, the Korea Logistics Society, the Korea Logistics Research Association, and the Korea Port Economic Association. We measured the performance of IVSM by the number of matches between the IVSM-generated keywords and the author-assigned keywords. According to our experiment, the precisions of IVSM applied to Web-based community service and academic journals were 0.75 and 0.71, respectively. The performance of both systems is much better than that of baseline systems that generate keywords based on simple probability. Also, IVSM shows comparable performance to Extractor that is a representative system of keyword extraction approach developed by Turney. As electronic documents increase, we expect that IVSM proposed in this paper can be applied to many electronic documents in Web-based community and digital library.

토픽모델링을 활용한 국내 문헌정보학 연구동향 분석 (A Study on the Research Trends in Library & Information Science in Korea using Topic Modeling)

  • 박자현;송민
    • 정보관리학회지
    • /
    • 제30권1호
    • /
    • pp.7-32
    • /
    • 2013
  • 본 연구는 국내 문헌정보학 분야의 연구동향을 규명하기 위하여 문헌정보학 주요 학술지인, 정보관리학회지, 한국문헌정보학회지, 한국도서관 정보학회지, 한국비블리아학회지의 1970년도부터 2012년도까지 발표 논문 초록을 수집하여 LDA(Latent Dirichlet Allocation)기반의 토픽 모델링 실험을 수행하였다. 그 결과를 종합하면 다음과 같다. 첫째, 토픽모델링 실험에서 도출된 연구주제를 문헌정보학 주제분류표와 비교 분석한 결과, '정보학'영역의 디지털도서관, 이용연구, 인터넷, 전문가시스템, 계량정보학, 자동화, 정보검색, 정보시스템, '도서관 서비스'영역의 정보서비스, 도서관 유형별 서비스, 이용자 교육/정보리터러시, 서비스 평가, '문헌정보학 기초'영역의 도서관과 사회, 전문성, '자료조직'영역의 분류, 편목, 메타데이터, '도서관 경영'영역의 도서관 평가, 장서개발/관리, '서지학'영역의 고서지, '도서관 체제'영역의 도서관 및 정보정책, '출판'영역의 도서/출판, '기록관리학'영역의 하위주제 등과 연결할 수 있었다. 또한 가장 많은 연구주제가 발견된 학문영역은 정보학과 도서관서비스로 나타났다. 둘째, 문헌정보학의 주요 연구주제에서 도서관 유형별 서비스 및 평가, 인터넷, 메타데이터의 연구주제는 상승세를 보였으나, 도서, 분류, 편목, 고서지에 관한 연구주제는 하강세를 보였다. 셋째, 학술지를 구분하여 비교 분석한 결과, 정보관리학회지는 도서관에 관한 연구주제보다 정보학에 관한 연구주제가 많이 출현하였고, 한국문헌정보학회지와 한국도서관 정보학회지, 한국비블리아학회지는 도서관에 관한 연구주제가 정보학에 관한 주제보다 많이 나타났다.

공개 소프트웨어 OMEKA를 이용한 기록 웹 전시 방안 연구 (A Study on the Exhibition through the Web with Open Source Software OMEKA)

  • 최윤진;최동운;김형희;임진희
    • 기록학연구
    • /
    • 제42호
    • /
    • pp.135-183
    • /
    • 2014
  • 우리나라는 높은 수준의 IT기술과 인터넷 보급률 덕분에 웹 전시를 제공할 수 있는 환경을 갖추고 있다. 그러나 소규모 공공기관의 웹 전시는 단순히 오프라인 전시프로그램을 소개하거나 웹전시 자체로는 활성화 되지 못한 채 운영되고 있다. 이와 같이 공공기관의 웹 전시가 활성화 되지 못하는 이유로는 웹 전시에 대한 인식 부족, 시스템 구축비용 문제, 전문 인력 부재 등을 들 수 있다. 이런 상황에서 시스템에 대한 전문지식을 갖춘 인력과 예산이 부족한 소규모 기관에서는 공개 소프트웨어의 적극적인 활용이 필요하다. 본고는 기록을 전시하기 위한 공개 소프트웨어인 OMEKA의 주요 기능을 소개하고 해외 사례 및 설치에서 전시에 이르는 활용을 살펴보았다. 그리고 OMEKA가 가진 특징을 고려할 때 전시효과와 효용을 높이기 위해 보강되고 갖추어야 할 점을 검토하였다. OMEKA는 전문적 기술 없이도 멀티미디어의 웹 전시가 가능해 시청각 기록물의 활용도가 높은 장점이 있다. 따라서 OMEKA는 설치가 쉽고 운영비용이 저렴하다는 장점뿐만 아니라 새로운 기술 발달 추세에 맞는 기술적 유연성을 갖춘 프로그램으로 다양한 기관의 목적을 구현하는데 적합하다. OMEKA는 디지털 컬렉션과 웹 전시 등 콘텐츠 관리를 위한 프로그램으로서 전통적인 아카이브 활용 프로그램과 달리 이용자에게 친화적이다. 특히 전시 기능이 탁월하여 이미 여러 도서관과 소규모 박물관, 학교 등에서 다양하게 활용되고 있다. OMEKA를 활용, 공공기관의 전시 서비스 수준을 향상시켜 이용자의 만족도를 높이면 이를 통해 공공기관에 대한 사회 전반의 인식을 변화 시킬 수 있을 것이다. 기관에서 보유한 기록에 대해 주제와 내용에 맞는 기획으로 전시 컬렉션을 제공할 수 있고 기관과 이용자의 상호작용을 통해 기록물 활용에 있어 긍정적인 결과를 얻을 수 있다. 따라서 OMEKA는 웹 전시가 필요하지만 전시를 위한 환경 조성에 어려움을 겪고 있는 공공기관에 현실적인 해결책을 제시할 수 있을 거라 기대된다.

주요국 국가서지 현황조사를 통한 국가서지의 최신 경향 분석 (Current Trends for National Bibliography through Analyzing the Status of Representative National Bibliographies)

  • 이미화;이지원
    • 한국비블리아학회지
    • /
    • 제32권1호
    • /
    • pp.35-57
    • /
    • 2021
  • 본 연구는 국가서지의 최신 경향을 분석하고자 문헌연구, 홈페이지분석, 사서 대상 설문조사를 실시하였다. 분석 결과 첫째, 한 국가 출판물의 기록이라는 국가서지의 정의에 부합하기 위해서 국가서지에 인쇄에서 전자자원까지 다양한 자료가 수록되도록 하였으나 현실적으로 모든 자료가 포함될 수 없으므로 제외사항이 있었다. 보편적인 국가서지 선정기준을 작성하는 것은 불가능하며, 국가의 특성을 반영하고, 분석을 바탕으로 한 타당하고 포괄적인 수록범위를 마련하는 방안이 필요하다. 둘째, 국가서지를 효율적으로 생성하기 위해 출판사 및 도서관 등과 협력이 이루어지고 있다. 국가서지 생성의 효율성을 위해 표준화 및 일관성, 디지털 자원에 대한 컬렉션 단위 메타데이터 기술, 링크드데이터를 활용한 국가서지 생성 등과 같이 국가서지 발행 및 생성에서 변화가 모색되어야 한다. 셋째, 국가서지는 국가서지 온라인 검색 시스템, 링크드데이터 검색, PDF, OAI-PMH, SRU, Z39.50을 이용한 MARC 다운로드, RDF/XML 형식의 대량 다운로드 형태 등으로 발행되고 있고, 온라인목록과 통합되거나 별도로 구축되기도 한다. 다만, 국가서지와 온라인목록은 통합 도서관 시스템을 이용해 데이터 재사용 방식으로 구축될 필요가 있다. 넷째, 국가서지를 위한 차별화된 기능으로 다양한 브라우징 기능과 함께 이용자 태깅, 국가서지 통계 등 다양한 서비스를 제공하고 있다. 추가적으로 국가서지 빅데이터 분석, 전자 출판물과의 링크, 링크드데이터의 대량 다운로드 서비스가 제공되어야 하며, 차별화된 서비스 개발을 위해서는 이용자의 요구를 파악하고, 이를 반영한 한 개방 서비스를 마련해야 할 것이다. 본 연구에서 분석된 국가서지의 최신 경향 및 고려사항을 통해 국내 및 국외 국가서지의 발전적 변화를 모색할 수 있을 것이다.