• 제목/요약/키워드: digital archive systems

검색결과 32건 처리시간 0.016초

비정형 텍스트 데이터 분석을 활용한 기록관리 분야 연구동향 (Research Trends in Record Management Using Unstructured Text Data Analysis)

  • 홍덕용;허준석
    • 한국기록관리학회지
    • /
    • 제23권4호
    • /
    • pp.73-89
    • /
    • 2023
  • 본 연구에서는 텍스트 마이닝 기법을 활용하여 국내 기록관리 연구 분야의 비정형 텍스트 데이터인 국문 초록에서 사용된 키워드 빈도를 분석하여 키워드 간 거리 분석을 통해 국내기록관리 연구 동향을 파악하는 것이 목적이다. 이를 위해 한국학술지인용색인(Korea Citation Index, KCI)의 학술지 기관통계(등재지, 등재후보지)에서 대분류(복합학), 중분류 (문헌정보학)으로 검색된 학술지(28종) 중 등재지 7종 1,157편을 추출하여 77,578개의 키워드를 시각화하였다. Word2vec를 활용한 t-SNE, Scattertext 등의 분석을 수행하였다. 분석 결과, 첫째로 1,157편의 논문에서 얻은 77,578개의 키워드를 빈도 분석한 결과, "기록관리" (889회), "분석"(888회), "아카이브"(742회), "기록물"(562회), "활용"(449회) 등의 키워드가 연구자들에 의해 주요 주제로 다뤄지고 있음을 확인하였다. 둘째로, Word2vec 분석을 통해 키워드 간의 벡터 표현을 생성하고 유사도 거리를 조사한 뒤, t-SNE와 Scattertext를 활용하여 시각화하였다. 시각화 결과에서 기록관리 연구 분야는 두 그룹으로 나누어졌는데 첫 번째 그룹(과거)에는 "아카이빙", "국가기록관리", "표준화", "공문서", "기록관리제도" 등의 키워드가 빈도가 높게 나타났으며, 두 번째 그룹(현재)에는 "공동체", "데이터", "기록정보서비스", "온라인", "디지털 아카이브" 등의 키워드가 주요한 관심을 받고 있는 것으로 나타났다.

메타데이터 상호운용성을 위한 기록관리 메타데이터 표준 분석 5W1H와 태스크 모델의 관점에서 (Analysis of Metadata Standards of Record Management for Metadata Interoperability From the viewpoint of the Task model and 5W1H)

  • 백재은;스기모토 시게오
    • 기록학연구
    • /
    • 제32호
    • /
    • pp.127-176
    • /
    • 2012
  • 메타데이터 표준규격(이하 메타데이터 표준으로 기재)은 디지털 자원(Digital resource)의 장기보존 및 디지털 아카이브를 위해 필요한 기본 요소 중 하나로, 이는 현대 정보사회에서 중요한 요소로 잘 알려져 있다. 자원(Resource)의 기록관리와 아카이브, 장기보존을 위한 메타데이터 표준은 다양하며, AGRkMS, EAD, ISAD(G), OAIS, PREMIS5) 등이 이용되고 있다. 우리는 아카이브 시스템의 메타데이터 표준을 디자인하기 위해 목적에 따른 메타데이터 표준을 선택하고 맞춤화(Customization)하지 않으면 안 된다. 한편으로, 다른 시스템의 메타데이터 스키마와의 상호운용성(Interoperability)에 대한 고찰도 실시하지 않으면 안 된다. 이전 연구에서, 우리는 기록 생애 주기(Records lifecycle)라는 관점으로부터 메타데이터 표준의 특성에 대해 분석을 실시하였다. 이로 인해, 각 메타데이터 표준 요소가 해당하는 기록 생애 주기의 처음 단계를 확인할 수 있었고, 아카이브 혹은 보존을 위해서는 하나의 메타데이터 표준만으로 기록 생애 주기 전체를 포괄할 수 없다는 것을 보여 주었다. 우리는 이 분석을 통해서 기록 생애 주기의 단계와 메타데이터 표준간의 관계, 기록 생애 주기 전체에서의 메타데이터 특성은 볼 수 있었으나, 보다 상세한 분석을 실시하는 것은 앞으로의 과제로 남겨두었다. 지금까지의 연구에 근거하여, 본 논문은 기록 생애 주기의 관점에서 디지털 아카이브와 보존, 기록관리를 위한 메타데이터 표준의 특징 분석을 위해, 기록 생애 주기 안에서 실행되는 업무의 관점으로부터 메타데이터 스키마를 재 파악하고 분석하였다. 지금까지 메타데이터 스키마는 기술대상이 되는 자원을 중심으로 정의되었기 때문에 기록 생애 주기 전체와 생애 주기 안의 각 단계에서 이용되는 메타데이터 표준간의 매핑을 위한 적절한 방법이 없었다. 이에 본 논문에서는 각기 다른 메타데이터 표준의 기술 요소를, 기록 생애 주기에 포함시키는 업무와 연결시키는 것으로 메타데이터 표준간의 매핑 방법을 제안한다. 본 연구에서는 메타데이터 표준 분석을 위한 프레임워크(Framework)로, 기록 생애 주기를 이용하여 작성한 자원의 업무중심 모델, 즉 태스크 모델(Task Model)을 제안한다. 태스크 모델을 이용함에 있어서 업무를 실행하는 '이벤트(Event)'의 관점을 보다 명확하게 할 수 있다. 한편, 업무를 중심으로 기술 요소간의 매핑을 보다 효율적으로 실시하기 위해서는 요소를 카테고리 화하여 매핑의 대상 범위를 좁히는 것이 중요하다. 이를 위해 우리는 범용성을 가진 5W1H모델(Who, What, Why, When, Where, How)을 이용하여, 기술 요소를 카테고리 화 하는 것을 제안한다. 그리고 태스크 모델과 5W1H 모델을 이용하여 메타데이터 표준 요소에 특징을 부여하고, 요소 간의 매핑을 실시하여 표준 간 관계를 확인하였다. 태스크 모델은 기록 생애 주기 전체에 업무의 관점을 반영한 것으로, 이 모델을 이용함으로써 기록 생애 주기와 그 안의 각 업무에 대한 메타데이터 표준의 사용, 그리고 특징 분석을 위해 실시되는 기술 요소간의 매핑이 가능할 수 있었다. 또한, 5W1H 카테고리를 이용하여 업무와 자원에 관련되는 기술 요소간의 관계를 살펴보는 것으로, 관계가 명확해지는 것과 함께 조사대상을 좁히는 것이 가능하게 되었다. 이 프레임워크의 제안과 이용으로 우리는 특징 분석을 위해 실시되는 매핑 혹은 분류가 단순한 일반적인 매핑이 아닌 의미적인 분류를 할 수 있었다. 본 연구에서는 이 모델들을 이용하여, 메타데이터 표준간의 크로스워크를 정의하였다. 그리고 태스크 모델의 각 단계의 문맥 내에서 메타데이터 기술 요소의 특성을 매핑 예로 확인하고, 이를 바탕으로 하여 프레임워크에 대해 고찰하였다.