• 제목/요약/키워드: 기록물 자동분류

검색결과 5건 처리시간 0.019초

메타데이터를 활용한 기록물 자동분류 성능 요소 비교 (Comparison of Performance Factors for Automatic Classification of Records Utilizing Metadata)

  • 김영범;장우권
    • 정보관리학회지
    • /
    • 제40권3호
    • /
    • pp.99-118
    • /
    • 2023
  • 이 연구의 목적은 기록물의 맥락정보를 담고 있는 메타데이터를 활용하여 기록물 자동분류 과정에서의 성능요소를 파악하는데 있다. 연구를 위해 2022년 중앙행정기관 원문정보 약 97,064건을 수집하였다.수집한 데이터를 대상으로 다양한 분류 알고리즘과 데이터선정방법, 문헌표현기법을 적용하고 그 결과를 비교하여 기록물 자동 분류를 위한 최적의 성능요소를 파악하고자 하였다. 연구 결과 분류 알고리즘으로는 Random Forest가, 문헌표현기법으로는 TF 기법이 가장 높은 성능을 보였으며, 단위과제의 최소데이터 수량은 성능에 미치는 영향이 미미하였고 자질은 성능변화에 명확한 영향을 미친다는 것이 확인되었다.

기록물 패키지를 위한 신경망 회로 기반 자동 스키마 매칭 (Neural Network based Automatic Scheme Matching for Archival Package)

  • 이명주;박소라;조만기;이지훈;황수찬
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.105-108
    • /
    • 2011
  • 범정부적인 차원에서 기록물은 종이 위주의 생산방식에서 전자문서방식으로 변하고 있다. 이미, 많은 국가에서 표준을 정의하여 기록물에 대한 연구가 진행되고 있다. 또한, 기록물을 효과적으로 저장하기 위한 기록물 보존소에 대한 연구도 활발하게 진행 되고 있다. 대부분의 기록물 보존소는 OAIS 참조모델을 기반으로 구성이 되고 있으며, SIP, AIP, DIP 패키지 형태로 수집, 보관, 배포되고 있다. 이러한 기록물 패키지들은 다양한 메타데이터 스키마를 포함 할 수 있어서, 여러 종류의 기록물들의 수집, 보관, 배포가 용이 하게 하지만, 기록물 보존소에 저장되어 있는 기록물 패키지를 검색하기 위해서는 다양한 스키마를 모두 검색 할 수 있어야 하는 문제점이 존재한다. 따라서 본 논문에서는 기록물 패키지를 위한 신경망 회로 기반 자동 스키마 매칭 기법을 제안 하고자 한다. 신경망 회로 기반 자동분류 알고리즘을 통하여 기록물 패키지 안에 존재하는 다양한 형태의 메타데이터 스키마들에 대한 검색을 가능하게 한다. 또한, 실험을 통하여 제안하는 방법의 정확성을 확인 하였다.

공공사이트 게시판 자료의 기록관리를 위한 자동 분류 시스템 (Automatic classification system for record management of bulletin board on public website)

  • 남은경;안혜림;송민
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2013년도 제20회 학술대회 논문집
    • /
    • pp.175-178
    • /
    • 2013
  • 웹의 발달과 전자정부의 지향으로, 행정기관의 웹사이트를 통한 민원처리가 증가하고 있다. 게시판을 통해 이용자가 민원을 제기하면, 각 기관에서는 담당자를 배정해 처리하지만 해당 게시물을 공기록으로 보존하지는 않는다. 공공사이트를 통한 투명한 행정을 위해서는 게시물도 공기록물로 보존하는 체계가 마련될 필요가 있다. 이를 위해, 정부기능연계모델(BRM)을 기준으로, 공공사이트의 게시글을 자동으로 분류하는 시스템을 구현하였다.

  • PDF

국가기록원 음성 기록물의 복원과 분석 (Restoration for Speech Records Managed by the National Archives of Korea)

  • 오세진;강홍구
    • 한국음향학회지
    • /
    • 제32권3호
    • /
    • pp.269-278
    • /
    • 2013
  • 국가기록원의 음성 기록물은 우리나라의 근현대사를 담은 중요한 기록물이다. 하지만 아날로그로 녹음된 방식은 시간이 지남에 따라 손실을 피할 수 없어 디지털로 변환하여 관리 및 서비스할 필요성이 있다. 그에 따라 왜곡이 발생한 부분에 대해 본래의 정보를 복원하는 작업은 매우 중요하며, 본 논문은 음성 기록물의 훼손 종류에 따라 4가지의 카테고리로 분류하고 음량, 정상 잡음, 돌발 잡음에 맞는 복원 알고리즘을 적용하였다. 그 결과 음량은 음성 존재구간에 대해서 -26 dBov로 조정했고 SNR은 10 dB이상 상승하였다. 특히 기존에는 음성이 훼손된 부분을 순차적으로 청취하여 개별적으로 문제를 해결해야 했기 때문에 방대한 자료를 복원하기는 불가능 했지만 자동 복원 알고리즘을 도입하여 보다 효율적인 방식으로 복원할 수 있게 되었다.

멀티모달 방법론과 텍스트 마이닝 기반의 뉴스 비디오 마이닝 (A News Video Mining based on Multi-modal Approach and Text Mining)

  • 이한성;임영희;유재학;오승근;박대희
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제37권3호
    • /
    • pp.127-136
    • /
    • 2010
  • 정보 통신기술이 발전함에 따라 멀티미디어 데이터를 포함하는 디지털 기록물의 양은 기하급수적으로 증가하고 있다. 특히 뉴스 비디오는 시대상을 반영하는 풍부한 정보를 내포하고 있으므로, 이를 효과적으로 관리하고 분석하기 위한 뉴스 비디오 데이터베이스 및 뉴스 비디오 마이닝은 광범위하게 연구되어왔다. 그러나 현재까지의 뉴스 비디오 관련 연구들은 뉴스 기사에 대한 브라우징, 검색, 요약에 치중되어 있으며, 뉴스 비디오에 내재되어 있는 풍부한 잠재적 지식을 탐사하는 고수준의 의미 분석 단계에는 이르지 못하고 있다. 본 논문에서는 뉴스 비디오 클립과 스크립트를 동시에 이용하는, 멀티모달 방법론과 텍스트 마이닝 기반의 뉴스 비디오 마이닝 시스템을 제안한다. 제안된 시스템은 텍스트 마이닝의 군집분석을 통해 뉴스 기사들을 자동 분류하고, 분류 결과에 대해 기간별 군집 추이그래프, 군집성장도 분석 및 네트워크 분석을 수행함으로써, 뉴스 비디오의 기사별 주제와 관련한 다각적 분석을 수행한다. 제안된 시스템의 타당성 검증을 위하여 "2007년 제2차 남북 정상회담" 관련 뉴스 비디오를 대상으로 뉴스 비디오 분석을 수행하였다.