• Title/Summary/Keyword: 기록물 자동분류

Search Result 5, Processing Time 0.018 seconds

Comparison of Performance Factors for Automatic Classification of Records Utilizing Metadata (메타데이터를 활용한 기록물 자동분류 성능 요소 비교)

  • Young Bum Gim;Woo Kwon Chang
    • Journal of the Korean Society for information Management
    • /
    • v.40 no.3
    • /
    • pp.99-118
    • /
    • 2023
  • The objective of this study is to identify performance factors in the automatic classification of records by utilizing metadata that contains the contextual information of records. For this study, we collected 97,064 records of original textual information from Korean central administrative agencies in 2022. Various classification algorithms, data selection methods, and feature extraction techniques are applied and compared with the intent to discern the optimal performance-inducing technique. The study results demonstrated that among classification algorithms, Random Forest displayed higher performance, and among feature extraction techniques, the TF method proved to be the most effective. The minimum data quantity of unit tasks had a minimal influence on performance, and the addition of features positively affected performance, while their removal had a discernible negative impact.

Neural Network based Automatic Scheme Matching for Archival Package (기록물 패키지를 위한 신경망 회로 기반 자동 스키마 매칭)

  • Lee, Myung-Joo;Park, So-Ra;Jo, Man-Gi;Lee, Ji-Hoon;Hwang, Soo-Chan
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06c
    • /
    • pp.105-108
    • /
    • 2011
  • 범정부적인 차원에서 기록물은 종이 위주의 생산방식에서 전자문서방식으로 변하고 있다. 이미, 많은 국가에서 표준을 정의하여 기록물에 대한 연구가 진행되고 있다. 또한, 기록물을 효과적으로 저장하기 위한 기록물 보존소에 대한 연구도 활발하게 진행 되고 있다. 대부분의 기록물 보존소는 OAIS 참조모델을 기반으로 구성이 되고 있으며, SIP, AIP, DIP 패키지 형태로 수집, 보관, 배포되고 있다. 이러한 기록물 패키지들은 다양한 메타데이터 스키마를 포함 할 수 있어서, 여러 종류의 기록물들의 수집, 보관, 배포가 용이 하게 하지만, 기록물 보존소에 저장되어 있는 기록물 패키지를 검색하기 위해서는 다양한 스키마를 모두 검색 할 수 있어야 하는 문제점이 존재한다. 따라서 본 논문에서는 기록물 패키지를 위한 신경망 회로 기반 자동 스키마 매칭 기법을 제안 하고자 한다. 신경망 회로 기반 자동분류 알고리즘을 통하여 기록물 패키지 안에 존재하는 다양한 형태의 메타데이터 스키마들에 대한 검색을 가능하게 한다. 또한, 실험을 통하여 제안하는 방법의 정확성을 확인 하였다.

Automatic classification system for record management of bulletin board on public website (공공사이트 게시판 자료의 기록관리를 위한 자동 분류 시스템)

  • Nam, Eunkyung;Ahn, Hye-Rim;Song, Min
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2013.08a
    • /
    • pp.175-178
    • /
    • 2013
  • 웹의 발달과 전자정부의 지향으로, 행정기관의 웹사이트를 통한 민원처리가 증가하고 있다. 게시판을 통해 이용자가 민원을 제기하면, 각 기관에서는 담당자를 배정해 처리하지만 해당 게시물을 공기록으로 보존하지는 않는다. 공공사이트를 통한 투명한 행정을 위해서는 게시물도 공기록물로 보존하는 체계가 마련될 필요가 있다. 이를 위해, 정부기능연계모델(BRM)을 기준으로, 공공사이트의 게시글을 자동으로 분류하는 시스템을 구현하였다.

  • PDF

Restoration for Speech Records Managed by the National Archives of Korea (국가기록원 음성 기록물의 복원과 분석)

  • Oh, Sejin;Kang, Hong-Goo
    • The Journal of the Acoustical Society of Korea
    • /
    • v.32 no.3
    • /
    • pp.269-278
    • /
    • 2013
  • The speech recording of the National Archives of Korea contains very important traces which represent modern times of Korea. But the way to be recorded by analogue is easily contaminated as time goes by. So it has to be digitalized for management and services. Consequently, restoration method of distorted speech is needed. We propose the four classes for each distortion kind and apply restoration algorithms for the cases of speech level, stationary noise and abrupt noise. As a result, speech volume adjusts to -26 dBov for only on the speech region and SNR improves above 10dB. Especially, conventional way to remove the noise is almost impossible because we need to listen to all of them but it can be more effective by adaptation of auto restoration algorithm.

A News Video Mining based on Multi-modal Approach and Text Mining (멀티모달 방법론과 텍스트 마이닝 기반의 뉴스 비디오 마이닝)

  • Lee, Han-Sung;Im, Young-Hee;Yu, Jae-Hak;Oh, Seung-Geun;Park, Dai-Hee
    • Journal of KIISE:Databases
    • /
    • v.37 no.3
    • /
    • pp.127-136
    • /
    • 2010
  • With rapid growth of information and computer communication technologies, the numbers of digital documents including multimedia data have been recently exploded. In particular, news video database and news video mining have became the subject of extensive research, to develop effective and efficient tools for manipulation and analysis of news videos, because of their information richness. However, many research focus on browsing, retrieval and summarization of news videos. Up to date, it is a relatively early state to discover and to analyse the plentiful latent semantic knowledge from news videos. In this paper, we propose the news video mining system based on multi-modal approach and text mining, which uses the visual-textual information of news video clips and their scripts. The proposed system systematically constructs a taxonomy of news video stories in automatic manner with hierarchical clustering algorithm which is one of text mining methods. Then, it multilaterally analyzes the topics of news video stories by means of time-cluster trend graph, weighted cluster growth index, and network analysis. To clarify the validity of our approach, we analyzed the news videos on "The Second Summit of South and North Korea in 2007".