DOI QR코드

DOI QR Code

Cloud storage-based intelligent archiving system applying automatic document summarization

문서 자동요약 기술을 적용한 클라우드 스토리지 기반 지능적 아카이빙 시스템

  • Received : 2012.03.29
  • Accepted : 2012.04.23
  • Published : 2012.06.30

Abstract

Zero client-based cloud storage technology is gaining much interest as a tool to centralized management of organizational documents nowadays. Besides the well-known cloud storage's defects such as security and privacy protection, users of the zero client-based cloud storage point out the difficulty in browsing and selecting the storage category because of its diversity and complexity. To resolve this problem, this study proposes a method of intelligent document archiving by applying an algorithm-based automatic topic identification technology. Without user's direct definition of category to store the working document, the proposed methodology and prototype enable the working documents to be automatically archived into the predefined categories according to the extracted topic. Based on the proposed ideas, more effective and efficient centralized management of electronic documents can be achieved.

제로 클라이언트 체제는 기업의 문서 중앙화를 위해 제시된 최신의 방법이며, 이를 기업의 현실에 보다 적합하도록 토착화시키는 작업은 필수적이다. 본 연구는 제로 클라이언트 체제의 잘 알려진 보안 및 프라이버시 상의 문제점을 제외한, 사용 상의 문제점을 보완하고자 고안되었다. 즉, 작업자가 작업한 문서를 기업 클라우드 스토리지에 저장하고자 저장 카테고리를 검색하는 과정의 부담과 정확성을 향상시키기 위하여, 작업 문서의 주제어를 자동으로 파악하고, 이를 바탕으로 해당 문서가 저장되어야 하는 카테고리를 자동으로 검색하여 작업자의 확인을 통해 자동 저장되도록 하는, 지능적 아카이빙 방식을 제시한다. 본 연구에서 제시하는 주제어 자동 파악 및 자동 아카이빙을 위한 방법론과 프로토타입 시스템은 기업 환경에 적용이 가능할 정도로 정확성과 확장성을 갖추고 있다.

Keywords

References

  1. 김미점, "클라우드 스토리지 시스템 기술 고찰", 정보과학논문지, Vol.28 No.12, 50-58, 2010.
  2. 나문성, 김승훈, 이재동, "클라우드 환경에서 대규모 콘텐츠를 위한 효율적인 자원처리 기법", 한국산업정보학회논문지, Vol.15 No.4, 17-27, 2010.
  3. 송민규, "애플리케이션 공유 및 데이터 접근 최적화를 위한 씬-클라이언트 프레임워크 설계", 한국산업정보학회논문지, Vol.14 No.5, 19-32, 2009.
  4. 유기동, "지식근로자의 상황정보를 이용한 자율적 지식획득 방법론: 대화형 지식의 획득을 위한 차세대형 지식경영시스템", 지식경영연구, Vol.9 No.4, 65-75, 2008.
  5. Dumais, S., Platt, J., Heckman, D., & Sahami, M., "Inductive learning algorithms and representations for text categorization", Proceedings of the 7th International Conference on Information and Knowledge Management, 1998.
  6. Joachims, T., "Text categorization with support vector machines: Learning with many relevant features", Proceedings of the European Conference on Machine Learning, 1998.
  7. Liu, Q., Wang, G., & Wu, J., "Secure and privacy preserving keyword searching for cloud storage services", Journal of Network and Computer Applications, in press, 2011.
  8. Mierswa, I., Wurst, M., Klinkenberg, R., Scholz, M., & Euler, T., "YALE: Rapid Prototyping for Complex Data Mining Tasks", Proceedings of the 12th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD-06), 2006.
  9. Mihalcea, R. & Tarau, P., "TextRank: Bringing Order into Texts", Proceedings of the Conference on Empirical Methods in Natural Language Processing, 404-411, 2004.
  10. Rennie, J.D.M. & Rifkin, R., "Improving multiclass text classification with the support vector machine", CBCL Paper #210/AI Memo #2001-026, Massachusetts Institute of Technology, October 2001.
  11. Yoo, K., "Automatic Document Archiving For Cloud Storage Using Text Mining-Based Topic Identification Technique", Proceedings of the 2012 International Conference on Information and Computer Applications, 2012.