DOI QR코드

DOI QR Code

미디어 영상 자동 분류를 위한 온톨로지 모델링 및 규칙 기반 추론

Ontology Modeling and Rule-based Reasoning for Automatic Classification of Personal Media

  • 투고 : 2015.10.21
  • 심사 : 2016.01.05
  • 발행 : 2016.03.15

초록

최근 스마트 디바이스가 많이 보급되면서 개인 영상 미디어가 다양한 방식으로 생성되어 영상 미디어를 이용한 서비스가 요구되고 있다. 이에 따라 영상 미디어 분석 및 인지 기술에 대한 연구가 활발히 진행되어, 영상으로부터 의미 있는 객체를 인지할 수 있게 되었다. 기존의 미디어 온톨로지를 이용한 시스템은 영상의 제목, 태그 및 스크립터 정보를 이용하기 때문에 영상에 등장하는 객체를 통해 미디어 분류를 수행할 수 없는 단점이 있다. 따라서 본 논문에서는 영상 미디어 데이터에서 인지되는 객체들을 이용해 해당 영상이 속하는 범주로 자동 분류하기 위해 서술논리 기반(Description Logic) 추론 시스템과 순서에 따라 달라질 수 있는 이벤트 처리를 위한 규칙 기반 추론 시스템을 제안한다. 제안하는 서술논리 기반 추론 시스템은 영상 미디어에서 인지되는 객체들의 관계를 서술논리로 정의된 행위(Activity) 온톨로지로 표현하고, 실체화 추론을 통해 인지된 객체가 행위로 추론되는 방법에 대해 설명한다. 규칙 기반 추론 시스템은 추론된 행위의 순서에 따른 이벤트를 정의하고 순서 기반 규칙 추론을 이용하여 범주에 알맞은 이벤트로 자동 분류하는 방법에 대하여 설명한다. 제안하는 방법의 타당성을 증명하기 위해 유투브의 영상에 대한 분석을 통해 올바른 범주로 분류된 미디어 데이터를 구성하여 제안하는 시스템의 타당성을 증명하였다.

Recently personal media were produced in a variety of ways as a lot of smart devices have been spread and services using these data have been desired. Therefore, research has been actively conducted for the media analysis and recognition technology and we can recognize the meaningful object from the media. The system using the media ontology has the disadvantage that can't classify the media appearing in the video because of the use of a video title, tags, and script information. In this paper, we propose a system to automatically classify video using the objects shown in the media data. To do this, we use a description logic-based reasoning and a rule-based inference for event processing which may vary in order. Description logic-based reasoning system proposed in this paper represents the relation of the objects in the media as activity ontology. We describe how to another rule-based reasoning system defines an event according to the order of the inference activity and order based reasoning system automatically classify the appropriate event to the category. To evaluate the efficiency of the proposed approach, we conducted an experiment using the media data classified as a valid category by the analysis of the Youtube video.

키워드

과제정보

연구 과제번호 : 현장전문가의 경험지식 획득 및 활용을 위한 경험지식플랫폼 개발 연구

연구 과제 주관 기관 : 한국산업기술평가관리원

참고문헌

  1. J.H. Choi, S.C. Kim, Y.T. Park, "Ontology Representation for Personal Media Management," Proc. of the KIISE Korea Computer Congress 2008, pp. 98-99, 2008. (in Korean)
  2. LIPTON, Alan J.; FUJIYOSHI, Hironobu; PATIL, Raju S. Moving target classification and tracking from real-time video, In: Applications of Computer Vision, 1998, WACV'98. Proceedings, Fourth IEEE Workshop on. IEEE, pp. 8-14, 1998.
  3. Krotzsch, Markus, Frantisek Simancik, and Ian Horrocks, "A description logic primer," arXiv preprint arXiv:1201.4089, 2012.
  4. Sirin, Evren, et al., "Pellet: A practical owl-dl reasoner," Web Semantics: science, services and agents on the World Wide Web 5.2, pp. 51-53, 2007. https://doi.org/10.1016/j.websem.2007.03.004
  5. LU, Lie; ZHANG, Hong-Jiang; JIANG, Hao. Content analysis for audio classification and segmentation. Speech and Audio Processing, IEEE Transactions on, 10.7: 504-516, 2002. https://doi.org/10.1109/TSA.2002.804546
  6. YOON, Yong-Ik; CHUN, Jee-Ae, Tracking Model for Abnormal Behavior from Multiple Network CCTV Using the Kalman Filter. In: Computer Science and its Applications. Springer Berlin Heidelberg, pp. 933-939, 2015.
  7. DAVIES, Anthony C.; VELASTIN, Sergio A. Progress in computational intelligence to support cctv surveillance systems, International Journal of Computing, 4.3: 76-84, 2014.
  8. SZEGEDY, Christian; TOSHEV, Alexander; ERHAN, Dumitru. Deep neural networks for object detection, In: Advances in Neural Information Processing Systems, pp. 2553-2561, 2013.
  9. LI, Dongge, et al. Classification of general audio data for content-based retrieval, Pattern recognition letters, 22.5: 533-544, 2001. https://doi.org/10.1016/S0167-8655(00)00119-7
  10. MANDEL, Michael I.; ELLIS, Daniel PW. Songlevel features and support vector machines for music classification, In: ISMIR 2005: 6th International Conference on Music Information Retrieval: Proceedings: Variation 2: Queen Mary, University of London & Goldsmiths College, University of London, 11-15 September, 2005, Queen Mary, University of London, pp. 594-599, 2005.
  11. S. Espinosa, A. Kaya, S. Melzer, R. Moller, and M. Wessel, Towards a media interpretation framework for the semantic web, In The 2007 IEEE/WIC/ACM International Conference on Web Intelligence (WI'07), Fremont, USA, pp. 374-380, 2007.