Semi-automatic Ontology Modeling for VOD Annotation for IPTV

IPTV의 VOD 어노테이션을 위한 반자동 온톨로지 모델링

  • 최정화 (숭실대학교 컴퓨터학과) ;
  • 허길 (숭실대학교 컴퓨터학과) ;
  • 박영택 (숭실대학교 컴퓨터학부)
  • Received : 2009.11.23
  • Accepted : 2010.04.20
  • Published : 2010.07.15

Abstract

In this paper, we propose a semi-automatic modeling approach of ontology to annotate VOD to realize the IPTV's intelligent searching. The ontology is made by combining partial tree that extracts hypernym, hyponym, and synonym of keywords related to a service domain from WordNet. Further, we add to the partial tree new keywords that are undefined in WordNet, such as foreign words and words written in Chinese characters. The ontology consists of two parts: generic hierarchy and specific hierarchy. The former is the semantic model of vocabularies such as keywords and contents of keywords. They are defined as classes including property restrictions in the ontology. The latter is generated using the reasoning technique by inferring contents of keywords based on the generic hierarchy. An annotation generates metadata (i.e., contents and genre) of VOD based on the specific hierarchy. The generic hierarchy can be applied to other domains, and the specific hierarchy helps modeling the ontology to fit the service domain. This approach is proved as good to generate metadata independent of any specific domain. As a result, the proposed method produced around 82% precision with 2,400 VOD annotation test data.

본 연구는 IPTV의 지능형 검색을 가능하게 하는 VOD 어노테이션을 위해 효율적인 반자동 온톨로지 모델링 기법을 제안한다. 제안하는 방법은 워드넷(WordNet)으로 부터 특정 도메인(또는 장르)을 대표하는 콘텐츠에 관련된 키워드의 상 하위어와 동의어에 해당하는 부분 트리를 추출하고, 워드넷에 없는 외래어, 한자어 등은 확장하여 콘텐츠 온톨로지를 구축한다. 이 온톨로지는 보편적 계층구조와 특정 계층구조를 생성한다. 전자는 콘텐츠와 관련 키워드를 제약 기술(description)을 포함하는 클래스로 정의한 어휘의 의미 모델이다. 후자는 생성된 모델에 함의관계(subsumption) 추론 기술을 적용하여 키워드를 관련있는 콘텐츠로 추론한 모델이다. 어노테이션은 이 온톨로지를 기반으로 VOD에 콘텐츠와 장르의 메타데이터를 의미 기반으로 생성한다. 보편적 계층구조는 서비스 도메인에 독립적으로 재사용이 가능하며, 특정 계층구조는 서비스 목적에 맞는 완전하고 함축적인 모델을 생성한다. 제안하는 방법은 서비스 도메인에 상관없이 적용 가능한 알고리즘이며, 2,400건의 테스트 데이터로 어노테이션 결과를 평가하여 82%의 정확도를 보였다.

Keywords

Acknowledgement

Supported by : 숭실대학교

References

  1. B. A. Emilio, "Real-Time Metadata for IPTV Systems," Network Division, NEC Labs Europe, 2007.
  2. A. Sanfilippo, S. Tratz, M. Gregory, A. Chappell, P. Whitney, C. Posse, P. Paulson, B. Baddeley, R. Hohimer, A. White, "Automating Ontological Annotation with WordNet," In Proc. of the Third International Global WordNet Conference (GWC- 06), pp.85-93, Jeju Island, South Korea, January 2006.
  3. V. Snasel, P. Moravec, J. Pokorny, "WordNet Ontology Based Model for Web Retrieval," In Proc. of WIRI'05 Workshop, Tokyo, Japan, 2005. IEEE Press.
  4. C. Fellbaum, "WordNet: An Electronic Lexical Database," MIT Press, 1998. http://wordnet.princeton.edu.
  5. L. De Silva and L. Jayaratne, "Semi-automatic extraction and modeling of ontologies using Wikipedia XML Corpus," In Proc. of the Applications of Digital Information and Web Technologies (ICADIWT 2009), pp.446-451, 2009.
  6. S. N. Lee, S. Y. Huh, R. D. McNiel, "Automatic generation of concept hierarchies using WordNet," Expert Systems with Applications: An International Journal, vol.35, no.3, pp.1132-1144, 2008. https://doi.org/10.1016/j.eswa.2007.08.042
  7. L. Denoyer and P. Gallinari, "The Wikipedia XML Corpus," SIGIR Forum, 2006.
  8. M. Laclavik, M. Seleng, and M. Babik, "OnTeA: Semi-automatic Ontology based Text Annotation Method," In Proc. of the Tools for Acquisition, Organisation and Presenting of Information and Knowledge, pp.49-63, ISBN 80-227-2468-8, 2006.
  9. T. Kanungo, D. M. Mount, N. S. Netanyahu, C. Piatko, R. Silverman, A. Y. Wu, "An efficient k-means clustering algorithm: analysis and implementation," IEEE Trans. Machine Intelligence, vol.24. no.7, pp.881-892, 2002. https://doi.org/10.1109/TPAMI.2002.1017616
  10. A. S. Yoon, S. H. Hwang, E. R. Lee, H. C. Kwon, "Construction of Korean Wordnet KorLex 1.5," Journal of KIISE : Software and Applications, vol.36, no.1, pp.92-108, Jan. 2009. (in Korean)
  11. M. Dean, D. Connolly, F. van Harmelen, J. Hendler, I. Horrocks, D. L. McGuinness, P. F. Patel-Schneider, L. A. Stein, "OWL web ontology language reference," W3C Working Draft, 31 March 2003. Available at http://www.w3.org/TR/2003/WD-owl-ref-20030331.
  12. D. Tsarkov and I. Horrocks. "Efficient reasoning with range and domain constraints," In Proc. of the 2004 Description Logic Workshop (DL 2004), pp.41-50, 2004.
  13. I. Horrocks, S. Tesssaris, "Querying the Semantic Web: a Formal Approach," In Proc. of the 2002 International Semantic Web Conference, Lecture Notes in Computer Science, no 2342, 2002.