Web Image Retrieval using Prior Tags based on WordNet Semantic Information

워드넷 의미정보로 선별된 우선 태그와 이를 이용한 웹 이미지의 검색

  • 권대현 (충주대학교 대학원 전자계산학과) ;
  • 홍준혁 (충주대학교 대학원 전자계산학과) ;
  • 조수선 (충주대학교 컴퓨터과학과)
  • Published : 2009.07.30

Abstract

This research is for early extraction and utilization of semantic information from the tags in tagged Web image retrieval. Generally, users attach a tag to a Web image with little thought of the order, up to over 100 ones. In this paper, we suggest a method of selecting prior tags based on their importance when tagged images are uploaded, and using them in image retrieval. Ideas came from the recognition of the important tags which give a better description of the image as the tags sharing more semantic information with other tags of the same image. This method includes calculation of relation scores between tags based on WordNet and multilevel search of tagged images with the scores. For evaluation, we compared the suggested method and other retrieval methods searching images with simple matching of tags to a given keyword. As the results, we found the superiority of our method in precision and recall rate.

본 연구는 태깅된 웹 이미지의 검색에서 태그들의 의미정보를 미리 추출하여 검색 시에 이용하고자 하는 것이다. 일반적으로 웹 이미지의 태그들은 사용자들에 의해 순서 구분 없이 무작위로 매겨지며 많게는 그 수가 100여개에 이른다. 본 논문에서는 이 태그들 간에 의미정보가 많이 공유된 것일수록 해당 이미지를 설명하는 중요 태그가 될 것임에 착안하여 이미지와 태그 정보가 업 로드되는 시점에 중요도에 따른 우선 태그를 결정하고 이를 검색에 활용하는 방법을 소개한다 제안된 방법은 워드넷에 기반하여 태그의 연관성점수를 계산하고 이를 이용하여 다단계 검색으로 태징된 웹 이미지를 검색한다. 평가를 위하여 제안된 방법으로 검색된 결과와 검색어와 태그의 단순 비교방식인 기존의 검색을 비교하였으며 실험 결과, 정확도와 재현율에서 본 시스템의 우수함을 확인할 수 있었다.

Keywords

References

  1. 홍성태, 임일, “웹 2.0 환경에서 정보 분류와 필터링, 그리고 협업을 위한 기술의 동향 및 발전 방향,” Telecommunications Review, 제17권, 제4호, 2007.
  2. http://www.flickr.com/
  3. “WordNet, a lexical database for the English language," http://wordnet.princeton.edu/
  4. 권대현, 홍준혁, 조수선, “태그기반의 웹 이미지 검색에서 워드넷을 이용한 검색 순위 조정,” 한국멀티미디어학회 추계학술발표대회논문집, pp. 685-688, 2008. 11.
  5. 이강표, 김두남, 김형주, “웹 2.0 환경에서의 태깅기술 동향,” 한국정보과학회지, 제25권, 제10호, 2007.
  6. G. Begelman, et al., “Automated Tag Clustering: Improving search and exploration in the tag space," In Proc. of the Collaborative Web Tagging Workshop at WWW''06, 2006.
  7. A. Hotho, et al., “Information Retrieval in Folksonomies: Search and Ranking," In Proc. of ESWC''06, 2006.
  8. S. Angeletou, et al., “Bridging the Gap Between Folksonomies and the Semantic Web: An Experience Report," In Proc. of Workshop: Bridging the Gap between Semantic Web and Web 2.0, European Semantic Web Conference, 2007.
  9. V.D. Celine, et al., “Folksontology: An integrated approach for turning folksonomies into ontologies," In Proc. of Workshop: Bridging the Gap between Semantic Web and Web 2.0, European Semantic Web Conference, 2007.
  10. 이시화, 이만형, 황대훈, “Web2.0 환경에서의 효율적인 이미지 검색을 위한 태그 클러스터링 시스템의 설계 및 구현,” 멀티미디어학회 논문지, 제11권, 제8호, 2008.
  11. G. A. Miller, “WordNet: An On- line Lexical Datbase," International Journal of Lexicography, Vol.3, No.4, 1990.
  12. Philip Resnik, “Using information content to evaluate semantic similarity in a taxonomy," Proceedings of the 14th International Joint Conference on Artificial Intelligence, Montreal, 1995.
  13. C. Leacock, M. Chodorow, “WordNet : An Electronic Lexical Database," C Fellbaum (Ed.), Combining local context and WordNet similarity for word sense identification, The MIT Press, pp. 265-283, 1998.
  14. 김형일, 김준태, “워드넷 기반 협동적 평가와 하이퍼링크를 이용한 검색엔진의 성능 향상,” 정보처리학회논문지B, 제11-B권, 제3호, 2004.
  15. 최준호, 조미영, 김판구, “컬러 분포와 WordNet상의 유사도 측정을 이용한 의미적 이미지 검색,” 정보처리학회논문지B, 제11-B권, 제4호, 2004.
  16. Y. Alp Aslandogan. et al., “Using Semantic contents and WordNet in image retrieval," In Proc. of ACM SIGIR97, Philadelphia PA, USA, pp. 286-295, 1997.
  17. G. Varelas, et aI., “Semantic Similarity Methods in WordNet and their Application to Information Retrieval on the Web," In Proc. of the 7th ACM Intern. Workshop on Web Information and Data Management (WIDM 2005), Bremen, Germany, pp. 10-16, 2005.
  18. P. Schmitz, “Inducing Ontology from Flickr Tags," In Proc. of the Collaborative Web Tagging Workshop at WWW''06, 2006.