• Title/Summary/Keyword: 데이터 어노테이션

Search Result 40, Processing Time 0.049 seconds

Design and Implementation of eBook Annotation Ontology Based on Non-First Normal Form (Non-First Normal Form에 입각한 eBook Annotation 온톨로지의 설계와 구현)

  • Shin Sung-Wook;Kim Jong-Suk;Lim Soon-Bum;Choy Yoon-Chul
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.361-363
    • /
    • 2005
  • 본 연구에서는 온라인 다중 사용자 환경의 eBook 어노테이션 시스템 개발에서 데이터를 의미 기반으로 관리하고, 데이터에 대하여 상호 공통적인 이해를 표현하며, 그리고 데이터에 대한 무결성 검사 등을 지원하기 위해서 eBook 어노테이션 온톨로지를 구축하였다. eBook 어노테이션 테이터에 대한 상호 공통적인 이해의 표현을 위해서 한국 전자책 문서 표준인 EBKS(Electronic Book of Korea Standard)를 기반으로 구축 하였으며 구축된 온톨로지는 Conceptual Graph(CG)를 사용하여 표현하였다. 의미 기반의 처리를 위해서 본 온톨로지에서는 다국어(Multilingua) 관계를 고려하였으며 또한 오노테이션 데이터 생성 시 중요도를 표현하기 위해서 중요성 axiom을 고려했고, $NF^2$(Non-First Normal Form)에 입각하여 온톨로지를 설계함으로서 어노테이션 데이터의 검색에 활용도를 높였다. 제안된 온톨로지는 어노테이션 데이터의 재사용성을 높일 수 있고 의미 정보를 활용함으로써 eLearning, cyberclass과 같은 다중 사용자 환경에서 효과적인 협업을 가능하게 한다. 본 연구에서는 구현한 eBook annotation 시스템은 구축한 온톨로지를 사용함으로써 의미 기반의 데이터 관리가 가능하다. 또한 어노테이션 생성 시 온톨로지 구조를 모르더라도 어노테이션을 생성할 수 있는 인터페이스를 구현하였다.

  • PDF

A Collaborative Video Annotation and Browsing System using Linked Data (링크드 데이터를 이용한 협업적 비디오 어노테이션 및 브라우징 시스템)

  • Lee, Yeon-Ho;Oh, Kyeong-Jin;Sean, Vi-Sal;Jo, Geun-Sik
    • Journal of Intelligence and Information Systems
    • /
    • v.17 no.3
    • /
    • pp.203-219
    • /
    • 2011
  • Previously common users just want to watch the video contents without any specific requirements or purposes. However, in today's life while watching video user attempts to know and discover more about things that appear on the video. Therefore, the requirements for finding multimedia or browsing information of objects that users want, are spreading with the increasing use of multimedia such as videos which are not only available on the internet-capable devices such as computers but also on smart TV and smart phone. In order to meet the users. requirements, labor-intensive annotation of objects in video contents is inevitable. For this reason, many researchers have actively studied about methods of annotating the object that appear on the video. In keyword-based annotation related information of the object that appeared on the video content is immediately added and annotation data including all related information about the object must be individually managed. Users will have to directly input all related information to the object. Consequently, when a user browses for information that related to the object, user can only find and get limited resources that solely exists in annotated data. Also, in order to place annotation for objects user's huge workload is required. To cope with reducing user's workload and to minimize the work involved in annotation, in existing object-based annotation automatic annotation is being attempted using computer vision techniques like object detection, recognition and tracking. By using such computer vision techniques a wide variety of objects that appears on the video content must be all detected and recognized. But until now it is still a problem facing some difficulties which have to deal with automated annotation. To overcome these difficulties, we propose a system which consists of two modules. The first module is the annotation module that enables many annotators to collaboratively annotate the objects in the video content in order to access the semantic data using Linked Data. Annotation data managed by annotation server is represented using ontology so that the information can easily be shared and extended. Since annotation data does not include all the relevant information of the object, existing objects in Linked Data and objects that appear in the video content simply connect with each other to get all the related information of the object. In other words, annotation data which contains only URI and metadata like position, time and size are stored on the annotation sever. So when user needs other related information about the object, all of that information is retrieved from Linked Data through its relevant URI. The second module enables viewers to browse interesting information about the object using annotation data which is collaboratively generated by many users while watching video. With this system, through simple user interaction the query is automatically generated and all the related information is retrieved from Linked Data and finally all the additional information of the object is offered to the user. With this study, in the future of Semantic Web environment our proposed system is expected to establish a better video content service environment by offering users relevant information about the objects that appear on the screen of any internet-capable devices such as PC, smart TV or smart phone.

CCL-MASTer : XMP-based CCL Metadata Annotation Supporting Tool (CCL-MASTer : XMP기반의 CCL메타데이터 어노테이션 지원도구)

  • Yang, Kyoung-Mo;Hwang, Suk-Hyung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2009.04a
    • /
    • pp.504-507
    • /
    • 2009
  • 사용자 참여, 개방, 공유를 기반으로 하는 웹2.0 환경 하에서 보다 효율적이고 합법적으로 UCC(User Created Contents)가 제작, 공유, 유통되기 위한 저작권 시스템으로서, CCL(Creative Commons License)이 빠르게 확산되고 있다. 그러나, UCC에 CCL메타데이터를 직접 첨부하지 않는 기존의 CCL어노테이션 방식은 의도적으로 또는 비의도적으로 UCC와 CCL메타데이터가 분리될 수 있는 문제점을 가지고 있다. 그 결과, UCC로부터 분리되어진 저작권관련정보는 변경 또는 분실되어 추후에 저작권분쟁의 원인이 될 수 있다. 본 연구에서는 RDF와 XMP를 기반으로 CCL메타데이터를 이미지 컨텐츠에 직접 부착하는 방법을 제안하고 이를 지원하기 위한 어노테이션 지원도구(CCL-MASTer)를 개발하였다. 본 연구결과는, 기존의 어노테이션 기법의 문제점을 해결하고 다양하고 풍부한 CCL메타데이터의 효율적인 어노테이션을 가능케 하여 UCC 저작권분쟁 해결방안 및 UCC와 UCC관련 CCL메타데이터의 생성과 검색 등의 토대가 된다.

COAT: Manual Semantic Annotation Support Toolkit (COAT: 시맨틱 어노테이션 말뭉치 구축 지원 도구)

  • Choi, DongHyun;Kim, Eun-Kyung;Go, Eun-Bi;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2011.10a
    • /
    • pp.85-89
    • /
    • 2011
  • 수동 어노테이션을 통한 말뭉치 구축 작업은 많은 시간과 노력이 필요한 작업이지만, 자동화된 정보 추출 도구의 훈련 및 실험, 평가를 위해서는 꼭 필요한 작업이기도 하다. 본 논문에서는, 수동 시맨틱 어노테이션을 통한 말뭉치 구축 작업을 지원하는 수동 시맨틱 어노테이션 지원 도구 COAT를 소개한다. COAT는 각 어노테이터의 작업 효율을 높이기 위하여 GUI 기반 인터페이스를 제공하고, 작업의 대부분을 단축키만 이용하여 수행 가능하도록 설계되었다. 또한 최종 결과로 얻어지는 데이터의 신뢰성을 높이기 위하여, 최소 두 명 이상의 어노테이터가 같은 문서에 대하여 작업하면 고참 어노테이터가 각 결과물들을 통합하는 컨쥬게이션 도구를 구축하였으며, 각 어노테이터들의 작업 및 데이터들을 관리 감독하기 위한 관리자 도구를 개발하였다. 본 도구를 직접 사용하여 어노테이션 작업을 수행한 결과, 본 도구를 사용하지 않고 작업을 수행할 때와 비교하여 약 87%의 비용 절감 효과를 얻을 수 있었다.

  • PDF

Semantic Annotation and an Example of Korean Semantic Annotation System (시맨틱 어노테이션과 한국어 시맨틱 어노테이션 시스템 사례)

  • Shim, Sang-Ah;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2009.10a
    • /
    • pp.97-100
    • /
    • 2009
  • 인터넷에는 다양하고 많은 정보들이 담겨져 있다. 이 많은 정보들 중에서 사용자가 정말로 필요로 하는 정보를 기계로 추출해 내기 위해서 시맨틱 웹이라는 기술이 제안 되었다. 시맨틱 웹의 구현을 위해서는 기계가 해석할수 있는 데이터들이 필요한데 이것은 시맨틱 어노테이션을 통해서 얻어낼수 있다. 대부분의 시맨틱 어노테이션 시스템들은 영어로 작성된 문서들에 포커스를 두고 개발되었다. 한국어와 같은 교착어를 처리할수 있는 시스템들은 드물다. 본 논문에서는 시맨틱 어노테이션에 대해서 자세히 설명하고 한국어 시맨틱 어노테이션 시스템을 개발하는데에 어떤 언어적인 특징을 고려해야 하는지 살펴본다. 그리고 국외에서 개발된 한국어 시맨틱 어노테이션 시스템 EXCOM을 예제로 소개하겠다.

  • PDF

On Developing a Semantic Annotation Tool for Managing Metadata of Web Documents based on XMP and Ontology (웹 문서의 메타데이터 관리를 위한 XMP 및 온톨로지 기반의 시맨틱 어노테이션 지원도구 개발)

  • Yang, Kyoung-Mo;Hwang, Suk-Hyung;Choi, Sung-Hee
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.10 no.7
    • /
    • pp.1585-1600
    • /
    • 2009
  • The goal of Semantic Web is to provide efficient and effective semantic search and web services based on the machine-processable semantic information of web resources. Therefore, the process of creating and adding computer-understandable metadata for a variety of web contents, namely, semantic annotation is one of the fundamental technologies for the semantic web. Recently, in order to manage annotation metadata, direct approach for embedding metadata into the document is mainly used in semantic annotation. However, many semantic annotation tools for web documents have been mainly worked with HTML documents, and most of these tools do not support semantic search functionalities using the metadata. In this paper, based on these problems and previous works, we propose the Ontology-based Semantic Annotation tool(OSA) to efficiently support semantic annotation for web documents(such as HTML, PDF). We define a semantic annotation model that represents ontological-semantic information by using RDFS(RDF Schema). Based on XMP(eXtensible Metadata Platform) standard, the model is encoded directly into the document. By using OSA with XMP, user can perform semantic annotation on web documents which are able to keep compatibility for managing annotation metadata. Eventually, the integrated semantic annotation metadata can be used effectively in semantic search for a variety of web contents.

Technical Trends of Semantic Annotation for Semantic Web Services (시맨틱 웹서비스를 위한 시맨틱 어노테이션 기술 동향)

  • Moon, A.K.;Park, Y.M.;Kim, S.G.
    • Electronics and Telecommunications Trends
    • /
    • v.25 no.2
    • /
    • pp.121-131
    • /
    • 2010
  • 인터넷의 발전 과정에서 데이터 중심의 시맨틱 웹 기술과 서비스 중심의 웹서비스 기술은 시맨틱 웹서비스라는 융합기술로 발전하고 있다. 본 고에서는 시맨틱 웹서비스 실현의 핵심인 시맨틱 어노테이션(annotation) 기술을 소개하고, 접근 방식에 따라 톱다운 방식와 바텀업 방식으로 분류한 어노테이션 기술들을 비교 분석한다. 그리고 어노테이션 기술 중 WSMO 기반의 어노테이션을 이용하여 시맨틱 웹서비스를 모델링하는 사례를 보임으로써 시맨틱 웹서비스 실현의 가능성과 그 시기를 가늠해보고자 한다.

A Study on the Annotation of Digital Content (디지털 콘텐트의 어노테이션에 관한 연구)

  • Kwak, Seung-Jin
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.40 no.4
    • /
    • pp.267-286
    • /
    • 2006
  • Tools are needed to have access to more effective information and to select it in the environment of digital information where information pours in. and some of the advanced techniques to make up these tools are metadata and annotation. Annotation additionally records the marks for the supplementary explanation of and emphasis on a specific part of the original text and kas more various merits than metadata in terms of the search and use of digital resources. This research aims at suggesting methods that annotation. which has a range of functions including access to information. its reuse and sharing in the digital surroundings of late, can be applied to digital contents such as web services, digital libraries and electronic books. As to the research method, the case studies of annotation systems applied to web services and digital libraries have been carried out, and the metadata formation of the systems has been analyzed.

Design of Ontology-based Interactive Image Annotation System using Social Image Database (소셜 이미지 데이터베이스를 이용한 온툴로지 기반 대화형 이미지 어노테이션 시스템의 설계)

  • Jeong, Jin-Woo;Lee, Dong-Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.04a
    • /
    • pp.300-303
    • /
    • 2011
  • 이미지 어노테이션 기법은 효과적인 이마지 공유 및 검색을 위하여 활발하게 연구되고 있는 연구분야 중 하나로서, 최근에는 사용자들에 의하여 제작되는 방대한 양의 이미지 데이터 및 태그 정보를 제공하는 Flick와 같은 소셜 이마지 데이터베이스를 활용함으로써 이미지 어노테이션 및 이미지 검색을 효과적으로 수행하고자 하는 다양한 연구들이 시도되고 있다. 본 논문에서는 이미지 지식정보의 관리 및 공유를 위한 온톨로지와 소셜 이마지 데이터베이스를 활용하여 이미지 어노테이션을 수행하기 위한 시스템을 제안한다. 본 논문에서 제안하는 시스템은 소셜 이미지 데이터베이스를 활용하여 의미 있는 개념들을 이미지 어노테이션에 활용하며, 지식 관리 체계인 온툴로지를 이용하여 이미지 데이터베이스 내의 이미지 및 개념간에 존재하는 의미적 관련성을 기반으로 보다 효율적인 이미지 검색을 수행하고자 한다.

Semi-automatic Ontology Modeling for VOD Annotation for IPTV (IPTV의 VOD 어노테이션을 위한 반자동 온톨로지 모델링)

  • Choi, Jung-Hwa;Heo, Gil;Park, Young-Tack
    • Journal of KIISE:Software and Applications
    • /
    • v.37 no.7
    • /
    • pp.548-557
    • /
    • 2010
  • In this paper, we propose a semi-automatic modeling approach of ontology to annotate VOD to realize the IPTV's intelligent searching. The ontology is made by combining partial tree that extracts hypernym, hyponym, and synonym of keywords related to a service domain from WordNet. Further, we add to the partial tree new keywords that are undefined in WordNet, such as foreign words and words written in Chinese characters. The ontology consists of two parts: generic hierarchy and specific hierarchy. The former is the semantic model of vocabularies such as keywords and contents of keywords. They are defined as classes including property restrictions in the ontology. The latter is generated using the reasoning technique by inferring contents of keywords based on the generic hierarchy. An annotation generates metadata (i.e., contents and genre) of VOD based on the specific hierarchy. The generic hierarchy can be applied to other domains, and the specific hierarchy helps modeling the ontology to fit the service domain. This approach is proved as good to generate metadata independent of any specific domain. As a result, the proposed method produced around 82% precision with 2,400 VOD annotation test data.