• 제목/요약/키워드: Free-form Annotation

검색결과 6건 처리시간 0.019초

XML문서 환경에서의 내용기반 자유형 Annotation 생성 기법 (A Method of Context based Free-form Annotation in XML Documents)

  • 손원성;김재경;임순범;최윤철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권9호
    • /
    • pp.850-861
    • /
    • 2003
  • 정확한 자유형 annotation 정보를 생성하기 위해서는 자유형 마킹의 기하 정보와 대상문서 내용(context)간에 영역 추출 과정에서 발생하는 모호성들을 인식 및 해결할 수 있어야 한다. 따라서 본 논문에서는 먼저 XML 기반의 annotation 환경에서 자유형 마킹과 다양한 내용간에 발생할 수 있는 모호성을 분석하였으며 이를 해결하기 위한 기법을 제안한다. 제안 기법은 자유형 마킹과 annotation이 생성된 영역간의 다양한 비구조 및 구조정보를 포함하는 내용을 기반으로 한다. 제안 기법에 의하여 분석 및 판별된 annotation 정보는 본 논문에서 정의한 XML 기반의 DTD로 표현되며, 본 연구에서 구현한 시스템을 통하여 출력 및 교환된다. 그 결과 본 연구의 제안 기법을 통하여 생성된 자유형 마킹 정보는 기존의 기법보다 정확한 annotation 영역을 포함하며, 다중사용자 및 서로 다른 문서환경에서도 명확한 교환을 가능케 할 수 있다.

명확한 free-form annotation 생성을 위한 인터페이스 설계 (Design of An Interface for Explicit Free-farm Annotation Creation)

  • 손원성;김재경;최윤철;임순범
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.139-141
    • /
    • 2002
  • Free-form annotation 환경에서 정확한 annotation 정보를 생성하기 위해서는 free-form 마킹의 기하 정보와 annotated part간의 관계를 분석하는 과정에서 발생하는 ambiguity를 인식 및 해결할 수 있어야 한다. 따라서 본 논문에서는 먼저 XML 기반의 annotation 환경에서 free-form 마킹과 다양한 컨텍스트 간에 발생할 수 있는 ambiguity를 분석하였으며 이를 해결하기 위한 annotation 보정 기법을 제안한다. 제안 기법은 free-form 마킹과 annotated part간의 다양한 textual 및 문서구조를 포함하는 컨텍스트를 기반으로 하며 본 연구에서 구현한 annotation 시스템을 통하여 출력 및 교환된다. 그 결과 본 연구의 제안 기법을 통하여 생성된 free-form 마킹 정보는 기존의 기법보다 사용자가 원하는 annotated part 영역을 포함할 수 있으며 따라서 다중사용자 및 서로 다른 문서환경에서도 명확한 교환 결과를 보장할 수 있다.

  • PDF

Modeling and Implementation of Context based Annotation for XML Documents

  • Sohn, Won-Sung;Ko, Myeong-Cheol;Kim, Jae-Kyung;Lim, Soon-Bum;Choy, Yoon-Chul
    • 한국멀티미디어학회논문지
    • /
    • 제6권4호
    • /
    • pp.565-575
    • /
    • 2003
  • This paper proposed context based annotation model and annotation ambiguity correction methods. The proposed model provides various annotation types, semantic models, and pen-based free drawing interface. Annotation correction method that is specifically based on the context which includes various textual and structure information between free-form marking and annotation. Also, interface for XML environment using the proposed model and correction methods is proposed and possibilities of application is looked at. The results from the implementation of the proposed method show that the annotated areas included in the free-form marking information are more accurate, achieving more accurate exchange results amongst multiple users in a heterogeneous document environment

  • PDF

휴대용 단말기 환경을 위한 Annotation 모델링 및 시스템 구현 (Annotation Modeling and System Implementation for Hand-held Environment)

  • 손원성
    • 정보교육학회논문지
    • /
    • 제10권2호
    • /
    • pp.219-226
    • /
    • 2006
  • 어노테이션(annotation)은 문서에서 개인의 의견, 정리, 요약 등을 표현하기 위한 주석을 의미한다. 따라서 전자문서에서도 어노테이션은 중요하게 사용되며 특히 전자 잉크(digital inking)릉 이용한 이동 단말기 환경에서 효과적으로 사용된다. 그러나 기존 연구에서는 휴대용 단말기 환경의 단점인 적은 디스플레이 공간을 전혀 고려하지 않기 때문에 어노테이션 작성 및 활용이 매우 불편하다. 따라서 본 논문에서는 전자펜과 이동식 단말기 환경을 고려한 어노테이션 모델 및 시스템을 제안한다. 제안 어노테이션 모델은 다양한 컨텍스트(context)를 고려하고 이에 기반한 어노테이션 마크업 언어를 정의한다. 본 모델은 다양한 어노테이션 타입 및 의미(semantic) 모델, 펜 기반 어노테이션의 자동 인식 및 영역 보정 기능 등을 고려하며, 이것을 기반으로 CAML(Context-based Annotation Markup Language)를 정의한다. 또한 본 모델을 이용하여 XML 기반의 전자책문서 및 단말기 환경을 고려한 어노테이션 시스템을 구현하고 그 활용 가능성에 대하여 살펴본다. 본 연구의 결과는 eLearning, Cyber-Class, IETM(Interactive Electronic Technical Manuals) 에서 적절히 응용 가능하다.

  • PDF

Extending TextAE for annotation of non-contiguous entities

  • Lever, Jake;Altman, Russ;Kim, Jin-Dong
    • Genomics & Informatics
    • /
    • 제18권2호
    • /
    • pp.15.1-15.6
    • /
    • 2020
  • Named entity recognition tools are used to identify mentions of biomedical entities in free text and are essential components of high-quality information retrieval and extraction systems. Without good entity recognition, methods will mislabel searched text and will miss important information or identify spurious text that will frustrate users. Most tools do not capture non-contiguous entities which are separate spans of text that together refer to an entity, e.g., the entity "type 1 diabetes" in the phrase "type 1 and type 2 diabetes." This type is commonly found in biomedical texts, especially in lists, where multiple biomedical entities are named in shortened form to avoid repeating words. Most text annotation systems, that enable users to view and edit entity annotations, do not support non-contiguous entities. Therefore, experts cannot even visualize non-contiguous entities, let alone annotate them to build valuable datasets for machine learning methods. To combat this problem and as part of the BLAH6 hackathon, we extended the TextAE platform to allow visualization and annotation of non-contiguous entities. This enables users to add new subspans to existing entities by selecting additional text. We integrate this new functionality with TextAE's existing editing functionality to allow easy changes to entity annotation and editing of relation annotations involving non-contiguous entities, with importing and exporting to the PubAnnotation format. Finally, we roughly quantify the problem across the entire accessible biomedical literature to highlight that there are a substantial number of non-contiguous entities that appear in lists that would be missed by most text mining systems.

XML 문서에서의 펜 기반 교정 인터페이스 (A Pen-based Proofreading Interface in XML Documents)

  • 손원성;김재경;최윤철;임순범;김우성
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권2호
    • /
    • pp.231-242
    • /
    • 2006
  • 펜 기반 교정 환경에서 정확한 마킹영역을 판별하기 위해서는 사용자가 드로잉한 교정마킹과 문서영역간의 관계를 판별하는 과정에서 발생하는 모호성(ambiguity)을 해결하여야 한다. 또한 웹 및 XML과 같은 구조문서 환경에서는 변경된 문서구조가 반드시 정의된 DTD에 따라야 한다. 본 논문에서는 자유형 마킹에 의한 교정부호 입력이 가능하며, 교정 마킹과 원본문서의 영역을 판별하는 과정에서 발생하는 모호성 문제를 최소화하기 위한 컨텍스트 기반의 영역인식 및 보정 인터페이스(Context-based Proofreading Interface)를 제안한다. 제안 인터페이스에서는 교정부호의 입력에 따른 문서내용 및 구조의 변화가 발생할 경우 올바르게 문서 구조를 유지하기 위한 구조변경 방법을 제공한다. 그 결과 본 논문에서 생성된 교정 마킹 정보는 기존 교정시스템에 비하여 보다 정확한 영역정보를 포함할 수 있으며, 교정부호 입력에 따른 구조문서 변경시에도 원본문서의 DTD에 따르는 문서구조를 유지할 수 있다.