• 제목/요약/키워드: annotation information

검색결과 391건 처리시간 0.026초

Universal conceptual cognitive annotation(UCCA) 주석 체계의 한국어 적용 연구 (A Study on UCCA for Korean Semantic Analysis)

  • 오태환;한지윤;최현수;박석원;김한샘
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.353-356
    • /
    • 2019
  • 본 논문은 Universal conceptual cognitive annotation(보편 개념 인지 주석, 이하 UCCA)를 한국어에 적용하는 방안에 대해 제시하였다. 우선 기존의 한국어 의미 분석 체계들의 장단점을 살펴본 뒤, UCCA가 가지고 있는 상대적인 장점들을 소개하였다. UCCA는 모든 언어에 대하여 일관적인 기술을 하려는 Meaning representation framework의 하나로, 보편언어적인 의미 분석 체계를 가지고 있다. 본고는 주석 단위와 문법적 요소의 관점에서 한국어의 특성을 반영하여 UCCA를 한국어에 적용하는 방안을 검토하였다.

  • PDF

XML문서에서 어노테이션의 위치재생성 기법 (Annotation Repositioning Methods in XML Documents)

  • 손원성;김재경;고명철;임순범;최윤철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권7호
    • /
    • pp.650-662
    • /
    • 2005
  • 어노테이션 시스템에서 원본문서가 갱신되었을 경우 어노테이션이 항상 적절한 위치를 유지하기 위해서는 로버스트(robust)한 위치재생성(repositioning) 기능이 필요하다. XML 문서환경에서 어노테이션에 대한 위치재생성을 위해서는 텍스트 정보뿐만 아니라 구조문서 특성을 포함할 수 있어야 한다. 이를 위하여 본 논문에서는 XML 기반의 원본문서 및 어노테이션 정보를 논리구조트리(logical structure tree)로 표현하고, 각 트리간의 대응관계를 분석하여 복수의 후보 앵커들을 생성한다 또한 복수의 후보 앵커들 중 최적의 후보 앵커를 선택하기 위하여 논리구조트리 앵커 노드의 문자열(textual data) 및 레이블 정보에 기반한 단계별 앵커링 기준을 제시한다. 그 결과 본 논문에서는 구조문서 환경에서 다양한 형태의 컨텍스트 갱신이 발생하였을 경우에도 로버스트한 위치재생성이 가능하다.

지능형CCTV시스템 성능평가를 위한 영상DB와 영상 주석도구 개발 (Development of Video Data-base and a Video Annotation Tool for Evaluation of Smart CCTV System)

  • 박장식;이승재
    • 한국전자통신학회논문지
    • /
    • 제9권7호
    • /
    • pp.739-745
    • /
    • 2014
  • 지능형CCTV시스템 성능평가를 위한 영상취득 및 영상DB 구축 그리고 평가방안을 제시한다. 영상취득은 각 시나리오에 대하여 원거리, 중거리, 근거리 영역을 설정하여 취득하였다. 영상DB에는 영상녹화정보, 검출영역, 실측경보를 XML형식으로 기록한다. 본 논문에서는 영상DB 제작을 위한 효율적인 실측정보 기록을 위한 영상 주석도구를 제안한다. 영상 주석도구는 특정 영상에 대하여 실측정보를 기록하고 지능형CCTV시스템의 출력경보와 비교하여 검출 성능을 평가하는 기능을 포함한다.

3D 가상공간에서 시멘틱 어노테이션 객체의 생성 및 검색 기법 (Creation and Retrieval Method of Semantic Annotation Objects in 3D Virtual Worlds)

  • 김수진;유석종
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권5호
    • /
    • pp.11-18
    • /
    • 2008
  • 세컨드라이프와 같은 3D 가상공간에서 가상객체를 생성하고 생성된 객체를 탐색하는 일은 시스템의 활용성을 높여주는 중요한 기능이다. 기존 가상공간은 개발자에 의해 구성된 이후에는 일반사용자에 의한 객체정보 변경이나 추가가 불가능하여 인터넷 상에서 사용자가 직접 콘텐츠를 만들어 참여하는 웹2.0의 목표에 부합하고 있지 않다. 이러한 가상공간 내에서 사용자의 콘텐츠 생성 욕구를 만족시키고 기존 가상공간의 한계를 개선하기 위하여 본 논문에서는 2D웹 상에서의 사용자에 의한 컨텐츠 생성 및 검색 기능을 3D 가상공간에 적용하는 시멘틱 어노테이션 객체의 개념을 제안하고자 한다. 제안 연구는 3D 가상공간에 웹의 정보공유 기능을 통합함으로써 가상공간에 대한 사용자 만족도를 높이는 효과가 있으며, 기존 가상공간과 제안시스템과의 공간 탐색시간 비교실험을 통하여 성능 개선 효과가 있음을 확인하였다.

  • PDF

AgeCAPTCHA: an Image-based CAPTCHA that Annotates Images of Human Faces with their Age Groups

  • Kim, Jonghak;Yang, Joonhyuk;Wohn, Kwangyun
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제8권3호
    • /
    • pp.1071-1092
    • /
    • 2014
  • Annotating images with tags that describe the content of the images facilitates image retrieval. However, this task is challenging for both humans and computers. In response, a new approach has been proposed that converts the manual image annotation task into CAPTCHA challenges. However, this approach has not been widely used because of its weak security and the fact that it can be applied only to annotate for a specific type of attribute clearly separated into mutually exclusive categories (e.g., gender). In this paper, we propose a novel image annotation CAPTCHA scheme, which can successfully differentiate between humans and computers, annotate image content difficult to separate into mutually exclusive categories, and generate verified test images difficult for computers to identify but easy for humans. To test its feasibility, we applied our scheme to annotate images of human faces with their age groups and conducted user studies. The results showed that our proposed system, called AgeCAPTCHA, annotated images of human faces with high reliability, yet the process was completed by the subjects quickly and accurately enough for practical use. As a result, we have not only verified the effectiveness of our scheme but also increased the applicability of image annotation CAPTCHAs.

임베디드 RDBMS로의 효율적인 XML 문서 저장 방법 (Efficient XML Document Storage Model to Embedded RDBMS)

  • 조국래;임태형;강원석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.66-71
    • /
    • 2007
  • 멀티미디어 데이터에 대한 효율적인 검색을 지원하기 위해 제정된 MPEG7이나 TV-AnyTime 등의 표준들은 XML을 사용하여 Metadata를 효과적으로 표현할 수 방법을 제시하고 있다. 플랫폼에 독립적으로 사용가능하다는 XML의 강점에도 불구하고 Text 방식으로 데이터를 저장하기 때문에 보안에 취약할 수밖에 없으며, 대용량의 자료 처리에도 문제점을 드러낸다. 이를 보완하기 위하여 XML 문서를 RDBMS에 저장하는 방법들이 제안되고 있는데, 기존의 Model Mapping이나 Structure Mapping의 경우 노드 검색을 위해 Traversing을 할 경우 많은 조인이 필요하기 때문에 한정된 메모리와 낮은 처리능력을 갖춘 임베디드 멀티미디어 플랫폼에서는 비효율적일 수밖에 없다. 본 논문에서는 MPEG7 Metadata를 RDBMS에 저장하고, 이를 검색할 때, 조인의 횟수를 최소화할 수 있는 저장 모델을 제안하고 있다. 부모, 자식, 형제간의 노드를 효율적으로 검색할 수 있도록 path MetaSchema를 제안함으로써, 최소 1번의 검색으로 필요한 노드 정보들을 추출할 수 있도록 하였다. 그리고 Annotation 작성시에 XML의 Attribute와 Element로 삽입하였기에, 기존의 방법에서 Annotation을 분석하기 위해 필요했던 Annotation 파싱을 제거하고, SAX나 DOM을 사용할 수 있도록 제안함으로써, Annotation의 정보에 대한 접근이 효율적으로 개선되었다.

  • PDF

서비스 지향 구조 기반의 EST 서열 주해 시스템 (An EST Sequence Annotation System Based On Service Oriented Architecture)

  • 남성혁;김태경;김경란;조완섭
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권3호
    • /
    • pp.35-44
    • /
    • 2008
  • 본 논문에서는 SOA 기반의 EST 서열 주해 시스템인 SeqWeB을 제안한다. SeqWeB은 EST 서열 주해에 사용되는 8개의 분석 프로그램 (Phrap, cross_match, RepeatMasker, ICAtools, TGICL, CAP 3, Phrap, BLAST)을 웹 서비스로 제작하고, BPEL (Business Process Execution Language)을 통해 8개의 서비스를 다양한 형태로 조합한다. BPEL로 조합한 서비스들은 표준 데이터 형식으로 통신하여 통합 시 상호 운용성을 보장한다. SeqWeB은 웹 서비스와 BPEL을 통한 약 결합 방식으로 통합하여, 기존의 애플리케이션 통합 방식보다 시스템의 확장과 수정이 쉬우며 유지보수 비용이 저렴하다. 또한, SeqWeB은 다른 서비스의 컴포넌트로 사용될 수도 있다. SeqWeB을 통해 SOA가 지향하는 재사용성(Reusability)과 유연성 (Flexible)을 기반으로 기존과 다른 방식의 생물학 분야의 애플리케이션 통합방법론을 제시한다.

  • PDF

LitCovid-AGAC: cellular and molecular level annotation data set based on COVID-19

  • Ouyang, Sizhuo;Wang, Yuxing;Zhou, Kaiyin;Xia, Jingbo
    • Genomics & Informatics
    • /
    • 제19권3호
    • /
    • pp.23.1-23.7
    • /
    • 2021
  • Currently, coronavirus disease 2019 (COVID-19) literature has been increasing dramatically, and the increased text amount make it possible to perform large scale text mining and knowledge discovery. Therefore, curation of these texts becomes a crucial issue for Bio-medical Natural Language Processing (BioNLP) community, so as to retrieve the important information about the mechanism of COVID-19. PubAnnotation is an aligned annotation system which provides an efficient platform for biological curators to upload their annotations or merge other external annotations. Inspired by the integration among multiple useful COVID-19 annotations, we merged three annotations resources to LitCovid data set, and constructed a cross-annotated corpus, LitCovid-AGAC. This corpus consists of 12 labels including Mutation, Species, Gene, Disease from PubTator, GO, CHEBI from OGER, Var, MPA, CPA, NegReg, PosReg, Reg from AGAC, upon 50,018 COVID-19 abstracts in LitCovid. Contain sufficient abundant information being possible to unveil the hidden knowledge in the pathological mechanism of COVID-19.

워키태깅 : 스마트폰 환경에서 음성기반의 효과적인 영상 콘텐츠 어노테이션 방법에 관한 연구 (WalkieTagging : Efficient Speech-Based Video Annotation Method for Smart Devices)

  • 박준영;이수빈;강동엽;석영태
    • 한국IT서비스학회지
    • /
    • 제12권1호
    • /
    • pp.271-287
    • /
    • 2013
  • The rapid growth and dissemination of touch-based mobile devices such as smart phones and tablet PCs, gives numerous benefits to people using a variety of multimedia contents. Due to its portability, it enables users to watch a soccer game, search video from YouTube, and sometimes tag on contents on the road. However, the limited screen size of mobile devices and touch-based character input methods based on this, are still major problems of searching and tagging multimedia contents. In this paper, we propose WalkieTagging, which provides a much more intuitive way than that of previous one. Just like any other previous video tagging services, WalkieTagging, as a voice-based annotation service, supports inserting detailed annotation data including start time, duration, tags, with little effort of users. To evaluate our methods, we developed the Android-based WalkieTagging application and performed user study via a two-week. Through our experiments by a total of 46 people, we observed that experiment participator think our system is more convenient and useful than that of touch-based one. Consequently, we found out that voice-based annotation methods can provide users with much convenience and satisfaction than that of touch-based methods in the mobile environments.

Active Learning on Sparse Graph for Image Annotation

  • Li, Minxian;Tang, Jinhui;Zhao, Chunxia
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제6권10호
    • /
    • pp.2650-2662
    • /
    • 2012
  • Due to the semantic gap issue, the performance of automatic image annotation is still far from satisfactory. Active learning approaches provide a possible solution to cope with this problem by selecting most effective samples to ask users to label for training. One of the key research points in active learning is how to select the most effective samples. In this paper, we propose a novel active learning approach based on sparse graph. Comparing with the existing active learning approaches, the proposed method selects the samples based on two criteria: uncertainty and representativeness. The representativeness indicates the contribution of a sample's label propagating to the other samples, while the existing approaches did not take the representativeness into consideration. Extensive experiments show that bringing the representativeness criterion into the sample selection process can significantly improve the active learning effectiveness.