• 제목/요약/키워드: 텍스트 어노테이션

검색결과 8건 처리시간 0.031초

XML문서에서 어노테이션의 위치재생성 기법 (Annotation Repositioning Methods in XML Documents)

  • 손원성;김재경;고명철;임순범;최윤철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권7호
    • /
    • pp.650-662
    • /
    • 2005
  • 어노테이션 시스템에서 원본문서가 갱신되었을 경우 어노테이션이 항상 적절한 위치를 유지하기 위해서는 로버스트(robust)한 위치재생성(repositioning) 기능이 필요하다. XML 문서환경에서 어노테이션에 대한 위치재생성을 위해서는 텍스트 정보뿐만 아니라 구조문서 특성을 포함할 수 있어야 한다. 이를 위하여 본 논문에서는 XML 기반의 원본문서 및 어노테이션 정보를 논리구조트리(logical structure tree)로 표현하고, 각 트리간의 대응관계를 분석하여 복수의 후보 앵커들을 생성한다 또한 복수의 후보 앵커들 중 최적의 후보 앵커를 선택하기 위하여 논리구조트리 앵커 노드의 문자열(textual data) 및 레이블 정보에 기반한 단계별 앵커링 기준을 제시한다. 그 결과 본 논문에서는 구조문서 환경에서 다양한 형태의 컨텍스트 갱신이 발생하였을 경우에도 로버스트한 위치재생성이 가능하다.

전자책 환경을 위한 사회적 어노테이션 및 탐색 지원 기법 (Social Annotation and Navigation Support for Electronic Textbooks)

  • 김재경;손원성
    • 한국멀티미디어학회논문지
    • /
    • 제12권10호
    • /
    • pp.1486-1498
    • /
    • 2009
  • 최근 전자 도서관 분야에서는 기존의 종이책을 디지털 형식으로 변환할 때 원본 문서의 모든 정보를 보존 할 수 있도록 스캐닝을 통한 이미지 기반의 형식을 이용하는데 주력하여왔다. 텍스트 형식의 문서와는 달리 이미지 형식의 문서는 해당 문서가 가진 정보를 쉽게 인식하기 어렵기 때문에 사용자가 접근, 처리 및 검색 등 디지털 문서로서 이미지를 활용하는데 에는 새로운 기법이 요구된다. 본 논문에서는 이미지 기반 문서에서 사용자 정보를 입력할 수 있는 어노테이션 및 사회적 탐색 지원 기법을 적용하여 디지털 문서의 사용성을 높이고, 특히 기존 온라인 교육 시스템에서 문제적으로 지적돼온 학습자의 낮은 참여율을 제안 기법을 통하여 개선하였다. 제안 기법은 현재 대학원 수업에 적용되어 어노테이션 및 사회적 탐색기법이 학습자가 학습 자료를 보다 효율적으로 활용하고 교육 시스템의 활용성을 얼마나 높이는지에 대해 검증하였다.

  • PDF

한국어 텍스트의 개체 URI 탐지: 품사 태깅 독립적 개체명 인식과 중의성 해소 (A Non-morphological Approach for DBpedia URI Spotting within Korean Text)

  • 김영식;함영균;김지성;황도삼;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.100-106
    • /
    • 2014
  • URI spotting (탐지) 문제는 텍스트에 있는 단어열 중에서 URI로 대표되는 개체(entity)에 해당되는 것을 탐지하는 것이다. 이 문제는 두 개의 작은 문제를 순차적으로 해결하는 과제이다. 즉, 첫째는 어느 단어열이 URI에 해당하는 개체인가를 인식하는 것이고, 둘째는 개체 중의성 해소 문제로서 파악된 개체가 복수의 URI에 해당할 수 있는 의미적 모호성이 있을 때 그 URI중 하나를 선택하여 모호성을 해소하는 것이다. 이 논문은 디비피디아 URI를 대상으로 한다. URI 탐지 문제는 개체명 인식 문제와 비슷하나, URI(예를 들어 디비피디아 URI, 즉 Wikipedia 등재어)에 매핑될 수 있는 개체로 한정되므로 일반적인 개체명 인식 문제에서 단어열의 품사열이 기계학습의 자질로 들어가는 방법론과는 다른 자질을 사용할 수 있다. 이 논문에서는 한국어 텍스트를 대상으로 한국어 디비피디아 URI 탐지문제로서 SVM을 이용한 개체경계 인식 방법을 제시하여, 일반적 개체명 인식에서 나타나는 품사태거의 오류파급효과를 없애고자 한다. 또한 개체중의성 해소 문제는 의미모호성이 주변 문장들의 토픽에 따라 달라지므로, LDA를 활용하며 이를 영어 디비피디아 URI탐지에서 쓰인 방법들과 비교한다.

  • PDF

소셜 미디어 검색을 위한 Flickr Note의 분석 및 응용에 관한 연구 (A Study on Analysis of Flickr Note and Its Applications for Social Media Search)

  • 정진우;홍현기;이동호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(A)
    • /
    • pp.49-52
    • /
    • 2011
  • 본 연구에서는 Flickr에서 제공하는 어노테이션 기법 중 Note 서비스에 대한 다양한 분석 결과를 제공하고, 이를 기반으로 소셜 미디어 검색을 위한 Flickr Note의 응용 방안을 제안한다. Flickr Note는 기존의 태그 기반 검색에서 활용되는 태그와는 달리 이미지의 특정 영역 위에 직접적으로 할당되는 텍스트들의 집합이다. Flickr Note는 보다 지능적인 소셜 이미지 공유 및 검색 서비스를 위하여 다양한 정보들을 제공할 수 있는 중요한 데이터지만, 이를, 이미지 검색에 효과적으로 활용하기 위한 연구는 미미한 수준이다. 따라서 본 연구에서는 Flickr Note에 대한 다양한 분석을 통하여 소설 이미지 검색에서 Note의 역할 및 활용 기능성을 제공하고자 하며, 이를 바탕으로 Flickr Note 기반의 이미지 분석 및 검색을 위한 다양한 연구들이 시도되기를 기대한다.

온톨로지 기반 지식 검색 시스템 개발: KT 콜센터 사례 (Development of an ontology-based knowledge search system: The case of KT call center)

  • 안세열;최현식
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.576-579
    • /
    • 2010
  • 콜센터의 고객문의는 복잡하여 기존 검색 시스템으로는 고객의 문제점을 신속하게 찾아 상담에 적용하는데 문제가 많았다. 온톨로지를 구축하고 시맨틱 검색을 제공할 경우 보다 보다 좋은 검색 기능을 제공할 것으로 기대되나 콜센터의 상담지식은 내용이 매우 복잡하여 그 텍스트의 내용을 완벽하게 온톨로지로 표현하는 것은 쉽지 않았다. 본 논문에서는 온톨로지 기반으로 구축된 지식베이스의 데이터 검색과 함께 그와 가장 관련성이 높은 문서를 출력하기 위해 문서를 온톨로지와 링크하여 어노테이션하는 방법을 제안한다. 본 시스템을 적용한 상담에서 상담원들의 생산성이 향상되고 고객 만족도를 높이는 결과를 확인했다.

인체영상 어노테이션 DB 설계에 관한 연구 (A Study on Design of Annotation Database for Visible Human)

  • 안부영;이승복;한건;이상호
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2008년도 춘계 종합학술대회 논문집
    • /
    • pp.819-822
    • /
    • 2008
  • 최근 들어 정보기술과 컴퓨터 네트워크가 급속도로 발전하면서 디지털콘텐트의 보급이 증가하고 있다. 디지털 콘텐트는 멀티미디어 형태의 2, 3차원 정보로 표현되며 이 가운데 인간의 몸을 촬영하여 데이터베이스를 구축한 인체영상 데이터베이스는 다양한 분야에 활용될 수 있는 주요한 디지털 콘텐트이다. 한국과학기술정보연구원(KISTI)에서는 한국인의 인체영상, 골격형상, 인체물성, 인체모델 등 다양한 인체정보를 현재 구축 중에 있으며 이러한 정보들을 인터넷을 통해 공개하고 있다. 그러나 인체영상의 각 이미지에 관한 설명자료는 제공되고 있지 않아 의학영상 전문가가 아니면 각 이미지에 대한 세부내용을 알 수가 없다. 이에 본 논문에서는 인체영상 데이터의 정보접근 효율성을 향상시키고자 한국인의 인체영상 데이터베이스를 대상으로 하여 이미지에 관한 설명과 특이사항을 정리하여 이미지와 텍스트가 연계 가능한 어노테이션 데이터베이스 및 검색 인터페이스를 설계하였다. 이를 통해 보다 접근성이 좋은 인체영상 데이터베이스의 개발과 함께 데이터 활용이 더욱 촉진되리라 기대된다.

  • PDF

온톨로지 인스턴스 생성 지원 도구 개발 (A development on Ontology Instance Management Tool)

  • 이미경;정한민;김문석;성원경
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2007년도 추계 종합학술대회 논문집
    • /
    • pp.386-390
    • /
    • 2007
  • 시맨틱 웹 기술의 발전에 따라 온톨로지는 점점 복잡해지고 대용량화되고 있어서 기존의 온톨로지 저작도구를 이용하여 인스턴스를 구축하게 되면 인스턴스 관리에 많은 어려움이 따르기 때문에 사용자 입장에서 편리하게 인스턴스 생성을 지원해주는 도구가 필요하게 되었다. 본 논문에서 개발한 온톨로지 지원도구 OntoManager는 계층적 인스턴스들의 관계를 쉽게 구현하기 위해서 히스토리 기반의 인스턴스 생성 뷰를 제공하여 인스턴스 생성 작업 시 사용자의 현재 작업 뷰에서 흐트러지지 않고 새로운 클래스의 인스턴스 생성할수 있으며 생성된 인스턴스의 자동 연결 기능을 제공한다. 그리고 웹브라우저와 개체명 인식 기능을 제공하여 웹 페이지의 텍스트에서 인스턴스 생성에 필요한 부가 정보를 자동 추천 해줘서 인스턴스 속성 값을 쉽게 구축할 수 있도록 도와준다. 마지막으로 이미지 어노테이션 기능을 제공하여 이미지의 특정 영역 정보를 선택하여 속성 값으로 가지는 인스턴스 생성도 지원해준다.

  • PDF

모바일 랜드마크 가이드 : LOD와 문맥적 장치 기반의 실외 증강현실 (A Mobile Landmarks Guide : Outdoor Augmented Reality based on LOD and Contextual Device)

  • 조비성;누르지드;장철희;이기성;조근식
    • 지능정보연구
    • /
    • 제18권1호
    • /
    • pp.1-21
    • /
    • 2012
  • 최근 스마트폰의 등장으로 인해 사용자들은 시간과 공간의 제약 없이 스마트폰을 이용한 새로운 의사소통의 방법을 경험하고 있다. 이러한 스마트폰은 고화질의 컬러화면, 고해상도 카메라, 실시간 3D 가속그래픽과 다양한 센서(GPS와 Digital Compass) 등을 제공하고 있으며, 다양한 센서들은 사용자들(개발자, 일반 사용자)로 하여금 이전에 경험하지 못했던 서비스를 경험할 수 있도록 지원하고 있다. 그 중에서 모바일 증강현실은 스마트폰의 다양한 센서들을 이용하여 개발할 수 있는 대표적인 서비스 중 하나이며, 이러한 센서들을 이용한 다양한 방법의 모바일 증강현실 연구들이 활발하게 진행되고 있다. 모바일 증강현실은 크게 위치 정보 기반의 서비스와 내용 기반 서비스로 구분할 수 있다. 위치 정보 기반의 서비스는 구현이 쉬운 장점이 있으나, 증강되는 정보의 위치가 실제의 객체의 정확한 위치에 증강되는 정보가 제공되지 않는 경우가 발생하는 단점이 존재한다. 이와 반대로, 내용 기반 서비스는 정확한 위치에 증강되는 정보를 제공할 수 있으나, 구현 및 데이터베이스에 존재하는 이미지의 양에 따른 검색 속도가 증가하는 단점이 존재한다. 본 논문에서는 위치 정보 기반의 서비스와 내용기반의 서비스의 장점들을 이용한 방법으로, 스마트폰의 다양한 센서(GPS, Digital Compass)로 부터 수집된 정보를 이용하여 데이터베이스의 탐색 범위를 줄이고, 탐색 범위에 존재하는 이미지들의 특징 정보를 기반으로 실제의 랜드마크를 인식하고, 인식한 랜드마크의 정보를 링크드 오픈 데이터(LOD)에서 검색하여 해당 정보를 제공하는 랜드마크 가이드 시스템을 제안한다. 제안하는 시스템은 크게 2개의 모듈(랜드마크 탐색 모듈과 어노테이션 모듈)로 구성되어있다. 첫 번째로, 랜드마크 탐색 모듈은 스마트폰으로 인식한 랜드마크(건물, 조형물 등)에 해당하는 정보들을 (텍스트, 사진, 비디오 등) 링크드 오픈 데이터에서 검색하여 검색된 결과를 인식한 랜드마크의 정확한 위치에 정보를 제공하는 역할을 한다. 스마트폰으로부터 입력 받은 이미지에서 특징점 추출을 위한 방법으로는 SURF 알고리즘을 사용했다. 또한 실시간성을 보장하고 처리 속도를 향상 시키기 위한 방법으로는 입력 받은 이미지와 데이터베이스에 있는 이미지의 비교 연산을 수행할 때 GPS와 Digital Compass의 정보를 사용하여 그리드 기반의 클러스터링을 생성하여 탐색 범위를 줄임으로써, 이미지 검색 속도를 향상 시킬 수 있는 방법을 제시하였다. 두 번째로 어노테이션 모듈은 사용자들의 참여에 의해서 새로운 랜드마크의 정보를 링크드 오픈 데이터에 추가할 수 있는 기능을 제공한다. 사용자들은 키워드를 이용해서 링크드 오픈 데이터로에서 관련된 주제를 검색할 수 있으며, 검색된 정보를 수정하거나, 사용자가 지정한 랜드마크에 해당 정보를 표시할 수 있도록 지정할 수 있다. 또한, 사용자가 지정하려고 하는 랜드마크에 대한 정보가 존재하지 않는다면, 사용자는 랜드마크의 사진을 업로드하고, 새로운 랜드마크에 대한 정보를 생성하는 기능을 제공한다. 이러한 과정은 시스템이 카메라로부터 입력 받은 대상(랜드마크)에 대한 정확한 증강현실 컨텐츠를 제공하기 위해 필요한 URI를 찾는데 사용되며, 다양한 각도의 랜드마크 사진들을 사용자들에 의해 협업적으로 생성할 수 있는 환경을 제공한다. 본 연구에서 데이터베이스의 탐색 범위를 줄이기 위해서 랜드마크의 GPS 좌표와 Digital Compass의 정보를 이용하여 그리드 기반의 클러스터링 방법을 제안하여, 그 결과 탐색시간이 기존에는 70~80ms 걸리는 반면 제안하는 방법을 통해서는 18~20ms로 약 75% 정도 향상된 것을 확인할 수 있었다. 이러한 탐색시간의 감소는 전체적인 검색시간을 기존의 490~540ms에서 438~480ms로 약 10% 정도 향상된 것을 확인하였다.