• 제목/요약/키워드: Structured Document Retrieval

검색결과 39건 처리시간 0.027초

구조화된 비디오 문서의 데이터 모델 및 질의어와 색인 기법 (Data Model, Query Language, and Indexing Scheme for Structured Video Documents)

  • 류은숙;이규철
    • 한국멀티미디어학회논문지
    • /
    • 제1권1호
    • /
    • pp.1-17
    • /
    • 1998
  • 비디오 정보는 전자 도서관이나 WWW 및 주문형 비디오 (VOD) 시스템과 같은 다양한 응용분야에서 중요한 요소로 부각되고 있다. 비디오 정보는 특성상 계층적으로 구조화된 문서 형태를 가지기 때문에 본 논문에서는 이를 “구조화된 비디오 문서”라 부른다. 본 논문에서는 구조화된 비디오 문서를 데이터베이스에 효율적으로 저장하고, 검색하기 위한 데이터 모델과 질의어 및 색인 기법을 제안한다. 구조화된 비디오 문서는 논리적인 계층 구조 특성을 지니기 때문에, 본 논문에서는 객체 지향 데이터 모델을 이용하여 비디오 문서를 복합 객체로 모델링하고, 이를 저장하기 위한 객체 타입들을 정의한다. 또한 본 논문에서는 비디오 데이터의 캡션이나 주석을 기반으로 한 내용 기반 검색과 비디오 문서의 논리적 구조를 기반으로 한 구조 기반 검색을 제공하며, 비디오 문서의 시공간 관계 연산을 이용한 검색도 지원한다. 그리고, 구조화된 비디오 문서의 효율적인 질의와 색인 공간의 오버헤드를 줄이기 위해 최적화된 역 색인 기법을 제시한다.

  • PDF

자동 색인을 위한 한국어 형태소 분석기의 실제적인 구현 및 적용 (Practical Development and Application of a Korean Morphological Analyzer for Automatic Indexing)

  • 최성필;서정현;채영숙
    • 정보처리학회논문지B
    • /
    • 제9B권5호
    • /
    • pp.689-700
    • /
    • 2002
  • 본 논문에서는 정보검색 시스템에서 필수적인 자동 색인을 위한 한글 형태소 분석기를 구현하였다. 현존하는 대용량의 데이터에 대한 자동 색인을 효율적으로 수행하기 위해서 새로운 개념이나 아이디어의 도입 및 적용에 초점을 맞추기보다는 기존에 연구되었던 다양한 어절 분석 기법들을 바탕으로 어절분석 속도의 최대화, 형태소 분석기의 모듈화 및 구조화에 초점을 맞추었다. 따라서 본 논문에서 개발된 시스템의 특징은 이론적인 측면보다는 소프트웨어 공학적인 측면이 훨씬 더 강조된다 품사 사전의 구조화가 우선적으로 수행되었으며, 이에 따라서 체언 및 용언 분석 모듈, 수사 분석 모듈 둥이 구현되었다. 또한 형태소의 패턴을 이용한 미등록어 분석 기능이 개발되었다. 개발된 전체 시스템은 정보 검색 엔진인 K-2000 시스템의 색인 모듈로 장착되어서 적용되었다.

XML DTD의 효율적인 검색을 위한 구조 정보 및 인덱스 메카니즘 (An Index Mechanism and Structure Information for Efficient Retrieval of XML DTD)

  • 김영란
    • 한국컴퓨터정보학회논문지
    • /
    • 제8권3호
    • /
    • pp.80-86
    • /
    • 2003
  • XML은 웹 상에서 정보를 전달하고 저장하는데 있어 가장 주목을 받고 있는 언어이다. XML로 표현된 정보는 의미가 부여됨으로서 보다 정확하고 빠른 검색을 제공한다. 반면에, XML 문서는 논리적으로는 유사하지만 구조적 측면에서 서로 다른 표현방식으로 작성됨으로 인해, 이 기종 시스템 및 장치를 갖는 문서처리 환경에서 문서를 교환하고 공유하는데 어려움이 있다. 이 논문에서는 객체 지향 클래스 다이어그램을 XML DTD로 변환하고, 동일 주제에 대해 서로 다른 구조로 작성된 XML DTD 문서를 효율적으로 관리하기 위한 구조 정보 표현과 인덱스 메카니즘을 설계하였다. 제안된 방법을 이용함으로써 특정 엘리먼트에 대한 효율적이고 빠른 검색을 지원할 수 있으며, 간단한 연산으로 엘리먼트에 접근을 용이하게 할 수 있는 효과가 기대된다.

  • PDF

연구.학술정보 효율적 검색을 위한 온톨로지 기반의 주제 색인어 구조화 방안 연구 (A Study on Ontology-based Keywords Structuring for Efficient Information Retrieval)

  • 송인석
    • 정보관리연구
    • /
    • 제39권4호
    • /
    • pp.121-154
    • /
    • 2008
  • 본 연구에서는 정보검색도구 관점에서 지식조직체계로서 기존 시소러스 구축방안의 특성과 한계점을 검토하고, 대상 정보의 지식구조의 반영 및 정보 간의 의미관계 추론을 지원하는 온톨로지 기반의 주제 색인어 구조화 방안을 제시한다. 기존의 용어 중심의 시소러스와 달리, 단계별 연구프로세스 과정에서 수행되는 연구자의 정보행위 및 수요 분석에 때라 주제색인어의 개념을 식별 범주화하고, 인문사회과학 분야 학술논문의 지식체계를 구성하는 그 개념들 간의 유기적 관계정의를 통해 주제 색인어 집합의 의미구조를 정형화하였다. 이를 기반으로 각각의 온톨로지 기반 주제 색인어 집합은 구조화된 의미 색인으로서 대상 문서의 지식체계를 표현한다. 정보수요에 따라 정의된 공리나 추론규칙을 활용하여 이용자는 문제 해결에 적합한 정보를 대상 정보의 의미관계로 구성된 주제 도메인의 학술커뮤니케이션 네트워크상에서 분석적 정보탐색을 통해 효율적으로 검색 할 수 있다.

디지털도서관 문서양식으로서의 XML과 HTML의 특성 및 검색 기능 비교 연구 (A Comparative Study of XML and HTML: Focusing on Their Characteristics and Retrieval Functions)

  • 김현희;장혜원
    • 정보관리학회지
    • /
    • 제16권2호
    • /
    • pp.105-134
    • /
    • 1999
  • 본 연구에서는 XML과 HTML의 이론적인 특성을 포괄적으로 비교하고 이러한 특성들이 실험 시스템에서 어떻게 적용되고 있는지를 검색기능, 검색 환경 및 이용자 만족도 측면에서 비교 분석하며, XML이 정보 검색에서 기존의 HTML 보다 더 유용한 것인지를 살펴보았다. 비교결과, XML은 복합 내용 및 구조검색이 가능한 점, 관련 자료들을 다중 링크를 사용해 접속할 수 있다는 점 그리고 데이터베이스로 구축할 경우 XML 문서는 태그를 이용해 자동적으로 변환할 수 있다는 등이 HTML 보다 더 우수한 것으로 나타났다. XML이 보다 활성화되기 위해서는 XML 문법을 완벽하게 지원하는 XML 관련 소프트웨어가 많이 개발되어져야 한다. 또한, XML이 주는 무제한적인 태그 작성의 자유가 자칫 동일한 문헌 형태를 너무 다양한 양식들로 표현하다 보면 혼란을 빚을 가능성도 매우 높아지고 있다. 따라서, 특정 문헌 형태에 대한 표준적인 DTD 설계가 절실히 요구되어진다.

  • PDF

관계형 모델에서 XML 변경과 전문 검색을 지원하기 위한 역 인덱스 구축 기법 (Inverted Indexes for XML Updates and Full-Text Retrievals in Relational Model)

  • 천윤우;홍동권
    • 정보처리학회논문지D
    • /
    • 제11D권3호
    • /
    • pp.509-518
    • /
    • 2004
  • 최근 산업체를 중심으로 XML 전문 검색과 XML 문서의 변성 기능에 대한 표준의 시도가 활발히 이루어지고 있다. XML 질의어에서의 전문 검색 기능은 매우 중요한 부분을 차지한다. XML 문서는 관계형 테이블과는 달리 문서의 구조가 복잡하며 때로는 매우 불규칙하다. 이런 상황에서의 검색은 부분적인 정보를 최대한 활용해야 하는 전문 검색이 일반적인 구조적 검색보다 매우 중요한 역할을 한다. 본 논문은 XML 데이터를 관리하기 위하여 관계형 모델을 사용하는 환경에서 XML 문서의 변경과 다양한 형태의 전문 검색을 동시에 지원하기 위한 방안으로 효율적인 역 인덱스 구축 기법을 제안한다. 본 논문에서 제안한 방법은 인덱스 크기의 큰 변화 없이 역 인덱스를 구축하며, 대용량의 XML 문서의 다양한 전문 검색 기능을 성능의 저하 없이 지원한다. 또 XML 문서의 부분적인 변화에 역 인덱스의 변경이 기존의 방법들에 비해서 급격히 줄어든 좋은 성능을 보인다.

Jointly Image Topic and Emotion Detection using Multi-Modal Hierarchical Latent Dirichlet Allocation

  • Ding, Wanying;Zhu, Junhuan;Guo, Lifan;Hu, Xiaohua;Luo, Jiebo;Wang, Haohong
    • Journal of Multimedia Information System
    • /
    • 제1권1호
    • /
    • pp.55-67
    • /
    • 2014
  • Image topic and emotion analysis is an important component of online image retrieval, which nowadays has become very popular in the widely growing social media community. However, due to the gaps between images and texts, there is very limited work in literature to detect one image's Topics and Emotions in a unified framework, although topics and emotions are two levels of semantics that often work together to comprehensively describe one image. In this work, a unified model, Joint Topic/Emotion Multi-Modal Hierarchical Latent Dirichlet Allocation (JTE-MMHLDA) model, which extends previous LDA, mmLDA, and JST model to capture topic and emotion information at the same time from heterogeneous data, is proposed. Specifically, a two level graphical structured model is built to realize sharing topics and emotions among the whole document collection. The experimental results on a Flickr dataset indicate that the proposed model efficiently discovers images' topics and emotions, and significantly outperform the text-only system by 4.4%, vision-only system by 18.1% in topic detection, and outperforms the text-only system by 7.1%, vision-only system by 39.7% in emotion detection.

  • PDF

역방향 레이블 경로를 이용한 XML 문서의 선형 경로 질의 처리 (Linear Path Query Processing using Backward Label Path on XML Documents)

  • 박충희;구흥서;이상준
    • 한국지능시스템학회논문지
    • /
    • 제17권6호
    • /
    • pp.766-772
    • /
    • 2007
  • XML의 광범위한 사용으로 XML 저장과 질의 처리에 관한 많은 연구가 이루어지고 있다. 하지만 기존의 경로 질의 처리에 대한 연구들은 한 개의 대규모 XML 문서나 동일한 구조를 가진 문서들에 대한 저장, 검색에 초점이 맞춰져 있어서 상이한 구조를 가진 대규모 문서들에 대해서 부분 매치 질의(partial match query)를 효과적으로 지원하지 못하는 단점이 있었다. 본 논문에서는 상이한 구조를 가지는 대규모 문서들에 대해서도 부분 매치 질의를 효과적으로 지원할 수 있는 관계형 테이블을 이용한 새로운 인덱스 구조를 제안하였다. 본 방법은 경로 정보를 저장할 때 기존의 연구에서 사용된 순방향 레이블 경로 대신 역방향 레이블 경로를 사용하여 $B^+$-트리 인덱스를 구축함으로써 부분 매치 질의 처리시 구축된 인덱스를 이용하여 질의에 해당되는 레이블 경로들을 효율적으로 찾을 수 있도록 하였다.

지식베이스 구축을 위한 한국어 위키피디아의 학습 기반 지식추출 방법론 및 플랫폼 연구 (Knowledge Extraction Methodology and Framework from Wikipedia Articles for Construction of Knowledge-Base)

  • 김재헌;이명진
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.43-61
    • /
    • 2019
  • 최근 4차 산업혁명과 함께 인공지능 기술에 대한 연구가 활발히 진행되고 있으며, 이전의 그 어느 때보다도 기술의 발전이 빠르게 진행되고 있는 추세이다. 이러한 인공지능 환경에서 양질의 지식베이스는 인공지능 기술의 향상 및 사용자 경험을 높이기 위한 기반 기술로써 중요한 역할을 하고 있다. 특히 최근에는 인공지능 스피커를 통한 질의응답과 같은 서비스의 기반 지식으로 활용되고 있다. 하지만 지식베이스를 구축하는 것은 사람의 많은 노력을 요하며, 이로 인해 지식을 구축하는데 많은 시간과 비용이 소모된다. 이러한 문제를 해결하기 위해 본 연구에서는 기계학습을 이용하여 지식베이스의 구조에 따라 학습을 수행하고, 이를 통해 자연어 문서로부터 지식을 추출하여 지식화하는 방법에 대해 제안하고자 한다. 이러한 방법의 적절성을 보이기 위해 DBpedia 온톨로지의 구조를 기반으로 학습을 수행하여 지식을 구축할 것이다. 즉, DBpedia의 온톨로지 구조에 따라 위키피디아 문서에 기술되어 있는 인포박스를 이용하여 학습을 수행하고 이를 바탕으로 자연어 텍스트로부터 지식을 추출하여 온톨로지화하기 위한 방법론을 제안하고자 한다. 학습을 바탕으로 지식을 추출하기 위한 과정은 문서 분류, 적합 문장 분류, 그리고 지식 추출 및 지식베이스 변환의 과정으로 이루어진다. 이와 같은 방법론에 따라 실제 지식 추출을 위한 플랫폼을 구축하였으며, 실험을 통해 본 연구에서 제안하고자 하는 방법론이 지식을 확장하는데 있어 유용하게 활용될 수 있음을 증명하였다. 이러한 방법을 통해 구축된 지식은 향후 지식베이스를 기반으로 한 인공지능을 위해 활용될 수 있을 것으로 판단된다.