• Title/Summary/Keyword: Indexing method

Search Result 532, Processing Time 0.033 seconds

SGML 한글문서의 논리적 구조에 근거한 색인기법에 관한 연구 (A Study of Automatic Indexing Technique based on Logical Structure of SGML Hangul Document)

  • 유석종
    • 정보관리학회지
    • /
    • 제12권2호
    • /
    • pp.85-101
    • /
    • 1995
  • 기존 색인 시스템은 전자문서에 대하여 전문색인 (full-text indexing) 방법만을 지원하며, 문서의 논리적 구조를 검색 방법으로 적절하게 활용하지 못하고 있다. 대부분의 전자문서는 특정 시스템에 의존적인 형식으로 되어 있으며, 문서의 물리적 형태만을 나타내고 논리적 구조에 대한 정보는 포함하고 있지 않다. 이에 반해 1986년에 ISO에서 문서교환에 대한 표준방식으로 제정한 SGML (Standard Generalized Markup Language)은 문서의 논리적 구조에 대한 정보를 포함하고 있다. 본 논문에서는 기존의 전문색인 시스템의 단점을 보완하고 표준문서형식을 사용하기 위해 SGML 문서에서의 색인 시스템을 설계 구현하고자 한다. 기존 색인 시스템에서는 문서 전체에 대하여 색인이 이루어지는데 비하여 본 시스템에서는 SGML 문서의 구성요소인 엘리먼트에 기반하여 색인 영역을 지정할 수 있게 하엿다. 따라서 문서의 논리적 구조를 반영한 다양한 검색기법에 응용될 수 있다. 또한 본 시스템에서는 SGML 한글문서에 대하여 자동색인이 가능하다.

  • PDF

MPEG-7 표준에 따른 내용기반 비디오 검색 시스템 (Content-based Video Indexing and Retrieval System using MPEG-7 Standard)

  • 김형준;김회율
    • 방송공학회논문지
    • /
    • 제9권2호
    • /
    • pp.151-163
    • /
    • 2004
  • 본 논문에서는 비디오의 효율적인 검색과 관리를 위해 MPEG-7 표준에 따른 내용기반 비디오 검색 시스템을 제안한다. 제안된 시스템은 비디오 DB 구축을 위한 인덱싱 모듈과 웹을 통한 비디오 검색 모듈로 구성되며 검색 모듈에서는 다양한 질의 방법을 지원한다. 비디오 인덱싱 모듈은 관리자가 입력한 키워드, 인덱싱 모듈이 자동으로 추출한 등장 인물 정보와 MPEG-7 비주얼 서술자와 같은 메타데이터를 서버에 저장한다. 일반 사용자는 웹을 통해 검색 모듈에 접근하며 키워드, 얼굴 예제 및 스케치 질의와 같은 다양한 질의 방법을 통해 원하는 비디오를 검색할 수 있다. 이러한 비디오 검색 시스템을 구성하기 위해서 본 논문에서는 효율적인 비디오 인덱싱을 위한 장면 전환 검출 방법으로 ATC(Adaptive Twin Comparison)와 사용자 편의성을 위한 개선된 내용기반 질의 방법으로 QBME(Query By Modified Example)를 제안한다. 실험에서 제안된 장면 전환 검출 방법이 기존의 방법보다 우수함을 보였고, 제안된 질의 방법을 통해 기존의 질의 방법인 QBE(Query By Example)나 QBS(Query By Sketch) 보다 사용자에게 검색의 편의성을 제공할 수 있음을 보였다.

효과적인 이미지 브라우징을 위한 M-트리 기반의 인덱싱 방법 (M-tree based Indexing Method for Effective Image Browsing)

  • 유정수;낭종호
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권4호
    • /
    • pp.442-446
    • /
    • 2010
  • 본 논문에서는 대량의 사진 데이터베이스에 대한 효과적인 사진 검색을 위하여 브라우징을 지원하는 인덱싱 방법을 제안하였다. 제안한 방법은 대표적인 거리 공간 인덱싱 방법인 M-트리를 기본 구조로 하였다. 그러나 M-트리는 pruning을 통한 검색의 효율성에 초점을 맞추었으며 브라우징을 직접적으로 고려하지 않는다. 따라서 본 논문에서는 M-트리의 노드 선택 방법, 노드 분할 방법 및 노드 분할 조건을 브라우징에도 적합하도록 변경하였다. 제안한 방법을 적용하여 실험한 결과 노드 응집도와 클러스터링 정확도에서 각각 2배와 1.5배의 향상을 나타내었으며, 검색 성능도 약 2배정도 빨라지는 효과를 확인하였다.

효과적인 도로 상황 인지를 위한 도로 객체 그래프 모델링 방법 (Road Object Graph Modeling Method for Efficient Road Situation Recognition)

  • ;정성모;송석일
    • Journal of Platform Technology
    • /
    • 제9권4호
    • /
    • pp.3-9
    • /
    • 2021
  • 이 논문에서는 차량 또는 도로 인프라 센서에 의해 검출된 도로상의 각 객체들 간의 상황인지를 효과적으로 하기 위해서 그래프 데이터 모델을 도입한다. 제안하는 방법은 도로상의 각 객체들을 그래프의 정점(Vertex)로, 객체들 간의 관계를 그래프의 간선(Edge)로 모델링하여 그래프 데이터베이스를 구축하고, 객체의 속성과 간선의 속성을 실시간으로 업데이트한다. 이때 간선으로 표현되는 객체들 간의 관계는 각 객체의 위치, 이동방향, 이동속도 등을 고려하여 객체들 간에 근접 가능성이 있을 경우 설정한다. 또한, 제안하는 그래프 모델링 방법을 통해 표현한 도로 객체 그래프 데이터베이스를 실시간으로 업데이트하기 위해 그래프 정점과 간선에 대한 공간 색인 기법을 제안한다. 제안하는 색인기법 기반의 그래프 데이터베이스 업데이트 성능을 평가하기 위해서 색인 없이 업데이트하는 방법과 비교하였으며 비교결과 제안하는 방법이 10배 더 빠르게 업데이트를 할 수 있음을 확인하였다.

주제분석기법으로서의 자동색인 (Automatic indexing as a subject analysis technique)

  • 이영자
    • 한국도서관정보학회지
    • /
    • 제12권
    • /
    • pp.61-96
    • /
    • 1985
  • The human subject analysis of a document has some critical problems. The method results in the inconsistency in analysis process and the contradiction of two objects of the subject analysis (one is the identification of the content for the retrieval of specific items and the other is to identify the content for the grouping of related materials). Since the subject analysis by mechanized has been recognized to be the possible way to aggregate the problems of manual analysis, various a n.0, pproaches of automatic indexing have been studied and experimented. This study is to examine the automatic indexing as one of the promising subject analysis techniques by statistical, syntactical and semantic a n.0, pproaches. In conclusion, the reasonable a n.0, pplication time of the automatic indexing should be made a decision based on the through investigation on the cost verse effectiveness, and automatic indexing system should be developed in the close relationship with the on-line search which is a good retrieval system for information explosion society. From now on, since the machine-readable document-text will be envisaged to be more and more available due to the rapid development of computer technology, the more substantial research on the automatic indexing will be also possible, which can bring about the increasing of practical automatic indexing systems.

  • PDF

고차원 벡터 데이터 색인을 위한 시그니쳐-기반 Hybrid Spill-Tree의 설계 및 성능평가 (Design and Performance Analysis of Signature-Based Hybrid Spill-Tree for Indexing High Dimensional Vector Data)

  • 이현조;홍승태;나소라;장유진;장재우;심춘보
    • 인터넷정보학회논문지
    • /
    • 제10권6호
    • /
    • pp.173-189
    • /
    • 2009
  • 최근 UCC를 중심으로 동영상 데이터에 대해 사람들의 관심이 증가하고 있다. 따라서 동영상 데이터의 내용-기반 검색을 지원하는 효율적인 색인 기법이 요구된다. 그러나 Hybrid Spill-Tree를 제외한 대부분의 색인 기법들은 대용량의 고차원 데이터를 다루는데 비효율적이다. 본 논문에서는 동영상 데이터의 내용-기반 검색을 지원하기 위한 효율적인 고차원 색인 기법을 제안한다. 제안하는 고차원 색인 기법은 기존 Hybrid Spill-Tree을 기반으로 새롭게 제안하는 클러스터링 방법과 시그니쳐를 이용한 데이터 저장 방법을 결합하여 확장된 색인 기법이다. 또한 제안하는 시그니쳐-기반 고차원 색인 기법이 기존 M-Tree 및 Hybrid Spill-Tree에 비해 성능이 우수함을 보인다.

  • PDF

A One-Size-Fits-All Indexing Method Does Not Exist: Automatic Selection Based on Meta-Learning

  • Jimeno-Yepes, Antonio;Mork, James G.;Demner-Fushman, Dina;Aronson, Alan R.
    • Journal of Computing Science and Engineering
    • /
    • 제6권2호
    • /
    • pp.151-160
    • /
    • 2012
  • We present a methodology that automatically selects indexing algorithms for each heading in Medical Subject Headings (MeSH), National Library of Medicine's vocabulary for indexing MEDLINE. While manually comparing indexing methods is manageable with a limited number of MeSH headings, a large number of them make automation of this selection desirable. Results show that this process can be automated, based on previously indexed MEDLINE citations. We find that AdaBoostM1 is better suited to index a group of MeSH hedings named Check Tags, and helps improve the micro F-measure from 0.5385 to 0.7157, and the macro F-measure from 0.4123 to 0.5387 (both p < 0.01).

이동객체의 현재 위치정보 관리를 위한 셀 기반 색인 기법 (A Cell-based Indexing for Managing Current Location Information of Moving Objects)

  • 이응재;이양구;류근호
    • 정보처리학회논문지D
    • /
    • 제11D권6호
    • /
    • pp.1221-1230
    • /
    • 2004
  • 모바일 환경에서 정보 제공 및 처리의 대상이 되는 사람, 자동차, 비행기 둥과 같은 이동객체는 시간이 경과함에 따라 끊임없이 자신의 위치를 변경하는 특징을 가지며, 이러한 정보들을 데이터베이스에서 효과적으로 처리하기 위해서는 연속적인 위치 변경을 수용할 수 있는 저장공간과 색인 유지 및 관리 기술이 필요하다. 기존의 색인 기법들은 색인의 유지 성능보다 질의 처리 능력을 향상시키는데 노력을 기울여 왔기 때문에 복잡하게 이동하며 매우 빈번하게 위치 정보를 갱신하는 이동객체 정보를 관리하기 어렵다. 이 논문에서는 질의 처리 성능뿐만 아니라 이동객체의 빈번한 위치 갱신을 효율적으로 처리하기 위해 고정 그리드 방식의 색인과 R-Tree의 장점을 결합한 ACAR-Tree(Adaptive Cell index with Auxiliary R-Tree)를 제안한다. 제안된 ACAR-Tree는 R-Tree에서 색인의 재구성으로 인하여 갱신 성능이 저하되는 단점을 보완하기 위하여 고정 그리드 방법의 셀 기반의 색인 방법을 기초로 한다. 또한 고정 그리드 방법에서의 데이터 분포가 편중되었을 경우의 색인 성능저하 문제를 해결하기 위하여, 셀과 버켓이 1 : 1로 매핑되는 셀에서 오버플로가 발생하였을 경우 해당 버켓이 부가적인 색인 구조인 보조R-Tree로 전환하여 처리한다. 제안된 방법을 다양한 데이터 분포 및 데이터 크기에서 실험한 결과, 기존의 R-Tree 기반의 색인 방법과 비교하여 색인의 크기가 크게 감소하였으며, 질의 및 갱신 성능에 대해서도 뛰어난 성능을 보였다.

NC 공정기계에서 온더머신 오차측정 및 보상 (On the machine error measurement and compensation)

  • 신동수;정성종
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 1992년도 한국자동제어학술회의논문집(국내학술편); KOEX, Seoul; 19-21 Oct. 1992
    • /
    • pp.1096-1101
    • /
    • 1992
  • In order tominimize fixing error of workpieces, circle, prismatic, sphere, cylindrical and sculptures types. Modification Rule by Indexing Table and Modification Rule by NC Program are developed for machining centers by using touch trigger probes. The Modification Rule by Indexing Table meas the alignment of workpiece to NC program through degree of freedoms of indexing table. The Modification Rule by NC Program is the alognment of NC program to workpiece ste-tp condition via the generation of NC progarm. A postprocessing module is alos developed for generating NC-part program(User Macro) to compensate for machining errors in end milling and boring processes. Developed method are verified by experiments.

  • PDF

XML 문서의 다양한 구조 검색을 위한 효율적인 동적 색인 모델 (An Efficient Dynamic Indexing Model for Various Structure Retrievals of XML Documents)

  • 신승호;손충범;강형일;유재수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권1호
    • /
    • pp.48-60
    • /
    • 2004
  • 정보 표현의 기본 단위인 엘리먼트로 구성되는 XML 문서 내에서 동적으로 구조 변경이 이루어진다. 이때 XML 문서의 구조변경은 빠른 검색을 위해 기존의 색인 구조 정보의 변경 없이 효율적으로 처리되어야 한다. 이를 위해 본 논문에서는 XML 문서의 구조 변경 시 기존의 색인 구조에 효율적으로 수용될 수 있는 동적 색인 모델을 제안한다. 제안하는 동적 색인 모델은 다양한 구조 검색을 지원하기 위한 구조 정보 표현 방법과 효율적인 구조 검색을 지원하기 위한 동적 색인 구조로 구성된다. 제안하는 색인 기법이 기존의 동적 색인을 지원하는 기법보다 내용 색인, 구조 색인, 애트리뷰트 색인 측면에서 우수함을 성능 평가를 통해 보인다.