• 제목/요약/키워드: Retrieval Efficiency

검색결과 324건 처리시간 0.022초

웹기반 정보검색을 위한 자연어 키워드 색인에 관한 연구 (A Study on Natural Language Keyword Indexing for Web-based Information Retrieval)

  • 윤성희
    • 한국컴퓨터산업학회논문지
    • /
    • 제4권12호
    • /
    • pp.1103-1111
    • /
    • 2003
  • 정보검색의 방법으로 단일 주제어를 키워드로 색인하여 검색하는 방식이 널리 사용되어 왔으나 문서의 내용을 정확히 표현하기 어렵고 검색 결과의 문서 집합 또한 너무 커서 사용자의 만족도가 낮다. 본 논문에서는 자연언어 처리 기술인 구문 분석 모듈을 도입해 단어 이상의 단위인 구 단위를 색인과 검색의 단위로 삼는 구 단위 색인 및 검색 기법을 사용을 제안한다. 웹 문서들 자체가 갖는 다양한 오류들로 인해 현실적으로 충분히 만족할 만할 우수한 성능의 구문 분석 모듈이 구현되기는 어려우므로 상향식 구문 분석 모듈을 구현하여 완전한 구문 분석 결과를 얻지 못하는 많은 문장에 대해서도 구 단위 색인이 가능하며 단일어 색인보다 식별력이 뛰어나 검색 성능이 향상되고 검색 과정의 부하도 줄일수 있다.

  • PDF

모멘트 특성을 이용한 다중 객체 이미지 검색 시스템 구현 (Implementation of System Retrieving Multi-Object Image Using Property of Moments)

  • 안광일;안재형
    • 한국멀티미디어학회논문지
    • /
    • 제3권5호
    • /
    • pp.454-460
    • /
    • 2000
  • 영상과 같은 다양하고 복잡한 데이터 검색은 기존의 키워드를 이용한 검색이 아닌 내용 기반 검색 방법이 요구된다. 본 논문에서는 물체의 위치 이동이나 회전, 크기 변화 등과 같은 각종 변환에 민감하지 않은 불변모멘트(invariant moments)값의 특성을 이용하여 사용자 질의로서 입력된 객체를 효율적으로 검색할 수 있는 시스템을 구현하였다. 영상내의 단일 객체뿐만 아니라 다중 객체들도 효과적으로 검출하기 위해 레이블링(labeling) 알고리즘을 적용해 각각의 객체를 따로 분리하여 불변모멘트를 적용하는 방법을 이용했다. 또한, 검색 시간 단축 및 영상의 효율적인 인덱싱(indexing)을 위해 해싱을 응용한 기법을 적용하였다. 실험결과, precision 85%, recall 23%의 높은 검색효율을 보였고 기존의 전체 영상의 특징을 가지고는 정확히 표현할 수 없는 객체들의 모양을 정확히 표현해 줌으로써 보다 정화한 검색 결과를 얻을 수 있었다.

  • PDF

상황 인식 환경에서 온톨로지를 이용한 프로액티브 검색 기법 (Proactive Retrieval Method using Ontology in Context-aware Environment)

  • 김성림;권준희
    • 전자공학회논문지CI
    • /
    • 제44권3호
    • /
    • pp.8-13
    • /
    • 2007
  • 상황 인식 환경에서는 물리적인 환경, 상황 등을 시스템이 인식하고 이를 기반으로 사용자와의 상호작용을 지원하는 상황 인식 기술이 중요한 요소로 자리잡고 있다. 온톨로지 기반의 상황 정보 모델은 상황정보의 공유와 재사용의 이점을 제공하기 때문에 최근 널리 사용되고 있다. 본 논문에서는 상황 인식 환경에서 온톨로지를 이용한 새로운 프로액티브 검색 기법을 제안한다. 제안된 기법은 온톨로지의 계층적 개념 트리를 이용하여 사용자의 상황에 맞는 정보의 개념 수준을 결정함으로써 보다 효율적인 검색이 가능하다. 이를 위해 제안된 기법을 설명하고, 실험을 통해 기존 기법보다 제안 기법이 우수함을 보인다.

모양기반 식물 잎 이미지 검색을 위한 표현 및 매칭 기법 (A Representation and Matching Method for Shape-based Leaf Image Retrieval)

  • 남윤영;황인준
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권11호
    • /
    • pp.1013-1020
    • /
    • 2005
  • 본 논문은 모양 특성을 이용한 효과적인 식물 잎 이미지 검색 시스템을 제시한다. 잎 이미지의 더 효과적인 표현을 위해 개선된 MPP 알고리즘을 제안하고, 매칭에 소요되는 시간을 줄이기 위해 기존의 Nearest Neighbor(NN) 검색을 수정한 동적인 매칭 알고리즘을 제시한다. 특히, 더 나은 정확율과 효율성을 위해, 잎 모양과 잎차례를 스케치하여 질의할 수 있도록 하였다. 실험에서는 제안한 알고리즘과 기존의 알고리즘인 CCD(Centroid Contour Distance), Fourier Descriptor. Curvature Scale Space Descriptor (CSSD), Moment Invariants, MPP와 비교하였다. 1000여개의 식물 잎 이미지를 통한 실험결과는 제안한 방법이 기존의 기법보다 더 좋은 성능임을 보였다.

Case-Based Reasoning Cost Estimation Model Using Two-Step Retrieval Method

  • Lee, Hyun-Soo;Seong, Ki-Hoon;Park, Moon-Seo;Ji, Sae-Hyun;Kim, Soo-Young
    • 토지주택연구
    • /
    • 제1권1호
    • /
    • pp.1-7
    • /
    • 2010
  • Case-based reasoning (CBR) method can make estimators understand the estimation process more clearly. Thus, CBR is widely used as a methodology for cost estimation. In CBR, the quality of case retrieval affects the relevance of retrieved cases and hence the overall quality of the reminding capability of CBR system. Thus, it is essential to retrieve relevant past cases for establishing a robust CBR system. Case retrieval needs the following tasks to obtain appropriate case(s); indexing, search, and matching (Aamodt and Plaza 1994). However, the previous CBR researches mostly deal with matching process that has limits such as accuracy and efficiency of case retrieval. In order to address this issue, this research presents a CBR cost model for building projects that has two-step retrieval process: decision tree and nearest neighbor methods. Specifically, the proposed cost model has indexing, search and matching modules. Features in the model are divided into shape-based and scale-based attributes. Based on these, decision tree is established for facilitating the search task and nearest neighbor method was utilized for matching task. In regard to applying nearest neighbor method, attribute weights are assigned using GA optimization and similarity is calculated using the principle of distance measuring. Thereafter, the proposed CBR cost model is developed using 174 cases and validated using 12 test cases.

Efficient Query Retrieval from Social Data in Neo4j using LIndex

  • Mathew, Anita Brigit
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권5호
    • /
    • pp.2211-2232
    • /
    • 2018
  • The unstructured and semi-structured big data in social network poses new challenges in query retrieval. This requirement needs to be met by introducing quality retrieval time measures like indexing. Due to the huge volume of data storage, there originate the need for efficient index algorithms to promote query processing. However, conventional algorithms fail to index the huge amount of frequently obtained information in real time and fall short of providing scalable indexing service. In this paper, a new LIndex algorithm, which is a heuristic on Lucene is built on Neo4jHA architecture that holds the social network Big data. LIndex is a flexible and simplified adaptive indexing scheme that ascendancy decomposed shortest paths around term neighbors as basic indexing unit. This newfangled index proves to be effectual in query space pruning of graph database Neo4j, scalable in index construction and deployment. A graph query is processed and optimized beyond the traditional Lucene in a time-based manner to a more efficient path method in LIndex. This advanced algorithm significantly reduces query fetch without compromising the quality of results in time. The experiments are conducted to confirm the efficiency of the proposed query retrieval in Neo4j graph NoSQL database.

이중 셔틀 자동창고 시스템의 주행시간 모델에 관한 연구 (A Study on Travel Time Model of double shuttle AS/RS)

  • Chae-Soo Kim;Seong-Whan Shinn
    • 대한안전경영과학회지
    • /
    • 제3권3호
    • /
    • pp.97-106
    • /
    • 2001
  • This paper considers automated storage and retrieval systems with double shuttle. We developed the expected travel time model based on the first come first served rule. An heuristic procedure by retrieval order sequencing was presented which aimed to improve the operation efficiency laking advantage of "No cost zone". Through sensitivity study, we evaluated the performance of the double shuttle system working on the four command cycle.

  • PDF

비디오 데이터에서 움직임 경로의 효율적인 검색을 위한 시그니쳐-기반 접근 기법 (A Signature-based Access Method for Efficient Retrieval on Moving Objects′Trajectories in Video Data)

  • 심춘보;장재우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.253-255
    • /
    • 2001
  • 본 논문에서는 비디오 데이터가 지니는 움직임 객체의 움직임 경로(Moving Objects'Trajectories)를 이용한 사용자 질의에 대해 효율적인 검색을 위만 새로운 시그니쳐 기반 접근 기법을 제안한다. 제안하는 시그니쳐 기반 접근 기법은 데이터 파일을 직접 접근하기 전에 전체 시그니쳐들을 탐색하여 필터링을 수행하기 때문에, 순차 탐색에 대해 디스크 접근 횟수를 감소시켜 검색 성능을 향상시킨다. 마지막으로 성능 평가를 통해 제안하는 방법이 삽입 시간, 검색 시간, 그리고 부가 저장 공간의 검색 효율(Retrieval Efficiency) 측면에서 성능이 우수함을 보인다.

  • PDF

이동 객체의 유사 부분궤적 검색을 위한 시그니쳐-기반 색인 기법 (Signature-based Indexing Scheme for Similar Sub-Trajectory Retrieval of Moving Objects)

  • 심춘보;장재우
    • 정보처리학회논문지D
    • /
    • 제11D권2호
    • /
    • pp.247-258
    • /
    • 2004
  • 최근 비디오 데이타베이스, 시공간 데이타베이스, 모바일 데이타베이스와 같은 데이타베이스 응용 분야에서 이동 객체를 기반으로 하는 검색 기법에 관한 연구가 활발히 이루어지고 있다. 본 논문에서는 이동 객체의 궤적에 대한 효율적인 유사 부분궤적 검색을 지원하는 새로운 시그니쳐-기반 색인 기법을 제안한다. 제안하는 시그니쳐-기반 색인 기법은 궤적 데이타를 토대로 궤적 시그니쳐를 생성하는 방법에 따라 중첩 시그니쳐-기반 색인 기법(Superimposed signature-based Indexing scheme for similar Sub-trajectory Retrieval : SISR)과 합성 시그니쳐-기반색인 기법(Concatenated signature-based Indexing scheme for similar Sub-trajectory Retrieval : CISR)으로 나뉜다. 생성된 궤적 시그니쳐 정보는 시그니쳐 파일에 저장되고, 검색시 주어진 사용자 질의 궤적 정보를 기반으로 데이타 파일을 직접 접근하기 전에 전체 궤적 시그니쳐들을 탐색하여 필터링을 수행한다. 이를 통해 데이타 파일의 검색 범위를 현저히 줄임으로써 검색 성능을 향상시킨다. 또한 검색된 궤적 데이터와의 유사성을 측정하기 위해 k-워핑 알고리즘을 적용시켜 검색의 효율성을 높인다. 마지막으로, 순차 색인 기법, SISR기법, 그리고 CISR 기법을 삽입시간, 검색 시간 그리고 부가 저장 공간측면에서 성능 평가를 수행한다. 성능 평가 결과, 제안하는 두 가지 기법이 검색 성능 측면에서 순차 색인 기법에 비해 성능이 우수함을 나타내고, 아울러 SISR 기법이 CISR 기법에 비해 보다 우수한 성능을 보인다.

자동창고 시스템의 최적안 도출을 위한 모의실험적 연구 (A Simulation Study for Optimizing the Functionality of an Automated Storage and Retrieval System)

  • 김문기
    • 한국생산제조학회지
    • /
    • 제23권5호
    • /
    • pp.505-511
    • /
    • 2014
  • The functional role of warehouses in modern industry is changing from an established concept of storage to a concept of circulation. The target of this study is to improve the stacker crane's efficiency for the internal operations of the Automated Storage and Retrieval System (AS/RS). Eight operating schemes are proposed under the combination of three conditions, namely, the storing method, the layout type, and the sequence of command execution. The moving distance of the stacker crane is calculated using the same gateway data through a simulation based on a C# program. The optimal operating scheme is proposed based on the analyzed simulation results. In conclusion, the combination of conditions of random storage, two-way type warehouse, and dual command execution elicits optimum results in travel efficiency for the stacker crane.