• 제목/요약/키워드: Search Query

검색결과 688건 처리시간 0.029초

연관 규칙 탐사 기법을 이용한 해양 전문 검색 엔진에서의 질의어 처리에 관한 연구 (Research on User's Query Processing in Search Engine for Ocean using the Association Rules)

  • 하창승;윤병수;류길수
    • 한국컴퓨터정보학회논문지
    • /
    • 제8권2호
    • /
    • pp.8-15
    • /
    • 2003
  • 최근 여러 가지 정보들이 WWW를 경유하여 제공되고 있기 때문에 검색엔진의 필요성은 점점 커지고 있다. 그러나 대부분의 검색엔진은 정보의 추출을 위해 웹 문서와 사용자 질의를 단순 패턴비교 방법을 사용함으로써 검색엔진의 효율은 비교적 낮은 편이다. 일반적으로 사용자의 검색 목적에 따라 다른 검색 엔진이 사용되기 때문에 여러 전문검색엔진을 개발하고 있지만 대부분의 검색엔진들이 사용자의 요구를 제대로 반영하고 있지 못하다. 본 연구에서는 웹 데이터마이닝의 연관규칙을 이용하여 사용자 질의를 처리하는 해양전문검색엔진을 제안한다. 데이터 마이닝 분야에서 주로 연구되어온 연관규칙탐사 기법은 지지도와 신뢰도에 따라 연관자료의 확신도를 측정할 수 있기 때문에 웹 문서 사이의 관련성을 입증하는데 이 규칙을 적용하여 기존의 검색 방법에서 자료의 재현률과 정확률을 개선하였다.

  • PDF

최적탐색거리를 이용한 최소근접질의 처리 방법의 성능 평가 (The Performance Evaluation of Method to Process Nearest neighbor Queries Using an Optimal Search Distance)

  • 선휘준;김홍기
    • 한국정보처리학회논문지
    • /
    • 제6권1호
    • /
    • pp.32-41
    • /
    • 1999
  • 공간 데이터베이스 시스템에서 최소 근접질의는 매우 빈번히 발생하며, 다른 유형의 공간질의에 비하여 처리비용이 많이 요구된다. 최소근접질의의 처리비용을 최적화하기 위해서는 색인에서 검색되는 노드의수를 최소화할 수 있어야 한다. 이를 위해 최소근접질의 처리시 색인에서 방문될 노드들을 정확히 선정하기 위한 검색거리 측도인 최적탐색거리가 제안되었다[13]. 본 논문에서는 최적탐색거리의 특성을 N차원으로 확장하고 최대검색거리를 이용한 방법에 비해 최적탐색거리를 이용한 방법이 질의처리 성능이 더 우수함을 실험을 통하여 입증한다.

  • PDF

관계형 데이터베이스에서의 시맨틱 기반 키워드 탐색 시스템 (Semantic-based Keyword Search System over Relational Database)

  • 양영휴
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권12호
    • /
    • pp.91-101
    • /
    • 2013
  • 키워드의 모호성은 효율적인 키워드 탐색에 있어서 일반적인 이슈가 되어왔는데, 이 모호성은 탐색결과의 신뢰성에 큰 영향을 줄 수 있으며, 기본적으로 질의에 사용된 용어 자체가 가지는 문맥상 의미의 모호함에 기인한다. 질의 자체의 모호함뿐만 아니라, 사용자들이 그 탐색 결과를 적절하게 해석하기 위해 결과에 나타나는 키워드간의 관계도 중요하므로 명확하게 명시 되어야 한다. 이 논문에서는 기존의 질의 용어와 스키마 용어/인스턴스간의 키워드 매핑기법을 적용하여 키워드 탐색의 모호성을 해결한다. 용어간의 매핑에서는 질의 키워드와 스키마 용어간의 구문적 유사성은 물론 시맨틱 유사성까지 고려하기 때문에 기존의 시스템에 비해 매핑과 정밀도가 50% 이상 상승하는 결과를 얻을 수 있다. 탐색결과에 나타나는 용어간의 불분명한 관계를 점 더 명확하게 나타내기 위하여 시맨틱 웹 기술을 적용하여 키워드간의 의미 있는 관계를 더 많이 지식베이스 내에서 찾을 수 있도록 하였다.

효율적 XML키워드 검색을 인덱스 분할 및 합병 (Partitioning and Merging an Index for Efficient XML Keyword Search)

  • 김성진;이형동;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권7호
    • /
    • pp.754-765
    • /
    • 2006
  • 일반적으로 XML 키워드 검색에서 검색 결과는 질의 키워드들을 모두 포함하는 가장 작은 원소(최소 공통 선조)로 정의되며 색인의 기본 단위는 XML 원소가 된다. 기존의 인덱스 구조 하에서는 질의 키워드를 포함한 각 원소의 조합으로 생성된 모든 최소 공통 선조가 검색 결과로 고려된다. 본 논문에서는-불필요한 최소 공통 선조 산출 연산을 피하고 검색 시간을 단축시키기 위한 목적으로-인덱스를 파티션이라고 불리는 물리적 단위로 분할하고 질의 처리 시 필요에 따라 파티션을 동적으로 합병하여 검색 결과를 산출하는 기법을 기술한다. 주어진 깊이 이상의 최소 공통 선조가 검색 결과로 반환되어야할 경우, 검색 시스템은 제안된 인덱스 구조 하에서 동일 파티션에 속한 원소들 간의 조합만으로 검색 결과를 반환함으로써 검색 시간을 단축시킬 수 있다. 검색 결과에 대한 깊이 제한이 주어지지 않을 경우에도 검색 시스템은 분할된 인덱스를 사용하여 검색 결과를 얻을 수 있으며, 이때 분할되지 않은 기존의 인덱스를 사용하는 검색과 동일한 시간이 소요된다. 실험은 DBLP 사이트와 INEX2003에서 제공되는 XML 문서들로 진행되었으며, 제안된 인덱스는 검색 결과의 최소 깊이가 주어질 경우 질의 처리 시간을 상당히 감소시켰다.

Color Image Query Using Hierachical Search by Region of Interest with Color Indexing

  • Sombutkaew, Rattikorn;Chitsobhuk, Orachat
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2004년도 ICCAS
    • /
    • pp.810-813
    • /
    • 2004
  • Indexing and Retrieving images from large and varied collections using image content as a key is a challenging and important problem in computer vision application. In this paper, a color Content-based Image Retrieval (CBIR) system using hierarchical Region of Interest (ROI) query and indexing is presented. During indexing process, First, The ROIs on every image in the image database are extracted using a region-based image segmentation technique, The JSEG approach is selected to handle this problem in order to create color-texture regions. Then, Color features in form of histogram and correlogram are then extracted from each segmented regions. Finally, The features are stored in the database as the key to retrieve the relevant images. As in the retrieval system, users are allowed to select ROI directly over the sample or user's submission image and the query process then focuses on the content of the selected ROI in order to find those images containing similar regions from the database. The hierarchical region-of-interest query is performed to retrieve the similar images. Two-level search is exploited in this paper. In the first level, the most important regions, usually the large regions at the center of user's query, are used to retrieve images having similar regions using static search. This ensures that we can retrieve all the images having the most important regions. In the second level, all the remaining regions in user's query are used to search from all the retrieved images obtained from the first level. The experimental results using the indexing technique show good retrieval performance over a variety of image collections, also great reduction in the amount of searching time.

  • PDF

용어적합성피드백기반-OPAC시스템에 대한 직접조작의 인터페이스 구축 (Developing a direct manipulation-based interface to OPAC system using term relevance feedback technique)

  • 이영자
    • 한국도서관정보학회지
    • /
    • 제26권
    • /
    • pp.365-400
    • /
    • 1997
  • The interface design for most present query-base model of OPAC systems does not include the function to implement an iterative feedback process till the user arrives at satisfied search results through the interaction with the system. Also, the interface doesn't provide the help function for a user to select pertinent search terms. To formulate a query at the present OPAC system, a user should learn a set of syntax different from system to system. All of above mentioned things make an end-user feel difficult to utilize an OPAC system effectively. This experimental system is attempted to alleviate a few limitations of the present OPAC system by a n.0, pplying the direct-manipulation technique as well as the feedback principle. First, this system makes it unnecessary for a user to learn some syntax for query formulation by providing option buttons for access points. Second, this system makes it possible for a user to decide whether each displayed record is relevant or not, and for keywords included in the relevant records to be automatically stored in order to be used for later feedback. Third, in this system, the keywords stored in [sayongja yongeu bogyanham] can be deleted if unnecessary or can selected as search terms for a query expansion as well as a query modification. Fourth, in this system, after inputting the original query, the feedback process can be proceed without coming back to the previous search step until a user becomes satisfied with the search results. In conclusion, the searching behaviors of heterogeneous users should be continuously observed, analysed, and studied, the findings of which should be integrated into the design for the interface of the OPAC system.

  • PDF

온톨로지-DTD 정합에 의한 XML 질의 확장 (XML Query-Expansion by Ontology-DTD Match)

  • 김명숙;공용해
    • 정보처리학회논문지D
    • /
    • 제12D권5호
    • /
    • pp.773-780
    • /
    • 2005
  • XML 질의를 온톨로지 기반으로 확장하면 보다 폭넓은 정보검색이 가능해지는 반면에, 대상 문서의 구조에 부적합하게 확장된 질의들은 검색의 효율을 저하시킬 수 있다. 본 연구는 은톨로지와 대상 문서의 DTD를 정합한 결과인 축소된 온톨로지를 기반으로 질의를 확장함으로써 질의의 적합도를 향상시키는 방법을 제안한다. 온톨로지 개념과 DTD 엘리먼트 정합 및 온톨로지와 DTD 속성 정합에 의해 한번 축소된 온톨로지는 질의의 적중률을 높일 수 있을 뿐만 아니라 동일한 구조를 가지는 문서 집단에 재사용될 수 있으므로 검색의 효율을 향상시킬 수 있다.

복합질의의 효율적 수행을 위한 궤적질의 필터링 기법 (A Filtering Method of Trajectory Query for Efficient Process of Combined Query)

  • 반재훈;김종민
    • 한국정보통신학회논문지
    • /
    • 제12권9호
    • /
    • pp.1584-1590
    • /
    • 2008
  • 영역 질의와 궤적 질의로 구성된 복합질의는 특정 영역에 위치하는 이동체의 궤적을 검색하는 질의이다. 궤적질의는 선행궤적을 찾기 위해 점질의를 계속 반복하기 때문에 복합질의의 성능을 결정짓는 중요한 요소이다. 이 경우에 점질의는 인덱스의 노드를 중복해서 방문하기 때문에 질의처리의 수행속도가 매우 느려진다. 이 논문은 영역 질의에 우수한 성능을 가진 R-tree 기반의 이동체 색인을 대상으로 궤적 질의를 효율적으로 처리함으로써 복합 질의의 성능을 향상시키기 위한 방법을 제시한다. 기존 연구의 문제점인 노드의 중복 방문을 방지하기 위해 최소 공통 탐색 선분을 정의하여 단일 방향으로만 탐색하며 궤적을 예측하고 예측된 선분을 이용하여 연속된 궤적을 동시에 탐색하는 예측기반 여과 방법을 제안한다.

폭소노미 기반 개인화 웹 검색 시스템 (Folksonomy-based Personalized Web Search System)

  • 김동욱;강수용;김한준;이병정
    • 디지털콘텐츠학회 논문지
    • /
    • 제11권1호
    • /
    • pp.105-115
    • /
    • 2010
  • 검색엔진들은 사용자로부터 질의어를 전송받아 질의어와 관련이 가장 높은 웹 문서들을 보여주게 된다. 하지만 검색엔진이 사용자의 질의어만 가지고 사용자의 의도를 파악하여 정확한 웹 문서를 제공하기는 어렵다. 따라서 검식 엔진 시스템은 다양한 개인화 방법을 사용하여 각 사용자가 원하는 검색 결과를 보여주기 위해 노력한다. 본 논문에서는 개인화 검색을 위해 '폭소노미'를 기반으로 사용자에게 적합한 질의어를 추천해 주는 방법을 제안한다. 또한 이러한 개인화된 검색 결과를 제공하는 시스템이 가질 수 있는 프라이버시 침해 위험성을 제거하면서도 검색 서비스 제공자 입장에서는 사용자 정보를 활용한 다양한 서비스(개인화 광고등) 제공이 가능하도록 하는 개인화 검색 서비스 구조를 제안한다.

CONTINUOUS QUERY PROCESSING IN A DATA STREAM ENVIRONMENT

  • Lee, Dong-Gyu;Lee, Bong-Jae;Ryu, Keun-Ho
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2007년도 Proceedings of ISRS 2007
    • /
    • pp.3-5
    • /
    • 2007
  • Many continuous queries are important to be process efficiently in a data stream environment. It is applied a query index technique that takes linear performance irrespective of the number and width of intervals for processing many continuous queries. Previous researches are not able to support the dynamic insertion and deletion to arrange intervals for constructing an index previously. It shows that the insertion and search performance is slowed by the number and width of interval inserted. Many intervals have to be inserted and searched linearly in a data stream environment. Therefore, we propose Hashed Multiple Lists in order to process continuous queries linearly. Proposed technique shows fast linear search performance. It can be utilized the systems applying a sensor network, and preprocessing technique of spatiotemporal data mining.

  • PDF