• 제목/요약/키워드: Query Tree

검색결과 329건 처리시간 0.033초

구문분석에 기반한 한글 자연어 질의로부터의 불리언 질의 생성 (Boolean Query Formulation From Korean Natural Language Queries using Syntactic Analysis)

  • 박미화;원형석;이근배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권10호
    • /
    • pp.1219-1229
    • /
    • 1999
  • 일반적으로 AND, OR, NOT과 같은 연산자를 사용하는 불리언 질의는 사용자의 검색의도를 정확하게 표현할 수 있기 때문에 검색 전문가들은 불리언 질의를 사용하여 높은 검색성능을 얻는다고 알려져 있지만, 일반 사용자는 자신이 원하는 정보를 불리언 형태로 표현하는데 익숙하지 않다. 본 논문에서는 검색성능의 향상과 사용자 편의성을 동시에 만족하기 위하여 사용자의 자연어 질의를 확장 불리언 질의로 자동 변환하는 방법론을 제안한다. 먼저 자연어 질의를 범주문법에 기반한 구문분석을 수행하여 구문트리를 생성하고 연산자 및 키워드 정보를 추출하여 구문트리를 간략화한다. 다음으로 간략화된 구문트리로부터 명사구를 합성하고 키워드들에 대한 가중치를 부여한 후 불리언 질의를 생성하여 검색을 수행한다. 또한 구문분석의 오류로 인한 검색성능 저하를 최소화하기 위하여 상위 N개 구문트리에 대해 각각 불리언 질의를 생성하여 검색하는 N-BEST average 방법을 제안하였다. 정보검색 실험용 데이타 모음인 KTSET2.0으로 실험한 결과 제안된 방법은 수동으로 추출한 불리언 질의보다 8% 더 우수한 성능을 보였고, 기존의 벡터공간 모델에 기반한 자연어질의 시스템에 비해 23% 성능향상을 보였다. Abstract There have been a considerable evidence that trained users can achieve a good search effectiveness through a boolean query because a structural boolean query containing operators such as AND, OR, and NOT can make a more accurate representation of user's information need. However, it is not easy for ordinary users to construct a boolean query using appropriate boolean operators. In this paper, we propose a boolean query formulation method that automatically transforms a user's natural language query into a extended boolean query for both effectiveness and user convenience. First, a user's natural language query is syntactically analyzed using KCCG(Korean Combinatory Categorial Grammar) parser and resulting syntactic trees are structurally simplified using a tree-simplifying mechanism in order to catch the logical relationships between keywords. Next, in a simplified tree, plausible noun phrases are identified and added into the same tree as new additional keywords. Finally, a simplified syntactic tree is automatically converted into a boolean query using some mapping rules and linguistic heuristics. We also propose an N-BEST average method that uses top N syntactic trees to compensate for bad effects of single incorrect top syntactic tree. In experiments using KTSET2.0, we showed that a proposed method outperformed a traditional vector space model by 23%, and surprisingly manually constructed boolean queries by 8%.

RFID 시스템에서 비트변화감지를 이용한 하이브리드 충돌 방지 프로토콜 (A Hybrid Anti-Collision Protocol using Bit Change Sensing Unit in RFID System)

  • 김정환;김영태;박용수;안광선
    • 인터넷정보학회논문지
    • /
    • 제10권2호
    • /
    • pp.133-141
    • /
    • 2009
  • RFID 시스템에서 리더의 식별영역 내에 다수개의 태그가 존재할 경우 태그 충돌 문제가 발생할 수 있으며, 따라서 태그 인식에 많은 시간이 필요하다. 태그 충돌 문제는 RFID 시스템 설계 시 가장 중요한 핵심 이슈중의 하나이며 다양한 프로토콜이 제안되고 있다. 일반적인 트리 기반의 프로토콜들은 적합한 프리픽스를 생성하여 태그 인식을 빠르게 하는 것이 목적이다. 본 논문에서는 리더와 태그의 질의-응답 횟수를 줄일 수 있는 QT-BCS 프로토콜을 제안한다. QT-BCS 프로토콜에서는 타임 슬롯과 비트 변화 감지 유닛을 통하여 프리픽스를 생성한다. 식별영역내의 태그들은 이전 비트와 다른 값이 나올 때까지의 비트값을 리더에 전송하도록 설계되고, 리더는 0-슬롯과 1-슬롯에 첫째 비트 값에 따라 비트값을 저장한다. 이와 같은 방법은 질의 프리픽스를 쉽게 추적하므로 질의 횟수를 효과적으로 줄인다. 시뮬레이션 결과 QT-BCS 프로토콜은 Query Tree, 4-ary Query Tree 프로토콜 보다 질의-응답 횟수를 줄여 태그 인식 속도를 빠르게 개선시켰다.

  • PDF

S-XML 데이터의 효율적인 X-Path 처리를 위한 색인 구조 (An Index Structure for Efficient X-Path Processing on S-XML Data)

  • 장기;장용일;박순영;오영환;배해영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.51-54
    • /
    • 2005
  • This paper proposes an index structure which is used to process X-Path on S-XML data. There are many previous index structures based on tree structure for X-Path processing. Because of general tree index's top-down query fashion, the unnecessary node traversal makes heavy access and decreases the query processing performance. And both of the two query types for X-Path called single-path query and branching query need to be supported in proposed index structure. This method uses a combination of path summary and the node indexing. First, it manages hashing on hierarchy elements which are presented in tag in S-XML. Second, array blocks named path summary array is created in each node of hashing to store the path information. The X-Path processing finds the tag element using hashing and checks array blocks in each node to determine the path of query's result. Based on this structure, it supports both single-path query and branching path query and improves the X-Path processing performance.

  • PDF

다차원 인덱싱 구조에서의 k-근접객체질의 처리 방안 (k-Nearest Neighbor Query Processing in Multi-Dimensional Indexing Structures)

  • 김병곤;오성균
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권1호
    • /
    • pp.85-92
    • /
    • 2005
  • 최근에 데이터베이스 응용분야에서 내용기반의 검색이 가능한 이미지 데이터와 같은 다차원 정보 처리에 대한 관심이 고조되고 있다. 따라서 다차원 데이터를 효율적으로 저장하고. 사용자가 원하는 질의 결과를 신속히 제공하는 것이 중요한 연구분야이다 다차원의 데이터에 대한 질의는 대표적으로 영역질의 (Range query)와 최근접객체검색질의(Nearest Neighbor Query)로 나눌 수 있다. 본 논문에서는 $R^*-tree$와 같은 다차원의 인덱싱 구조에서 효율적이고 빠른 k-근접객체검색질의를 수행하기 위한 방안을 제시한다. k-근접객체검색질의는 질의 객체로부터 가장 근접한 k개의 객체를 반환하는 것이다. 본 논문은 이를 위하여 가지치기(Pruning) 기법을 이용하여 검색 공간을 줄이는 방법을 사용하였다. 실험을 통하여 제안된 전략의 오버헤드와 이득을 보였으며, 마지막으로 가장 효율적인 전략의 사용을 제안하였다.

  • PDF

효율적인 센서 네트워크 관리를 위한 다중 연속질의 분할 (The Multiple Continuous Query Fragmentation for the Efficient Sensor Network Management)

  • 박정업;조명현;김학수;이동호;손진현
    • 정보처리학회논문지D
    • /
    • 제13D권7호
    • /
    • pp.867-878
    • /
    • 2006
  • 최근 센서네트워크에 관련된 많은 연구가 진행되고 있다. 특히, 센서의 전력 보전을 위한 많은 기술들이 개발되고 있는데, 본 논문에서는 센서 네트워크의 불필요한 전력 소비를 줄이는 다중 연속질의 최적화에 관련된 방법을 제시한다. 우리는 센서 네트워크에서 전송되는 데이터의 횟수나 전송량의 원천적 문제가 되는 다중 연속 질의의 중복성 문제를 해결하는 분할 알고리즘을 제안한다. 분할 알고리즘은 새롭게 생성된 사용자 질의와 기존의 질의 들 사이에 중첩 질의 영역을 제거하기 위해, 질의 인덱스 (QR-tree)를 통해 하나의 질의를 둘 이상의 질의로 분할하는 알고리즘이다. QR-트리는 효율적인 질의 분할을 위해, R*-트리를 본 논문의 구존에 맞게 개량한 것이다. 이러한 처리 결과, 우리는 센서 네트워크의 전체 에너지에서 약 20% 가량의 에너지를 보존할 수 있었다.

범위 질의 인덱싱을 이용한 스트림 데이터의 다중 질의처리 기법 (A Multi-dimensional Query Processing Scheme for Stream Data using Range Query Indexing)

  • 이동언;이윤석
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권2호
    • /
    • pp.69-77
    • /
    • 2009
  • 스트림 서비스 환경에서는 지속적으로 입력되는 막대한 양의 데이터에 대해 원하는 조건을 탐색하는 실시간 질의처리가 요구된다. 기존의 R-tee기반 질의처리 기술은 각 이벤트에 대해 트리 전체에 대해 동일한 탐색과정을 반복해야 하므로 이를 효율적으로 감당할 수 없었다. 한편 센서 측정값을 비롯한 대부분의 스트림 데이터는 매우 높은 지역성을 가지며 이를 활용하여 탐색 공간을 크게 줄일 수 있다. 따라서 본 연구에서는 스트림 데이터의 지역성을 활용하여 스트림 환경에 적합한 질의처리 기법을 제안하였다. 또한 이 프레임웍을 활용하여 스트림 환경에서 어플리케이션이 요구하는 다양한 질의처리 서비스를 개발할 수 있을 것으로 기대된다. 본 연구에서 구현한 프로토타입 시스템을 스트림 환경에 적용해 얻은 실험 결과를 통해, 스트림 환경에서 기존질의처리 기법보다 더 적합하고 효율이 크게 개선됨을 확인할 수 있었다.

충돌방지 알고리즘의 보안 견고성 (Security Robustness of Tree based Anti-collision Algorithms)

  • 서현곤;김향미
    • 대한전자공학회논문지TC
    • /
    • 제47권1호
    • /
    • pp.99-108
    • /
    • 2010
  • RFID(Radio Frequency IDentification) 기술은 RF신호를 사용하여 물품에 부착된 전자태그를 식별하는 비접촉 기술이다. RFID 리더의 식별 영역 내에 여러 개의 태그가 있는 경우 이들 사이의 충돌(collision)이 발생되기 때문에 이들을 식별할 수 있는 메커니즘이 필요하다. 다중 태그 식별 문제는 RFID 기술 중에서도 핵심이며, 이 문제는 충돌방지(anti-collision) 알고리즘을 통하여 해결할 수 있다. 하지만 RFID 시스템의 또 다른 문제는 정보보호이다. 태그는 리더의 쿼리에 매우 쉽게 응답하기 때문에 태그의 정보 노출에 따른 사용자 프라이버시 침해 문제가 발생한다. 이러한 점에서 RFID 기술은 외부로부터 스니핑(sniffing)에 매우 취약하다. 본 논문에서는 기존에 제안된 트리 기반 메모리래스 알고리즘인 트리-워킹 알고리즘, 쿼리 트리알고리즘, 향상된 쿼리 트리 알고리즘 등의 보안 견고성에 대하여 살펴본다.

RFID 시스템에서 하이브리드 태그 충돌 방지 알고리즘 (Hybrid Tag Anti-Collision Algorithms in RFID System)

  • 신재동;여상수;김성권
    • 한국통신학회논문지
    • /
    • 제32권4A호
    • /
    • pp.358-364
    • /
    • 2007
  • RFID(Radio Frequency IDentification) 기술은 라디오 주파수를 사용하는 비접촉 자동인식 기술이다. 이런 RFID 기술의 확산을 위해서는 리더(reader)가 다수의 태그(tag)를 짧은 시간 안에 인식하는 다중 태그 식별 문제를 해결 해야만 한다. 지금까지 이 문제를 해결하기 위한 충돌 방지(anti-collision) 알고리즘이 많이 개발되었고 이것들은 크게 알로하(ALOHA) 기반 알고리즘과 트리(tree) 기반 알고리즘으로 나뉜다. 본 논문에서는 이 두 가지 방법의 특징을 혼합한 새로운 충돌 방지 알고리즘 2가지를 제안한다. 그리고 대표적인 충돌 방지 알고리즘인 18000-6 Type A, Type B, Type C, query tree 알고리즘과 성능 비교 및 평가를 한다.

A Study of Efficient Access Method based upon the Spatial Locality of Multi-Dimensional Data

  • Yoon, Seong-young;Joo, In-hak;Choy, Yoon-chul
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1997년도 International Conference MULTIMEDIA DATABASES on INTERNET
    • /
    • pp.472-482
    • /
    • 1997
  • Multi-dimensional data play a crucial role in various fields, as like computer graphics, geographical information system, and multimedia applications. Indexing method fur multi-dimensional data Is a very Important factor in overall system performance. What is proposed in this paper is a new dynamic access method for spatial objects called HL-CIF(Hierarchically Layered Caltech Intermediate Form) tree which requires small amount of storage space and facilitates efficient query processing. HL-CIF tree is a combination of hierarchical management of spatial objects and CIF tree in which spatial objects and sub-regions are associated with representative points. HL-CIF tree adopts "centroid" of spatial objects as the representative point. By reflecting objects′sizes and positions in its structure, HL-CIF tree guarantees the high spatial locality of objects grouped in a sub-region rendering query processing more efficient.

  • PDF

vp tree에서 효과적인 k-Nearest Neighbor 검색 방법 (Effective k-Nearest Neighbor Search method based on vp tree)

  • 김민욱;윤경로
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.156-159
    • /
    • 2010
  • vp tree는 기준점(vantage point)과의 거리를 기준으로 데이터베이스 내의 자료를 색인하는 자료구조이다. 멀티미디어 자료 검색에서 비슷한 정도는 객체간의 거리를 바탕으로 비교하고, vp tree 색인 구조는 이 과정을 내포하고 있기 때문에 최근 멀티미디어 검색 연구에서 많이 사용되고 있다. 검색 방법에는 query와 가장 가까운 대상을 찾는 Nearest Neighbor Search, 또는 query와 가까운 k등까지를 검색하는 k-Nearest Neighbor Search가 있다. 본 논문에서는 Content-based retrieval에서 최근 자주 사용되는 vp tree에서 효과적인 k-NNS 방법을 제안하고, 기존의 전형적인 k-NNS 방법과의 비교 실험 결과를 보인다.

  • PDF