• 제목/요약/키워드: Analysis of Query

검색결과 457건 처리시간 0.025초

질의 재구성 알고리즘의 검색성능을 측정하기 위한 새로운 평가 방법의 개발 (Development of New Retieval Performance Measures for Query Reformulation Algorithms)

  • 김남호
    • 한국정보처리학회논문지
    • /
    • 제4권4호
    • /
    • pp.963-972
    • /
    • 1997
  • 정보 검색에서 대부분의 질의 재구성 알고리즘들은 초기 입력 문서나 피드백 문을 이용 하여 질의를 재구성하므로, 질의 재구성 알고리즘의 검색 성능은 입력되는 문서들의 질 에 따라 달라진다. 본 연구에서는 질의 재구성 알고리즘의 입력 문서에 대한 성능 감도를 새로운 검색성능 평가방법을 개발하여 분석하였다. 또한 CIRA라고 불리는 새로운 평가기준을 개발하여 질의 재구성 사이의 성능 변화추이를 분석하였다. 세가지의 질의 재구성 알고리즘(질의나무 (query tree), DNF 방법, Dillon 방법)의 감도와 성능변화를 테시트 세트인 CACM, CISI, Medlars 상에서 분석하였다. 세 실험에서 질의나무가 가장 작은 CIRA를 취득했으며, 감도 분석에서는 비록 다른 알고리즘과 차이는 적으나 가장 높은감도를 나타냈다.

  • PDF

RFID 시스템에서 태그 충돌 중재를 위한 하이브리드 기법 (A Hybrid Approach to Arbitrate Tag Collisions in RFID systems)

  • 류지호;이호진;석용호;권태경;최양희
    • 한국정보과학회논문지:정보통신
    • /
    • 제34권6호
    • /
    • pp.483-492
    • /
    • 2007
  • 본 논문에서는 RFID 시스템에서 쿼리 트리 기반의 태그 충돌 중재를 위한 새로운 프로토콜을 제안한다. 제안한 하이브리드 쿼리 트리(Hybrid Query Tree) 기법은 이진 쿼리 트리 대신에 4-ary 쿼리 트리를 이용하여 태그 충돌 수를 줄였으며 추가적으로 발생하는 유휴 시간을 줄이기 위해 slotted 백오프 기법을 활용하였다. 실험결과 및 수학적 분석은 제안한 하이브리드 쿼리 트리 프로토콜이 기존에 제시된 기법보다 우수한 성능을 보임을 입증한다.

사용자 질의패턴 분석을 이용한 효율적인 확장검색어 추천시스템 (An Efficient Extended Query Suggestion System Using the Analysis of Users' Query Patterns)

  • 김영안;박건우
    • 한국통신학회논문지
    • /
    • 제37권7C호
    • /
    • pp.619-626
    • /
    • 2012
  • 주요 검색엔진들은 확장 및 연관검색어를 추천하는 서비스를 제공함으로써 질의어 확장에 대한 사용자의 검색 편의성을 제공하고 있다. 하지만 많은 수의 사용자가 많이 찾는 검색어 즉, 대중성을 근거하여 제공되는 확장 및 연관검색어 추천 서비스는 사용자의 만족도를 높이는데 한계가 있다. 왜냐하면 사용자마다 생각하는 차이가 존재하며 선호하는 질의 및 관심 분야도 다르기 때문이다. 본 논문에서는 사용자의 정보요구에 적합한 효율적인 확장검색어를 추천하는 시스템을 설계 및 구현하고 웹 사용자의 정보검색 과정에서 최초 질의어 입력 후 질의어 확장 과정에서 사용자의 편의성을 향상시키고자 하였다. 평가결과 제안시스템은 검색엔진에서 추천하지 못한 구글 41% 및 야후 48%의 확장검색어를 추천할 수 있었으며 사용자의 편의성을 위하여 대중성 기반으로 추천되고 있는 확장 및 연관검색어 추천 서비스의 한계를 보완하여 사용자의 편의성을 향상시킬 수 있었다.

An Analysis of Element Information in XML Documents

  • Kim, Sungrim;Yoon, Yong-ik
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 ITC-CSCC -2
    • /
    • pp.834-837
    • /
    • 2002
  • This paper proposes the way to analyse XML docuements according to the element information. XML documents, which are becoming new standard for expressing and exchanging data in the Internet, don't have defined schema. It is not adequate to directly apply XML documents to the existing relational database or object-oriented database query language. Research on how to extract schema for XML documents and query language is going on actively For users' query, the results could be too many or too less. It is important to give the users adequate results. Our proposed analysis method can be reduced or extended to correspond to the users' query more flexibly.

  • PDF

웹검색 행태 연구 - 사용자가 스스로 쿼리를 뭉치는 방법으로 - (Web Search Behavior Analysis Based on the Self-bundling Query Method)

  • 이중식
    • 한국문헌정보학회지
    • /
    • 제45권2호
    • /
    • pp.209-228
    • /
    • 2011
  • 검색이 편재화 되고 있다. 사용자들은 PC를 너머 스마트폰과 스마트TV에서도 검색을 일상적으로 사용하고 있다. 따라서 사용자의 검색행태도 진화 중이다. 하지만 검색행태 연구는 서버의 트랜잭션 로그(transaction log)를 기반으로 하거나 사용자 로그(user log)를 관찰하는 경우에도 개별 쿼리(query instance)를 분석단위로 삼기에 여러 매체와 여러 시간을 가로지르는 검색 행태를 분석하기에 부족하다. 본 연구에서는 사용자가 직접 덩어리 지운 쿼리 뭉치(bundled query)를 살펴보아 시간과 매체를 가로지르며 궁금증을 해결해 나가는 사용자의 검색행동을 분석해 보았다. 연구를 위해 사용자 PC에 웹로그 캐처를 설치하고, 취합된 웹검색 기록을 사용자들이 직접 덩어리 지워 같은 궁금증을 가진 뭉치를 만들도록 하였다. 또한 각 뭉치에 대한 설문을 통해 검색의 동기, 계기, 만족도 및 검색 후 활동을 조사하였다. 사용자에 의해 만들어진 뭉치는 전화 인터뷰를 통해 검증하였고 맥락을 확인하였다. 뭉치를 통한 인터뷰는 검색 당시의 기억을 떠올리는 힌트로 작용하여 사용자의 검색 회상을 생생하게 하였다. 분석 결과 사용자들은 하루에 평균 4.75개의 검색 뭉치를 발생시키고, 각각의 검색 뭉치는 평균 2.75개의 쿼리로 구성되어 있음을 확인할 수 있었다. 또한 뭉치 내 쿼리의 발전을 '쿼리의 정교화'와 '주제의 정교화'라는 상위 범주 아래 9개의 패턴으로 확인하였다.

A Prediction-based Energy-conserving Approximate Storage and Query Processing Schema in Object-Tracking Sensor Networks

  • Xie, Yi;Xiao, Weidong;Tang, Daquan;Tang, Jiuyang;Tang, Guoming
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제5권5호
    • /
    • pp.909-937
    • /
    • 2011
  • Energy efficiency is one of the most critical issues in the design of wireless sensor networks. In object-tracking sensor networks, the data storage and query processing should be energy-conserving by decreasing the message complexity. In this paper, a Prediction-based Energy-conserving Approximate StoragE schema (P-EASE) is proposed, which can reduce the query error of EASE by changing its approximate area and adopting predicting model without increasing the cost. In addition, focusing on reducing the unnecessary querying messages, P-EASE enables an optimal query algorithm to taking into consideration to query the proper storage node, i.e., the nearer storage node of the centric storage node and local storage node. The theoretical analysis illuminates the correctness and efficiency of the P-EASE. Simulation experiments are conducted under semi-random walk and random waypoint mobility. Compared to EASE, P-EASE performs better at the query error, message complexity, total energy consumption and hotspot energy consumption. Results have shown that P-EASE is more energy-conserving and has higher location precision than EASE.

계층 최대 R-트리를 이용한 범위 상위-$\kappa$ 질의의 효율적인 수행 (Efficient Execution of Range $Top-\kappa$ Queries using a Hierarchical Max R-Tree)

  • 홍석진;이상준;이석호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권2호
    • /
    • pp.132-139
    • /
    • 2004
  • 범위 상위-$\kappa$ 질의는 질의 범위 내의 다차원 데이타 중 값 애트리뷰트를 기준으로 상위 k개의 레코드를 반환하는 질의로 공간 데이타베이스와 데이타 웨어하우스에서 분석을 위해 많이 사용되는 유용한 질의 형태이다. 이 논문에서는 계층 최대 R-트리의 선택적인 탐색을 통해 범위 상위-k 질의를 효과적으로 수행하는 기법을 제시한다. 이 기법은 단말 노드의 일부만을 접근하여 질의를 수행할 수 있으며, 질의 범위의 크기에 관계없이 거의 일정한 성능을 보인다. 또한 이 기법은 우선순위 큐를 효율적으로 관리함으로써 큐의 유지비용을 최소화하며, 기존 R-트리와 같은 팬아웃을 보장할 수 있다.

불리언 질의 구성 알고리즘의 시간복잡도 분석 (Time Complexity Analysis of Boolean Query Formulation Algorithms)

  • 김남호
    • 한국정보처리학회논문지
    • /
    • 제4권3호
    • /
    • pp.709-719
    • /
    • 1997
  • 알고리즘의 성능은 여러 측면에서 측정할 수 있다 하나의 질의 구성(Quvery Formulaiton)알고리즘이 개발되었다고 가정할때, 이 알고리즘 검색 성능의 효과과성 (재현율과 정확율)이 다른 알고리즘에 비해 우수하다하였도 질의 작성 시간적인 측면, 즉 효율성에서 다른 알고리즘에 뒤진다면 모든 면에서 우수하다고 평가하기 어렵다.본 연구에서는 질의나무(Query tree)라고 불리는 자동 질의 재구성 알고리즘과 다른 2개의 알고리즘(DNF method,Dilon's method)을 이론적 측면과 실시간 측정에 Sun SparcsStation 2를 이용하여 비교하여 보았다. 3가지 Test set 인 CACM,CISI,그리고 Medlars을 이용하여 실험한 질과 질의나무 알고리즘이 이론적, 실시간 측면 모두에서 가장빠른 알고리즘이라는 결과가 나왔다.

  • PDF

Query 및 Mathematical 기법을 이용한 홍수범람 해석 (An analysis of Flood Inundation using Query and Mathematical Method)

  • 정하옥;박상우;추태호;박건철
    • 한국습지학회지
    • /
    • 제12권1호
    • /
    • pp.33-40
    • /
    • 2010
  • 본 연구에서는 기존 연구에서 도출된 프로그램 사용의 어려움이나 많은 매개변수 산정 및 적용 문제, 복잡한 전처리과정 등의 어려움이나 문제점을 좀 더 단순화하고 정밀도가 높은 범람해석 및 홍수범람도 작성 방법을 제시하여 위험요소를 줄이고 개선시킬 수 있는 기법을 제시하고자 하였다. 대상 하천으로는 안성천 유역을 선정하였으며 월류 및 제방 붕괴만을 고려하기 위하여 계획빈도를 초과하는 이상홍수개념으로 홍수범람 시나리오를 작성하여 범람모의를 실시하였다. 범람모의를 위한 모형 적용은 1차원 수치모형인 HEC-RAS의 Storage 기능을 이용하여 월류 및 제방 붕괴에 대한 분석을 실시하였으며, 일반적으로 사용되는 Area-Time-Depth 방법보다는 좀 더 정확한 범람모의를 위해 Elevation versus Volume Curve를 적용하였다. Arcview 3.2a의 Query기법과 SURFER의 Mathematical 기법을 이용하여 작성한 침수면적의 차이가 크지 않아 전처리과정이 복잡한 Arcview 3.2a보다 비교적 작성방법이 간단하고 정밀도가 높은 홍수범람도를 작성할 수 있는 방법을 제시하였다.

불리언 질의 재구성에서 의사결정나무의 학습 성능 감도 분석 (Sensitivity Analysis of Decision Tree's Learning Effectiveness in Boolean Query Reformulation)

  • 윤정미;김남호;권영식
    • 한국경영과학회지
    • /
    • 제23권4호
    • /
    • pp.141-149
    • /
    • 1998
  • One of the difficulties in using the current Boolean-based information retrieval systems is that it is hard for a user, especially a novice, to formulate an effective Boolean query. One solution to this problem is to let the system formulate a query for a user from his relevance feedback documents in this research, an intelligent query reformulation mechanism based on ID3 is proposed and the sensitivity of its retrieval effectiveness, i.e., recall, precision, and E-measure, to various input settings is analyzed. The parameters in the input settings is the number of relevant documents. Experiments conducted on the test set of Medlars revealed that the effectiveness of the proposed system is in fact sensitive to the number of the initial relevant documents. The case with two or more initial relevant documents outperformed the case with one initial relevant document with statistical significances. It is our conclusion that formulation of an effective query in the proposed system requires at least two relevant documents in its initial input set.

  • PDF