• 제목/요약/키워드: query formulation

검색결과 18건 처리시간 0.026초

Query Formulation for Heuristic Retrieval in Obfuscated and Translated Partially Derived Text

  • Kumar, Aarti;Das, Sujoy
    • Journal of Information Science Theory and Practice
    • /
    • 제3권1호
    • /
    • pp.24-39
    • /
    • 2015
  • Pre-retrieval query formulation is an important step for identifying local text reuse. Local reuse with high obfuscation, paraphrasing, and translation poses a challenge of finding the reused text in a document. In this paper, three pre-retrieval query formulation strategies for heuristic retrieval in case of low obfuscated, high obfuscated, and translated text are studied. The strategies used are (a) Query formulation using proper nouns; (b) Query formulation using unique words (Hapax); and (c) Query formulation using most frequent words. Whereas in case of low and high obfuscation and simulated paraphrasing, keywords with Hapax proved to be slightly more efficient, initial results indicate that the simple strategy of query formulation using proper nouns gives promising results and may prove better in reducing the size of the corpus for post processing, for identifying local text reuse in case of obfuscated and translated text reuse.

개념 검색어 확장을 통해 질의 형식화를 도와주는 “개념 마법사”의 설계 및 구현 (Design and Implementation of “Concept Wizard” Supporting Query Formulation with Concept Term Expansion)

  • 강현규
    • 정보처리학회논문지B
    • /
    • 제9B권4호
    • /
    • pp.437-444
    • /
    • 2002
  • 정보 검색 시스템이나 웹(Web)이 방대해지고 초보적 수준의 사용자들이 늘어남에 따라 간단한 조작만으로 원하는 정보를 얻어낼 수 있는 도구의 개발이 점점 중요해지고 있다. 일반적으로 정보 검색 시스템이나 검색 엔진을 통한 질의 입력 방법이나 연산자들이 매우 다양하며 일반 사용자들은 질의를 형식화 하는 것이 쉽지 않다. 본 논문은 일반 사용자가 정보 검색 시스템이나 검색 엔진을 통하여 정보를 검색하기 위한 검색어 형식화를 도와주는 개념 마법사를 제안한다. 본 논문에서 제시한 개념 마법사는 실세계 지식의 부족을 시소러스를 이용하여 인터렉티브(interactive) 하게 제시하고 웹을 기반으로 하는 플러그인(plug-in)으로 제공함으로써 유용성 및 확장성이 크다.

시각 예제에 의한 질의: 시각정보 검색지원을 위한 이미지 질의 패러다임의 유용성 비교 연구 (Query by Visual Example: A Comparative Study of the Efficacy of Image Query Paradigms in Supporting Visual Information Retrieval)

  • 콜린 벤터스
    • 정보관리연구
    • /
    • 제42권3호
    • /
    • pp.71-94
    • /
    • 2011
  • 시각적 실례에 의한 질의는 내용기반 이미지 검색 환경에서 질의 표현을 위한 중요한 질의 패러다임이다. 이미지 및 스케치에 의한 질의는 질의표현을 가능하게 하는 방법으로서 오랫동안 알려졌다. 하지만 이 방법이 질의를 쉽게 작성하는 데 얼마나 도움을 주는지에 대한 효율성에 대한 실험적 입증은 아직 미미하다. 정보검색시스템에 표현하는 탐색자의 능력은 검색과정의 기본이다. 이 연구의 목적은 탐색자의 정보 문제와 효율적이고도 효과적인 시각적 질의 작성을 지원하기 위해 필요한 질의 방법들 간의 지식 격차의 원인이 되는 다양한 정보 요구를 지원하는 데 있어서 유용성 실험을 통해 이미지에 의한 질의와 스케치방법에 의한 질의 조사하기 위함이었다. 본 연구 결과는 이미지에 의한 질의가 시각적 질의 작성에 실행 가능한 접근방식임을 제시한다. 반면에, 본 연구결과를 통해 탐색자의 정보 문제와 시각적인 질의 작성에 도움을 주는 스케치 패러다임에 의한 질의표현 능력 간에 상당한 불일치가 있다는 것을 알 수 있다. 효율(시간)과 유효성(오류)에 초점을 둔 유용성 실험결과와 이용자의 만족도는 큰 차이점이 있다고 보여준다(p<0.001). 이는 다음 세 가지 측정(시간, 오류, 이용자의 만족도)에 대한 두 가지 질의 방식(이미지에 의한 질의, 스케치에 의한 질의) 사이에서 나타난 시간(Z=-3.597, p<0.001), 오류(Z=-3.317, p<0.001), 그리고 만족도(Z=-10.223, p<0.001)에서 드러난다. 본 연구결과는 또한 질의도구를 참가자가 인지하는 유용성에 큰 차이가 있다는 것을 보여준다(Z=-4.672, p<0.001).

색에 의한 질의: 시각정보 검색을 위한 질의 패러다임의 유용성 측정 (Query by Colour : Investigating the Efficacy of Query Paradigms for Visual Information Retrieval)

  • 콜린 크레이그 벤터스
    • 정보관리학회지
    • /
    • 제28권2호
    • /
    • pp.135-158
    • /
    • 2011
  • 탐색자가 정보 요구를 정보검색시스템에 표현하는 능력은 검색과정의 기본이다. 시각적 예시에 의한 질의는 내용기반 이미지 검색환경에서 질의 표현을 위한 중요한 패러다임이다. 하지만, 이 방법이 질의 구성의 편의성에 있어 얼마나 효과가 있는지에 대한 실험적 입증은 아직 미미하다. 이 연구의 목적은 다양한 정보요구와 효율적이고도 효과적인 시각적 질의 구성을 지원하기 위해 탐색자의 정보요구와 질의 방법 사이에 발생하는 지식 격차를 고려하여 색을 이용한 질의 방식의 사용성을 조사하기 위한 것이다. 본 연구결과를 통하여 색을 이용한 질의 방법이 시각적 질의 구성을 적절히 지원하지 못한다는 것과 탐색자의 정보요구와 검색 패러다임의 표현력 사이에 뚜렷한 불일치가 있다는 것을 알 수 있다.

불리언 질의 구성 알고리즘의 시간복잡도 분석 (Time Complexity Analysis of Boolean Query Formulation Algorithms)

  • 김남호
    • 한국정보처리학회논문지
    • /
    • 제4권3호
    • /
    • pp.709-719
    • /
    • 1997
  • 알고리즘의 성능은 여러 측면에서 측정할 수 있다 하나의 질의 구성(Quvery Formulaiton)알고리즘이 개발되었다고 가정할때, 이 알고리즘 검색 성능의 효과과성 (재현율과 정확율)이 다른 알고리즘에 비해 우수하다하였도 질의 작성 시간적인 측면, 즉 효율성에서 다른 알고리즘에 뒤진다면 모든 면에서 우수하다고 평가하기 어렵다.본 연구에서는 질의나무(Query tree)라고 불리는 자동 질의 재구성 알고리즘과 다른 2개의 알고리즘(DNF method,Dilon's method)을 이론적 측면과 실시간 측정에 Sun SparcsStation 2를 이용하여 비교하여 보았다. 3가지 Test set 인 CACM,CISI,그리고 Medlars을 이용하여 실험한 질과 질의나무 알고리즘이 이론적, 실시간 측면 모두에서 가장빠른 알고리즘이라는 결과가 나왔다.

  • PDF

사용자 상호작용에 기반한 그래프질의 생성 및 처리 (User Interaction-based Graph Query Formulation and Processing)

  • 정성재;김태홍;이승우;이화식;정한민
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제41권4호
    • /
    • pp.242-248
    • /
    • 2014
  • RDF 데이터가 급속히 증가함에 따라 RDF데이터로부터 정보를 효율적으로 추출하는 기술의 중요성도 점차 커지고 있다. RDF데이터 질의를 위해 가장 많이 사용하는 질의언어인 SPARQL은 문법이 간단하고 그래프 패턴을 손쉽게 질의로 표현할 수 있는 장점이 있다. 그러나 사용자가 적절한 SPARQL을 작성하려면 데이터 셋에 대한 온톨로지 구조와 용어를 사전에 파악해야 한다. 이 연구에서는 데이터 셋으로부터 사전에 추출된 스키마정보를 이용한 그래프 질의 생성 및 처리방법을 제안한다. 제안된 방법에서 사용자는 RDF 데이터 셋에 대한 온톨로지 구조 사전파악 없이 화면상에서 동적으로 질의를 작성하여 정보를 조회할 수 있다. 사용자가 생성한 질의는 관계형데이터베이스에 저장된 트리플 데이터에 대해 그래프 탐색을 수행할 때 탐색공간 제약조건으로 활용된다. LUBM(10,0) 데이터 셋에 대하여 LUBM 질의 2, 8, 9번을 이용하여 질의 처리 성능과 완전성을 확인하였다.

불리언 질의 재구성에서 의사결정나무의 학습 성능 감도 분석 (Sensitivity Analysis of Decision Tree's Learning Effectiveness in Boolean Query Reformulation)

  • 윤정미;김남호;권영식
    • 한국경영과학회지
    • /
    • 제23권4호
    • /
    • pp.141-149
    • /
    • 1998
  • One of the difficulties in using the current Boolean-based information retrieval systems is that it is hard for a user, especially a novice, to formulate an effective Boolean query. One solution to this problem is to let the system formulate a query for a user from his relevance feedback documents in this research, an intelligent query reformulation mechanism based on ID3 is proposed and the sensitivity of its retrieval effectiveness, i.e., recall, precision, and E-measure, to various input settings is analyzed. The parameters in the input settings is the number of relevant documents. Experiments conducted on the test set of Medlars revealed that the effectiveness of the proposed system is in fact sensitive to the number of the initial relevant documents. The case with two or more initial relevant documents outperformed the case with one initial relevant document with statistical significances. It is our conclusion that formulation of an effective query in the proposed system requires at least two relevant documents in its initial input set.

  • PDF

Department of Computer Science, Chosun University

  • Young-cheon kim;Moon, You-Mi;Lee, Sung-joo
    • 한국지능시스템학회논문지
    • /
    • 제11권7호
    • /
    • pp.659-665
    • /
    • 2001
  • Relevance feedback is the most popular query reformulation strategy in a relevance feedback cycle, the user is presented with a list of the retrieved documents and, after examining them, marks those which are relevant. In practice, only the top 10(or 20) ranked documents need to be examined. The main idea consists of selecting important terms, or expressions, attached to the documents that have been identified as relevant by the user, and of enhancing the importance of these terms in a new query formulation. The expected effect is that the new query will be moved towards the relevant documents and away from the non-relevant ones. Local analysis techniques are interesting because they take advantage of the local context provided with the query. In this regard, they seem more appropriate than global analysis techniques. In a local strategy, the documents retrieved for a given query q are examined at query time to determine terms for query expansion. This is similar to a relevance feedback cycle but might be done without assistance from the user.

  • PDF

A Study on Improving the Effectiveness of Information Retrieval Through P-norm, RF, LCAF

  • Kim, Young-cheon;Lee, Sung-joo
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제2권1호
    • /
    • pp.9-14
    • /
    • 2002
  • Boolean retrieval is simple and elegant. However, since there is no provision for term weighting, no ranking of the answer set is generated. As a result, the size of the output might be too large or too small. Relevance feedback is the most popular query reformulation strategy. in a relevance feedback cycle, the user is presented with a list of the retrieved documents and, after examining them, marks those which are relevant. In practice, only the top 10(or 20) ranked documents need to be examined. The main idea consists of selecting important terms, or expressions, attached to the documents that have been identified as relevant by the user, and of enhancing the importance of these terms in a new query formulation. The expected effect is that the new query will be moved towards the relevant documents and away from the non-relevant ones. Local analysis techniques are interesting because they take advantage of the local context provided with the query. In this regard, they seem more appropriate than global analysis techniques. In a local strategy, the documents retrieved for a given query q are examined at query time to determine terms for query expansion. This is similar to a relevance feedback cycle but might be done without assistance from the user.

인간심리를 이용한 감성 모델과 영상검색에의 적용 (Emotional Model via Human Psychological Test and Its Application to Image Retrieval)

  • 유헌우;장동식
    • 대한산업공학회지
    • /
    • 제31권1호
    • /
    • pp.68-78
    • /
    • 2005
  • A new emotion-based image retrieval method is proposed in this paper. The research was motivated by Soen's evaluation of human emotion on color patterns. Thirteen pairs of adjective words expressing emotion pairs such as like-dislike, beautiful-ugly, natural-unnatural, dynamic-static, warm-cold, gay-sober, cheerful-dismal, unstablestable, light-dark, strong-weak, gaudy-plain, hard-soft, heavy-light are modeled by 19-dimensional color array and $4{\times}3$ gray matrix in off-line. Once the query is presented in text format, emotion model-based query formulation produces the associated color array and gray matrix. Then, images related to the query are retrieved from the database based on the multiplication of color array and gray matrix, each of which is extracted from query and database image. Experiments over 450 images showed an average retrieval rate of 0.61 for the use of color array alone and an average retrieval rate of 0.47 for the use of gray matrix alone.