• Title/Summary/Keyword: 질의수정

Search Result 164, Processing Time 0.03 seconds

A Study on Query Refinement by Online Relevance Feedback in an Information Filtering System (온라인 이용자 피드백을 사용한 정보필터링 시스템의 수정질의 최적화에 관한 연구)

  • Choi, Kwang;Chung, Young-Mee
    • Journal of the Korean Society for information Management
    • /
    • v.20 no.4 s.50
    • /
    • pp.23-48
    • /
    • 2003
  • In this study an information filtering system was implemented and a series of relevance feedback experiments were conducted using the system. For the relevance feedback, the original queries were searched against the database and the results were reviewed by the researchers. Based on users' online relevance judgements a pair of 17 refined queries were generated using two methods called 'co-occurrence exclusion method' and 'lower frequencies exclusion method,' In order to generate them, the original queries, the descriptors and category codes appeared in either relevant or irrelevant document sets were applied as elements. Users' relevance judgments on the search results of the refined queries were compared and analyzed against those of the original queries.

The Method of Searching Metathesaurus, Using Automatic Modified a Query (질의어 자동수정을 이용한 메타시소러스 검색 방법)

  • 김종광;하원식;김태용;류중경;이정현
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.454-456
    • /
    • 2003
  • UMLS(2003AA edition 기준)의 메타시소러스는 다국어를 지원하며 875.233개의 개 (concept)과 2,146,897개의 개념명(concept name)을 포함한다. 현재 UMLS 메타시소러스 검색을 제공하는 PubMed나 NLM에서는 UMLS에서는 개념명에 존재하지 않는 잘못된 질의나, 잘못된 구문 또는 개념명의 일부를 이용한 검색이 불가능하다. 이는 사용자가 UMLS에서 정보를 얻기 위해서는 정확한 의학용어를 숙지해야 되며. UMLS 메타시소러스의 데이터가 잘못 되었을 경우 정보를 얻을 수 없다. 본 연구에서는 이러한 문제점을 보완하기 위해서 자연어처리에서 연구되고 있는 문자열 간의 유사도 측정방식을 적용하여 잘못된 질의어에 대한 자동수정 기능을 이용한 메타시소러스 검색방법을 제안한다. 제안한 방법에서는 질의어를 자동수정하기 위하여 철자사전을 자동으로 추출하고 문자열 비교알고리즘을 도입하여 질의어와 철자사전간의 용어의 유사도를 측정한다. 유사도에 의하여 얻어진 용어를 메타시소러스의 형식에 맞게 변환하여 질의에 대한 최적의 결과를 얻을 수 있도록 한다. 제안된 방법의 성능을 평가하기 위해서 최근(2003년 8월) bi-gram 방식을 도입한 NLM에서의 시스템과 비교 평가한다.

  • PDF

R-Trees construction using clustering (클러스터링을 이용한 R-Trees 구축방법)

  • 차정숙;이기준
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.171-173
    • /
    • 1999
  • 공간 데이터베이스에서 사용되는 데이터는 그 양이 방대하고 복잡하여 이를 효율적으로 저장, 관리하는 색인이 필요하다. 여러 공간 색인 방법들 중에서 R-tree는 삽입과 삭제가 빈번히 발생하는 동적인 환경에서 효율적인 질의 성능을 보이는 것으로 알려져 있다. R-tree는 삽입되는 데이터의 순서에 따라 트리의 구조가 달라질 수 있는데, 주어진 데이터가 수정이 자주 발생하지 않는다며 데이터 입력 순서를 결정하여 질의 성능이 가장 좋은 트리를 구성할 수 있다. 본 논문에서는 데이터가 자주 수정되지 않는 환경에서 노드간의 중첩을 가장 최소화 할 수 있는 데이터 입력 순서를 결정하기 위해 클러스터링을 이용한 새로운 방법인 CSR-tree를 제안하고자 한다. CSR-tree는 일반 R-tree와 hilbert packed R-tree 방법보다 향상된 질의 성능을 보인다.

  • PDF

Spatial Query Processing using Materialized Views in Client/Server Spatial Databases (클라이언트/서버 공간 데이터베이스에서 실체화된 뷰를 이용한 공간질의 처리)

  • 문상호
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2002.11b
    • /
    • pp.593-596
    • /
    • 2002
  • 일반적으로 공간질의 처리는 복잡한 대용량 공간데이타를 대상으로 수행하기 때문에 많은 비용과 시간이 필요하다. 특히, 클라이언트/서버 공간 데이터베이스 환경에서는 클라이언트가 자주 이용하는 질의를 반복하여 처리하는 경우에 서버의 부하가 증가되며 질의 응답시간도 길어지게 된다. 따라서 클라이언트/서버 공간 데이타베이스에서 클라이언트측의 공간질의를 효율적으로 처리하기 위해서는 데이터 캐싱 등의 기법이 필요하다. 이를 위하여 본 논문에서는 클라이언트에서 자주 이용되는 공간질의를 뷰로 정의하고 클라이언트에서 실체화하는 방법을 이용하여 데이터 캐싱을 처리한다. 그리고 클라이언트에 실체화된 뷰를 최대한으로 이용하기 위하여 질의 수정 기법을 적용한 공간질의 처리 방법을 제시한다.

  • PDF

Design of Query Reformulation System for Efficient Retrieval of XML Documents (효율적인 XML 검색을 위한 재질의 시스템 설계)

  • 정유나;황인준
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10a
    • /
    • pp.238-240
    • /
    • 2001
  • XML이 확산되면서 이를 저장하고 검색하는 XML DB와 검색 앤진들이 만들어졌다. 그러나, 이들 대부분의 시스템에서 초기 질의만으로 문서를 검색하고, 그 대상도 질의 조건에 완전히 정합되는 문서로만 제한하고 있다. 그러나, 사용자가 데이터에 대한 정확한 정보가 없는 경우에는 자신의 요구를 제대로 표현하기가 힘들고 또, 한번의 질의로 사용자 요구에 정확하게 부합되는 문서를 검색하기도 매우 어렵다. 따라서, 본 논문에서는 질의 조건에 부분적으로 정합되는 문서도 검색하고, 사용자 피드백을 받아서 조기 질의를 사용자 요구에 좀 더 근접만 문서들을 검색할 수 있도록 수정하여 재질의를 하는 시스템을 설계하였다.

  • PDF

Design and Implementation of an Unnesting Front-End for an OQL Query Optimizer (OQL 질의 처리기를 위한 중첩 질의 구조 제어용 전위 모듈의 설계와 구현)

  • 정승진;정진완;김형주
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10b
    • /
    • pp.36-38
    • /
    • 1998
  • 객체지향 데이터베이스 시스템의 표준 질의어로 사용되는 OQL은 SQL과 달리 select-from-where절 어디서나 중첩 질의를 자유롭게 허용하며, 이러한 중첩 질의는 질의어 수행 성능에 중요한 영향을 미치므로, OQL을 처리하는 질의 처리기에서는 이를 반드시 고려해 주어야 한다. 본 논문은 모노이드 컴프리핸션 해석(monoid comprehension calculus)을 이용하여, OQL 질의 처리기에서 중첩 질의의 중첩 구조를 제거할 수 있도록 해주고, 나아가 기존 질의 처리기에서 중첩질의 처리 기능을 추가하는데 있어, 이미 구현되어 있는 질의 최적화 모듈과 질의 수행 모듈의 수정을 최소화할 수 있는 중첩 질의 구조 제거용 전위 모듈(unnesting front-end)을 설계하고 구현하였다.

Apache Storm based Query Filtering System for Multivariate Data Streams (다변량 데이터 스트림을 위한 아파치 스톰 기반 질의 필터링 시스템)

  • Kim, Youngkuk;Son, Siwoon;Moon, Yang-Sae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.10a
    • /
    • pp.561-564
    • /
    • 2018
  • 최근 빠르게 발생하는 빅데이터 스트림이 다양한 분야에서 활용되고 있다. 이러한 빅데이터 전체를 수집하고 처리하는 것은 매우 비경제적이므로, 데이터 스트림 중 필요한 데이터를 걸러내는 필터링 과정이 필요하다. 본 논문에서는 아파치 스톰(Apache Storm)을 사용하여 데이터 스트림의 질의 필터링 시스템을 구축한다. 스톰은 대용량 데이터 스트림을 처리하기 위한 실시간 분산 병렬 처리 프레임워크이다. 하지만, 스톰은 입력 데이터 구조나 알고리즘 변경 시, 코드의 수정과 재배포, 재시작 등이 필요하다. 따라서, 본 논문에서는 이 같은 문제를 해결하기 위해 아파치 카프카(Apache Kafka)를 사용하여 데이터 수집 모듈과 스톰의 처리 모듈을 분리함으로써 시스템의 가용성을 크게 높인다. 또한, 시스템을 웹 기반 클라이언트-서버 모델로 구현하여 사용자가 언제 어디에서든 질의 필터링 시스템을 사용할 수 있게 하며, 웹 클라이언트를 통해 입력한 질의를 자동적 분석하는 쿼리 파서를 구현하여 별도의 프로그램의 수정 없이 질의 필터링을 적용할 수 있다.

Improved Query Method for Contents-Based Image Retrieval (내용 기반 영상 검색을 위한 개선된 질의 방법)

  • 임미영;김형준;김경수;김희정;하명환;정병희;김회율
    • Proceedings of the IEEK Conference
    • /
    • 2003.07d
    • /
    • pp.1665-1668
    • /
    • 2003
  • 디지털 컨텐츠의 증가에 따라 이들의 효율적인 검색과 관리를 위하여 내용 기반 영상 검색에 관한 많은 연구가 이루어지고 있다. 이러한 내용기반 영상 검색의 질의 방법으로는 유사한 영상을 질의로 사용하는 QBE와 영상을 사용자가 직접 스케치하여 질의에 사용하는 QBS 가 대표적이다. 본 논문에서는 질의로 사용할 정확한 영상을 가지고 있어야 하는 QBE 방법의 제약과 질의할 영상의 전체를 스케치해야 하는 QBS 의 문제점을 보완하는 개선된 질의 방법을 제안한다 제안하는 방법은 입력 영상의 단순화를 통해 스케치에 사용할 밑그림을 제공하고 사용자가 간단한 수정을 거쳐 질의 영상을 얻을 수 있도록 하는 방법으로 기존의 질의 방법을 개선하여 사용자의 편리성을 향상시킨다.

  • PDF

Instruction System Implementation based on Learning Technology Standard Architecture for Question Answer Learning Tool (QALT지원을 위한 LTSA기반의 교육 시스템 구현)

  • 김정수;신호준;한은주;김행곤
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.709-711
    • /
    • 2002
  • 웹 기반의 교육의 활성화로 이를 학습에 응용하기 위한 노력으로 GVA(Global Virtual Academy) 등과 같은 학습 보조 도구가 많이 발표하고 있는 설정이다. 대부분의 학습 보조 도구들은 각각의 특성들만 제시할 뿐 통합된 표준호가 되어 있지 않다. 최근 가상교육에서 학습기술이 상호운용성에 기반한 표준화의 일반적인 필요성을 인식하게 됨에 다라 가상교육의 국제표준을 소개하고 체계적으로 AICC(Aviation Industry CBT Committee), IMS Global Learning Consortium, ADL(Advanced Distributed Learning)을 중심으로 진행되어 오고 있다. 웹 기반의 교육을 통한 질의 응답의 학습방법을 고려한 도구가 없으므로 질의 응답 학습 도구(QALT)지원을 위한 표준화된 LTSA(Learning Technology Standard Architecture) 기반 시스템을 학습 객체에 대한 질의 응답과 개방형 단순 질의 응답 측면으로 구현한다. 그러므로 개방형 단순 질의 응답 측면을 구현하기 위해 학습 기술의 표준화로 제시되어 있는 LOM(Learning Object Metadata)을 통해 설계 자체를 체계화하고 전체적으로 명세 작업을 가능하게 하여 일관성을 유지하는 정련화된 문서로 질의 응답할 수 있도록 한다. 또한, Web 상에서의 Network delivery와 DTD(Document Type Definition)와 Stylesheet를 사용자가 쉽게 수정 가능하며 다양한 Linking Type을 제공하므로 단순 질의 응답 문서의 형식을 XML로 한다

  • PDF

Implementation of a Question Type Classification System using Keyword Patterns (키워드 패턴을 이용한 질의유형 분류 시스템 구현)

  • Ahn, Hyeokju;Kim, MinKyoung;Kim, Harksoo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.04a
    • /
    • pp.813-815
    • /
    • 2015
  • 질의응답 시스템에서 정답선택의 정확률을 향상시키기 위해 본 논문은 패턴과 휴리스틱을 기반으로 하는 질의유형 추출 시스템을 구현하는 방법을 제안한다. 질의유형은 DBPedia에서 사용하는 클래스타입을 기반으로 추출되며 질의유형에 포함하는 키워드패턴들을 수집하여 키워드패턴 데이터를 생성한다. 그 후 한국어 질의에서 많이 발생하는 유형을 분석하여 휴리스틱을 이용해 사용자가 의도한 질의 유형을 출력한다. 제안시스템은 기존 연구에 비해 구축과 수정이 쉽다는 장점이 있다.