• 제목/요약/키워드: 질의재구성

검색결과 94건 처리시간 0.021초

불리언 질의 구성 알고리즘의 시간복잡도 분석 (Time Complexity Analysis of Boolean Query Formulation Algorithms)

  • 김남호
    • 한국정보처리학회논문지
    • /
    • 제4권3호
    • /
    • pp.709-719
    • /
    • 1997
  • 알고리즘의 성능은 여러 측면에서 측정할 수 있다 하나의 질의 구성(Quvery Formulaiton)알고리즘이 개발되었다고 가정할때, 이 알고리즘 검색 성능의 효과과성 (재현율과 정확율)이 다른 알고리즘에 비해 우수하다하였도 질의 작성 시간적인 측면, 즉 효율성에서 다른 알고리즘에 뒤진다면 모든 면에서 우수하다고 평가하기 어렵다.본 연구에서는 질의나무(Query tree)라고 불리는 자동 질의 재구성 알고리즘과 다른 2개의 알고리즘(DNF method,Dilon's method)을 이론적 측면과 실시간 측정에 Sun SparcsStation 2를 이용하여 비교하여 보았다. 3가지 Test set 인 CACM,CISI,그리고 Medlars을 이용하여 실험한 질과 질의나무 알고리즘이 이론적, 실시간 측면 모두에서 가장빠른 알고리즘이라는 결과가 나왔다.

  • PDF

현재 및 미래 위치 처리를 위한 TPR-tree의 점진적 재구성 기법 (Incremental reorganization Policy of TPR-tree for Querying Predictive Positions)

  • 박동윤;김동현;홍봉희
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 한국공간정보시스템학회 2003년도 추계학술대회
    • /
    • pp.147-152
    • /
    • 2003
  • TPR-tree는 이동체의 위치 데이터에 대해 현재 및 미래 위치 질의를 지원하기 위하여 시간 함수 기반의 경계사각형(Sounding Rectangle)으로 이동체를 색인한다. 경계사각형의 각 축은 가장 빠른 속도로 이동하는 이동체의 속도 값을 이용하여 시간에 따라 확장한다. 경계사각형 영역의 확장으로 중복(overlap)이 심화되고 사장영역(dead space)이 커지는 문제가 있다. 따라서 시간이 지날수록 영역질의 시 성능이 떨어진다. 이 논문에서는 시간이 지남에 따라 발생하는 노드간의 심한 중복과 사장영역을 줄이기 위해 중복이 심한 두 개의 단말노드를 강제 합병하고 재분할하는 강제 합병 정책과 이동체의 삭제가 발생한 노드의 모든 이동체들을 강제적으로 재삽입하는 삭제노드 강제 재삽입 정책과 삭제가 발생한 노드와 중복되는 노드들의 이동체들을 강제적으로 재삽입하는 중복 노드 강제 재삽입 정책을 이용한다. 강제 합병 정책과 삭제 노드 강제 재삽입 정책, 그리고 중복 노드 강제 재삽입은 TPR-tree의 구조를 점진적으로 재구성하기 때문에 이동체의 현재 분포를 고려하여 색인 구조를 동적으로 개선하는 장점을 가진다.

  • PDF

자연어 질의 정보 검색 시스템의 비주제어 탐색 방법을 통한 성능 개선 (Improving the performance of natural language information retrieval system by using non-keyword search methods.)

  • 이승률;강현규;박세영;이상조
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1994년도 제6회 한글 및 한국어정보처리 학술대회
    • /
    • pp.374-377
    • /
    • 1994
  • 본 논문에서는 한글 문서 검색 시스템에서 자연어 질의어로 검색할경우, 질의어를 주제어와 참조어로 나누어 재구성하여 검색하는 방법을 제시하였다. 먼저 주제어로 전문검색을 하여 후보 카드들을 추출한 후 비주제어로 다시 본문 탐색을 하여 추출된 카드의 가중치를 재조정함으로써 카드추출의 정확성을 높였다. 이 논문에 제시된 방법의 실험은 한국전자통신연구소 언어정보연구실에서 개발한 멀티미디어 전자 백과 사전의 자연어 검색모듈에서 행하여 졌다. 이 방법으로 별다른 검색속도의 저하나, 저장공간의 추가가 없이 기존의 검색 방법에서보다 약 58%정도의 검색의 정확성이 올라갔다. 본 논문에서 제시한 검색의 방법은 여러가지 응용의 자연어 인터페이스에서 데이타를 검색하는 정보검색의 분야에 적용되어 정확성을 높일 수 있을 것이다.

  • PDF

확장 가능한 고가용 데이터 베이스에서 네트워크 비용을 줄이기 위한 변형된 분할기법 (A Modified Fragmentation Technique for Reducing Network Cost in A Scalable and Highly Available Clustered Database)

  • 유병섭;이충호;이재동;배해영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.193-195
    • /
    • 2002
  • 최근 근자상거래와 같은 웹 기반 응용프로그램에서는 높은 가용성과 확장성을 가지며 빠른 응답시간을 갖는 데이터베이스에 대한 필요성이 대두되고 있다. 이러한 요구에 대한 해결책의 하나로 비공유 구조의 클러스터 시스템을 구성하고 분활과 복제정책을 사용한다. 즉, 해쉬함수나 범위값에 의해 분할하여 여러 노드에 분산 시키고 서로 다른 노드에 마스터와 백업을 두어 가용성을 높이고 있다. 그러나 기존의 방법은 하나의 갱신 질의에 대해서 마스터와 백업에 각각 질의를 보내주어야 하고 온라인 확장시에는 모든 마스터와 백업의 데이터가 재구성되어야 하므로 네트워크 비용이 크다는 문제점이 있다. 따라서, 본 논문에서는 이러한 네트워크 비용을 줄이기 위한 변형된 분활 기법을 제안한다. 제안된 기법에서 마스터는 기존의 기법과 동일한 방법으로 저장하나 백업은 네트워크를 통해 지정된 노드로 포워딩을 하지 않고 질의를 받은 서버에 그대로 저장함으로써 클러스터를 구성하는 노드 사이에 통신 비용을 줄인다. 또한 온라인 확장에서는 기존의 기법과 달리 백업데이터는 같은 서버의 마스터데이터와 중복되는 것만 이동시킴으로써 데이터 이동비용을 줄이며, 전체 트랜잭션 처리량을 높인다.

  • PDF

SenDB: 무선 센서 네트워크용 질의 처리 시스템 (SenDB: Query Processing System for Wireless Sensor Network)

  • 김민규;김도혁;김태형
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (A)
    • /
    • pp.335-339
    • /
    • 2006
  • 자원 제약적인 무선 센서네트워크상에서 전송비용을 최대한 줄이기 위하여 데이터의 수집 및 처리를 분산된 형태로 처리하는 방법이 필수적이다. 또한 Declarative Query를 이용하여 다양한 질의를 표현하고 처리할 필요성이 있다. 센서네트워크 데이터베이스는 이와 밀접한 관련이 있고 본 논문에서는 기존의 센서네트워크 데이터베이스 시스템의 문제점을 분석해보고 해결책을 제안하고자 한다. 아울러 유한 상태 머신 기반의 실행모델을 이용하고 응용의 변화에 대처할 수 있게 동적 재구성 기능을 지원하도록 설계된 SenOS상에서 센서네트워크 질의 처리 시스템의 구조와 설계방법에 대하여 살펴보겠다.

  • PDF

로드 가능한 모듈 정책을 사용하는 SELinux의 성능 향상을 위한 정책 재구성 방법 (Policy Reorganization Method for Performance Improvements in SELinux using Loadable Module Policy)

  • 고재용;이상길;조경연;이철훈
    • 한국콘텐츠학회논문지
    • /
    • 제18권3호
    • /
    • pp.309-319
    • /
    • 2018
  • SELinux는 리눅스를 사용하는 다양한 시스템에서 시스템 레벨의 보안을 위해 사용되고 있으며, 현재 IoT와 같은 기기 보안에도 활용되고 있다. 하지만 SELinux 적용에는 실행시간 저하에 대한 이슈가 내재되어 있기에 이를 해결하기 위한 다양한 연구가 진행되어 왔다. 본 논문에서는 SELinux를 활용하는 일반적인 방법인 Loadable module policy 방법이 적용된 환경에서, 정책 재구성을 통해 성능 개선할 수 있음을 보인다. 타입에 우선순위를 부여하는 Priority-TE 정책을 통해 접근질의테이블을 재구성함으로써 성능상 더 빠른 접근 질의가 필요한 타입에 대하여 보다 빠른 수행시간을 제공할 수 있게 된다. SELinux의 정책 적용방법인 Monolithic 환경에서의 정책 구성 방법과의 차이점을 소개하고, 성능분석을 수행한다. 이는 보안 관리자나 개발자가 SELinux를 적용함에 있어 참고 자료로 사용될 수 있다.

구조적 중복을 사용한 XML 문서의 릴레이션으로의 분할저장 (Shredding XML Documents into Relations using Structural Redundancy)

  • 김재훈;박석
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권2호
    • /
    • pp.177-192
    • /
    • 2005
  • 본 논문에서는 XML 데이타를 릴레이션으로 분할 저장할 경우, 분할된 XML 데이타로부터 질의 결과 XML 문서를 재구성하는데 소모되는 질의 처리비용을 줄이기 위한 구조적 중복 방법을 소개한다. 기본 아이디어는 주어진 질의 패턴을 분석하여, 적절한 데이타들을 중복시킴으로서 질의 처리 성능을 향상시키는 것이다. 이러한 구조적 중복 방법으로 실질적으로 유효할 수 있는 ID, VALUE, SUBTREE의 세 가지 유형의 특성을 분석하였다. 본 논문에서는 추가적으로 주어진 XML 데이타와 질의들이 매우 크고 복잡할 경우 최적의 중복 집합을 팎는 것이 매우 어려운 작업이 될 수 있으므로, 이를 위한 경험적 탐색 방법을 소개한다. 마지막으로 몇 가지 실험을 통하여, 중복 데이타를 사용함으로 발생하는 XML 질의 처리비용과 제안된 탐색 방법의 효율성을 분석한다. 중복 데이타를 사용함으로 XML 판독 질의는 빨라지지만, XML 갱신 질의는 중복 데이타의 갱신 일관성 비용 때문에 느려지는 것은 당연하다. 하지만 실험 결과는 매우 과도한 갱신 비용의 경우에도 in-place ID 중복은 효율적이며, 갱신 비용이 매우 과도하지만 않다면 multiple-place SUBTREE 중복은 판독 질의 처리 성능을 크게 향상시킬 수 있음을 보여주었다.

XQuery에서의 XML 데이터 특성을 고려한 group by 지원을 위한 질의 표현 기법에 대한 연구 (Research on supporting the group by clause reflecting XML data characteristics in XQuery)

  • 이민수;조혜영;오정선;김윤미;송수경
    • 정보처리학회논문지D
    • /
    • 제13D권4호
    • /
    • pp.501-512
    • /
    • 2006
  • 현재 널리 채택되고 있는 XML은 플랫폼에 의존하지 않는 데이터 표현 형식으로 B2B 응용 프로그램이나 워크플로우 상황에서처럼 느슨하게 연결된(loosely coupled) 이기종 시스템 간에 정보를 교환하는 데 매우 유용하게 사용되고 있다. XML의 이러한 장점 때문에 점차 증가하는 XML에 대한 관리 및 검색에 대한 요구 사항에 대처할 수 있도록 강력한 질의 언어인 XQuery가 만들어졌다. 문서의 검색을 위한 질의 언어인 XQuery는 다양한 데이터 소스로부터 가져온 XML 데이터를 고유한 구조를 가진 질의 결과로 구성할 수 있도록 설계되었으며 현재 XML 질의 언어의 표준이다. XQuery는 반복문 등을 포함하는 강력한 검색 기능을 지원하나 데이터를 그룹화 하는 경우에는 질의 표현이 상대적으로 어렵고, 복잡한 형태를 취한다. 따라서 본 논문에서는 XQuery에 그룹화 처리를 위한 명시적인 groupby절을 도입한 질의 표현 기법을 모색함으로써 XML 데이터의 재구성과 집계 함수 처리를 위한 그룹화를 보다 효율적으로 처리할 수 있도록 하였다. 이를 위해서 XQuery에 groupby절을 도입하기 위한 EBNF(Extended Backus-Naur Form)를 제안하고, 네이티브 XML 데이터베이스인 eXist 기반의 XQuery 그룹화 질의 처리 시스템을 구현하였다.

퍼지 추론에 의한 자연언어 정보 검색 (Natural Language Information Retrieval by Fuzzy Inference)

  • 박현규;오종훈;김명호;최기선;이광형
    • 정보처리학회논문지B
    • /
    • 제8B권3호
    • /
    • pp.243-250
    • /
    • 2001
  • 인터넷 전자 상거래 시스템에서 주로 일어나는 정보 검색은 사용자의 상품정보 요구라고 할 수 있다. 이와 같이 사용자가 원하는 상품 정보를 웹 환경에서 검색하기 위해서는 편리한 검색 환경의 제공뿐만 아니라, 검색 성능의 효율성 또한 우수해야 한다. 인터넷 인구와 온라인 쇼핑몰의 급격한 증가로 인해 다양한 조건 검색에 의한 상품검색 요구가 증대되고 있다. 또한, 이러한 상품의 검색 결과는 사용자의 의도와 의미상으로 밀접한 관계를 가져야 한다. 자연언어 정보검색은 이러한 요구의 중요한 대안으로 대두되고 있으나, 자연언어 자체가 가지는 애매한 의미의 해석 등으로 인하여 상용 시스템에 적용하는데 많은 어려움이 있다. 본 논문에서는 이러한 문제점을 해결하기 위하여 퍼지추론을 이용한다. 입력된 자연언어 질의에서 형태소 분석을 통하여 데이터베이스 질의에 사용될 수 있는 의미어(content word)를 추출한 후, 의미어들을 재구성하여 템플릿을 작성한다. 작성된 템플릿은 퍼지 추론을 통하여 의미의 애매성을 해소하고 데이터베이스 질의로 변환하여 사용자의 질의 의도와 부합되는 검색 결과를 제시한다.

  • PDF

지역 질의 생성기반 전역 XQuery 질의 처리 기법 (A Global XQuery Query Processing based on Local XQuery Query Generation)

  • 박종현;박원익;김영국;강지훈
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권11호
    • /
    • pp.11-20
    • /
    • 2010
  • XML 뷰는 분산 환경에서 이종 데이터들을 XML 데이터처럼 바라보며 XML로 통합하기 위한 방법으로 제안되었으며, 전역 XML 뷰는 분산되어 있는 다양한 형태의 이종 데이터들을 단일의 XML 데이터처럼 바라보며 질의할 수 있도록한다. 이때사용자가 사용하는표준질의어는 XQuery이며, 전역XML 뷰를대상으로 작성된 질의가 바로 전역XQuery 질의이다. 그러므로이를효과적으로 처리하기위한방법은분산 환경에서이종데이터들사이의 통합 및 검색을 위한 연구의 주제이다. 기존 SQL 질의 처리에서 알 수 있는 것처럼, 분산 질의 처리를 위한 방법들 가운데 가장 범용적으로 사용되는 방법 중 하나는 전역 질의를 지역 질의로 분할하여 분할된 지역 질의들을 처리하고, 그 결과를 취하여 전역 질의의 결과로 재구성하는 것이다. 그러나 XQuery는 FOR 절과 같은 SQL 질의어에서는 찾아볼 수 없는 복잡한 구조적 특성을 갖는다. 그러므로 전역 XQuery 질의의 처리를 위해 지역 질의를 생성하기 위해서는 고려해야 할 사항들이 존재한다. 본 논문에서는 전역 SQL 질의 처리를 위한 지역 질의 생성 기법을 전역 XQuery 질의의 처리를 위해 적용할 때 발생하는 문제점을 정의하고 이를 해결하기 위한 방법을 제안한다. 또한, 제안한 방법을 기반으로 하는 전역 XQuery 질의 처리기를 구현하여 그 효율성을 보인다.