• 제목/요약/키워드: 질의재구성

검색결과 94건 처리시간 0.038초

메타데이타와 텍스트 정보의 통합검색 모델 (A Hybrid Information Retrieval Model Using Metadata and Text)

  • 유정목;맹성현;김성수;이만호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권3호
    • /
    • pp.232-243
    • /
    • 2007
  • 메타데이타를 위한 검색모델은 질의에 사용자의 정보요구를 정확하게 반영하기 때문에 정확율(precision)은 높지만 질의 조건에 만족하지 않는 정보를 배제하므로 재현율(recall)은 낮다. 반면 전문(full-text) 텍스트 검색 모델은 사용자 질의에 대하여 모든 문서를 검색대상으로 하므로 정확율은 낮고 재현율은 높다. 메타데이타 검색모델의 높은 정확율은 사용자가 메타데이타의 구조적 특성에 맞게 질의를 구성할 경우 가능하지만 일반적으로 사용자가 메타데이타의 구조 정보를 반영한 사용자 질의를 구성할 수 있다고 기대하기는 어렵다. 또한 메타데이타에 포함된 정보의 양은 전문 텍스트가 가진 정보의 양보다 적기 때문에 텍스트를 검색한 결과보다 재현율이 떨어진다. 본 논문에서는 이러한 특성을 반영하여 메타데이타 검색 시, 사용자의 다양한 질의를 메타데이타의 특성에 맞게 재구성하고 메타데이타뿐 아니라 텍스트에 대해서도 검색을 수행하여 두 모델의 장점을 함께 고려한 통합 검색 모델을 제안한다.

공간 데이터 웨어하우스에서 부분 색인 전송을 이용한 효율적인 색인 재구성 기법 (An Efficient Method of the Index Reorganization using Partial Index Transfer in Spatial Data Warehouses)

  • 정영철;유병섭;박순영;이재동;배해영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.39-42
    • /
    • 2005
  • 공간 데이터 웨어하우스 구축기는 소스 데이터의 변경 사항을 일괄처리의 형태로 공간 데이터 웨어하우스에 적재한다. 또한, 공간 데이터 웨어하우스 서버는 사용자의 질의에 빠른 응답을 하기위해 적재된 데이터로 색인을 구축한다. 색인을 구성하는 기존 기법으로는 벌크 삽입 기법 및 색인 전송 기법이 있다. 벌크 삽입 기법은 색인을 구성하기 위한 클러스터링 비용이 필요하며 검색 성능도 떨어진다. 또한, 색인 전송 기법은 주기적인 소스 데이터의 변경을 지원하지 않는다는 문제점이 있다. 본 논문에서는 이와 같은 문제점을 해결하기 위해 공간 데이터 웨어하우스에서 부분 색인 전송을 이용한 효율적인 색인 재구성 기법을 제안한다. 제안 기법은 구축기에서 색인의 구조에 맞게 클러스터링된 클러스터들을 부분 색인으로 구성하여 페이지 단위로 전송한다. 공간 데이터 웨어하우스 서버에서는 전송된 부분 색인의 물리적 사상 문제를 해결하기 위해 물리적으로 연속된 공간을 예약하고 예약된 공간에 부분 색인을 기록한다. 기록된 부분 색인은 공간 데이터 웨어하우스 서버에 있던 기존 색인에 삽입된다. 부분 색인이 기존 색인에 직접 삽입됨으로써 색인 재구성을 위한 검색, 분할, 재조정 비용은 최소가 된다.

  • PDF

웹에서의 XML 질의 캐쉬 기법 (Techniques of XML Query Caching on the Web)

  • 박대성;강현철
    • 한국전자거래학회지
    • /
    • 제11권1호
    • /
    • pp.1-23
    • /
    • 2006
  • e-Commerce와 같은 응용 등에 의해 점에서 XML데이터의 양이 많아짐에 따라 XML질의 처리를 신속하게 해주는 기술이 필요하게 되었다. 이를 가능하게 해주는 것이 XML질의 캐슁이다. 자주 제기되는 질의에 대하여 질의 결과를 캐쉬한 후, 동일 질의에 재사용 함으로써 빠른 응답 시간을 보장할 수 있다. 본 논문에서는 XML 질의 결과의 포맷으로 가장 보편적으로 사용되고 있는 노드 식별자 집합(NIS)을 캐쉬하여 XML 질의 성능을 향상시키는 기법을 제안한다. 캐쉬되는 NIS는 질의 결과를 구성하는 소스 XML 엘리먼트들의 식별자 집합이다. 따라서 NIS는 질의 결과의 재구성, 변형, 다른 데이터와의 통합 등 정 응용의 데이터 검색 요건을 충족시키기에 적절하고, XML 소스의 변경에 따른 점진적 갱신에 효율적이다. 그러나 XML문서 형태로 질의 결과를 반환해야 할 경우에는 소스 XML 엘리먼트를 검색하는 실체화 과정을 필요로 한다. 본 논문에서는 세 가지의 서로 다른 NIS의 구성을 고려하여 이들의 생성, 실체화. 점진적 갱신 알고리즘을 제안하고 RD BMS를 이용하여 구현하였다. 다양한 실험을 통한 성능 평가 결과 본 논문에서 제시하는 XML질의 캐쉬 기병의 효율성을 확확하였다.

  • PDF

소수 레이블을 이용한 RDF/RDFS 인덱스 구조 (Indexing Scheme for RDF/RDFS using Prime Number Label)

  • 김선영;권동섭;이석호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.82-84
    • /
    • 2005
  • 시맨틱 웹의 등장에 따라 RDF와 RDF Schema(RDF/RDFS)로 표현되는 웹 데이타의 양이 증가하고 있다. 이에 웹 데이타를 효율적으로 저장, 검색할 수 있는 인덱스 구조의 필요성이 높아지고 있다. 본 연구에서는 기존의 트리 모델을 위한 소수 레이블 기법(prime number labeling scheme)을 발전시켜, RDF/RDFS 인덱스 구조를 표현할 수 있는 그래프 모델을 위한 소수 레이블 기법을 제안한다. 제안한 기법은 기존의 소수 레이블 기법을 그래프에 적용하여 구조 질의(Structural Query)를 효율적으로 처리할 수 있고, 데이타 갱신 시에 인덱스를 재구성하지 않아도 되는 장점을 가지고 있다. 그리고 이전의 RDF/RDFS 인덱스 구조에서 효율적으로 처리하기 힘들었던 순환 방향성 그래프에 대한 질의도 쉴게 처리할 수 있다.

  • PDF

데이터 웨어하우스의 성장에 따른 문제 해결을 위한 개선된 메타데이타 모델 (Enhanced Metadata Model for Growing Data)

  • 박석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (1)
    • /
    • pp.386-388
    • /
    • 1998
  • 본 논문에서는 필드의 추가, 삭제에 의해 데이터 큐브의 확장과 서로 다른 시간구간의 뷰가 존재함을 밝히고 이에 따른 두 가지 문제점을 제안한다. 첫째 새로 추가된 필드에 따라 이전 데이터를 변화할 것인가\ulcorner 둘째 필드의 추가로 불필요해진 실체화된 뷰를 계속 유지할 것인가\ulcorner 이를 해결하기 위해 메타데이타를 통하여 데이터 큐브의 재구성이나 불필요한 뷰의 실체와 없이 다른 시간구간의 실체화된 뷰를 효과적으로 사용하는 기법을 제안한다. 본 논문에서 제안한 기법은 시간 축을 고려함으로써 데이터 큐브의 격자구조를 따라 의존관계의 뷰들을 부분적으로 사용하고 결과를 결합하는 방식이다. 성능평가를 통하여 데이터 웨어하우스의 변화 시 기존의 기법보다 좋은 질의처리 성능을 가짐을 보인다. 보다 빠른 질의처리를 위하여 데이터 큐브를 사용하고, 큐브를 구성하는 뷰들을 실체화 한다. 하지만 새로운 필드의 추가나 삭제와 같은 데이터 웨어하우스의 변화, 성장에 의해 구조변화 등의 문제가 발생하고, 이에 대하여 적절해 대응할 필요가 있다.

임베디드 리눅스 기반 UPnP AV 미디어 서버의 구현 (Implementation of UPnP AV Media Server Based on a Embedded Linux)

  • 이동훈;배수영;조창식;마평수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 추계학술발표논문집(상)
    • /
    • pp.183-186
    • /
    • 2004
  • UPnP 미디어 서버는 UPnP AV 아키텍처에서 컨트롤 포인터에게 서버와 서버에 저장되어 있는 컨텐츠에 대한 정보를 제공하기 위해서 구현되는 미들웨어이다. 보아 서버와 MPlayer로 구현되는 스트리밍 환경에서 UPnP AV 아키텍처는 각 디바이스를 발견하고 정보와 서비스를 질의하며 스트리밍 서비스를 설정하고 제어할 수 있는 기능을 제공한다. 본 논문에서의 UPnP 미디어 서버는 리눅스 셋탑 환경에서 동작하며, 서비스를 제공하는 AV 컨텐츠에 대한 정보를 제공하고 질의를 처리하기 위한 컨텐츠 디렉토리(Content Directory) 서비스와 미디어 서버, 타겟 디바이스 사이에서 전송 프로토콜과 데이터 포맷을 조율하기 위한 커넥션 메니저 (Connection Manager) 서비스를 구현하였다. 미디어 서버는 XML 기반의 DIDL로 기술된 메타 데이터를 이용하여 서버의 컨텐츠 정보를 관리하며, 컨트롤 포인터의 요청을 맞게 정보를 재구성하여 전달한다.

  • PDF

이동체 데이터베이스를 위한 R-tree 기반의 메인 메모리 색인 (Main Memory Index Based on R-tree for Moving Object Databases)

  • 이창우;안경환;홍봉희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.40-42
    • /
    • 2003
  • 최근에는 물류 및 수송 관리, 교통 정보 서비스 등과 같은 위치 기반 서비스의 요구가 증대되고 있다. 위치 기반 서비스에서 클라이언트들의 빈번한 보고 데이터를 처리하기 위해서는 서버에서 메인 메모리 DBMS를 유지하는 것이 필요하다. 그러나 기존 연구에서는 이러한 이동체 데이터베이스를 위한 메인 메모리 색인이 없으므로 이에 적합한 색인이 필요하다. 다차원 색인으로 영역 질의에 뛰어난 성능을 보이는 색인으로 R-tree가 있는데, 이는 디스크 환경을 고려하여 설계되었기 때문에 메인 메모리에서는 효율을 보장하지 못한다. 이 논문에서는 R-tree를 변형하여 이동체 데이터베이스를 위한 메인 메모리 색인을 제시한다. 이 논문에서 새로 제시한 성장 노드 구조와 동적 재구성 및 큰 영역을 가진 노드 분할 정책은 영역 질의의 성능을 향상시킨다. 실험은 제안한 색인이 이동체 데이터베이스를 위한 적합한 메인 메모리 구조임을 보여준다.

  • PDF

User Interface 기반 스크립트 설계를 통한 대화형 에이전트의 지식 표현 (Knowledge Representation of Conversational Agent using Script Design based on User Interface)

  • 김경민;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.427-729
    • /
    • 2003
  • 인터넷의 사용이 보편화됨에 따라 빠르게 변화하는 사용자의 요구를 만족시킴과 동시에 편리하고 유용한 서비스를 제공하기 위하여 사용자와 자연스럽게 의사소통할 수 있는 대화형 에이전트의 연구가 활발히 진행되고 있다. 그러나 현재 상용되고 있는 대부분의 대화형 에이전트들은 도메인 제한적 정보만을 제공하는 경향이 있어 도메인 변경의 경우 스크립트에서부터 새롭게 설계해야 하는 이중 부담을 겪고 있다. 본 논문에서는 스크립트 설계자가 특별한 사전 지식 없이도 간단한 입력 절차만 거쳐 자동으로 스크립트를 재구성할 수 있는 스크립트 인터페이스 구현에 초점을 맞춘다. 이 때 자연어로 입력되는 사용자 질의의 다양한 어휘들을 자동으로 대표 언어로 변환시킬 수 있도록 온톨로지 개념을 도입하여 동의어 사전을 구축함으로써 시스템의 효율성을 극대화한다. 또한 질의에 대한 다양한 답변 생성을 가능하게 하며, 실제 의류 사이트를 안내하는 대화형 에이전트를 구현하여 적용해 봄으로써 그 가능성을 알아본다.

  • PDF

바다-II에서 XML관리자의 설계와 구현 (Design and Implementation of an XML Manager for BADA-11)

  • 차명훈;박영철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.7-9
    • /
    • 2002
  • XML 문서를 관계형 데이타베이스에 저장하는 것은 관계형 데이타베이스 관리 시스템이 제공하는 안정성과 질의 능력을 활용하고자 하는 것이 주된 요인이다. 관계형 데이타베이스는 2차원의 테이블 구조를 저장하고 응용하는 것에 특화되어 있으므로 XML 문서에 표현되어 있는 계층적 구조, 중첩 구조 등 이질적인 요소들을 관계형 데이타베이스에 반영하는 모델링 방법으로 현재가지 완벽하게 실용화된 것은 없다. 본 논문은 XML 문서를 관계형 데이타베이스에 저장하기 위한 스키마 구조를 제안하고 XML 문서를 바다 -II에 저장, 검색, 재구성만 구현 결과를 제시한다.

  • PDF

DSS 시스템을 위한 BOSS 알고리즘 연구 (A Study of BOSS Algorithm for DSS System)

  • 박영철;임중수
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2006년도 춘계학술발표논문집
    • /
    • pp.394-396
    • /
    • 2006
  • 본 논문은 새로운 영상 압축 알고리즘 BOSS (Block-Based Object Selection System) 을 제안한다. 본 알고리즘은 디지털 감시시스템 (Digital Surveillance System: DSS)을 위한 영상 압축 부호화 기법으로서 영역분할을 통해 Macro block 단위로 물체 영역과 배경영역을 재구성해서 부호화에 이용하는 방식이다. 제안된 알고리즘은 매우 효율적인 압축 성능을 보여주며, 저 전송률 상황에서도 높은 질의 영상을 복원할 수 있다.

  • PDF