• Title/Summary/Keyword: 질의 처리기

Search Result 695, Processing Time 0.026 seconds

A Continuous Query Processing System for XML Stream Data (XML 스트림 데이터에 대한 연속 질의 처리 시스템)

  • Han Seungchul;Kang Hyunchul
    • The KIPS Transactions:PartD
    • /
    • v.11D no.7 s.96
    • /
    • pp.1375-1384
    • /
    • 2004
  • Streaming data processing is an area of interest with much research under way. There has been increasing attention on the demands for efficient processing of streaming data produced in the application areas such as monitoring and sensor network. We have developed a continuous query processing system for streaming data and evaluated its performance in this paper. XML, the standard for data exchange on the web, is used as the model for the streaming data and the XQuery appended with a time interval is adopted as the query language for expressing con-tinuous queries. In the proposed system, the result is produced through background processing and materialized for reute in subsequent query processing. Through a detailed set of performance experiments, we shoed the effectiveness of the proposed system.

The Design and Implementation of Automatic Query Term Refiner for Term Expansion/Restriction in Information Retrieval (정보검색에서 질의 용어 확장/한정을 위한 자동 질의 용어 정련기의 설계 및 구현)

  • Kang, Hyun-Su;Kang, Hyun-Kyu;Lee, Yong-Seok;Kim, Young-Sum
    • Annual Conference on Human and Language Technology
    • /
    • 1998.10c
    • /
    • pp.65-72
    • /
    • 1998
  • 인터넷 정보 검색에서 이용자들이 주로 사용하는 질의는 2-3개의 용어로 이루어진 짧은 질의이다. 또만 동음이의어를 갖는 용어를 사용하기도 한다. 짧은 질의를 처리하는 일반적인 방법은 시소러스[8]나 Wordnet[1]을 이용한 질의 확장이다. 그러나 시소러스나 Wordnet과 같은 지식 베이스는 구축하기가 용이하지 않으며, 도메인 종속적인 면과 단어의 회귀(sparseness) 문제를 극복하기 어려운 단점이 있다. 또한 동음이의어 용어로 인하여 검색의 정확성이 털어지는 문제점이 있다. 한편, 사용자의 질의를 주의 깊게 살펴보면, 질의로부터 관련 용어 분류 정보를 추출할 수 있다. 본 논문은 사용자의 질의가 관련 용어 분류 정보에 의해 유기적으로 관계를 가지고 있다는 사실에 기인하여 관련 용어 분류 정보에 따라 자동으로 용어 확장 및 한정을 수행하며 적절한 용어 가중치를 부여하는 자동 질의 용어 정련기를 제안한다. 자동 질의 용어 정련기는 용어의 확장, 한정 및 가중치 부여를 통하여 사용자의 정보 검색 요구를 명확히 하여 검색의 정확성을 향상시킨다.

  • PDF

An Extended SQL for Updating XML data (XML 데이터의 갱신을 지원하는 확장된 SQL)

  • 조영주;강지훈
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.82-84
    • /
    • 2002
  • XML은 자기 서술적인 표현 언어라는 중요한 장점을 가지고 있기 때문에 인터넷 관련 응용들에서 정보의 표현 및 문서 교환의 표준으로 빠른 속도로 자리잡아 가고 있다. 본 논문에서는 SQL에 XPath 표현 중 일부를 추가하여 SQL을 확장함으로써 XML 문서에 대한 질의를 가능하게 하였고, 또한 SQL의 CRUD(Create, Read. Update, Delete) 기능을 그대로 사용함으로써 XML 문서의 변경이 가능한 XML 질의를 위한 새롭게 확장된 SQL을 제안하였다. 그리고 폭 넓게 사용되고 있는 ORDBMS 환경에서 XML 색인 정보를 자동 생성 관리하는 XML 저장 관리기 및 확장된 SQL 처리기를 설계하고 구현하였다. 본 논문에서 제안하는 확장된 SQL 처리기는 XML 원문 자체의 보관을 원칙으로 하여 완벽한 문서 복구 등에 따르는 부담을 제거하였고, XML 저장 문서에 대한 원본성 및 무결성을 쉽게 유지할 수 있도록 하였으며, 색인 정보를 자동 생성 관리함으로써 파일 처리 시간과 XML 트리 운행 시간 및 XPath 파싱 처리 시간을 줄였다. 또한, “path”라는 키워드를 추가로 관리함으로써 ORDBMS 환경에서 XML 질의를 위한 SQL 변환 과정에서 PATH의 깊이 만큼 조인이 중첩되는 문제를 배제하여 조인이 발생할 가능성을 줄이는 방법을 제시하였다.

  • PDF

An Object Manager Interface for Object-Oriented Query Processing (객체지향 질의처리를 위한 객체관리기 인터페이스)

  • Lee, Yon-Sik;Chon, Byoung-Sil;Ryu, Keun-Ho
    • The Transactions of the Korea Information Processing Society
    • /
    • v.2 no.1
    • /
    • pp.1-11
    • /
    • 1995
  • Object-oriented database systems represent the complex data model of real- world and manage the complex data. An object manager handles the manipulation and access of all objects in object-oriented database management systems. In this paper, we not only propose the design rules of an object manager interface(OMI) which is specified the calling function and the semantics of an object manager for object-oriented query processing, but also implement the OMI based on the rules. The OMI implemented supports the independently developing environment of query processing and object management modules, and can be applicable to various applications, and also provides the efficient access method to users.

  • PDF

A Design and Implementation of XML Document Retrieval System Based on XQL supporting Web Publishing Framework (웹 출판 프레임워크를 지원하는 XQL기반 XML 문서 검색 시스템 설계 및 구현)

  • Moon, Jong-Hwan;Kim, Cheol-Won
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.10b
    • /
    • pp.1095-1098
    • /
    • 2001
  • 정보의 구조적 표현 가능하고 인터넷을 기반으로 하는 정보교환의 매개체로써 다양한 응용분야에 확산되고 있는 XML(extensible Markup Language)은 차세대 인터넷 전자문서 표준으로 주목받고 있다. 최근들어 기존 문서를 XML로 변환하거나 신규 문서를 XML로 작성하는 사례가 늘면서 대량의 XML문서가 생성되고 있으며 이에 따라 대량의 XML 문서를 효율적으로 검색하기 위한 XML 검색 시스템이 요구되어지고 있다. 본 논문에서는 내용기반, 구조기반, 속성기반 검색을 지원하는 XML 문서의 질의언어로 제안되어진 XQL과 XML 문서를 분석하는 문서 구조 처리기, 사용자 입력 질의를 실행하기 위한 질의 언어 처리기를 가지는 XML 문서검거 시스템을 제시하고 검색된 문서의 견과를 웹 출판 프레임워크(Web Publishing Framework) 인 Cocoon을 적용하여 다른 포맷의 문서로 전환 가능한 시스템을 설계 및 구현하였다.

  • PDF

A Study on the Types of Online Shopping Queries using Topic Modeling and Principal Components Analysis (토픽모델링과 주성분 분석을 활용한 온라인 쇼핑 검색 질의 유형 분류)

  • Kang, Hyeonah;Lim, Heuiseok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.11a
    • /
    • pp.765-768
    • /
    • 2020
  • 검색 질의 연구 분야의 대부분 선행 연구는 검색 질의 주제 분류에 집중되어 있으며 질의 자체에 대한 연구자의 정성적인 판단으로 분석되었다. 이는 검색 이후 클릭 된 문서를 고려하지 않고 진행되었다는 점과 분석 주제 및 활용 데이터가 제한적이라는 것에 한계가 있다. 이에 본 연구는 국내 대형 온라인쇼핑몰의 1년간의 검색로그를 활용하여 검색 질의와 검색 이후 조회한 문서명 정보를 기반으로 토픽모델링을 수행하여 검색 질의 주제를 정의하였다. 또한 검색 행동특성에 따른 주제별 성격을 정의하기 위하여 주성분 분석을 통해 주요 변수 추출 후 각 주제별 검색 행동특성을 분석하였다. 본 연구 결과는 효과적인 검색 서비스 구축 및 검색 시스템 개발에 기여 할 것으로 기대된다. 향후 연구로는 텍스트 분류기 모델링 실험을 통해 자동 분류 시스템을 구현할 수 있을 것이다.

The development of a document retrieval system using thesaurus and signature file (시소러스 및 요약화일을 이용한 문서 검색시스템)

  • Jeong, Sang-Cheol;Shin, Dong-Wook
    • Annual Conference on Human and Language Technology
    • /
    • 1994.11a
    • /
    • pp.400-408
    • /
    • 1994
  • 본 논문에서는 요약화일을 이용하여 복합명사를 효율적으로 처리하며 시소러스를 이용하여 검색하는 한글문서 검색시스템을 제안한다. 본 한글문서 검색 시스템은 한글문서를 대상으로 색인하는 자동색인기와 사용자의 질의를 받아 관련된 문서를 검색하는 검색기로 구성된다. 자동색인기는 우선 한글문서를 대상으로 최장일치 방법으로 명사들을 출출한 후 복합명사의 패턴을 분석하여 복합명사의 가능성이 높은 것들을 복합명사화한다. 두번째로 이들 복합명사들을 1+2SP 방식으로 코딩한 후 요약화일 방법을 이용하여 요약화일을 작성한다. 검색기는 사용자 질의어를 받아 명사들을 추출한 후 시소러스를 이용하여 질의어를 확장한다. 다음 확장된 질의어를 1+2SP 방식으로 코딩한 후 관련된 문서를 검색한다. 본 논문에서는 한국통신에서 만든 코퍼스를 이용하여 제안된 방법의 성능을 평가하였는데 복합명사 처리 및 시소러스 이용방식이 효율적임이 입증되었다. 또한 KAIST에서 개발한 문서검색 시스템보다 동일한 코퍼스로 실험하였을 경우 재현률 및 정확률이 $7{\sim}8%$ 정도 앞서 기존의 시스템보다도 성능이 우수하다는 것이 밝혀졌다.

  • PDF

A Recognition of Value Identifiers in Electonic Commerce System (전자거래 시스템에서 가격지정 연산자의 인식)

  • Kang, Seung-Shik
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.85-88
    • /
    • 1999
  • 전자거래 시스템에서 상품정보에 대한 자연언어 질의 문장은 상품명과 가격의 범위를 인식하는 것이 가장 중요한 요소이다. 가격의 범위를 인식하려면 가격 어휘와 가격지정어로 이루어진 가격범위 구문에 대한 별도의 처리 방법이 요구된다. 아라비아 숫자와 수사들로 구성된 가격어휘를 인식하는 수사어절 인식 알고리즘과 구문분석기를 이용하여 상품정보를 검색하는 질의 문장으로부터 상품명에 대한 가격의 범위를 인식하는 자연언어 질의어 처리 방법을 제안한다.

  • PDF

Design and Implementation of a Main-Memory Database System for Real-time Mobile GIS Application (실시간 모바일 GIS 응용 구축을 위한 주기억장치 데이터베이스 시스템 설계 및 구현)

  • Kang, Eun-Ho;Yun, Suk-Woo;Kim, Kyung-Chang
    • The KIPS Transactions:PartD
    • /
    • v.11D no.1
    • /
    • pp.11-22
    • /
    • 2004
  • As random access memory chip gets cheaper, it becomes affordable to realize main memory-based database systems. Consequently, reducing cache misses emerges as the most important issue in current main memory databases, in which CPU speeds have been increasing at 60% per year, compared to the memory speeds at 10% per you. In this paper, we design and implement a main-memory database system for real-time mobile GIS. Our system is composed of 5 modules: the interface manager provides the interface for PDA users; the memory data manager controls spatial and non-spatial data in main-memory using virtual memory techniques; the query manager processes spatial and non-spatial query : the index manager manages the MR-tree index for spatial data and the T-tree index for non-spatial index : the GIS server interface provides the interface with disk-based GIS. The MR-tree proposed propagates node splits upward only if one of the internal nodes on the insertion path has empty space. Thus, the internal nodes of the MR-tree are almost 100% full. Our experimental study shows that the two-dimensional MR-tree performs search up to 2.4 times faster than the ordinary R-tree. To use virtual memory techniques, the memory data manager uses page tables for spatial data, non- spatial data, T-tree and MR-tree. And, it uses indirect addressing techniques for fast reloading from disk.

A Design and Implementation of Spatial Database System Supporting Integrity maintenance Facility (무결성 유지 기능을 지원하는 공간 데이터베이스시스템의 설계 및 구현)

  • Lee, Young-Geol;Bae, Hae-Young
    • The Transactions of the Korea Information Processing Society
    • /
    • v.5 no.9
    • /
    • pp.2224-2232
    • /
    • 1998
  • 본 논문은 공간데이터와 비공간 데이터를 연계 처리하는 공간 데이터베이스 시스템에서 데이터의 의미적 무결성을 보장하는 확장된 공간 질의 처리 시스템의 구현에 대해 기술한다. 다양한 실세계의 지형 및 공간 정보를 모델링해야하는 지리정보 시스템은 공간 데이터베이스 시스템을 기반으로 구현되고 있다. 이러한 공간 데이터베이스 시스템에서 다루는 데이터는 단순 객체가 아닌 추상화된 복합 객체로 다양한 유도 데이터에 대한 의미적 무결성을 데이터베이스 시스템 내부에서 효율적으로 유지해야 하며 공간 데이터의 의미적 특성을 제약 조건의 형태로 표현할 수 있어야 한다. 본 논문에서는 공간 질의 처리기를 확장하기 위해 공간 데이터에 대한 무결성 정보를 술어 논리 형태로 표현할 수 있는 공간 제약 언어를 제안한다. 제안된 공간 제약 언어는 축약된 질의 트리 형태로 메타-데이터베이스에 저장하며 저장된 공간 제약 언어는 사용자의 질의에 대해 공간 데이터베이스의 일치성을 보장하는 정보로 사용된다.

  • PDF