Odysseus/m: a High-Performance ORDBMS Tightly-Coupled with IR Features

오디세우스/IR: 정보 검색 기능과 밀결합된 고성능 객체 관계형 DBMS

  • 황규영 (한국과학기술원 전산학과/첨단정보기술연구센터) ;
  • 이민재 (한국과학기술원 전산학과/첨단정보기술연구센터) ;
  • 이재길 (한국과학기술원 전산학과/첨단정보기술연구센터) ;
  • 김민수 (한국과학기술원 전산학과/첨단정보기술연구센터) ;
  • 한욱신 (한국과학기술원 전산학과/첨단정보기술연구센터)
  • Published : 2005.06.01

Abstract

Conventional ORDBMS vendors provide extension mechanisms for adding user-defined types and functions to their own DBMSs. Here, the extension mechanisms are implemented using a high-level interface. We call this technique loose-coupling. The advantage of loose-coupling is that it is easy to implement. However, it is not preferable for implementing new data types and operations in large databases when high Performance is required. In this paper, we propose to use the notion of tight-coupling to satisfy this requirement. In tight-coupling, new data types and operations are integrated into the core of the DBMS engine. Thus, they are supported in a consistent manner with high performance. This tight-coupling architecture is being used to incorporate information retrieval(IR) features and spatial database features into the Odysseus/IR ORDBMS that has been under development at KAIST/AITrc. In this paper, we introduce Odysseus/IR and explain its tightly-coupled IR features (U.S. patented). We then demonstrate a web search engine that is capable of managing 20 million web pages in a non-parallel configuration using Odysseus/IR.

상용 ORDBMS 개발사들은 자신의 DBMS에 사용자 정의 타입과 사용자 정의 함수를 추가하는 확장 방법을 제공하고 있다. 이러한 확장은 상위 레벨 인터페이스를 사용하여 이루어진다. 이러한 기법을 소결합(loose-coupling)이라 부른다. 소결합의 장점은 구현하기 쉽다는 것이나, 높은 성능이 요구되는 대용량 데이타베이스에서 새로운 데이타 타입과 연산을 추가하기에는 적합하지 않다. 본 논문에서는, 이러한 요구 조건.을 충족하기 위해 밀결합(tight-coupling)이라는 개념을 사용하는 것을 제안한다. 밀결합에서 새로운 데이타 타입과 연산은 DBMS의 엔진 내부에 통합된다. 따라서, 새로운 데이타 타입과 연산이 높은 성능으로 일관성 있게 제공된다. 이 밀결합 아키텍처는 정보 검색 기능과 공간 데이타베이스 기능을 한국과학기술원/첨단정보기술연구센터에서 개발 중인 객체 관계형 DBMS 오디세우스/IR에 통합하기 위해 사용되고 있다. 본 논문에서는, 오디세우스/1R을 소개하고 오디세우스/IR과 밀결합된 정보 검색 기능(미국 특허 등록)을 설명한다. 다음으로, 오디세우스/1R을 사용한 단일 시스템(non-parallel) 설정에서 2,000만건의 웹 페이지를 관리할 수 있는 웹 검색 엔진을 보인다.

Keywords

References

  1. Sandhya, S. M., Enterprise Storage: Answer to Backup & Recovery Blues, Cyber India Online Ltd., 2001
  2. Banerjee, S., Krishnamurthy, V., and Murthy, R., All Your Data: The Oracle Extensibility Architecture, Oracle White Paper, Oracle Corp., Oracle Parkway, California, 1999
  3. Whang, K., 'Tight-Coupling: A Way of Building High-Performance Application Specific Engines,' Presented at the panel session of Int'l Conf. on Database Systems for Advanced Applications (DASFAA), Japan, Mar. 2003, available on-line from http://db-www.aist-nara.ac.jp/dasfaa2003/file/Prof_Kyu-Young_Whang_5.pdf
  4. Oracle, Oracle9i Data Cartridge Develope's Guide, 2002
  5. IBM, DB2 UDB Text Extender Administration and Programming, 2003
  6. Whang, K., Park, B., Han, W., and Lee, Y., 'An Inverted Index Storage Structure Using Subindexes and Large Objects for Tight Coupling of Information Retrieval with Database Management Systems,' U.S. Patent No. 6,349,308, Feb. 19, 2002, Appl. No. 09/250,487, Feb. 15, 1999
  7. Lee, J., Lee, Y, Whang, K., and Song, I., 'A Region Splitting Strategy for Physical Database Design of Multidimensional File Organizations,' In Proc. the 23rd Int'l Conf. on Very Large Data Bases, pp. 416-425, 1997
  8. Whang, K. and Krishnamurthy, R., Multilevel Grid Files, IBM Research Report RC 11516, 1985
  9. Biliris, A, 'The Performance Three Database Storage Structures for Managing Large Objects,' In Proc. Int'l Conf. on Management of Data, ACM SIGMOD, pp. 276-285, 1992 https://doi.org/10.1145/130283.130324
  10. Faloutsos, C., 'Access Methods for Text,' ACM Computing Surveys, Vol. 17, No.1, pp. 49-74, Mar. 1985 https://doi.org/10.1145/4078.4080
  11. Guo, L., Shao, F., Botev, C., and Shanmugasundaram, J., 'XRANK: Ranked Keyword Search over XML Documents,' In Proc. Int'l Conf. on Management of Data, ACM SIGMOD, pp. 16-27, 2003 https://doi.org/10.1145/872757.872762
  12. Halverson, A, Burger, J., Galanis, L., Kini, A, Krishnamurthy, R., Rao, A. N., Tian, F., Viglas, S., Wang, Y, Naughton, J. F., and DeWitt, D. J., 'Mixed Mode XML Query Processing,' In Proc. the 29th Int'l Conf. on Very Large Data Bases, pp. 225-236, 2003
  13. 이재길, 이민재, 김민수, 황규영, '오디세우스 객체관계형 DBMS를 사용한 사이트 제한 검색의 구현', 한국정보과학회 봄 학술발표논문집(A), pp. 752-754, 2003년 4월