• 제목/요약/키워드: 질의 변환

검색결과 787건 처리시간 0.029초

관계형 DB에서 Local Order 방식을 이용한 XQuery 변환기 설계 및 구현 (XQuery transformer Using Local Order in Relational DB)

  • 이명숙;홍동권;손유익
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.137-140
    • /
    • 2005
  • 관계형 데이터베이스(RDBMS)의 내용을 XML로 표현하게 되면 지금까지 축적되어온 방대한 비즈니스 데이터들을 지속적으로 이용할 수 있게 된다. 다양한 형태로 저장된 XML 문서에서 원하는 데이터를 추출하고 변환하는 작업을 위해 W3C에서는 XPath를 핵심으로 하는 XQuery를 새로운 질의어 표준으로 발표하였다. RDBMS에 XQuery 질의어로는 구조가 다르기 때문에 질의어를 사용할 수가 없다. 따라서 본 논문에서는 XQuery 질의어로 RDBMS에서 검색이 가능하도록 XQuery 질의어를 SQL문장으로 변환시켜 검색할 수 있는 변환기를 설계하였다. 이 변환기는 복잡한 Numbering 기법을 사용하지 않고 child-parent relationship만 사용하므로 효율적인 데이터의 업데이트를 처리할 수 있다.

  • PDF

윈도우 제약 조건을 가지는 시간 왜곡 변환 기반 유사 시퀸스 검색 (Similar Sequence Searching under Time Warping with Window constraint)

  • 김인태;송병호;이석호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.214-216
    • /
    • 2001
  • 유사 시퀸스 검색에서 시간 왜곡 변환을 지원하기 위한 연구가 최근 활발히 이루어지고 있다. 음성 인식과 같은 몇몇 응용에서는 시간 왜곡 변환을 적용할 때 과도한 타이밍의 차이는 허용하지 않을 필요가 있다. 그래서 대부분의 경우 윈도우라는 제약 조건을 추가하게 된다. 이 논문에서는 윈도우 제약 조건이 있을 때 시간 왜곡 변환을 지원하는 유사 검색 방법으로 세그먼트 분할 기법(Segment Partition Approach:SFA)을 제안한다. SFA는 각 시퀸스를 세그먼트로 분할한 뒤 특징을 추출하여 다차원 인덱스를 구성한다. 유사 검색 질의를 수행할 때 이 인덱스를 검색하여 질의 시퀸스와 유사할 가능성이 큰 후보들을 빠르게 찾아낼 수 있고 찾아낸 후보들에 대해서만 정확한 시간 왜곡 변환 거리를 계산하기 때문에 전체 질의 처리 시간을 단축할 수 있다. SPA는 순차 검색에 비하여 좋은 성능을 보이며, 특히 거리 허용치가 작을 때 더욱 우수한 성능을 보인다.

  • PDF

XML 실체 뷰를 이용한 XQL 질의 변환 (Transformation of XQL Queries Using XML Materialized Views)

  • 김수희;문찬호;김영성;강현철;서상구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.9-11
    • /
    • 2000
  • XML과 관련하여 XML 문서의 구조적인 특징을 고려한 XML 질의에 관한 연구가 활발히 수행되고 있다. 이들 연구들은 하나의 XML 문서 또는 XML 저장소에 저장된 여러 XML 문서들을 대상으로 효과적인 검색을 위한 XML 질의 언어의 개발이나 확장을 중심으로 연구되고 있다. 한편 XML 문서 검색의 성능 향상을 위해서 XML 저장소에는 XML 문서들 외에 그들로부터 도출된 XML 뷰를 실체 뷰로 저장해 둘 수 있다. 본 논문에서는 XQL 질의의 결과로 얻어진 XML 실체 뷰가 있다고 가정하고 이를 이용한 XQL 질의 변환에 대해 연구하였다. 이를 위해 본 논문에서는 XML 실체 뷰 영역을 포함하는 XML 저장소의 구조를 설명하고, XQL 질의의 결과와 XML 실체 뷰 간의 포함 관계를 분류하며, 그에 따른 XQL 질의 변환 알고리즘을 제안한다.

  • PDF

시계열 데이터베이스에서 인덱스 보간법을 기반으로 정규화 변환을 지원하는 서브시퀀스 매칭 알고리즘 (An Index Interpolation-based Subsequence Matching Algorithm supporting Normalization Transform in Time-Series Databases)

  • 노웅기;김상욱;황규영
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권2호
    • /
    • pp.217-232
    • /
    • 2001
  • 본 논문에서는 시계열 데이터베이스에서 정규화 변환을 지원하는 서브시퀀스 매칭 알고리즘을 제안한다. 정규화 변환을 시계열 데이터 간의 절대적인 유클리드 거리에 관계 없이, 구성하는 값들의 상대적인 변화 추이가 유사한 패턴을 갖는 시계열 데이터를 검색하는 데에 유용하다. 기존의 서브시퀀스 매칭 알고리즘을 확장 없이 정규화 변환 서브시퀀스 매칭에 단순히 응용할 경우, 질의 결과로 반환되어야 할 서부시퀀스를 모두 찾아내지 못하는 착오 기각이 발생한다. 또한, 정규화 변환을 지원하는 기존의 전체 매칭 알고리즘의 경우, 모든 가능한 질의 시퀀스 길이 각각에 대하여 하나씩의 인덱스를 생성하여야 하므로, 저장 공간 및 데이터 시퀀스 삽입/삭제의 부담이 매우 심각하다. 본 논문에서는 인덱스 보간법을 이용하여 문제를 해결한다. 인덱스 보간법은 인덱스가 요구되는 모든 경우 중에서 적당한 간격의 일부에 대해서만 생성된 인덱스를 이용하며, 인덱스가 필요한 모든 경우에 대한 탐색을 수행하는 기법이다. 제안된 알고리즘은 몇 개의 질의 시퀀스 길이에 대해서만 각각 인덱스를 생성한 후, 이를 이용하여 모든 가능한 길이의 질의 시퀀스에 대해서 탐색을 수행한다. 이때, 착오 기각이 발생하지 않음을 증명한다. 제안된 알고리즘은 질의 시에 주어진 질의 시퀀스의 길이에 따라 생성되어 있는 인덱스 중에서 가장 적절한 것을 선택하여 탐색을 수행한다. 이때, 생성되어 있는 인덱스의 개수가 많을수록 탐색 성능이 향상된다. 필요에 따라 인덱스의 개수를 변화함으로써 탐색 성능과 저장 공간 간의 비율을 유연하게 조정할 수 있다. 질의 시퀀스의 길이 256 ~ 512중 다섯 개의 길이에 대해 인덱스를 생성하여 실험한 결과, 탐색 결과 선택률이 $10^{-2}$일 때 제안된 알고리즘의 탐색 성능이 순차 검색에 비하여 평균 2.40배, 선택률이 $10^{-5}$일 때 평균 14.6배 개선되었다. 제안된 알고리즘의 탐색 성능은 탐색 결과 선택률이 작아질수록 더욱 향상되므로, 실제 데이터베이스 응용에서의 효용성이 높다고 판단된다.

  • PDF

DTVF를 갖는 확장 R-tree 공간 색인 기법 (Extended R-tree Spatial Indexing Methods with DTVF)

  • 정원일;정보흥;박동선;김재홍;배해영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.228-230
    • /
    • 1999
  • 공간 인덱스를 이용한 공간 질의 처리의 과정은 여과와 정제 단계로 이뤄진다. 여과 단계에서 후보 객체의 수를 줄이며, 정제 단계에서의 false-hit이 낮아지므로 불필요한 디스크 접근과 공간연산으로 인한 질의 처리 비용의 증대를 방지할 수 있다. 본 논문에서는 여과 단계에서 후보 객체를 최소화하기 위해 DTVF가 추가된 확장 R-tree를 제안한다. 제안된 기법에서는 n차원 상에 존재하는 공간 객체의 대표 정점들을 구석점 변환 기법을 이용하여 2n차원의 점으로 변환하고, 이 값을 확장된 R-tree라는 리프 노드의 DTVF에 유지한다. 공간 질의 처리시 여과 단계에서 DTVF를 이용하면 후보 객체 수를 최소화할 수 있으며, DTVF에 유지된 차원 변환된 값을 통해 후보 객체 선정에도 빠른 성능을 나타낸다. 제안된 기법은 공간 질의 처리시 여과 효율을 극대화하여 질의 처리 성능을 향상시킨다.

  • PDF

한-일 교차언어검색에서의 질의 문맥 정보를 이용한 대역어 변환 확률 모델 (Query Context Information-Based Translation Models for Korean-Japanese Cross-Language Informal ion Retrieval)

  • 이규찬;강인수;나승훈;이종혁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2005년도 제17회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.97-104
    • /
    • 2005
  • 교차언어 검색 과정에서는 질의나 문서의 언어를 일치시키기 위한 변환 과정이 필수적이며, 이런 변환 과정에서 어휘의 중의성으로 인해 하나의 어휘에 대응하는 다수의 대역어가 생성됨으로써 사용자의 정보 욕구를 왜곡시켜 검색의 성능을 저하시킬 수 있다. 본 논문에서는 어휘 중의성 문제를 해결하기 위해서 질의의 문맥 정보를 이용하여 변환 질의의 확률을 구함으로써 중의성을 해소하는 방식을 제시하고, 질의의 길이, 중의도, 중의성을 가진 어휘의 비율 등에 따라서 성능이 어떻게 변하는지 비교함으로써 이 방법의 장점과 단점을 분석한다. 또한 현재의 단점을 보완하기 위한 차후 연구 방향을 제시한다.

  • PDF

데이터 웨어하우스에서 다차원 데이터를 위한 피벗 테이블의 효율적인 처리를 위한 관계 대수 변환 (Relational Algebra Query Transformation for Processing Efficiently Pivot Tables for Multi-dimensional Data in Data Warehouses)

  • 신성현;김진호;문양세
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.214-216
    • /
    • 2005
  • 데이터 웨어하우스에서는 데이터를 다양한 관점으로 분석하기 위해 데이터를 다차원 형태로 유지한다. 이 다차원 데이터를 간단하고 편리한 형태로 사용자에게 표현하기 위해 피벗 테이블이 이용된다. 피벗 테이블은 데이터에 대한 요약된 정보를 제공하는데 널리 사용되는 편리한 표현 방법이지만, 실제 값이 열의 제목으로 나오기 때문에 많은 개수의 열을 가질 수 있다. 이러한 피벗 테이블을 그대로 저장할 경우 관계 DBMS의 테이블 컬럼 수에 제약을 받게 되며, 데이터 저장 및 질의 처리에 성능이 떨어질 수 있다. 이 논문은 관계 데이터베이스의 테이블을 이용하여 피벗 테이블을 효율적으로 저장하는 방법을 제안한다. 이때, 피벗 테이블에 대한 질의물 저장된 형태의 테이블에 적용 가능하도록 질의를 변환시켜야 한다. 따라서 이 연구에서는 피벗 테이블에 대한 관계 연산자들(실렉션, 프로젝션, 합집합, 차집합 카디션 곱)을 효율적으로 변환하는 질의 변환 방범을 제안한다.

  • PDF

RFID 스트리밍 데이터 처리를 위한 연속 질의의 변환 기법 (A Transformation Scheme for Continuous Queries on RFID Streaming Data)

  • 박재관;홍봉희;반재훈
    • 정보처리학회논문지D
    • /
    • 제14D권3호
    • /
    • pp.273-284
    • /
    • 2007
  • RFID 미들웨어 시스템은 애플리케이션의 질의를 처리하기 위해서 다수의 RFID 판독기에 의해 지속적으로 인식되는 RFID 스트리밍 데이터를 수집 및 정제한다. 이러한 질의들은 미들웨어에서 일정기간 동안 수행되기 때문에 연속 질의라고 불린다. 미들웨어의 성능을 개선하기 위해서는, 이러한 연속 질의를 효과적으로 처리하기 위한 색인이 필수적이다. 최근, 데이터가 아닌 질의를 기반으로 색인을 구축하는 질의 색인 기법들이 제안되었으며 이러한 기법들은 이동체 위치 스트리밍 데이터 혹은 센서 스트리밍 데이터에 대하여 연속 질의를 처리하는 환경에서 향상된 성능을 보여준다. EPCglobal은 RFID 애플리케이션을 위한 표준 질의 인터페이스인 Event Cycle Specification (ECSpec)을 제안하였다. ECSpec 기반의 연속 질의는 질의의 조건을 대상 도메인 공간에 표현하면 다수의 세그먼트로 표현되는 특징이 있다. 이러한 RFID 질의 색인의 데이터에 대하여 기존의 질의 색인을 사용하면 다수의 데이터를 삽입해야 하기 때문에 색인을 구축 및 유지하기 위한 비용이 커지게 된다. 이러한 문제를 해결하기 위해서, 이 논문에서는 다수의 세그먼트를 새로운 변환공간으로 표현하고 이것을 결집하여 단일 데이터로써 표현하는 결집 변환(Aggregate Transformation) 기법을 제안한다. 또한, 기존 질의 색인과 변환 기법을 적용한 색인의 성능을 비교한다.

교차언어 문서검색에서 중의성 해소를 위한 가중치 부여 및 질의어 구조화 방법 (Weighting and Query Structuring Scheme for Disambiguation in CLTR)

  • 정의헌;권오욱;이종혁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.175-182
    • /
    • 2001
  • 본 논문은 사전에 기반한 질의변환 교차언어 문서검색에서, 대역어 중의성 문제를 해결하기 위한, 질의어 가중치 부여 및 구조화 방법을 제안한다. 제안하는 방법의 질의 변환 과정은 다음의 세 단계로 이루어진다. 첫째, 대역어 클러스터링을 통해 먼저 질의어 단어의 적합한 의미를 결정짓고, 둘째, 문맥정보와 지역정보를 이용하여 후보 대역어들간의 상호관계를 분석하며, 셋째, 각 후보 대역어들을 연결하여, 후보 질의어를 만들고 각각에 가중치를 부여하여 weighted Boolean 질의어로 생성하게 된다. 이를 통해, 단순하고 경제적이지만, 높은 성능을 낼 수 있는 사전에 의한 질의변환 교차언어 문서검색 방법을 제시하고자 한다.

  • PDF

관계 데이터베이스에서 XQuery 질의 처리 (Processing XQuery Queries in Relational Databases)

  • 신병주;진민;하경재
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.587-589
    • /
    • 2003
  • XML의 계층적 구조와 관계 데이터베이스의 평면적 구조가 일치하지 않기 때문에, 관계 데이터베이스에 저장된 XML 데이터에 대한 질의를 처리하여 XML 문서를 생성하기 위해서는 별도의 처리과정이 요구된다. 또한. 기존의 관계 데이터베이스가 XML 질의 언어를 지원하지 못하기 때문에 XML 질의 언어의 SQL로의 변환도 요구된다. 따라서. 몬 논문은 XQuery의 경로 표현식을 패스 테이블을 이용하여 SQL로 변환하여 데이터를 추출하고 뷰를 이용하여 평면적 구조로 저장된 XML 데이터를 계층적 구조인 XML 문서로 효과적으로 변환하여 태깅하는 방법을 제안하고, 이를 이용한 XML 질의 처리 시스템을 설계한다.

  • PDF