• 제목/요약/키워드: XML Query Processing

검색결과 217건 처리시간 0.022초

단백질 모티프 예측 및 갱신 프로토 타입 구현 (Implementation of Prototype for a Protein Motif Prediction and Update)

  • 노기용;김원식;이범주;이상태;류근호
    • 정보처리학회논문지D
    • /
    • 제11D권4호
    • /
    • pp.845-854
    • /
    • 2004
  • 모티프 데이터베이스는 새롭게 등장하는 원시 단백질 서열의 기능 및 구조 예측에 사용된다. 이러한 모티프 데이터베이스들은 원시 단백질 서열의 빠른 성장과 더불어 급속한 이용 증가 추세를 보이고 있으며, 최근에 이르러 모티프 자원 통합에 관한 연구가 진행되고 있다. 그러나 이러한 모티프 데이터베이스들은 각기 개별적인 메소드로 개발되었기 때문에 각기 다른 형식의 검색 결과를 제공한다. 이러한 문제 해결을 위한 데이터베이스 통합에서는 데이터베이스 자동 갱신 문제, 복잡한 질의 처리 문제, 중복된 데이터베이스 엔트리 핸들링 문제, XML 지원 문제 등을 지니고 있다. 이 논문에서는 기존 문제점들을 해결하기 위하여 데이터베이스 자원 통합 방법론을 제안하였고, 통합된 데이터베이스의 주기적 갱신 방안과 XML로의 변환에 관하여 기술하였다. 아울러 구축된 통합 데이터베이스와 사례 데이터베이스를 비교 평가하였다.

사용자 프로파일에 기반한 전자 메일의 중요도 결정 (Decision Method of Importance of E-Mail based on User Profiles)

  • 이상곤
    • 정보처리학회논문지B
    • /
    • 제15B권5호
    • /
    • pp.493-500
    • /
    • 2008
  • 개인 통신 방법의 수단으로 전자 메일이 널리 사용되고 있으나, 업무에 직접 관련이 없는 쓸모없는 상업용 메일도 대량으로 유포되고 있다. 본 연구에서는 사용자가 작성한 프로파일을 이용하여 메일을 자동으로 그룹핑(grouping) 하는 방법을 제안하고자 한다. 기존의 연구 방법은 단어의 빈도수만을 이용하는 단일 속성을 이용하므로 높은 정확률을 얻을 수 없었다. 그러나 본 논문에서 제안하는 방법은 기존 사용자의 폴더에 수신된 메일의 분류 체계에서 추출된 사용자 프로파일을 이용하여 그룹핑 되는 메일의 정확률을 높이고자 한다. 본 논문에서 적극적으로 이용하는 정보는 다중 속성(송신처, 문서의 주제, 문서의 유형 정보, 시간제한 표현의 어구 등) 값이다. 사용자의 프로파일을 이용함으로써 새로 도착한 메일이 사용자에게 중요한가 혹은 중요하지 않은가의 자동 판단이 가능하도록 시스템을 설계하였다. 학습 데이터를 네 가지 형태로 나누어 실험한 결과 Rocchio와 Widrow-Hoff의 상관계수가 각각 0.40과 0.43인 것 보다 본 논문의 방법이 0.52로 보다 높은 상관계수를 나타내 빈도수만을 이용하는 기존의 연구보다 정확한 방법임을 알 수 있었다.

이동객체를 위한 질의처리 컴포넌트의 설계 및 구현 (Design and Implementation of Query Processor for Moving Objects)

  • 김경숙;권오제;변희영;조대수;김태완;이기준
    • 한국공간정보시스템학회 논문지
    • /
    • 제6권1호
    • /
    • pp.31-50
    • /
    • 2004
  • 무선통신망과 GPS(Global Positioning System)를 탑재한 모바일 단말기의 발달로 사람이나 사물의 위치정보를 파악하고 이용하는 위치기반 서비스의 영역이 확대되고 있다. 위치기반서비스와 같은 응용분야에서는 시간에 따라 연속적으로 움직이는 이동객체를 효율적으로 저장하고 처리할 수 있는 데이터베이스가 주요한 기술이다. 본 논문에서는 이동객체 데이터베이스를 개발하기 위한 하나의 서브시스템으로서, 이동객체에 대한 질의를 처리하기 위한 컴포넌트를 설계 및 개발한다. 이동객체에 대한 질의를 처리하기 위해서 대표적인 질의표현 및 처리방법을 조사하고, 기존에 개발된 이동객체에 대한 데이터모델과 연산자를 기반으로 SQL형태의 이동객체 질의어를 새로이 정의한다. 사용자는 본 연구에서 제공하는 이동객체 질의어를 이용하여 이동객체의 위치정보에 대한 영역질의, 위상질의, 궤적질의, 최근접질의 등을 표현할 수 있다. 이동객체 질의처리 컴포넌트는 각 질의 들을 분석한 후 이를 효율적으로 처리하기 위한 모듈들을 설계하고 구현한다. 또한, 다른 이동객체 응용시스템을 개발할 때 본 시스템의 활용을 높일 수 있도록 ADO.NET 인터페이스를 제공하고 XML을 이용하여 질의의 결과를 표현할 수 있는 기능을 제공한다.

  • PDF

최소 공간관계를 이용한 효율적인 이미지 검색 (Efficient Image Retrieval using Minimal Spatial Relationships)

  • 이수철;황인준;변광준
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권4호
    • /
    • pp.383-393
    • /
    • 2005
  • 멀티미디어 데이타베이스에서 이미지를 검색하기 위해 공간관계를 이용하는 것은 비주얼한 인터페이스 시스템을 통해서 효율적으로 수행할 수 있다. 시스템에서 이미지의 객체들은 2D 스트링으로 표현되고, 이것은 이미지 내의 객체를 추상화 하는 방법으로 객체의 심볼릭 프로젝션을 통해서 생성된다. 그러나 2D 스트링 표현기법을 이용한 이미지 객체간의 공간관계는 정확하지 않기 때문에 3D 이미지를 검색할 때 정확도가 떨어진다. 이러한 문제점을 해결하기위해 본 논문에서는 3D 이미지를 위한 공간 연산자를 이용한 공간관계를 제안하고, 이미지의 공간관계에서 중복되는 부분을 제거하기 위해 여러 가지 추론규칙을 이용한다. 이러한 규칙을 기반으로 하는 추론기법은 내용을 이용해 이미지를 검색할 때 질의 처리 시스템에서 사용되고, 기존의 방법보다 정확도와 융통성이 높다.

Score Image Retrieval to Inaccurate OMR performance

  • Kim, Haekwang
    • 방송공학회논문지
    • /
    • 제26권7호
    • /
    • pp.838-843
    • /
    • 2021
  • This paper presents an algorithm for effective retrieval of score information to an input score image. The originality of the proposed algorithm is that it is designed to be robust to recognition errors by an OMR (Optical Music Recognition), while existing methods such as pitch histogram requires error induced OMR result be corrected before retrieval process. This approach helps people to retrieve score without training on music score for error correction. OMR takes a score image as input, recognizes musical symbols, and produces structural symbolic notation of the score as output, for example, in MusicXML format. Among the musical symbols on a score, it is observed that filled noteheads are rarely detected with errors with its simple black filled round shape for OMR processing. Barlines that separate measures also strong to OMR errors with its long uniform length vertical line characteristic. The proposed algorithm consists of a descriptor for a score and a similarity measure between a query score and a reference score. The descriptor is based on note-count, the number of filled noteheads in a measure. Each part of a score is represented by a sequence of note-count numbers. The descriptor is an n-gram sequence of the note-count sequence. Simulation results show that the proposed algorithm works successfully to a certain degree in score image-based retrieval for an erroneous OMR output.

효율적인 ROLAP 큐브 생성 방법 (An Efficient ROLAP Cube Generation Scheme)

  • 김명;송지숙
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권2호
    • /
    • pp.99-109
    • /
    • 2002
  • ROLAP(Relational Online Analytical Processing)은 다차원적 데이타 분석을 위한 제반 기술로써, 전사적 데이타 웨어하우스로부터 고부가가치를 창출하는데 필수적인 기술이다. 질의처리 성능을 높이기 위해서 대부분의 ROLAP 시스템들은 집계 테이블들을 미리 계산해 둔다. 이를 큐브 생성이라고 하며, 이 과정에서 기존의 방법들은 데이타를 여러 차례 정렬해야 하고 이는 큐브 생성의 성능을 저하시키는 큰 요인이다. (1)은 MOLAP 큐브 생성 알고리즘을 통해 간접적으로 ROLAP 큐브를 생성하는 것이 훨씬 빠르다는 것을 보였다. 본 연구에서도 MOLAP 큐브 생성 알고리즘을 사용한 신속하고 확장적인 ROLAP 큐브 생성 알고리즘을 제시하였다. 분석할 입력 사실 테이블을 적절하게 조각내어 메모리 효율을 높였고, 집계 테이블들을 최소 부모 집계 테이블로부터 생성하도록 하여 큐브 생성 시간을 단축하였다. 제안한 방법의 효율성은 실험을 통해 검증하였다.

SSQUSAR : Apache Spark SQL을 이용한 대용량 정성 공간 추론기 (SSQUSAR : A Large-Scale Qualitative Spatial Reasoner Using Apache Spark SQL)

  • 김종훈;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권2호
    • /
    • pp.103-116
    • /
    • 2017
  • 본 논문에서는 Apache Spark SQL을 이용하여 임의의 두 공간 객체들 간의 위상 관계와 방향 관계를 나타내는 새로운 정성 공간 지식을 효율적으로 추론해내는 대용량 정성 공간 추론기의 설계와 구현에 대해 소개한다. Apache Spark SQL은 Hadoop 클러스터 컴퓨터 시스템에서 다양한 데이터들 간의 매우 효율적인 조인 연산과 질의 처리 기능을 제공하는 분산 병렬 프로그래밍 환경이다. 본 공간 추론기에서는 정성 공간 추론의 전체 과정을 지식 인코딩, 역 관계 추론, 동일 관계 추론, 이행 관계 추론, 관계 정제, 지식 디코딩 등 크게 총 6개의 작업들로 나누고, 논리적 인과관계와 계산 효율성을 고려하여 작업들 간의 처리 순서를 결정하였다. 지식 인코딩 작업에서는 추론의 전처리 과정으로서 XML/RDF 형태의 입력 지식을 보다 간략한 내부 형태로 변환함으로써, 추론 대상인 지식 베이스의 크기를 축소시켰다. 일반적으로 이행 관계 추론 작업과 관계 정제 작업의 반복은 정성 공간 추론에 필요한 가장 많은 계산 시간과 기억 공간을 소모한다. 이 작업들을 효율화하기 위해 본 공간 추론기에서는 공간 추론에 필요한 최소한의 이접 관계들을 찾아내고, 이들을 기반으로 이행 관계 추론을 위한 조합표를 큰 폭으로 축소하고 관계 정제 작업도 최적화하였다. 대규모 벤치마킹 공간 지식 베이스를 이용한 실험을 통해, 본 논문에서 제안하는 대용량 정성 공간 추론기의 높은 추론 성능과 확장성을 확인하였다.