• 제목/요약/키워드: Query translation

검색결과 54건 처리시간 0.031초

XQuery SQL:2003 번역기 설계 및 구현 (Design and Implementation of a Translator form XQuery to SQL : 2003)

  • 김송현;박영섭;이윤준
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권7호
    • /
    • pp.668-681
    • /
    • 2006
  • XML은 다양한 장점으로 인해 인터넷 기반 환경에서 데이타 표현 및 교환의 표준으로 자리잡았다. XML이 데이타 표현 및 교환의 주요한 포맷으로 자리잡으면서 XML 데이타의 효율적인 저장 및 질의 처리에 대한 연구가 활발히 진행되었다. XML 데이타를 관계형 데이타 베이스시스템에 저장하는 것은 데이타 관리와 질의 처리에서 많은 이익을 가져온다. 왜냐하면, 관계형 데이타 베이스 시스템은 강력한 질의 처리 및 데이타 관리 기능을 제공하고, 이들 기능을 확장하여 XML 데이타에 적용할 수 있기 때문이다. 그러나, 이 방법을 사용하기 위해서는 XML 질의를 SQL 질의로 변환해야 한다. 본 논문에서는 대표적인 XML 질의 언어인 XQuery 질의를 SQL:2003 질의로 변환하는 질의 번역기를 설계 및 구현한다. SQL:2003은 SQL:1999을 대체하는 최신 SQL 표준으로, XML을 지원하기 위한 SQL/XML을 정의하고 있다. 본 논문의 주요 공헌은 다음과 같다. 첫째, SQL:2003 표준에서 정의하고 있는 XML 지원 특징을 살펴보고 미흡한 부분에 대한 사용자 정의 함수를 제안한다. 둘째, XQuery 질의를 SQL:2003 표준을 준수하는 SQL 질의로 변환하는 방법을 제안한다. 셋째, 번역기에 대한 설계와 구현을 자세히 기술하여 번역기의 가능성(feasibility)을 보여준다.

한영 교차언어 정보검색에서 질의 변환 및 질의 확장 방법 (Query Translation and Query Expansion Method in Korean-to-English Cross-Language Information Retreival)

  • 김백일;서희철;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.235-242
    • /
    • 2002
  • 본 논문은 한영 교차언어 정보검색을 위한 질의 변환 방법과 질의 확장에 대해서 기술하고 있다. 한영 교차언어 정보 검색은 한국어 질의와 관련된 영어 문서를 검색하는 것을 말하며, 한국어 질의를 영어 질의로 변환하는 방법을 사용했다. 이를 위해 한국어 단어들에 대한 영어 대역어들의 공기 정보를 이용하며, 공기 정보로는 상호 정보를 사용했다. 또한 한국어와 영어의 연어 사전을 사용하여 성능을 향상시켰다. 추가적인 검색 성능 향상을 위한 방법으로, 기존 연구에서 많이 사용된 적합성 피드백에 의한 지역적 질의 확장 대신, 영어 워드넷을 확장하여 구축한 한영 이중언어 시소러스를 사용하여 질의 확장을 하는 전역적 질의 확장을 시도하였다. 실험결과, 정확률의 향상보다는 재현율의 향상 정도가 더 컸으며, 긴 질의보다 짧은 질의를 확장한 경우가 성능이 높았다.

  • PDF

Seq2SPARQL: 신경망 기계 번역을 사용한 지식 베이스 질의 언어 자동 생성 (Seq2SPARQL: Automatic Generation of Knowledge base Query Language using Neural Machine Translation)

  • 홍동균;심홍매;김광민
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.898-900
    • /
    • 2019
  • SPARQL(SPARQL Protocol and RDF Query Language)은 지식 베이스를 위한 표준 시맨틱 질의 언어이다. 최근 인공지능 분야에서 지식 베이스는 질의 응답 시스템, 시맨틱 검색 등 그 활용성이 커지고 있다. 그러나 SPARQL 과 같은 질의 언어를 사용하기 위해서는 질의 언어의 문법을 이해하기 때문에, 일반 사용자의 경우에는 그 활용성이 제한될 수밖에 없다. 이에 본 논문은 신경망 기반 기계 번역 기술을 활용하여 자연어 질의로부터 SPARQL 을 생성하는 방법을 제안한다. 우리는 제안하는 방법을 대규모 공개 지식 베이스인 Wikidata 를 사용해 검증하였다. 우리는 실험에서 사용할 Wikidata 에 존재하는 영화 지식을 묻는 자연어 질의-SPARQL 질의 쌍 20,000 건을 생성하였고, 여러 sequence-to-sequence 모델을 비교한 실험에서 합성곱 신경망 기반의 모델이 BLEU 96.8%의 가장 좋은 결과를 얻음을 보였다.

유사한 질의쌍의 어휘 번역확률을 이용한 질의 분류 (Query Classification Based on Translation Probabilities of Similar Query Pair)

  • 김설영;장계훈;이경순
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.443-446
    • /
    • 2010
  • 질의 분류에서 어휘의 다양한 표현으로 인한 어휘 불일치문제는 성능저하의 주요 원인이다. 본 논문에서는 야후!앤써 질의응답 아카이브를 이용해서 같은 카테고리의 질의-질의쌍들에 대해 어휘-어휘 번역확률을 계산하는 방법을 제안한다. 정보검색에서 우수한 성능을 보인 어휘 사이의 번역확률을 반영하는 번역기반 언어모델이 질의 분류에서 유효함을 확인하였고 언어모델과의 비교실험을 통해 성능향상을 보였다. 어휘관계를 측정하는 방법에서 번역확률 계산방법에 따른 성능측정에서 전체 질의-대답쌍들에 대해 번역확률을 계산하는 것보다 같은 카테고리에 속하는 질의-질의쌍들에 대해 번역확률을 계산하는 것이 분류를 위해 더 좋은 번역확률임을 확인하였다.

A Database Approach for Modeling and Querying XML Documents

  • Panseop Shin;Kim, Jeong-Eun;Lee, Jaeho;Haechull Lim
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 ITC-CSCC -2
    • /
    • pp.703-706
    • /
    • 2000
  • In recent years. XML applications are being developed in diverse area. Especially, development of XML document repository system associated with database is carrying out widely. The previous researches of XML repository system have several defects which are update and retrieval limitations for the XML document, design limitation for a formal retrieval algorithm and data redundancy. In order to solve the above problems. in this paper, we suggest relational database schemes for overcoming limitations of updating, retrieving, and rebuilding document. And suggest query translation strategy using two-phase translation that consists of pattern analyzing phase and SQL generating phase.

  • PDF

Development of an integrated Web-based system with a pile load test database and pre-analyzed data

  • Chen, Yit-Jin;Liao, Ming-Ru;Lin, Shiu-Shin;Huang, Jen-Kai;Marcos, Maria Cecilia M.
    • Geomechanics and Engineering
    • /
    • 제7권1호
    • /
    • pp.37-53
    • /
    • 2014
  • A Web-based pile load test (WBPLT) system was developed and implemented in this study. Object-oriented and concept-based software design techniques were adopted to integrate the pile load test database into the system. A total of 673 case histories of pile load test were included in the database. The data consisted of drilled shaft and driven precast concrete pile axial load tests in drained, undrained, and gravel loading conditions as well as pre-analyzed data and back-calculated design parameters. Unified modeling language, a standard software design tool, was utilized to design the WBPLT system architecture with five major concept-based components. These components provide the static structure and dynamic behavior of system message flows in a visualized manner. The open-source Apache Web server is the building block of the WBPLT system, and PHP Web programming language implements the operation of the WBPLT components, particularly the automatic translation of user query into structured query language. A simple search and inexpensive query can be implemented through the Internet browser. The pile load test database is helpful, and data can be easily retrieved and utilized worldwide for research and advanced applications.

XQL-SQL 질의 변환을 통한 XQL 질의 처리 시스템의 설계 및 구현 (Design and Implementation of XQL Query Processing System Using XQL-SQL Query Translation)

  • 김천식;김경원;이지훈;장복선;손기락
    • 정보처리학회논문지D
    • /
    • 제9D권5호
    • /
    • pp.789-800
    • /
    • 2002
  • XML이 웹 문서의 표준이며, 문서교환용 언어로서 사용되고있다. 상업용 데이터는 대부분 관계형 데이터베이스에 저장되어 있고 이들 문서를 교환용 문서로 만들어서 문서교환에 이용하거나 관계형 데이터베이스에 저장된 XML데이터에 XQL로 질의하여 질의결과를 효율적으로 획득하는 것은 매우 중요하다. 따라서, 향후 많은 XML데이터의 보관 및 관리 그리고 XML데이터를 위한 질의어 처리는 필수적이다. 지금까지, XML데이터의 저장 및 검색과 관련한 연구 및 제품개발이 여러 업체에 의해 있어왔고, 지금도 연구 및 개발이 진행되고 있다. 하지만, 효율적인 XML데이터의 저장 및 검색을 위한 시스템은 아직까지 많지 않다. 따라서 본 논문에서는 효율적인 경로 질의를 위한 DFS-Numbering 방식을 사용하며, 효율적인 데이터 저장을 위해서 XML 데이터 저장을 위한 스키마를 설계하였다. 또한, 전통적인 관계형 데이터베이스 엔진을 이용한 효율적인 XQL 질의수행 방법을 설계 및 구현하였다. 즉, 사용자가 시스템에 XQL로 질의를 하면 XQL 처리기에 의해서 XQL이 SQL로 변환되고, SQL로 관계형 데이터베이스에 질의를 수행하면, 결과로 레코드를 반환한다. 이때 XML 생성기에 의해서 사용자에게 n문서를 반환한다.

XQuery FLWOR 연산의 SQL 변환 기법 분석 (Analysis of XQuery FLWOR expression to SQL translation)

  • 홍동권
    • 한국지능시스템학회논문지
    • /
    • 제18권2호
    • /
    • pp.278-283
    • /
    • 2008
  • 인터넷의 활용이 웹 1.0, 웹 2.0으로 점점 더 활성화 되어감에 따라 XML의 사용도 점점 더 가속화되고 있다. XML의 사용에 있어 효과적인 검색 기능은 필수적인 요소이며 XML 질의어의 사실상 표준인 W3C XQuery의 활용도 점점 늘어가는 추세이다. XQuery는 비정형적 문서와 데이터를 다루는 XML의 특성으로 인하여 질의어로서는 매우 복잡한 구조와 다양한 기능을 가지고 있다. XQuery의 가장 대표적인 구문은 for, let, where, order by, return의 기능을 나타내는 FLWOR 구문으로 XQuery 처리 시스템에서 가장 중요한 역할을 한다. 본 논문은 XQuery FLWOR 연산을 관계형 환경에서 처리하는 방법과 FLWOR 연산의 형식에 따라 그 방법들의 기능과 정확성을 증명 확인한다.

A Robust Fingerprint Matching System Using Orientation Features

  • Kumar, Ravinder;Chandra, Pravin;Hanmandlu, Madasu
    • Journal of Information Processing Systems
    • /
    • 제12권1호
    • /
    • pp.83-99
    • /
    • 2016
  • The latest research on the image-based fingerprint matching approaches indicates that they are less complex than the minutiae-based approaches when it comes to dealing with low quality images. Most of the approaches in the literature are not robust to fingerprint rotation and translation. In this paper, we develop a robust fingerprint matching system by extracting the circular region of interest (ROI) of a radius of 50 pixels centered at the core point. Maximizing their orientation correlation aligns two fingerprints that are to be matched. The modified Euclidean distance computed between the extracted orientation features of the sample and query images is used for matching. Extensive experiments were conducted over four benchmark fingerprint datasets of FVC2002 and two other proprietary databases of RFVC 2002 and the AITDB. The experimental results show the superiority of our proposed method over the well-known image-based approaches in the literature.

개선된 chain code와 HMM을 이용한 내용기반 영상검색 (Content-based Image Retrieval using an Improved Chain Code and Hidden Markov Model)

  • 조완현;이승희;박순영;박종현
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.375-378
    • /
    • 2000
  • In this paper, we propose a novo] content-based image retrieval system using both Hidden Markov Model(HMM) and an improved chain code. The Gaussian Mixture Model(GMM) is applied to statistically model a color information of the image, and Deterministic Annealing EM(DAEM) algorithm is employed to estimate the parameters of GMM. This result is used to segment the given image. We use an improved chain code, which is invariant to rotation, translation and scale, to extract the feature vectors of the shape for each image in the database. These are stored together in the database with each HMM whose parameters (A, B, $\pi$) are estimated by Baum-Welch algorithm. With respect to feature vector obtained in the same way from the query image, a occurring probability of each image is computed by using the forward algorithm of HMM. We use these probabilities for the image retrieval and present the highest similarity images based on these probabilities.

  • PDF