• 제목/요약/키워드: schema extraction

검색결과 46건 처리시간 0.026초

참조 스키마 생성을 위한 개념적 스키마 분석 (Conceptual Schema Analysis for Creation of Reference Sche)

  • 김흥수
    • 한국컴퓨터정보학회논문지
    • /
    • 제7권4호
    • /
    • pp.83-88
    • /
    • 2002
  • 데이터베이스 설계를 위해 구축된 수많은 개념적 스키마들을 재사용하기 위한 분석수단이 요구된다. 본 논문에서는 개념적 스키마를 분석하는 방법을 제시하고 참조 스키마를 추출하기 위한 스키마 분석을 실험을 하였다. 스키마 통합은 유사함 값이 0.6 이상인 경우에 적용하는 것이 바람직하다. 분석 방법을 통해 생성되는 참조 스키마는 개념을 포괄적으로 표현할 수 있고 스키마 재사용을 위한 수단이 된다. 그리고, 참조 스키마 추출에 필요한 상세한 분석자료를 구하기 위해서는 피쳐를 근거로 스키마를 분석하는 것이 효과적인 수단이 된다.

  • PDF

Formal Models and Algorithms for XML Data Interoperability

  • Lee, Thomas Y.;Cheung, David W.
    • Journal of Computing Science and Engineering
    • /
    • 제4권4호
    • /
    • pp.313-349
    • /
    • 2010
  • In this paper, we study the data interoperability problem of web services in terms of XML schema compatibility. When Web Service A sends XML messages to Web Service B, A is interoperable with B if B can accept all messages from A. That is, the XML schema R for B to receive XML instances must be compatible with the XML schema S for A to send XML instances, Le., A is a subschema of B. We propose a formal model called Schema Automaton (SA) to model W3C XML Schema (XSD) and develop several algorithms to perform different XML schema computations. The computations include schema minimization, schema equivalence testing, subschema testing, and subschema extraction. We have conducted experiments on an e-commerce standard XSD called xCBL to demonstrate the practicality of our algorithms. One experiment has refuted the claim that the xCBL 3.5 XSD is backward compatible with the xCBL 3.0 XSD. Another experiment has shown that the xCBL XSDs can be effectively trimmed into small subschemas for specific applications, which has significantly reduced the schema processing time.

스키마 추출 기법을 이용한 최적화 문제 해결 (Solving Optimization Problems by Using the Schema Extraction Method)

  • 조용군;강훈
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2000년도 제15차 학술회의논문집
    • /
    • pp.278-278
    • /
    • 2000
  • In this paper, we introduce a new genetic reordering operator based on the concept of schema to solve optimization problems such as the Traveling Salesman Problem(TSP) and maximizing or minimizing functions. In particular, because TSP is a well-known combinational optimization problem andbelongs to a NP-complete problem, there is huge solution space to be searched. For robustness to local minima, the operator separates selected strings into two parts to reduce the destructive probability of good building blocks. And it applies inversion to the schema part to prevent the premature convergence. At the same time, it searches new spaces of solutions. Additionally, the non-schema part is applied to inversion for robustness to local minima. By doing so, we can preserve diversity of the distributions in population and make GA be adaptive to the dynamic environment.

  • PDF

XML 문서에서의 엘리먼트 정보를 이용한 스키마 추출방법 (A Schema Extraction Method using Elements Information in XML Documents)

  • 김성림;윤용익
    • 정보처리학회논문지D
    • /
    • 제9D권3호
    • /
    • pp.381-388
    • /
    • 2002
  • 인터넷상에서 데이터를 표현하고 교환하는 새로운 표준으로 등장하는 XML 문서는 정해진 스키마를 가지고 있지 않다. XML 문서를 기존의 SQL이나 OQL에 바로 적용하기에는 부적합하여 이러한 XML 문서에 대해 스키마를 추출하는 방법과 질의어에 대한 연구가 활발히 진행되고 있다. 본 논문에서는 XML문서에 대해 엘리먼트 정보를 이용하여 스키마를 추출하고, 추출된 스키마를 바탕으로 데이터 빈도수에 따라 새로운 여러 단계의 스키마를 추출하는 방법을 제시하고 실험한다.

XML 문서에서의 레이블 경로 발생 빈도수에 따른 스키마 추출 방법 (The Schema Extraction Method using the frequency of Label Path in XML documents)

  • 김성림;윤용익
    • 인터넷정보학회논문지
    • /
    • 제2권4호
    • /
    • pp.11-24
    • /
    • 2001
  • 인터넷상에서 데이터를 표현하고 교환하는 새로운 표준으로 등장하는 XML 문서는 정해진 스키마를 가지고 있지 않다. XML 문서를 기존의 관계형 데이터베이스나 객체 지향 데이터베이스 질의어에 바로 적용하기에는 부적합하여 이러한 XML 문서에 대해 스키마를 추출하는 방법과 질의어에 대한 연구가 활발히 진행되고 있다. 본 논문에서는 XML문서의 레이블 경로발생 빈도 수에 따른 여러 단계의 스키마를 추출하는 방법을 제시하고, 이를 실험하여 그 효율성을 보인다.

  • PDF

RDB의 묵시적 참조 무결성 추출 알고리즘에 대한 성능 평가 (Performance Evaluation about Implicit Referential Integrities Extraction Algorithm of RDB)

  • 김진형;정동원
    • 한국시뮬레이션학회:학술대회논문집
    • /
    • 한국시뮬레이션학회 2005년도 추계학술대회 및 정기총회
    • /
    • pp.71-76
    • /
    • 2005
  • XML is rapidly becoming one of the most widely adopted technologies for information exchange and representation on the World Wide Web. However, the large part of data is still stored in a relational database. Hence, we need to convert relational data into XML documents. The most important point of the conversion is to reflect referential integrities In relational schema model to XML schema model exactly. Until now, FT, NeT and CoT are suggested as existing approaches for conversion from the relational schema model to the XML schema model but these approaches only reflect referential integrities which are defined explicitly for conversion. In this paper, we suggest an algorithm for automatic extraction of implicit referential integrities such as foreign key constraints which is not defined explicitly in the initial relational schema model. We present translated XML documents by existing algorithms and suggested algorithms as comparison evaluation. We also compare suggested algorithm and conventional algorithms by simluation in accuracy part.

  • PDF

공통 유사 서브스키마 추출을 통한 개념적 스키마 통합 : 다중 데이터베이스 시스템 적용사례 (A Conceptual Schema Integration through Extraction of Common Similar Subschemas : An Case Study of Multidatabase System)

  • 고재진;이원조
    • 정보처리학회논문지D
    • /
    • 제11D권4호
    • /
    • pp.775-782
    • /
    • 2004
  • 최근 글로벌 기업들은 조직들이 지역적으로 분산되어 있고, 분산된 조직들로 인하여 정보시스템들도 분산되어 있다. 이러한 정보시스템의 중심이 되는 데이터베이스도 분산되어 있어, 다양한 사용자 응용 프로그램을 위한 공통된 뷰(view)의 제공 및 효과적인 관리가 어렵다. 이것을 해결하기 위한 개념이 MDBS이고, 이것을 효과적으로 구축하기 위한 방안이 스키마 통합이다. 본 논문에서는 공통 유사 서브스키마 추출을 통한 스키마 통합 방법론을 제시한다. 본 방법론은 분석 대상 스키마에 대하여 친밀도 분석, 유사 서브스키마 추출, 통합순서 결정, 의리충돌 해결, 그리고 스키마 통합 순서로 구성되어 있다. 방법론의 유용성을 검증하기 위하여, MDBS를 대상으로 사례분석을 수행하였다. 분석 결과, 본 논문의 방법론이 공통 유사 서브스키마의 추출 및 스키마 통합에 유용하게 적용될 수 있다는 것을 확인할 수 있었다.

웹 정보원 통합을 위한 내용 기반의 스키마 자동생성시스템 (An Automatic Schema Generation System based on the Contents for Integrating Web Information Sources)

  • 곽준영;배종민
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권6호
    • /
    • pp.77-86
    • /
    • 2008
  • 웹 정보원은 사용자에게 제공되는 가장 큰 분산 데이터베이스로 간주될 수 있다. 분산된 웹 정보원을 가상적으로 통합하여 하나의 정보원으로 보고, 이 가상의 데이터베이스에 대하여 데이터베이스 질의어를 이용하여 검색하는 기능은 여러 가지 웹 기반 응용프로그램 개발에서 중요한 역할을 한다. 이러한 기능을 지원하기 위해서 브라우징 중심의 웹 문서로부터 데이터베이스 스키마를 추출해야 한다. 본 논문은 반 구조적인 웹 문서로부터 XML 스키마를 자동으로 생성하는 경험적 알고리즘을 제시한다. 이를 위하여 미리 정의된 구조태그 기반으로 후보패턴영역을 추출하고 후보패턴영역으로부터 패턴영역을 경험적으로 결정한다. 그리고 패턴영역으로부터 스키마생성규칙을 유도한다. 스키마생성규칙은 XQuery로 표현되기 때문에 공개된다양한 XML 도구를 사용하여 응용시스템을 개발할 수 있다. 개발된 시스템의 유효성을 보이기 위하여 다양한 웹정보원에 대하여 실험한 결과를 제시한다.

  • PDF

An Effective XML Schema Conversion Technique for Improving XML Document Reusability using Pattern List

  • Ko, Hye-Kyeong;Yang, Minho
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제9권2호
    • /
    • pp.11-19
    • /
    • 2017
  • The growing use of XML markup language has made amount of heterogeneous. XML documents are widely available in the Web. As the number of applications that utilize heterogeneous XML documents grow, the importance of XML document extraction increases greatly. In this paper, we propose a XML schema conversion technique that converts reusable XML schema from XML documents. We convert the schema graph and we use the reusability pattern list. The converted XML schema is evaluated in terms of cohesion, coupling, and reusability. The converted XML schema could be used to construct databases for various fields where XML is used as an intermediation of data exchange.

Drill-across연산자를 이용한 Snowflake schema 개념 설계 (Design of Snowflake schema concept using Drill-across Operator)

  • 김경주;오근탁;이윤배
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2004년도 춘계종합학술대회
    • /
    • pp.354-357
    • /
    • 2004
  • 데이터 웨어하우스는 주제 지향적이고, 통합적이며, 비 유동적인 데이터로써 의사결정에 필요한 정보들을 추출하여 OLAP(On-Line Analytical Processing)분석에 이용된다. 현재 OLAP 연산자와 스타 스키마 사이의 다차원 모델링에 관한 연구는 많이 진행되어 왔다. 본 논문에서는 drill-across 연산자를 통해 객체 지향 개념적 관계와 스타 스키마보다 한층 더 확장된 스노우 플레이크(snowflake) 스키마를 이용하여 관계를 설계하고자 한다. 설계를 통해 star schema에 적용되지 않았던 객체 지향 관계가 개선되었음을 알 수 있었다.

  • PDF