• Title/Summary/Keyword: 반구조적 데이터

Search Result 20, Processing Time 0.022 seconds

Extracting Common Structure of Semistructured data Using mining frequent patterns (빈발 패턴 탐사 기법을 이용한 반구조적 데이터로부터의 공통구조 추출)

  • 이영언;문봉희
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10a
    • /
    • pp.302-304
    • /
    • 2000
  • 인터넷의 발달로 웹에는 엄청난 데이터가 존재하나, 불규칙적인 구조를 이루고 있는 반구조적 데이터가 대부분이다. 이러한 반구조적 데이터는 데이터들간의 어떤 정확하게 정해진 구조를 갖고 있진 않지만 불완전하고 불규칙한 구조 정보를 포함하고 있는 것으로, 데이터들 간의 관계를 규명할 수 있는 공통 구조 정보를 추출하여 효과적으로 구조화시킴으로써 정보로서의 가치를 높일 필요성이 대두되게 되었다. 또, 데이터 처리 과정에서 기존의 잘 정의된 구조를 가진 데이터베이스의 장점을 수용하기 위해서는 반구조적 데이터 집합의 불완전한 구조 정보로부터 공통 구조를 추출하는 것이 요구된다. 본 연구에서는 후보 항목 집합의 생성이 없는 빈발 패턴 탐사 기법을 사용하여 반구조적 데이터 집합으로부터 공통구조를 추출하고자 한다.

  • PDF

An Efficient Technique for Extracting DTD from XML Data (XML 데이터의 효율적인 DTD 추출)

  • Yang, Eun-Joo;Park, Kyung-Hyun;Ryu, Keun-Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2000.10a
    • /
    • pp.97-100
    • /
    • 2000
  • 기존의 데이터를 인터넷상에서 XML 데이터 형태로 전송 시 부하를 줄이기 위해 DTD가 없는 형태로 전송하지만, 전송 받은 XML 데이터에 대한 저장 및 질의처리를 최적화하기 위해서는 DTD 추출이 필요하다. 따라서 이 논문에서는 반구조적 데이터의 특징을 갖는 XML 데이터에 대한 DTD를 추출하기 위해 기존의 데이터로그(DataLog)를 이용하여 반구조적 데이터의 최소 경계 스키마를 추출하는 방법보다 향상된 방법인 시뮬레이션을 이용한 최소 경계 스키마 추출 방법을 제시함으로써 보다 효율적인 DTD 추출을 가능하게 하는 방범을 제시한다.

  • PDF

An Efficient Technique for Storing XML Data Without DTD (DTD가 없는 XML 데이터의 효율적인 저장 기법)

  • Park, Gyeong-Hyeon;Lee, Gyeong-Hyu;Ryu, Geun-Ho
    • The KIPS Transactions:PartD
    • /
    • v.8D no.5
    • /
    • pp.495-506
    • /
    • 2001
  • XML makes it possible for data to be exchanged regradless of the data model in which it is represented or the platform on which it is stored, serving as a standard for data exchange format on the internet. Especially, it is natural to send XML data without DTD on the internet when XML is data-centric. Therefore it is needed to extract relational schema to store XML data efficiently, to optimize queries, and to publish data which have been stored in the relational database in the XML format. In this paper, we proposed a method to generate relational database in the XML documents without DTD and store XML data using upper/lower bound schema extraction technique for semistructured data. In extracting a lower bound schema, we especially show an efficient technique for creating relational schema by using simulation with is more advanced than the datalog method.

  • PDF

An Efficient Technique for Extracting Lower Bound Schema from Semistructured Data (반구조적 데이터의 효율적인 최소경계 스키마 추출 기법)

  • 박경현;김록원;양은주;최은선;류근호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10a
    • /
    • pp.27-29
    • /
    • 2000
  • 반구조적 데이터는 기존의 스키마와는 달리 고정된 스키마가 없고 주어진 데이터 인스턴스에 대해 하나 이상의 스키마가 존재한다. 따라서 여러 개의 스키마 추출이 가능한데 그중 가장 정확한 스키마를 추출해야 하는 문제(S초듬 Fxtraction)가 발생한다. 이러한 문제를 해결하기 위해 지금까지 여러 가지 스키마 추출 기번들이 제안되었는데 대표적인 것으로 데이터가이드(DataGuide)를 이용하여 최대경계 스키마를 추출하는 방법과 데이터로그(DataLog)를 이용하여 최소경계 스키마를 추출하는 방법이 있다. 이 논문에서는 기존의 데이터로그를 이용하는 방법보다 최소경계 스키마 추출 기법을 제안하고 이전의 스키마 추출 기법들과 비교함으로써 알고리즘의 성능을 살펴본다.

  • PDF

XML Query Optimization based on Signature (시그니처를 이용한 XML 질의 최적화)

  • Park, Sang-Won;Kim, Hyeong-Ju
    • Journal of KIISE:Databases
    • /
    • v.28 no.1
    • /
    • pp.104-114
    • /
    • 2001
  • XML은 웹에서 데이터를 주고받는 표준으로 새로이 등장하고 있다. 이러한 데이터를 잘 처리하기 위하여 데이터베이스의 도움은 필연적이다. XML을 처리하는 데이터베이스에서 데이터는 트리 형태로 저장되며 질의어는 정규 경로식(regular path expression)의 특징을 가지고 있다. 이때 질의 처리는 트리의 각 노드 탐색을 통하여 수행된다. 본 논문에서는 시그니처를 이용한 저장 방법 및 질의 처리를 통하여 질의 수행 시 각 노드의 탐색 횟수를 줄여 질의 수행을 빠르게 할 수 있게 한다. 뿐만 아니라 반 구조적 데이터에 대한 인덱스도 데이터베이스 내에서 반구조적 데이터로 표현된다. 그러므로 본 논문에서 제안한 방법을 인덱스 노드에도 적용할 수 있다. 이와 같이 본 논문에서 제안한 방법은 데이터 객체와 인덱스 객체의 탐색을 줄임으로서 XML 질의를 빠르게 처리할 수 있게 한다.

  • PDF

Storing XML Documents using Oracle8i XDK (Oracle8i XDK를 이용한 XML 문서의 저장)

  • 하상호;이강석;백인천
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2000.04a
    • /
    • pp.324-327
    • /
    • 2000
  • XML은 웹 상에서 데이터의 원활한 교환을 위해서 HTML을 보완하여 설계된 차세대 인터넷문서작성용언어이다. XML 문서와 같은 반구조(semistructured) 의 특성을 갖는 데이터를 효과적으로 다루기 위한 새로운 데이터모델과 질의어가 제안되어 오고 있지만, 여기서는 관계형 데이터베이스에 XML 문서를 효과적으로 저장하는 방법에 관해서 논의한다. 먼저, 도서를 표현하는 XML 문서를 위한 DTD를 제시하고, 이 DTD를 관계 테이블로 변환하는 방법을 논의한다. 다음에는 Oracle서 지원하는 XDK를 이용하여 XML문서를 Oracle8i DB에 저장하는 방법에 대해서 논의한다.

  • PDF

An Efficient Schema Extracting Technique Using DTD in XML Documents (DTD를 이용한 XML문서의 효율적인 스키마 추출 기법)

  • Ahn, Sung-Eun;Choi, Hwang-Kyu
    • Journal of Industrial Technology
    • /
    • v.21 no.A
    • /
    • pp.141-146
    • /
    • 2001
  • XML is fast emerging as the dominant standard to represent and exchange data in the Web. As the amount of data available in the Web has increased dramatically in recent years, the data resides in different forms ranging from semi-structured data to highly structured data in relational database. As semi-structured data will be represented by XML, XML will increase the ability of semi-structured data. In this paper, we propose an idea for extracting schema in XML document using DTD.

  • PDF

Implementation of Server and XML Database for the Track&Trace System (Track&Trace 시스템의 서버와 XML 데이터베이스의 구현)

  • 유정순;하수철;박주상;황재각
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2003.05b
    • /
    • pp.703-707
    • /
    • 2003
  • 본 논문은 물류 Tracking 시스템[1]의 서버와 XML 데이터베이스 구현에 관한 사항이다. 서버는 XML(데이터), XSL(표현방법), JSP(로직)의 3가지 형태로 분리함으로써 관리 및 개발 생산성을 향상시키도록 한다. 공간 낭비와 비효율성을 해결하기 위하여 반구조적인 데이터 모델이며, 트리 구조 형식인 XML을 XML 전용 데이터베이스인 오라클에 사상하여 저장한다. 그 결과 매핑 정보를 알기 때문에 XML 문서 전체를 파싱할 필요가 없어 보다 효율적으로 질의가 가능하다.

  • PDF

Design of a Mapping Structure of XML DTDs to Relational Tables (XML DTD로부터 관계형 테이블로의 사상구조 설계)

  • 박은경;정채영;김현주;배종민
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.133-135
    • /
    • 2001
  • 데이터로서 XML 역할에 대한 중요성이 증대되어감에 따라, 구조 정보를 내포하고 있는 데이터로서의 XML 문서를 효과적으로 관리하는 구조설계 및 질의어 처리에 대한 연구가 활발히 진행되고 있다. XML 저장구조는 XML 스키마에 의존하지 안고, 반구조적 데이터에 대한 저장과 질의처리 설계방법과 DTD와 같은 XML 스키마를 기반으로 저장구조를 설계하는 방법이 있다. DTD는 XML 문서의 논리적인 구조정보를 표현하는 역할을 가지고 있으며, 그러한 역할은 이 기종간의 문서교환시 더욱 중요해진다. DTD 기반의 XML문서를 관계형 테이블로 사상하고자 할 때, 사상과정이 자동적으로 이루어지는 경우와 사용자가 관리자가 직접 테이블 생성에 관여하는 수동적인 사상방법이 있다. 수동적인 사상과정은 질의처리가 구현시 데이터베이스 설계 방법에 크게 의존하게 되는 단점이 있지만, 사용자가 주어진 DTD 구조에 따라서 특정 응용에 알맞은 저장구조를 직접 설계하기 때문에 더 효율적인 저장구조를 설계할 수 있다. 본 논문에서는 관계형 DB를 질의처리 하기 위한 하부 저장소로 사용하고, DTD 기반의 XML 문서를 관계형 DB 테이블간의 수동적인 사상과정을 통하여 효율적인 XML 문서 저장구조를 설계하는 방법을 제시한다.

  • PDF

SW-IQS : Semantic Web based Information Query System for the integration of semantic data (SW-IQS : 의미론적 데이터 통합을 위한 시맨틱 웹 기반의 통합 정보 검색 시스템)

  • Choi, Ok-Kyung;Han, Sang-Young
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.05b
    • /
    • pp.895-898
    • /
    • 2003
  • 본 연구에서는 온톨로지를 이용한 SW-IQS(Semantic Web based Information Query System)를 제안한다. 제안한 시스템은 자동 분류 기술과 정보 검색 기법들을 이용하여 반구조(semi-structured) 문서뿐만 아니라 비구조(unstructured) 문서의 처리를 극대화시키고자 한다. 또한 상호 운용성 및 데이터 통합을 위해 RDF(S) 방식의 문서 저장 서버를 지원하며 웹 페이지들간에 검색 순위를 두어 보다 신속하고 정확한 정보 검색이 가능하도록 하고자 한다. 마지막으로 새로운 순위 측정 알고리즘을 제안하고 이를 이용한 성능 평가를 실시하여 그 효율성과 정확성을 검증해 보이고자 한다.

  • PDF