• Title/Summary/Keyword: 구조화된 XML 데이터

Search Result 70, Processing Time 0.027 seconds

Common XML Structure Extracting Algorithm for Applying Data Mining Techniques (데이터마이닝 기법 적용을 위한 공용 XML 구조 추출 알고리즘)

  • Jang, Min-Seok;Bang, Hyun-Jin
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • v.9 no.1
    • /
    • pp.1072-1076
    • /
    • 2005
  • Importance of XML as a target of Data Mining is growing because XML is used generally as a standard markup language for describing structured data. Especially researches have been done about extracting wanted informations by applying association rules to XML documents. But there are few development about solving the problems of method for efficiently obtaining informations from similar kinds of XML documents. To solve the problem this paper tries to suggest the method by which common XML structure is extracted form the same kinds of XML documents having a various XML schemas. The resulted schema structure is supposed to be important one as a preliminary job because it helps us to acquire the useful informations from various kinds of documents by unifying their structures.

  • PDF

An Efficient Relational Schema Extracting Technique Using Common Stricture in XML Documents (XML 문서의 공통구조를 이용한 효율적인 릴레이션 스키마 추출기법)

  • 안성은;이정선;최황규
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.49-51
    • /
    • 2002
  • XML은 웹 상에서 데이터를 표현하고 교환하기 위안 표준으로 등장하고 있다 최근에 웹 상에서 다루어지는 데이터의 양이 급격하게 증가함에 따라 데이터의 형태는 구조적인 릴레이션 데이터에서 반 구조적인 데이터에 이르기까지 다양하다. 앞으로 웹에서 반 구조적 데이터를 대표할 XML 문서특이 많아지면 .1 데이터들간의 의미적 구조적 관계를 설정하는 스키마즐- 추출하여 그에 따라 데이터를 구조화 시켜 정보로써의 가치를 만들 수 있는 새로운 저장 기법들이 필요하다. 본 논문에서는 XML 문서의 DTD를 이용하여 통일한 DTD를 사용하는 XML 문서들의 공통구조론 추출하여 관계 데이터베이스 시스템에 XML 문서를 저장하기 위한 릴레이션 스키마 추출 기법을 제안한다.

  • PDF

A study of XML Data Structure for SEMI Equipment Communication (반도체 장비 간 통신을 위한 XML 데이터 구조에 관한 연구)

  • Hwang, Min-Jeong;Park, Jae-Hyun
    • Proceedings of the KIEE Conference
    • /
    • 2001.11c
    • /
    • pp.50-52
    • /
    • 2001
  • 반도체 장비간 통신의 표준인 SECS(SEMI Equipment Communication Standard)는 반도체 제조 업체에서 많이 사용되고 있다. SECS-I의 단점을 보완하기 위해 제안된 HSMS (High-speed SECS Message Services)는, TCP/IP를 지원하고 SECS-I에 비해 통신 속도가 높다. 사용자는 HSMS를 이용하여 LAN을 통한 장비 제어 및 모니터링이 가능하게 되었다. 그러나, 네트워크의 확장에 대한 관심 고조로 기존의 제한된 영역의 네트워크 구성에 대한 변화가 필요하게 되었다. 또한 사용자가 항상 LAN의 범위 내에서 장비 모니터링 및 제어하기에는 위치적 제약이 많다. 그렇지만 HSMS는 Web을 통한 데이터 전송 요구를 수용하지 못하고 있다. 따라서 SECS-II message가 Web을 통해 전송될 수 있는 새로운 포맷이 필요하다. 본 논문에서는, 구조화된 데이터를 정의하기 유리한 마크업 언어인 XML을 이용하여, SECS-II message를 Web으로 전송할 수 있는 포맷을 정의하고 이를 구현한다.

  • PDF

Advanced Version Management Method for XML Documents using Historical Data (이력데이터를 이용한 XML 문서의 개선된 버전관리 방법)

  • Kim Seong-Rok;Park Hee-Sook;Cho Woo-Hyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.11a
    • /
    • pp.7-10
    • /
    • 2004
  • XML은 인터넷 웹문서, EDI 등을 포함하여 다양한 분야에서 활용하는 문서이다. XML은 플랫폼에 독립적이며 문서의 정보를 손실 없이 전송 및 교환이 쉽고 웹상에서 구조화된 문서의 전송이 가능하다. 따라서 시간이 변화함에 따라 XML 문서의 변경에 따른 효율적인 버전 관리에 대한 중요성이 대두되었다. 본 논문에서는 XML문서 버전관리에 있어서 시간적인 정보를 제공하기 위해 이력 데이터베이스의 정보를 이용하고 문서의 빠른 재구성을 위해 Dewey ordering방식을 결합한 새로운 버전번호 관리방식을 제안한다.

  • PDF

Design and Implementation of an XML-based Translator for Metadata Interchange in RDBs (RDB 대상 메타데이터 교환을 위한 XML기반 번역기 설계 및 구현)

  • Lee, Wol-Yeong;Lee, Gi-Ho
    • Journal of KIISE:Databases
    • /
    • v.28 no.1
    • /
    • pp.48-56
    • /
    • 2001
  • XML은 여러 분야에서 다양한 타입의 데이터를 효과적으로 관리하기 위한 표준으로 사용되고 있다. 이러한 XML의 한 응용으로서 데이터베이스 시스템, 파일 시스템, OLTP시스템, OLAP시스템, 데이터웨어하우징을 위한 ETL 시스템, 데이터마이닝 시스템 등을 포함하는 다양한 타입의 데이터 처리 시스템 사이에서 메타데이터를 교환하기 위하여 XML을 이용하여 메타데이터를 표준화하는 것이다. 본 연구는 MDC(MetaData Coalition)에 제안한 일반적인 데이터 처리 시스템을 위한 메타데이터 교환 스펙인 MDIS(Metadata Interchange Specification)를 따르도록 설계한 관계형 데이터베이스 시스템의 메타데이터 교환을 위한 사양으로서 R-MDIS(MetaData Interchange Specification for RDBs) 모델을 제안하고 이에 따라 표현된 자료를 상호 데이터베이스 시스템 사이에서 교환할 수 있는 Export 함수와 Import 함수를 포함하는 번역기를 개발한다. 이 번역기는 메타데이터의 일관성을 유지하면서도 메타데이터의 양방향 흐름을 지원할 수 있도록 하는 정보를 포함하고 있다. 본 연구는 구체적인 관계형 데이터베이스 시스템에서의 메타데이터 교환을 위한 실제적인 번역기를 구현함으로써 다양한 종류의 데이터 처리 시스템들 사이에서 메타데이터 불일치 문제를 해결할 수 있는 근거를 제시하였다. 둘째, XML을 이용하여 메타데이터 교환 사양을 설정함으로서 구도화된 데이터나 구조화되지 않은 데이터 모두에 대하여 일관된 방법으로 데이터 교환이 가능하도록 하여 효율적인 정보 교환을 할 수 있다는 것을 보여 주었다. 셋째, 본 연구에서 개발한 번역기는 메타데이터 교환에 의해 데이터들을 공유하게 함으로서 효율적으로 관리하지 못하던 데이터들을 효율적으로 사용할 수 있게 함으로서 데이터 관리 문제에 해결책이 될 것이다.

  • PDF

K-d Tree Structured Representation for MusicXML Music Scores (MusicXML 전자악보를 위한 K-d 트리 구조 표현)

  • Kim, Taek-Hun;Yang, Sung-Bong
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.06c
    • /
    • pp.252-257
    • /
    • 2007
  • MusicXML은 다양한 전자악보 형식들이 음악을 악보로 표현하는데 있어 지니는 한계를 잘 극복하면서 응용성, 확장성 및 공개성 등의 장점으로 인해 현재 전자악보의 표준으로 가장 적합한 것으로 평가되고 있는 악보 형식이다. 그러나 MusicXML은 XML을 기반으로 한 텍스트 데이터이기 때문에 이러한 악보 형식을 실제 악보로 변환하거나 연주하는 것은 물론 실제 악보 내용을 기반으로 한 악보 검색이 용이하도록 적절한 데이터 구조로 표현하는 것이 필요하다. 본 논문에서는 MusicXML 악보에 대하여 다차원 속성 정보를 가진 데이터의 표현에 용이한 k-d 트리 기반 데이터 구조로 표현하는 방법을 제안한다. 논문은 또한 악보에 대한 k-d 트리 구조를 보다 다양한 응용에 활용할 수 있도록 k-d 트리를 확장하여 구조화하는 방법을 제시한다. 본 논문에서 제안한 방법은 특히 내용을 기반으로 한 악보 정보 검색에 유용하게 이용될 수 있다.

  • PDF

XML-based Modeling for Semantic Retrieval of Syslog Data (Syslog 데이터의 의미론적 검색을 위한 XML 기반의 모델링)

  • Lee Seok-Joon;Shin Dong-Cheon;Park Sei-Kwon
    • The KIPS Transactions:PartD
    • /
    • v.13D no.2 s.105
    • /
    • pp.147-156
    • /
    • 2006
  • Event logging plays increasingly an important role in system and network management, and syslog is a de-facto standard for logging system events. However, due to the semi-structured features of Common Log Format data most studies on log analysis focus on the frequent patterns. The extensible Markup Language can provide a nice representation scheme for structure and search of formatted data found in syslog messages. However, previous XML-formatted schemes and applications for system logging are not suitable for semantic approach such as ranking based search or similarity measurement for log data. In this paper, based on ranked keyword search techniques over XML document, we propose an XML tree structure through a new data modeling approach for syslog data. Finally, we show suitability of proposed structure for semantic retrieval.

A Relational Schema Extracting Technique Using DTD XML in Documents (XML 문서의 DTD를 이용한 릴레이션 스키마 추출 기법)

  • Ahn, Sung-Eun;Choi, Hwang-Kyu
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.04a
    • /
    • pp.105-108
    • /
    • 2002
  • XML은 웹 상에서 데이터를 표현하고 교환하기 위한 표준으로 등장하고 있다. 최근에 웹 상에서 다루어지는 데이터의 양이 급격하게 증가함에 따라 XML 문서들간의 의미적 구조적 관계를 설정하는 스키마를 추출하여 그에 따라 데이터를 구조화시켜 정보로써의 가치를 만들 수 있는 새로운 저장 기법들이 필요하다. 본 논문에서는 XML 문서의 DTD를 이용하여 동일한 DTD를 사용하는 XML 문서들의 공통구조를 추출하여 관계 데이터베이스 시스템에 XML 문서를 저장하기 위한 릴레이션 스키마 추출 기법을 제안하였다. 제안된 기법은 성능비교에서 기존의 방법에 비하여 생성되는 릴레이션의 수가 적고 릴레이션 생성 시 발생하는 널 값의 출현을 감소시킬 수 있다.

  • PDF

An implementation of Visual XML Document Editor (시각적 XML 문서 편집기 구현)

  • 황현숙;오지훈;최병규;전양승;한성국
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10c
    • /
    • pp.169-171
    • /
    • 2004
  • XML은 어떠한 정보든지 구조화할 수 있으며, 데이터와 스타일 정보를 철저히 분리함으로써 컴퓨터가 처리할 수 있는 메타데이터를 제공하여 정보검색의 정확성을 높이는 획기적인 계기를 마련하였다. XML 데이터와 스타일의 분리를 위해 XML 기반의 문서를 표현하기 위한 스타일시트인 XSLT가 제안되었지만, 이는 전문적인 지식이 없는 일반인이 사용하기에 매우 어려울 뿐만 아니라, 작성하는데도 많은 시간과 비용이 필요하다. 이에 대한 대안으로 현재 XSLT 문서 편집 시스템이 상용화되어 출시되고 있지만. 사용이 너무 복잡하고 어려워 문서 편집 시스템의 요구조건을 충족하기에는 미흡하다. 이에 본 논문에서는 일반인도 쉽게 XML 기반의 문서 구조와 스타일시트를 생성할 수 있는 시각적 환경 기반의 XMㄴ 기반 문서 편집 시스템을 구현하고, 이를 실제 적용하여 기존 시스템과의 성능 평가를 통해 시스템의 성능을 검증하였다. 또한 문서 구조에 따른 데이터베이스 테이블을 동적으로 생성하여 XML 기반 문서 관리의 효용성을 다각도로 제시하였다.

  • PDF

Design on DTD-independent Data Model for XML Document (XML 문서를 위한 DTD 독립적인 데이터 모델 설계)

  • 김정은;신판섭;이재호;임해철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.69-71
    • /
    • 2000
  • XML은 사용자가 문서를 적절히 구조화해서 저장시킬 수 있는 장점으로 인해 기존의 HTML로 구축된 웹서비슬 환경을 데이터베이스화하여 다양하고 복잡한 검색 환경을 제공한다. 이러한 이유로 최근에 XML 문서를 데이터베이스에 저장하고 효율적인 관리 및 검색을 지원하는 연구들이 많이 진행되고 있다. 기존 연구를 살펴보면 XML의 구조적 특징을 문서 독립적으로 모델링하지 않아 갱신 및 검색 효율이 떨어지고, 생성되는 테이블의 수가 증가하며, 원문 복원 능력의 저하와 데이터 중복이 발생하는 문제점을 안고 있다. 따라서 본 논문에서는 관계 데이터베이스를 기반으로 XML문서의 구조 정보를 DTD 독립적으로 구성하여 테이블 생성 수와 갱신의 문제점을 개선하고, DTD 구조의 경로 정보 표현을 제안하여 탐색 및 원문 복원 능력을 강화하며, 테이블 중복 문제를 해결한 데이터 모델을 제안한다.

  • PDF