• 제목/요약/키워드: Structured XML Data

검색결과 97건 처리시간 0.163초

XML 기반의 EDI 문서 처리 시스템 설계 및 구현 (The Design and Implementation of EDI document processing system based on XML)

  • 임대명;정상호;류지웅;정회경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2010년도 춘계학술대회
    • /
    • pp.734-736
    • /
    • 2010
  • 현재 초고속 인터넷망을 이용한 정보 처리(Information processing) 및 정보 교환(Information exchange)에 대한 연구 및 개발이 활발하게 이루어지고 있다. 이를 위해서는 전자 문서에 대한 좀더 효율적이고 정확한 표준화 작업이 진행되어야 한다. 이에 따라 세계 각국의 표준화 기구들은 각종 표준을 제시하고 있으며, 이중 대표적으로 기업 간에 데이터를 교환하는 표준화 시스템으로 EDI(Electronic Data Interchange)를 들 수 있다. EDI는 전자상거래의 한 형태이며, 기업 간 거래에 관한 데이터와 문서를 표준화를 거쳐 컴퓨터 통신망을 이용하여 거래 당사자 간에 직접 송수신이 이루어진다. 하지만, 기업과 기업이 서로 정의된 방식으로 문서를 전달하는 것이므로 데이터 자체가 고정되어 있고 정형화되어 있어 확장 시에 문제가 발생하고, 구조적인 데이터 검색 및 처리가 불가능하다. 이에 본 논문에서는 구조적이고 확장성이 뛰어난 인터넷 표준 언어인 XML(eXtensible Markup Language)을 이용하여 EDI 문서를 처리하는 시스템을 설계 및 구현하였다.

  • PDF

Spatial XQuery2SQL Converter를 위한 알고리즘 (The Algorithm For Spatial XQuery2SQL Converter)

  • 최영운;서현호
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2004년도 추계 종합학술대회 논문집
    • /
    • pp.442-447
    • /
    • 2004
  • XML은 1996년 W3C(World Wide Web Consortium)에서 제안한 것으로서 웹상에서 구조화된 문서를 전송 가능하도록 설계된 표준화된 텍스트 형식이다. 이는 인터넷에서 기존에 사용하던 HTML의 한계를 극복하고 SGML의 복잡함을 해결하는 방안으로써 HTML에 사용자가 새로운 태그를 정의할 수 있는 기능이 추가되었다. 이러한 XML문서를 RDBMS에서 저장해서 사용하기 위한 많은 노력이 있으나 구조적으로 XML문서는 트리구조이어서 관계형 DB에 자료를 질의하기 위한 언어인 SQL과 완벽한 호환을 이루지 못한다 그래서 W3C의 XML 표준 질의인 XQuery가 등장하게 되었다. 이 논문에서는 공간 정보를 포함한 XML 정보들을 RDBMS에 저 장후 공간연산자, 공간함수를 통한 Sqatial XQuery2SQL이라는 변환기를 통해서 Spatial XQuery를 SQL로 변환한 후 RDBMS에 있는 정보를 추출하는 Sqatial XQuery2SQL 변환 알고리즘을 구현하고자 한다.

  • PDF

지역 질의 생성기반 전역 XQuery 질의 처리 기법 (A Global XQuery Query Processing based on Local XQuery Query Generation)

  • 박종현;박원익;김영국;강지훈
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권11호
    • /
    • pp.11-20
    • /
    • 2010
  • XML 뷰는 분산 환경에서 이종 데이터들을 XML 데이터처럼 바라보며 XML로 통합하기 위한 방법으로 제안되었으며, 전역 XML 뷰는 분산되어 있는 다양한 형태의 이종 데이터들을 단일의 XML 데이터처럼 바라보며 질의할 수 있도록한다. 이때사용자가 사용하는표준질의어는 XQuery이며, 전역XML 뷰를대상으로 작성된 질의가 바로 전역XQuery 질의이다. 그러므로이를효과적으로 처리하기위한방법은분산 환경에서이종데이터들사이의 통합 및 검색을 위한 연구의 주제이다. 기존 SQL 질의 처리에서 알 수 있는 것처럼, 분산 질의 처리를 위한 방법들 가운데 가장 범용적으로 사용되는 방법 중 하나는 전역 질의를 지역 질의로 분할하여 분할된 지역 질의들을 처리하고, 그 결과를 취하여 전역 질의의 결과로 재구성하는 것이다. 그러나 XQuery는 FOR 절과 같은 SQL 질의어에서는 찾아볼 수 없는 복잡한 구조적 특성을 갖는다. 그러므로 전역 XQuery 질의의 처리를 위해 지역 질의를 생성하기 위해서는 고려해야 할 사항들이 존재한다. 본 논문에서는 전역 SQL 질의 처리를 위한 지역 질의 생성 기법을 전역 XQuery 질의의 처리를 위해 적용할 때 발생하는 문제점을 정의하고 이를 해결하기 위한 방법을 제안한다. 또한, 제안한 방법을 기반으로 하는 전역 XQuery 질의 처리기를 구현하여 그 효율성을 보인다.

지진 관측소 정보의 XML기반 통합 관리시스템 (Integrated Management System of Seismic Observatory Information based on XML)

  • 임인섭;정순기
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권8호
    • /
    • pp.117-125
    • /
    • 2009
  • 본 논문에서는 국내 지진관측소 정보의 XML기반 통합 관리시스템을 제안한다. 1998년도 이후부터 기상청, 한국지질자원연구원 등 지진관측소를 운영하고 있는 국내 기관이 점차 증가하고 있는 추세이다. 지진 데이터의 효율적인 활용을 위해서는 관측소 위치, 설치된 계기의 특성 및 운영 이력정보 등이 필수적이다. 각 기관별의 독자적인 관측소 정보관리로는 통일된 형태의 정보 제공이 이루어지지 못하고, 관측소 변경 정보의 신속한 전달에도 한계가 있다. 본 논문에서는 각 기관의 담당자가 웹을 통해 해당 기관의 관측소 정보를 관리하고, 이를 범국가적으로 통합하여 사용자들에게 제공할 수 있는 지진관측소 정보 통합 관리시스템을 제안하다. 지진 데이터를 이용하기 위해 필요한 최소한의 관측소 정보를 분석, XML을 이용하여 구조화하였다. 통합 관리시스템은 관측소 관리, 정보 검색 및 최신 정보제공 모듈 등으로 구성된다. 제안된 시스템을 통해 각 기관별 지진관측소 정보가 범국가적 차원에서 효율적으로 관리, 제공될 수 있을 것이다.

RDF 데이타에 대한 효율적인 검색 기법 (An Efficient Keyword Search Method on RDF Data)

  • 김진하;송인철;김명호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권6호
    • /
    • pp.495-504
    • /
    • 2008
  • 최근 문서나 웹 페이지뿐만 아니라 관계형 데이타나 XML 데이타, RDF 데이타 같은 구조화된 데이타에 대해서도 검색을 지원하고자 하는 연구가 활발히 진행되고 있다. 본 논문에서는 RDF 데이타에 대한 효율적인 검색 기법을 제안한다. 제안하는 기법은 먼저 RDF 데이타의 크기를 줄여 검색 성능을 높이고 검색 결과로 관련 있는 정보를 함께 반환해 주기 위해 RDF 데이타에서 관련 있는 노드와 에지를 묶어 새로운 RDF 그래프를 생성한다. 또한 검색 과정에서 검색의 결과를 정렬하기 위해 RDF 데이타 그래프의 노드와 예지에 키워드와의 연관도를 부여할 때, RDF 온톨로지 데이타의 특성을 활용함으로써 보다 사용자의 의도에 부합하는 검색 결과를 반환한다. 실제 RDF 데이타를 사용한 성능 비교 결과는 제안하는 기법이 RDF 데이타의 크기를 최대 2배까지 줄이고 기존 기법에 비해 검색 속도가 최대 5배 빠르다는 것을 보여준다.

FPGA를 이용한 하드웨어 기반 고성능 XML 파싱 기법 (Hardware-Based High Performance XML Parsing Technique Using an FPGA)

  • 이규희;서병석
    • 한국통신학회논문지
    • /
    • 제40권12호
    • /
    • pp.2469-2475
    • /
    • 2015
  • 다양한 웹 서비스들은 서비스의 제공을 위해서 구조화된 표준문서인 XML(eXtensible Markup Language)을 널리 사용하고 있으며, 모바일 환경에서의 전자문서 및 전자서명 그리고 메일시스템에서도 XML이 사용되고 있다. XML을 사용하기 위해서는 문서의 파싱이 요구되며, 이는 XML 처리에서 가장 계산 집중적 작업이다. 따라서, XML 파싱 성능을 높이기 위해 하드웨어 기반의 파서들이 제안되어 성능 향상에 초점을 맞추고 있지만 실제 파싱 기법들에 대한 연구는 거의 이루어지지 않았다. 본 논문에서는 파서의 종류와 상관없이 사용될 수 있는 고성능 XML 파싱 기법을 제안하고 FPGA를 이용하여 파서를 설계하여 검증하였다. 제안된 파싱 기법은 상태머신 대신에 엘리먼트 분석기들을 사용하며 다중바이트 단위 엘리먼트 매칭을 수행한다. 제안된 파싱 기법은 CPB 항목에서 약 2~4배의 소비 클록을 감소시켰으며 파싱 이전에 전처리작업을 요구하지 않는다. 다른 파서들과 비교하여 제안된 파서는 약 1.33~1.82배 속도를 향상시켰다. 따라서, 제안된 파싱 기법은 실시간 XML 파싱이 가능하며 일반적인 XML 파서들에서도 적용할 수 있는 적합한 구조를 갖는다.

대용량 OWL 온톨로지 자동구축을 위한 세종전자사전 활용 방법론 연구 (A Study of Methodology for Automatic Construction of OWL Ontologies from Sejong Electronic Dictionary)

  • 송도규
    • 한국언어정보학회지:언어와정보
    • /
    • 제9권1호
    • /
    • pp.19-34
    • /
    • 2005
  • Ontology is an indispensable component in intelligent and semantic processing of knowledge and information, such as in semantic web. However, ontology construction requires vast amount of data collection and arduous efforts in processing these un-structured data. This study proposed a methodology to automatically construct and generate ontologies from Sejong Electronic Dictionary. As Sejong Electronic Dictionary is structured in XML format, it can be processed automatically by computer programmed tools into an OWL(Web Ontology Language)-based ontologies as specified in W3C . This paper presents the process and concrete application of this methodology.

  • PDF

APPLICATION OF HIGH RESOLUTION SATELLITE IMAGERY ON X3D-BASED SEMANTIC WEB USING SMART GRAPHICS

  • Kim, Hak-Hoon;Lee, Kiwon
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2006년도 Proceedings of ISRS 2006 PORSEC Volume II
    • /
    • pp.586-589
    • /
    • 2006
  • High resolution satellite imagery is regarded as one of the important data sets to engineering application, as well as conventional scientific application. However, despite this general view, there are a few target applications using this information. In this study, the possibility for the future wide uses in associated with smart graphics of this information is investigated. The concept of smart graphics can be termed intelligent graphics with XML-based structure and knowledge related to semantic web, which is a useful component for the data dissemination framework model in a multi-layered web-based application. In the first step in this study, high resolution imagery is transformed to GML (Geographic Markup Language)-based structure with attribute schema and geo-references. In the second, this information is linked with GIS data sets, and this fused data set is represented in the X3D (eXtensible 3D), ISO-based web 3D graphic standard, with styling attributes, in the next stop. The main advantages of this approach using GML and X3D are the flourished representations of a source data according to user/clients’ needs and structured 3D visualization linked with other XML-based application. As for the demonstration of this scheme, 3D urban modelling case with actual data sets is presented.

  • PDF

감염관리를 위한 항생제 사용량 데이터마트의 구축 (Building the Data Mart on Antibiotic Usage for Infection Control)

  • 임인수
    • 대한임상검사과학회지
    • /
    • 제48권4호
    • /
    • pp.348-354
    • /
    • 2016
  • 병원정보시스템에 저장되어 있는 자료들은 적절성 평가 및 질관리를 향상시키는 데 있어 많은 잠재력을 가지고 있으며 이를 기반으로 하는 데이터웨어하우스의 구축은 질 관리의 향상과 임상진료에 많은 도움을 줄 수 있는 것으로 알려져 있다. 본 연구는 감염관리 정보의 체계적이고 효과적인 자료 분석을 위한 일환으로 항생제 사용량 분석이 가능한 데이터마트를 구축하였다. 감염관리의 구성요소 및 평가 척도를 선정 후 XML DTD 방법으로 메타데이터를 설계하였고 모델링을 통해 데이터마트를 구축하여 항생제 사용량 분석을 위한 다차원 분석 도구인 OLAP를 시현하였다. 실험 자료는 1997년 7월 한 달 동안의 천안 지역의 일개 대학병원의 항생제 사용량 자료를 이용하였다. 감염관리 메타데이터의 상위요소는 항생제 내성 정보, 항생제 사용량 정보, 감염 정보, 검사 정보, 환자 정보 및 감염 관련 비용으로서 구성하였다. 이 중 항생제 사용량 정보를 스타 스키마에 적용하기 위한 데이터베이스의 설계를 하여 데이터마트를 구축하였다. 그리고 일 개월 간 사용된 항생제 사용량에 대해 OLAP을 시현하였다. 본 연구는 XML과 OLAP 기술의 구현을 통해 항생제 사용량에 대한 감염관리 데이터마트를 수립하였다. 개념적이고 구조화된 데이터마트의 구축은 감염관리 정보에 대해 신속하고 다양한 분석을 제공할 것으로 사료되었다.

비분류표시 데이타를 이용하는 분류 기반 Co-training 방법 (A Co-training Method based on Classification Using Unlabeled Data)

  • 윤혜성;이상호;박승수;용환승;김주한
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권8호
    • /
    • pp.991-998
    • /
    • 2004
  • 생물 정보학 등 많은 응용 분야에서 데이타 분석을 할 때는 적은 수의 분류표시된 데이터 (labeled data)와 많은 수의 비분류표시된 데이타(unlabeled data)가 있을 수 있다 분류표시된 자료는 사람의 노력이 요구되기 때문에 얻기가 어렵고 비용이 많이 들지만, 비분류표시된 자료는 별 어려움 없이 쉽게 얻을 수 있다. 이때 비분류표시된 자료를 이용하여 자료를 분류하고 분석하는데 널리 이용되고 있는 방법이 co-training 알고리즘이다. 이 방법은 적은 수의 분류표시된 자료에서 두 가지 뷰(view)로 각 분류자를 학습한다. 그리고 각 분류자는 분석하고자 하는 모든 비분류표시된 자료에서 가장 만족할만한 예측자들을 만들어 나간다. 이렇게 훈련 데이타 셋에서 실험을 여러 번 반복적으로 하게 되면 각 뷰에서 새로운 분류자가 학습되어 분류표시된 자료의 수가 증가한다. 본 논문에서는 비분류표시된 데이타를 이용하여 새로운 co-training 방법을 제시한다. 이 방법은 두 가지 분류자와 WebKB 및 BIND XML의 2가지 실험 데이타를 가지고 평가하였다. 실험 결과로서, 이 논문에서 제안한 co-training 방법이 분류표시된 자료의 수가 매우 적을 때 분류정확성을 효과적으로 향상시킬 수 있음을 보였다.