• 제목/요약/키워드: XML Parsing

검색결과 58건 처리시간 0.024초

FPGA를 이용한 하드웨어 기반 고성능 XML 파싱 기법 (Hardware-Based High Performance XML Parsing Technique Using an FPGA)

  • 이규희;서병석
    • 한국통신학회논문지
    • /
    • 제40권12호
    • /
    • pp.2469-2475
    • /
    • 2015
  • 다양한 웹 서비스들은 서비스의 제공을 위해서 구조화된 표준문서인 XML(eXtensible Markup Language)을 널리 사용하고 있으며, 모바일 환경에서의 전자문서 및 전자서명 그리고 메일시스템에서도 XML이 사용되고 있다. XML을 사용하기 위해서는 문서의 파싱이 요구되며, 이는 XML 처리에서 가장 계산 집중적 작업이다. 따라서, XML 파싱 성능을 높이기 위해 하드웨어 기반의 파서들이 제안되어 성능 향상에 초점을 맞추고 있지만 실제 파싱 기법들에 대한 연구는 거의 이루어지지 않았다. 본 논문에서는 파서의 종류와 상관없이 사용될 수 있는 고성능 XML 파싱 기법을 제안하고 FPGA를 이용하여 파서를 설계하여 검증하였다. 제안된 파싱 기법은 상태머신 대신에 엘리먼트 분석기들을 사용하며 다중바이트 단위 엘리먼트 매칭을 수행한다. 제안된 파싱 기법은 CPB 항목에서 약 2~4배의 소비 클록을 감소시켰으며 파싱 이전에 전처리작업을 요구하지 않는다. 다른 파서들과 비교하여 제안된 파서는 약 1.33~1.82배 속도를 향상시켰다. 따라서, 제안된 파싱 기법은 실시간 XML 파싱이 가능하며 일반적인 XML 파서들에서도 적용할 수 있는 적합한 구조를 갖는다.

XML 파싱기법을 이용한 안드로이드 기반의 종합 날씨 정보 앱 설계 및 구현 (Design and Implementation of Android-based Total Weather Information Application using XML Parsing Techniques)

  • 이진욱;윤형수;하수철
    • 디지털콘텐츠학회 논문지
    • /
    • 제12권4호
    • /
    • pp.611-618
    • /
    • 2011
  • 본 논문은 XML(eXtensible Markup Language) 파싱(parsing)기법을 이용한 안드로이드 기반의 날씨 정보 어플리케이션의 설계 및 구현에 관한 사항이다. GPS 위치 프로바이더와 XML 파싱기법 이용하여 현재 위치에 따라 날씨 정보가 변하게 된다. 또한 알람 시스템을 이용하여 어플리케이션의 접속과 종료에 상관없이 알람 이벤트가 발생 될 때의 시간을 기준으로 날씨 정보를 음성(English)으로 출력한다. 모든 어플리케이션에서 사용자 인터페이스는 앱의 첫 인상이 중요하기 때문에 복잡하지 않고, 단순한 방법으로 사용자 인터페이스 설계를 하였다.

불완전 XML을 위한 파싱 방법 (A Parsing Method for an Incomplete XML)

  • 조경룡;조성언;박장우
    • 한국정보통신학회논문지
    • /
    • 제12권12호
    • /
    • pp.2153-2158
    • /
    • 2008
  • 대표적인 웹 문서의 표준인 XML은 문서의 구조와 내용을 기술하기 위해 태그로 이루어진 문법 구조를 갖는다. XML 문서 작성자는 XML 문서 작성 중 해당 XML DTD(Document Type Definition)에 문법적으로 올바르지 않은 문장을 입력할 수 있다. 즉, 일반적인 텍스트 에디터 환경에서 XML 문서에 입력되는 내용과 태그의 쌍은 완전하지 못한 형태로 입력될 수 있다. 문법적으로 불완전한 문장 입력은 사용자의 계속적인 편집 상태를 종료하고, 정상적인 파싱을 보장하지 않는 원인이 된다. XML 문서를 작성하는 과정에서 문법적으로 불완전한 문장 입력은 정상적인 파싱을 보장하지 않는다. 따라서, 에디터가 문법적으로 빠져있는 부분의 심볼이 무엇인지 정확히 인식 가능하고, 주어진 문법에 따라 부분적인 파스트리를 완성한다면, 사용자의 프로그래밍 편집 상태를 종료하지 않고 계속적인 편집과 성공적인 파싱을 보장할 수 있을 것이다. 본 논문은 XML 문서 편집기에 사용될 수 있는 XML 파서가 문법적으로 불충분한 문장의 입력에 대해 문법에 따라 빠진 부분을 인식하고, 누락된 문법 심벌을 찾아 부족한 부분 파스트리를 완성함으로써 사용자에게 성공적인 XML 문서 편집을 보장할 수 있는 파싱 방법을 제안한다. 제안된 파싱 방법을 통해 사용자는 프로그래밍 편집 중 문법 오류에 대한 부담을 줄일 수 있다. 또한, 사용자는 불완전 입력에 대해 일반적인 에러 처리에 따른 편집 중단 없이 계속적인 문서 파싱 을 보장받아 편집 효율을 높일 수 있다.

DTD 전자서명을 이용한 XML문서의 보안성 향상 (Security Elevation of XML Document Using DTD Digital Signature)

  • 김형균;오무송
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2002년도 추계종합학술대회
    • /
    • pp.592-596
    • /
    • 2002
  • DTD는 XML 문서에 표현될 자료의 의미를 정의한 메타 데이터라고 할 수 있다. 따라서 DTD 정보가 손상될 경우 이 정보를 기반으로 한 XML 문서의 보안은 심각한 문제점을 가지게 된다. 본 연구에서는 XML 문서의 송수신 과정에서 XML 문서에만 전자서명을 첨부하는 것이 아니라, DTD 에도 전자 서명을 첨부하는 방법을 제안하였다. 먼저 DTD파일을 끝까지 읽으면서 파싱을 하고 여기서 추출되는 엘리먼트나 속성, 엔티티들을 해시테이블에 저장한다. 파싱이 종료되면 해시 테이블을 읽어 들여서 메시지 다이제스트를 수행한다. 수행 후 이를 개인 키와 합성하여 전자 서명을 생성한다. 전자 서명 시 메시지 다이제스트 과정에서 바꿔 순서에 대해서는 검사하지 못하기 때문에 전혀 다른 다이제스트 값을 생성하는 문제가 발생되는데, 이것은 표준화된 구조와 문서에 대한 트리구조를 구현할 수 있는 DOM을 이용하여 DTD의 전자 서명을 생성하는 방법으로 해결하였다.

  • PDF

XML 기술과 스트링 매칭 기법을 이용한 구조 기반 정보 검색 알고리즘 (Structure Based Information Retrieval Algorithm Using XML Technology and String Matching Algorithm)

  • 한기덕;권혁철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (C)
    • /
    • pp.171-176
    • /
    • 2007
  • Parsing 작업의 결과인 Parse Tree 정보는 문장에 관한 구조적 정보를 가지고 있는 Tree 정보로 이 정보를 이용하여 정보 검색에 활용하는 알고리즘을 제안한다. 제안하는 알고리즘은 XML 기술과 스트링 매칭 기법을 이용하였으며, 사용한 스트링 매칭 기법은 Approximate String Matching 기법이다. Query 정보와 문서 정보를 Parsing하여 얻은 Parse Tree를 XML 형태의 정보로 변환한 후, 두 정보를 가지고 Approximate String Matching 기법을 적용하여 Query 정보와 문서 정보 간의 유사도를 계산한다. 제안하는 알고리즘의 장점은 구조 기반의 정보 검색 기능이 가능하고 비슷한 정보에 대한 검색 기능이 가능하며 비슷한 구조에 대한 검색 기능이 가능하다는 것이다.

  • PDF

적응적 병렬 검색을 지원하는 스트리밍 XML 파서 (A Streaming XML Parser Supporting Adaptive Parallel Search)

  • 이규희;한상수
    • 한국정보통신학회논문지
    • /
    • 제17권8호
    • /
    • pp.1851-1856
    • /
    • 2013
  • XML은 SOAP(Simple Object Access Protocol)와 REST(Representational State Transfer) 같은 웹서비스들을 위해 널리 사용되며 데이터를 표현하기 위한 사실상의 표준이다. DOM(Document Object Model)을 사용하는 XML 파서는 DOM 트리로 생성하여 메모리에 저장하는 전처리가 요구되기 때문에, 제한적 자원을 갖는 임베디드 시스템들은 일반적으로 전처리를 요구하지 않는 스트리밍 XML 파서를 채택하여 사용하고 있다. 본 논문에서는 FPGA(Field Programmable Gate Array)에서 적응적 병렬 검색을 사용하는 스트리밍 XML 파서를 위한 새로운 구조를 제안한다. 제안된 APSearch(Adaptive Parallel Search) 파서는 이전 연구들과 비교하여 소프트웨어의 오버헤드를 상당 수 감소시켰으며 XML 파싱을 위한 처리 시간이 약 2.55배와 2.96배 향상되었다. 따라서, 제안된 APSearch 파서는 XML 파싱을 가속화하기 위한 시스템들에 적합한 구조이다.

구조적 정보 검색을 위한 XQL 질의 처리 시스템 설계 (Design of XQL Query Processing System for Structural information retrieval)

  • 김상영;김철원;김광현;박종훈;정현철
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2003년도 추계종합학술대회
    • /
    • pp.892-896
    • /
    • 2003
  • XML은 단순히 웹 브라우저에 표시하기 위한 것을 넘어서 여러 다양한 시스템간, 어플리케이션간의 데이터 교환을 위한 인터페이스 포맷 등 다양한 분야에서 활용되고 있다. 이에 따라 정보의 생성, 재사용, 처리 및 지속성, 이식성 등 XML 문서를 효과적으로 관리하고 검색할 수 있는 시스템에 관한 많은 연구들이 진행되어 지고 있다. 본 논문에서는 XQL과 문서 구조 처리기와 질의 언어 처리기에 대해 설명하고 XML 문서의 내용을 트리구조로 만들어 구조정보를 파싱하는 동안 XQL을 이용해 질의에 맞는 XML 문서 트리 구조정보를 찾는 방법을 제시한다. 이를 통해 웹 상에 분산된 XML 문서를 병합하여 파싱한 후 문서의 구조 정보를 트리 구조로 구성하고 질의 언어로 제안되어진 XQL을 이용한 효율적인 XML 문서 검색 시스템의 설계 및 구현에 대하여 기술하였다.

  • PDF

Parsing KEGG XML Files to Find Shared and Duplicate Compounds Contained in Metabolic Pathway Maps: A Graph-Theoretical Perspective

  • Kang, Sung-Hui;Jang, Myung-Ha;Whang, Ji-Young;Park, Hyun-Seok
    • Genomics & Informatics
    • /
    • 제6권3호
    • /
    • pp.147-152
    • /
    • 2008
  • The basic graph layout technique, one of many visualization techniques, deals with the problem of positioning vertices in a way to maximize some measure of desirability in a graph. The technique is becoming critically important for further development of the field of systems biology. However, applying the appropriate automatic graph layout techniques to the genomic scale flow of metabolism requires an understanding of the characteristics and patterns of duplicate and shared vertices, which is crucial for bioinformatics software developers. In this paper, we provide the results of parsing KEGG XML files from a graph-theoretical perspective, for future research in the area of automatic layout techniques in biological pathway domains.

DTD 전자서명을 이용한 XML문서의 보안성 향상 (Security Elevation of XML Document Using DTD Digital Signature)

  • 박도준;민혜란;이준
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 춘계종합학술대회
    • /
    • pp.1080-1083
    • /
    • 2005
  • DTD는 XML 문서에 표현될 자료의 의미를 정의한 메타 데이터라고 할 수 있다. 따라서 DTD 정보가 손상될 경우 이 정보를 기반으로 한 XML 문서의 보안은 심각한 문제점을 가지게 된다. 본 연구에서는 XML 문서의 송수신 과정에서 XML 문서에만 전자서명을 첨부하는 것이 아니라, DTD 에도 전자 서명을 첨부하는 방법을 제안하였다. 먼저 DTD파일을 끝까지 읽으면서 파싱을 하고 여기서 추출되는 엘리먼트나 속성, 엔티티들을 해시테이블에 저장한다. 파싱이 종료되면 해시 테이블을 읽어 들여서 메시지 다이제스트를 수행한다. 수행 후 이를 개인 키와 합성하여 전자 서명을 생성한다. 전자 서명 시 메시지 다이제스트 과정에서 바뀐 순서에 대해서는 검사하지 못하기 때문에 전혀 다른 다이제스트 값을 생성하는 문제가 발생되는데, 이것은 표준화된 구조와 문서에 대한 트리 구조를 구현할 수 있는 DOM을 이용하여 DTD의 전자 서명을 생성하는 방법으로 해결하였다.

  • PDF

XML 문서의 관계형 데이터베이스 구조로의 동적 변환

  • 김유신;황부현
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅲ
    • /
    • pp.1581-1584
    • /
    • 2003
  • XML 문서 데이터를 데이터베이스에 저장할 때마다 관계형 데이터베이스에 XML 데이터를 파싱하여 그 요소를 각각의 적절한 테이블에 저장하는 방법은 언뜻 보기에는 가장 최적의 방법으로 보이지만 XML 운서 구조가 복잡해질수록 이 방법의 프로그램 로직은 복잡해지고 데이터 처리는 어려워진다. 그리고 계층이 깊은 복잡한 구조의 XML 문서일 경우 관계형 데이터베이스 테이블 구조로는 매핑이 불가능한 경우도 발생한다. 중첩된 구조의 복잡한 XML 데이터를 RDBMS에 저장할 경우 데이터 질의 시 여러 테이블에 걸친 복잡한 연산이 필요하고, XML 데이터의 입력, 수정, 삭제 시 모든 ROW에 걸어야 하는 LOCKING은 시스템의 성능을 떨어뜨릴 수 있다 또한 XML 문서 스키마가 어떻게 바뀌는 가에 따라서 새로 구성해야하는 복잡한 과정을 거칠 수도 있다는 것이다. 이 논문에서는 XML과 데이터베이스와의 공존이라는 측면에서 XML 문서의 관계형 데이터베이스 구조로의 동적 변환에 대하여 연구하고자 한다.

  • PDF