• 제목/요약/키워드: Web Parsing

검색결과 59건 처리시간 0.026초

적응적 병렬 검색을 지원하는 스트리밍 XML 파서 (A Streaming XML Parser Supporting Adaptive Parallel Search)

  • 이규희;한상수
    • 한국정보통신학회논문지
    • /
    • 제17권8호
    • /
    • pp.1851-1856
    • /
    • 2013
  • XML은 SOAP(Simple Object Access Protocol)와 REST(Representational State Transfer) 같은 웹서비스들을 위해 널리 사용되며 데이터를 표현하기 위한 사실상의 표준이다. DOM(Document Object Model)을 사용하는 XML 파서는 DOM 트리로 생성하여 메모리에 저장하는 전처리가 요구되기 때문에, 제한적 자원을 갖는 임베디드 시스템들은 일반적으로 전처리를 요구하지 않는 스트리밍 XML 파서를 채택하여 사용하고 있다. 본 논문에서는 FPGA(Field Programmable Gate Array)에서 적응적 병렬 검색을 사용하는 스트리밍 XML 파서를 위한 새로운 구조를 제안한다. 제안된 APSearch(Adaptive Parallel Search) 파서는 이전 연구들과 비교하여 소프트웨어의 오버헤드를 상당 수 감소시켰으며 XML 파싱을 위한 처리 시간이 약 2.55배와 2.96배 향상되었다. 따라서, 제안된 APSearch 파서는 XML 파싱을 가속화하기 위한 시스템들에 적합한 구조이다.

XML을 이용한 웹 문서 수집기 설계 및 구현 (Design and implementation of web-robot using XML)

  • 이새벽;임희석
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2008년도 추계학술발표논문집
    • /
    • pp.49-52
    • /
    • 2008
  • 웹2.0, RIA(Rich Internet Application)의 발전으로 웹 기반 서비스가 다양해지고 기존의 응용프로그램 역시 웹 기반 인터페이스로 제공되면서 사용자 또한 단순 사용자가 아닌 서비스를 제공하는 컨슈머(Consumer)의 형태가 되었다. 따라서 웹 문서는 더욱 방대해 지고 검색, 분류, 색인 등을 위해서 웹문서의 수집이 새로운 형태로 필요하게 되었다. 그러나 기존의 데이터베이스 사용 방법이나, 문서의 전문을 파일형식으로 저장하는 방법은 웹문서를 이용하여 다양한 컨텐츠를 제공하기에 적합하지 않다. 그러므로 본 연구는 웹 문서를 파싱(Parsing)하여 필요한 부분을 XML파일 형태로 저장하여, 재사용성을 높이는데 초점을 맞추어 HTML을 파싱하고 자동으로 임의의 파일을 수집하는 문서수집기를 구현하게 되었다.

  • PDF

오픈소스기반의 지능형 개인 도움시스템(IPA) 개발방법 연구 (A Study on the Intelligent Personal Assistant Development Method Base on the Open Source)

  • 김길현;김영길
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 추계학술대회
    • /
    • pp.89-92
    • /
    • 2016
  • 최근 시리(siri)와 같이 사람의 말을 인식하고 대답해주는 서비스를 스마트폰 혹은 웹서비스로 제공해주고 있다. 이러한 지능형 처리를 위해서는 음성을 받아 드리고 웹상의 빅테이타를 검색하고 구문으로 분석, 정확도 부여등의 구현이 필요하다. 본 논문에서는 공개된 소스를 기반으로 하여 음성인식하는 ASR(Automatic Speech Recognition), 질문에 대한 내용을 데이터로 분석하고 응답을 만드는 QAS (Question Answering System), 결과를 음성으로 전달하는 TTS(Text to Speech) 로 구분하고 하나의 시스템으로 구현하는 연구와 분야별 적용될 수 있는 방법을 제안하고자 한다.

  • PDF

J2EE기반의 웹 애플리케이션을 위한 프리젠테이션 계층 자동생성 템플릿 개발 (Development of Template for Automatic Generation of Presentation Layer in J2EE-Based Web Applications)

  • 유철중;채정화;김송주;장옥배
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제9권2호
    • /
    • pp.133-145
    • /
    • 2003
  • J2EE(Jav $a^{™}$ 2 Platform, Enterprise Edition) 기반의 웹 애플리케이션은 기존의 애플리케이션이 갖는 시간적.공간적 제약을 극복하는 대안으로 대두되었다. 최근 웹 애플리케이션을 보다 빠르고 효율적으로 개발하기 위한 해결책으로 프레임워크를 이용하는 방안들이 다양하게 제기되고 있다. 본 논문에서는 계층구조를 갖는 웹 애플리케이션을 각 계층의 개발자들이 따로 프로그램을 개발할 수 있다는 점에 착안하여 프리젠테이션 계층에서 담당해야 할 여러 처리와 그 유형을 템플릿으로 제시하여 웹 애플리케이션의 프리젠테이션 계층을 보다 빠르게 개발할 수 있도록 한다. 이 템플릿은 사용자가 작성하고자 하는 웹 애플리케이션의 프리젠테이션 계층에 대한 정보를 나타내는 것으로 XML 형태의 문서이며, 이것을 입력받은 코드 생성기는 사용자 정보를 파싱한 후 주어진 웹 애플리케이션 프레임워크를 바탕으로 프리젠테이션 계층의 골격 코드를 자동 생성한다. 이것은 코드 생성기를 이용하여 프레임워크의 핫스팟 클래스들을 상속받은 골격 코드를 빠르게 생성할 수 있어 보다 효율적으로 웹 애플리케이션을 개발할 수 있음을 의미한다. 본 템플릿과 코드 생성기를 사용함으로써 개발자는 적은 학습량으로 웹 애플리케이션을 개발할 수 있고, 표준화시킨 개발 과정을 내포함으로써 다른 개발자와의 협력작업을 용이하게 하여 웹 애플리케이션을 적시에 개발할 수 있다.

참조연계 서비스 구현을 위한 참고문헌 식별자 매칭 시스템 (The Reference Identifier Matching System for Developing Reference Linking Service)

  • 이용식;이상기
    • 정보관리연구
    • /
    • 제41권3호
    • /
    • pp.191-209
    • /
    • 2010
  • 서로 다른 정보자원 간의 연결을 의미하는 참조연계 서비스를 위해서는 참고문헌 데이터베이스 구축과 식별자 매칭 작업이 필요하다. CrossRef, PubMed, Web Of Science 등의 많은 해외 기관들은 Inera의 eXstyles, Parity Computings의 Reference Extractor 등의 자동화 도구들을 이용하여 DOI, PMID 등의 식별자를 기반으로 하는 참조연계 체제를 구축하였다. 국내에서도 한국과학기술정보연구원, 한국연구재단 등의 여러 기관에서 참고문헌 데이터베이스를 구축하고 있다. 그러나 각 단체별로 채택하고 있는 다양한 참고문헌 기술 형식 때문에 망라적인 데이터베이스 구축은 많은 어려움에 직면해 있다. 이에 참고문헌을 자동으로 파싱하여 메타데이터를 추출하고, DOI, PMID, KOI의 식별자를 매칭하는 Citation Matcher 시스템을 개발하여 참고문헌 데이터베이스 구축의 효율성을 향상시키고자 한다.

다중바이트 기반 스트리밍 XML 하드웨어 파서의 설계 (Design of Multibyte-based Streaming XML Hardware Parser)

  • 이규희;서병석
    • 전자공학회논문지
    • /
    • 제52권9호
    • /
    • pp.135-140
    • /
    • 2015
  • 웹 서비스들은 데이터의 표현과 전송을 위해 구조화된 문서 XML을 채택하고 있다. SOAP나 REST는 XML을 이용하여 메시지를 송/수신하는 대표적 시스템들이다. XML 파서는 이벤트 기반과 DOM 기반 파서들로 나눌 수 있는데, 고속의 작업을 위해서 이벤트 기반인 스트리밍 파서가 널리 사용되지만, 순차 처리되는 특성을 갖기 때문에 성능향상에 제약이 있다. 본 논문에서는 스트리밍 파서에서의 순차 처리 특성을 해결하여 고성능 파서를 제안하기 위해 다중바이트 기반 하드웨어 파서를 제안한다. 제안된 구조는 다른 파서들과 비교하여 문자 비교에 사용되는 소비 클록의 수가 약 2.72배 감소하였고 약 7.8Gbps의 시스템 성능을 갖는다. 따라서, 제안된 MStreXHP 파서는 고성능 시스템들에서 스트리밍 XML 파서에 적합한 구조를 갖는다.

IVAG: An Integrative Visualization Application for Various Types of Genomic Data Based on R-Shiny and the Docker Platform

  • Lee, Tae-Rim;Ahn, Jin Mo;Kim, Gyuhee;Kim, Sangsoo
    • Genomics & Informatics
    • /
    • 제15권4호
    • /
    • pp.178-182
    • /
    • 2017
  • Next-generation sequencing (NGS) technology has become a trend in the genomics research area. There are many software programs and automated pipelines to analyze NGS data, which can ease the pain for traditional scientists who are not familiar with computer programming. However, downstream analyses, such as finding differentially expressed genes or visualizing linkage disequilibrium maps and genome-wide association study (GWAS) data, still remain a challenge. Here, we introduce a dockerized web application written in R using the Shiny platform to visualize pre-analyzed RNA sequencing and GWAS data. In addition, we have integrated a genome browser based on the JBrowse platform and an automated intermediate parsing process required for custom track construction, so that users can easily build and navigate their personal genome tracks with in-house datasets. This application will help scientists perform series of downstream analyses and obtain a more integrative understanding about various types of genomic data by interactively visualizing them with customizable options.

음성 웹서비스를 위한 VoiceXML 해석기의 설계 및 구현 (Design and Implementation of the VoiceXML Interpreter for Voice Web-service)

  • 신현경;강동남;염세훈;유재우
    • 한국음향학회지
    • /
    • 제20권4호
    • /
    • pp.42-47
    • /
    • 2001
  • 본 연구의 목적은 비 시각환경에서 웹 서비스를 위한 언어인 VoiceXML을 기존의 자동응답 시스템에 적용하기위해 VoiceXML문서의 마크-업을 인식하고, 문서가 문서 형정의 (DTD)에 적합한지를 검사하여 적합성이 확인되면 추상구문트리를 생성하는 DI 파서 (Document Instance Parser)와 생성된 추상구문트리를 이용하여, Voice-XML문서를 번역해주는 해석기를 제안하고자 한다. VoiceXML해석기는 DI 파서와 실행기로 구성되어 있으며, DI 파서는 Recursive descent 파싱 기법을, 실행기는 VXML 포럼에서 제안한 FIA (Form Interpretation Algorithm)를 사용하였다. 본 시스템은 VoiceXML 언어를 효율적으로 실행할 수 있는 환경 제공 및 시스템 개발의 편의성과 효율성을 위해 모듈화 설계가 가능한 자바언어를 사용함으로써 이 기종간의 이식성이 뛰어난 특징이 있다.

  • PDF

Implementation of AR Remote Rendering Techniques for Real-time Volumetric 3D Video

  • Lee, Daehyeon;Lee, Munyong;Lee, Sang-ha;Lee, Jaehyun;Kwon, Soonchul
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제12권2호
    • /
    • pp.90-97
    • /
    • 2020
  • Recently, with the growth of mixed reality industrial infrastructure, relevant convergence research has been proposed. For real-time mixed reality services such as remote video conferencing, the research on real-time acquisition-process-transfer methods is required. This paper aims to implement an AR remote rendering method of volumetric 3D video data. We have proposed and implemented two modules; one, the parsing module of the volumetric 3D video to a game engine, and two, the server rendering module. The result of the experiment showed that the volumetric 3D video sequence data of about 15 MB was compressed by 6-7%. The remote module was streamed at 27 fps at a 1200 by 1200 resolution. The results of this paper are expected to be applied to an AR cloud service.

TMO를 이용한 생체정보 수신모듈 구현 (The Implementation of Vital Sign Information Parsing Module using TMO(Time Triggered and Message Triggered Method))

  • 조의주;김천석;김광준
    • 한국전자통신학회논문지
    • /
    • 제3권4호
    • /
    • pp.247-253
    • /
    • 2008
  • 객체 지향 실시간 통신 분산 프로그래밍 구조를 구체적으로 나타내기 위해 시간 구동과 메시지 구동 (TMO : Time-triggered Message-triggered Object Model)에 대한 구조를 일반적인 형태의 구조로 모델링 하였으며, 이러한 모델링은 분산된 실시간 통신 객체와 비실시간 객체를 포함하여야 하고, 메시지 구동과 시간 구동을 모든 객체 구조 형태에 적용함으로서 실시간 통신 프로그래밍 설계가 이루어질 수 있다. 본 논문에서는 이러한 TMO 구조를 이용하여 실시간 통신 시뮬레이션 프로그래밍을 하기 위해 환자 모니터 원격진료 시스템 응용 환경에 적용하였다. Central Monitor로부터 전송되어진 환자의 생체정보 Raw Data가 HIS의 데이터 수신 모듈을 통해 사용가능한 데이터로 재구성될 수 있도록 설계가 이루어져 있다.

  • PDF