• Title/Summary/Keyword: 파싱

Search Result 385, Processing Time 0.027 seconds

Performance Comparison of XML Parsers for Android Applications (안드로이드 애플리케이션을 위한 XML 파서 성능비교)

  • Jeong, Kil-Hyun;Lee, Jong-Jin;Lee, Jin-Won
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2012.01a
    • /
    • pp.97-99
    • /
    • 2012
  • 모바일 애플리케이션의 다양한 개발 방법 중에서 파서는 중요한 요소로써 쓰이고 있으며 그 종류에는 여러 가지가 있다. 또 각 파서마다 데이터를 파싱하는 방법이 모두 다르며 구현되는 구조 또한 다르다. 본 논문에서는 이렇게 여러 가지 형태로 구현되는 파서를 분석하여 웹 서버를 거쳐 데이터베이스에 접근하는 방식을 좀 더 신속하고 효율적인 구조로 구현하고자한다. 구현방법으로는 파서의 성능 비교를 웹 전송부분을 제외한 파싱 속도를 측정한 방법과 웹 전송부분을 포함한 파싱 속도를 측정하는 두 가지 방법을 통하여 비교하였다. 그 결과, 웹 전송부분을 제외한 방법에서는 DOM 파서가 가장 좋은 성능을 보여주었고 웹 전송부분을 포함한 방법에서는 SAX 파서가 가장 좋은 성능을 보여주었다. 이러한 결과는 안드로이드 애플리케이션에서 웹 서버를 경유하여 데이터를 가져와 파싱하는데 사용할 파서를 선택하는데 도움을 줄 수 있다.

  • PDF

Design of Multi-document Parsing System for Mobile Device (휴대단말용 다중 마크업 문서 파싱 시스템 설계)

  • 최은정;손지연;한동원
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10e
    • /
    • pp.247-249
    • /
    • 2002
  • 본 논문에서는 휴대단말용 유무선 통합 브라우저를 위한 다중 문서 파싱 시스템을 제안한다. 현재 유무선 인터넷 서비스를 지원하기 위해 단일화된 표준 마크업 언어가 없다. 따라서, 유무선 통합 브라우저를 설계하려면 이들 각기 다른 마크업 언어의 지원을 생각하지 않을 수 없다. 이를 지원하기 위해 본 논문에서는 모든 마크업의 공통 분모 격인 파서를 설계하였으며, 각기 다른 사양의 휴대단말에 적합하게 표현하기 위해 그래픽 사용자 인터페이스 객체를 생성하는 방법을 제안하기로 한다. 이를 위해, 파서는 마크업 언어의 그래픽 기능을 휴대단말에서 지원 가능한 그래픽 사용자 인터페이스 객체 형태의 결과물을 만들어 내다. 이 결과물은 추후에 브라우저의 사용자 인터페이스 모듈과 연동될 것이다. 이러한 파싱 시스템은 브라우저로 하여금 모든 언어를 파싱할 수 있도록 하는 한편, 여러 언어 표준을 지원하려는 브라우저에 부담을 최소화시키는 기법이다.

  • PDF

Implementation and Performance Evaluation of JX-PullParser using JFlex and BYacc/J (JFlex와 BYacc/J를 이용한 JX-PullParSer의 구현 및 성능 평가)

  • 장주현;노희영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.862-864
    • /
    • 2004
  • 현재 XML은 HTML의 대체 마크업 언어로써 그 사용이 확대되어 지고, 또한 XML 데이터를 위한 파서 모델과 파서 구현방식에 대한 연구가 진행되고 있다. 그 연구의 결과로 벤치마킹에서 PULL모델이 빠른 파싱 속도를 나타내었고, 파서의 구현 방식에 있어서는 PULL 모델 파서인 piccolo에서 사용한 parser generator tool인 JFlex와 BYacc/J를 사용하는 방법이 기존 파서 구현 방식에서 사용하던 Hand-write 방식보다 파싱이 빠른결과 [1]를 내 놓았다. 또한 이 두 방법을 이용하여 기존의 파서 보다 파싱을 위한 시스템 설계를 제안하였다[2]. 본 논문에서는 JX-PullParser 시스템을 구현하였고, xml 파서 속도 비교 도구인 saxbench 속도 비교 도구를 사용하여 기존 파서보다 빠른 파싱 속도를 보이는 것을 입증하였다.

  • PDF

Korean Dependency Parsing Based on Learning Weights of Features (자질 가중치 학습을 이용한 한국어 의존파싱)

  • Kim, Young-Tae;Ra, Dong-Yul;Lim, SooJong
    • Annual Conference on Human and Language Technology
    • /
    • 2010.10a
    • /
    • pp.63-67
    • /
    • 2010
  • 본 논문에서는 자질(feature)의 가중치를 학습하여 이용하는 기계학습 기반 한국어 의존 파싱 기법을 소개한다. 이를 위하여 모든 가능한 의존관계에 대하여 각 의존관계마다 일정한 수의 자질을 생성한다. 자질마다 가중치에 의하여 그 중요도를 나타낸다. 자질의 가중치 값은 의존관계가 태깅된 구문구조 학습 말뭉치를 이용하여 학습한다. 이를 위해 본 논문에서는 간단한 가중치 기계학습 기법을 제시한다. 실험을 위한 언어 자원으로는 구구조부착 세종말뭉치를 변환하여 구한 의존관계 부착 말뭉치를 사용하였다. 실험 결과 약 86.5%의 정확률을 가지는 의존파싱이 가능함을 관찰하였다.

  • PDF

Automatic Data Augmentation for Korean AMR Sembanking & Parsing (한국어 의미 자원 구축 및 의미 파싱을 위한 Korean AMR 데이터 자동 증강)

  • Choe, Hyonsu;Min, Jinwoo;Na, Seung-Hoon;Kim, Hansaem
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.287-291
    • /
    • 2020
  • 본 연구에서는 한국어 의미 표상 자원 구축과 의미 파싱 성능 향상을 위한 데이터 자동 증강 방법을 제안하고 수동 구축 결과 대비 자동 변환 정확도를 보인다. 지도 학습 기반의 AMR 파싱 모델이 유의미한 성능에 도달하려면 대량의 주석 데이터가 반드시 필요하다. 본 연구에서는 기성 언어 분석 기술 또는 기존에 구축된 말뭉치의 주석 정보를 바탕으로 Semi-AMR 데이터를 변환해내는 알고리즘을 제시하며, 자동 변환 결과는 Gold-standard 데이터에 대해 Smatch F1 0.46의 일치도를 보였다. 일정 수준 이상의 정확도를 보이는 자동 증강 데이터는 주석 프로젝트에 소요되는 비용을 경감시키는 데에 활용될 수 있다.

  • PDF

Improvement of LR Parser using Reduction Goals (리덕션 골을 이용한 LR 파서의 개선)

  • Son, Yun-Sik;Oh, Se-Man
    • Journal of Korea Multimedia Society
    • /
    • v.11 no.5
    • /
    • pp.703-709
    • /
    • 2008
  • The methodology of the compiler construction improved by well-defined parsing techniques and developments of automatic generation tools. Through them, a variety of compilers for the special applications can be developed effectively: particularly, the compiler for embedded/mobile devices. Also, as contents industry is proliferating recently, the necessity of developing a compiler which is suitable for contents system is highly increasing. These various demands can be resolved by modular techniques and automatic construction of compilers. But, optimization of compiler itself as development tools uses heuristic methods and it needs higher cost. In this paper, we suggest the parsing method which can decrease unnecessary reduce actions by analyzing the characteristics of LR parser. The suggested parsing technique uses lookahead/ states, reachable reduction goals information in parsing process and enhances the parsing efficiency by changing continuous reduce actions to one. Actually, we applied it to the front-end of ANSI C compiler and proved the parsing performance in terms of the number of reduce actions.

  • PDF

A Parsing Method for an Incomplete XML (불완전 XML을 위한 파싱 방법)

  • Cho, Kyung-Ryong;Cho, Sung-Eon;Park, Jang-Woo
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.12 no.12
    • /
    • pp.2153-2158
    • /
    • 2008
  • XML is one of standard web languages. XML has a syntax architecture consisted of tags, which are used to descript contents and structures of a XML document. In XML documents, missing of markup tag is one of common factors generating incomplete inputs. Usually, editors will recognize incomplete inputs as syntax errors. And so, when editors find them, they will highlight lines in which syntax errors happened, and execute appropriate error handling routines. But, there are no more parsing actions. In this paper, we propose a method to recognize incomplete input strings and keep parsing phases going. To recognize pars missed grammatically in incomplete inputs and create them newly, we use an expanding parsing table. It includes additional parsing actions for newly generated input symbols. Through the information, incomplete inputs will be completed and parsing steps will be finished successively. Therefore, users can be assured that they make always correct XML documents, even if inputs are incomplete, and can not be nervous about input faults.

Ontology Parser Design for Speed Improvement of Ontology Parsing (온톨로지 파싱 속도향상을 위한 온톨로지 파서 설계)

  • Kim, Won-Pil;Kong, Hyun-Jang
    • Journal of the Institute of Electronics Engineers of Korea CI
    • /
    • v.47 no.4
    • /
    • pp.96-101
    • /
    • 2010
  • The core study of semantic web is the efficiency of ontology parsing. The ontology parsing and inference is based on the significant information retrieval which is the ultimate purpose of semantic web. However, most existing ontology writing tools were not processing the efficient ontology parsing. Therefore, we design the two steps ontology parser for extracting the all facts, are included in the ontology, more fast in this study. In the first step, the token extractor collects the all tokens of ontology and the triple extractor extracts the statements in the collected tokens. In conclusion, we confirm that which is designed in this study, processes the ontology parsing more faster than the existing ontology parsers.

A Robust Korean Spoken Language Parsing Based on Core Concept (핵심개념 기반의 강건한 한국어 대화체 파싱)

  • No, Seo-Yeong;Jeong, Cheon-Yeong;Seo, Yeong-Hun
    • The Transactions of the Korea Information Processing Society
    • /
    • v.6 no.8
    • /
    • pp.2113-2123
    • /
    • 1999
  • The partial free order feature of Korean makes grammar size represented by CFG too big and that's why grammar has to contain all the ordered words. There are some problems to parse spoken language, because spontaneous spoken language has special features such as meaningless words, repetitious speech, etc. So, in this paper, we define 'Core-Concept' as the necessary element for parsing and we describe grammar only using Core-Concept. And we can prevent grammar from becoming very large and reduce an additional parsing burden as we select. Core-Concept described in grammar as parsing element. Through this strategy, we present that the simplified grammar can give us more efficient method to get right results. Experiments show that our parsing strategy has an average of 98% or over success rate in correct parsing results.

  • PDF

Functional Expansion of Morphological Analyzer Based on Longest Phrase Matching For Efficient Korean Parsing (효율적인 한국어 파싱을 위한 최장일치 기반의 형태소 분석기 기능 확장)

  • Lee, Hyeon-yoeng;Lee, Jong-seok;Kang, Byeong-do;Yang, Seung-weon
    • Journal of Digital Contents Society
    • /
    • v.17 no.3
    • /
    • pp.203-210
    • /
    • 2016
  • Korean is free of omission of sentence elements and modifying scope, so managing it on morphological analyzer is better than parser. In this paper, we propose functional expansion methods of the morphological analyzer to ease the burden of parsing. This method is a longest phrase matching method. When the series of several morpheme have one syntax category by processing of Unknown-words, Compound verbs, Compound nouns, Numbers and Symbols, our method combines them into a syntactic unit. And then, it is to treat by giving them a semantic features as syntax unit. The proposed morphological analysis method removes unnecessary morphological ambiguities and deceases results of morphological analysis, so improves accuracy of tagger and parser. By empirical results, we found that our method deceases 73.4% of Parsing tree and 52.4% of parsing time on average.