• 제목/요약/키워드: Korean Parser

검색결과 168건 처리시간 0.034초

SGML(Standardized Genernal Markup Language)에 대한 기본 파서의 구현 (Implementation of SGML Basic Parser)

  • 홍은선;정회경;이수연
    • 한국통신학회논문지
    • /
    • 제17권5호
    • /
    • pp.495-508
    • /
    • 1992
  • 이 논문은 SGML(Standardized General Markup Larguage)을 적용하여 작성된 SGML 문서와 DTD(Document Type Definition)를 분석하는 SGML파서(parser)의 설계를 기술한다. 먼저 SGML 규칙을 내포하는 yacc 정의 파일을 구성하였고, 이 파일에 의하여 SGML DTD와 문서를 적합한 토큰(token)으로 파싱하였다. 이 토근으로 SGML문서의 논리적 구조를 내부 구조화하고, 엔터티(entity)테이블(table),엘리먼트(element)테이블등을 생성하여 데이터베이스(database)를 구축하였으며,이를 이용하여 속성값 입력등의 다음 단계처리에 이용 할 수 있게 하였다. 또한 이 파서는 소규모 참조를 변화하여 확장하는 기능도 갖는다. 이 파서에 몇몇 SGML문서를 시험 적용하여 바르게 시행됨을 확인하였다.

  • PDF

Transition and Parsing State and Incrementality in Dynamic Syntax

  • Kobayashi, Masahiro;Yoshimoto, Kei
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2007년도 정기학술대회
    • /
    • pp.249-258
    • /
    • 2007
  • This paper presents an implementation of a gramar of Dynamic Syntax for Japanese. Dynamic Syntax is a grammar formalism which enables a parser to process a sentence in an incremental fashion, establishing the semantic representation. Currently the application of lexical rules and transition rules in Dynamic Syntax is carried out arbitrarily and this leads to inefficient parsing. This paper provides an algorithm of rule application and partitioned parsing state for efficient parsing with special reference to processing Japanese, which is one of head-final languages. At the present stage the parser is still small but can parse scrambled sentences, relative clause constructions, and embedded clauses. The parser is written in Prolog and this paper shows that the parser can process null arguments in a complex sentence in Japanese.

  • PDF

( )

  • 박철희;유재우
    • 정보과학회지
    • /
    • 제5권2호
    • /
    • pp.61-84
    • /
    • 1987
  • 1950년대 초기의 Compiler가 나온 이후로 지금까지 Compiler를 만드는 기 술이 급격히 발전해 왔다. Backus는 “초기의 FORTRAN Compiler를 만드는데 18man-years가 걸렸다”고 하였다. 그러나 현재에 이르러서는 Computer Science Department의 학생들이 Compiler구조 시간을 통하여 한학기 정도의 작업으로도 실제 Compiler를 설치할 수 있게 되었다. 이렇게 지난 20여년간 크게 발전할 수 있었던 이유에 대하여 Aho and Ullman은 Compilation과정을 modulor하게 구 성하는 법을 이해하였고, Compilation중의 여러 중요한 작업을 처리하는 조직 적 기술을 연구 개발 하였으며, 특히 이를 뒷받침하는 software tools을 개발 하였음을 말하고 있다. 여기서 말하는 compiler writing tools는 scanner (lexical analyzer)나 parser generators에서 크게는 compiler generator 혹은 compiler compiler를 의미하고 있다.

English Syntactic Disambiguation Using Parser's Ambiguity Type Information

  • Lee, Jae-Won;Kim, Sung-Dong;Chae, Jin-Seok;Lee, Jong-Woo;Kim, Do-Hyung
    • ETRI Journal
    • /
    • 제25권4호
    • /
    • pp.219-230
    • /
    • 2003
  • This paper describes a rule-based approach for syntactic disambiguation used by the English sentence parser in E-TRAN 2001, an English-Korean machine translation system. We propose Parser's Ambiguity Type Information (PATI) to automatically identify the types of ambiguities observed in competing candidate trees produced by the parser and synthesize the types into a formal representation. PATI provides an efficient way of encoding knowledge into grammar rules and calculating rule preference scores from a relatively small training corpus. In the overall scoring scheme for sorting the candidate trees, the rule preference scores are combined with other preference functions that are based on statistical information. We compare the enhanced grammar with the initial one in terms of the amount of ambiguity. The experimental results show that the rule preference scores could significantly increase the accuracy of ambiguity resolution.

  • PDF

ALi M3330 MPEG-2 디코더 프로세서를 이용한 DVB-T PSI(Program Specific Information) 해석기 설계 (DVB-T PSI(Program Specific Information) Parser using Design of Ali M3330 MPEG-2 decoder processor)

  • 전도영;김민성;김수현;유홍연;홍성훈
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2007년도 심포지엄 논문집 정보 및 제어부문
    • /
    • pp.278-280
    • /
    • 2007
  • In this paper, wd design the Program Specific Information (PSI) parser and its On-Screen Display (OSD) on the middleware of ALi M3330 MPEG-2 decoder processor to analyze DVB-T Transport Stream(TS) information. To test the functional operation of the designed parser, we implement the DVB-T test board including the RF-tuner using ALi M3330 MPEP-2 decoder processor and confirm the correct operation using the input TS stream generated by DVB-T stream generator. The developed PSI parser could be used for the test environment, various channel extension, and the development of DVB-T reception module.

  • PDF

중한번역에서 구 묶음을 이용한 파싱 효율 개선 (Improving Parsing Efficiency Using Chunking in Chinese-Korean Machine Translation)

  • 양재형;심광섭
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권8호
    • /
    • pp.1083-1091
    • /
    • 2004
  • 본 논문은 기계번역 시스템에서 파싱의 전처리 단계로 도입되는 구 묶음 시스템을 제안한다. 구 묶음 모듈은 구 묶음의 결과로 얻어지는 의존관계 제약을 통하여 분석 시스템의 성능향상에 기여할 수 있다. 중국어를 위한 구 묶음 시스템을 변형 기반 학습 기법에 근거하여 구현하며, 의존관계를 효과적으로 파서에 넘겨줄 수 있는 인터페이스를 고안한다. 구현된 모듈을 중한 기계번역 시스템에 통합하고, 중국 관련 웹사이트로부터 수집한 말뭉치를 이용한 실험을 통해 구 묶음의 도입이 기계번역에서 분석시스템의 성능 향상에 기여할 수 있음을 보인다.

규칙에 기반한 한국어 부분 구문분석기의 구현 (Implementing Korean Partial Parser based on Rules)

  • 이공주;김재훈
    • 정보처리학회논문지B
    • /
    • 제10B권4호
    • /
    • pp.389-396
    • /
    • 2003
  • 본 논문에서는 문법검사기나 기계번역과 같은 실제 응용 시스템을 위한 한국어 부분 구문분석의 처리 대상을 정의하고, 규칙에 기반한 한국어 부분 구문분석기의 구현에 대해서 논의한다. 부분 구문분석기는 기본적으로 여러 개의 형태소나 단어가 구문적으로 하나의 구조에 속한 경우 이를 하나의 덩어리로 묶어주는 역할을 수행하며, 동시에 부가적인 작업을 수행할 수 있다. 또한 부분 구문분석기는 다양한 형태로 표현된 부분 구조를 표준 형태소 구조로 바꾸어 줌으로써, 상위 모듈의 처리에서 그 결과를 용이하게 사용할 수 있도록 한다. 본 논문에서는 한국어 부분 구문분석을 위해서 수동으로 작성된 140여 개의 규칙을 이용하였으며, 각 규칙은 일반적인 규칙과 마찬가지로 조건부와 행위부로 구성되었다. 부분 구문분석의 효율성을 관찰하기 위해서 일반적인 구문분석과 부분 구문분석을 포함한 구문분석을 비교하였다. 실험을 통해서 전자가 후자에 비해 약 두 배의 레코드 수가 요구됨을 알 수 있었다.

A comparison of grammatical error detection techniques for an automated english scoring system

  • Lee, Songwook;Lee, Kong Joo
    • Journal of Advanced Marine Engineering and Technology
    • /
    • 제37권7호
    • /
    • pp.760-770
    • /
    • 2013
  • Detecting grammatical errors from a text is a long-history application. In this paper, we compare the performance of two grammatical error detection techniques, which are implemented as a sub-module of an automated English scoring system. One is to use a full syntactic parser, which has not only grammatical rules but also extra-grammatical rules in order to detect syntactic errors while paring. The other one is to use a finite state machine which can identify an error covering a small range of an input. In order to compare the two approaches, grammatical errors are divided into three parts; the first one is grammatical error that can be handled by both approaches, and the second one is errors that can be handled by only a full parser, and the last one is errors that can be done only in a finite state machine. By doing this, we can figure out the strength and the weakness of each approach. The evaluation results show that a full parsing approach can detect more errors than a finite state machine can, while the accuracy of the former is lower than that of the latter. We can conclude that a full parser is suitable for detecting grammatical errors with a long distance dependency, whereas a finite state machine works well on sentences with multiple grammatical errors.

항공응급의료체계에서의 의료신호 표준 부호화기 설계 (Design of Standard Encoder for Health information in aviation emergency medical service)

  • 이용희;김순석;김동호;이덕규;정호영
    • 한국항행학회논문지
    • /
    • 제15권6호
    • /
    • pp.1173-1179
    • /
    • 2011
  • 본 논문에서는 광역의료서비스인 항공응급의료체계에서 요구되는 심전도, 혈압등과 같은 의료신호를 저장하기 위해 표준방식인 부호화기를 구현하기 위한 파서를 설계한다. 부호화기는 MDER에 기초하여 테그에 의해 파형의 정보를 부호화하고 이를 저장하기 위한 방법으로서, 이를 구현하기 위해서는 각 테그의 적용 범위를 고려하여 부호화기의 파서 구조를 설계하여야 한다. 연구에서는 테그간의 영향을 미치는 범위를 고려하여 루트속성을 갖도록 한 부호화기 파서의 구조를 설계한다. 설계된 파서는 구현을 통해 다른 구조들과 비교한다.