• Title/Summary/Keyword: 구문 분석기

Search Result 173, Processing Time 0.023 seconds

SERI Test Suites '97 : Test Sentences for Korean Syntactic Analyser (SERI Test Suites '97 : 한국어 구문분석기 성능 평가용 문장 모음)

  • Sung, Won-Kyung;Jang, Myung-Gil;Park, Jae-Deuk;Ryu, Pum-Mo;Lee, Hyun-A;Park, Dong-In
    • Annual Conference on Human and Language Technology
    • /
    • 1997.10a
    • /
    • pp.320-326
    • /
    • 1997
  • 자연어 정보처리 분야의 거듭된 발전은 다양한 언어처리 도구들의 출현을 가져왔다. 그러나 객관적인 성능 평가 기준의 부재로 인해, 개발된 도구들은 임의의 기준에 따라 평가될 수 밖에 없었다. 그 결과 성능 평가 결과는 평가자와 평가자가 제안한 기준에 따라 다를 수 밖에 없었고 따라서 평가 결과 자체 역시 설득력을 갖을 수가 없었다. 이와 같은 문제에 대한 해결책을 찾고자 하는 노력의 일환으로, 본 연구에서는 한국어처리 도구들 중 특히 구문분석기의 체계적이고도 객관적인 성능 평가를 목적으로 제작된 문장들과 관련 주석 정보들로 구성된 SERI Test Suites '97을 소개한다.

  • PDF

Design and Implementation of Executable File Format Generator (실행 파일 포맷 생성기의 설계 및 구현)

  • Son Yunsik;Oh Seman
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.11a
    • /
    • pp.623-626
    • /
    • 2004
  • EVM(Embedded Virtual Machine)은 임베디드 시스템을 위한 가상기계로서 플랫폼에 독립적이며, 모바일 디바이스와 디지털 TV등에 탑재할 수 있는 핵심 기술로 다운로드 솔루션에서는 꼭 필요한 기술이다. SIL(Standard Intermediate Language)은 임베디드 시스템을 위한 가상기계의 표준 중간 언어로 객체지향 프로그래밍 언어와 순차 적인 프로그래밍언어를 모두 수용할 수 있다. SIL로 기술된 프로그램이 EVM 에서 실행되기 위해서는 EFF(Executable File Format)형태로 변환되어야 한다. 임베디드 시스템을 위한 실행 파일 포맷인 EFF 는 구조가 간결하며 확장이 용이한 특징을 지닌다. 또한 메타데이터와 표준 중간 언어가 서로 독립적으로 구성되어 분석이 쉽고 타입 체크가 편리한 구조이다. 본 논문에서는 가상기계를 위한 표준 중간 언어인 SIL 을 EVM 에서 실행 가능한 형태로 변환시켜주는 실행 파일 포맷 생성기(EFF Generator)를 설계하고 구현한다. 먼저, SIL 구조를 위한 SIL 문법을 설계하고 파서 생성기(PGS)를 사용하여 SIL 프로그램을 위한 어휘분석기와 구문분석기를 구현한다. 그리고 AST를 생성한 후. 포맷 생성기를 통하여 AST를 운행하며 EFF를 생성한다.

  • PDF

The Implementation of Korean Morphological Analyzer Using Hierarchical Symbolic Connectivity Information (계층적 기호 접속정도를 이용한 한국어 형태소 분석기의 구현)

  • Lee, Eun-Chul;Lee, Jong-Hyeok
    • Annual Conference on Human and Language Technology
    • /
    • 1992.10a
    • /
    • pp.95-104
    • /
    • 1992
  • 본 논문은 구문해석, 의미해석 등의 전처리 단계로서의 형태소 분석기 구현에 대해 기술하고자 한다. 먼저 기존의 접속정보의 단점을 보완하는 새로운 접속정보를 정의한다. 이 접속정보는 계층적구조를 가지고 심볼로써 표현되며, 기존의 좌우 두 가지 접속정보를 사용한 방법과는 달리 좌우를 하나로 통합한 정보를 사용한다. 따라서 접속정보 유지와 확장에 편의를 제공해 주고 접속정보 부여시 정확성을 더할 수 있고, 계층적구조를 살려서 접속정보표의 구성을 용이하게 한다. 또한 불규칙활용에 있어서는 사전정보에 의한 선언적 방법과 프러시져에 의한 절차적 방법의 장점을 살려 혼용하였다. 끝으로 앞에서 정의된 새로운 접속정보 방식의 장점을 살려서 정확한 분석 결과를 얻을 수 있는 형태소 분석기의 구현에 대해 설명한다.

  • PDF

Design and Implementation of an ADL Processor (ADL처리기의 설계와 구현)

  • 신동익;노성환;최재각;전태웅
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10a
    • /
    • pp.382-384
    • /
    • 2001
  • 잘 정의된 소프트웨어 아키텍쳐는 복잡성과 무형성으로 인한 소프트웨어의 개발과 진화의 어려움을 상당히 해소할 수 있다. 소프트웨어 시스템을 아키텍쳐 수준에서 효과적으로 설계, 분석하기 위해서는 아키텍쳐 기술 언어 (ADL)와 이를 지원하는 도구의 사용이 필요하다. 본 논문은 컴포넌트 기반의 도메인 아키덱쳐 모델링 시C2스타일의 아키덱쳐 기술을 지원할 수 있도록 본 연구팀이 정의한ADL로 기술된 아키텍쳐 모델의 편집과 구문 및 의미상의 오류검사를 지원하는 ADL 처리기의 설계와 구현방법을 기술한다.

  • PDF

Parsing simulink mdl file and C# data structure for Testing (Testing을 위한 Simulink mdl파일의 파싱과 C# 자료구조)

  • Choi, Yong-Jae;Choi, Gyeong-Hee;Chung, Gi-Hyeon
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2010.06b
    • /
    • pp.414-418
    • /
    • 2010
  • 많은 분야에서 사용되는 matlab을 이용한 test방식을 좀 더 유연하고 원하는 기능을 만들어 사용하기 위해 matlab의 데이터 저장 파일인 mdl 파일의 내부 구조를 분석하고 구문 분석기로 파싱하여 실행 가능한 그래프를 나타내는 자료구조를 만든다.

  • PDF

A Corpus-based Hybrid Translation System for Limited Domain (제한된 도메인을 위한 코퍼스 기반의 하이브리드 번역 시스템)

  • Kang, Un-Gu;Kim, Sung-Hyun;Lee, Byung-Mun;Lee, Young-Ho
    • Journal of KIISE:Software and Applications
    • /
    • v.37 no.11
    • /
    • pp.826-836
    • /
    • 2010
  • This paper proposes a hybrid machine translation system which integrates SMT, RBMT, and PBMT in serial manner. SMT in our project has been implemented as a Quasi-syntax-based system where monotone search is done, given a preprocessed string of foreign language. Preprocessing includes rule-based reordering, NE recognition, clausal splitting, and attaching pattern translation information at the end of the input text. For lengthy & complex sentences, clausal splitting turned out to generate better translation than normal input.

Extraction of Information for Executable Code Generation to Formal Specification (정형명세에 대한 실행코드 생성을 위한 정보 추출)

  • Ko, Hyun;Lee, Moon-Kun;Lee, Yon-Sik
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.10a
    • /
    • pp.355-358
    • /
    • 2001
  • 본 논문은 순환공학 환경에서 실시간 시스템 개발 및 검증을 위한 실행코드 생성기 구현과정에서 ATM(Abstract Timed Machine)으로 명세된 실시간 시스템에 대한 정형명세와 명세분석을 통해 생성된 SRL(Software Representation Language) 코드로부터 실행코드로의 변환을 위해 필요한 정보들을 명세하고 이들의 추출 방법을 제시한다. ATM정형기법을 적용하여 실시간 시스템 개발 및 검증을 위해서는 시스템 명세도구나 명세분석을 위한 분석기, 코드 생성기, 검증기 등과 같은 자동화 도구의 개발이 요구된다. 따라서, 본 논문에서는 순환공학 환경에서의 실시간 시스템의 효율적 개발 및 검증을 위하여 사용될 실행코드 생성기 구현을 위하여, 특정 물리적 환경에서의 실시간 시스템을 명세한 DoME/ATM 스크립트 코드에 대한 SRL 코드로의 변환 시 필요한 정보들을 추출하고, 이를 기반으로 SRL 분석기와 SRL 파스트리 생성기를 이용한 Ada 실행코드로의 변환 시 필요한 실행코드 모듈구조 및 실행구문, 코드 실행 우선순위 결정 둥과 같은 관련된 정보들의 추출 방법을 제시한다.

  • PDF

Implementation of summarization system for documents by using a word co-occurrence graph (단어의 공기 관계 그래프를 이용한 문서 요약 시스템의 구현)

  • Ryu, Je;Sun, Bok-Keun;Park, Boh-A;Han, Kwang-Rok
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.348-350
    • /
    • 2000
  • 본 논문은 문서의 내용을 요약하기 위한 시스템의 구현에 대해서 다룬다. 문서의 내용을 분석하기 위해서는 문서의 키워드를 추출하고, 추출된 키워드를 사용하여 문서의 핵심 내용을 찾는 두 가지의 작업이 이루어져야 한다. 본 논문에서는 키워드를 추출하기 위해 형태소 분석 및 전처리기, 그리고 단어의 공기 관계 그래프를 이용한 키워드 추출기를 이용하였으며, 추출된 키워드를 이용하여 문서의 핵심 문장을 찾아내는 핵심 문장 추출기, 그리고 추출된 문장을 분석하여 내용을 요약할 수 있도록 해주는 구문분석기가 이용된다.

  • PDF

Honorific Correction Program Using Case Frame Dictionary (격틀사전을 활용한 존댓말 교정 프로그램)

  • Jang, Yunjeong;Lim, Lina;Lee, Jae Sung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.10a
    • /
    • pp.954-957
    • /
    • 2019
  • 한국어 맞춤법 검사기는 현재 여러 곳에서 개발하여 서비스를 제공하고 있으며 다양한 목적으로 사용되고 있다. 하지만 이들은 맞춤법이나 띄어쓰기를 검사할 뿐, 존댓말과 같은 높임표현이 잘못 사용되었는지는 검사할 수 없다. 최근에는 맞춤법 검사를 위해 통계적 방식과 딥러닝을 사용하고 있지만, 본 연구에서는 규칙 기반을 활용하여 사용자가 텍스트를 입력하면 잘못된 높임표현을 탐지하여 그에 대한 오류 정보를 제공하고, 올바른 표현으로 교정하는 프로그램을 개발하였다. 구문 분석기를 사용하여 주어-서술어 구조를 파악하고, 형태소 분석기를 활용하여 높임표현을 탐지한 후 격틀사전의 정보를 이용하여 존댓말 오류를 탐지한다. 본 연구는 격식이 있는 문서를 검사할 때나, 한국어 높임말에 익숙하지 않은 외국인들에게 도움이 될 수 있을 것이다.

A Model for Post-processing of Speech Recognition Using Syntactic Unit of Morphemes (구문형태소 단위를 이용한 음성 인식의 후처리 모델)

  • 양승원;황이규
    • Journal of Korea Society of Industrial Information Systems
    • /
    • v.7 no.3
    • /
    • pp.74-80
    • /
    • 2002
  • There are many researches on post-processing methods for the Korean continuous speech recognition enhancement using natural language processing techniques. It is very difficult to use a formal morphological analyzer for improving the speech recognition because the analysis technique of natural language processing is mainly for formal written languages. In this paper, we propose a speech recognition enhancement model using syntactic unit of morphemes. This approach uses the functional word level longest match which dose not consider spacing words. We describe the post-processing mechanism for the improving speech recognition by using proposed model which uses the relationship of phonological structure information between predicates md auxiliary predicates or bound nouns that are frequently occurred in Korean sentences.

  • PDF