• Title/Summary/Keyword: 파스 트리

Search Result 36, Processing Time 0.023 seconds

Natural Language Parsing through Evolutionary Computation (진화연산을 이용한 자연어 파싱)

  • 김동민;박성배;장병탁
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.419-421
    • /
    • 2003
  • 본 논문에서는 진화 연산 기법을 이용한 자연어 구운 분석 기법을 제시한다 기존의 확률 문맥 무관문법(PCFG)에 관한 연구는 차트 파싱 방법을 구문 분석을 위한 기법으로 가정하고 있다. 하지만, 차트 파싱은 문장의 길이가 늘어날수록 복잡도가 크게 증가하는 문제를 안고 있다. 따라서, 차트 파서의 대안으로서 진화 연산 기법을 사용하여 이 문제를 해결하였다. 진화 연산의 적합도 함수로는 생성된 파스트리의 확률을 사용하였다. 작은 규모의 자연어 문제에 적용한 결과, 진화 연산이 파싱 문제를 성공적으로 해결할 수 있음을 확인할 수 있었다.

  • PDF

Generating Dynamic Answer Sentences for Conversational Agent Using Genetic Programming (유전자 프로그래밍을 이용한 대화형 에이전트의 동적 답변 생성)

  • 김경민;임성수;조성배
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.478-480
    • /
    • 2004
  • 최근 정보 제공에 도움을 주는 대화형 에이전트의 연구가 활발히 진행되고 있다. 그러나 대부분의 대화형 에이전트는 사용자의 요구에 미리 준비된 정적인 답변을 제공하므로 친밀감을 주는 다양한 대화를 유지하지 못한다. 본 논문에서는 BNF(Backus Naur Form)를 이용하여 한국어 문법 구조를 정의하고. 이를 기반으로 가능한 파스트리를 하나의 염색체로 표현한 후, 유전자 프로그래밍을 적용하여 다양한 문법 구조를 생성하는 방법을 제시한다 생성된 문법 구조에 답변 스크립트의 핵심 키워드들을 매칭 시킴으로써 여러 답변 문장을 구성한다. 실제 의류 정보를 소개하는 간단한 웹 사이트에 적응하여 그 가능성을 확인할 수 있었다.

  • PDF

Pre-Processing of Korean Syntactic Analyzer for Korean to English MT (한영 자동 번역을 위한 한국어 구문 분석 전처리)

  • 김영길;양성일;서영애;김창현;홍문표;최승권
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.175-177
    • /
    • 2001
  • 형태소 해석 결과 생성되는 형태소 옅은 구문 분석을 수행하기에는 적절하지 않은 구문 단위로 구성되어 있는 경우가 많으며 이로 인해 구문 분석기가 불필요한 연산을 수행하여 과도한 구문 트리를 생성하는 원인이 된다. 따라서 본 논문에서는 한영 자동 번역의 한국어 구문 분석기 성능 향상 및 자연스러운 대역문 생성을 위하여 시간 부사구와 명사구에 대한 구묶음을 위한 구문 분석 전처리 방법을 제안하며 이를 위한 각 구 단위의 대역 패턴을 정의한다. 방송자막 및 매뉴얼 문장을 대상으로 실험한 결과, 각 문장 구문 단위를 평균적으로 26% 정도 감소시킴으로써 불필요한 파스 트리의 생성을 배제하여 구문 분석기의 성능을 향상시킬 수 있었다.

  • PDF

Integrating Transition-based and Graph-based Dependency Parsers using Dual Decomposition (Dual Decomposition을 이용한 전이기반 및 그래프 기반 의존 파서 통합 모델)

  • Min, Jin-Woo;Na, Seung-Hoon;Sin, Jong-Hun;Kim, Young-Kil
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.25-29
    • /
    • 2019
  • 딥러닝을 이용한 한국어 의존 파싱은 전이 기반 방식과 그래프 기반 방식으로 나뉘어 연구되어 왔다. 전이 기반 방식은 입력 버퍼와 스택으로부터 자질을 추출하여 모델을 통해 액션을 결정하고 액션에 따라 파스트리를 생성해 나가는 상향식(Botton-Up)의 지역적 모델이고 그래프 기반 방식은 문장 내의 모든 단어에 대해 지배소, 의존소가 될 수 있는 점수를 딥러닝 모델을 통해 점수화하여 트리를 생성하는 전역적 모델이다. 본 논문에서는 Dual Decomposition을 이용하여 하이브리드 방식으로 전이 기반 파서와 그래프 기반 파서를 결합하는 방법을 제안하고 BERT 언어 모델을 반영하여 세종 데이터 셋에서 UAS 94.47%, LAS 92.58% 그리고 SPMRL '14 데이터 셋에서 UAS 94.74%, UAS 94.20%의 성능을 보여 기존 그래프 기반 파서의 성능을 더욱 개선하였다.

  • PDF

Using Syntactic Unit of Morpheme for Reducing Morphological and Syntactic Ambiguity (형태소 및 구문 모호성 축소를 위한 구문단위 형태소의 이용)

  • Hwang, Yi-Gyu;Lee, Hyun-Young;Lee, Yong-Seok
    • Journal of KIISE:Software and Applications
    • /
    • v.27 no.7
    • /
    • pp.784-793
    • /
    • 2000
  • The conventional morphological analysis of Korean language presents various morphological ambiguities because of its agglutinative nature. These ambiguities cause syntactic ambiguities and they make it difficult to select the correct parse tree. This problem is mainly related to the auxiliary predicate or bound noun in Korean. They have a strong relationship with the surrounding morphemes which are mostly functional morphemes that cannot stand alone. The combined morphemes have a syntactic or semantic role in the sentence. We extracted these morphemes from 0.2 million tagged words and classified these morphemes into three types. We call these morphemes a syntactic morpheme and regard them as an input unit of the syntactic analysis. This paper presents the syntactic morpheme is an efficient method for solving the following problems: 1) reduction of morphological ambiguities, 2) elimination of unnecessary partial parse trees during the parsing, and 3) reduction of syntactic ambiguity. Finally, the experimental results show that the syntactic morpheme is an essential unit for reducing morphological and syntactic ambiguity.

  • PDF

Temporal Database Management Testbed (시간 지원 데이타 베이스 관리 시험대)

  • Kim, Dong-Ho;Jeon, Geun-Hwan
    • The Transactions of the Korea Information Processing Society
    • /
    • v.1 no.1
    • /
    • pp.1-13
    • /
    • 1994
  • The Temporal Database Management Testbed supports valid and transaction time. In this paper, we discuss the design and implementation of a testbed of a temporal database management system in main memory. The testbed consists of a syntactic analyzer, a semantic analyzer, a code generator, and an interpreter. The syntactic analyzer builds a parse tree from a temporal query. The semantic analyzer then checks it for correctness against the system catalog. The code generator builds an execution tree termed ann update network. We employ an incremental view materialization for the execution tree. After building the execution tree, the interpreter activates each node of the execution tree. Also, the indexing structure and the concurrency control are discussed in the testbed.

  • PDF

Delayed Reduction Algorithms of DJ Graph using Path Compression (경로 압축을 이용한 DJ 그래프의 지연 감축 알고리즘)

  • Sim, Son-Kwon;Ahn, Heui-Hak
    • The KIPS Transactions:PartA
    • /
    • v.9A no.2
    • /
    • pp.171-180
    • /
    • 2002
  • The effective and accurate data flow problem analysis uses the dominator tree and DJ graphs. The data flow problem solving is to safely reduce the flow graph to the dominator tree. The flow graph replaces a parse tree and used to accurately reduce either reducible or irreducible flow graph to the dominator tree. In this paper, in order to utilize Tarian's path compress algorithm, the Top node finding algorithm is suggested and the existing delay reduction algorithm is improved using Path compression. The delayed reduction a1gorithm using path compression actually compresses the pathway of the dominator tree by hoisting the node while reducing to delay the DJ graph. Realty, the suggested algorithm had hoisted nodes in 22% and had compressed path in 20%. The compressed dominator tree makes it possible to analyze the effective data flow analysis and brings the improved effect for the complexity of code optimization process with the node hoisting effect of code optimization process.

A Study on the Speech Conversion Formulas for Domestic Audio Book Service (국내 음성 도서 서비스를 위한 수식의 음성변환 기법에 대한 연구)

  • Lee, Jae-Hwa;Lee, Jong-Woo;Lim, Soon-Bum
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06b
    • /
    • pp.226-227
    • /
    • 2011
  • 현재 국내의 음성도서 서비스는 수식을 정확하게 읽어주지 못하며, 수식을 읽기 위한 독음규칙의 부재로 수식의 음성 서비스에 혼란을 야기 시키고 있다. 이에 본 논문은 중학교 수학 교과서를 바탕으로 수식표현의 '한글 독음규칙'을 정의해보았으며, 수식의 국내 음성 서비스를 위해, 정의된 '한글 독음 규칙'을 매스 파스 트리(Math Parse tree)와 매핑 하여 최종적으로 음성서비스가 가능한 수식의 음성 변환 기법에 관해 연구하였다.

Recognition and Completion of Incomplete Inputs (불완전 입력문장의 인식과 완성)

  • Cho, Yong-Yoon;Park, Yong-Kwan;Park, Ho-Byung;Kim, Sang-Heon;Yoo, Chae-Woo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.05b
    • /
    • pp.963-966
    • /
    • 2003
  • 에디터 환경에서 사용자가 문법적으로 불완전한 문장을 입력하면, 에디터는 오류를 발견하고 적절한 오류 처리 루틴을 실행하게 된다. 대부분의 에디터는 에러를 발견하면 에러 발생 여부를 사용자에게 알리고, 에러 위치를 하이라이트 시켜 사용자가 오류를 수정할 수 있도록 해준다. 에디터 환경에서의 사용자 입력은 입력 부분의 왼쪽, 오른쪽에서 완전하지 못한 형태로 입력될 수 있다. 그러나, 기존 오류 처리 방법은 불완전한 문장에 대해 에러 처리만을 통보할 뿐 계속적인 파싱을 보장하지 못한다. 본 논문은 파서가 문법적으로 불완전한 입력 문장을 해당 문법에 따라 올바로 인식하고, 누락된 문법 심벌을 찾아 파스 트리의 부족한 부분을 완성함으로써 계속적인 파싱을 보장할 수 있는 파싱 방법을 제안한다. 제안된 방법을 통해 사용자는 입력의 문법 오류에 대한 부담을 줄일 수 있고, 불완전한 입력에 대한 계속적인 파싱을 보증 받을 수 있어 파싱 효율을 높일 수 있다.

  • PDF