• Title/Summary/Keyword: syntactic

Search Result 717, Processing Time 0.027 seconds

Development and Evaluation of a Korean Treebank and its Application to NLP

  • Han, Chung-Hye;Han, Na-Rae;Ko, Eon-Suk;Martha Palmer
    • Language and Information
    • /
    • v.6 no.1
    • /
    • pp.123-138
    • /
    • 2002
  • This paper discusses issues in building a 54-thousand-word Korean Treebank using a phrase structure annotation, along with developing annotation guidelines based on the morpho-syntactic phenomena represented in the corpus. Various methods that were employed for quality control are presented. The evaluation on the quality of the Treebank and some of the NLP applications under development using the Treebank are also pre-sented.

  • PDF

THE SEMANTIC AND PRAGMATIC NATURE OF HONORIFIC AGREEMENT IN KOREAN:A CONSTRAINT-BASED APPROACH

  • Park, Byung-Soo
    • Language and Information
    • /
    • v.2 no.1
    • /
    • pp.116-156
    • /
    • 1998
  • This paper is an HPSG approach to agreement phenomena involving the Korean honorific expressions. it is shown that the theoretical devices developed by the constraint-based theory of HPSG can be fruitfully used to capture the interactions between syntactic constraints and semantic of pragmatic factors in Korean honorific agreement. The HPSG's semantic feature 'referential index' plays a key rele in discribing the multiple interaction. The constraint-based theory of agreement proves successful in accounting for the phenomenon that may be called 'inconsistent' honorific agreement as well as 'consistent' regular honorific usages. However, this paper acknowledges its limit. Recognizing an important distinction between basic and 'coercive' honorific expressions, it is argued that a systactic-semantic-pragmatic approach such as the present one can only be applied to basic honorific agreement. Being sociolinguistic in nature, coercive honorific agreement is perhaps not amenable to formal linguistic investigation.

  • PDF

Analysis of Coordination Ambiguity in Korean (한국어 병렬문의 중의성 분석)

  • 이호동;박종철
    • Language and Information
    • /
    • v.7 no.2
    • /
    • pp.59-79
    • /
    • 2003
  • Coordination in natural language is often syntactically explained by the rule schema X \longrightarrow X′ and X", where X′ and X" refer to expressions of a like syntactic type. While this schema does explain a lot of instances of coordination, it is well known that this schema also gives rise to serious structural ambiguity, leading not only to numerous unintended interpretations but also to a high degree of unnecessary computational complexity. In order to identify intended interpretations, we need to take into account a number of clues at all the levels of morphology, syntax, semantics, and pragmatics/discourse. In this paper, we propose, with an accompanying data analysis, principles of symmetry and coherency for an effective and reasonable identification of intended interpretations from coordination-bearing sentences.

  • PDF

Constraints on the Conversion of the Participle II in German (현대 독일어 제2형 분사의 형용사 전환에 대한 제약)

  • 류병래
    • Language and Information
    • /
    • v.6 no.1
    • /
    • pp.41-69
    • /
    • 2002
  • This paper addresses the issue of constraints on the conversion of the participle II in German, proposing a constraint-based lexical semantic approach. I argue against the widely accepted syntactic view which is based on the dichotomous distinction of intransitive verbs, which has been advanced by the Unaccusative Hypothesis [Perlmutter (1978)]. Several arguments are also given against the semantic view which is based on some aspectual notions such as 'telicity', 'transformativity' or 'terminativity'. The crucial constraints on the conversion of the participle II in German, it is argued, is instead two lexical semantic entailments, movement with a definite change of location and affectedness. These and other lexical semantic entailments in the sense of Dowty (1991) are encoded into the multiple inheritance type hierarchy of qfpsoa. The proposal made in this paper is based on the multiple inheritance hierarchy which is envisaged in a recent framework of head-driven Phrase Structure Grammar.

  • PDF

Subject-Object Asymmetries of Morphological Case Realization

  • Ahn, Hee-Don;Cho, Sung-Eun
    • Language and Information
    • /
    • v.11 no.1
    • /
    • pp.53-76
    • /
    • 2007
  • Case markers in Korean are omissible in colloquial speech. Previous discourse studies of Caseless bare NPs in Korean show that the information structure of zero Nominative not only differs from that of overt Nominative but it also differs from that of zero Accusative in many respects. This paper aims to provide a basis for these semantic/pragmatic properties of Caseless NPs through the syntactic difference between bare subjects and bare objects: namely, the former are left-dislocated NPs, whereas the latter form complex predicates with the subcategorizing verbs. Our analysis will account for the facts that (i) the distribution of bare subject NPs are more restricted than that of bare object NPs; (ii) bare subject NPs must be specific or topical; (iii) Acc-marked NPs in canonical position tend to be focalized.

  • PDF

Information Structure of Relative Clauses in English: a Flexible and Computationally Tractable Model

  • Song, Sanghoun
    • Language and Information
    • /
    • v.18 no.2
    • /
    • pp.1-29
    • /
    • 2014
  • Relativization is one of the common syntactic operations to merge two different clauses into a single information unit. This operation plays a pivotal role to structuralize multiple clauses cohesively as well as serves to specify the property an individual has within the context. That implies that relativization contributes to information structure of multiclausal sentences. In this context, this paper delves into information structure of relative clauses in English with an eye toward creation of a computational model from a standpoint of machine translation. The current work employs Head-driven Phrase Structure Grammar (HPSG, Pollard and Sag (1994)) as a theory of grammar and Minimal Recursion Semantics (MRS, Copestake et al. (2005) as a meaning representation system. Building upon these formalisms, this paper addresses how information structure of relative clauses can be represented and constrained. The current work makes use of Individual CONStraints (ICONS) for modeling relative clauses with respect to information structure. The current work also investigates which relative clause involves which information structure constraint. The present study argues that non-restrictive relative clauses impose a more specific constraint on information structure than restrictive relative clauses.

  • PDF

Protein-Protein Interaction Recognition based on Semantic Parse Tree Kernel (시맨틱 구문 트리 커널 기반의 단백질 간 상호작용 식별)

  • Jeong, Chang-Hoo;Chun, Hong-Woo;Choi, Yun-Soo;Choi, Sung-Pil
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2010.06c
    • /
    • pp.240-244
    • /
    • 2010
  • 본 논문에서는 단백질 간 상호작용 자동 식별을 위해서 구문 트리 커널을 확장한 시맨틱 구문 트리 커널을 제안한다. 기존의 구문 트리 커널은 구문 트리의 단말 노드를 구성하는 개별 어휘에 대해서 단순하게 외형적 비교를 수행하기 때문에 실제 의미적으로는 유사한 두 구문 트리의 커널 수치가 상대적으로 낮아져서 단백질 간 상호작용 식별의 성능이 떨어지는 문제점이 발생한다. 이를 극복하기 위해서 두 구문 트리의 구문적 유사도(syntactic similarity)와 어휘 의미적 유사도(lexical semantic similarity)를 동시에 효과적으로 계산하여 이를 결합하는 새로운 커널을 고안하였다. 그리고 제안된 시맨틱 구문 트리 커널을 활용하여 단백질 간 상호작용 식별 성능을 향상시킬 수 있음을 실험을 통하여 보여주었다.

  • PDF

DQL Search System That Apply Ranking Of Search Result (사용자에 따라 검색 결과의 순위를 적용하는 DQL 검색 시스템)

  • 김제민;박영택
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.589.1-591
    • /
    • 2004
  • 현재 웹 서비스에서 사용하고 있는 키워드 기반 검색은 syntactic한 정보만을 제공한다. 웹 서비스의 이러한 단점을 보안하고자 시멘틱 웹 기술이 제안되고 있다. DQL 검색 시스템은 검색 결과의 질을 향상시키기 위해서 시멘틱 웹 기반의 검색 시스템 중지 하나다. 시멘틱 검색은 입력된 질의들을 통해서 사용자가 원하는 정보와 의미가 일치하는 결과를 얻어내는 것이다. 본 논문은 시스템을 이용하는 각 사용자에 따라 검색되는 결과들에 우선순위를 적용하는 DQL 검색 시스템을 제안하고 다음 3가지 부분에 중점을 두어 시스템을 설계하였다. 첫째, 각 사용자들의 성향을 검색 결과에 반영하기 위해 개인화 프로파일과 온톨로지를 생성하는 개인화 온톨로지 생성기를 설계한다. 둘째. 검색 정확도틀 논이기 위해 검색 대상에 되는 정보들의 숙성과 관계를 추론해주는 검색 엔진을 설계한다. 마지막으로 DQL 검색 시스템의 사용 효율성을 높이기 위해 사용자가 입력한 키워드를 DQL로 자동 변환하는 DQL 컨버터를 설계한다.

  • PDF

An Automatic Evaluation Metric for Korean Paraphrase via Semantic Frame (시맨틱 프레임을 이용한 한국어 패러프레이즈 자동 평가 방법)

  • Park, Hancheol;Gweon, Gahgene;Choi, Ho-jin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2014.04a
    • /
    • pp.761-764
    • /
    • 2014
  • 본 연구는 지능형 QA시스템과 관련한 연구에서, 자동 패러프레이즈 생성 시스템을 평가하는 새로운 방법을 제시한다. 기존의 패러프레이즈 생성 시스템의 자동 평가 방법은 참조할 수 있는 패러프레이즈 정보의 양이 크게 제한되어 있었으며, 원 문장의 콘텍스트(context)와 이에 의존하는 통사적 구조(syntactic structure) 및 의미적 구조의 유사성을 고려하지 않고, 단순 구/단어 수준의 의미 유사성을 기반으로 생성된 패러프레이즈를 평가하였다. 이러한 문제를 해결하기 위해 본 연구는 시맨틱 프레임(semantic frame)을 이용한 패러프레이즈 문장 평가 방법을 제시한다. 본 연구에서 제시하는 방법론은 문장의 콘텍스트를 표현하는 프레임과 이러한 프레임이 발생시키는 통사적, 의미적 구조의 유사성을 바탕으로 원 문장과 패러프레이즈 문장의 '의미 유사성', '어휘 형태 비 유사성'을 평가하는 방식이다.

Machine Reading Comprehension based on Language Model with Knowledge Graph (대규모 지식그래프와 딥러닝 언어모델을 활용한 기계 독해 기술)

  • Kim, Seonghyun;Kim, Sungman;Hwang, Seokhyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.10a
    • /
    • pp.922-925
    • /
    • 2019
  • 기계 독해 기술은 기계가 주어진 비정형 문서 내에서 사용자의 질문을 이해하여 답변을 하는 기술로써, 챗봇이나 스마트 스피커 등, 사용자 질의응답 분야에서 핵심이 되는 기술 중 하나이다. 최근 딥러닝을 이용한 기학습 언어모델과 전이학습을 통해 사람의 기계 독해 능력을 뛰어넘는 방법론들이 제시되었다. 하지만 이러한 방식은 사람이 인식하는 질의응답 방법과 달리, 개체가 가지는 의미론(Semantic) 관점보다는 토큰 단위로 분리된 개체의 형태(Syntactic)와 등장하는 문맥(Context)에 의존해 기계 독해를 수행하였다. 본 논문에서는 기존의 높은 성능을 나타내던 기학습 언어모델에 대규모 지식그래프에 등장하는 개체 정보를 함께 학습함으로써, 의미학적 정보를 반영하는 방법을 제시한다. 본 논문이 제시하는 방법을 통해 기존 방법보다 기계 독해 분야에서 높은 성능향상 결과를 얻을 수 있었다.