• 제목/요약/키워드: syntactic

검색결과 717건 처리시간 0.023초

On the Inherent (non-) Negativity of Negative Sensitive Items

  • Hwang, Ju-Hyeon
    • 한국언어정보학회지:언어와정보
    • /
    • 제14권2호
    • /
    • pp.1-16
    • /
    • 2010
  • On the Inherent (non-) Negativity of Negative Sensitive Items. This paper explores the idea that Korean Negative Sensitive Items, which are better viewed as Negative Concord Items (NCIs) (Kim 2001, 2006, Watanabe 2004), should not be construed as inherently negative in spite of the fact that NCIs are able to appear as an elided form without the presence of a negative licenser. Among several diagnostics, which are designed to draw syntactic and semantic distinctions between traditional Negative Polarity Items (NPIs) and NCIs employed in previous studies, the ability of an NCI to appear as a fragment answer raises the question of whether the negativity of NCIs is inherent or not. Contrary to Kim (2001, 2006) and Watanabe (2004), who are in favor of the inherent negativity of NCIs, I claim that non-negative Korean NCIs still need contentful negation to be licensed, and therefore their ability to appear as a fragment answer should be considered as a matter of ellipsis, in support of Giannakidou (2000, 2006). The main argument will be strengthened by the fact that Korean NCIs do not express negative meaning themselves, and that double negation readings are not allowed no matter how many NCIs occur simultaneously.

  • PDF

구문분석과 기계학습 기반 하이브리드 텍스트 논조 자동분석 (Hybrid Approach to Sentiment Analysis based on Syntactic Analysis and Machine Learning)

  • 홍문표;신미영;박신혜;이형민
    • 한국언어정보학회지:언어와정보
    • /
    • 제14권2호
    • /
    • pp.159-181
    • /
    • 2010
  • This paper presents a hybrid approach to the sentiment analysis of online texts. The sentiment of a text refers to the feelings that the author of a text has towards a certain topic. Many existing approaches employ either a pattern-based approach or a machine learning based approach. The former shows relatively high precision in classifying the sentiments, but suffers from the data sparseness problem, i.e. the lack of patterns. The latter approach shows relatively lower precision, but 100% recall. The approach presented in the current work adopts the merits of both approaches. It combines the pattern-based approach with the machine learning based approach, so that the relatively high precision and high recall can be maintained. Our experiment shows that the hybrid approach improves the F-measure score for more than 50% in comparison with the pattern-based approach and for around 1% comparing with the machine learning based approach. The numerical improvement from the machine learning based approach might not seem to be quite encouraging, but the fact that in the current approach not only the sentiment or the polarity information of sentences but also the additional information such as target of sentiments can be classified makes the current approach promising.

  • PDF

계층트리를 이용하는 의미적 접근제어 방식 (A Method for Semantic Access Control using Hierarchy Tree)

  • 강우준
    • 한국인터넷방송통신학회논문지
    • /
    • 제11권6호
    • /
    • pp.223-234
    • /
    • 2011
  • 데이터베이스 보안 기술은 새로운 컴퓨팅 환경에 대응하기 위해 전통적인 접근제어방식을 확장하여 다양한 연구들이 수행되고 있다. 본 연구에서는 보안요소의 의미적 정보를 기반으로 정책 제약조건과 질의 제약조건이 구문적으로 일치하지 않는 경우에도 보안요소의 의미를 파악하여 적절한 보안정책 집행이 가능하도록 하는 접근제어 방식을 제안한다. 의미적 보안정책 집행을 위해 시멘틱 트리계층 구조 상에서 이들 간의 의미적 함의관계를 이용하고 또한 함의에 의해 초래될 수 있는 과도한 권한부여를 방지할 수 있도록 한다. 그리고 제안방식을 구현하는 프로토타입 시스템의 구조와 성능평가를 통해 다른 접근제어 방식들과 비교한다.

영한 기계번역의 자연어 생성 연구 (A Study on the Natural Language Generation by Machine Translation)

  • 홍성룡
    • 디지털콘텐츠학회 논문지
    • /
    • 제6권1호
    • /
    • pp.89-94
    • /
    • 2005
  • 기계번역에서 자연어 생성의 목적은 입력언어의 어구 분석을 이용하여 그 문장의 의미를 변환해주는 목적 언어를 생성하는 것이다. 그것은 언어적 구조 낱말 전사. 대화체 언어, 어휘적 정보 등을 포함해야 한다. 본 연구에서는 대화체 자동 기계번역 시스템 구현계획의 일부인 음성, 음운 분야에서 담당하게 될 음성인식과 음성합성 알고리듬을 확립하기 위한 한국어 특질에 대한 기초조사를 하고자 한다. 또한 기계번역의 단계를 분석하여 형태소 분석 단계와 구문 분석 단계, 의미 분석 단계로 구분한다. 형태소 분석은 입력 문장을 받아 분리된 형태소를 사전 내에서 검색하여·품사 정보를 얻고 이웃하는 단어와의 접속 관계가 문법적으로 올바르게 되었는지를 점검한다. 본 연구의 결과가 대화체 기계번역 시스템 구현계획의 종합적 입장에서는 단순한 기초조사일 수 있지만, 한국어의 교육 및 기계번역 이해의 측면에서는 그 자체로 가치를 지닌다고 할 수 있겠다. 따라서 교육적 측면에서의 직접적 활용을 여러 측면에서 고려할 수 있을 것이다.

  • PDF

세종명사전자사전의 통사정보 (Syntactic informations in the Sejong Electronic Dictionary of Korean Nouns)

  • 홍재성;고길수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.348-355
    • /
    • 2001
  • 세종전자사전은 한국어 어휘의 정보를 총체적으로 표상하는 전산어휘자료체이다. 세종전자사전은 궁극적으로 다양한 유형과 기능의 한국어 자동처리에의 활용을 목표로 한다. 세종체언전자사전은 최종적으로 5만여 항목을 대상으로 구축될 것이다. 세종명사전자사전은 전산적 효율성을 고려하여 명사 어휘의 정보를 8개의 하위정보구획과 50여개의 세부정보항목으로 구분하여 표상한다. 특히, 명사의 어휘 통사적인 결합에 관한 정보는 한국어 명사구와 문장의 자동생성에 직접 활용될 수 있는 정보이다. 명사는 수식어 요소 또는 조사와 결합하여 명사구를 형성하고, 동사 및 형용사와 결합하여 문장의 생성에 참여한다. 개별 명사들은 이 과정에서 다양한 제약적인 양상들을 보여주고 있으며, 세종명사전자사전은 이 정보들을 명시적으로 표상한다. 또한 명사는 기능동사와 결합하는 술어명사와 그렇지 않은 비술어명사로 구분이 된다. 술어 명사가 기능동사와 결합하여 문장을 형성할 때, 명사와 그 논항들은 다양한 통사적 기능을 담당한다. 또한 술어명사는 논항과 결합하여 명사구를 형성한다. 그러나, 술어명사의 명사구 형성과 기능동사의 결합은 불규칙적이고, 명사와 기능동사의 의미적 특성에 따라 다양한 제약이 발견된다. 이 정보들의 정밀한 표상은 개별 술어명사로부터 생성될 수 있는 가능한 명사구와 문장의 형태를 구체적으로 밝혀주게 된다. 세종명사전자사전의 어휘 통사적인 결합에 관한 정보들은 명사구 또는 문장의 자동생성의 정확성과 효율성을 높여줄 것이다.

  • PDF

구문적 언어지식 획득 과정의 문제점 분석 및 지원도구 설계 (Problem Analysis on Syntactic Linguistic Knowledge Acquisition and Design of a Supporting Tool)

  • 이현아;박재득;장명길;박수준;박동인
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.489-496
    • /
    • 1996
  • 자연어 처리에서 언어에 대한 지식은 전자사전과 문법규칙으로 구성되어 서로 상보적 관계에 있고, 각 어휘에 대한 품사 및 기타 자질-값에 의해 매개된다. 이러한 언어지식을 전통적인 방법에서는 국어자료의 분석에 경험이 많은 언어전문가의 직관에 다분히 의존하여 정의하였고, 말뭉치를 이용한 자동 획득 기법에서는 태그세트를 먼저 설정하고, 이 태그를 원시 말뭉치에 부착하여 태깅된 말뭉치로부터 자동으로 통계적 분석을 통하여 획득한다. 그런데 두가지 접근방법이 가지고 있는 공통적인 문제점은 품사나 자질-값의 정의 및 할당기준, 선악의 평가기준, 튜닝에 대한 적극적 대처 등이 마련되어 있지 않다는 점이다. 이 연구에서는 이러한 문제점의 발생원인을 말뭉치 분석 과정에서 살펴보고, 품사 및 자질-값의 설정과 할당기준을 마련하는 방법론 및 이를 적극적으로 지원하는 도구를 설계한다.

  • PDF

이종 개념체계의 상호보완방안 연구 - 세종의미부류와 KorLexNoun 1.5 의 사상을 중심으로 (Cross-Enrichment of the Heterogenous Ontologies Through Mapping Their Conceptual Structures: the Case of Sejong Semantic Classes and KorLexNoun 1.5)

  • 배선미;윤애선
    • 한국언어정보학회지:언어와정보
    • /
    • 제14권1호
    • /
    • pp.165-196
    • /
    • 2010
  • The primary goal of this paper is to propose methods of enriching two heterogeneous ontologies: Sejong Semantic Classes (SJSC) and KorLexNoun 1.5 (KLN). In order to achieve this goal, this study introduces the pros and cons of two ontologies, and analyzes the error patterns found during the fine-grained manual mapping processes between them. Error patterns can be classified into four types: (1) structural defectives involved in node branching, (2) errors in assigning the semantic classes, (3) deficiency in providing linguistic information, and (4) lack of the lexical units representing specific concepts. According to these error patterns, we propose different solutions in order to correct the node branching defectives and the semantic class assignment, to complement the deficiency of linguistic information, and to increase the number of lexical units suitably allotted to their corresponding concepts. Using the results of this study, we can obtain more enriched ontologies by correcting the defects and errors in each ontology, which will lead to the enhancement of practicality for syntactic and semantic analysis.

  • PDF

An English Tough-construction Resolution: A Minimalist Account

  • Hong, Sung-Shim
    • 한국언어정보학회지:언어와정보
    • /
    • 제13권1호
    • /
    • pp.127-143
    • /
    • 2009
  • Tough-construction is, undoubtedly, one of the most puzzling syntactic problems in the history of transformational grammar. Various approaches have been proposed including Deletion approaches (Akmajian, 1972; Lasnik and Fiengo, 1974) and movement approaches. Among the movement approaches, Chomsky (1977; 1981) argues for movement of null Operator, and Hornstein (2001) argues for a two-step movement equipped with Sideward movement. Most recently, Schueler (2004) and Hartman (2009) each have also argued for a kind of movement approach. With the development of the Minimalist syntax (Chomsky, 1995; Chomsky, 2000; Chomsky, 2001), tough-construction, an age old problem in the description of grammar, turns into another round toward to a more satisfactory answer. By examining the most recent competing analyses of tough-constructions, this paper defends and extends Schueler's (2004) analysis, rather than Hartman's (2009) two step movement approach. Furthermore, this paper proposes that tough-subject originates from the intermediate CP internal Spec-TopicP position rather than from the iterated CP layer (Authier, 1992). This approach has more descriptive power than it was originally argued for in Schueler (2004) and is a step closer toward Minimalism insofar as the conception of government is no longer utilized.

  • PDF

하위범주화에 의한 한국어 파싱 설계 (A Design of Korean Language Parsing based on Subcategorization)

  • 이호석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.242-247
    • /
    • 2008
  • 본 논문은 하위범주화에 의한 한국어 파싱의 설계를 논의한다. 우선, 기계 번역에 중요한 영향을 끼치는 한국어 문법구성 요소인 통사 범주, 조사, 어미, 통사적 접사, 의존 명사 등을 논의하고 하위 범주화와 표현 패턴을 논의한다. 다음에 간단한 한국어 파서의 기본 골격을 제시한다. 첫 번째 과정은 입력 단계로서 문장을 스캐닝(scanning) 하고 관사, 명사, 수사, 통사적 접사, 조사, 의존 명사, 어미활용, 형용사, 부사, 조동사 들을 처리한다. 두 번째 과정에서는 하위범주화 패턴과 표현 패턴을 처리한다. 세 번째 단계에서는 절을 처리하고, 네 번째 단계에서는 SEA(Sentence Ending+Auxiliary)를 처리한다.

  • PDF

질의 응답 시스템을 위한 질의문 심층 분석 (Deep Analysis of Question for Question Answering System)

  • 신승은;서영훈
    • 한국콘텐츠학회논문지
    • /
    • 제6권3호
    • /
    • pp.12-19
    • /
    • 2006
  • 본 논문에서는 질의 응답 시스템의 성능 향상을 위한 질의문 심층 분석을 제안한다. 일반적인 질의응답 시스템들은 사용자의 자연언어 질의의 의미를 분석하지 않기 때문에 정확한 정답을 제공하는 것이 어렵다. 질의문 심층 분석은 의미자질 추출 문법과 자연언어 질의 특성을 이용하여 사용자의 질의를 의미적으로 분석하고, 의미자질들을 추출한다. 의미자질 추출 문법과 자연언어 질의 특성은 사용자 질의의 의미와 구문 구조를 반영하기 위해 의미자질과 형식형태소로 표현된다. 웹에서 추출한 세부 정답 유형이 '인물'인 100개의 질의에 대한 실험을 통해, 비교적 짧지만 사용자의 질의 의도를 충분히 표현하고 있는 자연언어 질의에 대해 질의문 심층 분석을 수행함으로써 사용자의 질의 의도를 분석하고, 의미자질들을 추출할 수 있음을 보였다.

  • PDF