• 제목/요약/키워드: Syntactic Analysis

검색결과 261건 처리시간 0.027초

지식기반 (Knowledge-based) 질의응답시스템: 사실 자료 (Faet Database)구축을 중심으로 (A Knowledge-based Question-Answering System: With A View To Constructing A Fact Database)

  • 신효필
    • 인지과학
    • /
    • 제13권1호
    • /
    • pp.41-51
    • /
    • 2002
  • 본 논문에서는 질의어 응답시스템에 있어 핵심이 되는 사실 자료 (Fact Database) 구축의 관점에서 지식기반 방법의 중요성과 그 과정에 대해서 논의한다. 지식기반 질의어 시스템은 기존의 이용가능한 자연언어처리의 자원-형태소, 구문, 의미분석 등-과 온톨로지라는 개념구조망을 이용하는 시스템으로 이 개념을 현실세계의 사실 자료와 연결시켜 개념구조가 지닌 속성과 값의 확장을 통해 그 가능한 응답을 유도해 내는 시스템이다. 이 시스템 구축에 있어 실제 세계의 자료를 수집하고 가공하고 개념화하는 과정은 이 시스템의 성패를 좌우하는 핵심작업으로 아직은 완전히 자동화되기 어렵다. 그러나 지식기반에 기초한 방법은 응용시스템의 질적 향상이라는 측면에서 진지하게 논의될 필요가 있다. 이 글에서는 사실 자료 구축의 관점에서 이런 작업들이 어떻게 행해져야 하는지 그리고 그 방법론이 지닌 특징 및 문제점에 대해 논의한다.

  • PDF

한국어 ATIS 질의문의 QLF 표현과 분석방법에 관한 고찰 (Representing & Analyzing QLFs for Korean ATIS Queries)

  • 박현석
    • 인지과학
    • /
    • 제10권2호
    • /
    • pp.17-25
    • /
    • 1999
  • 문맥에 고려한 데이터베이스 인터페이스 시스템을 개발하는 데는 영어권 언어 시스템을 개발하는데 있어서 별로 거론되지 않았던 여러 가지 문제점이 존재한다. 예를 들어, 한국어의 처리는 구문 구조적 제약이 비교적 엄격하지 않기 때문에 적은 수의 규칙으로도 문장이 분석될 수 있지만, 이러한 점은 구문구조분석단계에서 모호성을 남기게 되어 의미 구조분석 단계나 뒤에 연속되는 문맥관련 모듈을 설계할 때는 큰 부담으로 작용한다. 이러한 점을 고려하면서, 본 논문에서는 SRI에서 개발한 CLE라는 시스템을 기초로 개발된 한국어 데이터베이스 인터페이스 시스템을 구축하면서 직면한 여러 가지 어려움을 기술하고자 하며 특히 QLE 라는 의미구조를 한글에 적용시키면서 관찰된 여러 가지 문제들에 중점을 두고 논의를 전개해 나가고자 한다.

  • PDF

Resolving Multi-Translatable Verbs Japanese-TO-Korean Machine Translation

  • Kim Jung-In;Lee Kang-Hyuk
    • 한국멀티미디어학회논문지
    • /
    • 제8권6호
    • /
    • pp.790-797
    • /
    • 2005
  • It is well-known that there are many similarities between Japanese and Korean language. For example, the order of words and the nature of the grammatical conjugation of both languages are almost the same. Another similarity is the frequent omission of the subject from a sentence. Moreover, both languages have honorific expressions and the identical concept for expressing nouns in terms of Chinese characters. Using these similarities, we have developed a word-to-word translation system which does away with any deep level analysis of syntactic and semantic structures of the two languages. If we use these similarities, the direct translation method is superior to the internal language translation method or transfer-based translation method. Although the MT system based on the direct translation method is more easily developed than the ones based on other methods, it may have a lot of difficulties when it tries to select the appropriate target word from ambiguous source verbs. In this paper, we propose a new algorithm to extract the meaning of substantives and to make use of the order of the extracted meaning. We could select $86.5\%$ appropriate verbs in the sample sentences from IPAL-verb-dictionary. $13.5\%$ indicates the cases in which we could not distinguish the meaning of substantives. We are convinced, however, that the succeeding rate can be increased by getting rid of the meaning of verbs thatare not used so often.

  • PDF

논항변이와 의미차이 (Argument Alternations with Meaning Differences)

  • 김현효
    • 한국산학기술학회논문지
    • /
    • 제3권4호
    • /
    • pp.240-244
    • /
    • 2002
  • 영어문장의 논항변이는 오랫동안 언어학자들의 주목을 받아온 재미있는 현상이다. 대표적으로 인용되는 예문은 “load hay onto the truck" 과 “load the truck with hay" 간의 의미차이 그리고 “The garden swarms with bees" 또는 “Bees are swarming in the garden" 과 “The garden swarms with bees" 의 의미차이이다. 이 문장들은 언어학이론상 설명하기 곤란한 의미차이를 가져오게 된다. 통사적인 논항의 재배치는 미묘하지만 엄연한 동사의 의미차이를 보인다. 이를 학자에 따라 “Double-faced" 또는 “Verbal diathesis"라고도 하는데, 본고에서는 Dowty(200l)의 견해를 따르며, 관련있는 학자들의 견해를 반영한다. 나아가 “Argument alternation" 의 행위자 주어 (A-subject)와 위치주어 (L-subject) 형 문장을 중심으로 문장을 분석하고 상이한 특질을 기술하여 Dowty(2001)식 분석의 이론적 타당성을 확인하게 된다.

  • PDF

구문트리 비고를 통한 프로그램 유형 복제 검사 (A Program-Plagiarism Checker using Abstract Syntax Tree)

  • 김영철;김성근;염세훈;최종명;유재우
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권7_8호
    • /
    • pp.792-802
    • /
    • 2003
  • 기존의 프로그램 유형 복제 검사 시스템들은 단순한 텍스트 기반의 프로그램 복제 검사나, 속성 및 토큰 스트링을 이용하여 복제 검사를 수행한다. 이 시스템들은 들여쓰기, 여백, 설명문과 같은 프로그램의 구문과 상관없는 프로그램 스타일에 어려움을 갖고 있다. 본 연구에서는 서로 다른 두 프로그램의 구문트리를 이용하여 복제 검사를 수행하는 모델을 제시한다. 구문트리를 이용한 프로그램 유형 복제 검사는 프로그램 스타일에 취약한 기존의 복제 검사 시스템의 단점을 극복할 수 있으며, 구문분석과 의미분석을 통해 프로그램의 구조적인 검사까지 수행할 수 있다는 장점을 가지고 있다. 또한 본 시스템은 인터넷이나 사이버 교육 체제에서 대량의 C/C+. 언어의 프로그램 복제 검사를 수행하기 위하여 AST 생성, 역파서 및 유사도 검사 알고리즘을 제시하며, 프로그램 복제 유형에 대해서 평가한다.

단위 명사간 보-술 관계를 이용한 한국어 복합 명사의 문장 복원 (Restoring Functional Word and Noun-Verb Syntactic Relations for Korean Compound Noun Analysis)

  • 양성일;김영길;서영애;박은진;나동렬
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.694-695
    • /
    • 2007
  • 한국어 문장의 구성은 명사, 동사와 같은 내용어와 조사, 어미와 같은 기능어로 크게 나눌 수있다. 문장의 핵심적인 의미 전달은 내용어에 의해 이루어지며, 한국어 명사구의 경우 잦은 기능어의 생략으로 명사 나열에 의한 복합 명사가 발생된다. 이렇게 발생되는 복합 명사를 구성하는 단위 명사들은 일부 문장 성분을 생략시켜 발생된 것으로, 생략 성분의 복원에 의해 본래의 문장 형태를 추정할 수 있다. 한국어 복합 명사의 경우, 생략되는 문장 성분은 대부분 접사, 조사와 같은 기능어로 국한되며, 기능어의 복원은 단위 명사 간의 격 관계와 의미 관계를 분석하여 이루어질 수 있다. 본 논문에서는 단위 명사간의 보-술 관계를 이용하여 복합 명사를 구성하는 단위 명사 간의 의존 관계를 추정하고, 추정된 의존 관계에 의해 생략된 격조사와 용언화 접사를 복원하는 방법을 제안한다. 구조 분석에서 사용되는 의미 격틀에 의해 결정되는 격 관계는 격조사와 용언화 접사의 복원을 결정하며, 올바른 본래의 문장 표현 복원을 위해 관형격 조사와 관형격 어미를 비롯한 특별한 형태의 복원은 통계 정보와 휴리스틱 규칙으로 결정한다.

  • PDF

구문 분석에 기반한 자연어 질의로부터의 불리언 질의 생성 (Boolean Formulation of Korean Natural Language Queries Using Syntactic Analysis)

  • 박미화;원형석;이원일;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.73-80
    • /
    • 1998
  • 본 연구는 자연어 질의의 형태 및 구문 정보를 바탕으로 불리언 질의를 생성하는데 그 목적을 둔다. 일반적으로 대부분의 상용정보검색시스템은 입력형식을 검색성능이 종은 불리언 형태로 하고 있으나, 일반 사용자는 자신이 원하는 정보를 불리언 형태로 표현하는데 익숙하지 않다. 그러므로 본 정보검색시스템은 자연어 질의를 기본 입력형태로 하여 사용자의 편의성을 높이고, 이 질의를 범주문법에 기반한 구문분석 결과에 의해 복합명사를 고려한 불리언 형태로 변환하여 검색을 수행함으로써 시스템의 검색 성능의 향상을 도모하였다. 정보검색 실험용 데이터 모음인 KTSET2.0으로 실험한 결과 본 논문에서 제안한 자연어 질의로부터 자동 생성된 불리언 질의의 검객성능이 KTSET2.0에서 제공하는 수동으로 추출한 불리언 질의보다 8% 더 우수한 성능을 보였고, 기존 자연어질의 시스템이 수용해온 방법인 형태소 분석을 거쳐 불용어를 제거한 후 Vector 모델을 적용하여 검색을 수행한 경우보다는 23% 더 나은 성능을 보였다.

  • PDF

영한 기계번역의 자연어 생성 연구 (A Study on the Natural Language Generation by Machine Translation)

  • 홍성룡
    • 디지털콘텐츠학회 논문지
    • /
    • 제6권1호
    • /
    • pp.89-94
    • /
    • 2005
  • 기계번역에서 자연어 생성의 목적은 입력언어의 어구 분석을 이용하여 그 문장의 의미를 변환해주는 목적 언어를 생성하는 것이다. 그것은 언어적 구조 낱말 전사. 대화체 언어, 어휘적 정보 등을 포함해야 한다. 본 연구에서는 대화체 자동 기계번역 시스템 구현계획의 일부인 음성, 음운 분야에서 담당하게 될 음성인식과 음성합성 알고리듬을 확립하기 위한 한국어 특질에 대한 기초조사를 하고자 한다. 또한 기계번역의 단계를 분석하여 형태소 분석 단계와 구문 분석 단계, 의미 분석 단계로 구분한다. 형태소 분석은 입력 문장을 받아 분리된 형태소를 사전 내에서 검색하여·품사 정보를 얻고 이웃하는 단어와의 접속 관계가 문법적으로 올바르게 되었는지를 점검한다. 본 연구의 결과가 대화체 기계번역 시스템 구현계획의 종합적 입장에서는 단순한 기초조사일 수 있지만, 한국어의 교육 및 기계번역 이해의 측면에서는 그 자체로 가치를 지닌다고 할 수 있겠다. 따라서 교육적 측면에서의 직접적 활용을 여러 측면에서 고려할 수 있을 것이다.

  • PDF

구문적 언어지식 획득 과정의 문제점 분석 및 지원도구 설계 (Problem Analysis on Syntactic Linguistic Knowledge Acquisition and Design of a Supporting Tool)

  • 이현아;박재득;장명길;박수준;박동인
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.489-496
    • /
    • 1996
  • 자연어 처리에서 언어에 대한 지식은 전자사전과 문법규칙으로 구성되어 서로 상보적 관계에 있고, 각 어휘에 대한 품사 및 기타 자질-값에 의해 매개된다. 이러한 언어지식을 전통적인 방법에서는 국어자료의 분석에 경험이 많은 언어전문가의 직관에 다분히 의존하여 정의하였고, 말뭉치를 이용한 자동 획득 기법에서는 태그세트를 먼저 설정하고, 이 태그를 원시 말뭉치에 부착하여 태깅된 말뭉치로부터 자동으로 통계적 분석을 통하여 획득한다. 그런데 두가지 접근방법이 가지고 있는 공통적인 문제점은 품사나 자질-값의 정의 및 할당기준, 선악의 평가기준, 튜닝에 대한 적극적 대처 등이 마련되어 있지 않다는 점이다. 이 연구에서는 이러한 문제점의 발생원인을 말뭉치 분석 과정에서 살펴보고, 품사 및 자질-값의 설정과 할당기준을 마련하는 방법론 및 이를 적극적으로 지원하는 도구를 설계한다.

  • PDF

이종 개념체계의 상호보완방안 연구 - 세종의미부류와 KorLexNoun 1.5 의 사상을 중심으로 (Cross-Enrichment of the Heterogenous Ontologies Through Mapping Their Conceptual Structures: the Case of Sejong Semantic Classes and KorLexNoun 1.5)

  • 배선미;윤애선
    • 한국언어정보학회지:언어와정보
    • /
    • 제14권1호
    • /
    • pp.165-196
    • /
    • 2010
  • The primary goal of this paper is to propose methods of enriching two heterogeneous ontologies: Sejong Semantic Classes (SJSC) and KorLexNoun 1.5 (KLN). In order to achieve this goal, this study introduces the pros and cons of two ontologies, and analyzes the error patterns found during the fine-grained manual mapping processes between them. Error patterns can be classified into four types: (1) structural defectives involved in node branching, (2) errors in assigning the semantic classes, (3) deficiency in providing linguistic information, and (4) lack of the lexical units representing specific concepts. According to these error patterns, we propose different solutions in order to correct the node branching defectives and the semantic class assignment, to complement the deficiency of linguistic information, and to increase the number of lexical units suitably allotted to their corresponding concepts. Using the results of this study, we can obtain more enriched ontologies by correcting the defects and errors in each ontology, which will lead to the enhancement of practicality for syntactic and semantic analysis.

  • PDF