• 제목/요약/키워드: 결합범주문법

검색결과 27건 처리시간 0.019초

유형상속 결합범주문법에서의 격현상 구현 (Implementation of Case Phenomena in the Korean TCCG System)

  • 이화윤;이용훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2010년도 제22회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.118-122
    • /
    • 2010
  • 격현상은 한국어의 여러 가지 문법현상들을 분석하고 이를 전산학적으로 구현하는데 아주 중요한 부분 중의 하나이다. 결합범주문법(Combinatory Categorial Grammar; CCG)을 이용한 대부분의 기존 연구들에서는 격조사나 보조사들에도 별도의 통사범주들을 할당한 후, 이들 조사들이 명사와 결합하여 하나의 명사구를 구성하는 것으로 조사들을 처리하고 있다. 그러나 이러한 방법들은 이론적인 문제점들뿐만 아니라 전산적 구현에 있어서도 문제점을 안고 있다. 본 논문에서는 이러한 문제점들을 해결하면서도 한국어의 격현상을 효과적으로 구현할 수 있는 방법을 소개한다. 본 논문에서 사용하려고 하는 문법공학 시스템은 한국어를 위한 유형상속 결합범주문법(Type-inherited Combinatory Categorial Grammar; TCCG)이다. 이 시스템 안에서는 명사구의 격조사나 보조사들이 별도의 통사범주들을 할당받지 않고, 명사의 굴절규칙(inflectional rules)에 의하여 명사와 결합하게 된다. 따라서 국어의 기본적인 격조사들을 효율적으로 구현할 수 있을 뿐만 아니라 보조사나 격조사 탈락현상들도 효과적으로 분석하고 구현할 수 있게 된다.

  • PDF

결합범주문법과 구문분석 (Combinatory Categorial Grammar and Parsing)

  • 조형준;박종철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.223-230
    • /
    • 1999
  • 본 논문에서는 결합범주문법으로 한국어를 처리할 때 구문분석과정에서 복잡도를 높이는 역할을 하는 spurious ambiguity와 구조적 모호성이 있는 명사구 접속에 대해서 논한다. 통사적 처리와 의미적 처리가 동시에 수행되는 결합범주문법의 특징을 사용해서 spurious ambiguity로 인해 발생하는 복잡도를 줄이는 방안을 제시하고 접속항에서 접속의 중심이 되는 명사들 간의 공기유사도를 이용해서 접속항 선정에서 발생하는 복잡도와 오분석을 줄이는 방안을 제시한 뒤 이의 개선방안을 논의한다.

  • PDF

결합범주문법을 이용한 자연언어 인터페이스 (Natural Language Interface with Combinatory Categorial Grammar)

  • 이호동;박종철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.173-175
    • /
    • 2000
  • 본 연구에서는 전자상거래 데이터베이스를 대상으로 결합범주문법을 이용한 자연언어질의 인터페이스를 구현한다. 이를 위해 질의문을 분석하고 표현 방법을 논의한다. 또한 SQL 형식언어로 변환하기 위한 어휘 표현 및 유도 방법을 보인다. 제안하는 방법은 구문분석 과정에서 SQL 형식의 질의문을 직접 유도하는 것으로 기존 연구에서 제안됐던 중간논리언어 변환단계를 거치지 않으므로 과정이 간결해져 시스템의 성능향상을 가져올 수 있다. 시스템은 웹 기반과 client/server 구조로 구현된다.

  • PDF

결합범주문법을 이용한 한국어 경어 체계의 이해와 처리 (Computational Processing of Honorifics in Korean with Combinatory Categorial Grammar)

  • 권오식;박종철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.365-372
    • /
    • 2001
  • 한국어나 일본어는 영어 등 서구의 언어와 비교하여 매우 발달된 경어 체계를 가지고 있다. 그러나 이러한 경어 체계는 이들 언어를 모국어로 사용하지 않는 사람들을 포함하여 모국어로 사용하는 많은 사람들까지도 정확하게 구사하기는 어려워 하는 것이 현실이다. 그럼에도 불구하고 경어 체계의 정확한 구사 능력은 적절한 어휘 선택 능력과 함께 자연스러운 의사 소통을 위한 중요한 언어 능력으로 간주되고 있다. 특히 기계번역기나 문법검사기를 구현하고자 할 때 이러한 경어 체계를 정확하게 이해하는 시스템의 구현은 한 차원 높은 자연스러운 표현을 제공하기 위하여 필수적이라고 할 수 있다. 본 논문에서는 한국어의 경어 체계를 조사하고 결합범주문법을 통하여 이를 검증하는 시스템을 소개한 뒤 사극 대본을 대상으로 하여 이 시스템의 성능을 확인한다.

  • PDF

한국어 병렬문의 통사, 의미, 문맥 분석을 위한 결합범주문법 (Combinatory Categorial Grammar for the Syntactic, Semantic, and Discourse Analyses of Coordinate Constructions in Korean)

  • 조형준;박종철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권4호
    • /
    • pp.448-462
    • /
    • 2000
  • 자연언어처리에 있어서 병렬구문은 분석의 복잡성, 단어의 애매성, 서술어 생략 등에 따른 처리의 어려움을 내포하고 있다. 본 논문에서는 한국어에서 발생하는 병렬문의 통사적 특징을 능력문법 (competence grammar)의 입장에서 접근하고 분석된 결과를 기반으로 하여 한국어 병렬문 해석을 위한 결합범주문법 (Combinatory Categorial Grammar)을 제안한다. 제안된 결합범주문법을 사용해서 병렬문에 대한 각각 다른 수준의 통사적, 의미적, 문맥적 정보들이 사전에 어휘적으로 통합될 수 있고 통합된 정보를 이용하여 통사적, 의미적, 문맥적 분석들이 각각 다른 수준의 처리를 거치지 않고 동시에 점진적으로 유도될 수 있음을 보인다. 유도된 정보들을 통해 일반적으로 한국어 병렬문의 주된 기능이라고 생각되는 두 문장이 가지는 정보를 대조, 비교하는 기능이 표현될 수 있음을 보인다. 말뭉치를 분석하여 병렬문이 한국어 처리에서 차지하는 비중과 제시한 문법으로 처리할 수 없는 문형들에 대한 논의를 제공한다.

  • PDF

결합범주문법을 이용한 한국어 문장의 자연스러운 억양 생성에 대한 연구 (Predicting Contextually Appropriate Intonation from Utterances in Korean with Combinatory Categorial Grammar)

  • 이화진;박종철
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 한글 및 한국어 정보처리
    • /
    • pp.68-75
    • /
    • 2000
  • 상대방에게 의사를 전달할 때 보다 정확하게 자신의 의도를 표현하려면 대화의 흐름에 맞는 적절한 억양을 주어 발화해야 한다. 본 논문에서는 결함범주문법을 이용하여 문장을 분석하고 문장 내 정보와 문장 간 정보 즉, 문맥에 따라 강세(pitch accent), 휴지(pause), 강조 등의 억양정보를 어떻게 나타내야 하는지를 분석하여 문장의 정보구조에 추가하는 방법을 제시한다.

  • PDF

시간 표현에 대한 부분 문법 기술 및 FST를 이용한 시간 구문 분석 (Representation of Local Grammar for Temporal Expression and Analysis of Temporal Phrase with FST)

  • 김윤관;윤준태;송만석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.231-236
    • /
    • 1999
  • 시간표현은 문장에서 다른 명사와 결합하여 복합어를 이루는 경우가 있고, 용언과 결합하여 시간 부사의 역할을 하는 경우가 있는데, 이는 구문 분석에 있어서 중의적 해석이 두드러지며, 그 결과 구문 분석의 오류를 빈번히 야기하기도 한다. 본 논문에서는 이러한 시간 관계의 표현을 대량의 말뭉치로부터 획득하고 이들을 부분문법(local grammar)으로 표현한 후, 이것을 FST(Finite State Transducer)를 이용하여 부분 구문분석을 하고자 한다. 이를 위해 5천만 어절의 말뭉치에서 259개의 시간 단어를 추출하였고, 시간 단어들의 의미적 또는 기능적 사용에 의해서 26개의 어휘 범주로 분류하고 각 범주들의 결합관계를 일반화하였다. 실험을 통하여 인식을 위한 시간표현의 결합관계는 최고 97.2%의 정확률을 보였고, 품사태깅에 있어서는 평균 96.8%의 정확률을 보였다. 이는 시간 표현의 결합관계가 부분 구문분석에 있어서 유용한 정보임을 보여준다.

  • PDF

음절단위 결합범주문법을 이용한 한국어 문장의 자동 띄어쓰기 (Word Segmentation for Korean with Syllable-Level Combinatory Categorial Grammar)

  • 이호준;박종철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.47-54
    • /
    • 2002
  • 한국어의 띄어쓰기 현상은 단어별로 정형화된 띄어쓰기를 하는 영어나 띄어쓰기가 발달하지 않은 중국어, 일본어와는 다르게 독특한 형태로 발전되어 왔다. 기존에는 부분적인 띄어쓰기 오류를 바로잡아주는 형태의 연구가 많이 진행되었지만 이제는 문자인식이나 음성인식 등의 연구와 결합하여 띄어쓰기가 완전히 무시된 문장의 띄어쓰기를 자동으로 처리하는 방법에 대한 연구가 활발히 진행 중이다. 본 논문에서는 한국어의 띄어쓰기 현상과 띄어쓰기 복원 방법에 대한 기존의 연구에 대해서 살펴보고 기존의 방법으로는 저리하기 힘들었던 형태를 음절단위 결합범주문법으로 설명한다.

  • PDF

한국어 기능범주의 정보처리 (The Structure and Processing of the Korean functional category)

  • 황유미;문영선;박혜성;남기춘
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 춘계 학술대회
    • /
    • pp.273-278
    • /
    • 2000
  • 본 연구는 한국어 기능 범주(functional category)의 처리를 살펴보기 위하여 실문법증 환자를 대상으로 실시되었다. 일반적으로 수형도에서 기능 범주는 보문소구(Complementizer Phrase), 시제구(Tenxe Phrase), 일치소구(Agreement Phrase)의 순으로 구성되어 있다. 본 실험은 Grodzinsky(1997)의 수형도 가지치기 가설과 실문법증의 엄밀성 척도를 바탕으로 한국어 기능 범주의 처리에 있어서도 두 가지 가설의 적용이 타당한지 여부를 검증하기 위해 실시되었다. 실험 1은 일치소(Agr)의 처리를 살펴보기 위하여 실시되었는데, 국어의 존칭 선어말 어미를 중심으로 살펴보았다. 국어의 존칭선어말 어미는 크게 '-시-'삽입에 의한 존칭과 다른 어휘로 대체하는 보충법에 의한 존칭으로 구분된다. '-시-'삽입에 의한 존칭은 AgrP의 범주로 보충법에 의한 존칭은 동사구(Verb Phrase)의 범주로 설정하여 문법에 어려움을 보이는 실문법증의 경우 어휘부에 혹하는 보충법에 의한 존칭을 문법범주에 속하는 '-시-'삽입의 존칭보다 더 잘 할 것으로 가정하였다. 실험 2는 AgrP의 범주인 '-시-'선택의 장애가 TPqja주인 시제 선택에 역시 영향을 미칠 것이라는 가정아래 설계되었다. 수형도 상에서 '-시-'는 일치소(Agr)로서 시제(TP)의 아래에 위치하므로 실험 3은 '-시-'삽입 존칭과 시제에서 어려움이 보문소(CP)의 선택에 역시 영향을 미칠 것이라는 가정하에서 실시되었다. 실험 1의 결과 '-시-'삽입에 의한 존칭을 처리하는데 보충법에 의한 존칭보다 어려움을 보였다. 실험 2의 결과 '-시-'삽입 존칭에 어려움을 보인 환자는 시제 선어말 어미를 선택하는데도 어려움을 보임이 확인되었다. 실험 3 역시 실험 1과 실험2에서와 동일하게 처리의 어려움을 보였다. 이러한 실험 결과들은 국어의 존칭과 시제 선어말 어미가 통사부에서 구(XP)와 결합하여 새로운 구를 형성하는 통사적 접사로 해석할 수 있으며 Grodzinsky의 가설을 지지하는 결과를 보여 줌으로서 국어에서도 AgrP, TP, CP 사이의 통사적 위계가 있음을 뒷받침하는 증거가 된다.

  • PDF

억양 합성을 위한 어휘 중의성 해소 : 결합범주문법을 통한 접근 (Lexical Disambiguation for Intonation Synthesis : A CCG Approach)

  • 이호준;박종철
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2005년도 하계 학술대회
    • /
    • pp.103-118
    • /
    • 2005
  • IT의 급격한 발전과 함께 새로운 형태의 정보 전달 방법이 지속적으로 나타나면서 우리말의 정확한 발음에 대한 인식이 점점 약화되고 있는 추세이다. 특히 장단음의 발음은 발화에 대한 전문인들도 정확하게 구분하지 못하고 있는 심각한 상황이다. 본 논문에서는 한국어 명사에서 나타나는 장단음화 현상을 주변 어휘와의 관계를 바탕으로 살펴보고 동음이의어 중 다르게 발음되는 명사의 장단음 구분을 명사와 명사의 수식어, 명사의 서술어와의 관계를 중심으로 논의한다. 분석된 결과는 결합범주문법을 이용하여 표현하고 어휘적 중의성이 해소된 음성 합성 과정을 표준화된 SSML(Speech Synthesis Markup Language)으로 기술한다.

  • PDF