• Title/Summary/Keyword: 한국어 문법

Search Result 345, Processing Time 0.019 seconds

h-Metathesis and Discontinuous Morphs in Modern Korean (우리말 ㅎ 음운도치와 불연속형태)

  • Youe Mahn-Gunn
    • Proceedings of the KSPS conference
    • /
    • 1996.10a
    • /
    • pp.510-513
    • /
    • 1996
  • 현대 한국어에 ㅎ음운도치 현상에 잇는데 주로 두가지 문법범주에 나타난다. 첫째는 ${\ulcorner}암탉/수탉{\Ircorner}$ 처럼 ${\ulcorner}암{\Ircorner}$ (female), ${\ulcorner}수{\Ircorner}$ (male)에 이어지는 명사초성 파열음에서 생기고, 그 다음은 ${\ulcorner}놓고/많지{\Ircorner}$ 처럼 용언 어간말음 ㅎ소리와 그것에 이어지는 어미초성 파열음, 파찰음 사이에서 생긴다. 첫째 경우에는 정서법이 음운도치를 그대로 반영하지만 두째 경우에는 어간.어미를 갈라적는다는 기준에 따라 대개 발음순서와 철자순서가 다르게 되어있다. 이 글의 초점은 현행 한글맞춤법상 이렇게 발음순서와 철자순서가 어긋남을 음성학적 분석을 통해 고찰하고, 그 철자방식을 비판하면서 한글맞춤법 개선을 위해 ㅎ받침 효용에 대한 새로운 제안을 하려는 것이다.

  • PDF

Korean Noun Phrase Identification Using Maximum Entropy Method (최대 엔트로피 모델을 이용한 한국어 명사구 추출)

  • 강인호;전수영;김길창
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2000.06a
    • /
    • pp.127-132
    • /
    • 2000
  • 본 논문에서는 격조사의 구문적인 특성을 이용하여, 수식어까지 포함한 명사구 추출 방법을 연구한다. 명사구 판정을 위해 연속적인 형태소열을 문맥정보로 사용하던 기존의 방법과 달리, 명사구의 처음과 끝 그리고 명사구 주변의 형태소를 이용하여 명사구의 수식 부분과 중심 명사를 문맥정보로 사용한다. 다양한 형태의 문맥 정보들은 최대 엔트로피 원리(Maximum Entropy Principle)에 의해 하나의 확률 분포로 결합된다. 본 논문에서 제안하는 명사구 추출 방법은 먼저 구문 트리 태깅된 코퍼스에서 품사열로 표현되는 명사구 문법 규칙을 얻어낸다. 이렇게 얻어낸 명사구 규칙을 이용하여 격조사와 인접한 명사구 후보들을 추출한다. 추출된 각 명사구 후보는 학습 코퍼스에서 얻어낸 확률 분포에 기반하여 명사구로 해석될 확률값을 부여받는다. 이 중 제일 확률값이 높은 것을 선택하는 형태로 각 격조사와 관계있는 명사구를 추출한다. 본 연구에서 제시하는 모델로 시험을 한 결과 평균 4.5개의 구를 포함하는 명사구를 추출할 수 있었다.

  • PDF

An Implementation of Intelligent Korean Editor (지능형 한글 편집기의 구현)

  • Yi, Kyu-Eun;Kim, Hwang-Soo
    • Annual Conference on Human and Language Technology
    • /
    • 1992.10a
    • /
    • pp.329-338
    • /
    • 1992
  • 본 논문에서는 한글 입력시 중성 다음에 입력되는 자음이 현재 글자의 종성인지 다음 글자의 초성인지를 예측하는 능력을 가지는 지능형 한글 편집기를 구현하고 성능을 검사하였다. 지능형 한글 편집기는 한글 입력시 어색한 단어를 화면에 나타내지 않고, 마치 사람이 쓰는 것과 같이 화면에 글자를 나타내므로 사용자의 생각과 화면에 나타난 글자와의 차이를 없게 하여 사용자에게 편안함과 자연스러움을 느끼게 하는 한글 편집기이다. 지능형 한글 편집기는 확률, 사전, 조사표, 어미표, 그리고 문법 지식을 이용한다.

  • PDF

Triple Extraction for RDF Graph Construction from Wikipedia Articles (위키피디아 문서로부터 트리플 추출과 RDF 그래프 생성)

  • Lee, SoonWoong;Choi, KeySun
    • Annual Conference on Human and Language Technology
    • /
    • 2009.10a
    • /
    • pp.106-110
    • /
    • 2009
  • 웹이 발전하면서 점점 더 많은 정보가 웹을 통해 생성되고 공유되고 있다. 하지만 정보의 급격한 증가로 인해 정작 정확한 정보를 찾는 것은 오히려 더 어려워지고 있고, 이로 인해 특히 구조화되지 않은 텍스트에 대한 정확한 정보 검색의 필요성이 증가하고 있다. 본 논문에서는 위키피디아 문장들로부터 RDF 트리플을 추출하고 이를 하나의 연결된 RDF 그래프로 구성함으로써 효과적인 정보 검색을 수행하는 방법을 제안하고자 한다. 트리플 추출 방법은 문장에 대한 파스 트리를 탐색함으로써 이루어지는데, 약 81%의 정확도를 나타내었다. 최종적으로 생성되는 RDF 그래프는 입력 문장들의 문법적인 요소만을 고려하기 때문에 방법이 단순하지만 그래프 탐색을 통해 다양한 쿼리에 대한 정보 검색이 가능하다.

  • PDF

Programming with Korean Vocabulary by Using P Language (P 언어를 이용한 한글 프로그래밍)

  • Choi, Sea-Young
    • Annual Conference on Human and Language Technology
    • /
    • 2013.10a
    • /
    • pp.90-95
    • /
    • 2013
  • 본 논문에서는 모국어를 이용한 프로그래밍을 위한 지원 방법으로서, 모국어로 된 데이터의 표현, 변수의 모국어 표현, 문법 키워드의 모국어 표현, 모국어 병행표현 등에 대하여 알아본다. 그리고 임의의 다국어를 지원하도록 설계된 P 언어를 이용하여 한글 프로그래밍을 하는 방법을 알아본다. 구체적으로 한글 프로그래밍 환경을 구축하는 방법, 한글 프로그램을 위한 어휘의 선정에 대하여 알아보고, 이를 이용한 간단한 알고리즘의 구현과 art 모듈을 이용하여 그래픽 프로그래밍의 예를 들어보겠다. 그리고 한글 프로그래밍을 위해 P 언어를 사용한 경우의 장점과 단점에 대하여 알아보겠다. 끝으로 한글 프로그래밍의 발전을 위해서는 표준 한글어휘 선정을 위해 학계와 산업계의 통일된 노력이 필요하다는 점과 한글 프로그래밍이 가져다 줄 수 있는 영향과 한글 프로그래밍의 바른 사용 방법으로서 영문과 한글의 병용사용을 제안한다.

  • PDF

Chatting System that Pseudomorpheme-based Korean (의사 형태소 단위 채팅 시스템)

  • Kim, Sihyung;Kim, HarkSoo
    • Annual Conference on Human and Language Technology
    • /
    • 2016.10a
    • /
    • pp.263-267
    • /
    • 2016
  • 채팅 시스템은 사람이 사용하는 언어로 컴퓨터와 의사소통을 하는 시스템이다. 최근 딥 러닝이 큰 화두가 되면서 다양한 채팅 시스템에 관한 연구가 빠르게 진행 되고 있다. 본 논문에서는 문장을 Recurrent Neural Network기반 의사형태소 분석기로 분리하고 Attention mechanism Encoder-Decoder Model의 입력으로 사용하는 채팅 시스템을 제안한다. 채팅 데이터를 통한 실험에서 사용자 문장이 짧은 경우는 답변이 잘 나오는 것을 확인하였으나 긴 문장에 대해서는 문법에 맞지 않는 문장이 생성되는 것을 알 수 있었다.

  • PDF

Analysis and Reconstruction of Temporal Relations in Multimedia Fairy Tales for Digital Cinematography (디지털 영상 기법을 위한 자연언어 멀티동화 시간 관계 분석 및 재현)

  • Jang, Se-Min;Park, Jong-C.
    • Annual Conference on Human and Language Technology
    • /
    • 2002.10e
    • /
    • pp.309-316
    • /
    • 2002
  • 동화는 사건의 흐름에 따라서 이야기를 진행시킨다. 그러나 독자인 어린이들의 관심을 지속적으로 유지하기 위하여 사건을 실제 순서와 다르게 배치해놓아 극적 효과를 꾀하는 경우가 많이 있다. 동화를 애니메이션으로 생성하는데 있어서 이러한 사건의 배치에 담긴 작가의 의도를 제대로 파악하는 것은 중요한 문제이다. 본 논문에서는 이처럼 사건의 흐름을 파악하고 이를 활용하기 위해서 다루어야 할 언어적 요소들에 대하여 살펴보고, 결합범주문법을 사용하여 동화에서 나타나는 시간 관계를 분석한다. 또한 각 시간 관계에 따라 애니메이션 효과를 높이기 위한 영상 기법을 제안하고 이를 이용하여 시간 관계를 재현하는 시스템을 설명한다.

  • PDF

Anaphora Resolution for Contextually Appropriate Animation of Multimedia Fairy Tales (문맥상 자연스러운 멀티동화 자동 애니메이션을 위한 참조현상 해결)

  • Hong, Kyung-Wha;Park, Jong-C.
    • Annual Conference on Human and Language Technology
    • /
    • 2002.10e
    • /
    • pp.317-324
    • /
    • 2002
  • 참조현상이란 이미 언급되었던 혹은 이미 알고 있다고 여겨지는 정보에 대한 재표현이다. 참조현상은 자연언어처리 분야에서뿐만 아니라 인지과학, 심리학, 철학분야에서도 활발하게 연구되는 현상으로 참조표현인 조응사(anaphora)의 선행사(antecedent)를 채택하는 방법에 따라 그 성능이 좌우된다. 자연언어문장으로부터 멀티동화를 생성을 위한 애니메이션 제어 스크립트 명령들에서의 참조해결은 선행 정보의 적절한 참조를 바탕으로 자연스러운 애니메이션 장면을 생성하는데 있어서 필수적이다. 본 논문에서는 이러한 동화의 자연언어 문장에 나타나는 참조현상들에 대해 살펴보고 결합범주문법을 이용하여 참조현상을 해결하는 방법과 구현방법에 대해 논의한다.

  • PDF

구문패턴을 이용한 반자동 구문분석 말뭉치 구축도구

  • Im, Jun-Ho;Park, So-Yeong;Gwak, Yong-Jae;Im, Hae-Chang;Kim, Ui-Su;Gang, Beom-Mo
    • Annual Conference on Human and Language Technology
    • /
    • 2002.10e
    • /
    • pp.343-350
    • /
    • 2002
  • 본 논문에서는 구문패턴을 이용한 반자동 구문분석 말뭉치 구축도구를 제안한다. 일반적으로 구문분석 말뭉치를 구축하는 작업은 문법전문가의 많은 시간과 노력을 필요로 하고 있다. 본 논문은 구문분석 말뭉치를 구축할 때 수작업을 감소시켜 줄 수 있는 도구를 개발하기 위하여, 사용자가 정의하는 자질집합과 신뢰도를 바탕으로 구문패턴을 자동 추출하고 적용하는 방법을 제안한다. 소량의 말뭉치에서 실험한 결과, 구문패턴의 사용은 30%정도의 수작업을 감소시킬 수 있는 것으로 나타났다.

  • PDF

Integrated Sentence Preprocessing System for Web Indexing (웹 인덱싱을 위한 통합 전처리 시스템의 개발)

  • Shim, Jun-Hyuk;Cha, Jong-Won;Lee, Geun-Bae
    • Annual Conference on Human and Language Technology
    • /
    • 2000.10d
    • /
    • pp.216-223
    • /
    • 2000
  • 웹 문서는 일반 문서들과 달리 자유로운 형식으로 기술되어 있고, 원문에 태그나 코드 등 불필요한 내용들을 많이 포함하고 있어 언어 처리에 바로 사용하기에 적합하지 못하다. 본 논문은 인덱싱 대상 문서로 사용되는 웹 문서를 자동으로 수집하여, 문장 단위로 정렬된 문서로 제작, 관리하는 통합 전처리 시스템인 Web Tagger의 구조와 전처리 방법을 소개한다. Web Tagger는 문서 정제, 문장 분할, 띄어쓰기의 과정을 거쳐 웹 문서에서 표준화된 정보를 추출하고, 형태소 분석기를 포함한 응용 시스템의 목적에 맞게 XML 형식의 원문 코퍼스를 자동으로 생성하고 관리한다. '정규문법(Regexp)', '휴리스틱', '품사 인덱스 참조', 'C4.5를 사용한 학습 규칙' 등의 다양한 전처리 기법은 형태소 분석 정확도 향상과 시스템 안정성 보장에 기여한다.

  • PDF