• Title/Summary/Keyword: 한국어의 특성

Search Result 757, Processing Time 0.031 seconds

A Study on strengthening the Korean pronunciation of Chinese speakers (중국어 화자의 한국어 발음의 강세에 관한 연구)

  • Jee, Sang-Hwi;Park, Hyung-Woo;Bae, Myung-Jin
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2016.07a
    • /
    • pp.299-300
    • /
    • 2016
  • 매년 급격한 경제성장률을 보이는 중국은 이제 우리나라와 긴밀한 관계가 돼야할 필요성이 있으며, 이러한 이유로 국내외적으로 한국어 홍보와 한국어 학습교재 발간, 학습방법에 대한 논의가 이루어져 왔다. 따라서 중국인화자가 한국어를 발성하였을 때와 외국인화자의 한국어발성시의 특성을 비교, 분석 하였으며, 분석을 통한 향후 외국인들의 한국어 교육 시에 강세의 중요성을 알리기 위해 연구를 하고자 한다. 분석 결과 피치는 비슷하였으나 나머지 포만트 구간에서는 중국어 화자가 전체적으로 낮게 나왔으며, 중간 중간에 에너지가 적거나 없고, 강세부분에서 높낮이가 있지 않고 평탄한 결과를 얻을 수 있었다.

  • PDF

A Statistical Model for Korean Text Segmentation Using Syllable-Level Bigrams (음절단위 bigram정보를 이용한 한국어 단어인식모델)

  • Shin, Joong-Ho;Park, Hyuk-Ro
    • Annual Conference on Human and Language Technology
    • /
    • 1997.10a
    • /
    • pp.255-260
    • /
    • 1997
  • 일반적으로 한국어는 띄어쓰기 단위인 어절이 형태소 분석의 입력 단위로 쓰이고 있다. 그러나 실제 영역(real domain)에서 사용되는 텍스트에서는 띄어쓰기 오류와 같은 비문법적인 형태도 빈번히 쓰이고 있다. 따라서 형태소 분석 과정에 선행하여 적합한 형태소 분석의 단위를 인식하는 과정이 이루어져야 한다. 본 연구에서는 한국어의 음절 특성을 이용한 형태소분석을 위한 어절 인식 방법을 제안한다. 제안하는 방법은 사전에 기반하지 않고 원형코퍼스(raw corpus)로부터의 필요한 음절 정보 및 어휘정보를 추출하는 방법을 취하므로 오류가 포함된 문장에 대하여 견고한 분석이 가능하고 많은 시간과 노력이 요구되는 사전구축 및 관리 작업을 필요로 하지 않는다는 장점이 있다. 한국어 어절 인식을 위하여 본 논문에서는 세가지 확률 모텔과 동적 프로그래밍에 기반한 인식 알고리즘을 제안한다. 제안하는 모델들을 띄어쓰기 오류문제와 한국어 복합명사 분석 문제에 적용하여 실험한 결과 82-85%정도의 인식 정확도를 보였다.

  • PDF

Unification based Chart Parsing for Korean (Chart와 단일화를 이용한 한국어 분석 기법)

  • Kwon, Hyuk-Chul;Chae, Young-Soog;Yun, Ae-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 1989.10a
    • /
    • pp.15-20
    • /
    • 1989
  • 이 논문은 상대적으로 어순이 자유로운 언어인 한국어의 특성을 반영하면서, 모든 가능한 문장 구조를 분석할 수 있는 한국어 분석 방법을 제시한다. 특히 구절 구조에 의한 통사 표현 기능을 하위 범주화와 단일화에 의해 보완하는 기법을 이용하면서, bottom-up과 left-right에 의해 분석이 가능한 단일 과정 (one-path) 분석 기법을 이용하는 것이 본 논문의 특징이다. 그리고 하위 범주화와 서술어의 어미가 가진 양상 정보에 의존하여 한국어의 내포문 처리가 이루어져야함을 보여준다.

  • PDF

Morpheme-Unit POS Tagging Model Considering Eojeol-Spacing (어절 띄어쓰기를 고려한 형태소 단위 품사 태깅 모델)

  • Kim, Jin-Dong;Lee, Sang-Zoo;Rim, Hae-Chang
    • Annual Conference on Human and Language Technology
    • /
    • 1998.10c
    • /
    • pp.3-8
    • /
    • 1998
  • 한국어 품사 태깅 모델은 어절 단위 모델과 형태소 단위 모델로 나눌 수 있다. 이들 중 형태소 단위 모델은 자료 부족 문제가 별로 심각하지 않고 비교적 풍부한 태깅 결과를 내어 준다는 점에서 선호되나 어절 단위로 띄어쓰기를 하는 한국어의 특성을 제대로 반영하지 못한다는 단점이 있다. 이에 본 논문에서는 한국어의 어절 띄어쓰기 정보를 활용하는 형태소 단위 품사 태깅 모델을 제안한다. 어절 띄어쓰기 정보는 복잡도가 매우 작기 때문에 모델 구축에 드는 추가 비용이 그리 크지 않다. 그림에도 불구하고 실험 결과는 어절 띄어쓰기 정보가 한국어 품사 태깅에 유용한 정보임을 보여준다.

  • PDF

A Study on Resolving Word Sense Ambiguity Using Mutual Information (상호 정보를 이용한 어의 모호성 해소에 관한 연구)

  • Jeon, Mee-Sun;Park, Se-Young
    • Annual Conference on Human and Language Technology
    • /
    • 1994.11a
    • /
    • pp.369-373
    • /
    • 1994
  • 정보 검색 시스템의 정확성은 색인어의 정확성과 질의 해석의 정확성에 의존한다. 한국어 정보 검색분야에서는 한국어의 특성을 고려하는 것이 무엇보다 중요하다. 한국어의 문서 색인과 질의 해석시 야기되는 어의 모호성(word sense ambiguity)을 가지는 단어에 대해서는 어의 모호성을 해소한 정확한 색인과 질의 해석이 전제되어야 정확한 문서를 검색해낼 수 있다. 본 논문은 한국어 문서 색인시 동음이의어(homonym)에 의해 발생하는 어의 모호성을 해소하기 위한 방안에 대해 다루고 있으며 의미적 관련 정보를 이용할 것을 제안하고 타당성을 보이는 실험 결과를 제시한다.

  • PDF

Expansion and Improvement of Korean FrameNet utilizing linguistic features (언어적 특징을 반영한 한국어 프레임넷 확장 및 개선)

  • Kim, Jeong-uk;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2016.10a
    • /
    • pp.85-89
    • /
    • 2016
  • 프레임넷 (FrameNet) 프로젝트는 버클리에서 1997년에 처음 제안했으며, 최근에는 다양한 언어적 특징을 반영하여 여러 국가에서 사용되고 있다. 하지만 문장의 프레임을 분석하는 것은 자연언어처리 전문가들이 많은 시간을 들여야 한다. 이 때문에, 한국어 프레임넷을 처음 만들 때는 충분한 훈련을 받은 번역가들이 영어 프레임넷의 문장들과 그 주석 정보들을 직접 번역하는 방법을 사용했다. 결과적으로 상대적으로 적은 비용이 들지만, 여전히 한 문장에 여러 번 등장하는 프레임 정보를 모두 번역하고 에러를 분석해야 했기에 많은 노력이 들어갔다. 본 연구에서는 일본어와 한국어의 언어적 유사성을 사용하여 비교적 적은 비용으로 한국어 프레임넷을 확장하는 방법을 제시한다. 또한 프레임넷에 친숙하지 않은 사용자가 더욱 쉽게 프레임 정보를 활용할 수 있도록 PubAnnotation 기술을 도입하고 "조사"라는 특성을 고려한 Valence pattern 분류를 통해 한국어 공개 프레임넷 사이트를 개선하였다.

  • PDF

A Study on a Part of Speech for Korean Natural Language Processing (한국어 처리를 위한 품사 체계 연구)

  • Ahn, Mi-Jung;Kim, Jae-Han;Okcy, Cheol-Young
    • Annual Conference on Human and Language Technology
    • /
    • 1993.10a
    • /
    • pp.581-592
    • /
    • 1993
  • 지금까지의 한국어 자연언어 처리에 기반이 되는 사전 품사 체계에 대한 연구는 형태소 분석, 구문 구조 분석, 그리고 의미 분석 등의 다양한 분야에서 이루어져 왔다. 한국어 자연언어 처리 각 분야는 자체의 고유한 독립성을 가지는데, 이러한 특성은 사전 품사 체계의 다양화를 초래하였으며, 연계성있는 자연언어 처리를 위한 통합 환경 조성을 저해시켜 왔다. 본 논문에서는 한국어 자연언어 처리 전반에 걸친 통합 환경 조성을 위한 범용적인 사전 품사체계의 필요성에 따라 한국어 자연언어 분석의 각 분야에 적합한 사전 품사체계에 대하여 살펴 본 후, 한국어 자연 언어 처리 전반에 사용될 범용적이고 통합적인 기본 사전 품사체계 구축을 위한 방안을 제시한다.

  • PDF

Pronunciation Generation Based on Morphophonological Analysis in Korean TTS (한글 TTS시스템에서 형태 음운론적 분석에 기반 한 발음열 생성)

  • Jeong, Kyung-Seok;Park, Hyuk-Ro
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.10a
    • /
    • pp.559-562
    • /
    • 2001
  • 한국어 TTS시스템에서 한 가지 모듈로써의 발음열 생성기는 한국어의 특성상 음운적 조건과 형태론적 조건 등에 의해 다양한 방법과 예외처리를 요구하고 한국어의 음운현상에 대한 체계적인 분석과 처리가 필요하다. 그래서 이 논문은 형태 음운론적 분석을 통한 발음열 자동 생성기법을 소개한다. 이 시스템은 형태소 분석을 선행한 후, 특수문자나 숫자 등을 정규화하고 복합명사 분해 사전을 이용한 복합명사 분해와 추가 조건을 통해 ㄴ-첨가 규칙을 전 처리한다. 그리고 음운 변화 현상을 분석하여 선택적으로 규칙을 적용하여 발음열을 생성한다. 제안된 시스템은 기존의 형태소 분석되지 않은 시스템에 비해 더욱 효과적인 음운, 형태소 변화를 가져옴과 함께, 특히 ㄴ-첨가가 적용되는 텍스트는 7$\sim$8%정도의 나은 발음열을 생성찬 수 있었다. 그 결과, 발음열 생성기는 한국어 TTS 시스템의 한국어 처리라는 고질적인 문제 해결에 좋은 방향과 결과를 기여할 수 있다.

  • PDF

Korean Depenency Parsing using a Maximum Spanning Tree (최대신장트리를 이용한 한국어 의존구문분석)

  • Park, Young-Min;Seo, ung-Yun
    • Annual Conference on Human and Language Technology
    • /
    • 2010.10a
    • /
    • pp.68-72
    • /
    • 2010
  • 본 논문에서는 그래프 기반의 최대신장트리(Maximum Spanning Tree)를 이용한 한국어 의존구문분석 방법을 제안한다. 우리는 최대신장트리 알고리즘을 한국어의 특성인 지배성분 후위의 원칙과 투사성의 원칙을 적용하여 한국어 의존구문분석에 적합한 알고리즘을 만들었다. 제안한 알고리즘은 기존의 한국어 의존구문분석의 방법들보다 낮은 시간복잡도를 가지며 대용량 말뭉치를 학습하기 위해 증분학습이 가능하고 비교적 학습속도가 빠른 Averaged Perceptron 알고리즘을 사용하였다. 실험결과 제안한 방법은 비교적 열악한 환경인 복문이 포함된 장문의 문장에서도 뛰어난 성능을 보여주었다,

  • PDF

Perception of native Korean speakers on English and German $/\int/$ - in relation to loanword representation (한국인의 외국어 $/\int/$음에 대한 인지연구 - 외래어 표기와 관련하여 -)

  • Kang Hyunsook;Koo SoRyeong;Lee Sook-hyang
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.305-308
    • /
    • 2000
  • 본 논문에서는 한국어에 나타난 외래어 중에서 외국어(영어/독일어)의 $[\int]$음이 어떻게 인식되고 해석되었는지를 살펴보았다. 특히 본 논문에서는 $[\int]$음의 영어와 독일어 발음과 한국어의 대응되는 분절음이 일대일 대응을 이루고 있지 못하다는 것을 보이고 이런 대응관계를 설명하기 위해 어떤 정보가 필요한지에 대해 살펴보았다. 즉, 독일어와 영어에서 음절의 말음으로 쓰인$[\int]$음이 한국어에서는 [쉬/시]로 인식되는데 반해 본토어에서 $[\int]$음이 음절초음의 일부로 사용된 경우에는 한국어의 외래어에서 (슈)로 화자에게 인식되고 또 문자로 표현된다 따라서 본 논문에서는 음절초음의 일부로 나타나는 외국어의 $[\int]$음과 음절말음으로 나타나는 외국어 $[\int]$음의 음성학적 기호를 분석해보고 한국어에서 서로 다른 표면형을 형성하는 이유가 본토어의 (음절 초음/말음이라는) 음운론적 특성에 기인하는 것인지 혹은 현재까지 우리가 알고 있지 못했던 $[\int]$음의 발음 위치에 따른, 즉 동시조음(coarticulation) 현상 때문에 생긴 변이음 때문인지에 대한 규명을 시도하였다. 외국어 화자의 발성실험을 통해, 한국어에서 /쉬/로 인식되는 독일어와 영어의 $/\int/$음은 /슈/로 인식되는 $/\int/$음보다 마찰소음의 peak frequency가 높거나 지속시간이 길게 나타났다 이런 결과를 근거로 영어와 독일어의 $/\int/$ 음이 한국어의 /쉬/음과 /슈/음으로 구분될 때 사용되는 음성자질은 크게 2가지, 즉 마찰소음의 peak frequency와 지속시간이며, 둘 중 한가지만 있어도 구분은 가능하나 이 2가지가 동시에 존재할 때 /쉬/음과 /슈/음의 구분이 현저히 용이해진다는 가설을 세워보았다.

  • PDF