• Title/Summary/Keyword: 음운 정보

Search Result 124, Processing Time 0.025 seconds

Morphological Analysis of Irregular Conjugation in Korean with Micro Combinatory Categorial Grammar (MicroCCG를 이용한 용언의 불규칙 활용의 처리와 한국어 형태소 분석)

  • 이호준;박종철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.531-533
    • /
    • 2003
  • 본 논문에서는 형태소 수준의 결합범주문법을 이용하여 형태소 분석을 포함한 자연언어처리의 여러 단계를 한 단계의 유도과정으로 처리하고 형태소 분석 단계에서 증가하는 애매성과 복잡도를 상위 분석 단계의 정보를 사용하여 줄이는 방법에 대해서 논한다. 한국어에서 나타나는 복잡한 언어 현상 중에 하나인 용언의 불규칙 활용을 확률 정보뿐만 아니라 음운정보를 포함만 통사 정보나 의미 정보 등의 상위 정보를 사용하여 처리하여보고 일반적인 형태소 분석기로서의 발전 가능성에 대해서 알아본다.

  • PDF

A Study of Morphophonemic Processes of Korean using Neural Networks (인공신경망을 이용한 한국어 형태음운현상 연구)

  • Lee, Chan-Do
    • The Transactions of the Korea Information Processing Society
    • /
    • v.2 no.2
    • /
    • pp.215-228
    • /
    • 1995
  • Despite their importance in language, there have been relatively few computational studies in understanding words. This paper describes how neural networks can learn to perceive and produce words. Most traditional linguistic theories presuppose abstract underlying representations (UR) and a set of explicit rules to obtain the surface realization. There are, however, a number of questions that can be raised regarding this approach: (1) assumption of URs, (2) formation of rules, and (3) interaction of rules. In this paper, it is hypothesized that rules would emerge as the generalizations the network abstracts in the process of learning to associate forms with meanings of the words. Employing a simple recurrent network, a series of simulations on different types of morphophonemic processes was run. The results of the simulations show that this network is capable of learning to perceive whether words are in basic from or in inflected form, given only forms, and to produce words in the right form, given arbitrary meanings, this eliminating the need for presupposing abstract URs and rules.

  • PDF

The Effects of Korean Lexical Characteristics on Memory Span (한국어 어휘특성들이 기억폭에 미치는 효과)

  • Park Tae-Jin;Park Sun-Hee;Kim Tae-Ho
    • Korean Journal of Cognitive Science
    • /
    • v.17 no.1
    • /
    • pp.15-27
    • /
    • 2006
  • The effects of the number of Hangul syllable, the nunber/location of batchim in a Hangul word, and compound/noncompound Hangul word on memory span were examined. The results were that (1) the more syllables a word had, the lower us memory span was, (2) the more batchims a two-syllable word had, the lower its memory span was (Korean batchim effect on memory span), (3) noncompound word had higher memory span than compound word. The reading speed of above mentioned words was measured and the results were that (1) the more syllables a word had, the slower its reading speed was, (2) but the reading speed of a two-syllable word was forest when it had a batchim on second syllable than when it had no batchim or had a batchim on first syllable or batchims on both syllables (Korean ending batchim effect on reading speed), (3) noncompound word was read faster thu compound word. Korean ending batchim effect on reading speed was not compatible with the explanation by articulatory loop bur compatible with the explanation by visual cache where the orthographic information was represented. The results suggest that memory span was influenced nor only by phonological information but also by orthographic information.

  • PDF

Korean Spacing System for Continuous Speech Characters (연속 음성 문자열에 대한 한국어 띄어쓰기 시스템)

  • Kim, Kye-Sung;Lee, Hyun-Ju;Kim, Sung-Kyu;Choi, Jae-Hyuk;Lee, Sang-Jo
    • Annual Conference on Human and Language Technology
    • /
    • 1998.10c
    • /
    • pp.391-395
    • /
    • 1998
  • 대용량의 연속된 음성을 인식하는 데에는 형태소 사이의 음운변동과 언절과 어절 사이의 불일치 등으로 인한 어려움이 따른다. 그러므로 언어학적인 지식을 이용한 자연어 처리 기술과의 결합이 필수적이라 할 수 있다. 본 논문에서는 문장 단위의 연속 음성 문자열을 올바른 어절로 띄어주는 시스템을 제안한다. 먼저 띄어쓰기 발음열 사전을 이용하여 어절의 경계를 추정한다. 이 때 보다 정확한 띄어쓰기 위치를 추정하기 위하여 2음절 이상의 최장 조사 어미와 음절 분리가능빈도가 이용된다. 이렇게 해서 분리된 어절들은 음절 복원기를 거친 뒤, 형태소 분석을 행하여 올바른 어절인지를 검사한다. 분석에 실패한 어절은 띄어쓰기 오류 유형에 따라 교정을 한 후 형태소 분석을 재시도한다. 제안한 시스템을 테스트해 본 결과 96.8%의 정확도를 보였다. 본 시스템은 음운 변동 처리기와 함께 말소리를 음성 그대로 인식하는 인식기의 후처리로 이용할 수 있을 것이다.

  • PDF

Textbook vocabulary analysis for Korean phonics program of 1st and 2nd graders (한글 파닉스 교육을 위한 초등 1-2학년 교과서 어휘 자소분석)

  • Lee, Daeun;Kim, Hyeji;Shin, Gayoung;Seol, Ahyoung;Pae, Soyeong;Kim, Mibae
    • Annual Conference on Human and Language Technology
    • /
    • 2016.10a
    • /
    • pp.226-230
    • /
    • 2016
  • 본 연구는 초등 저학년 읽기부진아동을 위한 한글 파닉스 교육의 기반을 확립하고자 1-2학년 교과서 고빈도 어절 531개를 기반으로 자소 및 음운규칙을 분석하였다. 연구결과, 자소-음소 일치 어절을 기반으로 하였을 때 초성에서 50번 이상 나타난 자소는 /ㄱ/, /ㄹ/, /ㄴ/, /ㅅ/, /ㅎ/, /ㅈ/이다. 중성에서 50번 이상 나타난 자소는 /ㅏ/, /ㅣ/, /ㅗ/, /ㅡ/, /ㅜ/이다. 종성에서 50번 이상 나타난 자소는 /ㄹ/, /ㄴ/, /ㅇ/이다. 자소와 음소가 불일치 된 어절을 기반으로 하였을 때 가장 많이 출현하는 음운규칙은 연음화 규칙이었다. 본 연구결과를 바탕으로 교과서를 기반으로 한 한글 파닉스 교육에 유용하게 사용될 수 있을 것이다.

  • PDF

Study on the parts-of-speech in Korean (한국어 품사 분류에 대한 제안)

  • 서민정
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2002.05a
    • /
    • pp.76-81
    • /
    • 2002
  • 인터넷의 발달 등으로 많은 정보들이 문서화되기도 하고 그런 정보들이 공유되고 있는 지금, 언어학이나 전산학의 요구를 함께 충족시킬 수 있는 문법 모델 개발의 필요성이 극대화되고 있다. 이 글은 한국어 품사 분류에 대해서 국어학과 전산학에서의 처리 방법과 결과를 검토하고 정리하여 우리말의 특성을 잘 설명하면서도 국어를 전산 처리하는데도 도움을 줄 수 있는 품사분류를 제안하는데 그 목적이 있다. 한국어의 특성을 고려하여 음운, 형태, 통 어, 의미 정보를 함께 처리할 수 있는 어휘부 중심의 문법인 HPSG의 모형을 도입하여 한국어 품사 분류를 정보 전달에 기반을 두어 자질 체계와 통합 연산을 핵심으로 기술하려고 한다. 문법기술은 주로 자질 구조를 속성과 값의 행렬인 AVM(attribute-value matrices)으로 제시할 것이다.

  • PDF

Textbook vocabulary analysis for Korean phonics program of 1st and 2nd graders (한글 파닉스 교육을 위한 초등 1-2학년 교과서 어휘 자소분석)

  • Lee, Daeun;Kim, Hyeji;Shin, Gayoung;Seol, Ahyoung;Pae, Soyeong;Kim, Mibae
    • 한국어정보학회:학술대회논문집
    • /
    • 2016.10a
    • /
    • pp.226-230
    • /
    • 2016
  • 본 연구는 초등 저학년 읽기부진아동을 위한 한글 파닉스 교육의 기반을 확립하고자 1-2학년 교과서 고빈도 어절 531개를 기반으로 자소 및 음운규칙을 분석하였다. 연구결과, 자소-음소 일치 어절을 기반으로 하였을 때 초성에서 50번 이상 나타난 자소는 /ㄱ/, /ㄹ/, /ㄴ/, /ㅅ/, /ㅎ/, /ㅈ/이다. 중성에서 50번 이상 나타난 자소는 /ㅏ/, /ㅣ/, /ㅗ/, /ㅡ/, /ㅜ/이다. 종성에서 50번 이상 나타난 자소는 /ㄹ/, /ㄴ/, /ㅇ/이다. 자소와 음소가 불일치 된 어절을 기반으로 하였을 때 가장 많이 출현하는 음운규칙은 연음화 규칙이었다. 본 연구결과를 바탕으로 교과서를 기반으로 한 한글 파닉스 교육에 유용하게 사용될 수 있을 것이다.

  • PDF

규칙기반과 신경망 모델을 결합한 한국어 글자-음소 변환 시스팀 개발에 관한 연구

  • Kim, Se-Hun;Lee, Ju-Heon
    • Annual Conference on Human and Language Technology
    • /
    • 1991.10a
    • /
    • pp.307-320
    • /
    • 1991
  • 본 연구는 한국어 음성합성 시스팀에서 한글 텍스트를 음소로 변환 시키는 규칙기반과 신경망을 결합한 한글-음소 변환 시스팀을 제안하고 이를 위해 시스팀 모델을 설계하고 시스팀의 각 구성요소들을 설명하며 한국어 음운 변동 규칙중 설측음화 데이타와 설측음화에 상충되는 데이타를 사용하여 시스팀을 실험하고 제안된 모형의 타당성을 분석한다.

  • PDF

Effect of orthographic, phonological and semantic information on the processes of Korean heteronym (동철이음어 처리 과정에서 형태와 의미 정보의 영향)

  • Kim, Tae Hoon;Cho, Jeung-Ryeul;Lee, Yoonhyoung
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.16 no.6
    • /
    • pp.3819-3828
    • /
    • 2015
  • The present study discusses some of important issues in the word recognition such as the roles of the form(orthographic & phonologic) and semantic information by investigating the processes of Korean heteronym. The priming paradigm has been applied to see whether or not there would be facilitatory effect from form and/or semantic information. In experiment 1, orthographically-related or phonologically-related prime stimuli were presented and a lexical decision task for Korean heteronym was conducted. The same procedure was applied for the experiment 2, except the prime stimulus which was semantically-related. The results showed that orthographic and phonologic information did not influence the processing of the heteronym while semantic information facilitated its processing, suggesting that the semantic information plays an important role in the processes of the Korean heteronym.

An Implementation of A Korean Standard Ponetic Value Generating System (WWW에서의 한국어 표준 음가생성 시스템 구현)

  • 임재걸;이계영;남중구
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10b
    • /
    • pp.204-206
    • /
    • 1999
  • 본 시스템은 한글 발음 교육 사이트 개발 프로젝트의 일부인 음가 생성에 관한 컴포넌트로써 한국어 표준발음 테이블에서 음운 변동값을 추출하고 해당 음성과 입모양을 출력하는 WWW상의 자바 애플릿 프로그램 개발에 관한 연구이다. 본 논문에서는 형태소 분석에 선행되어야 할 전처리 과정, 예외처리, 음가 생성부에서 고려하여야할 점과, 시스템의 애플릿 구현 등에 대해 중점적으로 기술하였다.

  • PDF