• Title/Summary/Keyword: 한국어

Search Result 5,288, Processing Time 0.031 seconds

A Description Method of Korean Auxiliary Verbs (한국어 보조동사의 개념그래프적 기술 방안)

  • Lee, Byeong-Hui;Gwon, O-Seok
    • The KIPS Transactions:PartB
    • /
    • v.8B no.4
    • /
    • pp.373-380
    • /
    • 2001
  • 본 논문은 한국어 보조동사의 의미를 Sowa에 의해 제안되고 국제표준이 되고있는 개념그래프를 이용하여 형식적으로 기술하는 방법을 제안한다. 이를 위해 영어의 양상과 상에 관한 개념그래프를 알아보고 한국어 보조동사를 통사/의미론적으로 고찰한다. 한국어 보조동사의 개념그래프적 기술을 위해, 각종 논문과 국어사전에서 한국어 보조동사 40개의 여러 예문들을 수집하여 완료, 진행, 봉사, 시도, 강세, 원망, 지속, 추정의 8가지 의미로 분류하고 이들을 개념그래프로 기술한다. 실험에서는 이들 8가지 의미들을 인공지능언어의 일종인 LIPS과 유사한 KIF로 작성하고 C++를 이용하여 한국어 보조동사가 포함된 문장을 입력받아 개념그래프로 변환하는 프로그램을 구현한다. 문장 내의 모든 범주들의 개념과 개념 관계가 자연어의 모든 의미관계를 표시할 수 있는 개념그래프는 한국어 보조동사의 다양한 의미를 기술하는데 적합함을 알 수 있었다.

  • PDF

Korean Speech Recognition using the Phoneme (음소를 이용한 한국어의 인식)

  • 김영일;차일환;조문재
    • The Journal of the Acoustical Society of Korea
    • /
    • v.3 no.2
    • /
    • pp.35-45
    • /
    • 1984
  • 본 연구는 한국어의 발음상의 특징과 구조에 의해서 한국어를 음소별로 분리할 수 있음에 착안 하여, 자음과 모음으로 구성된 한국어 단음을 자음의 음소와 모음의 음소로 각각 분리하여 인식하는 새 로운 방법에 관한 연구이다. 특정 화자 2명에 대하여 한국어 단음 84자를 모음의 음소와 자음의 음소로 각각 분리하여 인삭한 실험결과 모음을 인식한 경우에는 선형 예측 계수를 이용하면 인식률이 95.2%이 고, 편자기 상관계수로 92.5%, 폴만트로 97.6%의 인식률을 얻었고, 자음을 인식한 경우에는 선형 예측 계수로 88.7%, 편자기 상관계수로 92.9%의 인식률을 얻었다. 또, 자음의 음소와 모음의 음소를 결합시킨 단음을 인식한 경우에는 선형 예측 계수로 83.9%, 편자기 상관계수로 86.3%의 인식률을 얻었다. 이 때, 각 음소들의 데이터의 수는 256개이고, 선형 예측 계수와 편자기 상관 계수와의 예측차는 15차이다. 이 와 같이 한국어를 자음의 음소와 모음의 음소로 분리하면 작은 데이터 양으로 처리 시간을 단축 시켜 한국어의 모든 단음, 단어, 연속음, 문장 등을 분석하고 인식할 수 있고, 또한 각 음소들을 원칙적으로 결합시켜 모든 한국어의 합성이 가능함을 알 수 있다.

  • PDF

A Plug-In Component-based Korean Morphological Analyzer (플러그인 컴포넌트 기반의 한국어 형태소 분석기)

  • Park, Sangwon;Choi, Donghyun;Kim, Eunkyung;Choi, Keysun
    • Annual Conference on Human and Language Technology
    • /
    • 2010.10a
    • /
    • pp.197-201
    • /
    • 2010
  • 지식/정보 서비스의 수준이 급격히 발전함에 따라 기반 기술인 자연언어처리의 중요성이 증가했고, 또 여러 분야에서 다양한 목적에 부합하는 자연언어처리 도구를 필요로 하고 있다. 한국어 자연언어처리 기반 기술 중에서 형태소 분석은 기초적이면서도 중요한 분석 단계이다. 하지만 현재까지 개발된 한국어 형태소 분석기들은 대부분 특정 시스템에 맞게 최적화되어 실행 효율성과 정확성을 높이는데 중점을 두고 있다. 이러한 도구들은 접근성과 확장성이 떨어지고 다양한 요구에 유언하게 대처할 수 없는 단점이 있다. 따라서 본 논문에서는 플러그인 형태의 한국어 형태소 분석 컴포넌트들을 이용하여 유연하게 워크플로를 구성하고 다양한 목적에 맞게 활용할 수 있도록 지원하는 한국어 형태소 분석 시스템을 제안한다. 이번 연구를 통해서 보다 많은 사람들이 형태소 분석 기술에 쉽게 접근하고 활용하여, 한국어 분석 기반 기술 및 용용 기술이 더욱 발전 할 수 있을 것으로 기대한다.

  • PDF

A Study for Sequence-to-sequence based Korean Abstract Meaning Representation (AMR) Parsing (Seq2seq 기반 한국어 추상 의미 표상(AMR) 파싱 연구)

  • Hao Huang;Hyejin Park;Hansaem Kim
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.257-261
    • /
    • 2022
  • 본 연구에서는 한국어 AMR 자동 파싱을 하기 위해 seq2seq 방법론을 적용하였다. Seq2seq 방법론은 AMR 파싱 태스크를 자연어 문장을 바탕으로 선형화된(linearization) 그래프의 문자열을 번역해내는 과정을 거친다. 본고는 Transformer 모델을 파싱 모델로 적용하여 2020년 공개된 한국어 AMR와 자체적으로 구축된 한국어 <어린 왕자> AMR 데이터에서 실험을 진행하였다. 이 연구에서 seq2seq 방법론 기반 한국어 AMR 파싱의 성능은 Smatch F1-Score 0.30으로 나타났다.

  • PDF

KcBERT: Korean comments BERT (KcBERT: 한국어 댓글로 학습한 BERT)

  • Lee, Junbum
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.437-440
    • /
    • 2020
  • 최근 자연어 처리에서는 사전 학습과 전이 학습을 통하여 다양한 과제에 높은 성능 향상을 성취하고 있다. 사전 학습의 대표적 모델로 구글의 BERT가 있으며, 구글에서 제공한 다국어 모델을 포함해 한국의 여러 연구기관과 기업에서 한국어 데이터셋으로 학습한 BERT 모델을 제공하고 있다. 하지만 이런 BERT 모델들은 사전 학습에 사용한 말뭉치의 특성에 따라 이후 전이 학습에서의 성능 차이가 발생한다. 본 연구에서는 소셜미디어에서 나타나는 구어체와 신조어, 특수문자, 이모지 등 일반 사용자들의 문장에 보다 유연하게 대응할 수 있는 한국어 뉴스 댓글 데이터를 통해 학습한 KcBERT를 소개한다. 본 모델은 최소한의 데이터 정제 이후 BERT WordPiece 토크나이저를 학습하고, BERT Base 모델과 BERT Large 모델을 모두 학습하였다. 또한, 학습된 모델을 HuggingFace Model Hub에 공개하였다. KcBERT를 기반으로 전이 학습을 통해 한국어 데이터셋에 적용한 성능을 비교한 결과, 한국어 영화 리뷰 코퍼스(NSMC)에서 최고 성능의 스코어를 얻을 수 있었으며, 여타 데이터셋에서는 기존 한국어 BERT 모델과 비슷한 수준의 성능을 보였다.

  • PDF

Neural Architecture Search for Korean Text Classification (한국어 문서 분류를 위한 신경망 구조 탐색)

  • ByoungKyu Ji
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.125-130
    • /
    • 2023
  • 최근 심층 신경망을 활용한 한국어 자연어 처리에 대한 관심이 높아지고 있지만, 한국어 자연어 처리에 적합한 신경망 구조 탐색에 대한 연구는 이뤄지지 않았다. 본 논문에서는 문서 분류 정확도를 보상으로 하는 강화 학습 알고리즘을 이용하여 장단기 기억 신경망으로 한국어 문서 분류에 적합한 심층 신경망 구조를 탐색하였으며, 탐색을 위해 사전 학습한 한국어 임베딩 성능과 탐색한 신경망 구조를 분석하였다. 탐색을 통해 찾아낸 신경망 구조는 기존 한국어 자연어 처리 모델에 대해 4 가지 한국어 문서 분류 과제로 비교하였을 때 일반적으로 성능이 우수하고 모델의 크기가 작아 효율적이었다.

  • PDF

Korean Chemical Named Entity Recognition in Patent Documents (특허문서의 한국어 화합물 개체명 인식)

  • Jinseop Shin;Kyung-min Kim;Seongchan Kim;Mun Yong Yi
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.522-524
    • /
    • 2023
  • 화합물 관련 한국어 문서는 화합물 정보를 추출하여 그 용도를 발견할 수 있는 중요한 문서임에도 불구하고 자연어 처리를 위한 말뭉치의 구축이 되지 않아서 활용이 어려웠다. 이 연구에서는 최초로 한국 특허 문서에서 한국어 화합물 개체명 인식(Chemical Named Entity Recognition, CNER)을 위한 말뭉치를 구축하였다. 또한 구축된 CNER 말뭉치를 기본 모델인 Bi-LSTM과 KorBERT 사전학습 모델을 미세 조정하여 개체명 인식을 수행하였다. 한국어 CNER F1 성능은 Bi-LSTM 기반 모델이 83.71%, KoCNER 말뭉치를 활용하는 자연어 처리 기술들은 한국어 논문에 대한 화합물 개체명 인식으로 그 외연을 확대하고, 한국어로 작성된 화합물 관련 문서에서 화합물 명칭뿐만 아니라 물성, 반응 등의 개체를 추출하고 관계를 규명하는데 활용 될 수 있을 것이다.

  • PDF

한국어 음성인식

  • 정차균
    • The Magazine of the IEIE
    • /
    • v.24 no.9
    • /
    • pp.75-82
    • /
    • 1997
  • 한국어 음성인식기술은 1980년대를 전후로 비약적인 발전을 하여왔다. 본 논문에서는 한국어 음성인식에 적용된 기술을 검토하고, 문제점을 고찰해서 향후 한국어 음성인식의 나아갈 방향을 조명해 본다.

  • PDF

The Scope and Patterns of Korean Language Education for Specific Purposes - Focusing on the Patterns of Learners in Korean Language Education for Missionary Purposes - (특수목적 한국어교육의 범위와 유형에 관한 연구 - 선교목적 한국어교육에서 대상자에 따른 유형 중심으로 -)

  • Lee, Ran
    • The Journal of the Korea Contents Association
    • /
    • v.21 no.3
    • /
    • pp.685-695
    • /
    • 2021
  • The purpose of this study is to confirm the definition and the scopes of the implementation of Korean education for missionary purposes which is an area of ones for specific purposes and to suggest the teaching methods for each type by examining the subtypes of it. For this, a body of research and the related textbooks were analyzed: as a result, the definition of Korean education for missionary purposes was confirmed by examining the scope of implementation of it. Based on the definition, this study categorized the learners into four patterns such as non-Christian, the learners for listening gospel, the learners for nurturing, overseas Korean children and missionary kids according to the levels of Christianity literacy and briefly proposed the goals and teaching methods for each category. Finally, this study expected the development of the related textbooks and the activation of more segmented research in this area.

Developing Korean Learning Contents Using Augmented Reality (증강현실을 활용한 한국어 학습 콘텐츠 개발)

  • Park, Eunha;Jeon, Jinwoo
    • The Journal of the Korea Contents Association
    • /
    • v.13 no.4
    • /
    • pp.459-468
    • /
    • 2013
  • With advancements in augmented reality technology, attempts to apply it in various fields have increased. With advancements in information technology and a growth in the number of Korean learners in Korea and abroad, there is a growing demand for state-of-the-art Korean learning contents. Because the Korean learning contents developed using augmented reality have been found insufficient, this paper investigates ways to develop better contents. This paper proposes ways to develop learning contents that can increase learners' interest in learning and lead to academic achievement, because the methods of education in Korea are limited to textbook learning and learning through the media. Because of the structure of fairytales and the educational lessons that can be learned from them, Korean learning contents are developed using fairytales. Additionally, Korean contents are designed to implement augmented reality technology, and learners need only have computers, webcams, and markers to make use of it. In consideration of Korean learners who do not have access to augmented reality technology, this paper clarifies that there should be a harmony between existing and new Korean learning contents. On the basis of this study, further studies on Korean education exploring the role of augmented reality should be conducted so that Korean learning contents that use diverse types of augmented reality technology can be will developed.