• 제목/요약/키워드: 한국어 정의

검색결과 504건 처리시간 0.024초

일본인 화자의 한국어 모음 발음에 대한 음향음성학적인 연구

  • 조성문;오오까와다이스께
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 2003년도 제19회 학술대회
    • /
    • pp.141-141
    • /
    • 2003
  • 발음 교육은 의사소통적 교수법을 중시하는 최근의 언어 교육에서 약간 소홀히 다루어져 왔다. 그러나 외국어로서의 한국어 교육에서 정확한 발음 교육은 의사소통을 위해서 매우 중요한 역할을 한다고 볼 수 있다. 아무리 한국어 어휘와 문법을 정확하게 표현한다고 해도 잘못된 발음을 한다면 가장 기본적인 것에서 오류를 범하게 되기 때문이다. 다만 지금까지 일본인의 한국어 발음 오류에 대해서 조음음성학적이나 음운론적으로 어느 정도 연구가 되어 있다. 그러나 그 연구 결과들은 추상적인 단계에 머물러 있어서 아직까지 일본인의 한국어 모음 발음 문제를 명확하게 분석해 내지 못하고 있다. (중략)

  • PDF

한국어 Lexicon에 의존한 문자 인식의 후처리 (A Postprocessing of Character Recognition Based on Korean Lexicon)

  • 임한규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.371-377
    • /
    • 1993
  • 본 논문에서는 문자 인식이 끝난 한국어 원문에 대해 한국어 Lexicon에 기반을 둔 후처리의 구현을 보여주는 것을 목적으로 한다. 빈번하게 오인식되는 음절에 대해 이의 옳은 음절을 대응시킨 테이블을 만들어 놓고, 오인식이라고 정의된 음절이 출현했을 때는 이를 원래의 옳은 음절로 대체시킨 어절과 오인식된 음절이 포함된 어절에 대해 한국어 형태소 분석을 행함으로써, 올바른 형태소가 분석될 경우, 이를 옳은 음절로 간주한다. 실험결과 약 90%에서 95%에 달하는 인식율이 이 후처리 방법에 의해서 95%에서 99%로 높아졌다.

  • PDF

의사 형태소 단위의 음성언어 형태소 해석 (Morphological Analysis of Spoken Korean Based on Pseudo-Morphemes)

  • 이경님;정민화
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.396-404
    • /
    • 1998
  • 본 논문에서는 언어학적 단위인 형태소의 특성을 유지하면서 음성인식 과정에 적합한 분리 기준의 새로운 디코딩 단위인 의사형태소(Pseudo-Morpheme)를 정의 하였다. 이러한 필요성을 확인하기 위해 새로이 정의된 40개의 품사 태그를 갖는 의사 형태소를 표제어 단위로 삼아 발음사전 생성과 형태소 해석에 초점을 두고 한국어 연속음성 인식 시스템을 구성하였다.

  • PDF

소프트웨어 정의 네트워크를 이용한 한중일 한자-한국어 변환 키워드 도메인 이름 시스템 (CJK Chinese Character-Korean Character Conversion Keyword Domain Name System in Software Defined Network)

  • 이승훈;조승철;薛園園;路凯;向天歌;한선영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.339-342
    • /
    • 2019
  • 본 논문에서는 소프트웨어 정의 네트워크를 이용한 한중일 한자-한국어 변환 키워드 도메인 이름 시스템을 제안하였다. 한자 체계를 주로 사용하는 한국, 중국, 일본에서 세 나라의 한자 수량이 너무 많기 때문에 우선 한국, 중국, 일본이 공용으로 사용하는 한자 체계인 CJK808을 가지고 연구하였다. 연구를 통해 CJK808 한자 체계에서 각 나라의 한자 특징도 많이 발견하였고, 그 중에서 표준자와 이체자의 다양성이 더욱 두드러졌다. SDN을 이용함으로써 관리 측면에서 다양한 이점을 얻을 수 있다. 제안하는 시스템을 통하여 사용자들은 한국, 중국, 일본 한자를 입력하면 SDN에서 관리하는 도메인 네임 서버를 통해 IP 주소를 얻을 수 있다.

  • PDF

한국어 어휘의미망을 활용한 Conditional Random Fields 기반 한국어 개체명 인식 (Conditional Random Fields based Named Entity Recognition Using Korean Lexical Semantic Network)

  • 박서연;옥철영;신준철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.343-346
    • /
    • 2020
  • 개체명 인식은 주어진 문장 내에서 OOV(Out of Vocaburary)로 자주 등장하는 고유한 의미가 있는 단어들을 미리 정의된 개체의 범주로 분류하는 작업이다. 최근 개체명이 문장 내에서 OOV로 등장하는 문제를 해결하기 위해 외부 리소스를 활용하는 연구들이 많이 진행되었다. 본 논문은 의미역, 의존관계 분석에 한국어 어휘지도를 이용한 자질을 추가하여 성능 향상을 보인 연구들을 바탕으로 이를 한국어 개체명 인식에 적용하고 평가하였다. 실험 결과, 한국어 어휘지도를 활용한 자질을 추가로 학습한 모델이 기존 모델에 비해 평균 1.83% 포인트 향상하였다. 또한, CRF 단일 모델만을 사용했음에도 87.25% 포인트라는 높은 성능을 보였다.

  • PDF

한국어 번역 메모리 시스템의 실현성 분석 및 설계 (Feasibility Test and Design of Korean Translation Memory System)

  • 류철;노윤형;이기영;최승권;박상규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.281-287
    • /
    • 2001
  • 번역 메모리(Translation Memory) 시스템이란 기존에 번역된 결과를 담고 있는 대용량의 번역 메모리에서 사용자가 제시한 입력문과 가장 유사한 문장을 검색한 후, 유사도 순으로 결과를 제시하여 이후의 번역 작업을 보다 효율적으로 할 수 있도록 도와주는 시스템을 말한다. 이는 기계 번역 시스템과 비교해 볼때, 보다 실현 가능성이 높은 자연어 처리의 응용 분야라고 할 수 있다. 일반적으로 번역 메모리 시스템에서 핵심이 되는 요소는 번역메모리의 구성과 유사성 척도에 대한 정의라고 할 수 있다. 국외의 경우, 이미 많은 상용 시스템들이 개발되어 번역 작업의 시간 및 비용을 줄이는데 많은 도움을 주고 있지만, 국내의 경우 한국어 번역 메모리의 구성 및 한국어 문장간 유사성 척도 등에 대한 연구가 미흡한 실정이다. 따라서 본 논문에서는 한국어를 대상으로 번역 메모리의 효율적인 구성 방법 및 문장간 유사성 척도에 대한 정의를 내리며, 한국어를 대상으로한 번역 메모리 시스템에 대한 실현 가능성을 논한다.

  • PDF

한국어 단어 정의 벡터를 이용한 단어 의미 모호성 해소 (Word Sense Disambiguation Using Korean Word Definition Vectors)

  • 박정연;이재성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.195-198
    • /
    • 2021
  • 기존 연구에 따르면, 시소러스의 계층적 관계를 기반으로 압축한 의미 어휘 태그를 단어 의미 모호성 해소에 사용할 경우, 그 성능이 향상되었다. 본 논문에서는 시소러스를 사용하지 않고, 국어 사전에 포함된 단어의 의미 정의를 군집화하여 압축된 의미 어휘 태그를 만드는 방법을 제안한다. 또, 이를 이용하여 효율적으로 단어 의미 모호성을 해소하는 BERT 기반의 딥러닝 모델을 제안한다. 한국어 세종 의미 부착 말뭉치로 실험한 결과, 제안한 방법의 성능이 F1 97.21%로 기존 방법의 성능 F1 95.58%보다 1.63%p 향상되었다.

  • PDF

구문 분석을 위한 한국어 말덩이 정의 (Defining Chunks for Parsing in Korean)

  • 남궁영;김창현;천민아;박호민;윤호;최민석;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.409-412
    • /
    • 2018
  • 한국어는 문장 구성 요소들 간의 이동 및 생략이 자유롭다는 언어적 특성 때문에 구문 분석을 할 때 중의성이 증가한다. 뿐만 아니라 형태소 분석 단계에서 고도로 세분화된 분석 결과로 인해 한국어 구문 분석에 어려움을 더하고 있다. 이러한 문제점을 완화하기 위한 한 방안으로 형태소 분석과 구문 분석의 중간 단계에서 같은 역할을 수행하는 형태소들을 묶어 하나의 의미를 가진 부분적인 구문 요소(말덩이)를 형성하는 방법이 있다. 본 논문에서는 이러한 말덩이들에 대해 구체적인 정의를 내리고 그 단위 및 표지를 제시하여 향후 부분 구문 분석의 연구 및 수행에 활용될 수 있는 기준을 제시한다.

  • PDF

한국어 품사 분류에 대한 제안 (Study on the parts-of-speech in Korean)

  • 서민정
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2002년도 춘계학술대회
    • /
    • pp.76-81
    • /
    • 2002
  • 인터넷의 발달 등으로 많은 정보들이 문서화되기도 하고 그런 정보들이 공유되고 있는 지금, 언어학이나 전산학의 요구를 함께 충족시킬 수 있는 문법 모델 개발의 필요성이 극대화되고 있다. 이 글은 한국어 품사 분류에 대해서 국어학과 전산학에서의 처리 방법과 결과를 검토하고 정리하여 우리말의 특성을 잘 설명하면서도 국어를 전산 처리하는데도 도움을 줄 수 있는 품사분류를 제안하는데 그 목적이 있다. 한국어의 특성을 고려하여 음운, 형태, 통 어, 의미 정보를 함께 처리할 수 있는 어휘부 중심의 문법인 HPSG의 모형을 도입하여 한국어 품사 분류를 정보 전달에 기반을 두어 자질 체계와 통합 연산을 핵심으로 기술하려고 한다. 문법기술은 주로 자질 구조를 속성과 값의 행렬인 AVM(attribute-value matrices)으로 제시할 것이다.

  • PDF

RFC 모델의 한국어 억양 곡선에의 적용 (Application of Rise/Fall/Connection(RFC) Model to Korean Intonation)

  • 표경란
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.214-217
    • /
    • 1998
  • 합성음에 사용할 한국어 억양 모델을 세우기 위한 기초적 연구로서 한국어 억양 곡선에 RFC 모델을 적용해 보았다. 억양 곡선의 구조는 피치 액센트와 억양구 경계 음조의 연속으로 되어 있는데, RFC 모델은 각각의 진폭과 지속기간을 가지는 상승 음조 요소와 하강 음조요소, 그리고 연결 요소로 이러한 억양 곡선의 모양을 모델링한다. 본 논문에서는 한국어 억양 곡선의 특징을 잘 반영하도록 RFC 모델의 구성요소를 수정하고, 청취 실험을 통해서 원래의 RFC 모델과 수정된 RFC 모델을 비교해 보았다. 실험 결과는 수정된 RFC 모델이 원래의 RFC 모델보다 13%정도 음조 표지 개수가 줄었음에도 불구하고 청각적으로 인지하는데 차이가 없는 것으로 나타났다.

  • PDF