• Title/Summary/Keyword: 자모인식

Search Result 50, Processing Time 0.02 seconds

Enhancing Korean Alphabet Unit Speech Recognition with Neural Network-Based Alphabet Merging Methodology (한국어 자모단위 음성인식 결과 후보정을 위한 신경망 기반 자모 병합 방법론)

  • Solee Im;Wonjun Lee;Gary Geunbae Lee;Yunsu Kim
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.659-663
    • /
    • 2023
  • 이 논문은 한국어 음성인식 성능을 개선하고자 기존 음성인식 과정을 자모단위 음성인식 모델과 신경망 기반 자모 병합 모델 총 두 단계로 구성하였다. 한국어는 조합어 특성상 음성 인식에 필요한 음절 단위가 약 2900자에 이른다. 이는 학습 데이터셋에 자주 등장하지 않는 음절에 대해서 음성인식 성능을 저하시키고, 학습 비용을 높이는 단점이 있다. 이를 개선하고자 음절 단위의 인식이 아닌 51가지 자모 단위(ㄱ-ㅎ, ㅏ-ㅞ)의 음성인식을 수행한 후 자모 단위 인식 결과를 음절단위의 한글로 병합하는 과정을 수행할 수 있다[1]. 자모단위 인식결과는 초성, 중성, 종성을 고려하면 규칙 기반의 병합이 가능하다. 하지만 음성인식 결과에 잘못인식된 자모가 포함되어 있다면 최종 병합 결과에 오류를 생성하고 만다. 이를 해결하고자 신경망 기반의 자모 병합 모델을 제시한다. 자모 병합 모델은 분리되어 있는 자모단위의 입력을 완성된 한글 문장으로 변환하는 작업을 수행하고, 이 과정에서 음성인식 결과로 잘못인식된 자모에 대해서도 올바른 한글 문장으로 변환하는 오류 수정이 가능하다. 본 연구는 한국어 음성인식 말뭉치 KsponSpeech를 활용하여 실험을 진행하였고, 음성인식 모델로 Wav2Vec2.0 모델을 활용하였다. 기존 규칙 기반의 자모 병합 방법에 비해 제시하는 자모 병합 모델이 상대적 음절단위오류율(Character Error Rate, CER) 17.2% 와 단어단위오류율(Word Error Rate, WER) 13.1% 향상을 확인할 수 있었다.

  • PDF

Verification of Graphemes Using Neural Networks in HMM Based On-line Koran Handwriting Recognition (인공신경망을 이용한 HMM 기반 온라인 한글인식 시스템의 자모 검증)

  • Cho, Sung-Jung;Kim, Ja-Hwan;Kim, Jin-Hyung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2000.04a
    • /
    • pp.890-895
    • /
    • 2000
  • 본 논문에서는 인공신경망을 이용한 자모 검증을 HMM 기반 온라인 한글인식 시스템에 적용하는 방법론을 제시한다. 본 시스템에서 각각의 자모는 한 개의 HMM 모델과 한 개의 인공신경망 검증기를 갖는다. 자모 검증기는 HMM 네트웍이 생성한 자모 후보 가정을 입력으로 받은 후, 이 가정의 타당성에 대한 사후 확률을 출력한다. 이 사후 확률은 Viterbi 탐색시 탐색 경로에 반영된다. 기존 HMM 시스템의 국소적 특징의 한계를 보완하기 위하여, 한글 자모의 기본획 분석에서 얻어진 구조적, 전역적 특징이 자모 검증기에 사용되었다. 한글 낱자인식에 대한 실험 결과 HMM 기반 인식기에 자모 검증기를 도입함으로서 38.5%의 인식 오류를 줄일 수 있었다.

  • PDF

Handwritten Hangul Word Recognition from Small Vocabulary using Grapheme Combination Type (자모 결합 유형을 이용한 적은 어휘에서의 필기 한글 단어 인식)

  • Jin, Yu-Ho;Kim, Ho-Yeon;Kim, In-Jung;Kim, Jin-Hyeong
    • Journal of KIISE:Software and Applications
    • /
    • v.28 no.1
    • /
    • pp.52-63
    • /
    • 2001
  • 필기 단어 인식 방법에는 낱자별 분할 및 낱자 단위 인식을 통해 인식하는 방법과 단어 사전을 이용하여 단어와 영상을 직접 비교하는 방법이 있다. 이 중 후자는 인식 대상이 되는 단어들이 작은 수의 어휘로 제한되었을 대 매우 효과적이다. 본 논문에서는 입력 영상이 주어졌을 때 자모를 순차적으로 탐색하고 그 결과의 최적 조합을 찾아 인식하는 사전을 이용한 필기 한글 단어 인식 방법을 제안한다. 입력 영상은 사전의 각 단어와의 매칭을 통해 인식된다. 단어는 필기 순서로 정렬된 자모열로 표현하고 입력 영상은 획들의 집합으로 표현한다. 단어의 자모들은 입력 영상으로부터 추출된 획들의 집합으로부터 단계적으로 탐색된다. 각 단계에서는 전 단계까지의 매칭 상태와 탐색하려는 자모의 형태로부터 자모가 존재할 것이라고 기대되는 정합 기대 영역을 설정한 후 그 안에서 자모 탐색기를 이용해 자모를 찾는다. 자모 탐색기는 획들의 집합으로 이루어진 복수의 자모 후보와 그 점수를 출력한다. 각 단계마다 생성된 자모 후보들은 최적의 단어 매칭을 찾기 위한 탐색 공간을 이룬다. 본 연구에서는 단어 사전을 trie로 구성하고, 탐색 과정에서 dynamic programming을 이용하여 효과적으로 탐색을 수행하였다. 또한 인식 속도를 향상시키기 위해 산전 축소, 탐색 공간 축소 등 다양한 지식을 이용하였다. 제안하는 방법은 무제약으로 쓰여진 필기 단어도 인식 할 수 있을 뿐 아니라, 동적 사전을 이용하기 때문에 사전의 내용이 변하는 환경에서도 적용할 수 있다. 인식 실험에서는 39개의 단어로 이루어진 사전에 대하여 613개의 단어 영상에 대해 실험한 결과 98.54%의 높은 인식률을 보임으로써 제안하는 방법이 매우 효과적임을 확인하였다. 아니라 곰팡이 균주도 실제 praxis에 적합하게 개발시킬수 있다. 따라서 앞으로 발효육제품제조에 있어 starter culture가 갖는 의미는 매우 중요하며 특히 짧은 숙성기간을 거치는 발효소시지의 제조에 있어서는 필수불가결한 공정의 한 분야로 자리잡게 될 것이다.큰 차이 없었으나 이중포장과 진공포장은 상당히 효과적임을 알 수 있었다.로는 18%에 비하여 22%가 더 적합한 것으로 생각되었다.$0.15{\sim}0.35%$이었다.irc}C$에서 $13.49{\times}10^{-3}$이었다. 이 값들을 Arrhenius식에 대입하여 구한 활성화 에너지는 24.795 kJ/Kmol이었다. 이 값으로부터 결정한 살균 포장약주 명가의 상용 저장 수명은 $10^{\circ}C$에서 2년, $20^{\circ}C$에서 1년 4개월, $25^{\circ}C$에서 1년 2개월 이었다. 서울의 매월 평균 온도를 기준으로 계산할 때 본제품의 상용저장기간은 1년 8개월이었다.로 반죽이 호화되고 가열시간이 그 이상으로 증가할 때도 반죽의 호화가 약간은 진행되지만 $90^{\circ}C$ 이상의 가열온도에서는 가열시간 0.5분 이내에 반죽의 호화가 급속히 일어나고 가열 시간을 증가시켜도 더이상의 호화는 일어나지 않았다. 같은 조건에서는 waxy corn starch 반죽의 호화 속도가 corn starch보다 더 빠른 것으로 나타났다. 대표적으로 52% 수분함량에서 반응속도상수(k)와 가열온도(T)사이의 관계식은 corn starch의 경우 $logk=11.1140-4.1226{\times}10^3(1/T)

  • PDF

Post-processing of Hangul Recognition for Discriminating Pairs of Characters (유사 문자쌍을 구분하기 위한 한글 인식의 후처리)

  • Jang, Seung-Ick;Kim, Jin-Hyung
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.388-393
    • /
    • 2001
  • 유사한 형태의 필기 한글 문자쌍은 한글 인식 시 발생하는 오류의 많은 부분을 차지한다. 이는 유사한 문자들의 작은 차이를 인식기가 충분히 반영하기 어렵기 때문이다. 본 논문에서는 최근 주목 받고 있는 Support Vector Machine을 이용해 유사한 문자쌍을 검증하는 한글 인식 후처리 방법을 제안한다. 제안하는 방법은, 대부분의 문자 유사쌍이 한 두개의 자모만이 상이한 점에 착안하여 자모 단위로 문자 유사쌍을 구분한다. 기존 랜덤그래프를 이용한 한글 인식기를 이용하여 자모 분할을 수행하고, Support Vector Machine을 이용하여 분할된 결과를 검증한다. 제안한 방법은 유사쌍 구분에 중요한 자모만을 선택적으로 고려하여, 기존 한글 인식기의 부족한 점을 보완한다. 실험 결과, 자주 혼동되는 문자쌍들의 인식 오류가 정정되는 것을 볼 수 있었으며 그에 따라 한글 인식의 전체 성능이 향상되었다.

  • PDF

Recognition of Hangul alphabets as assessed by the Stroop and hemispheric lateralization (Stroop 및 반구 비대칭성 효과를 통해 본 한글자모 인식과정의 특성 분석)

  • Han, Kwang-Hee;Yoo, Hyung-Hyun;Chung, Chan-Sup
    • Annual Conference on Human and Language Technology
    • /
    • 1989.10a
    • /
    • pp.278-281
    • /
    • 1989
  • 한글 자모 인식과정의 특성을 알아보기 위하여 Stroop 및 반구 비대칭성 효과를 검증하였다. 피보험자들에게 두가지 색으로된 10개의 한글자모를 좌시야와 우시야에 제시하고, 그중 어떤 것이 가운데에 제시된 검사지극의 색 또는 자모형태와 같은 목표자극인가를 신속하게 판단하도록 하였다. 반구 비대칭성 및 Stroop 효과를 선택 반응시간을 측정하여 비교하였다. 자모 처리와 색깔 처리에서는 반구간 차이가 나타나지 않았다. 자모 처리에서 반구간 차이가 나타나지 않은 것은 한글 자모의 시각적 특성과 실험 절차의 특수성애 결부되어 해석되었다. Stroop 효과는 좌반구 보다는 우반구에서 의미있게 큰 것으로 나타났다. 따라서 대뇌 반구간의 비대칭성이 확인되었고 대뇌의 좌반구는 분석적 처리에, 우반구는 전체적인 처리에 전문화 되어 있다는 것을 확인하였다.

  • PDF

The Recognition of Vowels and Consonants in a Handwritten Hangul Text with Attributed Grammars (속성문법을 이용한 필기체 한글 문서 내의 자모인식)

  • Lyu, Sung-Pil;Kim, Tae-Kyun
    • Journal of the Korean Institute of Telematics and Electronics
    • /
    • v.26 no.3
    • /
    • pp.85-94
    • /
    • 1989
  • This paper proposes a method to recognize vowels and consonants in a handwritten Hangul text, in which the sizes of chracters and the spaces between characters are not uniform. In this method, all characters in the thinned image of a handwritten Hangul text are transformed into strokes, and the attributes which represent the relations between strokes are extracted from these strokes, and the attributes which represent the relations between strokes are extracted from these strokes. The vowels and consonants are recognized by applying attributed grammars to the strokes and attributes.

  • PDF

A study on Korean character recognition using the sun of unit vector (단위벡터를 이용한 한글 인식에 관한 연구)

  • Cheon, Su-Yeon;Jo, Dong-Seop
    • Proceedings of the KIEE Conference
    • /
    • 1987.07b
    • /
    • pp.1104-1106
    • /
    • 1987
  • 본 논문은 한글 자모 인식에 관한 새로운 방법을 제시한다. 본 연구는 한글패턴을 독립된 자소의 부분패턴으로 나누어서 특정점들(끝점, 7굴곡점, T굴곡점)을 추출하여 각 굴곡점에서 연결되는 점과의 벡터를 글자의 크기에 관계없도록 하기 위해 크기가 1인 단위벡터를 구한 후 이들의 합성벡터를 생성한다. 생성된 합성벡터들의 수, 벡터들이 지준축과 이루는 각, 그리고 특정점들의 수로부터 한글의 기본 자모를 분류하는 과정을 연구하였다. 입력된 한글패턴은 이미 세선화가 된 자모패턴으로 하였다.

  • PDF

The effect of Meungzo and Saemmul fonts on Hangul recognition (명조체와 샘물체 단어모양이 한글인식에 미치는 효과)

  • Kim, Ho-Young;Cheong, Chan-Sup
    • Annual Conference on Human and Language Technology
    • /
    • 1992.10a
    • /
    • pp.259-267
    • /
    • 1992
  • 단어모양이 한글 시각정보처리에 미치는 효과를 알아보기 위해 명조체와 샘물체로 된 한음절 글자, 두음절 단어, 세음절 단어의 정확인식율을 비교하였다. 명조체는 자모의 모양과 크기가 글자의 고정된 사각틀에 맞게 변형되므로 단어모양이 글자의 자모조합 유형과 음절길이에 따라 크게 달라지지 않는다. 이에 반해 샘물체는 자모조합 유형에 따라 글자의 사각틀이 변형되므로 부가적인 단어변별 정보가 단어모양에 포함되며, 음절길이가 증가할 때 단어모양 정보가 명조체에 비해 더욱 두드러진다. 이처럼 서로 구별될 수 있는 명조체와 샘물체 단어의 시각적 구조는 각각 다른 근거에서 한글인식에 영향을 미칠 수 있을 것으로 예상된다. 연구결과, 명조체의 정확인식율이 샘물체보다 높았으며, 음절길이가 증가할 때 명조체와 샘물체에 상관없이 정확인식율이 향상되었다. 본 실험의 결과는 단어의 외곽모양 변이가 영어의 경우보다 한글 시각정보처리에서 상대적으로 덜 중요하다는 것을 시사한다.

  • PDF