• Title/Summary/Keyword: 숫자

Search Result 1,593, Processing Time 0.061 seconds

분별학습에 기반한 전화 숫자음 음성인식

  • Han, Mun-Seong
    • Journal of the Korean Society for Industrial and Applied Mathematics
    • /
    • v.5 no.2
    • /
    • pp.7-17
    • /
    • 2001
  • 음성인식 시스템이 있어서 현재 가장 널리 사용되고 있는 Hidden Markov Model(HMM)은 확률 모델을 기반한 것으로 데이터에 대한 통계처리를 학습과정으로 하고 있다. 한국어 연속 숫자음에 대한 음성인식은 고립 숫자음 인식과는 달리 충분한 학습데이터만으로는 만족할 만한 결과를 가져오지 못한다. 이 논문에서는 연속 숫자음 음성인식에 잇어서 비슷하게 발음되는 숫자음과 같은 숫자에 대해 다양하게 발음되는 숫자음에 대해 HMM의 한계를 제시하고 그 해결채으로 Discriminant 학습의 적용방법을 제시한다. 연속 숫자음의 인식 시스템을 구현하는 데 있어서 인식률 낮은 부분에 Discriminant 학습을 적용하여 인식률을 대폭 향상시킨 실험결과를 제시한다.

  • PDF

Utterance Verification and Substitution Error Correction In Korean Connected Digit Recognition (한국어 연결숫자 인식에서의 발화검증과 대체오류수정)

  • Jung Du Kyung;Kim Hyung Soon
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.111-114
    • /
    • 2002
  • 음성인식에서 발화검증은 비인식대상어휘(OOV)를 기각시키고, 인식대상어휘라도 오인식 가능성이 높은 결과를 기각시키는 기술을 말한다. 본 논문에서는 혼동가능성 높은 숫자쌍들이 존재하는 한국어 연결 숫자 인식에서 발화검증 결과로 숫자열 기각시 오인식 가능성이 높은 숫자열을 그냥 기각시키는 대신에 대체오류를 수정하여 인식성능을 향상시키고자 하였다. N-best decoding 결과에 따르면 $2^{nd}\;best$$3^{rd}\;best$안에 대부분의 제대로 된 인식결과들이 포함된다. 따라서, N-best decoding을 이용해, 숫자열 기각시 $2^{nd}\;best$ 숫자열로 대체된 것이라고 가정한 후, 개별숫자 log likelihood ratio(LLR)과 N-best 기반의 숫자열 LLR[3] 등을 함께 고려한 신뢰도 측정방식에 의해 그 가정이 맞다고 판단이 되면 $2^{nd}\;best$ 의 숫자열과 대체함으로써 부분적으로 오류를 수정하였다.

  • PDF

De-Noising and Contour Preserving Digit Enhancement for Meter Digit Recognition (계량기 숫자 인식을 위한 잡영 제거 및 윤곽보존 숫자강화)

  • Yi, Eun-Gyoo;Ko, Jae-Pil
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10b
    • /
    • pp.515-520
    • /
    • 2006
  • 계량기 숫자 인식은 일반적으로 사용되고 있는 아날로그 계량기에 카메라를 부착하여, 검침 시 숫자 계기판 영상을 전송받고, 그 영상으로부터 숫자를 추출 및 인식하는 기술이다. 계량기 숫자 인식에서는 카메라의 설치 상태 및 기타 환경적인 요인들로 인해 숫자 계기판 영상의 일관성 있는 취득이 어렵게 된다. 본 논문에서는 숫자 인식에 악영향을 미치는, 취득 영상의 상태 변화를 보정해주기 위해 잡영 제거 및 윤곽보존 숫자강화를 제안하였다. 잡영 제거를 위해 잡영을 분포 위치에 따라서 세 가지 타입으로 나누었으며, 각 타입별로 잡영 제거를 하였다. 윤곽보존 숫자강화 과정에서는 일반적인 이진화 기법이 가지는 테두리 정보손실을 최소화할 수 있도록, 숫자 테두리의 명도를 보존하면서 숫자 중심부분의 밝기를 강화시켰다. 전처리 전/후의 인식률 비교 실험을 위해 SVM(Support Vector Machines)을 사용하였으며, 학습 데이터 1,409장과 조명 상태를 달리하여 취득한 1,782의 테스트 데이터를 실험 데이터로 사용하였다. 실험 결과, 81.09%라는 성능 향상을 확인하였으며 이는 제안한 전처리 기법이 조명으로 인한 데이터의 상태 변화 문제를 해결해줌으로써 인식 성능 향상에 크게 기여한다는 것을 입증해준다.

  • PDF

A Study on the Arabic numeral reading rules in Modern Korean (현대 한국어에서 아라비안 숫자의 읽기 규칙 연구)

  • Jung, Young-Im;Kim, Jeong-Se;Kim, Sang-Hoon;Lee, Young-Jik;Yoon, Ae-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2002.10e
    • /
    • pp.16-23
    • /
    • 2002
  • 본 논문에서는 아라비안 숫자를 포함한 텍스트를 음성으로 합성하기 위하여, 숫자 형태와 분류사 그리고 숫자가 나오는 문맥에 따라 숫자를 자동으로 문자화할 수 있는 전처리 규칙을 설정하는데 목적을 둔다. 먼저 선행연구를 통해 숫자를 포함한 수사 및 수사표현의 읽기 규칙의 적용 범위 및 한계점을 살펴보고, 음성 합성을 위한 아라비안 숫자의 문자화 규칙을 설정하고자 한다. 현대 한국어에서 아라비안 숫자를 읽는 방식은 크게 고유어 방식과 한자어 방식이 있으며 단(單)단위에서는 영어가 사용되기도 한다. 또한 한자어 방식에서도 단위를 붙여 읽는 경우와 모든 수를 단 단위로 읽는 경우가 있으므로, 아라비안 숫자의 문자화를 단순한 규칙을 설정하여 자동화하기에는 중의성이 높다. 본 연구에서는 (1) 숫자 전 전치어(pre-numeral), (2) 기호를 포함한 숫자열의 표현 형식과 크기, (3) 단위 표현, (4) 숫자 후치어(post-numeral), (5) 분류사(classifier) (6) 분류사 후치어(post-classifier), (7) 수사표현 앞뒤 문맥에 따라, 아라비안 숫자표현이 문자화되는 방식을 살펴보았다. 분석 대상 말뭉치는 C 신문의 2000년 1월부터 2000년 4월까지 전체 기사 1,400건에서 숫자가 포함된 숫자표현 약 63,000개론 구성하였다. 패턴화된 구조 및 중의성이 없는 구조를 12가지로 밝히고 중의성이 있는 구조의 유형을 밝혔으며 분류사 후치어와의 결합 관계, 좌우 문맥정보를 통해 중의성 해결의 단서를 제시하고자 하였다.

  • PDF

Restoration of corrupted digit image Using 4-neighborhood mask and projection (4-방향마스크와 프로젝션을 이용한 손상된 문서에서의 숫자 영상 복원)

  • 최선아;윤미진;강동구;김도현;차의영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.670-672
    • /
    • 2002
  • 본 논문에서는 잘못된 인쇄로 인한 문서상의 잡영이나 문자 훼손이 있는 문서를 복원 하고자 만다. 제안하는 방법은 스캐너로 읽어들인 문서영상을 잡영 제거론 만 다음 훼손된 숫자 영상에 대해서 프로젝션을 이용하여 숫자 열을 낱낱의 숫자로 분할한다. 각각의 숫자에 대해서 크기가 일정하도록 정규화를 시킨 다음, Backpropagalion을 이용하여 훼손된 숫자를 학습하였다. 학습시킨 다음 원 영상과 훼손된 영상을 각 픽셀단위로 비교하여 4-방향 마스크를 이용하여 원래의 숫자 영상으로 복원하도록 만다.

  • PDF

A Study on Continuous Digits Speech Recognition using Probabilistic Models (확률적 모델을 이용한 연속 숫자음 인식에 관한 연구)

  • Lee Ju-Sung;Lee Seong-Kwon;Kim Soon-Hyob
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.109-112
    • /
    • 1999
  • 본 연구는 음소 단위의 CHMM(Continuous Hidden Markov Model)을 이용한 한국어 연속 음성인식에 관한 내용이다. 연구실 환경에서 음성으로 전화를 걸기 위하여 연속 숫자음 인식을 수행하였다. ETRI 445 데이터를 사용하여 초기의 모델은 ML(Maximum Likelihood) 추정법을 이용하여 작성하였고 적응화를 위해 최대 사후 확률 추정법을 사용하였다. 연속 숫자음의 인식을 위하여 한국어 숫자음 음성의 음향학적 특성을 고려하여 발성 사전을 작성하였고, 음절 단위로 되어있는 한국어 숫자음의 모든 경우를 고려하여 복수개의 단어를 사전에 등록하였다. 또한 숫자음의 알 뒤 연음현상을 고려하여 작성한 21 종류의 7자리 숫자음과 이를 음절 단위로 세그먼트한 숫자음을 DB로 사용하여 적응화를 수행하였다. 이의 효율성을 입증하기 위하여 ETRI에서 작성한 35종류의 4연속 숫자음 목록을 대상으로 인식실험을 수행하였다.

  • PDF

Writing Korean Numerals in Technical Writing (기술문에서 우리말 숫자 쓰기)

  • Kwon, Sung-Gyu
    • Journal of Engineering Education Research
    • /
    • v.14 no.2
    • /
    • pp.30-39
    • /
    • 2011
  • There is a problem that some spoken words are not consistent with the written words when Arabic numerals in Korean language are read. Since some rules for reading the Arabic numerals are not clear, the numerals should be read carefully by recognizing the position of the numbers in sentence, the relationship of the numerals with measurement nouns and other writing elements, and context. In view of technical writing, this work is to appreciate some rules for writing Korean numerals in place of Arabic numerals by studying the works regarding numerals, classifiers and measurement nouns.

A Study on the Implementation Methods of the MLP Recognizer for Handwritten Numerals and Non-Numerals (필기체 숫자와 비숫자의 인식을 위한 MLP 인식기의 구현 방법에 관한 연구)

  • Lim, Kil-Taek
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • v.9 no.2
    • /
    • pp.1119-1122
    • /
    • 2005
  • This paper describes the implementation methods of the MLP (mulilayer perteptrons) recognizers for numerals and non-nummerals. The MLP has known to be a very efficient classifier to recognize handwritten numerals in terms of recognition accuracy, speed, and memory requirements. The MLP in the previous researches, however, focuses on the only numeral inputs and does not pay attention to non-numeral inputs with respect to recognition accuracy, rejection rates, and other characteristics. In this paper, we present some implementation methods of the MLP in the environments that numeral and non-numerals are mixed. The MLP had been developed by three methods, and investigated with three error types introduced. The experiments had been conducted on a total of about 63,000 numerals and non-numerals. The promising method to recognize numeral and non-numerals is described in terms of the three error types.

  • PDF

Segmentation and Recognition Methods for Touching Handwritten Digit String (접촉된 숫자열의 분할 및 인식 기법)

  • 송성일;김황수
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10d
    • /
    • pp.481-483
    • /
    • 2002
  • 본 논문은 숫자간 접촉이 포함된 무제약 오프라인 필기 숫자열 인식을 위한 분할 및 인식기법을 소개하고자 한다. 시스템은 숫자열에서 접촉된 성분을 추출하는 모듈, 접촉된 숫자를 분할하는 모듈과 최종적으로 분할된 결과를 조합하는 모듈로 이루어진다. 그리고, 위의 기법을 NIST 데이터에 적용하여 제안한 분할 및 인식기법의 효율성을 보여준다.

  • PDF

Performance Improvement of Connected Digit Recognition by Considering Phonemic Variations in Korean Digit and Speaking Styles (한국어 숫자음의 음운변화 및 화자 발성특성을 고려한 연결숫자 인식의 성능향상)

  • 송명규;김형순
    • The Journal of the Acoustical Society of Korea
    • /
    • v.21 no.4
    • /
    • pp.401-406
    • /
    • 2002
  • Each Korean digit is composed of only a syllable, so recognizers as well as Korean often have difficulty in recognizing it. When digit strings are pronounced, the original pronunciation of each digit is largely changed due to the co-articulation effect. In addition to these problems, the distortion caused by various channels and noises degrades the recognition performance of Korean connected digit string. This paper dealt with some techniques to improve recognition performance of it, which include defining a set of PLUs by considering phonemic variations in Korean digit and constructing a recognizer to handle speakers various speaking styles. In the speaker-independent connected digit recognition experiments using telephone speech, the proposed techniques with 1-Gaussian/state gave string accuracy of 83.2%, i. e., 7.2% error rate reduction relative to baseline system. With 11-Gaussians/state, we achieved the highest string accuracy of 91.8%, i. e., 4.7% error rate reduction.