• 제목/요약/키워드: 모음 인식

검색결과 191건 처리시간 0.023초

화자 인식을 위한 모음의 포만트 연구 (A Study on Formants of Vowels for Speaker Recognition)

  • 안병섭;신지영;강선미
    • 대한음성학회지:말소리
    • /
    • 제51호
    • /
    • pp.1-16
    • /
    • 2004
  • The aim of this paper is to analyze vowels in voice imitation and disguised voice, and to find the invariable phonetic features of the speaker. In this paper we examined the formants of monophthongs /a, u, i, o, {$\omega},{\;}{\varepsilon},{\;}{\Lambda}$/. The results of the present are as follows : $\circled1$ Speakers change their vocal tract features. $\circled2$ Vowels /a, ${\varepsilon}$, i/ appear to be proper for speaker recognition since they show invariable acoustic feature during voice modulation. $\circled3$ F1 does not change easily compared to higher formants. $\circled4$ F3-F2 appears to be constituent for a speaker identification in vowel /a/ and /$\varepsilon$/, and F4-F2 in vowel /i/. $\circled5$ Resulting of F-ratio, differences of each formants were more useful than individual formant of a vowel to speaker recognition.

  • PDF

한국어 고립 단어 음성의 자음/모음/유성자음 음가 분할 및 인식에 관한 연구 (A Study on Consonant/Vowel/Unvoiced Consonant Phonetic Value Segmentation and Recognition of Korean Isolated Word Speech)

  • 이준환;이상범
    • 한국정보처리학회논문지
    • /
    • 제7권6호
    • /
    • pp.1964-1972
    • /
    • 2000
  • For the Korean language, on acoustics, it creates a different form of phonetic value not a phoneme by its own peculiar property. Therefore, the construction of extended recognition system for understanding Korean language should be created with a study of the Korean rule-based system, before it can be used as post-processing of the Korean recognition system. In this paper, text-based Korean rule-based system featuring Korean peculiar vocal sound changing rule is constructed. and based on the text-based phonetic value result of the system constructed, a preliminary phonetic value segmentation border points with non-uniform blocks are extracted in Korean isolated word speech. Through the way of merge and recognition of the non-uniform blocks between the extracted border points, recognition possibility of Korean voice as the form of the phonetic vale has been investigated.

  • PDF

모음 검출을 통한 텍스트 독립 화자인식에 관한 연구 (A Study on the Text-Independent Speaker Recognition from the Vowel Extraction)

  • 김에녹;복혁규;김형래
    • 전자공학회논문지B
    • /
    • 제31B권10호
    • /
    • pp.82-91
    • /
    • 1994
  • In this thesis, we perform the experiment of speaker recognition by identifying vowels in the pronounciation of each speaker. In detail, we extract the vowels from the pronounciation of each speaker first. From it, we check the frequency energgy of 29 channels. After changing these into fuzzy values, we employ the fuzzy inference to recognize the speaker by text-dependent and text-independent methods. For this experiment, an algorithm of extracting vowels is developed, and newly introduced parameter is the frequency energy of the 29 channels computed from the extracted vowels. It shows the features of each speakers better than existing parameters. The advanced point of this paramter is to use the reference pattern only without the help of any codebook. As a rewult, test-dependent method showed about 95.5% rate of recognition, and text-independent method showed about 94.2% rate of recognition.

  • PDF

모음길이 비율에 따른 발화속도 보상을 이용한 한국어 음성인식 성능향상 (An Improvement of Korean Speech Recognition Using a Compensation of the Speaking Rate by the Ratio of a Vowel length)

  • 박준배;김태준;최성용;이정현
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 컴퓨터소사이어티 추계학술대회논문집
    • /
    • pp.195-198
    • /
    • 2003
  • The accuracy of automatic speech recognition system depends on the presence of background noise and speaker variability such as sex, intonation of speech, and speaking rate. Specially, the speaking rate of both inter-speaker and intra-speaker is a serious cause of mis-recognition. In this paper, we propose the compensation method of the speaking rate by the ratio of each vowel's length in a phrase. First the number of feature vectors in a phrase is estimated by the information of speaking rate. Second, the estimated number of feature vectors is assigned to each syllable of the phrase according to the ratio of its vowel length. Finally, the process of feature vector extraction is operated by the number that assigned to each syllable in the phrase. As a result the accuracy of automatic speech recognition was improved using the proposed compensation method of the speaking rate.

  • PDF

말초 청각 계통 모델을 이용한 한국어 모음 인식 (Korean Vowel Recognition using Peripheral Auditory Model)

  • 윤태성;백승화;박상희
    • 대한의용생체공학회:의공학회지
    • /
    • 제9권1호
    • /
    • pp.1-10
    • /
    • 1988
  • In this study, the recognition experiments for Korean vowel are performed using peripheral auditory model. In addition, for the purpose of objective comparison, the recognition experiments are performed by extracting LPC cepstrum coefficients for the same speech data. The results are as follows. 1) The time and the frequency responses of the auditory model show that important features of input signal are involved in the responses of inner ear and auditory nerve. 2) The recognition results for Korean vowel show that the recognition rate by auditory model output is higher than the recognition rate by LPC cepstrum coefficients. 3) The adaptation phenomenon of auditory nerve provides useful characteristics for the discrimination of vowel signal.

  • PDF

영어 후위고설모음들의 반응시간과 인식에 대한 연구 (A Research on Response Time and Identification of English High Back Vowels)

  • 윤영도
    • 말소리와 음성과학
    • /
    • 제3권3호
    • /
    • pp.49-56
    • /
    • 2011
  • This study investigates how American English high back vowels are identified. American English and Korean speakers participated in a phonetic experiment for this study. This study shows their response times of the vowels and discusses how the speakers identified them. For the experiment I used a synthesized vowel continuum between American English /u/ and /$\mho$/based on American English male speakers' voice obtained by Peterson and Barney (1952). I manipulated spectral steps and vowel duration of the stimuli. The statistical results showed that American English speakers were not able to distinguish the stimuli based on spectral quality. Instead they relied on vowel duration. This suggests that the American English high back vowels have changed since Peterson and Barney recorded them in 1952. The Korean speakers also relied on vowel duration, not spectral quality since they could not distinguish them. American speakers' response times of these vowels were not affected by both spectral quality and vowel duration. Koreans' response times were affected by vowel durations only.

  • PDF

대용량 음성 D/B 구축을 위한 AUTO-SEGMENTATION에 관한 연구 (A study on Auto-Segmentation Improvement for a Large Speech DB)

  • 이병순;장성욱;양성일;권영헌
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 학술발표대회 논문집 제19권 2호
    • /
    • pp.209-212
    • /
    • 2000
  • 본 논문은 음성인식에 필요한 대용량 음성 D/B 구축을 위한 auto-segmentation의 향상에 관한 논문이다. 50개의 우리말 음소(잡음, 묵음 포함)를 정하고 음성특징으로 MFCC(Mel Frequency Cepstral Coefficients), $\Delta$MFCC, $\Delta\Delta$MFCC, 39차를 추출한 다음 HMM 훈련과 CCS(Constrained Clustering Segmentation) 알고리즘(1)을 사용하여auto-segmentation을 수행하였다. 이 과정에서 대부분의 음소는 오류범위$(\pm25ms)$ 안에서 분절이 이루어지지만, 짧은 묵음, 모음+유성자음('ㅁ', 'ㄴ', 'ㄹ', 'o') 등에서 자주 오류범위를 넘어 분절이 발생하였다. 이러한 음운환경에 따른 경계의 오류를 구간별로 Wavelet 변환 신호의 MLR(Maximum Likelihood Ratio) 값을 이용, 기존 문제점을 보완하여 오류의 범위를 줄임으로서 auto-segmentation의 성능 향상을 얻을 수 있었다.

  • PDF

베이지안 분류 기반의 입 모양을 이용한 한글 모음 인식 시스템 (Recognition of Korean Vowels using Bayesian Classification with Mouth Shape)

  • 김성우;차경애;박세현
    • 한국멀티미디어학회논문지
    • /
    • 제22권8호
    • /
    • pp.852-859
    • /
    • 2019
  • With the development of IT technology and smart devices, various applications utilizing image information are being developed. In order to provide an intuitive interface for pronunciation recognition, there is a growing need for research on pronunciation recognition using mouth feature values. In this paper, we propose a system to distinguish Korean vowel pronunciations by detecting feature points of lips region in images and applying Bayesian based learning model. The proposed system implements the recognition system based on Bayes' theorem, so that it is possible to improve the accuracy of speech recognition by accumulating input data regardless of whether it is speaker independent or dependent on small amount of learning data. Experimental results show that it is possible to effectively distinguish Korean vowels as a result of applying probability based Bayesian classification using only visual information such as mouth shape features.

GAN 기반 폰트 생성 (GAN based Fonts Generation)

  • 이세훈;김민재;권혁정
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2019년도 제60차 하계학술대회논문집 27권2호
    • /
    • pp.255-256
    • /
    • 2019
  • 한글 폰트를 만드는 데는 자음+모음 조합으로 약 11,500자 정도의 글자가 필요하다. 디자이너가 글자 하나씩 전부 디자인 하는 것도 굉장한 부담요소이고, 한글폰트를 제작하는데 있어 3개월 이상의 소요 기간과 3000만 원 이상의 비용부담 또한 무시 못 할 요소이다. 게다가 카피라이트 폰트에 대한 저작권 문제 또한 골칫거리다. 그래서 이를 최소한으로 하고자 딥 러닝의 방식중 하나인 GAN(생성적 적대 신경망)을 통해서 디자이너가 399자만 작성하고 나머지는 컴퓨터가 디자이너의 폰트 디자인을 인식하고 자동으로 만들어 주는 프로그램을 고안하였다.

  • PDF

졸업학년 간호대학생의 감정노동에 대한 인식 (Awareness of Emotional Labor of Nursing College Students in Graduation Year)

  • 염은이
    • 한국산학기술학회논문지
    • /
    • 제18권5호
    • /
    • pp.177-189
    • /
    • 2017
  • 본 연구의 목적은 졸업학년 간호대학생의 감정노동에 대한 인식을 이해하여 기술하기 위함이다. 연구참여자는 충남소재 1개 간호대학에 재학 중인 졸업학년 간호대학생 11명이었다. 자료수집 기간은 2016년 9월 5일부터 11월 25일까지였으며, 자료수집은 심층면담을 통해 자료가 포화될 때까지 이루어졌다. 모든 면담내용은 녹음하여 참여자가 말한 그대로 필사하였으며, 수집된 자료는 Colaizzi의 현상학 연구방법을 적용하여 분석하였다. 연구결과 21개의 주제가 확인되었으며, 10개의 주제모음과 5개의 범주가 도출되었다. 졸업학년 간호대학생이 인식하는 감정노동에 대한 5개의 주요 범주는 '비합리적인 상황으로 인한 혼란', '간호직에 대한 회의', '간호사의 힘든 처지에 대한 공감', '간호사의 언행을 학습' 그리고 '미래를 위한 준비'로 구성되었다. 본 연구결과는 간호대학생의 임상실습 감정노동 관리를 위한 효과적인 간호교육 프로그램 개발의 근거를 제공하여 간호 실습교육의 내실화와 질적 향상에 기여할 것이다. 그리고 간호대학생의 감정노동 경험을 보다 심층적으로 탐색하는 연구와 간호대학생의 감정노동 인식에 영향을 주는 다양한 요인과 발생 문제에 대한 심도 있는 연구가 필요할 것으로 사료된다.