• 제목/요약/키워드: Speech Class

검색결과 140건 처리시간 0.021초

G.729 코덱의 패킷 손실 영향 모델을 이용한 비 침입적 음질 예측 기법 (Non-Intrusive Speech Quality Estimation of G.729 Codec using a Packet Loss Effect Model)

  • 이민기;강홍구
    • 한국음향학회지
    • /
    • 제32권2호
    • /
    • pp.157-166
    • /
    • 2013
  • 본 논문은 패킷 손실의 영향을 이용한 비 침입적 음질 평가 방법을 제안한다. 패킷 손실은 패킷 기반의 통신 시스템에서 음질을 저하시키는 주된 요소이며 그 영향은 코덱에 내장된 패킷 손실 은닉 알고리듬에 의해 결정된다. 패킷 손실 영향을 반영한 음질평가 시스템을 위해 VoIP 에서 협대역 코덱으로 사용되는 코덱 중 하나인 G.729를 선택하였으며, 음성 특징에 따른 패킷 손실 영향을 구분하기 위해서 G.729 코덱의 음성 파라미터를 이용한 한 음성 특성 분류기를 설계하였다. 이후, 각각의 패킷 특성에 따른 음질 저하의 정도를 수치화하기 위해 원 PESQ-LQ점수와 상관계수를 최대화하는 음질 저하 가중치를 반복적으로 구하였으며, 최종 음질 저하는 가중합으로 구하였다. 그 결과 제안한 모델과 PESQ-LQ의 상관계수는 칩입 모델 에서는 0.8950를, 비 침입 모델 에서는 0.8911의 결과를 나타내었다.

선형 판별분석과 공통벡터 추출방법을 이용한 음성인식 (Speech Recognition Using Linear Discriminant Analysis and Common Vector Extraction)

  • 남명우;노승용
    • 한국음향학회지
    • /
    • 제20권4호
    • /
    • pp.35-41
    • /
    • 2001
  • 본 논문에서는 선형 판별분석 (LDA: Linear Discriminant Analysis)과 공통벡터 추출방법을 이용한 음성인식방법을 제안하였다. 음성신호는 화자의 성별, 나이, 출생지, 주위 잡음, 정신적 상태, 발성기관의 구조 등과 같은 다양한 정보를 포함하고 있다. 이로 인해 같은 음성신호라 할지라도 서로 다른 화자가 발성하게 되면 서로 다른 특성을 보이게 된다. 음성신호의 이러한 성질은 같은 음성군 (class)에 포함된 공통된 특성벡터를 추출하는 일을 상당히 어렵게 한다. 음성신호에서 공통된 특징 벡터를 추출하는 방법은 KLT (Karhunen-Loeve Transformation)와 같이 선형 대수적인 접근방법이 많이 사용되어지고 있으나, 본 논문에서는 M. Bilginer et al.이 제안한 공통벡터 추출 방법을 사용하였다. M. Bilginer et al.이 제안한 방법은 주어진 훈련 음성신호들에 대하여 최적의 공통 벡터를 추출하여 주면서 공통벡터 추출에 사용된 훈련 데이터에 대해서는 100%의 인식결과를 보여준다. 그러나 공통벡터 추출을 위한 훈련 음성신호의 수를 무한히 늘릴 수 없다는 점과 공통벡터들간의 구별정보 (discriminant information)가 정의되지 않았다는 단점이 있다. 본 논문에서는 단어그룹간 (class) 구별정보를 추출된 공통벡터와 결합해 단어간의 오인식률 (error rate)을 감소시킬 수 있는 방법과 공통벡터 추출방법에 적합한 파라미터 가공 방법을 제안하였다. 공통벡터 추출방법은 음성신호의 시간 축 정규화 방법과 벡터의 차원 크기에 따라 인식시간과 인식률에 영향을 받는다. 따라서 부적절한 시간 축 정렬과 너무 큰 벡터의 차원 수는 인식률 저하 등과 같이 알고리즘의 효율성을 떨어뜨린다. 본 논문에서 제안한 방법을 사용하여 실험한 결과 알고리즘의 효율성이 증가되었으며, 기존방법보다 약 2%정도의 향상된 인식률을 얻을 수 있었다.낮추는 효과를 나타내었다.다. 이상의 결과를 통하여 추출 온도와 용매 농도에 따른 수율의 차이가 있었으며 free radical 소거 활성에서는 종자 에탄을 추출물이 과피 에탄올 추출물 보다 145배 이상의 현저히 높은 활성을 나타내었다.을 나타내었다.'Lian(연)' : repeatability, continuance, plenty and intercommunicate, 2. 'Lian(연)'-'Lian(염)': integrity, 3. 'He (하)'-'He(화)' : peace, harmony and combination, 4. 'He(하)'-'He(하)' : clear river, 5.'He(하)'-'He(하)' ; all work goes well. When the Chinese use lotus patterns in lucky omen patterns, same pronunciation and pitch of Chinese language more prominent than natural properties or the image of Buddhism. I guess that it cause praying individual's peace and happiness more serious than philosophical meaning or symbol that base in Buddhism for ordinary people.ML., -9.00~12.49 and -19.81~19.81%, respectively). Therefore, it is concluded that the two formulations are bioequivalent for both the extent and the rate of absorption after single dose administration.ation.ion.ion.ation.ion.n. fibrosis, collagen bundle) was

  • PDF

프랙탈 차원을 이용한 단음절 음성의 자$\cdot$모음 분리 (Consonant/Vowel Segmentation in Monosyllabic Speech Data Using the Fractal Dimension)

  • 최철영;김형순;김재호;손경식
    • 한국음향학회지
    • /
    • 제13권3호
    • /
    • pp.51-62
    • /
    • 1994
  • 본 논문에서는 음성신호의 프랙탈 차원을 이용하여 한국어 CV(Consonant-Vowel) 단음절에서 자음과 모음을 분리하는 실험을 하였다. 프랙탈 차원은 Minkowski-Bouligand 차원을 사용하였으며, 형태학적 커버링 (morphological covering) 방법을 이용하여 구하였다. 프랙탈 차원의 음성분리에 있어서의 유용성을 조사하기 위하여 프랙탈 차원과 단구간 에너지 각각을 이용한 음성분리 실험과 에너지와 프랙탈 차원을 같이 이용한 음성분리 실험을 하여 그 결과들을 비교하였다. 실험 결과 에너지의 기울기를 사용한 경우는 $88.0\%$의 바른 분리 결과를 보였고, 프랙탈 차원의 기울기를 사용한 경우는 그보다 더 나은 $93.6\%$의 바른 분리 결과를 보였으며, 에너지의 기울기와 프랙탈 차원의 기울기의 곱을 사용한 경우는 $96.1\%$로 가장 높은 바른 분리결과를 나타냈다. 이를 통해 프랙탈 차원이 음성신호의 분리에 있어서 하나의 유용한 파라메타가 될 수 있음을 확인하였다.

  • PDF

Angle씨 II급 1류 부정교합아동의 발음에 관한 음향학적 연구 (AN ACOUSTIC ANALYSIS OF PRONUNCIATION IN CHILDREN WITH ANGLE'S CLASS II DIV. 1 MALOCCLUSION)

  • 박윤정;이상훈;손동수
    • 대한소아치과학회지
    • /
    • 제24권1호
    • /
    • pp.95-111
    • /
    • 1997
  • The human speech organ consists of respiration system (lung, larynx), phonation system (vocal cord), articulation system (esophagus, pharynx, uvula, teeth, gingiva, palate, tongue, lip) and resonating system(oral cavity, nasal cavity, paranasal sinus). Because teeth are components of the articulation system, it has been reported that the persons with abnormally positioned teeth generally have abnormal occlusion and pronunciation. In this study, using /ㅅ(s)/, the most commonly mispronunced consonant in children with malocclusion, and the seven single vowels, /사(sa), 서($s\delta$), 소(so), 수(su), 스($s\omega$), 시(si), 세(se)/ and / ㅏ(a), ㅓ($\delta$), ㅗ(o), ㅜ(u), ㅡ($\omega$), 1(i), ㅔ(e)/ were recorded and analyzed using speech analysis program on computer by measuring formants and compared them for investigating the differences in pronunciation in children with Angle's class I occlusions and those with Angle's class II div.1 malocclusion. The result were as follows: 1. In the Angle's Class II div.1 group, there were no significant differences in F1 of all recorded sounds as compared with Angle's Class I group(p>0.05). 2. In the consonants, there were significant differences in F2 of /스($s\omega$)/ and F2/F1 ratio of /사(sa), 서($s\delta$), 시(si)/ between the two group(p<0.05). 3. In the vowels, there were significant differences F2/F1 ratio of /ㅓ($\delta$)/(p<0.05) and no significant differences in F2/F1 ratio between two group(p>0.05). 4. In the consonants, there were significant differences in F2 and F2/F1 ratio when succeeding vowels were high or low, and F2/F1 ratio when front in accordance with tongue position (p<0.05). 5. In the vowels, there were no significant differences in formant in accordance with tongue position(p>0.05)

  • PDF

퍼스컴을 이용한 영어 강세 및 억양 교육 프로그램의 개발 연구 (Development of English Stress and Intonation Training System and Program for the Korean Learners of English Using Personal Computer (P.C.))

  • 전병만;배두본;이종화;유창규
    • 음성과학
    • /
    • 제5권2호
    • /
    • pp.57-75
    • /
    • 1999
  • The purpose of this paper is to develop an English prosody training system using PC for Korean learners of English. The program is called Intonation Training Tool (ITT). It operates on DOS 5.0. The hardware for this program requires over IBM PC 386 with 4 MBytes main memory, SVGA (1 MByte or more) for graphic, soundblaster 16 and over 14 inch monitor size. The ITT program operates this way: the learners can listen as well as see the English teacher's stress and intonation patterns on the monitor. The learner practices the same patterns with a microphone. This program facilitates the learner's stress and intonation patterns to overlap the teacher's patterns. The learner can find his/her stress and intonation errors and correct these independently. This program is expected to be a highly efficient learning tool for Korean learners of English in their English prosody training in the English class without the aid of a native English speaker in the classroom.

  • PDF

Academic Performance, Communication, and Psychosocial Development of Prelingual Deaf Children with Cochlear Implants in Mainstream Schools

  • Choi, Ji Eun;Hong, Sung Hwa;Moon, Il Joon
    • Journal of Audiology & Otology
    • /
    • 제24권2호
    • /
    • pp.61-70
    • /
    • 2020
  • Background and Objectives: To assess the academic performance, communication skills, and psychosocial development of prelingual deaf children with cochlear implants (CIs) attending mainstream schools, and to evaluate the impact of auditory speech perception on their classroom performance. Subjects and Methods: As participant, 67 children with CI attending mainstream schools were included. A survey was conducted using a structured questionnaire on academic performance in the native language, second language, mathematics, social studies, science, art, communication skills, self-esteem, and social relations. Additionally, auditory and speech performances on the last follow-up were reviewed retrospectively. Results: Most implanted children attending mainstream school appeared to have positive self-esteem and confidence, and had little difficulty in conversing in a quiet classroom. Also, half of the implanted children (38/67) scored above average in general academic achievement. However, academic achievement in the second language (English), social studies, and science were usually poorer than general academic achievement. Furthermore, half of the implanted children had difficulty in understanding the class content (30/67) or conversing with peers in a noisy classroom (32/67). These difficulties were significantly associated with poor speech perception. Conclusions: Improving the listening environment for implanted children attending mainstream schools is necessary.

Academic Performance, Communication, and Psychosocial Development of Prelingual Deaf Children with Cochlear Implants in Mainstream Schools

  • Choi, Ji Eun;Hong, Sung Hwa;Moon, Il Joon
    • 대한청각학회지
    • /
    • 제24권2호
    • /
    • pp.61-70
    • /
    • 2020
  • Background and Objectives: To assess the academic performance, communication skills, and psychosocial development of prelingual deaf children with cochlear implants (CIs) attending mainstream schools, and to evaluate the impact of auditory speech perception on their classroom performance. Subjects and Methods: As participant, 67 children with CI attending mainstream schools were included. A survey was conducted using a structured questionnaire on academic performance in the native language, second language, mathematics, social studies, science, art, communication skills, self-esteem, and social relations. Additionally, auditory and speech performances on the last follow-up were reviewed retrospectively. Results: Most implanted children attending mainstream school appeared to have positive self-esteem and confidence, and had little difficulty in conversing in a quiet classroom. Also, half of the implanted children (38/67) scored above average in general academic achievement. However, academic achievement in the second language (English), social studies, and science were usually poorer than general academic achievement. Furthermore, half of the implanted children had difficulty in understanding the class content (30/67) or conversing with peers in a noisy classroom (32/67). These difficulties were significantly associated with poor speech perception. Conclusions: Improving the listening environment for implanted children attending mainstream schools is necessary.

음성스펙트럼의 클러스터링을 이용한 음성검출기법 개선 (Speech Detection using Speech Spectrum Clustering)

  • 김태영;김남수;김태정
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.149-152
    • /
    • 2000
  • 본 연구에서는 기존의 통계 이론에 근거한 음성 검출 기법을 제안하는 음성 스펙트럼 모형화기법을 통해 개선시키고자 한다 기존의 방법과는 달리 음성을 하나의 단일 모형이 아닌 여러 클래스(class) 모형의 결합체로 간주한다. 각 클래스 모형의 추정을 위해 신호원 부호화(source coding)의 클러스터링(clustering)과 유사한 기법을 제안하고, 이를 이용한 두 가지의 검출 기법을 제안한다. 하나는 각각의 클래스에 대해 LRT(likelihood ratio test)를 수행하고, 이를 최종적으로 통합하는 기법이고 다른 하나는 각 클래스의 모형으로부터 혼합모형(mixture model)을 구하여 이를 이용하여 LRT를 수행하는 방법이다. 제안한 두 가지 방법 모두 비교적 적은 연산량 증가에도 불구하고 실험 결과 기존 방법에 비해 매우 우수한 성능을 보였다.

  • PDF

An Application of Announcing techniques to the teaching of speech for non-native speakers of Japanese

  • Tomoko Shimoda
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 1996년도 10월 학술대회지
    • /
    • pp.168-168
    • /
    • 1996
  • In this paper I will examine some concrete examples of the obstacles faced by non-native speakers of Japanese when learning the language. I will go on to suggest ways in which these obstacles may be overcome. Nowadays there are numerous Japanese language books available for non-native speakers. However, most of these introductory Japanese language books focus on topics such as pronunciation, accent and intonation. Notable, these introductory textbooks provide insufficient emphasis on prosodic features of the Japanese language. The Japanese language has been considered by many teachers as relatively easy compared to other languages, due to its simple phonetic structure. This may be a partial explanation of the reason why the teaching of prosodic features has generally been given insufficient emphasis. To teach Japanese efficiently at a university level I have combined an emphasis on the teaching of prosodic features together with my experience of television announcing. This has entailed using television news programmes and contemporary reading materials in my class. Using taped material I intend to describe a case-study of teaching of Japanese articulation.

  • PDF

한국어의 변이음 규칙과 변이음의 결정 요인들 (Allophonic Rules and Determining Factors of Allophones in Korean)

  • 이호영
    • 대한음성학회지:말소리
    • /
    • 제21_24호
    • /
    • pp.144-175
    • /
    • 1992
  • This paper aims to discuss determining factors of Korean allophones and to formulate and classify Korean allophonic rules systematically. The relationship between allophones and coarticulation, the most. influential factor of allophonic variation, is thoroughly investigated. Other factors -- speech tempo and style, dialect, and social factors such as age, set, class etc. -- are also briefly discussed. Allophonic rules are classified into two groups -- 3) those relevant to coarticulation and 2) those irrelevant to coarticulation. Rules of the first group are further classified into four subgroups according to the directionality of the coarticulation. Each allophonic nile formulation is explained and discussed in detai1. The allophonic rules formulated and classified in this paper are 1) Devoicing of Voiced Consonants, 2) Devoicing of Vowels, 3) Nasal Approach and Lateral Approach, 4) Uvularization, 5) Palatalization, 6) Voicing of Voiceless Lax Consonants, 7) Frication, 8) Labialization, 9) Nasalization, 10) Release Withholding and Release Masking, 11) Glottalization, 12) Flap Rule, 13) Vowel Weakening, and 14) Allophones of /ㅚ, ㅟ, ㅢ/ (which are realized as diphthongs or as monophthongs depending on phonetic contexts).

  • PDF