• Title/Summary/Keyword: 발성

Search Result 1,733, Processing Time 0.028 seconds

A Study on a Implementation of Gentle Phone's Fuction by using PSOLA Algorithm (PSOLA 알고리즘을 이용한 친절전화기능의 구현에 관한 연구)

  • Jung HyunUk;Kim JongKuk;Bae MyungJin
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.93-96
    • /
    • 2004
  • 본 논문은 전화기의 수화기에서 들리는 상대방의 목소리를 디지털 발성처리기술을 적용하여 억양이 강하지 않고 부드러운 소리(소프트사운드, soft-sound)로 통화하는 방식을 새로이 제안한 것이다. 실시간 친절전화기의 구현에 있어 메모리 점유율을 음성신호의 지속시간을 제어함으로써 효율적인 소프트웨어 및 하드웨어 구현을 위한 방법을 제안한다. 목소리 신호의 특징 추출을 수행하여 발성자의 특성정보는 그대로 유지하면서 발성자의 의미정보를 친절하게 변경하는 것으로서, 발성자의 발성특성에서 지속시간을 조절하여 슬로우-목소리를 구현하거나, 발성 지속시간의 지연을 유성 및 비유성 구간으로 구분하여 처리를 다르게 하는 등의 발성 변환법을 전화기에 구현하여 상대방 목소리가 친절하게 들리도록 하는 친절기능을 부가한 전화기를 구현한다.

  • PDF

Vocalization for Pop Singers - Research on Vocalization for Korean Pop - (대중음악 가수들을 위한 발성법 -가요 발성법 연구-)

  • Cho, Tae-Seon
    • Proceedings of the KAIS Fall Conference
    • /
    • 2009.05a
    • /
    • pp.364-367
    • /
    • 2009
  • 음악 장르마다 소리의 색깔, 성량이 모두 다르다. 그것은 발성법 즉 소리를 어떻게 만들어내느냐에 따라 다른 것 인데, 호흡법에 따라서도 많은 차이난다. 성악의 경우 맑고 깨끗한 소리를 만들어내기 위해 주로 두성을 많이 사용 한다. 창이나 판소리의 경우도 처음에는 몸통에서 소리를 끌어내는 방식으로 소리를 내다가 결국에는 두성으로 소리를 만들어낸다. 이는 모두 소리를 멀리 보내기 위한 방법인데, 마이크와 앰프를 사용하는 대중음악 가수들의 경우는 분명 다른 발성법을 사용해야한다. 본 연구에서는 소리의 확장보다는 본인만의 개성을 중요시 하는 가수들에게 필요한 발성법에 대해 연구해 보고자 한다.

  • PDF

Use of Pansori for Developing Actor's Aesthetic Voice (배우의 미학적 발성을 위한 판소리의 활용방안)

  • Lee, Ki-Ho
    • The Journal of the Korea Contents Association
    • /
    • v.9 no.12
    • /
    • pp.181-192
    • /
    • 2009
  • The purpose of this research is to investigate appropriate usage of pansori's method of breathing, sound making, and resonance in order to develop actor's aesthetic voice. Today's theatre no longer see inter-cultural approach as new or experimental, but see it as a part of global current. Actors are required to integrate some global-ness into their acting. It's not enough, however, for actors to equip some cosmopolitan sensibility. More important thing is that they should be able to integrate one's own culture and aesthetic into their performance. Only after acquiring one's own cultural identity, it is possible to step into inter-cultural work. It is fundamental, therefore, for actors to assimilate traditional movement and aesthetic voice. It's been known that traditional Korean voice traits are well preserved in Pansori. In this paper, based upon well-known theories and practices of western voice training, pansori's principles and practices are utilized to bring a new aesthetic voice.

A Study on Acoustical Properties of Soprano′s Singing (소프라노의 성악 발성에 대한 음향학적 특징 연구)

  • 임동철;문소연;이행세
    • The Journal of the Acoustical Society of Korea
    • /
    • v.19 no.5
    • /
    • pp.60-64
    • /
    • 2000
  • This paper studies the relation between the Fundamental Frequency (F0) and the formants of simple vowels in the Korean language sung by sopranos. It is hewn that, in soprano singing, the F0 of a vowel affects its formants. For this reason the formants of simple vowels sung by sopranos must be considered in all over the soprano singing range. We recorded the five simple vowel sounds /a/, /e/, /i/, /o/, and /u/ sung by five professional sopranos from A3 (220.0Hz) to A5 (880.0Hz) in the major scale and compared the formants of the sung vowels with those of spoken vowels. We observed that F1 and F2 of sung vowels were stable in low F0 (lower than B4) but in high F0 (higher than B4), F1 and F2 lost their stabilities. In the case of /a/, /o/, and /u/, the slope of the F1-F2 graph was about 2.6, and those of the F0-F2 and F0-Fl graphs were 2.2-2.5 and 0.7-1.0, respectively. And as the F0 increases, the F1 and F2 of sung vowels /a/, /e/, /i/, /o/, and /u/ were almost the same. At A5, the Fl and F2 of five sung vowels had the same values. This results suggest that the relation between the F0 and the formants be used to synthesize soprano's singing vowels.

  • PDF

Glottal Spectrum Analysis According to Speaking volume (발성크기에 따른 Glottal Spectrum 성분 분석)

  • Lee Yoonjoo;Cho Namsu;Bae Myungjin
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.53-56
    • /
    • 2001
  • 사람은 연령, 성별 등에 따라 성도(vocal tract), 성대(vocal cord, 혹은 vocal fold), 비강(nasal tract)등 발성기관의 차이가 있고, 이는 음성의 음색, 높낮이 등 음향 특성에 영향을 미치며, 시간이 지나감에 따라 변하는 특성을 가지고 있다. 예를 들어, 발성기관의 차이가 큰 남성과 여성은 동일한 단어를 발성하더라도 음향학적으로 매우 큰 차이를 보이며, 이러한 특성은 다른 문장 발성 시에도 음향학적으로 일정한 영향을 미치게 되므로 정적특성이라 한다. 본 논문에서는 이러한 정적특성 중 음성의 발성크기에 따른 Glottal Spectrum을 비교 $\cdot$분석 하고자 한다.

  • PDF

A Study on the HMM Structure for Classifying Dog Breeds (개의 품종 분류를 위한 HMM 구조의 연구)

  • Lim, Seong-Min;Kim, Yoon-Joong
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06b
    • /
    • pp.477-479
    • /
    • 2012
  • 개의 발성은 성도의 물리적인 특징에 따라 고유의 특정 포먼트를 만들어 내며 개의 품종에 따라 다른 물리적 특징을 가지므로 개의 발성을 HMM(Hidden Markov Model)으로 모델링하여 개의 품종을 분류하는 연구를 하였다. 주파수 특징은 MFCC(Mel Frequency Cepstral Coefficients) 12차, 에너지 컴포넌트 1차, 델타 13차, 억셀러레이션(Acceleration) 13차, 총 39차 벡터를 사용하였다. 개의 품종 분류에 적합한 HMM 구조의 설계를 위하여 기본 좌우 모델, 좌우 모델, 좌우 모델2, 전후진 모델, 총 4가지를 제안하고 실험하여 성능을 비교분석하였다. 이 중 전후진 모델이 가장 바람직한 모델로 검증 되었다. 본 모델은 다음과 같은 장점을 갖는다. (1) 기본 좌우 모델과 마찬가지로 1~2회 발성을 갖는 데이터가 입력되어도 처음에서 마지막 상태까지의 이동단계가 최소 3번까지 가능하므로 적은 횟수의 발성 데이터도 처리가 가능하다. (2) 다수 반복된 발성 데이터의 신호도 처리가 가능하다. 즉, 본 모델은 상태의 이동이 후진도 가능하므로 5회이상 반복된 발성 데이터의 신호의 처리도 가능하다.

Research on popular music vocalization (대중음악 보컬 발성법에 관한 연구 -진성(眞聲) 발성훈련을 통한 소리의 확장 중심으로-)

  • Cho, Tae-Seon
    • Proceedings of the KAIS Fall Conference
    • /
    • 2011.12a
    • /
    • pp.18-20
    • /
    • 2011
  • 한류 문화를 비롯해 방송사들에서 시행하는 각종 오디션 프로그램들로 인해 대중음악계가 상당히 부각되고 있다. 이러한 가요계의 발전과 더불어 가수가 되고자 하는 지망생들이 급격히 증가하였는데, 아직은 이들을 가르치고 훈련을 받을 수 있는 교육적인 여건이 미비하다. 본 논문은 가수지망생, 즉 보컬이 기복적으로 갖추어야 할 호흡과 발성법에 관한 논문이다. 호흡과 발성은 노래를 잘하기 위한 과정이지만, 노래를 잘하기에 앞서 목소리를 크게 만들고 라이브 공연 시 목소리를 안정적으로 내기 위한 필수적인 요건이다. 명성에 비해 라이브 실력이 부족한 가수들을 흔히 볼 수 있는데 이것이 모두 호흡과 발성훈련을 소홀히 해서 생긴 결과이다. 따라서 본 논문에서는 크고, 안정적인 목소리를 만들기 위한 발성훈련 방법에 대해 알아보는 논문이다.

  • PDF

Characteristics of Dairy Cow's Vocalization in Postpartum Related with Calf Isolation (출산 후 새끼와의 분리에 따른 유우의 발성음 특성)

  • Kim, Min-Jin;Son, Seung-Hun;Rhim, Shin-Jae;Chang, Moon-Baek
    • Journal of Animal Science and Technology
    • /
    • v.52 no.1
    • /
    • pp.51-56
    • /
    • 2010
  • This study was conducted to clarify the characteristics of Holstein dairy cow's vocalization in postpartum related with calf isolation. Vocalizations of 16 individuals of cows were recorded 6 hours per day (1:00am~4:00am and 1:00pm~4:00pm) using digital recorder and microphone during October 2008 and May 2009. Vocalizations were divided into 4 types. Characteristics of frequency, intensity and duration were analyzed by GLM (general linear model) and Duncan's multi-test. There were significant differences in frequency and intensity based on analyses of spectrogram and spectrum among 4 types of vocalizations. Frequencies of vocalizations were dramatically decreased on 2nd and 3rd day. Vocalization would be important factor affecting the motheryoung bond in Holstein dairy cattle.

Study on the Improvement of Speech Recognizer by Using Time Scale Modification (시간축 변환을 이용한 음성 인식기의 성능 향상에 관한 연구)

  • 이기승
    • The Journal of the Acoustical Society of Korea
    • /
    • v.23 no.6
    • /
    • pp.462-472
    • /
    • 2004
  • In this paper a method for compensating for thp performance degradation or automatic speech recognition (ASR) is proposed. which is mainly caused by speaking rate variation. Before the new method is proposed. quantitative analysis of the performance of an HMM-based ASR system according to speaking rate is first performed. From this analysis, significant performance degradation was often observed in the rapidly speaking speech signals. A quantitative measure is then introduced, which is able to represent speaking rate. Time scale modification (TSM) is employed to compensate the speaking rate difference between input speech signals and training speech signals. Finally, a method for compensating the performance degradation caused by speaking rate variation is proposed, in which TSM is selectively employed according to speaking rate. By the results from the ASR experiments devised for the 10-digits mobile phone number, it is confirmed that the error rate was reduced by 15.5% when the proposed method is applied to the high speaking rate speech signals.

Deep neural networks for speaker verification with short speech utterances (짧은 음성을 대상으로 하는 화자 확인을 위한 심층 신경망)

  • Yang, IL-Ho;Heo, Hee-Soo;Yoon, Sung-Hyun;Yu, Ha-Jin
    • The Journal of the Acoustical Society of Korea
    • /
    • v.35 no.6
    • /
    • pp.501-509
    • /
    • 2016
  • We propose a method to improve the robustness of speaker verification on short test utterances. The accuracy of the state-of-the-art i-vector/probabilistic linear discriminant analysis systems can be degraded when testing utterance durations are short. The proposed method compensates for utterance variations of short test feature vectors using deep neural networks. We design three different types of DNN (Deep Neural Network) structures which are trained with different target output vectors. Each DNN is trained to minimize the discrepancy between the feed-forwarded output of a given short utterance feature and its original long utterance feature. We use short 2-10 s condition of the NIST (National Institute of Standards Technology, U.S.) 2008 SRE (Speaker Recognition Evaluation) corpus to evaluate the method. The experimental results show that the proposed method reduces the minimum detection cost relative to the baseline system.