• 제목/요약/키워드: Speech quality

검색결과 805건 처리시간 0.027초

Countertenor 1인의 Modal Register와 Falsetto Register에서의 공기역학적 변화 및 전기성문파형의 변화 연구 (Analysis of Phonatory Aerodynamic & Electroglottography of a Countertenor)

  • 남도현;최성희;최재남;최홍식
    • 대한후두음성언어의학회지
    • /
    • 제17권1호
    • /
    • pp.43-48
    • /
    • 2006
  • Background and Objectives: Countertenors who can produce higher vocal pitch like female classical singer's voice and use both modal and falsetto register. This study was conducted to study phonatory characteristics between modal and falsetto register of the countertenor. Materials and Methods: A male countertenor who had 8 years of experience was examined using a videostroboscopy and his voice was analyzed using aerodynamic measures; fundamental frequency(F0), Mean air flow rate(MFR), intensity(SLP), subglottal air pressure(Psub) with phonatory function analyzer(Nagashima) and acoustic measures; jitter, shimmer, HNR, closed quotient(CQ) using a Electro-glottography(EGG) of Lx. Speech Studio(Laryngoscope, Ltd, UK) and voice range profile of CSL(Kay elemetrics). Results: In the stroboscopy finding, the longitudinal length of vocal folds was increased at the falsetto register and the upper margin of vocal folds vibrated with incomplete closure of true vocal folds. In aerodynamic analysis, intensity was same at the modal and falsetto register. However, MFR, Psub, MPT were higher at the falsetto register. In the electroglottographic analysis, closed quotient(CQ) at the modal register was high and also much higher at the high-pitch falsetto than at the loud falsetto. In the VRP, intensity was similar though F0 was different between modal and falsetto register. Conclusion: It implied that countertenor could produce powerful voice quality by increasing of respiratory pressure and respiratory volume though glottal closure was incomplete. In addition, no change of EGG waveform, similar voice range with alto was observed.

  • PDF

IP 그룹화를 이용한 다자간 멀티미디어 회의시스템의 설계 및 구현 (Design and Implementation of A Multi-Point Multimedia Conference System Using IP Grouping)

  • 성백견;성동수;이건배;현동환
    • 한국멀티미디어학회논문지
    • /
    • 제8권7호
    • /
    • pp.1012-1021
    • /
    • 2005
  • 본 논문에서는 공동작업을 지원하는 효율적인 다자간 멀티미디어 회의시스템을 설계하고 구현한다. 기존의 다자간 멀티미디어 회의시스템은 영상, 음성 및 문서회의의 데이터 전송으로 인한 대역폭의 제한으로 인해 다수의 사용자가 원활한 공동작업을 수행하rl 어렵다. 특히, 실시간으로 전송되는 영상, 음성의 데이터는 다수의 사용자가 한정된 대역폭을 사용하는 경우 전송지연으로 인하여 원활한 공동작업을 제공하지 못하는 경우가 많다. 본 논문에서는 원활한 공동작업을 지원하기 위해 분산식과 중앙집중식을 혼합한 하이브리드 전송방식을 사용하고, 영상의 경우 IP 그룹화를 이용한 다자간 회의시스템을 구성함으로써 네트워크 대역폭을 줄인다. 또한, 사용자의 수에 따라 적응적 영상 프레임 변화를 이용하여 네트워크의 병목현상을 해소하고, 음성의 품질을 지원하는 효율적인 다자간 멀티미디어 회의시스템을 설계한다.

  • PDF

보코더에서 프레임별 에너지 보상에 의한 피치검색 성능 개선에 관한 연구 (An Algorithm on Improving a Pitch Searching by Energy Compensation in a Frame for Vocoder)

  • 백금란;민소연;배명진
    • 한국산학기술학회논문지
    • /
    • 제13권7호
    • /
    • pp.3188-3193
    • /
    • 2012
  • 보코더 과정 중 피치를 분석하는 과정은 코드북 분석과 더불어 부호화기 성능에 큰 영향을 미치는 부분이다. 피치를 검색하기 위해 먼저 신호의 주기성을 강조해야 하는데 일반적으로 자기상관법의 일종인 듀얼 펄스 알고리즘 기법을 이용하여 주기성을 강조한 후 피치를 검색하는 방법을 많이 사용한다. 이 방법은 한 프레임 내에서 두 개의 펄스 간격을 변경시키면서 음성신호와의 상관관계 값을 구하여 상관관계가 가장 높을 때의 펄스 간격을 찾는다. 또한 상관관계 값이 가장 높을 때의 주기가 가장 뚜렷한 반복 구간인데 이것을 피치 주기라 한다. 이때 반주기, 배주기 및 세배주기가 주된 주기로 찾아지는 경우에는 이 간격을 피치 주기라 할 수 없어 이를 해결하기 위한 여러 가지방법들이 제안되어 있다. 본 논문에서는 피치를 검색하기 전에 프레임내의 전체 에너지변화 비율을 추정하여 신호의 에너지 레벨을 미리 보상해 준 후 피치를 검색하는 방법을 제안한다. 이 방법을 적용하면 피치검색 시간을 단축할 수 있고, 피치 검색의 정확도를 높일 수 있어 전반적인 피치 검색에 관한 성능이 개선된다.

3차원 모델을 이용한 입모양 인식 알고리즘에 관한 연구 (A study on the lip shape recognition algorithm using 3-D Model)

  • 김동수;남기환;한준희;배철수;나상동
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 1998년도 추계종합학술대회
    • /
    • pp.181-185
    • /
    • 1998
  • 최근 통신 시스템의 연구와 발전 방향은 목소리의 음성 정보와 말하는 얼굴 영상의 화상 정보를 함께 적용하므로서 음성 정보만을 제공하는 경우보다 높은 인식율을 제공한다. 따라서 본 연구는 청각장애자들의 언어 대체수단 중 하나인 구화(speechreading)에서 가장 시각적 변별력이 높은 독순(lipreading)을 PC에서 구현하고자 한다. 간 논문은 기존의 방법과 달리 말하는 영상 시퀀스에서 독순(lipreading)을 행하기 위해 3차원 모델을 사용하여 입의 벌어진 정도, 턱의 움직임, 입술의 돌출과 같은 3차원 특징 정보를 제공하였다. 이와 같은 특징 정보를 얻기 위해 3차원 형상 모델을 입력 동영상에 정합시키고 정합된 3차원모델에서 각 특징점의 변화량을 인식파라미터로 사용하였다. 그리고, 인식 단위로 동영상을 분리하는 방법은 3차원 특징점 변화량에서 얻어지는 강도의 기울기에 의한다. 인식은 다차원(multi-dimensional), 다단계 라벨링 방법을 사용하여 3차원 특징벡터를 입력으로 한 이산 HMM을 사용하였다.

  • PDF

ISDN 전화기의 음량 정격 및 송화자 에코설계 (Design of The Loudness Ratings And Talker Echo For ISDN Telephone)

  • 홍진우;강경옥;강성훈
    • The Journal of the Acoustical Society of Korea
    • /
    • 제13권2E호
    • /
    • pp.32-40
    • /
    • 1994
  • 본 논문은 디지털 망에 접속된 ISDN 전화기의 전송품질인 음량정격과 송화자 에코를 설정하는 방법을 기술한다. ISDN 전화기의 바람직한 음량정격 및 송화자 에코를 설계하기 위하여 주관평가를 위한 디지털 음성통신 모델 시스템을 개발하였고, 이 모델 시스템을 이용하여 최적의 코덱 입력레벨, 전체 음량정격의 범위, 그리고 송화자 에코 등을 결정하기 위하여 오피니언 테스트를 수행하였다. 실험결과 송화 음량정격은 6~8dB, 수화음량정격은 0~2dB, 측음마스킹정격은 8~12dB로 설정되었다. 또한, 에코프리의 전화통화를 위한 단말결합손실은 전체음량정격이 10dB 일때 적어도 40dB 이상이어야 한다는 결론을 얻었다.

  • PDF

G.729A와 SMV 음성부호화기를 위한 파라미터 직접 변환 방식의 상호부호화 알고리듬 (Transcoding Algorithm for SMV and G.729A Vocoders via Direct Parameter Transformation)

  • 장달원;서성호;이선일;유창동
    • 대한전자공학회논문지SP
    • /
    • 제40권6호
    • /
    • pp.71-83
    • /
    • 2003
  • 본 논문에서는 G.729A와 SMV 음성부호화기를 위한 새로운 파라미터 직접 변환 방식의 상호부호화 알고리듬을 제안한다. 상호부호화를 위하여 부가적인 복호화, 부호화 과정을 거쳐야하는 기존의 Tandem 방식과 달리 제안된 파라미터 직접 변환 방식에서는 양 음성부호화기가 음성을 부호화하기 위하여 공통적으로 사용하는 파라미터들이 직접 변환된다. SMV 에서 G.729A로의 트랜스코딩에서는 LSP 변환, 피치 지연 변환, 낮은 전송률에서의 트랜스코딩 등의 알고리듬을 제안하고, G.729A에서 SMV로의 트랜스코더에서는 LSP 변환, 피치 지연 변환, 전송률 결정 등의 알고리듬을 제안한다 제안된 알고리듬을 다양한 방법으로 평가해본 결과 기존의 Tandem 방식과 비교하여 계산량과 지연 시간을 줄이면서도 동등한 음질 또는 향상된 음질을 구현함을 확인할 수 있었다.

남성성악가의 Vocal Register Transition(Passaggio)시 공기역학적 변화와 EGG의 변화 연구 (Analysis of Phonatory Aerodynamic & E.G.G. during Passaggio of the Trained Male Singers)

  • 남도현;최성희;최재남;최홍식
    • 대한후두음성언어의학회지
    • /
    • 제15권1호
    • /
    • pp.21-26
    • /
    • 2004
  • Vocal Register Transition(Passaggio) is one of the most important vocal technique for classically trined male singers(tenor). Passaggio is that it bridges the chest register to head register without a noticeable voice break. Vocalist gest the feeling that voice is not locked a particular register. The purpose of this study was to clarify the difference between easy($B_3$) tone and non passaggio(F#_4$) & passaggio(F#_4$). We selected 6 trained singers(tenor), who had more than 12.6 years of experience and were well trained in passaggio technique. Simulataneous measurement was performed frequency(F0), mean flow rate(MFR), intensity(I), and subglottal pressure(Psub) using a phonatory function analyzer(Nagashima) and Closed Quotient(CQ), Jitter, Shimmer, NHR a Electro-glottography(EGG) of Lx. Speech Studio(Laryngogrph Lt, London, UK) and vocal efficiency was calculated by Carroll's method. For the tenor, target tone/a/was measured in three conditions : 1) easy phonation : $B_3$, 2) high tone without passaggio : F#_4$, 3) high tone with passaggio : F#_4$). The results revealed that F0 of the target tones between non-passaggio group and passaggio group were not significantly different though higher is F0, higher is subglottal pressure. And also CQ, MFR, Psub were increased in passagio than nonpssagio but these values were not statistically different. This study concluded that passaggio is the vocal technique to make the same quality of tone between chest register and head register in tenor.

  • PDF

Damping 요소를 첨가한 매칭 퍼슈잇 정현파 모델링 (Matching Pursuit Sinusoidal Modeling with Damping Factor)

  • 정규혁;김종학;임정우;주기호;이인성
    • 대한전자공학회논문지SP
    • /
    • 제44권1호
    • /
    • pp.105-113
    • /
    • 2007
  • 본 논문은 정현파 모델 기반의 코덱을 위한 매칭 퍼슈잇(Matching Pursuit)의 성능을 개선시킨 새로운 정현파 모델링을 제안한다. 제안하는 damping 요소를 첨가한 매칭 퍼슈잇 정현파 모델링은 과거와 현재 프레임에서 파라미터들간의 상관성을 이용하여 damping 요소를 정의하고 현재 프레임에서 보다 정확한 정현파 파라미터를 damping 요소에 따라 매칭 퍼슈잇 방법으로 추출한 후 합성한다. 따라서 인접 프레임과의 보간 없이 현재 프레임에서의 정현파 파라미터만으로 효율적인 모델링이 가능하다. 제안한 모델링 방법은 보간법을 사용한 일반적인 정현파 모델과 달리 추가지연을 가지지 않으면서 유성음 구간 신호뿐만 아니라 모든 구간에서 개선된 음질을 보인다. 제안한 모델링 방법의 성능을 SNR, MOS값, LR(Itakura-Saito likelihood ratio), CD(cepstral distance)를 통해 보간법을 사용한 매칭 퍼슈잇과 비교 평가한다.

음악요소와 노래 부르기를 활용한 호흡 및 구강훈련이 정상노인의 음성에 미치는 영향 (Effects of Respiration and Oral Motor Training based on Musical Elements and Singing on Voice of Healthy Elderly)

  • 전희운;김수지
    • 한국콘텐츠학회논문지
    • /
    • 제11권10호
    • /
    • pp.380-387
    • /
    • 2011
  • 본 연구는 음악요소와 노래 부르기 중심의 호흡 및 구강운동 훈련이 정상노인 음성개선에 효과가 있는지 알아보고자 실시되었다. 연구 대상은 서울 소재 노인 기관에서 노래 부르기 활동에 참여하고 있는 65세~80세 노인 27명을 대상으로 실험군 11명, 통제군 16명을 무작위 분류하여 선정하였으며, 훈련은 4주 동안 25분씩 4회의 그룹치료 형태로 실시되었다. 연구 결과는 두 집단의 사전 사후 결과를 Praat(음성프로그램)으로 분석하였으며, 측정된 결과는 평균을 산출한 후 SPSS 19.0으로 통계처리를 하였다. 연구 결과에서 실험군은 강도(p < .001), 기본주파수(p < .01), 최대발성지속시간(p < .05), 일련운동속도(p < .001)가 유의미하게 향상을 보였으며, 통제군은 강도만 유의미한 차이로 감소를 보이고(p < .05), 나머지는 통계적으로 유의미하지 않은 감소를 보였다. 따라서 음악요소와 노래 부르기를 활용한 호흡 및 구강훈련은 노화로 인한 정상 노인의 음성 기능 개선에 치료적 효과를 나타내며, 이후 음성 장애를 예방하는 음성 훈련프로그램으로 활용될 수 있을 것이다.

최근 우리나라 e-Learning 시장의 주요 동향 및 향후 전망 (Some Problems of e-Learning Market in Korea)

  • 윤영한
    • 통상정보연구
    • /
    • 제9권2호
    • /
    • pp.103-120
    • /
    • 2007
  • The knowledge based economy requires more and more people to learn new knowledge and skills in a timely and effective manner. These needs and new technology such as computer and Internet are fueling a transition in e-learning. According to specialist's opinion, imagination experience studying is generalized, and learning environment that language barrier by studying, multi-language studying Machine that experience past things that disappear through simulation, and travel area, and experience future changed state disappears is forecasting to come. This is previewing finally that it may become future education that education and IT, element of entertainment is combined. Already, became story that argument for party satellite of e-Learning existence passes one season already. e-Learning is utilized already in all educations that we touch by effectiveness by corporation's competitive power improvement and implement of lifelong education in educational institutions through present e-Learning. It is obvious that when see from our viewpoint which is defining e-Learning by one industry and rear by application to education as well as one new growth power about these, e-Learning industry becomes very important means that can solve dilemma of growth real form. Only, special quality of digital industry that e-Learning is being same with other digital industry and repeat putting out a fire rapidly, and is repeating sudden change that these evolution is not gradual growth of accumulation and improvement of technology that is appearing consider need to. In the meantime, we need to observe about evolution of Information Technology. Because there is some scholars who e-Learning's concept foresees to evolve by u-Learning.(although, a person who see that these concept is not more in marketing terminology by some scholars' opinion is). This u-Learning's concept means e-Learning that take advantage of ubiquitous technology as Ubiquitous-Learning's curtailment speech. Ubiquitous, user means Information-Communication surrounding that can connect to network freely regardless of place without feeling network or computer. There is controversy about introduction time regarding these direction, but e-Learning is judged to evolve by u-Learning necessarily. Because keep in step and age that study all contents that learner wants under environment of 3A (any time, any whrer, any device) by individual order thoroughly is foreseen to come in ubiquitous learning environment that approach more festinately.

  • PDF