• 제목/요약/키워드: quality of pitch

검색결과 332건 처리시간 0.024초

개별 피치펄스를 이용한 멀티펄스 음성부호화 방식에 관한 연구 (A Study on Multi-Pulse Speech Coding Method by using Individual Pitch Pulses)

  • 이시우
    • 한국정보통신학회논문지
    • /
    • 제8권5호
    • /
    • pp.977-982
    • /
    • 2004
  • 본 연구에서는 피치추출 오류를 줄이고 피치간격의 변위에 적응할 수 있도록 피치간격을 정규화하지 않은 개별피치 펄스를 이용한 새로운 멀티펄스 음성부호화 방식(띤-MPC)을 제안하였다. 여기에서, 개별피치 펄스의 추출률은 남자음성에서 96 여자음성에서 85%를 얻을 수 있었으며, 개별피치 펄스를 이용한 IP-MPC와 자기상관법의 피치정보를 이용한 MPC를 평가한 결과, IP-MPC의 음질이 MPC의 음질에 비하여 상당히 개선되었음을 알 수 있었다.

음원 모델에 기초한 합성음의 피치 조절 (Pitch Modification based on a Voice Source Model)

  • 최용진;여수진;김진영;성굉모
    • 음성과학
    • /
    • 제3권
    • /
    • pp.132-147
    • /
    • 1998
  • Previously developed methods for pitch modification have not been based on the voice source model. Therefore, the synthesized speech often sounds unnatural although it may be highly intelligible. The purpose of this paper is to analyze the alteration of a voice source signal with pitch period and to establish the pitch-modification rule based on the result of this analysis. We examine the alteration of the interval of closing phase, closed phase and open phase using the excitation waveform as the pitch increases. In comparison to the previous methods which performed directly on the speech signal, the pitch modification method based on a voice source model shows high intelligibility and naturalness. This study might benefit the application to the speaker identification and the voice color conversion. Therefore the proposed method will provide high quality synthetic speech.

  • PDF

CELP 보코더에서 델타 피치 검색 방법 개선에 대한 연구 (An Algorithm to Reduce the Pitch Computational Complexity Using Modified Delta Searching in G.723.1 Vocoder)

  • 민소연;배명진
    • 음성과학
    • /
    • 제11권3호
    • /
    • pp.165-172
    • /
    • 2004
  • In this paper, we propose the computational complexity reduction methods of delta pitch search that is used in G.723.1 vocoder. In order to decrease the computational complexity in delta pitch search the characteristic of proposed algorithms is as the following. First, scheme to reduce the computational complexity in delta pitch search uses NAMDF. Developed the second scheme is the skipping technique of lags in pitch searching by using the threshold value. By doing so, we can reduce the computational amount of pitch searching more than 64% with negligible quality degradation.

  • PDF

음성 하모닉스 스펙트럼의 피크-피팅을 이용한 피치검출에 관한 연구 (A Study on the Pitch Detection of Speech Harmonics by the Peak-Fitting)

  • 김종국;조왕래;배명진
    • 음성과학
    • /
    • 제10권2호
    • /
    • pp.85-95
    • /
    • 2003
  • In speech signal processing, it is very important to detect the pitch exactly in speech recognition, synthesis and analysis. If we exactly pitch detect in speech signal, in the analysis, we can use the pitch to obtain properly the vocal tract parameter. It can be used to easily change or to maintain the naturalness and intelligibility of quality in speech synthesis and to eliminate the personality for speaker-independence in speech recognition. In this paper, we proposed a new pitch detection algorithm. First, positive center clipping is process by using the incline of speech in order to emphasize pitch period with a glottal component of removed vocal tract characteristic in time domain. And rough formant envelope is computed through peak-fitting spectrum of original speech signal infrequence domain. Using the roughed formant envelope, obtain the smoothed formant envelope through calculate the linear interpolation. As well get the flattened harmonics waveform with the algebra difference between spectrum of original speech signal and smoothed formant envelope. Inverse fast fourier transform (IFFT) compute this flattened harmonics. After all, we obtain Residual signal which is removed vocal tract element. The performance was compared with LPC and Cepstrum, ACF. Owing to this algorithm, we have obtained the pitch information improved the accuracy of pitch detection and gross error rate is reduced in voice speech region and in transition region of changing the phoneme.

  • PDF

음성으로부터 감성인식 요소분석 (Analyzing the element of emotion recognition from speech)

  • 심귀보;박창현
    • 한국지능시스템학회논문지
    • /
    • 제11권6호
    • /
    • pp.510-515
    • /
    • 2001
  • 일반적으로 음성신호로부터 사람의 감정을 인식할 수 있는 요소는(1)대화의 내용에 사용한 단어, (2)톤 (tore), (3)음성신호의 피치(Pitch), (4)포만트 주파수(Formant Frequencey)그리고 (5)말의 빠르기(Speech Speed)(6)음질(Voice Quality)등이다. 사람의 경우는주파수 같은 분석요소 보다 톤과 단어 빠르기, 음질로 감정을 받아들이게 되는것이 자연스러운 방법이므로 당연히 후자의 요소들이 감정을 분류하는데 중요한 인자로쓰일 수있다. 그리고, 종래는 주로 후자의 효소들을 이용하였는데, 기계로써 구현하기 위해서는 포만트 주파수를 사용할 수있게 되는것이 도움이 된다. 그러므로, 본 연구는 음성 신호로부터 피치와 포만트, 그리고 말의 빠르기 등을 이용하여 감성인식시스템을 구현하는것을 목표로 연구를 진행하고 있으며, 그 1단계 연구로서 본 논문에서는 화가 나서 내뱉는 말을 기반으로 하여 화난 감정의 독특한 특성을 찾아내었다.

  • PDF

양성후두 질환 음성에 대한 여러 기존 피치검출 알고리즘의 성능 평가 (Performance Assessment of Several Established Pitch Detection Algorithms in Voices of Benign Vocal Fold Lesions)

  • 장승진;최성희;김효민;최홍식;윤영로
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2007년도 하계종합학술대회 논문집
    • /
    • pp.407-408
    • /
    • 2007
  • Robust pitch estimation is an important study in many areas of speech processing. In voice pathology, diverse statistics extracted form pitch were commonly used to test voice quality. In this study, we compared several established pitch detection algorithms (PDAs) for verification of adequacy of the PDAs. In the database of total pathological voices of 99 and normal voices of 30, an analysis of errors related with pitch detection was evaluated between pathological and normal voices, or among the types of pathological voices such as benign vocal fold lesions; polyp, nodule, and cysts. Consequently, it is required to survey the severity of tested voice in order to obtain accurate pitch estimates.

  • PDF

소아 심장 CT검사 시 Wide Coverage Volume Axial Mode의 유용성 평가 (Evaluation of the Availability of the Wide Coverage Volume Axial Mode in Pediatric Cardiac CT)

  • 박기석;김동현
    • 한국방사선학회논문지
    • /
    • 제13권5호
    • /
    • pp.683-689
    • /
    • 2019
  • 소아의 선천적 심장질환 진단을 위해 High Pitch Mode를 사용하여 획득한 소아 심장 CT 영상과 Wide Coverage Volume Axial Mode를 사용하여 획득한 소아 심장 CT 영상으로부터 환자의 피폭선량과 각 영상의 화질을 비교 및 분석하여 Wide Coverage Volume Axial Mode의 유용성을 평가해보고자 한다. 소아 심장 CT 검사 시 High Pitch Mode와 Wide Coverage Volume Axial Mode를 각각 50명 총 100명의 환자를 대상으로 시행하였으며, 각 프로토콜로부터 얻은 영상을 이용하여 환자의 피폭선량을 비교하였다. 각 영상에 ROI를 설정해 SNR과 CNR을 산출하여 영상의 화질을 비교하였다. High Pitch Mode에 비해 Wide Coverage Volume Axial Mode를 사용하여 검사하였을 때 환자의 피폭선량이 13.07% 감소하였고, SNR과 CNR이 향상되었다. Wide Coverage Volume Axial Mode는 고속 회전 스캐너를 이용하여 조사시간을 줄이고, 저선량 기술인 ASi R-V를 통해 High Pitch Mode를 사용했을 때보다 환자의 피폭선량이 감소하고 영상의 화질 또한 향상되는 유용한 검사라 할 수 있다.

항공기의 고도, 속도 및 깊은 실속의 회복을 위한 자동회복장치 설계 및 검증에 관한 연구 (A Study on the Design and Validation of Automatic Pitch Rocker System for Altitude, Speed and Deep Stall Recovery)

  • 김종섭
    • 제어로봇시스템학회논문지
    • /
    • 제15권2호
    • /
    • pp.240-248
    • /
    • 2009
  • Modem version of supersonic jet fighter aircraft must have been guaranteed appropriate controllability and stability in HAoA(High Angle of Attack). The HAoA flight control law have two parts, one is control law of departure prevention and the other is control law of departure recovery support. The control laws of departure prevention for advanced jet trainer consist of HAoA limiter, roll command limiter and rudder fader. The control laws of departure recovery support are consist of yaw-rate limiter and MPO(Manual Pitch Override) mode. The guideline of pitch rocking using MPO mode is simple, but operating skill of pitch rocking is very difficult by the pilot with inexperience of departure situation. Therefore, automatic deep stall recovery system is necessary. The system called the "Automatic Pitch Rocker System" or APRS, provided a pilot initiated automatic maneuver capable of an aircraft recoveries in situations of deep stall, speed and altitude. This paper addresses the design and validation for APRS to recovery of an deep stall without manual pitch rocking by the pilot. Also, this system is designed to recovery of speed, attitude and altitude after deep stall recovery using ATCS (Automatic Thrust Control System) and autopilot. Finally, this system is verified by real-time pilot evaluation using HQS (Handling Quality Simulator).

두부 CT 검사 시 검사 모드에 따른 화질 및 선량평가 (Image Quality and Dose Assessment According to Examination Mode during Head CT Examination)

  • 강헌효;최우전;김동현
    • 한국방사선학회논문지
    • /
    • 제15권4호
    • /
    • pp.437-444
    • /
    • 2021
  • 두경부 CT 검사시 팬텀을 이용하여 Helical mode, High Pitch Mode, Volume Axial Mode 사용하여 획득한 CT 영상으로부터 환자의 피폭선량과 각 영상의 화질을 비교 및 분석하여 Volume Axial Mode의 유용성을 평가해보고자 한다. 두경부 CT 검사 시 각 mode에 따른 70 kVp, 80 kVp, 100 kVp 관전압에 따라 검사를 시행하였다. 사용 장비로는 GE사의 Revolution(GE Healthcare, Wisconsin USA) 모델과 iMED X-ray Phantom을 이용하였다. 검사 Mode에따른 kVp별로 얻어진 영상을 이용하여 팬텀의 피폭선량을 비교하였으며, 각 영상에 ROI를 설정해 신호대 잡음비와 대조도대 잡음비를 산출하여 영상의 화질을 비교하였다. Volume Axial Mode를 사용하여 검사하였을 때 팬텀의 피폭선량이 Helical에 비해 17.12% 낮게, High Pitch에 비해 5.35% 낮게 측정되었고, 신호대 잡음비와 대조도대 잡음비가 향상되었다. Volume Axial Mode는 고속 회전 스캐너를 이용하여 테이블의 이동이 없이 조사시간을 줄이고, High Pitch Mode와 Helical Mode를 사용했을 때 보다 팬텀의 0.28초의 단시간에 영상을 획득하여 피폭선량이 감소하고 영상의 화질 또한 향상되는 유용한 검사라 할 수 있다. 또, 몸이 불편한 환자의 촬영이나 긴급환자의 CT 촬영에 있어서 Volume Axial Mode의 빠른 검사시간은 최대의 장점이라고 볼 수 있다.

개선된 여기신호의 4800BPS LPC 보코우터 (A 4800 BPS LPS Vocoder with Improved Exitation)

  • 은종관;성원용
    • 한국음향학회지
    • /
    • 제1권1호
    • /
    • pp.54-59
    • /
    • 1982
  • We present an improved 4800 bps LPC vocoder system that virtually eleminates the buzzy effect from synthetic speech. Excitation signal in the new system is formed by adding high-pass filtered pitch pulses or random noise to a baseband residual signal that has been coded by pitch predictive PCM. Since the baseband residual is used as a part of excitation, the system is also robust to V/UV and pitch errors. According to our informal listening tests, the synthetic speech of the new system does not have the buzzy effect. As a result the vocoder speech quality is more natural than that of a conventioinal LPC vocoder.

  • PDF