• 제목/요약/키워드: Speech rate

검색결과 1,242건 처리시간 0.03초

웨이블릿 변환을 이용한 잡음제거기 설계 (Design of the Noise Suppressor Using Wavelet Transform)

  • 원호진;김종학;이인성
    • 한국음향학회지
    • /
    • 제20권7호
    • /
    • pp.37-46
    • /
    • 2001
  • 본 논문에서는 웨이블릿 변환을 이용한 주변 잡음제거기를 제안하였다. 기존의 고정된 시간-주파수 해상도를 가지는 단구간 푸리에 분석법 대신 다양한 시간-주파수 해상도를 제공하는 웨이블릿 분석법을 사용함으로써 시간 특성이 변하는 베이블 (Babble) 잡음에 좀더 효율적인 잡음제거 방법을 설계하였다. 본 논문에 제안된 웨이블릿 변환 잡음제거기는 스펙트럴 차감법에 기반하여 구성하였으며, 고주파 영역에서 높은 시간 해상도를 갖는 웨이블릿 마스크 패턴을 사용함으로써 시간 특성이 빠르게 변화하는 고주파 잡음에 더욱 효율적인 동작을 하도록 설계하였다. 성능평가를 위해 차량 잡음, 길거리 잡음, 베이블 잡음과 같은 이동통신에서 많이 사용하는 주변잡음에서 시험하였으며, 그 주관적 음질 평가 결과 베이블 잡음의 경우 기존의 EVRC(Enhanced Variable Rate Coder) 잡음 제거기보다 Mos (Mean Opinion Score) 0.2의 성능 개선을 이룰 수 있었다. 출력 음성의 스펙트로그램에서도 성능 개선을 확인할 수 있었다.

  • PDF

MYSTERY CIRCLE 시스템을 이용한 폭주부족형 사위 및 간헐성 사시 환자의 시기능 훈련 효과 연구 (The Effect of Vision Training on Exophoria and Intermittent Extropia Using MYSTERY CIRCLE System)

  • 이창선;김건규;전영기;김종기;최철희;김기홍
    • 한국안광학회지
    • /
    • 제15권4호
    • /
    • pp.373-379
    • /
    • 2010
  • 목적: 이 연구의 목적은 MYSTERY CIRCLE 시스템을 이용하여 폭주부족 사위와 간헐성 사시 환자의 시기능 훈련효과를 조사하였다. 방법: 시기능 훈련 대상자는 안질환과 조절이상 및 수직사위가 없는 폭주부족 사위(n=18)와 간헐성 사시(n=8) 이상자 26명을 대상으로 추적 관찰하였고, 훈련기간은 8주간 매주 한번은 안경원에 방문하여 시기능 훈련에 따른 변화를 측정하였다. 결과: MYSTERY CIRCLE 시스템으로 시기능 훈련을 실행한 결과 기능적 및 감각적 증상이 개선되었다. 그리고 Worth 4 Dot검사, 입체시 검사 및 적색렌즈 융합 속도 검사도 개선을 보여 주었다. 결론: MISTERY CIRCLE 시기능 훈련 시스템을 이용한 시기능 훈련은 좋은 양안시 이상 개선 효과를 보여주었다.

다중비 신호처리에 적용한 선형 주기적 시변 시스템의 입출력 이득 (Input-Output Gains of Linear Periodic Time-Varying Systems with Applications to Multirate Signal Processing)

  • 이상철;박계원
    • 한국정보통신학회논문지
    • /
    • 제4권5호
    • /
    • pp.963-969
    • /
    • 2000
  • 본 논문에서는, 선형 주기적 시변 시스템에 대해서, 두 개의 입출력 이득을 정의한다. 그 하나는 단위 크기의 ι$_2$노름을 갖는 모든 입력에 대한 최악의 $\iota_2$ 노름의 출력의 비로서, G($\iota_2,\iota_2$ 로 표기한다. 또 다른 하나는 단위 크기의 RMS 값을 갖는 모든 입력에 대한 최악의 RMS 값의 출력의 비로서, G(RMS, RMS)로 표기한다. 선형 시불변 시스템에 대해서는 이 두 개의 이득은 등가라는 사실이 잘 알려져 있다. 본 논문에서는 선형 주기적 시변 시스템에 대해서도 이 두 개의 이득이 등가라는 것을 증명한다. 또한, 선형 주기적 시변 시스템에 대한 주파수 응답을 얻는 두 가지 방법 사이의 관계를 유도한다. 이렇게 정의된 입출력 이득은 M-채널 필터 뱅크에 적용한다. 필터 뱅크는 음성 압축 등에 사용되는 대표적인 다중비 신호처리 시스템이다. 이러한 필터뱅크에는 일반적으로 에일리어징 왜곡, 진폭 왜곡 및 위상 왜곡이 존재한다. 본 논문에서는 오차 시스템의 G($\iota_2,\iota_2$ 이득을 최적화 하는 방법에 의해 필터 뱅크를 설계함으로써, 필터 뱅크에서 일반적으로 존재하는 왜곡을 작게할 수 있음을 보인다.

  • PDF

수직후두부분절제술 및 점막 피판과 지방 이식을 통한 성대 재건술 후의 음성분석 (The Analysis of Voice after Vertical Partial Laryngectomy with Mucosal Flap and Fat Graft Reconstruction)

  • 주형로;최인자;김진환;안회영;노영수
    • 대한후두음성언어의학회지
    • /
    • 제18권2호
    • /
    • pp.134-137
    • /
    • 2007
  • Background and Objectives: The goals of laryngeal reconstruction have been prevention of aspiration, production of a functional voice, and maintenance of an adequate airway for decannulation. It is generally believed that the reconstruction of the glottic region after vertical partial laryngectomy (VPL) can improve laryngeal function. The objective of this study is to evaluate of voice function after VPL with mucosal flap and fat graft reconstruction. Materials and Methods: From 1994 to 2006, 13 patients, who had been treated with VPL with mucosal flap and fat graft reconstruction. The voice characteristics, acoustic, aerodynamic parameter were measured in 13 patients after vertical partial laryngectomy with mucosal flap and fat graft reconstruction. Acoustic analysis was carried out using Computerized Speech Lab (CSL) and aerodynamic analysis were carried out using Aerophon II,3 months and 12 months after surgery. Results: The GRBAS scale, jitter, shimmer, NHR were improved as time goes on after surgery. But, maximum phonation time was shortened after surgery and there is no significant differences between before and after surgery in mean flow rate. Conclusion: The voice function of the mucosal flap and fat graft reconstruction after VPL were satisfactory. This can be an excellent reconstruction method after vertical partial laryngectomy.

  • PDF

2차원 상의 음원위치 추정을 위한 효율적인 영역분할방법 (An efficient space dividing method for the two-dimensional sound source localization)

  • 김환용;최홍섭
    • 한국음향학회지
    • /
    • 제35권5호
    • /
    • pp.358-367
    • /
    • 2016
  • 음원의 위치를 찾는 SSL(Sound Source Localization)은 로봇과의 인터페이스, 화상회의, 스마트 자동차 등 여러 분야에서 꼭 필요한 기술이다. 일반적으로 음원의 위치 정보를 활용하는 기술들은 주로 측정 장치에 대한 음원의 각도 정보를 찾아서 이용하고 있다. 그러나 음원의 위치에 대한 각도를 추정할 때 이용하는 사인 역함수의 비선형적인 특성으로 추정된 각도에 오차가 발생하며, 이에 대한 방안으로 마이크가 담당하는 영역을 분할하는 방법이 제안되었다. 본 논문에서는 마이크 어레이 패턴에 따른 영역분할 방법을 제안하고 음원의 위치를 2차원상의 평면 좌표로 특정하는 방법으로 위치 추정 성능을 평가하였다. 실험에서 잡음에 강인한 GCC-PHAT(Generalized Cross Correlation Phase Transform) 방법을 사용했으며, 마이크 어레이의 패턴은 마이크 3개와 4개로 삼각형과 사각형 두 종류로 구성하였으며, 100개의 음성 데이터로 실험한 결과 실제 환경에서는 3개의 마이크 어레이를 사용해서는 영역 분할 해상도가 낮아서 음원의 위치를 정해진 특정 범위내로 추정하는데 실패했으나, 4개 마이크를 이용하여 해상도를 높였더니 위치추정 성공률이 67 %로 크게 향상됨을 확인할 수 있었다.

음소에 의한 한국어 음성의 분석과 인식 (The Analysis and Recognition of Korean Speech Signal using the Phoneme)

  • 김영일;이건기;이문수
    • 한국음향학회지
    • /
    • 제6권2호
    • /
    • pp.38-47
    • /
    • 1987
  • 한국어는 발음상의 특징과 구조에 의해서 음소철로 분리가 가능하므로, 한국어를 자음 음소, 모음 음소, 받침 음소로 나눌 수 있다. 분리된 각각의 음소들을 편자기 상관계수를 이용하여 분석하였는데, 이 때 예측 차수는 15차이다. 분석 실험에서 동일한 음소들은 그 특성이 거의 유사하였다. 한국어 단음 675개를 자음 음소. 모음 음소, 받침 음소로 각각 분리하여 인식한 결과 각각 $85.0(\%)$, $90.7(\%)$, $85.5(\%)$의 인식률을 얻었고, 이 음소들을 결합시킨 단음에서는 $72.1(\%)$의 인식률을 얻었다. 따라서, 이와 같은 방법을 이용하여 한국어 단음을 작은 데이터 양으로 처리 시간을 단축시킬 수 있고, 더 나아가 한국어의 모든 단음, 단어, 문장 둥을 인식할 수 있다.

  • PDF

차원별 Eigenvoice와 화자적응 모드 선택에 기반한 고속화자적응 성능 향상 (Performance Improvement of Fast Speaker Adaptation Based on Dimensional Eigenvoice and Adaptation Mode Selection)

  • 송화전;이윤근;김형순
    • 한국음향학회지
    • /
    • 제22권1호
    • /
    • pp.48-53
    • /
    • 2003
  • Eigenvoice 방법은 고속화자적응에 적합하다고 알려져 있지만, 이 방법은 발화수가 증가하더라도 추가적인 인식성능향상이 이루어지지 않는 단점이 있다. 본 논문에서는 이 문제를 해결하기 위해 음성 특징벡터의 차원별로 eigenvoice의 가중치를 구하여 적응시키는 방법과 또한 적응 데이터 수에 따라 높은 인식률을 얻는 적응 방식을 선택하는 방식을 제안한다. 화자독립모델 및 eigenvoice들을 구성하기 위해 POW (Phonetically Optimized Words)데이터베이스를 사용하였으며, PBW(Phonetically Balanced Words) 452단어 중50개까지 발화 수를 변화시키면서 교사방식 (Supervised mode)로 적응에 사용하고 나머지 중 400개를 인식실험에 사용하였다. 차원별 eigenvoice 방법이 발화수가 증가함에 따라 기존의 eigenvoice 나 MLLR 방법보다 높은 성능을 보였으며, eigenvoice와 차원별 eigenvoice방법 사이의 적응 모드 선택을 통해 기존의 eigenvoice 방식에 비해 최고 26%의 단어 오인식률 감소를 얻었다.

발화 내 감정의 정밀한 인식을 위한 한국어 문미억양의 활용 (Utilizing Korean Ending Boundary Tones for Accurately Recognizing Emotions in Utterances)

  • 장인창;이태승;박미경;김태수;장동식
    • 한국통신학회논문지
    • /
    • 제30권6C호
    • /
    • pp.505-511
    • /
    • 2005
  • 인간을 상대하는 자율장치는 고객의 자발적인 협조를 얻기 위해 암시적인 신호에 포함된 감정과 태도를 인지할 수 있어야 한다. 인간에게 음성은 가장 쉽고 자연스럽게 정보를 교환할 수 있는 수단이다. 지금까지 감정과 태도를 이해할 수 있는 자동시스템은 발성문장의 피치와 에너지에 기반한 특징을 활용하였다. 이와 같은 기존의 감정인식 시스템의 성능은 문장의 특정한 억양구간이 감정과 태도와 관련을 갖는다는 언어학적 지식의 활용으로 보다 높은 향상이 가능하다. 본 논문에서는 한국어 문미억양에 대한 언어학적 지식을 피치기반 특징과 다층신경망을 활용하여 구현한 자동시스템에 적용하여 감정인식률을 향상시킨다. 한국어 감정음성 데이터베이스를 대상으로 실험을 실시한 결과 $4\%$의 인식률 향상을 확인하였다.

한국어 고립단어인식을 위한 고속 알고리즘 (Fast Algorithm for Recognition of Korean Isolated Words)

  • 남명우;박규홍;정상국;노승용
    • 한국음향학회지
    • /
    • 제20권1호
    • /
    • pp.50-55
    • /
    • 2001
  • 본 논문에서는 청각모델을 이용하여 음성신호로부터 추출한 특징벡터를 2차원 DCT (discrete cosine transform)방법을 사용하여 가공한 후, 새로운 거리측정 방법에 적용하여 한국어 고립단어 인식 실험을 행하였다. 고립단어 인식은 기존에 많은 방법들이 제안되어졌으나, 본 논문에서 제안한 방법은 고립단어 인식을 위한 특징 파라미터로 2차원 DCT 계수를 사용한 것으로 구현이 간단하며, 간단한 계산식으로 인하여 빠른 인식 시간을 가지는 장점이 있다. 제안한 방식의 타당성 검토를 위하여, 고립단어 인식에서 좋은 인식결과를 나타내는 DTW (Dynamic Time Warping)방법을 사용하여 인식률을 비교하였다[5][6]. 실험결과 제안한 방식은 DTW를 사용한 인식방법에 비하여 화자종속 고립단어 인식에서는 거의 유사한 인식결과를, 화자독립 고립단어 인식에서는 더 높은 인식결과를 얻을 수 있었다. 또한, DTW에 비해 패턴비교를 위한 계산시간에 있어서는 200배 이상의 감소효과를 볼 수 있었다. 제안된 방법은 비교 방법에 비하여 잡음환경에서도 강한 특성을 보였다.

  • PDF

3축 가속도센서 및 음성인식 모듈을 이용한 마우스 포인팅 시스템의 구현 (A embodiment of mouse pointing system using 3-axis accelerometer and sound-recognition module)

  • 이승준;신동환;아피프;김주웅;박진우;엄기환
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2010년도 춘계학술대회
    • /
    • pp.934-937
    • /
    • 2010
  • 본 논문에서는 물리적 스위치 방식의 인터페이스를 사용하기 불편한 장애우나 전자기기 사용에 익숙하지 못한 사람들을 위한 차세대 인터페이스를 구현하기 위해 음성인식과 3축 가속도센서를 헤드셋과 연동하여 새로운 마우스 포인팅 시스템을 구현하였다. 인식률이 상대적으로 높은 화자종속방식을 지원하고 그 음성신호를 인식해서 BCD 코드로 출력을 내는 음성인식 모듈을 헤드셋의 마이크의 출력부와 연결하여 사용하였으며, TMS320F2812 프로세서를 사용한 컨트롤러를 구축하여 3축 가속도 센서와 연동한 후 헤드셋의 머리윗부분에 장착하여 비주얼 베이직을 통해 헤드셋으로 마우스 포인팅 및 클릭이 가능한 시스템을 구현하였다.

  • PDF