• 제목/요약/키워드: 원거리 음성

검색결과 56건 처리시간 0.03초

한국어 원거리 음성의 운율적 특성 (Prosodic Characteristics of Korean Distant Speech)

  • 김선희;김종진;이숙향
    • 한국음향학회지
    • /
    • 제25권3호
    • /
    • pp.137-143
    • /
    • 2006
  • 본 논문의 목적은 한국어 원거리 음성의 운율적 특성을 규명하는 것으로, 36개의 2음절어를 4명의 화자 (여성 화자 2명, 남성 화자 2명)가 원거리 환경과 일반환경에서 발화한 총 288개의 2음절어를 분석대상으로 하였다. 실험 결과 지속시간과 에너지의 경우는 일반 음성에 비하여 원거리 음성의 첫음절에 대한 둘째음절의 비율이 유의미하게 큰 것으로 나타났다. F0 대역폭의 경우에도 원거리 음성에서의 대역폭이 평이 음성에 비해 큰 값을 보였다. 억양 패턴에 있어서는 원거리 음성의 경우에 둘째음절에 'HL%'의 복합 경계성조가 실현되거나 첫음절에 'L+H' 성조가 실현되기도 하였으며 이 두 가지가 한 단어에 모두 실현되는 경우도 있었다.

다채널 마이크 환경에서 Naive Bayesian Network의 Decision에 의한 음성인식 성능향상 (Performance Improvement in Distant-Talking Speech Recognition by an Integration of N-best results using Naive Bayesian Network)

  • 지미경;김희린
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2005년도 추계 학술대회 발표논문집
    • /
    • pp.151-154
    • /
    • 2005
  • 원거리 음성인식에서 인식률의 성능향상을 위해 필수적인 다채널 마이크 환경에서 방 안의 도처에 분산되어있는 원거리 마이크를 사용하여 TV, 조명 등의 주변 환경을 음성으로 제어하고자 한다. 이를 위해 각 채널의 인식결과를 통합하여 최적의 결과를 얻고자 채널의N-best 결과와 N-best 결과에 포함된 hypothesis의 frame-normalized likelihood 값을 사용하여 Bayesian network을 훈련하고 인식결과를 통합하여 최선의 결과를 decision 하는데 사용함으로써 원거리 음성인식의 성능을 향상시키고 또한 hands-free 응용을 현실화하기위한 방향을 제시한다.

  • PDF

전화기를 이용한 원격제어기 설계 (Remote Controller Design Using Telephone)

  • 임석구
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2006년도 춘계학술발표논문집
    • /
    • pp.446-448
    • /
    • 2006
  • 근래에 이르러 시설농가, 농수산물 건조기, 저온 저장고, 양어장, 보일러, 심야전기기계장치 등의 사용이 증가하였지만 이를 관리하기 위한 인력은 항시 관련 장비의 근거리에 위치하였다. 그러나 관련 장비를 관리하기 위한 인력이 원거리에 있는 경우 장비의 이상 유무를 수시로 확인 할 수 없어서 장비의 고장이 발생하여도 적절한 조치를 취하지 못하여 커다란 손실을 입는다. 이러한 관점에서 장비에 이상이 발생하였을 때 이를 감지하여 원거리에 있는 관리자의 전화기에 자동 연결하여 녹음된 음성 메시지를 신속히 알려 적절히 대처할 수 있는 제어기 개발에 대한 연구를 수행하였다. 본 논문에서는 농업용 온실 및 기계장치에서 이상 발생 시 휴대전화를 이용하여 사용자에게 음성으로 자동 통보하는 시스템을 개발하여 시스템은 미리 지정된 전화번호로 통보를 하여 사용자가 정상적으로 인지하였는가를 인식할 수 있는 기능을 갖고 있다. 또한 미리 저장된 여러 개의 전화번호를 시스템에서 직접 Dialing 해주는 기능을 갖고 있으며, 음성합성 기능을 적용하여 온도와 이상 상태들을 음성으로 통보해 주는 기능도 갖고 있다. 또한 사용자가 원격지에서 전화를 이용하여 원격제어를 할 수 있는 기능도 갖추고 있으며, 이를 확인할 수 있는 기능을 갖는 시스템을 개발하였다.

  • PDF

원거리 음성 인식을 위한 효율적인 에코제거 시스템 (Efficient Acoustic Echo Cancellation System for Distant-Talking Automatic Speech Recognition)

  • 김기범;김상윤;이우정;권민석;고병섭
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 2014년도 추계학술대회 논문집
    • /
    • pp.150-155
    • /
    • 2014
  • 본 논문에서는, 원거리 음성인식을 위한 서브밴드 필터링 기반의 빠르고 효율적인 에코제거 시스템을 제안한다. 제안하는 에코제거 시스템은 우선 채널간 유사도 (correlation) 가 높을 경우 적응필터가 오작동하는 것을 방지하기 위해 spatial decorrelation 을 적용하게 된다. 그리고 tree 형태를 가지는 IIR filterbank 기반의 subband 구조를 채택함으로써, 적은 차수로도 효과적인 analysis, synthesis 필터링을 수행할 수 있도록 한다. 이 과정에서 불가피하게 발생하는 서브 밴드간 spectral aliasing은 notch filter를 적용해 해결할 수 있다. 또한 적응 필터로는 improved proportionate normalized least-mean-square (IP-NLMS) 알고리즘을 사용해 수렴속도 및 에코제거 성능에서 우수함을 확인하였다. 마지막으로 decision-directed estimation 기반의 residual echo suppressor를 적용해 잔여 에코를 제거하게 된다. 본 논문에서는 각 단계를 구성하게 된 이론적인 배경을 소개하고, 실제 에코가 존재하는 환경에서 ERLE, 원거리 음성 인식률, computational complexity를 통해 제안하는 에코제거 시스템의 효과를 입증하도록 한다.

  • PDF

스테레오 음향 반향 제거를 위한 적응 알고리즘 (A New Adaptive Algorithm for Stereophonic Acoustic Echo Cancellation)

  • 정양원;이지하;박영철;윤대희
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.11-14
    • /
    • 2000
  • 현장감 있는 원거리 회의를 위해서는 두 채널 이상의 신호를 전송하는 스테레오 시스템이 필요하다. 이러한 원거리 회의 시스템의 경우 스피커와 마이크로폰간의 커플링에 의해 발생하는 음향 반향을 제거하기 위해 스테레오 음향 반향 제거기가 요구된다. 본 논문에서는 스테레오 음향 반향제거기의 성능을 효과적으로 개선하기 위하여 인간의 청각 특성과 음성 신호 특성을 이용한 전처리단을 제안한다 제안한 전처리단은 마스킹 현상을 이용하여 청각적으로 인지할 수 없는 크기의 부가 잡음을 음성 신호 분석을 통해 발생시켜 원 신호에 더해줌으로 두 채널 신호의 상호 상관 관계를 낮추어 준다. 또한 본 논문에서는 적응 반향 제거 알고리즘인 Affine Projection(AP) 알고리즘이 Cram-Schmidt(GS) 직교화 과정을 통한 벡터 연산으로 갱신될 수 있음을 이용하여, 별도의 음성 분석 과정 없이 AP알고리즘의 GS 직교화단으로 제안한 전처리단을 구현할 수 있음을 보이고, 최종적으로 전처리단과 적응 알고리즘이 결합된 스테레오 음향반향 제거를 위한 적응 알고리즘을 제안한다.

  • PDF

휴머노이드 로봇을 위한 원거리 음성 인터페이스 기술 연구 (Distant-talking of Speech Interface for Humanoid Robots)

  • 이협우;육동석
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2007년도 한국음성과학회 공동학술대회 발표논문집
    • /
    • pp.39-40
    • /
    • 2007
  • For efficient interaction between human and robots, speech interface is a core problem especially in noisy and reverberant conditions. This paper analyzes main issues of spoken language interface for humanoid robots, such as sound source localization, voice activity detection, and speaker recognition.

  • PDF

가산 잡음 또는 반향 환경에 강인한 음성인식을 위한 은닉 마르코프 모델 기반 특징 향상 방법

  • 조지원;박형민
    • 정보와 통신
    • /
    • 제33권9호
    • /
    • pp.17-23
    • /
    • 2016
  • 실세계 환경의 원거리에서 녹음된 음성은 가산 잡음이나 반향 성분으로 왜곡되기 때문에 음성인식 성능이 현저히 떨어진다. 따라서 음성 전처리 과정은 실세계 환경에서 강인한 음성인식을 위한 필수과정이다. 모델 기반 특징 향상 방법은 전처리 방법 중 하나로 특징 영역 데이터의 적절한 동적 범위(dynamic range)와 차원 수로 인하여 실시간 처리가 가능하고 깨끗한 음성의 선험적 정보를 모델링하기에 용이하다. 또, 인식을 위한 최종 특징 입력에 가까운 단계에서 데이터를 처리하므로 인식에 밀접한 영향을 준다는 장점이 있다. 그러나 대략적인 왜곡 요인 관련 파라미터 추정 때문에 음성인식 성능이 하락되는 단점이 있다. 최근에 기존 모델 기반 특징 향상의 단점을 개선하여 가산 잡음이나 반향 환경에 적합한 방법이 제안되었다. 이글에서는 특징 향상 방법을 소개하고 개선된 방법의 음성인식 강인성을 알아보고자 한다.

음성의 유성음 특성을 이용한 음성/비음성 판별 방법 (A Robust Speech/Non-Speech Decision Using Voiced Characteristics of Speech)

  • 이성주;정호영;이윤근;김형순
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.411-412
    • /
    • 2007
  • 자동음성인식 시스템을 이용하는 사용자 입장에서 보면 음성인식시스템을 사용하기 위하여 음성을 입력할 때마다 버튼을 눌러야 하는 Push-To-Talk (PTT) 방식은 여간 번거로운 일이 아닐 수 없다. 그리고 사용자가 원거리에서 음성을 입력하는 경우처럼 PTT 방식 자체가 용이하지 못 한 음성인식 응용분야에서는 Non-Push-To-Talk (NON-PTT) 방식의 필요성이 대두되게 된다. NON-PTT 방식의 음성 전처리를 위해서는 입력신호로부터 음성신호만을 구분해내는 음성판별기술이 필수적이다. 하지만 일상적인 잡음환경에서 음성신호만을 구분해내는 일은 매우 어려운 일이 아닐 수 없다. 본 논문에서는 일상적인 가정잡음환경에 강인한 음성판별방식을 제안한다. 여기서는 음성판별을 위해서 음성의 유성음 특성을 이용하였다. 즉, 일정구간 이상의 음성신호에는 일정구간이상의 유성음 구간이 존재하며 만약 잡음환경에서도 유성음 구간을 잘 검출할 수 있다면 이러한 음성의 특성을 이용하여 검출된 신호가 음성인지 아닌지를 판별할 수 있다. 이를 위하여 여기서는 가정잡음환경에서도 유성음을 잘 검출할 수 있도록 11 가지 유성음 특징들과 이를 이용한 음성판별방법을 제안하였다. 제안된 방법의 성능 평가를 위하여 음성의 끝점검출방법과 통합하여 음성/비음성 판별 테스트를 수행하였으며 테스트 수행결과 열악한 잡음환경에서 80%이상의 비음성을 거절하는 성능을 보였다.

  • PDF

가정용 로봇의 호출음 등록 및 인식 시스템 (A Name Recognition Based Call-and-Come Service for Home Robots)

  • 오유리;윤재삼;박지훈;김민아;김홍국;공동건;명현;방석원
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 1부
    • /
    • pp.360-365
    • /
    • 2008
  • 본 논문에서는 Call-and-Come 서비스를 제공하는 가정용 로봇의 호출음 등록 및 인식 시스템 구축하고, 음성 기반의 효율적인 로봇 호출음 등록 및 인식 알고리즘을 제안한다. 본 논문에서는 음성을 이용하여 로봇 호출음을 효율적으로 등록하기 위해 monophone 음향모델을 이용하여 탐색 범위를 줄이고, 줄어든 탐색 범위 내에서 triphone 음향모델을 이용하여 호출음을 등록을 한다. 또한, 잘못된 호출이 인식되는 것을 줄이기 위한 발화 검증에 필요한 피라미터를 구한다. 원거리 음성인식률을 향상시키기 위해서 근거리 음성에 최적화된 음향모델을 원거리 음성 데이터베이스로 적응시켰으며, 마이크로폰 배열을 이용하여 사용자의 위치를 추정한다. 제안한 시스템의 성능 측정을 위해 수행된 로봇 호출음에 대한 등록 및 인식 실험에서 98.3%의 음성 인식률을 얻었다.

  • PDF