• 제목/요약/키워드: Simulation speech

검색결과 299건 처리시간 0.028초

Modulated Lapped Transform 영역에서 적응 필터링을 이용한 음향 반향 제거기의 구현 (An Implementation of Acoustic Echo Canceller Using Adaptive Filtering in Modulated Lapped Transform Domain)

  • 백수진;박규식
    • 한국음향학회지
    • /
    • 제22권6호
    • /
    • pp.425-433
    • /
    • 2003
  • 음향 반향 제거기 (Acoustic Echo Canceller: AEC)는 원거리 회의 시스템이나 차량 내 핸즈프리 통화 등에서 필연적으로 발생하는 반향을 제거하기 위해 이용된다. 이러한 반향을 제거하기 위해 다양한 적응 필터링 알고리즘이 제안되었으며 LMS(Least Mean Square) 알고리즘은 다른 알고리즘에 비해 매우 단순하고, 비교적 강인하여 많은 응용 분야에 사용되고 있다. 그러나 LMS 알고리즘은 음성과 같은 상관도가 높은 유색 신호에 대해 음향반향 제거기의 수렴 속도를 저하시켜 전체적인 음향 반향 제거 성능을 떨어뜨리게 한다. 이를 보완하기 위하여 DCT나 DFT 등의 직교 변환 행렬을 이용하여 입력신호의 상관성을 저하시킨 후 LMS 적응 필터링 알고리즘을 적용하는 변환 영역 음향 반향 제거 알고리즘 등이 제안되었다. 본 논문에서는 MLT (Modulated Lapped Transform) 직교 변환행렬을 이용한 MLT영역의 적응음향반향 제거 알고리즘을 제안한다. 제안된 알고리즘은 기존의 NXN DCT, DFT, Hadamad등의 정방 행렬 대신에 2NXN 크기의 MLT 변환 행렬을 사용함으로서 유색 입력 신호에 대해 효과적인 상관성 저하와 빠른 수렴 속도를 달성할 수 있었으며 실제 음향 반향 제거 시스템에 적용하여 그 성능을 비교 입증하도록 하였다. 합성 음성신호와 실제 음성 신호를 이용한 모의 실험 결과 제안된 MLT 영역 음향 반향 제거 시스템은 기존의 DCT 변환 영역 음향 반향 시스템에 비해 약 2배 이상의 빠른 수렴속도와 약 20∼30 ㏈ 정도의 ERLE (Echo Return Loss Enhacement) 향상을 얻을 수 있었다

근접센서를 이용한 수중 표적 정보 추정기법 (Underwater Target Information Estimation using Proximity Sensor)

  • 김정훈;윤경식;서익수;이균경
    • 전자공학회논문지
    • /
    • 제52권5호
    • /
    • pp.174-180
    • /
    • 2015
  • 본 논문은 근접센서를 이용하여 수중 표적의 정보를 추정하는 수동소나 신호처리 기법을 제안한다. 이 기법은 수중 센서망을 구성하는 단일 센서에서 수행되며 계층적 신호처리 구조를 가진다. 이를 통해 추정되는 표적 정보는 표적의 속도, 깊이, CPA 상황에서의 거리와 방위각이며 계층적 신호처리 구조를 가짐으로써 신호처리 기법의 정확도를 향상시킬 수 있다. 제안하는 기법의 성능을 검증하기 위해 모의실험을 수행하였고 이를 통해 최대 탐지거리 내에서 최대 20%의 오차를 가짐을 확인하였다. 또한 해상실험을 통해 실제 해상환경에서 신뢰성을 가지는지 확인하였다.

확률적 비음수 행렬 인수분해를 사용한 통계적 음성검출기법 (Statistical Voice Activity Detection Using Probabilistic Non-Negative Matrix Factorization)

  • 김동국;신종원;권기수;김남수
    • 한국통신학회논문지
    • /
    • 제41권8호
    • /
    • pp.851-858
    • /
    • 2016
  • 본 논문은 비음수 행렬 인수분해(NMF)의 확률적 해석에 근거한 새로운 통계적 음성검출기법을 제안한다. NMF의 기저와 부호화 행렬들이 주어졌을 때, 데이터 행렬의 분포를 Poisson 분포로 가정한 로그 우도는 Kullback-Leibler 발산을 이용한 NMF의 목적 함수와 일치한다. 이러한 NMF의 확률모델에 근거하여 음성검출을 위해 DFT영역에서 잡음과 음성의 크기 스펙트럼을 Poisson 분포로 모델링하여 새로운 우도비 검출 규칙을 유도한다. 실험 결과를 통해 제안된 기법이 0-15dB 신호 대 잡음비의 시뮬레이션 환경에서 기존 Gaussian과 NMF을 사용한 기법보다 향상된 음성검출 결과를 보여준다.

HMM에 의한 원형 마이크로폰 어레이 적용 드론 위치 추적 (Drone Location Tracking with Circular Microphone Array by HMM)

  • 정형찬;임원호;곽준봉;이시티아크 아메드;장경희
    • 한국항행학회논문지
    • /
    • 제24권5호
    • /
    • pp.393-407
    • /
    • 2020
  • 불법 무인기에 의한 위협을 줄이기 위해, 음향 기반 기법에 의한 추적시스템을 구현하였다. 드론 음향 추적 방식에는 3가지 주요 사항이 있다. 첫째, 가변 빔 형성을 통해 공간을 스캔하여 음원을 찾아 마이크 어레이를 사용하여 소리를 녹음한다. 둘째, 음원의 존재 유·무 여부를 알기 위해 은닉 마르코프 모델(HMM)로 분류한다. 마지막으로 음원이 드론인 경우, 적응형 빔 패턴을 기반의 추적기준 신호로 기록 및 저장된 음원을 사용한다. 시뮬레이션은 배경 노이즈 및 간섭 사운드가 없는 이상적인 상태와 배경 노이즈 및 간섭 사운드가 있는 비이상적인 조건 모두에서 수행되며 불법적인 드론의 추적 성능을 평가하였다. 드론 추적 시스템은 마이크 어레이 성능에 따른 탐색 거리 성능향상 및 음향 패턴 일치 정도에 따른 드론 유무 판정 기준을 설계하여 음성판독 회로설계에 반영하였다.

독립적인 센서쌍 배열에 기반한 음원 위치추정 기법 (Source Localization Based on Independent Doublet Array)

  • 최영두;이호진;윤경식;이균경
    • 전자공학회논문지
    • /
    • 제51권10호
    • /
    • pp.164-170
    • /
    • 2014
  • 본 논문에서는 독립적인 센서쌍 배열(Doublet Array)을 이용하여 근거리 단일 음원의 방위와 거리를 추정하는 기법을 제안한다. 일반적인 방위각 추정 기법의 경우 주로 선형 배열 (Uniform Linear Array) 혹은 환영 배열 (Uniform Ciucular Array) 등을 이용하나 배열 구조상 근거리 음원의 거리를 추정하기 위한 개구간(Aperture)을 확보하는데 제약이 있다. 최근 독립적인 센서쌍 배열을 이용하여 넓은 개구간으로 근거리 단일 음원의 방위와 거리를 추정하는 기법이 제안되었으나 센서쌍이 직선상에 위치하는 경우로 제한되어 있다. 본 논문에서는 이를 일반화 하여 다양한 배열 구조에서도 근거리 음원의 위치를 추정하고자 한다. 제안된 알고리즘은 시뮬레이션을 통해 성능을 검증하였다.

Developing an Embedded Method to Recognize Human Pilot Intentions In an Intelligent Cockpit Aids for the Pilot Decision Support System

  • 차우창
    • 대한인간공학회지
    • /
    • 제17권3호
    • /
    • pp.23-39
    • /
    • 1998
  • Several recent aircraft accidents occurred due to goal conflicts between human and machine actors. To facilitate the management of the cockpit activities considering these observations. a computational aid. the Agenda Manager (AM) has been developed for use in simulated cockpit environments. It is important to know pilot intentions performing cockpit operations accurately to improve AM performance. Without accurate knowledge of pilot goals or intentions, the information from AM may lead to the wrong direction to the pilot who is using the information. To provide a reliable flight simulation environment regarding goal conflicts. a pilot goal communication method (GCM) was developed to facilitate accurate recognition of pilot goals. Embedded within AM, the GCM was used to recognize pilot goals and to declare them to the AM. Two approaches to the recognition of pilots goals were considered: (1) The use of an Automatic Speech Recognition (ASR) system to recognize overtly or explicitly declared pilot goals. and (2) inference of covertly or implicitly declared pilot goals via the use of an intent inferencing mechanism. The integrated mode of these two methods could overcome the covert goal mis-understanding by use of overt GCM. And also could it overcome workload concern with overt mode by the use of covert GCM. Through simulated flight environment experimentation with real pilot subjects, the proposed GCM has demonstrated its capability to recognize pilot intentions with a certain degree of accuracy and to handle incorrectly declared goals. and was validated in terms of subjective workload and pilot flight control performance. The GCM communicating pilot goals were implemented within the AM to provide a rich environment for the study of human-machine interactions in the supervisory control of complex dynamic systems.

  • PDF

시청각 코퍼스 기반의 립싱크 알고리듬 개발 (Development of a Lipsync Algorithm Based on Audio-visual Corpus)

  • 김진영;하영민;이화숙
    • 한국음향학회지
    • /
    • 제20권3호
    • /
    • pp.63-69
    • /
    • 2001
  • 본 논문에서는 자연스러운 얼굴 합성을 위한 코퍼스 기반의 립싱크 알고리듬을 제안한다. 립싱크 알고리듬을 개발하기 위하여 여성 아나운서의 시청각 코퍼스를 구축하였다 코퍼스 구축시, 입술파라미터 추출하기 위하여 여성화자의 얼굴에 스티커를 붙이고, 이의 위치를 영상처리기법에 의하여 얻었다. 그리고 길이, 세기 그리고 피치의 운율정보를 얻기 위하여 음성을 HTK (hidden Markov tool kit)를 사용하여 레이블 하였다. 립싱크의 기본단위로는 자음-모음-자음의 음절단위를 사용하였는데, 구축된 시청각 코퍼스는 입술의 정보 그리고 음운론적, 운율적 정보를 포함하는 음절들로 구성된다. 입술합성시에는 입력된 텍스트로부터 음절의 열을 만들고 각 음절에 적절한 대표들을 코퍼스로부터 N개씩 선정후, 최적의 열은 비터비탐색을 통하여 얻었다. 이를 위하여 음운론적 거리와 운율거리 함수가 정하였다. 컴퓨터 모의실험결과 제안된 알고리듬이 좋은 성능을 보임을 확인할 수 있었으며, 특히 립싱크에서는 길이정보뿐 아니라 길이와 피치의 정보도 유용함을 밝혔다.

  • PDF

동적 세그멘테이션을 이용한 폴리포닉 오디오 신호의 정현파 모델링 (Sinusoidal Modeling of Polyphonic Audio Signals Using Dynamic Segmentation Method)

  • 장호근;박주성
    • 한국음향학회지
    • /
    • 제19권4호
    • /
    • pp.58-68
    • /
    • 2000
  • 본 논문에서는 폴리포닉 오디오 신호에 대한 정현파 모델링 방법을 제안한다. 정현화 모델링을 폴리포닉 오디오 신호에 적용하는데 있어서 가장 큰 문제점은 스펙트럼 분석을 위한 분석 윈도우의 크기를 결정할 수 없다는 것이다. 또한 고음질의 합성음을 위해서는 악기음의 특성을 결정짓는 어택이 잘 보존되어야 한다. 본 논문에서는 입력 신호를 6개의 옥타브 벤드 구조의 다중 해상도 필터 뱅크를 통과시키고, 각 서브벤드 신호에 대해 서로 다른 크기의 분석 윈도우를 적용시킴으로써 폴리포닉 오디오 신호에 대한 분석 윈도우 크기 결정 문제를 해결한다. 정현파 모델링에서 발생하는 어택과 같은 천이 구간에서의 퍼짐 현상을 개선하기 위해 각 서브밴드 신호에 동적 세그맨테이션 방법을 적용하여 천이 구간 근처에서는 분석과 합성 프레임 크기를 작게 하는 방법을 사용한다. 이 방법을 통해 서브밴드 신호의 구간별 시간-주파수 특성에 따라 적절한 크기의 윈도우를 선택할 수 있다. 동적 세그멘테이션 방법으로는 기존의 방법보다 계산량과 성능 면에서 더 나은 특성을 보이는 방법을 제안한다. 여러가지 폴리포닉 오디오 신호에 대한 시뮬레이션 결과 제안한 정현파 모델링 방법이 음질의 손상 없이 원래 신호를 잘 복원할 수 있음을 확인하였다.

  • PDF

최근 우리나라 e-Learning 시장의 주요 동향 및 향후 전망 (Some Problems of e-Learning Market in Korea)

  • 윤영한
    • 통상정보연구
    • /
    • 제9권2호
    • /
    • pp.103-120
    • /
    • 2007
  • The knowledge based economy requires more and more people to learn new knowledge and skills in a timely and effective manner. These needs and new technology such as computer and Internet are fueling a transition in e-learning. According to specialist's opinion, imagination experience studying is generalized, and learning environment that language barrier by studying, multi-language studying Machine that experience past things that disappear through simulation, and travel area, and experience future changed state disappears is forecasting to come. This is previewing finally that it may become future education that education and IT, element of entertainment is combined. Already, became story that argument for party satellite of e-Learning existence passes one season already. e-Learning is utilized already in all educations that we touch by effectiveness by corporation's competitive power improvement and implement of lifelong education in educational institutions through present e-Learning. It is obvious that when see from our viewpoint which is defining e-Learning by one industry and rear by application to education as well as one new growth power about these, e-Learning industry becomes very important means that can solve dilemma of growth real form. Only, special quality of digital industry that e-Learning is being same with other digital industry and repeat putting out a fire rapidly, and is repeating sudden change that these evolution is not gradual growth of accumulation and improvement of technology that is appearing consider need to. In the meantime, we need to observe about evolution of Information Technology. Because there is some scholars who e-Learning's concept foresees to evolve by u-Learning.(although, a person who see that these concept is not more in marketing terminology by some scholars' opinion is). This u-Learning's concept means e-Learning that take advantage of ubiquitous technology as Ubiquitous-Learning's curtailment speech. Ubiquitous, user means Information-Communication surrounding that can connect to network freely regardless of place without feeling network or computer. There is controversy about introduction time regarding these direction, but e-Learning is judged to evolve by u-Learning necessarily. Because keep in step and age that study all contents that learner wants under environment of 3A (any time, any whrer, any device) by individual order thoroughly is foreseen to come in ubiquitous learning environment that approach more festinately.

  • PDF

M-채널 서브밴드 QMF 필터뱅크를 이용한 웨이브릿변환기반 적응 음향반향제거기 (An Adaptive AEC Based on the Wavelet Transform Using M-channel Subband QMF Filter Banks)

  • 안주원;권기룡;문광석;김문수
    • 한국멀티미디어학회논문지
    • /
    • 제3권4호
    • /
    • pp.347-355
    • /
    • 2000
  • 본 논문에서는 M-채널 서브밴드 QMF 필터 뱅크를 이용한 웨이브릿 변환기반 적응 음향반향제거기를 제안한다. 제안한 적응 음향반향제거기는 웨이브릿변환 필터뱅크의 적은 계산량, 서브밴드 처리 및 웨이브릿 서브밴드 필터의 직교성에 의해 정상상태 성능을 향상시키고, 실시간 처리가 가능하도록 구현한다. 각 서브밴드에서 적응필터의 계수적응을 위한 알고리듬으로는 실시간 반향제거와 하드웨어 구현시 비용감소를 위하여 계산량이 적고 구현이 간단한 LMS 적응 알고리듬을 사용한다. 제안한 적응 음향반향제거기의 성능평가를 위한 실험으로서 백색 가우시안 잡음 및 주변잡음을 포함한 실제의 음성신호를 입력신호로 반향제거 기에 인가하여 반향성능을 평가하였다. 실험 결과로서 제안한 음향반향제거기는 웨이브릿 완전복원 필터뱅크에 의해 수렴후 점근적 에러가 적고, 적은 계산량을 요구하며 안정한 수렴성능을 나타내었다.

  • PDF