• 제목/요약/키워드: 음향 신호 생성

검색결과 136건 처리시간 0.023초

다중 주파수 재생을 위한 광대역 수중 음향 신호 증폭기 설계 연구 (A study on wideband underwater acoustic signal amplifier design for generating multi-frequency)

  • 이동훈;유승진;김형문;김형남
    • 한국음향학회지
    • /
    • 제36권3호
    • /
    • pp.179-185
    • /
    • 2017
  • 본 논문에서는 수중에서 운용하는 임베디드 능동 음향탐지 시스템에 적용하기 위한 광대역 송신 전력 증폭기 설계/제작/시험 과정에서 발생된 문제를 분석하고 해결방안을 제시한다. 최근 수중음향 분야에서도 탐지 성능을 향상시키기 위해 광대역 소나(Sound Navigation and Ranging, SONAR) 신호처리 연구가 진행되고 있으며 이를 위한 광대역 수중음향 송수신 장치 개발이 이루어지고 있다. 본 논문에서는 임베디드 시스템 특성상 복잡하지 않고 구현이 간단한 2 레벨 톱니파 형태의 Class D 급 PWM(Pulse Width Modulation) 신호 생성 방식을 사용하여 광대역 수중음향 신호를 생성한 이후에, 송신 증폭기를 통하여 다양한 형태의 송신 파형을 재생하고 수중에서 실험을 하는 과정에서 두가지 이상의 주파수를 가진 소나 신호를 동시에 재생한 경우, 원신호에 두 신호의 주파수 차의 정수배만큼 더해진 기생 주파수가 나타나는 현상이 발생하여 원하지 않은 송신 음원이 재생되는 문제가 있음을 발견하였다. 이러한 문제점의 원인을 분석하기 위해 MATLAB 및 Simulink를 이용하여 송신 하드웨어 및 PWM 제어 과정을 모델링하고 시뮬레이션 하였으며, 시뮬레이션을 통해 문제점을 재현하고 해결방안을 제시한다.

향상된 음향 신호 기반의 음향 이벤트 분류 (Enhanced Sound Signal Based Sound-Event Classification)

  • 최용주;이종욱;박대희;정용화
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권5호
    • /
    • pp.193-204
    • /
    • 2019
  • 센서 기술과 컴퓨팅 성능의 향상으로 인한 데이터의 폭증은 산업 현장의 상황을 분석하기 위한 토대가 되었으며, 이와 같은 데이터를 기반으로 현장에서 발생하는 다양한 이벤트를 탐지 및 분류하려는 시도들이 최근 증가하고 있다. 특히 음향 센서는 상대적으로 저가의 가격으로 현장 정보를 왜곡 없이 음향 신호를 수집할 수 있다는 큰 장점을 기반으로 다양한 분야에 설치되고 있다. 그러나 소리 취득 시 발생하는 잡음을 효과적으로 제어하지 못한다면 산업 현장의 이벤트를 안정적으로 분류할 수 없으며, 분류하지 못한 이벤트가 이상 상황이라면 이로 인한 피해는 막대해질 수 있다. 본 연구에서는 잡음 상황에서도 강인한 시스템을 보장하기 위하여, 딥러닝 알고리즘을 기반으로 잡음의 영향을 개선 시킨 음향 신호를 생성한 후, 해당 음향 이벤트를 분류할 수 있는 시스템을 제안한다. 특히, GAN을 기반으로 VAE 기술을 적용한 SEGAN을 활용하여 아날로그 음향 신호 자체에서 잡음이 제거된 신호를 생성하였으며, 향상된 음향 신호를 데이터 변환과정 없이 CNN 구조의 입력 데이터로 활용한 후 음향 이벤트에 대한 식별까지도 가능하도록 end-to-end 기반의 음향 이벤트 분류 시스템을 설계하였다. 산업 현장에서 취득한 음향 데이터를 활용하여 제안하는 시스템의 성능을 실험적으로 검증한바, 99.29%(철도산업)와 97.80%(축산업)의 안정적인 분류 성능을 확인하였다.

Pro-Audio 장비용 가변형 필터뱅크 기반 고품질 음향 DSP 시스템 개발을 위한 제안 (Proposal of High Quality Audio DSP System using Flexible Filterbank for Pro-Audio Equipment)

  • 송재종;양창모;임태범
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1450-1451
    • /
    • 2013
  • 본 논문에서는 음향 확성 환경과 음향신호의 입 출력 조건에 최적화된 음향 시스템을 실시간으로 생성 및 적용 가능한 음향 신호처리용 시스템으로서, 가변형 필터뱅크 기술 및 상황 적응적 필터 재조합 재배열 기술을 음향 신호처리용 DSP에 적용함으로서 Pro-Audio 장비, 방송 음향장비, 산업 음향장비와 같은 다양한 음향관련 장비에서 고품질 음향 서비스를 제공하기위한 핵심 기술인 가변형 필터뱅크 기반 고품질 음향 DSP 시스템 개발을 제안한다.

다중대역 여기신호를 이용한 음성의 규칙합성에 관한 연구 (A Study on the speech synthesis-by-rue system using Multiband Excitation signal)

  • 경연정
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1993년도 학술논문발표회 논문집 제12권 1호
    • /
    • pp.80-83
    • /
    • 1993
  • 본 논문에서는 양질의 규칙합성을 얻기 위하여, 유성음에 대한 여기신호로 임펄스 스펙트럼과 노이즈 스펙트럼을 다중대역으로 혼합하여 생성한 여기신호를 규칙합성에 적용하는 방법을 제안한다. 이 방법에서는, 분석합성에서 각 프레임별로 요구되었던 혼합여기신호에 대한 정보량 문제를 해결하기 위해 유성음의 정상부분의 한 프레임에 대해 혼합여기신호를 구하여 규칙합성에 적용하였고, 정보량을 더욱 줄이는 방안으로, 켑스트럼 유클리디안 거리를 이용하여 유성음을 분류하여, 각 그룹에 대한 대표 여기신호를 규칙합성의 여기신호로 사용하였다. 제안된 방법으로 음성을 합성한 결과 양질의 합성음을 얻을 수 있음을 확인하였다.

  • PDF

도플러 효과의 보상을 통한 시간지연 차의 추정 (Improved Time Delay Difference Estimation for Target Tracking using Doppler Information)

  • 염석원;윤동헌;윤동욱;고한석
    • 한국음향학회지
    • /
    • 제17권8호
    • /
    • pp.25-33
    • /
    • 1998
  • 본 논문에서는 한 쌍의 센서를 이용하여 미지의 수중 음향 신호의 시간지연의 차 (Time Delay Difference)를 추정하고 탐지하는 알고리즘을 다루고 있다. 전형적인 시간지연 차의 최적화 추정 기법은 두 신호의 상관관계(Cross Correlation)에 의한 ML(Maximum likelihood)추정으로 구할 수 있지만, 실제 수중 음향 환경 하에서 시간 지연뿐만 아니라 표 적의 이동에 의하여 발생하는 도플러 효과로 신호의 주파수도 변하게 된다. 이러한 신호 주 파수의 올바른 고려 없이 단순히 두 신호의 시간지연만을 추정하는 방법은 불가피한 에러를 생성하게 된다. 본 논문에서는 시시각각 변하는 시간지연의 차를 구하기 위한 준 최적화 기 법인 확률분포 함수의 Recursive Filter에 시간 지연 차와 도플러효과의 2차원 확률분포 함 수를 적용한 추정 알고리즘을 제안한다. 관측된 신호의 리샘플링(Resampling)을 통하여 도 플러 효과를 보상한 후 2차원 Conditional likelihood를 구하고 Projection과 Correction 과정 을 통하여 시간지연과 도플러 효과에 대한 사후확률을 구한다. 그리고 이러한 알고리즘을 가상 시나리오에 대한 모의실험을 통하여 평가한다.

  • PDF

생성적 적대 신경망을 이용한 음향 도플러 기반 무 음성 대화기술 (An acoustic Doppler-based silent speech interface technology using generative adversarial networks)

  • 이기승
    • 한국음향학회지
    • /
    • 제40권2호
    • /
    • pp.161-168
    • /
    • 2021
  • 본 논문에서는 발성하고 있는 입 주변에 40 kHz의 주파수를 갖는 초음파 신호를 방사하고 되돌아오는 신호의 도플러 변이를 검출하여 발성음을 합성하는 무 음성 대화기술을 제안하였다. 무음성 대화 기술에서는 비 음성 신호로 부터 추출된 특징변수와 해당 음성 신호의 파라메터 간 대응 규칙을 생성하고 이를 이용하여 음성신호를 합성하게 된다. 기존의 무 음성 대화기술에서는 추정된 음성 파라메터와 실제 음성 파라메터간의 오차가 최소화되도록 대응규칙을 생성한다. 본 연구에서는 추정 음성 파라메터가 실제 음성 파라메터의 분포와 유사하도록 생성적 적대 신경망을 도입하여 대응 규칙을 생성하도록 하였다. 60개 한국어 음성을 대상으로 한 실험에서 제안된 기법은 객관적, 주관적 지표상 으로 기존의 신경망 기반 기법보다 우수한 성능을 나타내었다.

보컬 피치 검출의 성능 향상을 위한 보컬 강화 기술 (Vocal Enhancement for Improving the Performance of Vocal Pitch Detection)

  • 이세원;송재종;이석필;박호종
    • 한국음향학회지
    • /
    • 제30권6호
    • /
    • pp.353-359
    • /
    • 2011
  • 본 논문에서는 다성 음악 신호의 보컬 피치 검출 성능을 향상시키기 위해 음악 신호의 보컬 신호를 강화시키는 전처리 기술을 제안한다. 제안한 보컬 강화 기술은 입력된 다성 음악 신호로부터 반주 신호를 예측하고, 예측된 반주 신호를 입력된 보컬 신호의 크기에 맞춰 가공하여 반주 복사본 신호를 생성한다. 마지막으로 주파수 영역에서 반주 복사본 신호를 원래 다성 음악 신호에서 제거하여 보컬이 강화된 출력 신호를 생성한다. 원 음악 신호와 제안한 방법으로 보컬이 강화된 신호에 동일한 보컬 피치 검출 방법을 각각 적용하여 피치 검출의 정확도를 측정하였고, 제안한 기술에 의하여 피치 검출 정확도가 평균 7.1 % 포인트 향상된 것을 확인하였다.

3-D 텐서와 recurrent neural network기반 심층신경망을 활용한 수동소나 다중 채널 신호분리 기술 개발 (Sources separation of passive sonar array signal using recurrent neural network-based deep neural network with 3-D tensor)

  • 이상헌;정동규;유재석
    • 한국음향학회지
    • /
    • 제42권4호
    • /
    • pp.357-363
    • /
    • 2023
  • 다양한 신호가 혼합된 수중 신호로부터 각각의 신호를 분리하는 기술은 오랫동안 연구되어왔지만, 낮은 품질의 수중 신호의 특성 상 쉽게 해결되지 않는 문제이다. 현재 주로 사용되는 방법은 Short-time Fourier transform을 사용하여 수신된 음향신호의 스펙트로그램을 얻은 뒤, 주파수의 특성을 분석하여 신호를 분리하는 기술이다. 하지만 매개변수의 최적화가 까다롭고, 스펙트로그램으로 변환하는 과정에서 위상 정보들이 손실되는 한계점이 지적되었다. 본 연구에서는 이러한 문제를 해결하기 위해 긴 시계열 신호 처리에서 좋은 성능을 보인 Dual-path Recurrent Neural Network을 기반으로, 다중 채널 센서로부터 생성된 입력신호인 3차원 텐서를 처리할 수 있도록 변형된 Tripple-path Recurrent Neural Network을 제안한다. 제안하는 기술은 먼저 다중 채널 입력 신호를 짧은 조각으로 분할하고 조각 내 신호 간, 구성된 조각간, 그리고 채널 신호 간의 각각의 관계를 고려한 3차원 텐서를 생성하여 로컬 및 글로벌 특성을 학습한다. 제안된 기법은, 기존 방법에 비해 개선된 Root Mean Square Error 값과 Scale Invariant Signal to Noise Ratio을 가짐을 확인하였다.

음성인식 성능 개선을 위한 다중작업 오토인코더와 와설스타인식 생성적 적대 신경망의 결합 (Combining multi-task autoencoder with Wasserstein generative adversarial networks for improving speech recognition performance)

  • 고조원;고한석
    • 한국음향학회지
    • /
    • 제38권6호
    • /
    • pp.670-677
    • /
    • 2019
  • 음성 또는 음향 이벤트 신호에서 발생하는 배경 잡음은 인식기의 성능을 저하시키는 원인이 되며, 잡음에 강인한 특징을 찾는데 많은 노력을 필요로 한다. 본 논문에서는 딥러닝을 기반으로 다중작업 오토인코더(Multi-Task AutoEncoder, MTAE) 와 와설스타인식 생성적 적대 신경망(Wasserstein GAN, WGAN)의 장점을 결합하여, 잡음이 섞인 음향신호에서 잡음과 음성신호를 추정하는 네트워크를 제안한다. 본 논문에서 제안하는 MTAE-WGAN는 구조는 구배 페널티(Gradient Penalty) 및 누설 Leaky Rectified Linear Unit (LReLU) 모수 Parametric ReLU (PReLU)를 활용한 변수 초기화 작업을 통해 음성과 잡음 성분을 추정한다. 직교 구배 페널티와 파라미터 초기화 방법이 적용된 MTAE-WGAN 구조를 통해 잡음에 강인한 음성특징 생성 및 기존 방법 대비 음소 오인식률(Phoneme Error Rate, PER)이 크게 감소하는 성능을 보여준다.

가상현실 음향을 위한 심층신경망 기반 사운드 보간 기법 (A Sound Interpolation Method Based on Deep Neural Networks for Virtual Reality Sound)

  • 최재규;최승호
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 추계학술대회
    • /
    • pp.194-196
    • /
    • 2018
  • 본 논문은 가상현실 음향 구현을 위한 심층신경망 기반 사운드 보간 방법에 관한 것으로서, 이를 통해 두 지점에서 취득한 음향 신호들을 사용하여 두 지점 사이의 음향을 생성한다. 산술평균이나 기하평균 같은 통계적 방법으로 사운드 보간을 수행할 수 있지만 이는 실제 비선형 음향 특성을 반영하기에 미흡하다. 이러한 문제를 해결하기 위해서 본 연구에서는 두 지점들과 목표 지점의 음향신호를 기반으로 심층신경망을 훈련하여 사운드 보간을 시도하였으며, 실험결과 통계적 방법에 비해 심층신경망 기반 사운드 보간 방법의 성능이 우수함을 보였다.

  • PDF