• 제목/요약/키워드: 잔향

검색결과 391건 처리시간 0.024초

심층신경망 기반의 음성인식을 위한 절충된 특징 정규화 방식 (Compromised feature normalization method for deep neural network based speech recognition)

  • 김민식;김형순
    • 말소리와 음성과학
    • /
    • 제12권3호
    • /
    • pp.65-71
    • /
    • 2020
  • 특징 정규화는 음성 특징 파라미터들의 통계적인 특성의 정규화를 통해 훈련 및 테스트 조건 사이의 환경 불일치의 영향을 감소시키는 방법으로서 기존의 Gaussian mixture model-hidden Markov model(GMM-HMM) 기반의 음성인식 시스템에서 우수한 성능개선을 입증한 바 있다. 하지만 심층신경망(deep neural network, DNN) 기반의 음성인식 시스템에서는 환경 불일치의 영향을 최소화 하는 것이 반드시 최고의 성능 개선으로 연결되지는 않는다. 본 논문에서는 이러한 현상의 원인을 과도한 특징 정규화로 인한 정보손실 때문이라 보고, 음향모델을 훈련 하는데 유용한 정보는 보존하면서 환경 불일치의 영향은 적절히 감소시켜 음성인식 성능을 최대화 하는 특징 정규화 방식이 있는 지 검토해보고자 한다. 이를 위해 평균 정규화(mean normalization, MN)와 평균 및 분산 정규화(mean and variance normalization, MVN)의 절충 방식인 평균 및 지수적 분산 정규화(mean and exponentiated variance normalization, MEVN)를 도입하여, 잡음 및 잔향 환경에서 분산에 대한 정규화의 정도에 따른 DNN 기반의 음성인식 시스템의 성능을 비교한다. 실험 결과, 성능 개선의 폭이 크지는 않으나 분산 정규화의 정도에 따라 MEVN이 MN과 MVN보다 성능이 우수함을 보여준다.

SFIT형태를 이용한 SPUDT형 필터제작에 관한 기초실험 (The basic experiments for the fabrication of the SPUDT type Inter using the SFIT type filter)

  • 유일현
    • 한국정보통신학회논문지
    • /
    • 제11권10호
    • /
    • pp.1916-1923
    • /
    • 2007
  • 대역통과용 표면 탄성파 필터 제작하기 위하여 Langasite 기판위에 빗살무의 변환기를 형성 시켜 모의실험을 수행하였으며, 전극재료로는 Al-Cu를 사용하였다. 모의실험을 바탕으로 입력단에는 IDT를 직렬형태로 연결시킨 block 형태로 하중을 가하는 전극 방법을 쓰고 출력 단은 withdrawal 형태로 하중을 가하는 방법을 써서 제작하였다. 이를 바탕으로 광대역의 SAW 필터 전극 설계 방식에 대한 적절한 위상조건도 얻고자 시도하였다. Langasite 기판위에 형성시킨 입출력 빗살무의 변환기 전극 수는 50쌍, 두께는 $5000\;{\AA}$으로 하였으며, 반사기 폭은 $3.6{\mu}m$으로 하였다. 그리고 hot전극과 반사기사이의 거리는 각각 $2.0{\mu}m\;2.4{\mu}m$로 제작하였고, hot전극에서부터 접지전극까지 간격은 $1.5{\mu}m$로 하였으며 전극 모양은 좌우 동일한 형상을 채택하였다. 제작한 필터의 주파수 특성은 중심주파수가 대략 190MHz정도, 대역폭은 7.8MHz 이하로 측정되었으며, matching 후 return-loss는 -18dB 이하이고, 리플 특성은 3dB 이하이며, 반사에 의한 잔향은 -25dB 이하로 측정되었다.

양상태 소나에서의 자세각과 양상태각에 따른 표적 식별 정확도 비교 (Comparison of target classification accuracy according to the aspect angle and the bistatic angle in bistatic sonar)

  • 추연성;변성훈;추영민;최기융
    • 한국음향학회지
    • /
    • 제40권4호
    • /
    • pp.330-336
    • /
    • 2021
  • 양상태 능동 소나에서 수중 표적의 산란 강도는 사용된 신호의 주파수, 표적과 음원사이의 각도를 의미하는 자세각, 표적과 수신기 사이의 각도를 나타내는 양상태각 등의 운용 변수에 따라 다르게 나타난다. 따라서 양상태 소나의 표적 탐지 및 식별 성능은 소나 운용 과정에서 표적, 음원, 그리고 수신기의 위치를 어떻게 변화시키느냐에 따라 그 성능이 달라질 수 있다. 본 연구에서는 양상태 소나 운용 시 자세각을 변화시키는 경우와 양상태각을 변화시키는 경우의 표적 식별 성능을 비교하여 어떤 변수를 변화시키는 것이 유리한지 평가하였다. 속이 비어있는 구와 실린더를 식별하는 시나리오를 가정하였으며, 유한요소법 기반의 음향 산란 시뮬레이션을 이용하여, 서포트 벡터 머신으로 두 표적을 분류하고 정확도를 비교하는 방법으로 성능을 비교하였다. 표적의 산란 신호만을 고려하기 위하여, 해저면 잔향의 효과는 고려하지 않았다. 비교 결과, 자세각을 고정한 상태에서 주파수와 양상태각으로 정의되는 산란 강도를 이용하는 것이 우수한 평균 분류 정확도를 보여주었으며, 이는 양상태 소나를 이용하여 구와 실린더를 식별하고자 하는 경우, 음원의 위치를 고정시킨 상태에서 수신기를 이동하여 양상태각을 변화시키는 것이 표적 식별에 더 효과적임을 보여준다.

음성명료도 시험에 의한 노인 교육시설의 청취환경 조사 (Investigation of the listening environment of classrooms for elderly people using speech intelligibility tests)

  • 박찬재;김보경;한찬훈
    • 한국음향학회지
    • /
    • 제40권1호
    • /
    • pp.18-30
    • /
    • 2021
  • 본 연구의 궁극적인 목적은 청력 비완전자인 노인을 위한 학습공간의 음향기준을 제시하기 위한 것이다. 사전연구로서 본 연구는 현재 운영 중인 노인 교육시설의 청취환경을 조사하고 이를 이용 중인 노인의 음성 인지성능 실태를 조사하기 위해 진행되었다. 이를 위하여, 청주시 소재 2개 노인 교육시설을 대상으로 물리적 음향성능을 측정하고 설문조사 를 실시하였다. 또한, 음절법과 단어법을 이용한 음성명료도 평가를 수행하였다. 노인을 대상으로 한 설문조사 결과 전반적인 청취환경에는 만족하는 것으로 나타났다. 배경소음, 신호대잡음비, 잔향시간, 음성전달지수와 같은 물리적 음향성능 측정 결과 대한민국 일반교실의 음향성능 기준을 만족하고 있음을 알 수 있었다. 그러나 음성명료도 평가 결과 20대 건청인에 비해 노인 그룹의 점수가 20점 이상의 차이로 월등히 낮았으며, 연령대가 높아질수록 점수 또한 낮아지는 것으로 나타났다. 따라서 현재 사용 중인 일반인 대상 교육시설의 음향성능 기준이 노인 교육시설에 적합하지 않음을 알 수 있었다.

주관적 평가법을 이용한 초등학교 저학년 교실의 청취환경 조사 (Investigation of the listening environment for lower grade students in elementary school using subjective tests)

  • 박찬재;한찬훈
    • 한국음향학회지
    • /
    • 제40권3호
    • /
    • pp.201-212
    • /
    • 2021
  • 본 연구는 만 9세 이하 아동과 같은 청력 비완전자에게 적합한 교실의 음향성능 기준을 제시하기 위한 사전연구로써 수행되었다. 이를 위해 초등학교 저학년 교실의 청취환경 특성을 분석하기 위하여 청주시 소재 초등학교 2곳에서 총 264명의 학생을 대상으로 설문조사 및 음성명료도 평가와 같은 주관적 평가를 진행했다. 설문조사 결과 학생들이 수업 내용 이해에 가장 도움이 되는 정보형식은 교사의 음성이라고 응답했다. 또한 현재 교사의 음성에 대해 음량은 '보통' 수준이며 명료도에는 높은 만족도를 보이고 있었다. 교실의 음향성능에 대해서도 소음의 경우 '보통'이며 잔향감은 '매우 짧다'는 의견이 가장 많아서 청취환경에 대한 전반적인 만족도가 높은 편인 것으로 파악되었다. 또한 초등학교 저학년 학생들을 위해 선별된 시험용 단어목록을 이용해 음성명료도 평가를 수행한 결과 만 8세 아동의 경우 음원으로부터의 종축거리가 음성인지에 영향을 미치는 요인임을 유추해볼 수 있었다.

두 대역 상반된 스윕방향 hyperbolic frequency modulation 펄스로 수중물체 시선속도추정 기법 및 성능분석 (Underwater object radial velocity estimation method using two different band hyperbolic frequency modulation pulses with opposite sweep directions and its performance analysis)

  • 조점군;정의철
    • 한국음향학회지
    • /
    • 제42권1호
    • /
    • pp.25-31
    • /
    • 2023
  • 능동소나를 이용하여 수중물체의 속도를 추정하려면 Continuous Wave(CW) 펄스를 이용하는 것이 일반적이나, 수중물체의 속도가 느리고 근거리의 해양에서는 잔향음의 영향으로 수중물체의 속도 추정이 용이하지 않다. 2017년도에 Wang 연구진은 이를 극복하고자 수중물체의 속도에 의한 도플러 변이에 둔감한 광대역 신호인 Hyperbolic Frequency Modulation(HFM) 펄스 두 개를 상반된 스윕방향으로 이용하였다. 두 펄스 간 송신 시간간격과 탐지시간 차이의 변화를 통하여 수중물체 속도 추정이 가능하다는 것을 시뮬레이션으로 제시하였다. 하지만 동일한 대역을 이용하므로 상호상관성에 의해서 수중물체 탐지 성능이 영향을 받을 수 밖에 없다. 상호상관성에 의한 수중물체 탐지 성능저하를 방지하기 위하여 대역이 분리된 상반된 스윕방향의 두 HFM 펄스 이용을 제안한다. 본 논문에서는 상반된 스윕방향의 두 대역 HFM을 이용하여 수중물체의 시선속도 추정에 관한 이론을 도출하였고, 펄스길이와 대역폭이 1 s와 400 Hz인 HFM 펄스로 시뮬레이션을 수행하였다. 제안한 방법을 이용하여 수중물체의 시선속도를 추정하면 약 6 %의 오차로 표적 속도 추정이 가능하다는 것을 시뮬레이션을 통하여 확인하였다.

고속 수중운동체 탐지를 위한 일반화된 사인파 주파수 변조 기반 고해상도 거리 및 속도 추정 기법 (High-resolution range and velocity estimation method based on generalized sinusoidal frequency modulation for high-speed underwater vehicle detection)

  • 박진욱;김근환;석종원;홍정표
    • 한국음향학회지
    • /
    • 제42권4호
    • /
    • pp.320-328
    • /
    • 2023
  • 고속 수중운동체 능동 탐지는 수중 무기 방어 시스템에 중요한 기술로, 정확한 표적 탐지와 거리 및 속도 추정이 필수적이다. 빔 형성 각도마다 신호를 순차적으로 송신해야 하지만 펄스 분할 송신 방법은 거리 추정의 모호성이 발생한다. 이를 보완하기 위해 다중 주파수 기반 방법이 제안되었지만 대역폭을 분할할 경우 시간-대역폭 곱에서 손실이 발생한다. 이러한 문제를 해결하기 위해, 본 연구에서는 대역폭을 분할하지 않아도 부펄스 간의 상관관계를 낮게 설계할 수 있는 일반화된 사인파 주파수 변조(Generalized Sinusoidal Frequency Modulation, GSFM)를 사용한 능동 고속 탐지 기법을 제안한다. 제안한 방법은 펄스 길이를 최소화시킨 GSFM을 사용함으로써 표적의 거리와 속도를 빠르게 갱신할 수 있다. 제안한 방법의 성능을 검증하기 위해 잔향이 존재하는 모의 환경을 구축하였다. 모의 실험 결과 0.05 s의 선형 주파수 변조 펄스는 한정적인 주파수 대역으로 인해 추정 거리 대비 평균적으로 50 %의 거리 추정 오차와 103 %의 속도 추정오차가 발생하였다. 이에 반해, GSFM은 같은 길이의 펄스를 사용하더라도 추정 거리 대비 거리 추정 오차와 속도 추정 오차가 각각 10 %와 14 %로 표적을 비교적 정확하고 빠르게 추적할 수 있었다. 게다가, GSFM은 방위별로 직교성이 높은 부펄스를 송신하여 표적의 대략적인 방위까지 알 수 있었다.

구조용 직교 집성판 슬래브와 상부 토핑 조건에 따른 바닥충격음 및 공기전달음 평가 (Evaluation of floor impact sound and airborne sound insulation performance of cross laminated timber slabs and their toppings)

  • 이효진;하연수;이상준
    • 한국음향학회지
    • /
    • 제42권6호
    • /
    • pp.572-583
    • /
    • 2023
  • 전 세계적으로 탄소중립 2050 실현을 위한 목조 건축물 수요가 늘어나고 있으며, 국내에서도 구조용 직교 집성판(Cross Laminated Timber, CLT)을 이용한 목조 고층 건축물에 대한 기술적 검토가 이루어지고 있다. 본 논문에서는 CLT의 기초 음향성능을 검토하기 위해, 국내산 낙엽송과 소나무로 CLT 슬래브(두께 150 mm)를 제작해 바닥 충격음 차단 성능과 음향투과손실을 측정했다. 실험은 상하로 연결된 페어 잔향실에서 수행했으며, CLT 슬래브에 콘크리트 토핑(두께 50 mm ~ 210 mm, 6조건)을 추가해 차음성능 개선량을 정량적으로 평가했다. 수종에 따른 바닥충격음 차단 성능의 단일수치 평가량을 비교하면, 낙엽송 CLT가 소나무 CLT보다 중량 바닥충격음에서 3 dB, 경량 바닥충격음에서 1 dB 낮았으나, 상부에 콘크리트 토핑을 추가한 조건에서는 수종 간 차이가 없었다. 상부의 콘크리트 층 두께 상승에 따라 중량 바닥충격음이 9 dB ~ 20 dB, 경량충격음이 20 dB ~ 30 dB 저감했다. 이 관계를 면밀도로 분석한 결과, CLT 슬래브의 바닥충격음 차단 성능은 면밀도와 높은 상관관계(R2 = 0.94 ~ 0.99)가 있는 것을 확인했다. CLT 슬래브의 음향투과손실은 수종에 따른 차이가 없었다. 면밀도와 주파수로 산출한 음향투과손실 이론치와 실측치의 주파수 특성은 유사하지만 실측치가 8 dB ~ 12 dB 낮아, 보정치를 이용해 실험 대상인 CLT 슬래브의 음향투과손실과 주파수 특성의 관계를 도출했다.

중량 바닥충격음 측정의 신뢰성 향상을 위한 측정방법 검토 (A Study on the Measurement Method for Improvement of Reliability for Heavy-Weight Floor Impact Sound Measurement)

  • 주문기;박종영;양관섭;오양기
    • 한국음향학회지
    • /
    • 제27권4호
    • /
    • pp.163-170
    • /
    • 2008
  • 대부분의 바닥충격음측정은 반사성 재질로 마감된, 가구도 커튼도 없는 수 미터 치수의 장방형 공실에서 이루어진다. 이러한 공간에서 저주파 모드의 발생을 피하는 일은 쉽지 않다. 현재의 측정표준에 따른 중량 바닥충격음 측정의 재현성과 신뢰성을 저해하는 가장 큰 요인은 이러한 저주파 모드 중첩 현상이며, 그 측정의 편차는 63Hz 대역에서 때론 10dB에 이르는 경우도 있다. 이 연구에서는 중량바닥충격음 측정의 편차원인인 저주파 대역 모드중첩의 영향을 줄일 수 있는 보다 신뢰성 있는 측정방법을 찾고자 하였다. 그 방법으로 수음실의 모드 중첩 현상 자체를 제어하는 방법과 어느 정도 모드가 존재하는 상황에서도 수음실 공간 전체의 음압레벨 평균에 가깝게 측정할 수 있는 방법의 두 가지에 대하여 실험하였다. 실험의 결과 저음흡음재 보다 베이스 트랩을 이용하여 수음실의 울림을 줄이는 방식은 수음실의 모드중첩을 제어하는 데는 효과가 있지만 현실적으로 다양한 측정 현장에서 저음 잔향시간을 $1{\sim}2$ 초 사이로 구현하는 일이 쉽지 않음이 단점으로 드러났다. 마이크로폰을 회전시키면서 공간적 평균을 구하는 방식은 측정이 복잡하지도 않으며 쉽게 많은 수음점을 확보하여 수음실 전체 공간을 통한 측정값과 근소한 오차를 보이는 것으로 밝혀졌다.

소수 불균형 데이터의 심층학습을 통한 능동소나 다층처리기의 표적 인식성 개선 (Improving target recognition of active sonar multi-layer processor through deep learning of a small amounts of imbalanced data)

  • 류영우;김정구
    • 한국음향학회지
    • /
    • 제43권2호
    • /
    • pp.225-233
    • /
    • 2024
  • 능동소나는 은밀하게 기동하는 수중 물체를 탐지하기 위해 음파를 송신하여 표적에서 반사되어 돌아오는 신호를 탐지한다. 그러나 능동소나의 수신 신호에는 표적의 반향음 외에도 해저면/해수면의 잔향, 생물 소음 및 기타 잡음 등이 섞여 있어 표적 인식을 어렵게 한다. 기존의 문턱값 이상의 신호를 탐지하는 기법은 설정한 문턱값에 따라 오탐지가 발생하거나 표적을 놓치는 경우가 발생할 뿐 아니라 다양한 수중환경마다 적절한 문턱값을 설정해야하는 문제가 있다. 이를 극복하기 위해 Constant False Alarm Rate(CFAR) 등의 기법을 이용한 문턱값의 자동산출과 진보된 형태의 추적 필터 및 연계 기법을 적용한 연구가 수행되었지만, 상당수의 탐지가 발생하는 환경에서는 그 한계가 있다. 최근 심층학습 기술이 발달함에 따라 수중 표적 탐지분야에도 이를 적용하기 위한 노력이 있었으나, 분류기 학습을 위한 능동소나 데이터의 획득이 매우 어려워 데이터가 희소할 뿐 아니라, 극소수의 표적과 상대적 다수의 비표적으로 인한 데이터의 불균형성으로 어려움이 있다. 본 논문에서는 탐지 신호의 에너지 분포 영상을 이용하되, 데이터의 불균형성을 고려한 방식으로 분류기를 학습하여 표적과 비표적을 구분하는 기법을 기존 소나처리 기법에 추가하여 표적의 오분류를 최소화하면서 비표적을 제거하여 능동소나 운용자의 표적 인식을 용이하게 하였다. 그리고 동해에서 수행한 해상실험에서 획득한 능동소나 데이터를 통해 제안 기법의 유효성을 검증하였다.