• 제목/요약/키워드: 음향 모델

검색결과 1,253건 처리시간 0.036초

청취자 및 스피커의 위치에 따른 Transaural 필터 구현 (Implementation of Transaural filter method for the location of listeners and loudspeakers)

  • 황신;방승범;김순협;정완섭
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 하계학술발표대회 논문집 제19권 1호
    • /
    • pp.197-200
    • /
    • 2000
  • 본 논문에서는 공간에 위치한 음원으로부터 양 귀에 들리는 음향을 스피커를 이용하여 재현 하는 기술에 대한 문제점과 이를 효과적으로 구현할 수 있는 방법에 대해 소개한다. 좌우 대칭 위치의 스피커를 이용하여, 음상 정위를 실현할 때 직면한 문제점인 Cross-talk 제거와 스피커와 청취자 양 귀사이의 음향전달 모델 선정에 대한 문제점들을 본 논문에서 고찰한다. 이러한 고찰을 통하여 Transaural 필터의 모델 제시와 본 모델의 음향학적 특성을 소개한다. 인간 청각기관의 공간 감응 인자인 lID(Interaural Intensity Difference)와 ITD(Interaural Time Difference)의 개념을 이용한 Transaural 필터의 구현 방법을 제시한다. 제시한 구현방법과 영국 ISVR의 "Stereo Dipole"과의 비교와, 끝으로, 주파수에 따른 적합한 스피커간의 배치 문제에 관한 것도 언급한다.

  • PDF

Sine 파를 이용한 오디오 신호 분석 및 합성 (Analysis and Synthesis of Audio Signals using a Sinusoidal Model)

  • 남승현
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.255-258
    • /
    • 1998
  • Sine파를 이용한 오디오 분석과 합성은 고음질 저비트율 오디오 부호화에 매우 효율적인 방법의 하나로 알려져 있다. 본 논문은 sine파를 이용한 오디오 분석과 합성에 중요한 sine파 검출에 심리음향모델을 활용하는 방안을 제안하였다. 모의실험 결과, 심리음향모델을 사용한 경우 사용하지 않은 경우에 비해 합성에 사용되는 sine파의 개수를 약 50% 정도 줄일 수 있었음을 알 수 있었다. 한편 오디로 신호의 attack이나 nonstationarity를 처리할 수 있는 방법이 sine파를 이용한 오디오 부호화에 필수적이라는 사실을 확인하였고 그에 대한 대처 방안을 제시하였다.

  • PDF

음향 장면 분류를 위한 경량화 모형 연구 (Light weight architecture for acoustic scene classification)

  • 임소영;곽일엽
    • 응용통계연구
    • /
    • 제34권6호
    • /
    • pp.979-993
    • /
    • 2021
  • 음향 장면 분류는 오디오 파일이 녹음된 환경이 어디인지 분류하는 문제이다. 이는 음향 장면 분류와 관련한 대회인 DCASE 대회에서 꾸준하게 연구되었던 분야이다. 실제 응용 분야에 음향 장면 분류 문제를 적용할 때, 모델의 복잡도를 고려하여야 한다. 특히 경량 기기에 적용하기 위해서는 경량 딥러닝 모델이 필요하다. 우리는 경량 기술이 적용된 여러 모델을 비교하였다. 먼저 log mel-spectrogram, deltas, delta-deltas 피쳐를 사용한 합성곱 신경망(CNN) 기반의 기본 모델을 제안하였다. 그리고 원래의 합성곱 층을 depthwise separable convolution block, linear bottleneck inverted residual block과 같은 효율적인 합성곱 블록으로 대체하고, 각 모델에 대하여 Quantization를 적용하여 경량 모델을 제안하였다. 경량화 기술을 고려한 모델은 기본 모델에 대비하여 성능이 비슷하거나 조금 낮은 성능을 보였지만, 모델 사이즈는 503KB에서 42.76KB로 작아진 것을 확인하였다.

장방형 실의 형태가 실내음향에 미치는 영향 (The Effects of Room Shape on the Acoustics of Rectangular Rooms)

  • 연철호;박계균;김홍배;한찬훈
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 하계학술발표대회 논문집 제19권 1호
    • /
    • pp.443-446
    • /
    • 2000
  • 본 연구는 과학적이고 실험적인 접근을 통하여 공간의 비례와 실내음향과의 상관관계를 규명하기 위하여 체적과 마감재료가 같고 비슷한 기본축척의 모델을 중심으로 가로, 세로, 높이의 비율이 다른 4개의 모델에서 각각 SPL, EDT, C, RT, LEF, IACC 등을 측정하여 각 형태의 모델의 값을 비교 분석하였다. 실험결과 잔향은 동일한 체적인 경우 음원으로부터 평균거리가 멀리 위치한 장방형의 형태가 양쪽 측벽 사이의 거리가 넓은 장방형보다 잔향시간이 긴 것으로 나타났다. 음압은 실의 체적이 작고 음원으로부터의 평균거리가 짧은 순서로 큰 반면, 명료도는 잔향의 크기순서에 반대로 분석되었으며 특히 음원으로부터의 직선거리가 짧은 순서로 명료도가 좋게 나타났다. IACC는 양쪽 측벽의 거리가 가장 긴 모델에서 가장 작게 나타났다 그러나, 초기 음장에서는 그 변화가 작게 나타났는데 이것은 IACC가 실의 형태에 장시간 관여하는 지수라는 것을 의미한다.

  • PDF

음성인식용 아동음성데이터베이스의 구축 및 음향모델의 검토 (The Construction of a Children Speech Database for Speech Recognition and The Validation of Acoustic Models)

  • 김연화;이용주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (상)
    • /
    • pp.717-720
    • /
    • 2003
  • 최근 아동음성을 이용한 응용분야가 활기를 띄고 있다. 따라서 아동음성DB의 구축이 시급히 필요하게 되었다. 이러한 요구에 따라 아동음성을 여러 응용분야에 적용하기 위한 한 방법으로 아동음성DB를 구축하였고, 이를 이용한 음향모델을 작성하였다. 아동음성의 효율적인 인식을 위한 음향모델을 고찰하기 위하여 연령대별로 음향모델을 만들고, 이를 이용하여 훈련 및 평가용 데이터로 인식 실험한 결과를 비교 검토한다.

  • PDF

루프/에어갭/내장재 효과를 고려한 차실 음향-구조 연성해석 (The Acoustic-structural Coupling Analysis of the Passenger Cavity Considering the Characteristic of a Roof/Airgap/Trim)

  • 이장무;강상욱;김석현
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 1996년도 추계학술대회논문집; 한국과학기술회관, 8 Nov. 1996
    • /
    • pp.84-90
    • /
    • 1996
  • 일반적으로 차실 음향 공동과 차체 팬널이 연성이 되는 계에 대한 소음 연성해석을 위한 해석 모델은 팬널과 공동이 직접적으로 연성이 되는 것으로 모델링되었다. 그러나 루프와 같은 팬널이 차실과 연성이 되는 경우, 루프의 진동은 차실에 직접적으로 전달되지 않고 루프 하단에 존재하는 갭과 내장판을 통하여 차실 소음에 영향을 미친다. 루프와 내장재 사이에 있는 갭의 매질은 주로 공기 도는 흡음재이다. 본 논문에서는 이러한 음향 구조 연성계를 이론적으로 해석 가능한 1차원 모델로 근사화하여 갭의 간격, 갭의 매질 특성, 내장재의 물성치 등의 변화에 따른 공동 내의 음향 응답 특성을 알아보고자 한다. 또한 위 결과를 에어갭을 고려한 3차원 차실 모델에 적용하고, 1/2 차실 모델에 대한 실험을 통하여 에어갭과 내장재의 효과를 검증한다.

  • PDF

압전 미세 외팔보 형 수중 음향 벡터센서의 작동 원리와 설계 기법 (Modeling of Sound-structure Interactions for Designing a Piezoelectric Micro-Cantilever Acoustic Vector Sensor)

  • 양성관;김준수;문원규
    • 한국음향학회지
    • /
    • 제34권2호
    • /
    • pp.108-116
    • /
    • 2015
  • 수중 음향 벡터센서는 음압 뿐 아니라 음파의 진행 방향에 관한 정보를 측정할 수 있는 센서이다. 본 논문에서는 미세 외팔보를 이용한 수중 음향 벡터 센서를 구현하기 위해 음향학적 이론을 바탕으로 음향과 기계 구조물의 상호작용을 이론적으로 정립하고자 하였다. 감응 방식으로 압전 효과를 이용한 두 가지 유니모프(unimorph)형태의 모델을 제시하였으며, 제시된 모델에 대하여 압전 미세 외팔보의 거동을 집중 질량 모델을 통해 음파가 임의의 주파수와 각도를 가지고 미세 외팔보로 입사할 때 나오는 신호의 크기를 구할 수 있는 전달함수를 유도하였다. 또한 이를 바탕으로 매우 얇고 유연한 구조물로 미세 외팔보를 설계하면 매질의 입자 속도에 관한 정보를 직접적으로 측정 가능한 센서로 활용할 수 있다는 것을 확인하였다.

천해 저주파 양상태 잔향음 모델 (Bi-static Low-frequency Reverberation Model in Shallow Water)

  • 김남수;오선택;윤관섭;이성욱;나정열
    • 한국음향학회지
    • /
    • 제22권6호
    • /
    • pp.472-481
    • /
    • 2003
  • 천해에서 포물선 근사 (parabolic approximation)에 기초한 저주파 양상태 잔향음 모델 (LHYREV-B, Low-frequency Hanyang Univ. Reverberation model-Bistatic)을 제안하였다. LHYREV-B 모델에서는 해저와 해저지형 내의 상호작용을 포함하는 음향모델에 수평입사에 독립인 산란함수를 이용하여 양상태 잔향음을 계산하였다. 모델의 검증을 위하여 실측 잔향음 신호와 비교하였으며, 비교 결과 LHYREV-B 모델이 저주파 잔향음 예측에 적합함을 확인할 수 있다.

External knowledge를 사용한 LFMMI 기반 음향 모델링 (LFMMI-based acoustic modeling by using external knowledge)

  • 박호성;강요셉;임민규;이동현;오준석;김지환
    • 한국음향학회지
    • /
    • 제38권5호
    • /
    • pp.607-613
    • /
    • 2019
  • 본 논문은 external knowledge를 사용한 lattice 없는 상호 정보 최대화(Lattice Free Maximum Mutual Information, LF-MMI) 기반 음향 모델링 방법을 제안한다. External knowledge란 음향 모델에서 사용하는 학습 데이터 이외의 문자열 데이터를 말한다. LF-MMI란 심층 신경망(Deep Neural Network, DNN) 학습의 최적화를 위한 목적 함수의 일종으로, 구별 학습에서 높은 성능을 보인다. LF-MMI에는 DNN의 사후 확률을 계산하기 위해 음소의 열을 사전 확률로 갖는다. 본 논문에서는 LF-MMI의 목적식의 사전 확률을 담당하는 음소 모델링에 external knowlege를 사용함으로써 과적합의 가능성을 낮추고, 음향 모델의 성능을 높이는 방법을 제안한다. External memory를 사용하여 사전 확률을 생성한 LF-MMI 모델을 사용했을 때 기존 LF-MMI와 비교하여 14 %의 상대적 성능 개선을 보였다.

향상된 MDL 기법에 의한 음향모델의 최적화 연구 (A Study on Improved MDL Technique for Optimization of Acoustic Model)

  • 조훈영;김상훈
    • 한국음향학회지
    • /
    • 제29권1호
    • /
    • pp.56-61
    • /
    • 2010
  • 본 논문에서는 HMM 기반의 연속음성인식에서 음향모델의 최적화 기법을 논한다. 대부분의 음성인식 시스템에서 HMM 상태별로 동일한 개수의 가우시안 성분 (mixture component)을 사용해 왔다. 그러나, 음향 모델링에 사용되는 데이터 샘플의 개수는 HMM상태별로 다르므로 이에 따른 최적화를 수행할 경우 모델 파라미터의 개수를 효과적으로 줄일 수 있을 뿐 아니라, 디코딩 단계에서 음성인식기의 속도 및 인식 성능 개선이 기대된다. 본 연구에서 제안한 방법은 기존에 알려진 MDL (minimum description length) 기반의 음향모델 최적화 방법에서 가우시안 성분들의 통합과정에 가우시안 성분의 가중치 정보 (mixture weight)를 반영하도록 개선하였다. 인식 실험 결과, 제안한 방법은 가우시안 성분의 가중치를 반영하지 않는 기존 방법에 비해 향상된 최적화 성능을 보임을 확인할 수 있었다.