• Title/Summary/Keyword: 오디오신호

Search Result 435, Processing Time 0.023 seconds

Sound Event Detection based on Deep Neural Networks (딥 뉴럴네트워크 기반의 소리 이벤트 검출)

  • Chung, Suk-Hwan;Chung, Yong-Joo
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.14 no.2
    • /
    • pp.389-396
    • /
    • 2019
  • In this paper, various architectures of deep neural networks were applied for sound event detection and their performances were compared using a common audio database. The FNN, CNN, RNN and CRNN were implemented using hyper-parameters optimized for the database as well as the architecture of each neural network. Among the implemented deep neural networks, CRNN performed best at all testing conditions and CNN followed CRNN in performance. Although RNN has a merit in tracking the time-correlations in audio signals, it showed poor performance compared with CNN and CRNN.

자동차 부품 고장 진단에 관한 연구

  • 오재웅;한창수;이호택;신준;모종운;국두윤
    • Proceedings of the Korean Society of Precision Engineering Conference
    • /
    • 2001.10a
    • /
    • pp.144-148
    • /
    • 2001
  • 자동차의 발전과 함께 유지 보수를 위한 사용자의 요구는 급증하고 있으나 정비사의 부족으로 인해 경제성 및 신속성 등 이 문제가 되고 있고 이를 해결하기 위해 현재 개발되고 있는 장치들은 대부분 전자 제어 유닛에서 발생시키는 신호를 분석하거나 운전자와의 대화를 통하여 진단하는 방식으로 고장으로 인한 소음이나 진동등 운전자들의 주관적인 평가대상에 대해서는 적절한 해결책으로 제시해 주지 못하고 있다. 그러므로 계측에 의한 소음과 진동 데이터를 이용하여 전문가의 판단을 가지고 고장의 원인을 규명하며 운전자를 위한 오디오적인 표현을 해 줄 수 있는 진단 전문가 시스템이 필요하게 되었다. 본 논문에서는 자동차의 여러 단품중 쇼크 옵서버와 에어컨에 대하여 소음 진동 현상의 정상 및 이상 증상과 신호 계측 방법을 연구하였고 계측된 신호에 대해 패턴 화하여 인공 신경 회로망과 퍼지 추론을 통한 진단을 할 수 있는 알고리즘을 개발하였으며 차후 계속되는 연구에 사용될 정상 및 이상신호에 대한 기본적인 데이터 베이스를 구축하였다.

Multi-Channel Audio Coding Method with Virtual Source Location Information (멀티채널 오디오 재생 시스템에서 가상 음원의 위치 정보를 이용한 압축 재생 방법)

  • Moon Han-gil
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.165-168
    • /
    • 2004
  • 본 논문은 방송 및 통신 환경을 이용한 멀티채널 음향 재생 환경에서 다수 객체의 음상 정위를 보다 효과적이고 효율적으로 하기 위한 방법에 관한 것이다. 본 논문에서는 전송되는 정보의 양을 최소화 하면서도 재생되는 음향공간에서는 다수의 음향 객체들이 충실하게 재생되어 자연스러운 음향공간이 재현할 수 있는 방법을 제시하고가 한다. 기존 방법의 경우, 전송 선로를 통해 음원을 압축하여 전송하기 위해서는 먼저 멀티채널 신호를 합한 모노신호와 채널 신호사이의 음량차이(ICLD), 시간지연 차이(ICTD), 상관도(ICC)등을 전송하는 양귀단서 신호화 기술(Binaural Cue Coding)을 이용하고 있다. 본 논문에서는 멀티채널 음원을 분석하여, 음원의 가상 위치정보를 벡터적으로 표현하고, 이 위치벡터와 멀티채널 음원을 하나의 모노 음원으로 다운 믹스한 신호를 전송함으로써 전송 효율을 극대화 한 압축 재생 방법을 제시한다.

  • PDF

Implementation of adaptive speech enhancement system using TMS320C6413 DSP processor (TMS320C6413 DSP프로세서를 이용한 적응 음질개선 시스템의 구현에 관한 연구)

  • Lee Young-Il;Lee Soon-Reyo;Shin Yoon-Ki;Choi Hong-Sub
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.101-104
    • /
    • 2004
  • 본 논문에서는 보상기를 채용하여 안정성을 확보한 적응순환필터인 ACHARF(Adaptive Compensated Hyperstable Adaptive Recursive Filter)를 사용하여 잡음제거를 통한 음성의 음질개선을 DSP 프로세서를 통하여 구현하였다. 실험에서는 TI사의 최신 DSP 프로세서인 TMS320C6413와 스테레오 오디오 코덱인 TLV320AIC23을 탑재한 Evaluation board를 사용하였다. 2개의 입력마이크를 이용하여 음성신호와 기준 잡음신호를 별도로 수집하여 알고리즘을 수행하였으며, 실험 결과로 음질개선 효과를 확인할 수 있었다. 본 연구를 통해서 시스템의 성능개선의 핵심은 입력으로 들어오는 음성신호와의 상관도가 가능한 적은 잡음신호를 수집하는 방법이라 생각되며 앞으로 이에 대한 연구가 필요하겠다.

  • PDF

Design and Implementation the USB Multi-signal Transmission System (USB 다중 신호 전송 시스템 설계 및 구현)

  • Chae, Jung-Sik;Kim, Jong-Moon;Kim, Chang-Su;Jung, Hoe-Kyung
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2013.05a
    • /
    • pp.623-625
    • /
    • 2013
  • This signal can be distributed using a single USB cable, computer, video, audio, USB, LAN, one USB multi-signal transmission system was designed and implemented. USB multi-signal transmission was implemented in order to convert a single DVI, audio, and multiple USB, LAN, USB signal converter modules. This USB DVI port supports up to 1920 * 1090 resolution. USB multi-signal transmission system by sending multiple signals into a single cable installation costs of the various cable and using the replication feature of the screen, will provide schools and institutes, etc., providing the convenience of the river, and the scalability of computer peripheral ports.

  • PDF

Tone Quality Improvement Algorithm using Intelligent Estimation of Noise Pattern (잡음 패턴의 지능적 추정을 통한 음질 개선 알고리즘)

  • Seo, Joung-Kook;Cha, Hyung-Tai
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.15 no.2
    • /
    • pp.230-235
    • /
    • 2005
  • In this paper, we propose an algorithm that improves a tone quality of a noisy audio signal in order to enhance a performance of perceptual filter using intelligent estimation of noise pattern from a band degraded by additive noise. The proposed method doesn't use the estimated noise which is obtained from silent range. Instead new estimated noise according to the power of signal and effect of noise variation is considered for each frame. So the noisy audio signal is enhanced by the method which controls a estimation of noise Pattern effectively in a noise corruption band. To show the performance of the proposed algorithm, various input signals which had a different signal-to-noise ratio(SNR) such as $5\cal{dB},\;10\cal{dB},\;15\cal{dB}\;and\;20\cal{dB}$ were used to test the proposed algorithm. we carry out SSNR and NMR of objective measurement and MOS test of subjective measurement. An approximate improvement of $7.4\cal{dB},\;6.8\cal{dB},\;5.7\cal{dB},\;5.1\cal{dB}$ in SSNR and $15.7\cal{dB},\;15.5\cal{dB},\;15.2\cal{dB},\;14.8\cal{dB}$ in NMR is achieved with the input signals, respectively. And we confirm the enhancement of tone quality in terms of mean opinion score(MOS) test which is result of subjective measurement.

Audio Coder Using Variable Subband Wavelet Filter (가변 대역분할 웨이블릿필터를 이용한 오디오 부호화기)

  • 김준성;강현철;변윤식
    • The Journal of the Acoustical Society of Korea
    • /
    • v.17 no.5
    • /
    • pp.57-62
    • /
    • 1998
  • 본 논문에서는 입력신호의 시변특성에 따라 분석 필터의 대역을 가변 시키는 필터 뱅크의 구조를 제안한다. 제안된 필터뱅크는 일반적으로 32개의 균일한 대역으로 나누어 임 계대역의 표현을 적절히 표현하지 못하는 Polyphase 필터의 단점을 극복하면서 시스템 설 계에 높은 계산량을 요구하는 QMF-tree 필터의 단점을 보완한다. 본 연구에서는 분할 대역 은 4개에서 26개의 대역으로 가변하고, 웨이블릿 필터중 Daubechies필터를 사용하였다. 제 안된 구조의 부호화기는 128kbps에서 MPEG-a오디오와 비슷한 수준의 CD 음질을 유지하 며, 연산량 비교결과는 PolyPhase filter를 이용한 MPEG보다 부호화, 복호화 과정을 합쳐 다양한 전송률과 음원에서 평균 19%의 감소를 얻었다.

  • PDF

Content-based music retrieval using temporal characteristics (Temporal 특성을 이용한 내용기반 음악 정보 검색)

  • Park Chuleui;Park Mansoo;Kim Sungtak;Kim Hoi-Rin;Kang Kyeongok
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.299-302
    • /
    • 2004
  • 본 논문에서는 내용 기반 음악 정보 검색에 음악의 temporal 특징을 이용한 검색 방법을 제안한다. 방송환경에 적용하기 위해 검색 범위를 드라마나 영화의 배경 음악으로 사용되는 OST 앨범으로 제한하였다. 오디오의 특징 벡터로써 UFCC(Mel Frequency Cepstral Coefficient)를 사용하였으며 이 특징 벡터를 이용하여 VQ(Vector Quantization)로 부호화한 codeword로 오디오 신호의 시변 특성을 표현한다. 본 논문에서는 제안한 음악의 temporal 특성을 반영한 codeword-sequence를 이용하는 방법을 pitch-histogram을 기반으로 하는 방법 및 MFCC codeword-histogram을 기반으로 하는 방법과 비교하고 성능 개선을 보여주었다.

  • PDF

Unified Speech and Audio Coding Technology (통합 음성 오디오 부호화 기술)

  • Lee, Taejin;Beack, Seungkwon;Kang, Kyeongok;Kim, Whan-Woo
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2011.07a
    • /
    • pp.264-267
    • /
    • 2011
  • 다양한 기능을 가지는 모바일 기기들이 하나로 융합되어 가는 방향으로 기술이 발전함에 따라, 음성 및 오디오 모두에 대해 우수한 음질을 제공하는 부호화 기술에 대한 요구사항이 증대되고 있다. MPEG 에서는 2008 년 10 월부터 MPEG-D USAC 기술에 대해 CfP 를 시작으로 본격적으로 표준화를 진행하고 있으며, 2011 년 3 월 96 차 미팅에서 Study on DIS 까지 승인하였다. 본 논문에서는 LPD 모드의 TCX 윈도우의 변경을 통한 USAC 성능향상 방법은 제안한다. TCX 프레임의 연결에 고정된 크기의 중첩만을 이용하는 현재의 방식과는 달리, 이전 TCX 모드와 다음 TCX 모드, transient 의 존재 유무에 따라 적절하게 TCX 윈도우 중첩크기를 조절하여 음악 특성 신호에 대해 LPD 모드의 음질을 개선할 수 있다.

  • PDF

WINCE Using MOST Network Control Program (Windows CE 기반 MOST Network 관리 기능의 설계 및 구현)

  • Seo, Sang-Uk;Jang, Si-Woong;Yu, Yun-Sik
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2011.05a
    • /
    • pp.201-204
    • /
    • 2011
  • 최근 차량 내부의 전장장치 사이에 운전자의 편의성의 요구 수준이 높아지고 있으며 이에 대응해 상호통신을 위한 차량용 네트워크 기술이 빠르게 발전하고 있다. 이에 따라 이들 인포테인먼트 시스템 중 최적화된 내부 통신기술이 필요하게 되었다. 차량용 네트워크인 MOST(Media Oriented Systems Transport)는 오디오, 비디오 신호를 동기적으로 전송할 수 있는 자동차용 멀티미디어 시스템에 가장 광범위 하게 사용되고 있는 네트워크이며 넓은 대역폭과 오디오, 비디오 데이터의 실시간 전송 및 코딩을 지원한다. Windows CE는 다양한 라이브러리를 지원함으로써 다양한 GUI 및 네트워크 프로젝터 개발이 가능하다. 이러한 기술적 변화에 맞춰서 본 논문에서는 Windows CE 6.0 기반의 보드와 차량용 인포테이먼트 네트워크인 MOST 네트워크를 이용하여 MOST 네트워크 상태를 관리할 수 있고 MOST 네트워크 동작 및 정보, 상태 등 다양한 정보를 한눈에 확인할 수 있는 시스템을 구성하였다.

  • PDF