• 제목/요약/키워드: 오디오신호

검색결과 435건 처리시간 0.022초

합성곱 신경망과 장단기 메모리를 이용한 사격음 분석 기법 (Shooting sound analysis using convolutional neural networks and long short-term memory)

  • 강세혁;조지웅
    • 한국음향학회지
    • /
    • 제41권3호
    • /
    • pp.312-318
    • /
    • 2022
  • 본 논문은 딥러닝기법 중 하나인 합성곱 신경망과 순환 신경망 중 하나인 장단기 메모리를 이용하여 사격시 발생하는 소음(이하 사격음)만으로 화기의 종류, 사격음 발생지점에 관한 정보(거리와 방향)을 추정하는 모델을 다루었다. 이를 위해 미국 법무부 산하 연구소의 지원하에 생성된 Gunshot Audio Forensic Dataset을 이용하였으며, 음향신호를 멜 스펙트로그램(Mel-Spectrogram)으로 변환한 후, 4종의 합성곱 신경망과 1종의 장단기 메모리 레이어로 구성된 딥러닝 모델에 학습 및 검증 데이터로 제공하였다. 제안 모델의 성능을 확인하기 위해 합성곱 신경망으로만 구성된 대조 모델과 비교·분석하였으며, 제안 모델의 정확도가 90 % 이상으로 대조모델보다 우수한 성능을 보였다.

음성로고 삽입을 위한 디지털 영상 워터마킹에 관한 연구 (A Study on Digital Image Watermarking for Embedding Audio Logo)

  • 조강석;고성식
    • 대한전자공학회논문지TE
    • /
    • 제39권3호
    • /
    • pp.21-27
    • /
    • 2002
  • 디지털 워터마킹 기술은 멀티미디어 데이터에 적용하여 소유물에 대한 불법 복제나 소유자의 저작권 보호 문제를 해결할 수 있는 방법 중의 하나이다. 그렇지만 디지털 영상, 비디오, 그리고 오디오와 같은 멀티미디어 보호 문제를 해결하기 위해서는 여전히 소유권 주장 방법에 대해서 극복해야할 문제점을 가지고 있다. 본 논문에서는 저작물 소유자의 음성신호(Audio signal)를 음성로고(Audio Logo)의 워터마크로 변환하고, 원 영상 내 픽셀 농도 값의 비선형적 특성를 이용하여 음성로고를 공간 영역에서 삽입한다. 그리고 추출된 음성로고를 음성신호로 변환하여 청각적으로 소유자의 음성신호를 스피커로 출력하여 소유권을 주장하는 방법을 제안한다. 실험 결과를 통해, 본 논문에서 제시하는 알고리즘이 일반적인 영상 처리나, 특히 손실 JPEG 등과 같은 다양한 공격에 대해서 강인성을 유지시킬 수 있어 음성로고를 이용해 저작물 보호를 확인할 수 있음을 검증하였다.

청각 장애인용 홈 모니터링 시스템을 위한 다채널 다중 스케일 신경망 기반의 사운드 이벤트 검출 (Sound event detection based on multi-channel multi-scale neural networks for home monitoring system used by the hard-of-hearing)

  • 이기용;김형국
    • 한국음향학회지
    • /
    • 제39권6호
    • /
    • pp.600-605
    • /
    • 2020
  • 본 논문에서는 청각 장애인을 위한 소리 감지 홈 모니터링을 위해 다채널 다중 스케일 신경망을 사용한 사운드 이벤트 검출 방식을 제안한다. 제안하는 시스템에서는 홈 내의 여러 무선 마이크 센서들로부터 높은 신호 품질을 갖는 두 개의 채널을 선택하고, 그 신호들로부터 도착신호 지연시간, 피치 범위, 그리고 다중 스케일 합성 곱 신경망을 로그멜 스펙트로그램에 적용하여 추출한 특징들을 양방향 게이트 순환 신경망 기반의 분류기에 적용함으로써 사운드 이벤트 검출의 성능을 더욱 향상시킨다. 검출된 사운드 이벤트 결과는 선택된 채널의 센서 위치와 함께 텍스트로 변환되어 청각 장애인에게 제공된다. 실험결과는 제안한 시스템의 사운드 이벤트 검출 방식이 기존 방식보다 우수하며 청각 장애인에게 효과적으로 사운드 정보를 전달할 수 있음을 보인다.

하모닉 정보를 이용한 SAOC의 보컬 신호 제거 방법에 관한 연구 (A Study on Vocal Removal Scheme of SAOC Using Harmonic Information)

  • 박지훈;장대근;한민수
    • 한국멀티미디어학회논문지
    • /
    • 제16권10호
    • /
    • pp.1171-1179
    • /
    • 2013
  • IAS는 대게 사용자가 자신의 취향에 맞는 음악을 직접 제작 및 편집 가능한 기능을 제공하는 서비스이다. SAOC는 낮은 전송률로 IAS가 가능한 다객체 오디오 코딩 기술이다. 하지만 SAOC 기법은 특정 객체를 제거하는 경우, 특히 보컬 객체를 제거하는 경우 배경음악에 보컬 객체의 하모닉이 남아있는 문제점이 있다. 그래서 본 논문은 하모닉 추출과 제거를 사용한 보컬 객체 제거 기법을 제안한다. 제안 하는 기법은 부호화기에서 추출한 하모닉 정보를 이용하여 복호화기에서 보컬 객체 신호를 다운믹스 신호에서 제거하는 기법이다. 하모닉 정보로써, 기본 주파수, MVF, 하모닉 크기를 사용한다. 성능평가로 객관적, 주관적 실험을 수행하였으며 모든 실험 결과를 통해 SAOC 기법보다 제안하는 기법이 우수함을 확인한다.

디지털 음원의 촉각 자극 전이를 위한 미디어 플레이어에 대한 연구 (A research on the media player transferring vibrotactile stimulation from digital sound)

  • 임영훈;이수진;정종환;하지민;황민철;박준석
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2007년도 학술대회 1부
    • /
    • pp.881-886
    • /
    • 2007
  • 오감 융합 정보 시대가 도래한다. 오감 융합은 감각 정보의 전이 기술 개발로 가능하다. 본 연구는 청각 정보의 촉각 정보 전이에 대한 연구이다. WMPlayer10SDK는 마이크로소프트사의 윈도우즈 미디어 플레이어(Windows Media Player, WMP)를 전용 소프트웨어 기반으로 하는 Plug-in 개발툴이다. WMPlayer10SDK 시스템은 WMP 내에서의 비디오와 오디오의 신호 정보를 추출하는 부분을 제공한다. 이를 이용하여 촉각 디스플레이(Tactile Display)장치인 Pos Tactor를 연동하여 음성 신호에서 진동 촉각을 제시하는 시스템을 개발하였다. 음성신호는 8bit, 16bit, 24bit, 32bit로 구분되며 각각의 주파수와 음폭의 Scale을 계산하여 그 수치를 시리얼 통신을 사용하여 통신포트(COM1)에 38400bps로 전달하여 구동하게 하였다. 이를 이용하여 음악을 촉감으로 느끼는 뮤직슈트(music suit)를 개발 하였다. 그러므로 뮤직슈트의 적용된 기술은 청각적 체험을 촉각적 체험을 할 수 있는 오감 융합 기술의 기초 기술로 제공 될 수 있다.

  • PDF

디지털 라디오 수신기에 마치는 전파 간섭 분석 (Analysis of interference on Digital Radio Receiver)

  • 홍우현;김주석;이용태;백명선;김경석
    • 한국통신학회논문지
    • /
    • 제35권11A호
    • /
    • pp.1059-1065
    • /
    • 2010
  • 최근 아날로그 라디오 방송에서 고품질 오디오 및 영상을 포함한 부가데이터 서비스가 가능한 디지털 멀티미디어방송 방식으로의 전환이 급격히 이루어지는 추세에 있다. 디지털라디오란 기존의 FM/AM 라디오를 디지털 신호로 전송하는 것으로 보다 깨끗한 음질과 교통, 날씨정보 등 다양한 부가 서비스를 제공할 수 있다는 장점이 있다. 이 밖에도 라디오가 디지털로 전환되면 갈수록 늘어나는 FM 주파수에 대한 수요도 충족시킬 수 있을 것으로 기대하고 있다. 본 논문에서는 동일 주파수 대역에서 Digital FM Radio 시스템의 수신 전계 강도를 이용하여 디지털 라디오 방송의 간섭영향을 분석하였고, 간섭신호의 송신 출력과 희망신호의 송선 출력에 따른 Digital FM Radio 수신기의 전파 간섭 영향을 분석하였다, Digital FM Radio 수신기의 최소전계강도식과 ($S/(N_o+I)$)의 식을 유도하여 Digital FM Radio의 환경을 모의실험에 적용하여 결과를 확인하였다.

이차 보간에 따른 ENF 기반의 위변조 디지털 파일 탐지 기법 (ENF based Detection of Forgery and Falsification of Digital Files due to Quadratic Interpolation)

  • 박세진;윤지원
    • 정보과학회 논문지
    • /
    • 제45권3호
    • /
    • pp.311-320
    • /
    • 2018
  • 최근 형사 및 모든 분야의 소송에서 디지털 오디오 및 비디오를 증거로써 사용하는 경우가 증가하고 있으며, 이에 디지털 포렌식 기법을 이용한 과학 수사가 발전하고 있다. 컴퓨팅 기능과 파일 편집 기술의 발달로 누구나 간단하게 비디오 파일을 조작할 수 있게 되면서 디지털 데이터를 조작하는 사례는 증가하고 있으며, 이로 인해 디지털 데이터에 대한 감정을 통해 증거의 무결성과 신뢰성을 확보하는 일이 요구되고 있다. 본 연구에서는 디지털 포렌식 기법 중 하나로 전력 공급에 대한 지리적 환경에 따른 전력망 그리드를 통해 전력망 주파수 신호(Electrical Network Frequency: ENF)를 추출하고 QIFFT를 이용해 peak 검출을 위한 신호처리 과정을 거치는 기법에 대해 제안한다. 그리고 표준편차를 이용한 탐지 알고리즘을 통해 73%의 정확도로 비디오 파일의 위변조 여부 확인 및 위변조 지점을 찾는 실험을 진행하고 이를 검증하였다.

심층 신뢰 신경망을 이용한 오푸스 코덱 기반 인공 음성 대역 확장 기술 (Artificial speech bandwidth extension technique based on opus codec using deep belief network)

  • 최윤상;이아성;강상원
    • 한국음향학회지
    • /
    • 제36권1호
    • /
    • pp.70-77
    • /
    • 2017
  • 대역폭 확장 기술은 300 ~ 3,400 Hz 대역의 협대역 음성 신호를 50 ~ 7,000 Hz 대역의 광대역 음성신호로 확장하여 음질, 명료도, 그리고 자연성을 높이는 기술이다. 본 논문에서는 협대역 음성 정보를 이용하여 광대역 음성신호를 추정하는 인공 대역폭 확장 기술을 설계하여, 오푸스(Opus) 오디오 복호화기에 내장시킴으로써, 대역폭 확장 모듈에서의 LPC(Linear Prediction Coding) 분석 및 LSF(Line Spectral Frequencies) 해석과 관련된 계산량을 감소시켰고 알고리즘 지연도 줄였다. 이를 위해 현재 다양한 분야에 적용되고 있는 딥 러닝 기술 중 하나인 심층 신뢰 신경망(Deep Belief Network, DBN) 방식을 스펙트럼 포락선 확장에 도입하여 전통적인 코드북 매핑법보다 더 좋은 품질의 스펙트럼을 만들 수 있었다.

1-비트 4차 델타-시그마 변조기법을 이용한 D급 디지털 오디오 증폭기 (Class-D Digital Audio Amplifier Using 1-bit 4th-order Delta-Sigma Modulation)

  • 강경식;최영길;노형동;남현석;노정진
    • 대한전자공학회논문지SD
    • /
    • 제45권3호
    • /
    • pp.44-53
    • /
    • 2008
  • 본 논문에서는 휴대용 오디고 제품의 헤드폰 구동을 위한 델타-시그마 변조기법 기반의 D급 증폭기를 제안한다. 제안된 D급 증폭기는 고성능 단일 비트 4차 델타-시그마 변조기를 이용하여 펄스폭 변조 신호를 발생시킨다. 높은 신호 대 잡음비를 얻는 것과 동시에 시스템의 안정성 확보를 위하여 시뮬레이션을 통해 변조기 루프필터의 폴과 제로를 최적화하였다. 테스트 칩은 $0.18{\mu}m$ CMOS 공정으로 제작되었다. 칩 면적은 $1.6mm^2$ 이며, 20Hz 부터 20kHz까지의 신호대역을 대상으로 동작한다. 3V 전원전압과 32옴의 로드를 사용하여 측정된 출력은 0.03% 이하의 전고조파 왜율을 갖는다.

수신 다이버시티를 이용한 음향 통신 시스템의 성능 향상 분석 (Performance Improvement analysis of Acoustic Communication System using Receive Diversity)

  • 복준영;유흥균
    • 한국통신학회논문지
    • /
    • 제36권3A호
    • /
    • pp.198-204
    • /
    • 2011
  • 음향 통신 시스템은 오디오와 데이터를 동시에 전송하는 기술이다. 음향 통신 시스템은 데이터 신호의 파워를 높게 할수록 데이터 신호가 소리로 들리는 문제점을 가진다. 데이터 신호의 송신 파워가 낮아질수록 전송 가능한 거리는 감소된다. 따라서 음향 통신 시스템에서 전송 거리를 증가시킬 수 있는 방법에 대한 연구가 필요하다. 본 논문에서는 데이터 전송 효율을 높이기 위해 사용되는 수신 다이버시티 기법을 음향 통신 시스템에 적용하여 송신 거리를 향상 시키고자 한다. 동일한 송신 파워로 전송될 때 제안된 시스템과 기존 시스템의 수신 성능을 거리에 따라 측정 하였다. Single Input Sing Output (SISO) 시스템에서 $7{\times}10^{-3}$의 Bit Error Rate (BER) 성능을 만족 시키는 거리가 약 2m 일 경우, Selection Combining (SC) 기법을 적용하게 되면 약 3m로 거리가 증가하고, Equal Gain Combining (EGC) 기법을 적용하면 약 4m 에서도 수신 성능을 만족 시킬 수 있다.