• 제목/요약/키워드: 오디오신호

검색결과 435건 처리시간 0.024초

청각장애인을 위한 사운드 이벤트 검출 기반 홈 모니터링 시스템 (Home monitoring system based on sound event detection for the hard-of-hearing)

  • 김지연;신승수;김형국
    • 한국음향학회지
    • /
    • 제38권4호
    • /
    • pp.427-432
    • /
    • 2019
  • 본 논문에서는 청각장애인을 위해 양방향 게이트 순환 신경망을 이용한 사운드 이벤트 검출 기반의 홈 모니터링 시스템을 제안한다. 제안된 시스템에서는 우선적으로 효과적인 사운드 이벤트 검출을 위해 패킷손실 은닉을 이용하여 무선 센서 네트워크로 인해 손실된 신호를 복원하고, 멀티채널 상호 상관관계 계수를 이용하여 신뢰할 수 있는 채널을 선택한다. 선택된 채널의 사운드는 이벤트 검출을 위해 두 개의 오디오 채널을 사용하는 양방향 게이트 순환신경망에 적용된다. 검출된 사운드 이벤트는 텍스트로 변환되며, 이와 함께 하모닉/퍼커시브 음원 분리 방식을 통해 햅틱 신호로 변환되어 청각장애인에게 제공된다. 실험결과는 제안한 사운드 검출기반의 성능이 기존 방식보다 더 우수하다는 것과 음원 분리 방식을 통해 사운드를 세밀한 햅틱 신호로 표현할 수 있음을 보인다.

독립 성분 분석과 지각 필터를 이용한 음질 개선 (Performance Improvement of Speech Enhancement Using Independent Component Analysis and Perceptual Filtering)

  • 구교식;차형태
    • 한국음향학회지
    • /
    • 제29권4호
    • /
    • pp.270-277
    • /
    • 2010
  • 본 논문에서는 독립 성분 분석 기법과 적응 지각 필터를 이용하여 잡음에 오염된 신호에서 잡음을 추정 및 제거함으로서 보다 효율적으로 오디오 신호를 개선하는 방법에 대해 제안한다. 기존의 적응 지각 필터는 묵음 구간에서 추정된 고정적인 추정 잡음을 사용하기 때문에 잡음이 시간에 따라 가변적일 경우 성능이 상당히 저하된다. 그러나 제안된 알고리즘은 독립 성분 분석 기법을 이용하여 신호 구간마다 달라지는 잡음을 추정한 후 이를 적응 지각 필터에 적용시켜 준다. 제안된 알고리즘의 성능 분석을 위하여 기존 및 제안된 알고리즘을 이용한 시뮬레이션을 수행하였으며, 그 결과로 제안된 알고리즘은 기존의 알고리즘에 비해 향상된 결과를 생성하였다. 더불어 음질의 열화도 적음을 확인할 수 있었다.

HE-AAC 부호화의 저비트율에서 음질향상 기법 (Quality Improvement of Low-Bitrate HE-AAC Encoder)

  • 김정근;이재성;이태진;강경옥;박영철
    • 한국음향학회지
    • /
    • 제27권2호
    • /
    • pp.66-74
    • /
    • 2008
  • 본 논문에서는 HE-AAC (High Efficiency Advanced Audio Coding) 오디오 부호화기의 저주파 대역과 고주파 대역을 담당하고 있는 AAC부호화기와 SBR (Spectral Band Replication) 부호화기에 대해 낮은 비트율에서 효과적인 개선 방법을 제안한다. AAC 부호화기가 담당하는 저주파 대역에서 과도신호가 발생하는 부분의 프리에코를 줄이기 위하여 적용 주파수범위가 저주파 대역 방향으로 선택적으로 확장되는 eTNS (exteded Temporal Noise Shaping) 방법을 고안하였다. 또한 SBR에 의해 부호화되는 고주파 대역에서 톤 성분 복원 시에 잡음층 (Noise floor)이 추가 발생되지 않도록 정현파 모델을 통해 톤을 사전 인지하고 인지된 톤들의 주파수를 QMF 밴드의 중앙으로 재배치하여 성능 향상을 이루었다. 제안한 방법들을 사용하여 복호화한 샘플 음원들에 대해 주/객관적 음질평가를 실시한 결과, 표준 HE-AAC에 비해 향상된 결과를 보여주었다.

AVB 기반의 버스안전용 멀티뷰어의 FPGA 카메라모듈 설계 (Design of FPGA Camera Module with AVB based Multi-viewer for Bus-safety)

  • 김동진;신완수;박종배;강민구
    • 인터넷정보학회논문지
    • /
    • 제17권4호
    • /
    • pp.11-17
    • /
    • 2016
  • 본 논문에서는 버스안전을 위한 다중 HD 카메라 기반의 IP통신망 AVB(Audio Video Bridge) 이더넷 케이블을 연동한 FPGA(Xilinx Zynq702)로 멀티뷰어 플랫폼을 제안하였다. 이러한 AVB(IEEE802.1BA) 시스템은 차량용 네트워크에서 다중 HD 비디오와 오디오 디지털 신호의 실시간 전송이 가능하다. 제안한 멀티뷰어 플랫폼은 기존 이더넷 케이블 1Gbps전송과 2-선 100Mbps 스트림 전송방식을 통해 4개의 초광각 HD 카메라로 부터 H.264 비디오 신호를 다중화하기 위한 지연속도의 개선을 위해 FPGA로 설계하였다. 아울러, 차량용 HD 동영상 전송망에서 시간지연을 최소화하기 위한 AVB 플랫폼은 Zynq 702기반의 H.264 AVC 저지연 코덱의 설계 방안을 제안하였다. 이러한 H.264 AVC 코덱의 부호화/복호화 결과확인을 위해 JM 모델을 참조한 PSNR(Peak Signal-to-noise-ratio)을 분석하였다. 설계한 Zynq 702기반의 H.264 AVC CODEC은 다중 HD 카메라의 다중뷰어 동영상 손실 압축에서 화질 손실에 대한 PSNR은 이론 값과 유사한 HW 결과 값을 확인하였다. 이로서 제안한 AVB기반의 다중 HD 카메라 연동형 멀티뷰어 플랫폼은 H.264 AVC CODEC의 저지연 특성이 차량용 특성에 만족함으로서 버스안전을 위한 주변의 오디오와 비디오 영상감시가 가능할 것이다.

전력선통신 기반 음향 시스템 설계 및 특성 분석 (Sound System Design and Characteristic Analysis based on Power Line Communication)

  • 김관규;염경태;김관웅;김용갑
    • 한국콘텐츠학회논문지
    • /
    • 제8권6호
    • /
    • pp.1-7
    • /
    • 2008
  • 본 논문은 기존의 음향 시스템이 가지고 있는 시스템 구성의 어려움, 추가설치비용 증가, 비 친화적인 인테리어의 문제점을 해결하기 위한 연구이다. 기존 시스템의 문제점을 해결하기 위하여 전력선통신을 기반으로 새로운 음향 시스템을 설계하고 특성을 연구하였다. PLC 전용칩 INT5500CS을 사용하여 송신기와 수신기를 설계하였으며, 송신부에서 CD PLAYER로 음향 신호를 제공하고 수신부에 스피커를 연결하여 출력하는 음향 시스템을 구성하였다. 구성된 시스템의 특성분석을 위해 USBPre 외장사운드 카드와 PC기반의 음향 측정/분석 프로그램인 Smaart Live 5를 추가 구성하여 실험하였다. 실험 결과, Measurement 신호는 Reference 신호보다 $2{\sim}3$[dB]정도의 낮은 신호레벨을 보였으며, Latency는 16.69[ms]을 확인하였고, Coherency는 고 주파수대역에서 특성이 나빠졌음을 확인하였다. 반면에, Pink Noise 및 특정 주파수 1[kHz], Phase, Magnitude를 확인한 결과 90[%] 이상으로 정상적인 신호의 송수신이 이루어 졌음을 확인하였다. 이러한 결과, 본 고에서 설계한 시스템의 성능이 우수함을 밝혔고, 이를 통해 기존 오디오 신호 전송 시스템의 문제점을 해결하였다.

실데이터 기반 능동 소나 신호 합성 방법론 (Real data-based active sonar signal synthesis method)

  • 김윤수;김주호;석종원;홍정표
    • 한국음향학회지
    • /
    • 제43권1호
    • /
    • pp.9-18
    • /
    • 2024
  • 최근 수중표적의 저소음화와 해상교통량의 증가로 인한 주변 소음의 증가로 능동 소나 시스템의 중요성이 증대되고 있다. 하지만 신호의 다중 경로를 통한 전파, 다양한 클러터와 주변 소음 및 잔향 등으로 인한 반향신호의 낮은 신호대잡음비는 능동 소나를 통한 수중 표적 식별을 어렵게 만든다. 최근 수중 표적 식별 시스템의 성능을 향상 시키기 위해 머신러닝 혹은 딥러닝과 같은 데이터 기반의 방법을 적용시키려는 시도가 있지만, 소나 데이터셋의 특성 상 훈련에 충분한 데이터를 모으는 것이 어렵다. 부족한 능동 소나 데이터를 보완하기 위해 수학적 모델링에 기반한 방법이 주로 활용되어오고 있다. 그러나 수학적 모델링에 기반한 방법론은 복잡한 수중 현상을 정확하게 모의하는 데에는 한계가 있다. 따라서 본 논문에서는 심층 신경망 기반의 소나 신호 합성 기법을 제안한다. 제안하는 방법은 인공지능 모델을 소나 신호 합성 분야에 적용하기 위해, 음성 합성 분야에서 주로 사용되는 타코트론 모델의 주요 모듈인 주의도 기반의 인코더 및 디코더를 소나 신호에 적절하게 수정하였다. 실제 해상 환경에 모의 표적기를 배치해 수집한 데이터셋을 사용하여 제안하는 모델을 훈련시킴으로써 보다 실제 신호와 유사한 신호를 합성해낼 수 있게 된다. 제안된 방법의 성능을 검증하기 위해, 합성된 음파 신호의 스펙트럼을 직접 분석을 진행하여 비교하였으며, 이를 바탕으로 오디오 품질 인지적 평가(Perceptual Quality of Audio Quality, PEAQ)인지적 성능 검사를 실시하여 총 4개의 서로 다른 환경에서 생성된 반사 신호들에 대해 원본과 비교해 그 차이가 최소 -2.3이내의 높은 성적을 보여주었다. 이는 본 논문에서 제안한 방법으로 생성한 능동 소나 신호가 보다 실제 신호에 근사한다는 것을 입증한다.

DAB망에서 멀티미디어 서비스를 위한 MOT 프로토콜 성능 최적화 방안에 관한 연구 (A Study on MOT Protocol for multimedia Service on Digital Audio Broadcasting Network)

  • 고예윤;조규섭
    • 융합신호처리학회논문지
    • /
    • 제4권2호
    • /
    • pp.7-11
    • /
    • 2003
  • 최근 들어 디지털 기술의 급속한 발전과 더불어 다양한 형태의 광대역 멀티미디어 서비스들에 대한 요구가 증대되어 지면서 라디오 방송 역시 디지털화가 진전되고 있다 DAB(Digital Audio Broadcasting)는 기존의 아날로그 라디오 방송을 대체할 새로운 형태의 멀티미디어 방송 시스템으로 고품질 오디오 방송뿐만 아니라 다양한 멀티미디어 데이터 서비스도 제공할 수 있다. 본 논문에서는 DAB 망에서 효율적인 멀티미디어 서비스를 제공하기 위해 부가서비스 제공을 위한 표준인 MOT 프로토콜 성능 최적화 방안에 대해 연구하였다 MOT 프로토콜은 세그먼트 크기, 세그먼트 반복횟수 등에 따라 그 성능이 변화하므로, 성능을 최적화하기 위한 값들을 다중 경로 채널 하에서 시뮬레이션을 통하여 찾아내었다. 시뮬레이션의 결과에 따르면, DAB 망에서 멀티미디어 서비스를 제공하기 위해 사용하는 MOT 프로토콜에서 사용하는 세그먼트의 크기는 2Kbyte 정도가 적절하며, 반복횟수는 4회 정도가 적절함을 알 수 있다.

  • PDF

HRTF를 이용한 헤드폰 기반의 다채널 입체음향 생성 (Headphone-based multi-channel 3D sound generation using HRTF)

  • 김시호;김경훈;배건성;최송인;박만호
    • 대한전자공학회논문지SP
    • /
    • 제42권1호
    • /
    • pp.71-77
    • /
    • 2005
  • 본 논문에서는 5.1채널 입체음향 오디오 신호를 2채널의 헤드폰으로 재생하기 위한 HRTF (Head Related Transfer Function) 기반의 입체음향 생성 시스템에 대하여 다룬다. 각 채널의 모노 입력신호는 HRTF를 이용한 바이노럴(binaural) 필터링을 통해 가상적으로 음상정위되며, 입체감과 공간감을 증가시키기 위해 잔향효과가 추가된다. 연산량 감소를 위해 음상정위 성능을 저하시키지 않는 범위에서 HRTF의 임펄스 응답 탭 수를 줄였으며, 잔향효과를 위한 음장제어부에서는 초기반사열중 주요한 성분만을 지연기로 모델링하였다. 또한 비개인화된 HRTF DB에 의란 앞/뒤 혼돈 문제를 줄이기 위하여 앞/뒤 스펙트럼의 차를 가중치로 하여 HRTF 스펙트럼을 강조하는 방법을 적용하였다. 구현한 시스템의 성능 평가 결과, 단순한 스테레오 방법이나 2채널 Down Mixing 방식에 비해 현실감 있고 방향성 있는 입체음향을 느낄 수가 있었다.

음악의 클라이맥스 추출을 이용한 내용 기반 장르 분류 (Content-Based Genre Classification Using Climax Extraction in Music)

  • 고일주;정명범
    • 한국멀티미디어학회논문지
    • /
    • 제10권7호
    • /
    • pp.817-826
    • /
    • 2007
  • 기존의 음악 분류 연구는 음악에서 임의 20초 구간 또는 $40%{\sim}45%$ 지난 부분으로부터 20초 구간을 얻은 후 여러 가지 신호적 특징을 추출하여 장르 분류에 사용해왔다. 본 논문에서는 기존 연구의 성공률을 높이기 위해 음악의 클라이맥스 구간을 추출하여 장르 분류하는 것을 제안한다. 음악은 도입과 진행, 클라이맥스 부분으로 나뉘며, 클라이맥스는 음악이 강조하는 부분으로서 그 음악의 특징을 가장 잘 나타낸다. 즉, 음악을 분석하거나, 분류할 때 클라이맥스 부분을 이용하면 보다 효과적인 결과를 얻을 것이다. 음악의 클라이맥스는 FFT를 이용하여 박자와 마디 정보를 얻은 후 마디별 파형 집중도로부터 추출할 수 있다. 논문에서는 기존의 연구에 사용된 방법과 제안한 방법인 클라이맥스를 이용하여 장르 분류 실험을 하였다. 기존 방법은 47%의 성공률을 보이는 반면 제안한 방법은 55% 향상된 성공률을 얻을 수 있었다.

  • PDF

고속 PLC 홈네트워크 솔루션

  • 임수빈
    • 정보와 통신
    • /
    • 제23권8호
    • /
    • pp.35-42
    • /
    • 2006
  • 최근 광대역 서비스에 대한 소비자들의 욕구가 차츰 증가하고 있고 대상콘텐츠도 데이터와 음성 및 비디오까지 포함된 멀티미디어 서비스로 변화함에 따라, 통신서비스 제공업체들은 이에 대한 해결책을 찾는 것이 지상과제가 되었다. xDSL, 케이블 모뎀, 광랜 등 엑세스 네트워크가 잘 발달되어 있는 국내에서도 멀티미디어 서비스의 최종 수신 장치가 될 TV, PC, 오디오 기기 및 전화기 등에까지 네트워크를 연결하기 위해서는 댁내에서 또 다른 홈 네트워크를 구성해야 하는 상황이다. 이러한 홈 네트워크를 가능하게 하는 기술로는 홈 RF, 무선랜, 블루투스 등 무선 홈 네트워크 기술과 IEEE1394, 이더넷, 홈 PNA, 전력선통신과 같은 유선 홈 네트워크 기술로 나눌 수 있다. 무선 홈 네트워르 기술의 경우, 댁내에서의 반사와 감쇄 등의 영향에 의한 음영지역이 존재하는 단점이 있고 또 RF단을 구현해야 하므로 시스템 가격이 올라가게 된다. IEEE1394, 이더넷, 홈 PNA 같은 유선 홈 네트워크기술의 경우에는 댁내 통신을 위해 새로운 선을 포설해야 하는데 이를 위해서는 막대한 시설 투자비가 들어가게 된다. 이 막대한 투자비는 홈 네트워크 구축에 많은 시간이 걸리게 하는 요인이 될 뿐만 아니라, 일반 사용자들이 서비스를 이용하기에는 가격적으로 부담스럽게 된다. 전력선통신 (PLC: Power Line Communication) 은 전기를 공급하는 전력선에 흐르고 있는 상용주파수 50/60Hz의 저주파 전력신호에 고주파 신호를 활용하여 데이터를 실어 나르는 통신기술이다. 집안 곳곳 이미 포설되어 있는 전력선이 이미 하나의 네트워크를 구성하고 있기 때문에 번거롭고 값비싼 추가 배선작업 없이 바로 네트워킹이 가능하다. 이와 같은 이유로 고속 PLC는 설치 용이성, 접근성, 속도 및 비용부분 등에서 경쟁기술에 비하여 여러 장점을 가지고 있다. 젤라인은 국내 전력선통신 표준을 만족하는 24Mbps 고속 전력선통신 칩을 기반으로 다양한 전력선 채널환경 하에서 최적의 통신을 보장하는 전력선 통신시스템을 제공하고 있으며, 이를 소개하고자 한다.