• 제목/요약/키워드: 필터뱅크

검색결과 250건 처리시간 0.026초

깊은 신경망을 이용한 오디오 이벤트 검출 (Audio Event Detection Using Deep Neural Networks)

  • 임민규;이동현;박호성;김지환
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권1호
    • /
    • pp.183-190
    • /
    • 2017
  • 본 논문에서는 깊은 신경망을 이용한 오디오 이벤트 검출 방법을 제안한다. 오디오 입력의 매 프레임에 대한 오디오 이벤트 확률을 feed-forward 신경망을 적용하여 생성한다. 매 프레임에 대하여 멜 스케일 필터 뱅크 특징을 추출한 후, 해당 프레임의 전후 프레임으로부터의 특징벡터들을 하나의 특징벡터로 결합하고 이를 feed-forward 신경망의 입력으로 사용한다. 깊은 신경망의 출력층은 입력 프레임 특징값에 대한 오디오 이벤트 확률값을 나타낸다. 연속된 5개 이상의 프레임에서의 이벤트 확률값이 임계값을 넘을 경우 해당 구간이 오디오 이벤트로 검출된다. 검출된 오디오 이벤트는 1초 이내에 동일 이벤트로 검출되는 동안 하나의 오디오 이벤트로 유지된다. 제안된 방법으로 구현된 오디오 이벤트 검출기는 UrbanSound8K와 BBC Sound FX자료에서의 20개 오디오 이벤트에 대하여 71.8%의 검출 정확도를 보였다.

MDCT/IMDCT의 계산 복잡도를 개선하기 위한 효율적인 알고리즘 (An Efficient Algorithm for Improving Calculation Complexity of the MDCT/IMDCT)

  • 조양기;이원표;김희석
    • 대한전자공학회논문지SP
    • /
    • 제40권6호
    • /
    • pp.106-113
    • /
    • 2003
  • Modified Discrete Cosine Transform (MDCT)와 역변환인 IMDCT는 서브밴드 및 변환 코딩 기법에서 시간 영역 에일리어징 제거(Time Domain Aliasing Cancellation)를 기반으로 하는 분석/합성 필터 뱅크로서 채택되고 있으며, MPEG 오디오 표준의 레이어-Ⅲ에서 가장 많은 연산 량을 필요로 한다 본 논문에서는 MDCT/IMDCT를 효율적으로 계산할 수 있는 새로운 알고리즘을 제안하였다. 제안한 알고리즘은 DCT를 이용하여 MDCT/IMDCT를 계산하는 알고리즘에 기반을 두고 있기 때문에, MDCT/IMDCT 계산을 위해 두 개의 DCT-Ⅱ를 이용한다. 더불어, 제안한 알고리즘은 4로 나누어지는 길이의 입력을 갖는 MDCT/IMDCT의 계산에도 적용할 수 있다. 제안한 알고리즘은 계산 복잡도 면에서 기존의 알고리즘들과 비교하여 적은 계산 량을 필요로 하며, 구조적인 면에서 병렬적인 구조로 나타낼 수 있기 때문에, VLSI 구현에 매우 적합하다.

최소 제곱 서포트 벡터 회귀 기반 비선형 자귀회귀 방법을 이용한 지속 모음 모델링 (Sustained Vowel Modeling using Nonlinear Autoregressive Method based on Least Squares-Support Vector Regression)

  • 장승진;김효민;박영철;최홍식;윤영로
    • 한국지능시스템학회논문지
    • /
    • 제17권7호
    • /
    • pp.957-963
    • /
    • 2007
  • 본 연구에서는 비선형 지속 모음 모델링을 위한 최소 제곱 서포트 벡터 회귀 기반 비선형 자귀회귀 방법을 소개하고 분석하였다. 비주기적인 파형 특성을 갖는 양성 후두 질환자 43명의 지속 모음을 대상으로 한 실험에서 제안된 비선형 합성기는 거의 완벽하게 혼란한 지속 모음을 생성하고 선형 예측 코딩은 할 수 없는 주파수 변동과 같은 자연스러운 음의 특성 또한 보존할 수 있었다. 하지만 일부 모음의 합성 결과 실제 원음과 다른 차이점을 보였다. 이러한 결과들은 단일 밴드 모델이 음의 고주파 성분을 조정, 분해 못하기 때문에 발생한 것이라 가정된다. 그러므로 웨이블릿 필터 뱅크를 이용한 멀티 밴드 모델을 단일 밴드 모델과 대치하여 실험을 수행한 결과 향상된 안정성을 보였다. 결과적으로 최소 제곱 서포트 벡터 회귀 기반 비선형 자귀회귀 방법은 성공적으로 원음에 가까운 합성음을 생성할 수 있다는 것을 확인 할 수 있었다.

Contourlet 변환 및 PCA에 의한 얼굴인식 (Face Recognition using Contourlet Transform and PCA)

  • 송창규;권석영;전명근
    • 한국지능시스템학회논문지
    • /
    • 제17권3호
    • /
    • pp.403-409
    • /
    • 2007
  • 컨투어렛 변환은 2차원의 웨이블렛 변환을 확장한 개념으로 다중스케일과 방향성필터뱅크를 이용한다. 이러한 컨투어렛 변환은 웨이블렛 변환의 특징인 다중스케일과 시간-주파수의 지역적 특성뿐만 아니라 방향성분에 대해서도 풍부한 정보를 얻을 수 있는 장점을 가지고 있다 본 논문에서는 컨투어렛 변환과 주성분분석기법을 이용하는 융합기법에 의한 얼굴인식 시스템을 제안한다. 제안된 방법은 먼저 컨투어렛 변환에 의해 얼굴영상을 방향성 부대역 영상으로 분할한 후, 주성분분석기법을 이용하여 방향성분별로 분할된 각각의 부영상에 대하여 특징벡터를 산출한다. 그리고 최종 단계에서는 각각의 대역별로 산출된 매칭도를 효과적으로 융합할 수 있는 융합기법을 이용하여 얼굴인식을 수행한다. 제안된 방법의 타당성을 보이기 위해 ORL 얼굴영상과 CBNU 얼굴영상을 대상으로 실험한 결과 기존 방법인 PCA나 웨이블렛 변환을 이용한 방법에 비해 향상된 인식 성능을 보임을 확인할 수 있었다.

주파수 공유기법을 적용한 RF 송수신기에 대한 연구 (The Study on the RF Transceiver Applied to Cognitive Radio Method)

  • 김기중;김종성;배문관
    • 한국전자통신학회논문지
    • /
    • 제10권12호
    • /
    • pp.1315-1320
    • /
    • 2015
  • 본 논문은 군통신 데이터링크 장비에 대해서 주파수 자원을 효율적으로 이용하기 위하여 고속도약기법, 주파수환경센싱기법, 수신2채널기법, 수신필터뱅크부 적용 등을 이용하여 동일한 주파수 대역을 사용하는 레이다 등의 타장비와 공유할 수 있는 기법을 소개한다. 사전에 운용대역의 주파수 환경을 실시간 측정 및 분석하였고, 일차적으로 개발하려는 장비가 기존 운용하고 있는 레이다에 간섭영향성이 최소화하는 방법을 분석하였으며, 반대로 레이다가 간섭을 주는 환경에서 본 논문에서 제시한 주파수 공유기법을 사용하여 최대한 통신확률을 높이는 구조를 제시한다. 최종적으로 설계된 RF송수신기의 잡음지수, 상호혼변조(IMD)와 같은 주요 규격에 대한 모의실험을 통하여 만족여부를 사전 검증하였다.

전술데이터링크용 고출력증폭기 설계 및 제작 (High Power Amplifier Design and Fabrication for Tactical Data Link)

  • 김종성;배문관;김주연
    • 전기전자학회논문지
    • /
    • 제21권4호
    • /
    • pp.338-347
    • /
    • 2017
  • 본 논문은 TDL(전술 데이터 링크)의 항공용 단말의 구성품인 고출력증폭기의 설계 및 제작에 관해 기술하였다. 동일한 주파수 대역을 사용하는 레이다 및 다른 통신장비와 한정된 주파수 자원을 효율적 사용이 가능하도록 고속주파수도약기술, 인지무선기술, 수신필터뱅크 기술을 적용하였다. 고출력증폭기는 물리적으로 송신부, 수신부, 기구부, 케이블조립체로 구성되며, 최대 전송 거리, 수신감도 등의 전기적 특성과 온도 특성을 충족하도록 설계되었다. 고출력증폭기의 요구 규격을 만족하기 위해 모델링 및 시뮬레이터를 이용하였다. 송신 출력과 잡음 지수는 각각 50.02dBm 및 2.682dB로 측정되었다. 전기적 특성 시험 및 환경 특성 시험으로 요구 규격을 모두 만족함을 확인하였다.

서포트 벡터와 뱀형상 윤곽선을 이용한 TRUS 영상의 전립선 분할 (A ProstateSegmentationofTRUS ImageusingSupport VectorsandSnake-likeContour)

  • 박재흥;서영건
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권12호
    • /
    • pp.101-109
    • /
    • 2012
  • TRUS영상에서 전립선에 대한 많은 진단과 치료 과정에서 정확한 전립선 경계의 추출이 요구된다. 여기에는 전립선 경계의 애매함, 반점, 낮은 그레이 레벨로 인하여 많은 어려움이 존재한다. 본 논문에서는 서포트 벡터와 뱀형상 윤곽선을 이용하여 TRUS영상의 자동 전립선 분할에 대한 방법을 제안한다. 이 방법은 전처리, 가버 특성 추출, 학습, 전립선 추출 단계로 구성된다. 텍스처 특성을 추출하기 위하여 가버 필터 뱅크가 사용되며, 학습 과정에서 전립선과 비전립선의 각 특성을 얻기 위하여, SVM이 사용된다. 전립선의 경계는 뱀형상 윤곽 알고리즘에 의해 추출된다. 실험 결과, 제안된 알고리즘은 인간 전문가가 추출한 경계와 비교했을 때 9.3%보다 적은 차이로 전립선 경계를 추출할 수 있었다.

잡음 환경에서 심리음향모델 기반 음성 에너지 최대화를 이용한 음성 검출 방법 (Voice Activity Detection Method Using Psycho-Acoustic Model Based on Speech Energy Maximization in Noisy Environments)

  • 최갑근;김순협
    • 한국음향학회지
    • /
    • 제28권5호
    • /
    • pp.447-453
    • /
    • 2009
  • 이 논문은 음성 에너지를 최대화 하여 낮은 SNR환경에서 음성 존재 여부를 판단하고 정확한 끝점을 검출하는 방법에 대한 것이다. 전통적인 VAD (Voice Activity Detection) 알고리듬은 잡음의 추정치를 이용해 음성과 비음성 구간을 선택하여 낮은 SNR환경이나 비안정 잡음환경에서는 정확하지 못한 문턱값으로 인해 부정확한 끝점검출을 하였다. 또한 잡음의 시간적 변화를 반영하기 위해 비교적 큰 분석 구간을 두어 계산량이 증가함에 따라 실제 응용에 적합하지 않은 단점이 있다. 이 논문은 잡음환경에서 정확한 음성 구간의 검출을 위해 심리음향 모델에 기반 한 바크 스케일 필터 뱅크를 이용하여 주어진 프레임에서 음성 에너지를 최대화 시키고 잡음을 억제하는 SEM-VAD (Speech Energy Maximization-Voice Activity Detection) 방법을 제안하였다. 다양한 잡음환경, SNR 15 dB, 10 dB 5 dB 0 dB 상황에서 실험한 결과 SNR의 변화에 안정적인 문턱값을 얻었고, 음성 검출을 위한 실험에서 자동차 잡음 환경에 대한 PHR (Pause Hit Rate)은 모든 잡음 환경에서 100%의 정확도를 보였고, FAR (False Alarm Rate)는 SNR 15 dB와 10 dB에서는 0%, SNR 5 dB에서 5.6% SNR 0 dB에서 9.5%의 성능을 보였다.

가버 필터를 사용한 철도 콘크리트 궤도 도상의 자동 균열 감지 개발 (Development of Automatic Crack Detection using the Gabor Filter for Concrete Structures of Railway Tracks)

  • 나용현;박미연;박지수;박성백;권세곤
    • 한국재난정보학회 논문집
    • /
    • 제14권4호
    • /
    • pp.458-465
    • /
    • 2018
  • 연구목적: 철도 안전에 영향을 미치는 콘크리트 궤도는 이미지분석 기술을 사용하여 균열을 감지 할 수 있으나 균열을 검출하기 위한 콘크리트 궤도 및 표면 오염의 조건이 균열검측에 방해되므로 이를 효과적으로 제거하기 위한 방법이 필요하다. 연구방법: 본 연구에서는 한국 철도의 균열을 효과적으로 감지하기 위한 이미지 분석 기법을 적용한 프로세스를 제안하고 실험 모듈을 통해 취득된 이미지를 분석하여 성능을 검증하였다. 또한, 우리는 제안된 Gabor Filter Bank 기법을 사용하여 철도 콘크리트 도상 이미지를 획득한 데이터 중 무작위로 선택된 2000개의 이미지를 개발된 프로세스를 통해 자동 균열 검측을 수행하여 타당성을 검토하였다. 연구결과: 연구에서 제안된 시스템으로 균열 검측 결과 탐지율이 약 94% 성능으로 검토되었으며 취득된 철도콘크리트도상이미지의 균열이 동일한 크기와 형식으로 일치하였다. 결론: Gabor Filter Bank를 사용한 균열 검측법은 한국 철도의 콘크리트 궤도도상에 노이즈를 포함한 균열 이미지에 효과적으로 분석되는 것을 확인 할 수 있었다. 이 시스템은 기존의 인간 위주의 철도 산업에서 자동화 된 유지 관리 시스템이 될 수 있을 것으로 기대된다.

효율적인 SHM을 위한 압축센싱 기술 - Kobe 지진파형을 이용한 CAFB의 최적화 및 지진응답실험 중심으로 (Compression Sensing Technique for Efficient Structural Health Monitoring - Focusing on Optimization of CAFB and Shaking Table Test Using Kobe Seismic Waveforms)

  • 허광희;이진옥;서상구;정유승;전준용
    • 한국구조물진단유지관리공학회 논문집
    • /
    • 제24권2호
    • /
    • pp.23-32
    • /
    • 2020
  • 압축센싱 기술인 CAFB는 대상 구조물의 원시신호를 목적된 주파수 범위의 신호로 압축하여 획득하도록 개발되었다[27]. 이때 압축센싱을 위해 CAFB는 대상 구조물의 목적된 주파수 범위에 따라 다양한 기준신호로 최적화 될 수 있다. 또한, 최적화된 CAFB는 지진과 같은 돌발/위험상황에서도 대상 구조물의 유효한 구조응답을 효율적으로 압축할 수 있어야 한다. 본 논문에서는 상대적으로 유연한 구조물의 효율적인 구조 건전도 모니터링을 위하여 목적된 주파수 범위를 10Hz 미만으로 설정하고, 이를 위한 CAFB의 최적화 방법과 지진상황에서 CAFB의 지진응답성능을실험적으로 평가하였다. 이를 위해 본 논문에서는, 먼저 Kobe 지진파형을 이용하여 CAFB를 최적화하였고, 이를 자체 개발한 무선 IDAQ 시스템에 임베디드 하였다. 그리고, Kobe 지진파형을 이용하여 2경간 교량에 대한 지진응답실험을 수행하였다. 마지막으로 CAFB가 내장된 IDAQ 시스템을 이용하여 실시간으로 2경간 교량의 지진응답을 무선으로 획득하고, 획득된 압축신호는 원시신호와 상호 비교하였다. 실험의 결과로부터 압축신호는 원시신호와 대비하여 우수한 응답성능과 데이터 압축효과를 보였고, 또한 CAFB는 지진상황에서도 구조물의 유효한 구조응답을 효과적으로 압축센싱할 수 있었다. 최종적으로 본 논문에서는 목적된 주파수 범위(10Hz 미만)에 적합하도록 CAFB의 최적화 방법을 제시하였고, CAFB는 지진상황의 계측-모니터링을 위해 경제적이고 효율적인 데이터 압축센싱 기술임을 증명하였다.