• 제목/요약/키워드: 부대역

검색결과 216건 처리시간 0.021초

음성인식을 위한 주파수 부대역별 효과적인 특징추출 (Effective Feature Extraction in the Individual frequency Sub-bands for Speech Recognition)

  • 지상문
    • 한국정보통신학회논문지
    • /
    • 제7권4호
    • /
    • pp.598-603
    • /
    • 2003
  • 본 논문에서는 주파수 부대역마다 최적의 특징추출을 위해서, 음성인식률을 기준으로 최적의 방법을 선택한다. 다중대역 음성인식 접근을 사용하여 각기 다른 주파수 영역에서 특징벡터를 독립적으로 추출함으로써 부대역별로 다른 특징추출 방법을 적용할 수 있었다. 저주파 대역의 음성은 비교적 스펙트럼의 구조가 명확하므로 전극모델을 사용하는 것이 효과적이었고, 고주파 대역에서는 비모수적인 변환방법인 이산 코사인 변환을 사용한 켑스트럼이 효과적이었다. 부대역별로 효과적인 특징추출 방법을 사용함으로써, 각 주파수 부대역에 포함된 음성인식을 위한 언어정보를 보다 효과적으로 추출할 수 있었다. 음성인식 실험결과, 제안한 방법은 전대역 특징추출보다 우수한 성능을 나타내었다.

다중대역 음성인식을 위한 부대역 신뢰도의 추정 및 가중 (Estimation and Weighting of Sub-band Reliability for Multi-band Speech Recognition)

  • 조훈영;지상문;오영환
    • 한국음향학회지
    • /
    • 제21권6호
    • /
    • pp.552-558
    • /
    • 2002
  • 최근에 Fletcher의 HSR (human speech recognition) 이론을 기초로 한 다중대역 (multi-band) 음성인식이 활발히 연구되고 있다. 다중대역 음성인식은 주파수 영역을 다수의 부대역으로 나누고 별도로 인식한 뒤 부대역들의 인식결과를 부대역 신뢰도로 가중 및 통합하여 최종 판단을 내리는 새로운 음성인식 방식으로서 잡음환경에 특히 강인하다고 알려졌다. 잡음이 정상적인 경우 무음구간의 잡음정보를 이용하여 부대역 신호대 잡음비(SNR)를 추정하고 이를 가중치로 사용하기도 하였으나, 비정상잡음은 시간에 따라 특성이 변하여 부대역 신호대 잡음비를 추정하기가 쉽지 않다. 본 논문에서는 깨끗한 음성으로 학습한 은닉 마코프 모델과 잡음음성의 통계적 정합에 의해 각 부대역에서 모델과 잡음음성 사이의 거리를 추정하고, 이 거리의 역을 부대역 가중치로 사용하는 ISD (inverse sub-band distance) 가중을 제안한다. 1500∼1800㎐로 대역이 제한된 백색잡음 및 클래식 기타음에 대한 인식 실험 결과, 제안한 방법은 정상 및 비정상대역제한잡음에 대하여 부대역의 신뢰도를 효과적으로 표현하며 인식 성능을 향상시켰다.

주파수 부대역의 켑스트럼 해상도 최적화에 의한 특징추출 (Feature Extraction by Optimizing the Cepstral Resolution of Frequency Sub-bands)

  • 지상문;조훈영;오영환
    • 한국음향학회지
    • /
    • 제22권1호
    • /
    • pp.35-41
    • /
    • 2003
  • 일반적인 음성인식 방법에서는 주파수 전대역에서 추출한 특징벡터를 사용하므로, 각 주파수 부대역은 최종인식 결과에 동등하게 기여한다. 본 논문에서는 주파수 부대역별로 독립적인 특징을 추출하고, 음성인식에 효과적이 되도록 부대역의 켑스트럼 해상도를 조절하는 방법을 제안한다. 주파수 부대역별로 독립적인 특징을 추출하는 멀티밴드 음성인식접근을 사용하여 부대역 특징벡터의 차원을 변화시킨다. 최적의 벡터 차원 조합을 찾기 위하여 음성인식률과 군집화 품질을 사용한다. TIDIGITS 연결 숫자음을 사용한 실험결과에서, 제안한 방법은 전대역 특징추출에 비해 적은 계산량으로도 숫자열 인식률은 99.12%, 백분율 정확도 (percent correct)는 99.775%, 백분율 정밀도 (percent accuracy)는 99.705%를 얻었으며, 이는 전대역 특징벡터에 비해 상대적 오류율을 각각 38%, 32%, 37% 감소시킨 결과이다.

Quad-tree Fresnelet 변환을 이용한 디지털 홀로그램 데이터 압축 기법 (Digital Hologram Data Compression Scheme using Quad-tree Fresnelet Transform)

  • 양예진;이윤혁;서영호;김동욱
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2015년도 하계학술대회
    • /
    • pp.62-64
    • /
    • 2015
  • 본 논문에서는 디지털 홀로그램 영상 데이터를 Fresnelet 변환을 이용하여 압축하는 기법을 다룬다. 이 방법은 quad-tree 기반 Fresnelet 변환을 통해 주파수 영역의 부대역으로 나누고, 각 부대역의 에너지에 따라 일정 순서의 부대역을 제거한 후, 나머지 부대역들을 2 차원 동영상 압축기로 압축하는 방식이다. 압축기는 H.264/AVC 와 HEVC 사용되며, 실험결과는 압축기를 거치지 않고 특정 부대역의 에너지를 제거한 영상과 원본과의 화질을 비교하고, 제거되는 않은 영역들을 압축한 결과 압축률에 따른 화질을 비교, 분석한다.

  • PDF

웨이블릿 코덱에서의 Inter-Intra 움직임 예측 기법 (Inter-Intra Motion Estimation in Wavelet based Codec)

  • 이주경;김충길;강정구;정기동
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (C)
    • /
    • pp.187-189
    • /
    • 2003
  • 웨이블릿 변환에 기반한 동영상 코덱에서의 움직임 예측 기법은 OCT 기반 코덱과 유사하게 이전 프레임과의 움직임 예측을 통하여 수행된다. 그러나, 현재 프레임이 이전 프레임을 참조하므로 네트워크상의 전송시 이전 프레임에 발생한 오류가 전달되는 오류 전파의 문제도 발생하게 된다. 본 논문에서는 웨이블릿 변환된 프레임의 특성을 이용하여 최상위 레벨의 LL 부대역만 이전 프레임과의 움직임 예측을 수행하고, 나머지 부대역에 대하여 프레임 내의 상위레벨의 부대역이 하위 부대역을 창조하여 예측 및 보상을 수행하여 오류전파의 가능성을 최소화하는 Inter-Intra ME 동영상 코덱을 제안한다 제안된 움직임 예측을 사용하여 MAD(Mean-Absolute Differences)를 측정한 결과, 프레임간 변화가 심한 경우에는 제안된 기법과 이전 프레임의 부대역을 참조한 기법 사이의 압축율은 유사하게 나타났으며, 변화가 적은 경우에는 이전 프레임을 참조하는 것의 압축율이 높게 나타났다. 그러나, 네트워크 전송시 발생하는 오류전파에는 제안된 기법의 성능이 우수한 것으로 나타났다.

  • PDF

음향 반향 제거기의 수렴속도 개선에 대한 연구 (Study on Improvement of Convergence Rate of Acoustic Echo Canceller)

  • 강희훈
    • 한국전자통신학회논문지
    • /
    • 제4권1호
    • /
    • pp.66-69
    • /
    • 2009
  • 적응형 반향제거기는 스피커폰, 3G 화상전화와 VoIP 서비스 시스템과 같은 응용분야에 필수적인 요소이다. 일반적인 반향제거기들은 반향을 제거하기 위해서 매우 많은 탭을 필요한다. 이들 탭수의 증가는 계산량을 증가시키고 수렴속도를 떨어뜨리는 원인이 된다. 이러한 단점들을 극복하기 위해서, 본 논문에서는 수렴속도를 개선할 수 있는 적응형 반향제거기를 제안한다. 본 논문에서 수렴속도를 개선하기 위해서 반향대역을 부대역으로 구분하고 각 부대역에 적용형 필터링을 적용한다. 각 부대역 필터는 부대역 반향 신호로써 반향신호를 인식하게 되고 따라서 동적인 부대역이 적게 되어 수렴속도를 빠르게 한다. 게다가 탭수와 가중치 갱신이 각 부대역에서 산출되므로 각 적응 필터의 구현상 복잡성을 감소시킨다.

  • PDF

프레넬릿 기반의 디지털 홀로그램 부호화를 위한 쿼드트리 부대역 양자화기 설계 (Quad-tree Subband Quantizer Design for Digital Hologram Encoding based on Fresenelet)

  • 서영호;김문석;김동욱
    • 한국정보통신학회논문지
    • /
    • 제19권5호
    • /
    • pp.1180-1188
    • /
    • 2015
  • 본 논문에서는 프레넬릿 변환을 이용하여 디지털 홀로그램을 압축할 경우에 사용될 수 있는 쿼드트리 형태의 부대역 양자화기를 제안한다. 획득된 디지털 홀로그램에 대해서 프레넬릿 변환을 수행한 후에 각 부대역별로 화소당 평균 에너지와 부대역의 시각적인 중요도를 분석하여 부대역이 복원 영상에 비치는 영상을 분석하였다. 각 부대역별로 계수들의 분포를 분석하여 다이나믹 영역을 정하고, 부대역 양자화기를 설계하였다. 설계한 양자화기의 효율을 높이기 위해서 다이나믹 영역 외의 영역에 존재하는 계수를 활용하는 방법을 적용하였고, 이를 예외 계수라 하였다. 그 결과 σ′ = 5.0인 범위에서 높은 성능을 가질 수 있는 양자화기를 설계하였다.

다중 반향 커널을 이용한 부대역 신호 기반 오디오 워터마킹 (Audio Watermarking in Sub-band Signals Using Multiple Echo Kernel)

  • 오인정;조재원;정현열;정호열
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 춘계학술발표대회 논문집 제23권 1호
    • /
    • pp.355-358
    • /
    • 2004
  • 최근 웨이블릿 변환을 이용하여 저주파수 부대역 신호를 반복적으로 분해하고 삽입된 워터마크 비트에 따라 특정 부대역 신호에 두개의 다른 반향 중 하나를 삽입하는 반향 삽입 기법을 제안하였다. 이 기법은 오디오 신호의 주파수 특성을 고려했기 때문에 시간 영역에서의 기존의 반향 삽입 기법에 비해 비가청성(inaudibility), 워터마크의 강인성(robustness) 및 용적성(capacity)을 모두 증가시킬 수 있다. 기존의 부대역 신호 기반 반향 삽입 기법이 단일 반향 커널만을 이용하였으나, 본 논문에서는 부대역 신호에 다중 반향 커널을 이용한 반향 삽입 기법을 제안한다. 이 기법은 주관적 왜곡(perceptibility)과 SNR(signal to Noise Ratio)과 같은 객관적인 왜곡 면에서, 원본 오디오 신호의 왜곡을 줄일 수 있다. 실험 결과를 통하여 기존의 방법에 비해 제안된 방법이 SNR과 DR(Detection Rate) 모두 좋은 성능을 보여 제안된 방법의 유효성을 입증하였다.

  • PDF

부대역 부호화기법에 따른 직교 주파수분할다중화의 첨두대 평균전력비 (Peak-to-Average Power Ratio of OFDM with respect to the Subchannel Coding Schemes)

  • 강석근
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2004년도 하계종합학술대회 논문집(1)
    • /
    • pp.63-66
    • /
    • 2004
  • 본 논문에서는 채널간간섭 자기소거를 위한 부대역 부호화기법에 따른 직교 주파수분할다중화의 첨두전력대 평균전력비가 분석된다. 인접부대역에 대척신호를 할당하는 기존 상관부호화의 경우 전송신호열에서 형상성분이 발생되며, 이로 인하여 직교 주파수분할다중화 시스템의 첨두전력 대 평균전력비가 최대 3dB 가량 증가됨을 이론적$\cdot$실험적으로 검증한다. 그리고 이와 같은 형상성분을 제거할 수 있는 새로운 부대역 부호화기법이 제시된다. 여기서는 인접부대역에 할당되는 신호쌍의 위상차가 신호사상기의 출력에 따라 변화된다. 그 결과, 새로운 부대역 부호화기법이 적용된 시스템은 기존의 시스템보다 $2\~3dB$ 적은 첨두전력 대 평균전력비를 가지는 것을 확인할 수 있다.

  • PDF

2차원 DWT 부대역의 주파수 특성과 디지털 워터마킹 특성 (Frequency characteristics of 2D-DWT subbands and Digital Watermarking Characteristics)

  • 강이슬;이용석;서영호;김동욱
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2016년도 추계학술대회
    • /
    • pp.103-106
    • /
    • 2016
  • 인터넷 사용의 발달로 디지털 미디어 영상에 대한 불법 복제, 불법 배포 등의 문제가 완연해짐에 따라 영상의 제작자의 소유권과 저작권을 보호할 수 있는 워터마크 기법이 많이 연구되고 있다. 워터마크 시스템은 워터마크 삽입 후, 삽입정보를 알 수 없어야하는 비가시성 특성과 여러 공격에도 훼손되지 않고 추출될 수 있는 강인함을 가지고 있어야 한다. 이에 본 논문은 이산 웨이블릿 변환(DWT)으로 생성되는 부대역의 점유 주파수대역 특성과 공격이 이 부대역들에 미치는 영향을 분석하고, 이를 사용하여 디지털 워터마킹을 수행하였을 때 추출률을 최고로 하기 위해서는 변환된 부대역이 특정 범위내의 해상도를 가져야 한다는 것을 보인다. 본 연구는 실험적 방법으로 모든 부분연구는 실험에 의해서 결정된다.

  • PDF