• 제목/요약/키워드: 코드북 검색

검색결과 37건 처리시간 0.027초

RPE 검색을 이용한 CELP 보코더의 불규칙 코드북 검색 (On a Reduction of Codebook Searching Time by using RPE Searching Tchnique in the CELP Vocoder)

  • 김대식
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
    • /
    • pp.141-145
    • /
    • 1995
  • Code excited linear prediction speech coders exhibit good performance at data rates as low as 4800 bps. The major drawback to CELP type coders is their large computational requirements. In this paper, we propose a new codebook search method that preserves the quality of the CELP vocoder with reduced complexity. The basic idea is to restrict the searching range of the random codebook by using a searching technique of the regular pulse excitation. Applying the proposed method to the CELP vocoder, we can get approximately 48% complexity reduction in the codebook search.

  • PDF

커버곡 검색을 위한 코드 기반 크로마그램 유사도 (A code-based chromagram similarity for cover song identification)

  • 서진수
    • 한국음향학회지
    • /
    • 제38권3호
    • /
    • pp.314-319
    • /
    • 2019
  • 음악 커버곡 검색 시스템 구현에 있어서 크로마그램 간 유사도 계산은 필수적인 구성 요소이다. 본 논문은 크로마그램 비교에 소요되는 저장공간 및 계산량을 줄이기 위한 크로마그램 코딩 방법을 제안한다. 음악별로 코드북을 학습하여 크로마그램 수열을 코드 수열로 변환하여 저장 공간을 줄이게 된다. 얻어진 코드 간 거리를 룩업 테이블에 저장하여 크로마그램 비교의 속도를 개선하였다. 두 가지 커버곡 실험 데이터셋에서 성능 비교를 수행하여, 제안된 코드 기반 방법과 기존 방법 간의 커버곡 검색 정확도, 저장 공간, 계산량을 비교하였다.

다단계 벡터 양자화를 이용한 웨이브렛 리프팅 기반 ECG 압축 (Wavelet Lifting based ECG Signal Compression Using Multi-Stage Vector Quantization)

  • 박서영;정규혁;김영주;이인성;주기호
    • 전자공학회논문지SC
    • /
    • 제43권6호
    • /
    • pp.76-82
    • /
    • 2006
  • ECG와 같은 생체 신호를 장시간 저장하기 위해서는 많은 메모리를 필요로 한다. 따라서 본 논문에서는 다단계 벡터양자화 기법을 적용하여 ECG의 웨이브렛 리프팅 계수를 압축하는 방법을 제안한다. 첫 번째 단계의 코드북은 ECG의 웨이브렛 리프팅 계수를 양자화하고 두 번째 단계 코드북은 오차 신호의 웨이브렛 리프팅 계수에 대해 J개의 후보 코드벡터를 구해 양자화하여 복원 오차를 최소화하도록 하였다. 두 코드북의 코드벡터는 웨이브렛 계수의 에너지 분포특성을 이용해서 고주파 성분의 계수를 제거함으로써 코드북의 검색 시간과 복잡성을 감소 시켰다. 실험 결과 CDR이 276.62 bit/sec에서 3%이하의 PRD를 얻었다.

EVRC의 고속 구현 알고리듬 (Fast Implementation Algorithms for EVRC)

  • 정성교;최용수;김남건;윤대희
    • 한국음향학회지
    • /
    • 제20권1호
    • /
    • pp.43-49
    • /
    • 2001
  • EVRC (Enhanced Variable Rate Codec)는 북미 및 우리 나라 CDMA 디지털 셀룰러 시스템에 채택되었으며 8kbps의 전송률에서 우수한 성능을 갖는 부호화기이다. 본 논문에서는 복잡한 알고리듬으로 인해 많은 계산량을 갖는 EVRC 부호화기를 성능 저하 없이 고속으로 구현할 수 있는 알고리듬을 제시한다. 제안된 고속 알고리듬에서는 효율적인 피치 검색과 고정 코드북 탐색 과정이 구현되는데, 고정 코드북 탐색 과정에서는 펄스 위치 조합의 수를 제한하는 방법과 줄여진 임펄스 응답을 사용하여 연산량을 기존의 방법의 70% 정도로 감소시킨다. 주관적인 음질 평가를 통해 제안된 고속 EVRC 알고리듬이 기존의 방법에 비해 적은 계산량에 구현되지만 음질의 저하는 초래하지 않는다는 것을 확인하였다.

  • PDF

SMV와 AMR 음성부호화기를 위한 상호부호화 알고리즘 (Transcoding Algorithm for SMV and AMR Speech Coder)

  • 이덕종;정규혁;이인성
    • 한국음향학회지
    • /
    • 제27권8호
    • /
    • pp.427-434
    • /
    • 2008
  • 본 논문에서는 SMV와 AMR 음성부호화기를 위한 상호부호화 알고리즘을 제안한다. 각기 다른 통신망에서 음성부호화기간의 효율적인 연동을 위해 가장 간단한 방법인 tandem 방식이 있지만 긴 지연시간과 많은 연산량, 그리고 음질 저하의 문제점들을 해결하기위해 상호부호화 방법을 사용한다. 제안하는 상호부호화 알고리즘은 LSP (Line Spectral Pairs) 변환, 피치 변환, 그리고 고속 고정 코드북 탐색을 수행한다. 실험 결과, $20\sim50%$의 적은 계산량과 $5\sim10$ ms의 지연 시간을 줄이면서도 동등한 음질을 확인할 수 있었다.

PCA에 기반한 압축영역에서의 MPEG Video 검색기법 (PCA-Based MPEG Video Retrieval in Compressed Domain)

  • 이경화;강대성
    • 대한전자공학회논문지SP
    • /
    • 제40권1호
    • /
    • pp.28-33
    • /
    • 2003
  • 본 논문에서는 동영상 압축 부호화에 대한 표준안인 MPEG 기반의 압축 비디오 스트림으로부터 DCT DC 계수를 추출하구 이들로 구성된 DE 영상으로부터 장면 전환 검출을 수행한 후 대표 프레임을 추출한다. 또한 추출된 대표 프레임을 PCA(Principal Component Analysis) 방법을 이용하여 데이터베이스의 색인 정보로 저장한 후 입력된 질의 영상과 가장 유사한 대표 영상들을 검색하는 방법에 대해 제안한다. 즉, 추출된 대표 프레임에 대해 주성분해석 기법을 적용하여 통계적인 특성을 가진 데이터를 특징으로 추출함으로써 코드워드의 수에 따른 코드북을 생성하고 이를 데이터베이스의 색인 정보로 저장한다. 실험 결과 제안된 방법이 검색에 있어 우수한 성능을 나타내고 또한 통계적인 데이터의 특성을 이용하기 때문에 처리 시간과 상당한 양의 메모리 공간을 줄일 수 있음을 확인하였다.

자기 조직화 지도 모형을 이용한 인종별 얼굴 영상 군집화 기법 (Face Data Clustering Method for Face Recognition Using Self Organizing Feature Map)

  • 권혜련;고병철;변혜란;이일병
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.577-579
    • /
    • 2003
  • 본 논문에서는 생체인식 분야 중 얼굴인식의 검색 정확성 향상 및 검색 시간을 단축하기 위한 단계로 인종별 얼굴영상 데이터베이스에 대한 군집화 기법을 연구하였다. 우선, 일반적으로 얼굴 및 이미지 검색에 사용되는 다양한 특징을 추출하고, 추출한 다차원의 특징 데이터들로부터 다 인종 얼굴 데이터를 유사한 인종별로 정확하게 군집화 하기 위해 최적의 특징벡터를 자동으로 선택 할 수 있는 방법을 제안하였다. 군집결과 분석을 위해 자기 조직화 지도 모형을 이용하였는데, 이는 2차원 분석 및 가시화에 유용하며, 학습 후 코드북벡터를 사용하여 유사한 의미간의 거리부터 검색할 수 있는 특징을 가지고 있다. 특징추출에 관한 실험결과 인종별 구분을 위한 특징벡터로는 웨이블릿 주파수 성분(lowpass 성분)과 CbCr 특징벡터가 인종별 군집화에 가장 유용한 특징으로 선택되었으며. 추출된 특징을 바탕으로 semantic map을 구성하여 제안방법의 효율성을 제시하였다.

  • PDF

보코더에서 프레임별 에너지 보상에 의한 피치검색 성능 개선에 관한 연구 (An Algorithm on Improving a Pitch Searching by Energy Compensation in a Frame for Vocoder)

  • 백금란;민소연;배명진
    • 한국산학기술학회논문지
    • /
    • 제13권7호
    • /
    • pp.3188-3193
    • /
    • 2012
  • 보코더 과정 중 피치를 분석하는 과정은 코드북 분석과 더불어 부호화기 성능에 큰 영향을 미치는 부분이다. 피치를 검색하기 위해 먼저 신호의 주기성을 강조해야 하는데 일반적으로 자기상관법의 일종인 듀얼 펄스 알고리즘 기법을 이용하여 주기성을 강조한 후 피치를 검색하는 방법을 많이 사용한다. 이 방법은 한 프레임 내에서 두 개의 펄스 간격을 변경시키면서 음성신호와의 상관관계 값을 구하여 상관관계가 가장 높을 때의 펄스 간격을 찾는다. 또한 상관관계 값이 가장 높을 때의 주기가 가장 뚜렷한 반복 구간인데 이것을 피치 주기라 한다. 이때 반주기, 배주기 및 세배주기가 주된 주기로 찾아지는 경우에는 이 간격을 피치 주기라 할 수 없어 이를 해결하기 위한 여러 가지방법들이 제안되어 있다. 본 논문에서는 피치를 검색하기 전에 프레임내의 전체 에너지변화 비율을 추정하여 신호의 에너지 레벨을 미리 보상해 준 후 피치를 검색하는 방법을 제안한다. 이 방법을 적용하면 피치검색 시간을 단축할 수 있고, 피치 검색의 정확도를 높일 수 있어 전반적인 피치 검색에 관한 성능이 개선된다.

$TMS320C6701^TM$을 이용한 2.4kbps EHSX 음성 부호화기의 실시간 구현 (Real-time implementation of the 2.4kbps EHSX Speech Coder Using a $TMS320C6701^TM$ DSPCore)

  • 양용호;이인성;권오주
    • 한국통신학회논문지
    • /
    • 제29권7C호
    • /
    • pp.962-970
    • /
    • 2004
  • 본 논문에서는 TI사의 부동소수점 DSP인 TMS320C6701$^{TM}$을 이용한 2.4kbps EHSX(Enhanced Harmonic Stochastic Excitation) 음성부호화기의 실시간 구현 방법에 대해서 논한다. EHSX는 4khz의 대역폭을 갖는 음성신호를 2.4kbps의 비트율을 갖는 압축 패킷으로 변환하는 부호화 방법으로, 유/무성음에 따라 하모닉(Harmonic) 여기 부호화 방법과 CELP 부호화 방법을 선택적으로 사용하는 구조를 갖는다. 본 논문에서는 이러한 EHSX의 실시간 구현을 위해 연산량의 큰 비중을 차지하는 CELP 분석의 코드북 검색부분과 일부 IIR 필터링 부분에 대한 고정소수점 변환 방법과, 부호화시 하모닉 검색 및 피치 검색방법에 대한 알고리즘 상 연산량 감소 방법, DSP의 구조를 고려한 코드를 배치방법 등 연산량을 감소시키기 위한 최적화 방법을 제시한다. 설계된 음성 부호화기는 PESQ(perceptual evaluation of speech quality) ITU-T Recommendation P.862를 이용한 음질 평가 결과로서 약MOS 3.28을 얻었으며, 실시간으로 압축 및 복원을 수행한다.

VHDL을 이용한 MPEG-4 CELP 부호화기의 구현 (Implementation of MPEG-4 CELP Encoder using VHDL)

  • 이시원;김수현;홍민철;차형태
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.561-564
    • /
    • 2000
  • MPEG-4 CELP의 알고리즘은 전송환경에 따라 선택할 수 있는 다양한 전송률을 지원하며 각종 옵션을 추가함으로써 다양한 기능을 부가할 수 있도록 구성되어 있다. 본 논문에서는 MPEG-4 오디오 CELP 부호화기를 VHDL(Very High Speed Intergrated Circuit Hardware Description Language)을 이용하여 구현하였다. MPEG-4 CELP의 부호화 과정을 크게 3부분으로 나누어 LPC 분석부, 코드북 검색부, 비트열 생성부로 나누어 설계하였으며, 내부 메모리의 크기를 줄이기 위하여 중복적인 성격을 갖거나 계산과정에서 나오는 중간 결과 값들을 저장하지 않도록 알고리즘을 최적화하였다. 또 계산 값의 동적 범위(Dynamic Range)가 크거나 정밀도가 요구되는 부분에 대해서는 배밀도(Double Precision) 연산을 사용하여 값의 오차를 줄였다.

  • PDF