• 제목/요약/키워드: 잔여벡터

검색결과 18건 처리시간 0.033초

부동 소수점 DSP를 이용한 4kbps EHSX 음성 부호화기의 실시간 구현 (Real-Time Implementation of the EHSX Speech Coder Using a Floating Point DSP)

  • 이인성;박동원;김정호
    • 한국음향학회지
    • /
    • 제23권5호
    • /
    • pp.420-427
    • /
    • 2004
  • 본 논문에서는 선형예측 잔여신호에 대한 하모닉 벡터 여기 코딩과 시간 대역 분리 혼합 코딩을 결합한 4kbps EHSX (Enhanced Harmonic Stochastic Excitation) 음성부호화기 실시간 구현한 내용을 기술한다. 유성음 구간에서는 하모닉 여기 코딩에 무성음 구간에 대해서는 분석-합성 구조의 벡터 여기 코딩을 사용하였으며, 유/무성음이 혼재하는 전이구간에서는 시간 분리 전이 코딩을 사용하였다. 이 음성부호화기 구현을 위해 부동소수점과 고정소수점을 모두 지원하는 DSP인 TMS320C6701을 사용하였고, 연산량을 줄이기 위해 IFFT를 사용한 저 복잡도 정현파 합성법을 사용하여 알고리즘의 최적화를 이루었으며, 복잡도의 문제가 되는 부분을 고정소수점으로 변환한 후 파이프라인을 적용한 핸드 어셈블리 코딩을 하여 구현에서의 최적화를 이루었다. 또한, 메모리의 효율성을 극대화하기 위해 캐쉬 메모리 할당과 데이터를 내부 메모리에 할당하였고 수학 연산의 최적화를 위해 FastRTS67x 라이브러리를 사용하였다. 개발 환경은 DSP EVM 보드를 사용하였으며 음성 신호의 입·출력 확인으로 동작 및 기능을 검증하여 실시간 구현하였다.

스크린 컨텐츠 동영상 압축을 위한 적응적 색 공간 변환 기법

  • 강제원
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2014년도 추계학술대회
    • /
    • pp.18-20
    • /
    • 2014
  • 본 논문에서는 스크린 컨텐츠 동영상의 효율적인 압축을 위한 부호화 기법을 제안한다. 제안 부호화 기법은 RGB 색 요소 간의 신호의 통계적 중복성을 줄이기 위한 적응적 색 변환 기법에 기반한다. 기존의 색 변환 기법들은 스크린 컨텐츠 동영상이 포함하는 신호의 급격히 변화하는 ?계적 특성에 적용하기 어려운 반면 제안 방식에서는 부호화 블록의 시간적/공간적 주위 픽셀의 정보를 이용한 성분 분석을 통해 색 공간 변환 행렬식을 유도하여 부호화에 사용한다. 주위 픽셀 정보는 부호화 블록의 예측 방식에 따라 결정하며 움직임 벡터를 이용한 시간/변위 예측 부호 방식에서는 참조 블록의 정보를 이용하고 공간적 예측 방식에서는 블록의 인접 픽셀를 이용한다. 부호기 측에서는 비트율-왜곡 최적화를 통하여 예측 후 잔여신호의 부호화를 원래의 RGB 공간에서 수행할지 또는 색 변환한 공간에서 수행할지를 결정하고 관련 정보를 표시하여 블록 단위로 전송함으로써 부호화 효율을 증대한다. 실험에 의하면 제안 기법은 기존 압축 방식 대비 탁월한 부호화 성능을 제공함을 보인다.

  • PDF

지능형 서비스 로봇을 위한 잡음에 강인한 문맥독립 화자식별 시스템 (Noise Robust Text-Independent Speaker Identification for Ubiquitous Robot Companion)

  • 김성탁;지미경;김회린;김혜진;윤호섭
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 1부
    • /
    • pp.190-194
    • /
    • 2008
  • 본 논문은 지능형 서비스 로봇의 여러 기술들 중에서 기본적인 기술인 화자식별 기술에 관한 내용이다. 화자식별 기술은 화자의 음성신호를 이용하여 등록된 화자들 중에서 가장 유사한 화자를 찾아내는 것이다. 기존의 mel-frequency cepstral coefficient 를 이용한 화자식별 시스템은 무잡음 환경에서는 높은 성능을 보장하지만 잡음환경에서는 성능이 급격하게 떨어진다. 이렇게 잡음환경에서 성능이 떨어지는 요인은 등록환경과 식별환경이 다른 불일치문제 때문이다. 본 논문에서는 불일치문제를 해결하기 위해 relative autocorrelation sequence mel-frequency cepstral coefficient 를 사용하였다. 또한, 기존의 relative autocorrelation sequence mel-frequency cepstral coefficient 의 제한된 정보문제와 잔여잡음문제를 해결하기 위해 멀티스트리밍 방법과 멀티스트리밍 방법에 특정벡터 재결합 방법을 결합한 하이브리드 방법을 제한 하였다. 실험결과 제한된 방법들이 기존의 특정벡터보다 잡음환경에서 높은 화자식별 성능을 보여주었다.

  • PDF

광대역 음성부호화기를 위한 백터-스칼라 LSP 파라미터 양자화기 설계 (Design of the Vector-Scalar Quantizer of LSP Parameters for Wideband Speech Coder)

  • 신재현;이인성;지덕구;윤병식;최송인
    • 대한전자공학회논문지SP
    • /
    • 제40권4호
    • /
    • pp.286-291
    • /
    • 2003
  • 본 논문에서는 광대역 음성 부호화기를 위한 VQ-SQ 구조의 LSP(Line Spectral Pairs) 파라미터 양자화기를 설계하였다. 16차 LPC(Linear Prediction Coefficients) 계수를 사용하며, 양자화 특성이 좋고 합성필터의 안정성의 조건을 검사하기 쉬운 LSP 파라미터로 변환/sup [2]/하여 양자화 한다. 설계된 VQ-SQ 양자화기는 첫 번째 단에서 2단 SVQ(Split VQ)로 각각 8차씩 양자화한 뒤, 두 번째 단에서 순서화 특성(OP Ordering Property)을 적용한 SQ를 사용하여 잔여신호(Residual Signal)를 양자화하는 구조로 되어있다. VQ-SQ결합 양자화기의 전체적인 성능개선을 위해 백터 양자화기에서 하나의 최적 벡터를 찾지 않고 5개의 후보백터를 가지고 스칼라 양자화를 수행한 후, 전체적으로 본래의 LSP 파라미터에 가장 가까운 벡터 양자화기 인덱스와 스칼라 양자화기의 인덱스를 결정한다. 순서화 특성을 고려하여 설계된 적응 VQ-SQ 양자화기는 LSP 파라미터에 총 35비트를 할당하여 광대역 명료도(Wideband Transparency)인 평균 1.6㏈ 이하의 스펙트럼 왜곡(SD : Spectral Distortion)과 4%미만의 3㏈가 넘는 프레임의 비율/sup [1]/을 만족하였으며, 기존의 VQ-SQ 양자화기보다 2-3비트를 절약할 수 있었다.

Triplet Loss 기반 딥러닝 모델을 통한 유사 아동 그림 선별 알고리즘 (A deep learning model based on triplet losses for a similar child drawing selection algorithm)

  • 문지유;김민종;이성옥;유용균
    • 한국산업정보학회논문지
    • /
    • 제27권1호
    • /
    • pp.1-9
    • /
    • 2022
  • 본 논문은 유사 아동 그림 선별 알고리즘 생성을 위한 Triplet Loss 기반 딥러닝 모델설계를 목적으로 한다. 아동 그림들 사이 유사성 측정을 위해서는 동일 클래스에 속하는 그림 간 특징 벡터의 거리는 가까워야 하고 다른 클래스 간 특징 벡터의 거리는 멀어져야 한다. 따라서, 본 연구에서는 클래스 수가 많아지는 경우에 이미지 유사성 측정에 이점을 지닌 Triplet Loss와 잔여 네트워크(ResNet)를 결합한 딥러닝 모델을 구축하여 유사 아동 그림 선별 알고리즘을 생성하였다. 결론적으로 본 모델을 활용한 유사 아동 그림 선별 알고리즘을 통해 대상 아동 그림과 다른 그림 간의 유사성을 측정하고 유사성이 높은 그림을 선별할 수 있다.

집적영상에서 효율적인 물체움직임 추정 및 차 영상 기법을 이용한 서브영상의 고속 압축 (Accelerated compression of sub-images by use of effective motion estimation and difference image methods in integral imaging)

  • 이형우;김은수
    • 한국정보통신학회논문지
    • /
    • 제16권12호
    • /
    • pp.2762-2770
    • /
    • 2012
  • 본 논문에서는 서브영상(sub-image)에 MSE(mean square error)기반의 블록정합 알고리즘인 TSS (three-step search)와 FS (full search)를 복합적으로 적용함으로써 물체움직임을 고속, 정밀하게 추정 보상하고, 차 영상 기법을 통해 공간적 중복데이터를 제거한 잔여영상(residual image)을 고속 압축할 수 있는 새로운 기법을 제시하였다. 즉, 제안된 기법에서는 픽업된 영상 간의 유사성을 향상시키기 위하여 픽업된 요소영상으로부터 서브영상을 재합성한 뒤, TSS 기반의 MSE 알고리즘을 사용하여 전 물체영역을 대상으로 가능한 물체영역 만을 고속으로 찾은 다음, 그 가능한 물체영역에 정밀한 FS 탐색 알고리즘을 적용하여 물체영상의 정확한 움직임 벡터를 추정하여 보상하게 된다. 또한, 움직임이 보상된 물체영상에 차 영상(difference image) 기법을 적용하여 서브영상 간의 공간적 중복 데이터를 제거한 잔여영상을 얻게 되고 이는 MPEG-4 알고리즘을 통해 최종적으로 압축되게 된다. 실험결과, 제안된 기법은 기존방식에 비해 영상 압축률은 그대로 유지하면서 프레임 당 압축시간이 214% 향상됨을 보임으로써 제안된 기법의 실제 응용 가능성을 제시하였다.

HEVC의 분할 영역에서 효율적인 움직임 정보 표현 (Efficient Motion Information Representation in Splitting Region of HEVC)

  • 이동식;김영모
    • 한국멀티미디어학회논문지
    • /
    • 제15권4호
    • /
    • pp.485-491
    • /
    • 2012
  • 본 논문은 움직임 벡터와 함께 Coding Unit (CU)의 분할 정보를 표현하기 위해 쿼드트리 기반의 Coding Unit Tree (CUT)를 제안한다. 새로운 동영상 국제 표준안인 High Efficiency Video Coding (HEVC)는 높은 압축 효율을 위해 다양한 새로운 기술들을 채택하였다. 그리고 CU, prediction Unit (PU), 와 Transform Unit (TU)라는 분할 개념을 도입하였다. 그중 기본 부호화 단위인 CU는 H.264/AVC의 매크로 블록보다 다양한 크기를 제공하며 계층적인 구조를 가지고 있으며 쿼드트리 기반의 영상을 분할하고 처리한다. 이러한 구조는 유연성과 최적화를 이룰 수 있는 기반을 제공하고 있으나, 분할 정보에 대한 오버헤더가 발생한다. 복잡한 움직임 정보가 발생하면, 해당하는 정보를 전송하기 위해 다양한 신호가 발생한다. 본 논문에서는 이러한 다양한 신호들을 분석하고, 중복되는 정보를 제거하기 위한 알고리즘을 제안한다. 제안하는 알고리즘 은 기본 블록인 $2{\times}2$ 블록을 기준으로 계층적인 구조를 제안한다. 제안하는 알고리즘은 쿼드트리 기반의 타입 코드로 영상을 구조를 나타내고, 대표 값과 잔여 값으로 각 노드의 값을 표현한다. 결과에서 제안하는 알고리즘이 HM1.0보다 13.6% 압축 향상을 보여준다.

무선 센서 네트워크에서 칼만 필터를 이용한 잔여 힘-벡터 기반 Range-free 위치인식 알고리즘 (Range-free Localization Based on Residual Force-vector with Kalman Filter in Wireless Sensor Networks)

  • 이상우;이채우
    • 한국통신학회논문지
    • /
    • 제35권4B호
    • /
    • pp.647-658
    • /
    • 2010
  • 기존에 연구된 위치인식 기법은 자신의 위치를 알고 있는 앵커노드만을 참조하여 일반노드의 위치를 계산한다. 그 외 노드들 간 관계를 고려하지 않기 때문에 참조하는 앵커노드의 수가 부족하거나 앵커노드로부터의 거리정보가 부정확한 경우에는 실제위치와 예측위치 간 위치오차 뿐만 아니라 노드 간 상대적인 위치오차가 크다. 본 논문에서는 일반노드가 노드 간 거리정보 없이 앵커노드와 한 홉 거리의 이웃노드의 정보만을 참조하여 모든 이웃 노드와의 거리가 균등하도록 위치를 계산하는 알고리즘을 제안한다. 노드가 모든 이웃노드와 균등한 거리에 위치함으로써 노드 간 상대적 위치오차와 네트워크 전체의 평균적인 위치오차를 감소시킨다. 다양한 환경에서의 모의실험을 통해서 제안하는 알고리즘의 성능을 평가하였다.