통합 검색 | Korea Science

LPC 켑스트럼 계수와 신경회로망을 사용한 화자인식 (Speaker Recognition using LPC cepstrum Coefficients and Neural Network)

최재승
- 한국정보통신학회논문지
- /
- 제15권12호
- /
- pp.2521-2526
- /
- 2011
본 논문에서는 퍼셉트론 신경회로망과 선형예측부호화 켑스트럼 계수를 사용한 화자인식 알고리즘을 제안한다. 제안하는 화자인식 알고리즘은 입력받은 음성신호에 대해서 유성음 구간을 추출한다. 추출된 유성음 구간에 대하여 선형예측 분석에 의하여 화자의 특성을 가지고 있는 선형예측부호화 켑스트럼 계수를 구한다. 구해진 선형예측부호화 켑스트럼 계수를 분류하기 위하여 이 켑스트럼 계수를 퍼셉트론 신경회로망의 입력으로 사용하여 네트워크의 학습을 수행한다. 본 실험에서는 선형예측부호화 켑스트럼 계수와 신경회로망을 사용하여 본 화자인식 알고리즘이 유효하다는 것을 인식률을 통하여 확인한다.
https://doi.org/10.6109/jkiice.2011.15.12.2521 인용 PDF KSCI

BWE 예측기반 대역분할 부호화기에 대한 연구 (A Study of BWE-Prediction-Based Split-Band Coding Scheme)

송근배;김석호
- 한국음향학회지
- /
- 제27권6호
- /
- pp.309-318
- /
- 2008
본 논문에서는 입력신호를 하위대역 (low-band)과 상위대역 (high-band)으로 나누어 각 대역을 개별적으로 부호화하는 대역분할 부호화 (split-band coding) 방식에 있어서, 상인대역 신호를 효율적으로 부호화하는 방법에 대해 다룬다. 일반적으로 그리고 특히, 그 동안 대역폭 확장법 (Bandwidth Extension, BWE)에 관한 연구를 통하여 두 대역 사이에 일정 정도의 상관관계가 존재한다는 사실이 밝혀져 있다. 따라서 두 대역간에 예측 부호화 기법을 도입함으로써 부호화 효율을 향상시킬 수 있다. BWE 예측기반 부호화 기법과 관련하여, 단순히 선형 BWE 함수를 이용하는 것은 두 대역간의 관계가 비선형성을 가지고 있으므로 최적의 결과를 얹기 어렵다. 따라서 비선형 BWE 함수를 포함한 다양한 예측 함수들의 성능비교를 통하여 가장 적절한 예측기를 선택하고자 하는 노력이 필요하다. 본 논문에서는 몇몇 대표적인 BWE 함수를 이용한 주파수 대역간 예측 부호화 방법에 대해 살펴 보고 각각의 성능을 평가한다. 또한 BWE 예측기반 부호화기를 (주파수)공간상의 중복제거 기술로 볼 때, 시간적 중복 제거 기술 즉, 예측 벡터 양자화기 (predictive vector quantizer)와의 결합이 부호화 효율향상에 상승효과가 있는지에 대해서도 검토한다.
https://doi.org/10.7776/ASK.2008.27.6.309 인용 PDF KSCI

GRNN을 이용한 동영상 움직임 예측 및 대역분할 부호화에 관한 연구 (A study on motion prediction and subband coding of moving pictuers using GRNN)

한영오
- 한국전자통신학회논문지
- /
- 제5권3호
- /
- pp.256-261
- /
- 2010
본 연구에서는 신경회로망의 일종인 GRNN을 이용하여 동영상 대역분할 부호화에 적용하고자 하는 새로운 비선형 움직임 예측기를 제안하였다. 제안된 비선형 예측기의 성능은 가장 일반적으로 많이 사용되는 블록매칭 알고리즘과 비교하였다. 결과적으로 제안된 비선형 움직임 예측기는 블록매칭 알고리즘보다 2-3dB 성능이 우수함을 알 수 있었다. 특히, 제안된 예측기는 클러스터링 과정과 잡음 신호를 둔화시키는 기능이 있어서 원영상의 에지를 잘 보존하는 장점이 있음을 알 수 있다. 이러한 결과는 인간의 시각적 특성에 중요하며 동영상의 대역분할 부호화에서도 우수한 특성을 나타낸다.
PDF KSCI

콜레스키 분해와 골롬-라이스 부호화를 이용한 무손실 오디오 부호화기 설계 (Design of a Lossless Audio Coding Using Cholesky Decomposition and Golomb-Rice Coding)

정전대;신재호
- 한국멀티미디어학회논문지
- /
- 제11권11호
- /
- pp.1480-1490
- /
- 2008
무손실 오디오 부호화기에 있어서 선형예측기 및 이에 적합한 엔트로피 부호화기의 설계가 가장 중요한 부분이다. 본 논문에서는 공분산 방법에 콜레스키 분해를 이용하여 선형예측기의 계수를 계산하였고, 그 결과를 다항 예측기와 비교하여 예측 에러가 최소화되는 선형예측기를 선택하도록 하였다. 엔트로피 부호화기는 골롬-라이스 부호를 사용하였고, 골롬-라이스 부호화기의 매개변수를 계산하기 위해 블록기반 매개변수 예측 방법과 LOCO-I, RLGR의 순차 적응 방법을 적용하였다. 실험 결과 블록기반 매개변수 예측 방법과 제안 방식의 예측기를 이용하면 자기상관 방법과 레빈슨-더빈을 사용하는 FLAC 무손실 부호화기보다 $2.2879%{\sim}0.3413%$ 압축률이 향상되는 결과를 나타내었고, 제안 방식의 예측기와 LOCO-I 순차 적응 방법을 이용한 경우는 $2.2381%{\sim}0.0214%$ 압축률이 향상되는 결과를 나타내었다. 그러나 제안 방식의 예측기와 RLGR 순차 적응 방법을 이용한 경우는 특정 신호에서만 압축률이 향상되었다.
PDF

시점 간 비선형 움직임 블록 예측에 기초한 적응적 다시점 비디오 보상 보간 기법 (Adaptive Multi-view Video Interpolation Method Based on Inter-view Nonlinear Moving Blocks Estimation)

김진수
- 한국콘텐츠학회논문지
- /
- 제14권4호
- /
- pp.9-18
- /
- 2014
최근에 무선 비디오 감사, 무선 비디오 센서 네트워크 그리고 무선 모바일 비디오와 같은 다시점 비디오 서비스에 대한 연구가 활발히 진행되고 있다. 다시점 비디오 신호처리에서 다수 개의 다른 카메라에서 획득되는 영상 사이에 존재하는 높은 상관성을 이용하는 것은 매우 핵심적인 기술이다. 본 논문에서는 카메라들 사이에 상호작용을 요구하지 않고, 다시점 분산 비디오 부호화에 효과적으로 사용할 수 있는 적응적인 다시점 보간 기법을 제안한다. 제안한 방법은 비선형적인 블록 예측, 시차 보상 시점 예측 그리고 비신뢰 블록에 대한 채우기 기법 등으로 구성된다. 모의실험을 통하여 제안한 방식은 기존의 방식에 비해 우수한 성능을 보인다.
https://doi.org/10.5392/JKCA.2014.14.04.009 인용 PDF KSCI

효과적인 분산 비디오 부호화를 위한 비대칭성 움직임 벡터 기반 보조정보 생성 방법 (Asymmetric Motion Vector-Based Side Information Generation for Efficient Distributed Video Coding)

나태영;김문철
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송공학회 2010년도 추계학술대회
- /
- pp.129-131
- /
- 2010
분산 비디오 부호화(distributed video coding)는 분산 소스 부호화의 대표적인 응용분야로서 부호화 복잡도가 부호화기에서 복호화기로 이동되어 저전력 부호화 환경에 매우 적합하다. 본 논문에서는 분산 비디오 부호화의 성능 향상에 있어 가장 중요한 보조 정보의 효과적인 생성 방법을 제안한다. 우선 보조 정보 생성을 위한 키 프레임들 간의 블록 움직임 추정에 있어 기존 방법들이 대체적으로 가정하고 있는 선형적인 움직임 이동에 따른 잘못된 예측을 해결하기 위해 두 장 이상의 키 프레임을 사용하여 블록 움직임을 추정한 후, 선형 회귀(linear regression)를 이용하여 보조 정보 상의 블록 움직임 궤적을 추정한다. 이때 움직임 추정을 위한 키 프레임 번호를 증가하며 선입선출(FIFO)형 버퍼에 저장 및 삭제하여 동일한 보조정보에 해당하는 여러 움직임 벡터 필드와, 기존의 선형적인 움직임이 가정된 움직임 벡터 필드를 동시에 생성한다. 다음으로 보간(interpolation)하려는 보조 정보 프레임 내의 임의의 블록에 가장 가깝게 통과하는 움직임 벡터 필드를 선택하여 해당하는 블록의 최종 움직임 벡터로 선택한다. 실험결과 제안하는 보조 정보 생성 방법은 기존의 방법과 비교했을 때 비대칭성 움직임 벡터 사용만으로 평균 PSNR이 0.216dB 만큼 증가하는 것을 확인할 수 있었다.
PDF

효율적인 예측 SBR 구현 (An Efficient Predictive-SBR Implementation)

허소영;김인철
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송공학회 2008년도 동계학술대회
- /
- pp.109-112
- /
- 2008
본 논문에서는 MPEG-4 HE-AAC의 SBR 부호기의 효율을 개선하기 위해 예측 SBR(Predictive-SBR)을 제안한다. SBR 부호기는 주부호기(core encoder)와 결합하여 적은 비트량으로 고주파 성분을 복원할 수 있게 한다. 본 논문에서는 SBR 데이터의 약 70%를 차지하는 포락선 정보를 부호화하는 방법을 개선하여 효율성을 높이고자 한다. 기존 SBR은 포락선 정보의 전송을 위해 다음과 같은 방법을 이용한다. 먼저 고주파 대역의 에너지를 스케일팩터 밴드 단위로 계산한다. 다음으로, 전송정보량의 감소를 위해 델타 코딩 방식을 이용하여 에너지 정보를 부호화한다. 본 논문에서는 SBR의 포락선 정보를 효과적으로 감축하기 위하여 고주파 대역의 에너지를 예측하는 방법을 이용한다. SBR 부호기의 입력 데이터가 SBR 복호기의 입력데이터와 동일하다는 가정 하에 선형 회귀(linear-regression) 기법을 이용하여 고주파 대역의 에너지를 추정한다. 그 후에 추정된 에너지와 원래의 고주파 대역 에너지의 오차를 델타 코딩을 이용하여 부호화한다. 정보를 전송할 때는 고주파 대역 에너지의 델타 코드와 예측 SBR에서 계산한 오차의 델타 코드 중 부호화에 필요한 비트량이 적은 방식을 선택하여 부호화하도록 한다. 그 결과 약 10% 정도의 정보량 감축 효과를 얻을 수 있다.
PDF

Wavelet 변환 영역에서 의료영상압축 (Medical Image Compression in the Wavelet Transform Domain)

이상복;신승수
- 한국콘텐츠학회논문지
- /
- 제2권4호
- /
- pp.23-29
- /
- 2002
본 논문에서는 의료정보시스템 중 PACS에서 필요한 영상압축 기법을 제안한다. 영상부호화 기법은 웨이브릿 변환 영역에서 선형예측기와 Lloyd-Max 양자화기를 사용하였다. 웨이브릿 변환 방법은 영상을 3레벨의 10개의 부밴드로 나누어 다해상도로 처리하며, 웨이브릿 변환 영역중 인간의 시각특성에 민감한 최저주파 영역은 무손실 부호화기인 DPCM으로 부호화하고, 나머지 고주파영역의 부밴드에 대해서는 부밴드간의 링잉현상과 영상의 엘리어싱을 감소시키기 위해서 선형예측기를 사용하였으며, 비선형양자화기로써 양자화 오차를 줄이기 위해 최적 양자화기로 Lloyd-Max 양자화기를 사용하였다. 실험결과 512$\times$512 복부 CT영상과 Chest영상에 대하여 PSNR이 28.53dB이 되었고, 복원화질이 우수함을 알 수 있었다.
PDF

텍스처 영상 재배열을 이용한 삼차원 텍스처 좌표 부호화 (Three-dimensional Texture Coordinate Coding Using Texture Image Rearrangement)

김성열;호요성
- 대한전자공학회논문지SP
- /
- 제43권6호
- /
- pp.36-45
- /
- 2006
삼차인 텍스처 좌표(texture coordinates)란 삼차원 표면을 텍스처와 텍스처 매핑(texture mapping) 기술을 이용하여 렌더링 할 때, 폴리곤(polygon)에 사상되는 텍스처 조각의 위치 정보를 의미한다. 삼차원 텍스처 좌표를 압축하는 기존의 방법은 기하학 정보를 압축하기 위해 사용한 선형 예측기(linear predictor)를 그대로 다시 이용하였다. 그러나 기존의 방법은 부호화 순서에 따라 텍스처 좌표가 불연속적으로 위치하기 때문에, 선형 예측을 효과적으로 수행할 수가 없었다. 특히, 이러한 텍스처 좌표의 불연속성(discontinuity)은 non-atlas 텍스처를 가지고 있는 삼차원 메쉬 모델에서 더 심각하게 나타난다. 본 논문에서는 부호화 순서에 따라 텍스처 영상을 재배열하여 삼차원 텍스처 좌표를 부호화하는 새로운 방법을 제안한다. 제안한 텍스치 좌표 부호화는 텍스처로부터 텍스처 조각을 추출하고, 이를 부호화 순서에 맞게 연속적으로 재배치한 후, 텍스처 좌표를 선형 예측한다. 제안한 방법은 텍스처 좌표의 불연속성을 효과적으로 최소화할 수 있기 때문에, 텍스처 좌표의 부호화 효율을 향상시킬 수 있다. 실험 결과는 제안한 방법이 MPEG-4 3DMC 표준보다 부호화 효율성 측면에서 성능이 우수함을 보여준다.
PDF KSCI

H.264/AVC에서의 효율적인 고속 다중 참조 프레임 선택 기법 (Efficient Fast Multiple Reference Frame Selection Technique for H.264/AVC)

이현우;유종민;정제창
- 한국통신학회논문지
- /
- 제33권10C호
- /
- pp.820-828
- /
- 2008
H.264/AVC 동영상 부호화 표준은 높은 부호화 효율을 위해서 가변 블록 크기 부호화, 1/4 화소 정확도의 움직임 예측, 다중 참조 프레임 사용, 율-왜곡 최적화 등과 같은 기법을 도입하였다. 그러나 이러한 부호화 방법들은 움직임 예측에 필요한 복잡도를 크게 증가시키는 단점이 있다. 특히 다중 참조 프레임 움직임 예측을 수행함으로써 증가되는 계산량은 탐색되는 참조 프레임의 개수에 따라 선형적으로 비례하여 늘어난다. 따라서 본 논문에서는 다중 참조 프레임 움직임 예측에서 탐색되는 참조 프레임의 개수를 효율적으로 조절함으로써 복잡도를 크게 줄일 수 있는 방법을 제안한다. 제안하는 알고리듬은 인터 $16{\times}16$ 모드와 인접 블록의 최적 참조 프레임 정보를 이용하여 나머지 화면간 모드들에서의 불필요한 탐색 과정을 생략한다. 실험 결과는 제안하는 방법을 적용함으로써 영상의 화질과 비트율의 큰 변화 없이 부호화 행 시간을 평균 58.54% 정도의 큰 폭으로 감소시킴을 보인다. 또한 이 방법은 다른 고속 움직임 예측 알고리듬을 같이 적용함으로써 추가적인 성능 향상을 얻을 수 있는 확장성을 가진다.
PDF KSCI

검색결과 52건 처리시간 0.026초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)