통합 검색 | Korea Science

Convolutional auto-encoder based multiple description coding network

Meng, Lili;Li, Hongfei;Zhang, Jia;Tan, Yanyan;Ren, Yuwei;Zhang, Huaxiang
- KSII Transactions on Internet and Information Systems (TIIS)
- /
- 제14권4호
- /
- pp.1689-1703
- /
- 2020
When data is transmitted over an unreliable channel, the error of the data packet may result in serious degradation. The multiple description coding (MDC) can solve this problem and save transmission costs. In this paper, we propose a deep multiple description coding network (MDCN) to realize efficient image compression. Firstly, our network framework is based on convolutional auto-encoder (CAE), which include multiple description encoder network (MDEN) and multiple description decoder network (MDDN). Secondly, in order to obtain high-quality reconstructed images at low bit rates, the encoding network and decoding network are integrated into an end-to-end compression framework. Thirdly, the multiple description decoder network includes side decoder network and central decoder network. When the decoder receives only one of the two multiple description code streams, side decoder network is used to obtain side reconstructed image of acceptable quality. When two descriptions are received, the high quality reconstructed image is obtained. In addition, instead of quantization with additive uniform noise, and SSIM loss and distance loss combine to train multiple description encoder networks to ensure that they can share structural information. Experimental results show that the proposed framework performs better than traditional multiple description coding methods.
https://doi.org/10.3837/tiis.2020.04.015 인용 PDF KSCI HTML

효율적인 주파수 변조된 초음파 파형 발생을 위한 최적화된 시그마 델타 변조 기법 (Optimized Sigma-Delta Modulation Methodology for an Effective FM Waveform Generation in the Ultrasound System)

김학현;한호산;송태경
- 대한의용생체공학회:의공학회지
- /
- 제28권3호
- /
- pp.429-440
- /
- 2007
A coded excitation has been studied to improve the performance for ultrasound imaging in term of SNR, imaging frame rate, contrast to tissue ratio, and so forth. However, it requires a complicated arbitrary waveform transmitter for each active channel that is typically composed of a multi-bit Digital-to-Analog Converter (DAC) and a linear power amplifier (LPA). Not only does the LPA increase the cost and size of a transmitter block, but it consumes much power, increasing the system complexity further and causing a heating-up problem. This paper proposes an optimized 1.5bit fourth order sigma-delta modulation technique applicable to design an efficient arbitrary waveform generator with greatly reduced power dissipation and hardware. The proposed SDM can provide a required SQNR with a low over-sampling ratio of 4. To this end, the loop coefficients are optimized to minimize the quantization noise power in signal band while maintaining system stability. In addition, the decision level for the 1.5 bit quantizer is optimized for a given input waveform, which results in the SQNR improvement of more than 5dB. Computer simulation results show that the SQNR of a FM(frequency modulated) signal generated by using the proposed method is about 26dB, and the peak side-lobe level (PSL) of its compressed waveform on receive is -48dB.
https://doi.org/10.9718/JBER.2007.28.3.429 인용 PDF KSCI

스위치-매트릭스 구조의 고해상도 델타-시그마 D/A변환기용 준 디지털 FIR 재생필터 (A switch-matrix semidigital FIR reconstruction filter for a high-resolution delta-sigma D/A converter)

송윤섭;김수원
- 대한전자공학회논문지SD
- /
- 제42권7호
- /
- pp.21-26
- /
- 2005
본 논문에서는 작은 면적을 갖는 저전력 스위치-매트릭스 구조의 델타-시그마 D/A 변환기용 준 디지털 FIR 재생필터를 제안하였다. 제안된 재생필터는 계수를 7 비트로 양자화하고 각 비트 값에 대응하는 전류를 생성하는 7 개의 전류원을 사용하는 구조로 205 개의 탭을 가지며 1419 개의 스위칭 트랜지스터로 구현되었다. 제안된 필터는 0.25 um CMOS공정을 이용하여 설계되었으며 전체 칩 면적은 1.5 mm$^{2}$으로 2.5 V에서 3.8 mW의 소비 전력을 갖는다. 모의실험 결과 104 dB의 다이나믹 레인지와 -84 dB의 대역 밖의 노이즈 허용값을 나타내어 고해상도 오디오용 DAC에 적합하다.
PDF KSCI

표본 적응 프러덕트 양자기에 기초한 DPCM을 이용한 고 전송률 영상 압축 (High Bit Rate Image Coder Using DPCM based on Sample-Adaptive Product Quantizer)

김동식;이상욱
- 한국통신학회논문지
- /
- 제24권12B호
- /
- pp.2382-2390
- /
- 1999
본 논문에서는 표본 적응 프러덕트 양자기(sample-adaptive product quantizer: SAPQ)라 불리는 새로운 기법의 양자기를 불변 길이 출력을 가지며 높은 전송률을 가지는 DPCM(differential pulse coded modulation)에 기초한 영상 데이터 감축에 적용하였다. DPCM의 성능을 개선하기 위해서는 기존의 스칼라 양자기 대신에 벡터 양자기(vector quantizer: VQ)를 사용해야 하는데, 전송률이 증가함에 따라 일반적인 VQ나 심지어 나무 구조를 가지는 변형된 VQ도 부호화 복잡도나 요구되는 기억 장치의 양으로 인하여 그 구현이 거의 불가능하다. SAPQ는 매우 짧은 적응 주기를 가지는 feed-forward 적응 스칼라 양자기로 일종의 제한적 구조를 가지는 VQ의 일종이다. 따라서, 비록 전송률이 높다고 해도, SAPQ를 사용하면 일반 VQ에서의 부호화 복잡도와 요구되는 기억 장치의 양을 줄이면서 VQ의 성능을 얻을 수 있다. 나아가서 SAPQ가 스칼라 양자기 구조를 가지고 있으므로 DPCM 부호기에서 기존의 스칼라 값을 예측하는 예측기를 그대로 사용하면서 SAPQ는 양자화 역할을 수행할 수 있다. 합성 신호와 실제 영상 데이터에 대하여 실험한 결과 DPCM의 양자화 부분?을 바꾸어서 전송률이 4 b/point 이상에서 2-3 dB 정도의 성능 향상을 얻을 수 있었다.
PDF

부분공간과 LVQ 분류기에 기반한 실시간 얼굴 인식 (Real-Time Face Recognition Based on Subspace and LVQ Classifier)

권오륜;민경필;전준철
- 인터넷정보학회논문지
- /
- 제8권3호
- /
- pp.19-32
- /
- 2007
본 논문에서는 실시간 얼굴인증 시스템의 구축을 위한 LVQ 신경망 기반의 새로운 얼굴 인식 방법을 제안한다. 기존의 연구에서 PCA, LDA 변환이 많이 적용되며 신경망을 결합한 형태가 제안되고 있지만 신경망 학습 시간이 오래 걸리는 단점을 가지고 있다. LVQ 신경망은 학습 시간이 짧고 클래스간의 분리도를 최대화할 수 있는 교사학습방법이다. 따라서, 본 논문에서 제안된 방법은 동영상으로부터 실시간으로 입력되는 얼굴영상을 PCA와 LDA변환을 순차적으로 적용하여 부분공간상의 변환된 특징벡터로부터 LVQ 신경망의 학습을 통하여 얼굴을 인식한다. 외부조명의 영향에 강건한 인식시스템을 구축하기 위하여 얼굴검출 단계에서 검출된 얼굴영역은 밝기값의 최대-최소 정규화 방법에 의해 보정된 정규화 영상을 생성한다. 정규화된 얼굴영상은 PCA와 LDA 변환을 통해 부분공간상의 특징벡터로 변환된다. 변환된 훈련 데이터로부터 LVQ 신경망의 초기 중심 벡터를 결정하고 신경망의 학습률 향상을 위해 K-Means 클러스터링 알고리즘을 적용하며, 초기 중심 벡터를 이용하여 LVQ2 학습 방법에 의해 학습된 중심벡터는 클래스의 대표 벡터가 된다. 결국 각 클래스의 대표 벡터로부터 입력 영상의 특징벡터간의 유클리디언 거리 비교법을 적용하여 얼굴 인식을 수행한다. ORL 데이터베이스를 이용한 정지 영상에 대한 인식과 실시간으로 입력되는 영상에 대한 인식 등 두 가지 형태의 영상을 기반으로 실험한 결과 두 경우에 모두 제안된 방법이 기존의 인식 방법보다 인식률에서 우수함을 입증할 수 있었다.
PDF

글자 영상을 위한 학습기반 초고해상도 기법 (Learning-based Super-resolution for Text Images)

허보영;송병철
- 전자공학회논문지
- /
- 제52권4호
- /
- pp.175-183
- /
- 2015
본 논문은 글자 영상을 효과적으로 확대 (up-scaling)하기 위한 학습 기반 초고해상도 (super-resolution; SR) 기법을 제안한다. 제안 기법은 크게 학습 단계와 합성 단계로 나뉜다. 학습 단계에서 다양한 HR (high-resolution) /LR (low-resolution) 글자 영상 쌍들을 수집한다. LR영상들은 양자화를 하고, 충분히 많은 수의 HR-LR 블록쌍들을 추출한다. 양자화된 LR블록을 기준으로 블록 쌍들을 소정의 개수의 클래스들로 구분한다. 클래스 별로 최적의 2D-FIR 필터 계수를 계산하고, 양자화한 후색인용 LR 블록과 함께 사전에 저장한다. 합성 단계에서 입력 LR 영상 내 각 블록을 양자화한 후 사전 내 양자화된 LR블록들과 정합하여 가장 근사한 블록에 대응하는 FIR 필터계수를 선정한다. 마지막으로 선택된 FIR필터로 HR 블록을 합성하여 최종적인 HR영상을 생성한다. 또한, 우리는 잡음이 있는 글자 영상에 대응하기 위해 학습과정에서 잡음 세기에 따른 복수개의 사전들을 제작한다. 입력 LR 영상의 잡음 레벨에 맞는 사전을 선택하여 HR영상을 합성한다. 실험 결과는 제안 기법이 종래 기법보다 잡음이 없는 환경에서는 물론 잡음이 있는 환경에서 우수한 주관적/객관적 화질을 가짐을 보인다.
https://doi.org/10.5573/ieie.2015.52.4.175 인용 PDF KSCI

검색결과 36건 처리시간 0.023초

Convolutional auto-encoder based multiple description coding network

효율적인 주파수 변조된 초음파 파형 발생을 위한 최적화된 시그마 델타 변조 기법 (Optimized Sigma-Delta Modulation Methodology for an Effective FM Waveform Generation in the Ultrasound System)

스위치-매트릭스 구조의 고해상도 델타-시그마 D/A변환기용 준 디지털 FIR 재생필터 (A switch-matrix semidigital FIR reconstruction filter for a high-resolution delta-sigma D/A converter)

표본 적응 프러덕트 양자기에 기초한 DPCM을 이용한 고 전송률 영상 압축 (High Bit Rate Image Coder Using DPCM based on Sample-Adaptive Product Quantizer)

부분공간과 LVQ 분류기에 기반한 실시간 얼굴 인식 (Real-Time Face Recognition Based on Subspace and LVQ Classifier)

글자 영상을 위한 학습기반 초고해상도 기법 (Learning-based Super-resolution for Text Images)

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)