• 제목/요약/키워드: Image Codec

검색결과 137건 처리시간 0.023초

H.264/AVC 기반의 스테레오 영상 디스플레이 시스템 (Stereoscopic Video Display System Based on H.264/AVC)

  • 김태준;김지홍;윤정환;배병규;김동욱;유지상
    • 한국통신학회논문지
    • /
    • 제33권6C호
    • /
    • pp.450-458
    • /
    • 2008
  • 본 논문에서는 양안시차를 이용한 스테레오 영상의 부호화 기법을 H.264/AVC 기반으로 스테레오 영상을 실시간으로 전송하기 위한 효과적인 시스템을 제안한다. OpenCV를 이용하여 스테레오 웹캠으로부터 영상을 획득하고, 전처리 과정으로 입력 시스템을 통해 획득한 스테레오 영상을 YUV 4:2:0 파일 포맷으로 변환한다. 변환된 파일은 스테레오 부호화기로 입력되고 제안된 예측구조에 의해 부호화기의 복잡도를 감소시킴으로써 초당 30프레임 이상의 부호화 속도로 부호화 된다. 부호화된 비트스트림 파일은 복호화기에 입력되어 좌, 우 스테레오 영상으로 재 생성된다. 재 생성된 스테레오 영상은 입체영상으로 합성되어 3D 디스플레이 장치를 통해 사용자에게 보여지게 된다. 제안된 시스템은 기존의 스테레오 코덱을 사용했을 때 보다 최소 1.5dB에서 최대 3dB의 압축효율이 뛰어남을 본 실험을 통하여 검증 및 확인하였다. 본 연구는 저 대역폭, 저 전력의 실시간 전송을 위한 모바일환경에 응용이 가능할 것으로 기대된다.

MPACS 시스템에서 Scalable 구조를 이용한 심장 조영상의 계층적 부호화에 관한 연구 (A Study on the Hierachical Coding of the Angiography by Using the Scalable Structure in the MPACS System)

  • 한영오;정재우;안진호;박종관;신중인;박상희
    • 대한의용생체공학회:학술대회논문집
    • /
    • 대한의용생체공학회 1995년도 춘계학술대회
    • /
    • pp.235-238
    • /
    • 1995
  • In this paper, we propose an effective coding method of the angiography by using the scalable structure in the frequency domain for MPACS(Medical Picture Archiving and Communication System). We employed the subband decomposition method and MPEG-2 system which is the international standard coding method of the general moving picture. After the subband decomposition is applied to split an input image into 4 bands in the spatial frequency domain, the motion compensated DPCM coding method of MPEG-2 is carried out for each subband. As a result, an easily controllable coding Structure is accomplished by composing the compound hit stream for each subband group. Follows are the simulation results of the proposed sheme for the angiography. A scalable structure which can be easily controlled for a loss of transmission or the band limit can be accomplisbed in the MPEG-2 stucture by the subband decomposition minimizing the side information. And by reducing the search area of the motion vector between -4 and 3, the processing speed of a codec is enhanced by more than two times without a loss of the picture quality compare with the conventional DCT coefficients decompositon method. And the processing speed is considerably improved in the case of the parallel construction of each subband in the hardware.

  • PDF

클라우드 컴퓨팅을 이용한 유시티 비디오 빅데이터 분석 (An Analysis of Big Video Data with Cloud Computing in Ubiquitous City)

  • 이학건;윤창호;박종원;이용우
    • 인터넷정보학회논문지
    • /
    • 제15권3호
    • /
    • pp.45-52
    • /
    • 2014
  • 유비쿼터스 시티(유시티)에서는 수많은 비디오 카메라들이 설치된다. 이렇게 설치된 많은 카메라로부터 대용량의 비디오 데이터가 실시간으로 끊임없이 발생하고 유시티의 관리 시스템으로 전달된다. 유시티의 다양한 서비스들을 뒷받침하기 위해서는 이러한 비디오 데이터를 저장하고, 이렇게 저장된 대용량의 비디오 데이터를 분석할 수 있는 방법과 관리 시스템이 요구된다. 그래서, 이 논문에서는 클라우드 컴퓨팅을 기반으로 한 유시티 비디오 관리 시스템을 제안한다. 또한, 근래 주목받고 있는 데이터 병렬처리 프레임워크인 Hadoop MapReduce를 이용하여 이러한 빅데이터 비디오를 분석하는 방법을 제안하고, 이에 따른 우리의 성능 평가를 소개한다.

H.264에서 성능향상을 위한 Uni-directional 8X8 인트라 예측 (Uni-directional 8X8 Intra Prediction for H.264 Coding Efficiency)

  • 국승용;박광훈;이윤진;심동규;정광수;최해철;최진수;임성창
    • 방송공학회논문지
    • /
    • 제14권5호
    • /
    • pp.589-600
    • /
    • 2009
  • 본 논문은 초 고화질급(UHD) 영상으로 디지털화 되어 가는 시대에 대응하기 위하여, 현재 우리가 사용하고 있는 최신 코덱의 하나인 H.264 코덱 구조에서 인트라 예측 성능을 향상토록 한 Uni-directional $8{\times}8$ 인트라 예측 기반 코덱을 개발하여 앞으로의 동영상 압축 개발에 기여하고자 한다. Uni-directional $8{\times}8$ 인트라 예측은 $8{\times}8$ 픽셀 단위의 인트라 예측 시 $4{\times}4$ 픽셀 단위로 나누어 같은 인트라 예측방향을 사용하면서 $4{\times}4$ 픽셀 단위로 재구성된 영상을 통하여 예측을 세밀하게 할 수 있게 하는 아이디어를 기반으로 한다. 본 논문에서 제안한 Uni-directional $8{\times}8$ 인트라 예측은 H.264 코덱 구조에서 기존의 $8{\times}8$ 인트라 예측만을 수행한 코딩 결과와 비교할 경우 QCIF, CIF에서 약 7.3% BDBR 성능 향상을 가져오며, 현재의 H.264 코덱 구조에 더하여 적용하였을 경우, 약 1.3% BDBR 성능 향상을 가져왔다. 더 큰 영상 사이즈를 압축하기 위해서는 지금 영상 사이즈에 최적화 된 코덱을 그대로 쓰기보다는 지금보다 더 큰 블록 사이즈를(현재는 $4{\times}4$ 블록 단위가 최소 단위) 기준으로 할 수도 있기 때문에 새로운 코덱기술 개발에 있어 기초 연구가 될 수 있을 것이다.

DCT기반의 블라인드 워터마크를 이용한 EPG 정보 재생기 설계 (Design of EPG Information Player System using DCT based Blind Watermark)

  • 김대진;최홍섭
    • 한국콘텐츠학회논문지
    • /
    • 제11권4호
    • /
    • pp.1-10
    • /
    • 2011
  • 광대역 네트워크의 발달과 함께 멀티미디어 산업의 발달은 IPTV와 같은 디지털 콘텐츠 시장의 확산을 가져오고 있다. 일반적으로 셋탑박스와 같은 미들웨어를 통해서 습득한 디지털 콘텐츠는 PC 재생기를 이용하여 시청할 수 있다. 이 때 PC 재생기는 코덱정보, 비트레이트 등과 같은 정보만 알 수 있다. 그러나 일반 사용자들은 이러한 정보보다 콘텐츠의 내용, 설명 등과 같은 부가 정보를 보기 원한다. 따라서 기존의 PC 재생기와 달리 데이터베이스 사용하지 않고 셋탑박스를 통해서 습득한 콘텐츠 내에 삽입되어 있는 EPG 정보를 볼 수 있는 재생기를 PC상에 설계하였다. 콘텐츠 내에 EPG 정보를 삽입하기 위해서 DCT 기반의 블라인드 워터마크를 제안한다. 이는 콘텐츠 원본 없이도 정보를 추출할 수 있고, 주파수 영역에서 계수값에 비례하여 강인한 워터마크를 삽입 할 수 있다. 그리고 EPG 정보로부터 원하는 정보를 워터마크를 통하여 삽입하기 위하여 MPEG-TS에 포함된 PSI 정보를 분석하고 분리하였으며, 삽입된 콘텐츠로부터 EPG 정보를 추출하여 UI를 구성하였다. 또한 워터마크 삽입 및 추출, 콘텐츠 재생 등의 기능을 다이렉트쇼 필터를 기반으로 설계하여 시스템을 모듈화 하였다. 따라서 개발자들이 보다 쉽고, 빠르게 시스템을 개발할 수 있도록 설계하였다.

MPEG 비디오 인코더를 위한 장면전환 검출 및 적응적 율 제어 방식 연구 (Study of Scene change Detection and Adaptive Rate Control Schemes for MPEG Video Encoder)

  • 남재열;강병호;손유익
    • 한국정보처리학회논문지
    • /
    • 제6권2호
    • /
    • pp.534-542
    • /
    • 1999
  • 고정 비트 율 채널을 통해 비디오를 전송할 때 잘 설계된 율 제어 방식은 전반적인 화질을 향상시킬 수 있으며, 율 제어 방식은 MPEG 비디오 표준에는 포함되어 있지 않기 때문에 어떤 율 제어 방식을 채택했는가에 따라 MPEG 비디오 코덱의 성능은 많은 차이를 나타낼 수 있다. MPEG에서 제안된 기존의율 제어 방식은 장면전환이 없을 때는 좋은 성능을 보이나, 장면 전환된 영상은 잘 처리하지 못하는 단점을 갖고 있다. 따라서 장면전환 후에는 화질이 열화 되고 버퍼 넘침이 발생할 가능성이 높아진다. 본 논문에서는 국소분산을 이용한 새로운 장면전환 검출 방식을 제안한다. 또한, 장명전환 검출부에서 계산된 국소분산을 율 제어부의 비트 할당 및 적응적 양자화 단계에서 재사용하여 영상의 국소적인 특성을 고려한 양자화 변수, mqunt,를 결정하는 방식과 장면전환이 발생했을 경우 장면전환 발생 이전의 몇 프레임에서 절약한 비트 수를 장면 전환된 영상에 부가적으로 할당함으로써 장면전환을 효과적으로 대처하는 적응적 율 제어 방식을 제안한다. 제안된 방식을 검증하기 위해 컴퓨터 모의실험을 수행하였다. 제안된 검출방식은 장면전환을 정확하게 검출하였고, 제안된 율 제어 방식은 기존의 MPEG 방식보다 우수한 율 제어 성능을 보였다.

  • PDF

고품질 스테레오 음악을 위한 오디오 워터마크 정보 삽입/추출 기술 (An Embedding /Extracting Method of Audio Watermark Information for High Quality Stereo Music)

  • 배경율
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.21-35
    • /
    • 2018
  • 본 논문에서는 스테레오 음악에 오디오 워터마크를 삽입하기 위한 알고리즘을 제안하였다. 스테레오 음악은 2개의 채널을 갖고 있기 때문에 기존 워터마킹 기술은 일반적으로 각 채널을 독립적으로 생각하고 처리하는 경우가 많다. 그러나 스테레오를 모노로 변환하는 과정에서 워터마크의 손실이 발생하는 경우가 많이 발생할 수 있다. 제안한 알고리즘은 스테레오를 모노로 변환하더라도 워터마크의 손실이 발생하지 않도록 워터마크를 삽입할 때 스테레오와 모노변환의 특성을 이용하였다. 제안된 알고리즘에 사용된 오디오 워터마크는 "Copyright"와 "Copy_free"라는 두 가지 정보를 터보코드를 이용하여 생성하였다. 두 워터마크는 9바이트(72비트)로 이루어져 있으며, 오류정정을 위하여 터보코드를 적용하면 222비트로 삽입해야 하는 정보량이 늘어난다. 222비트의 워터마크는 추가적인 오류에 강인하도록 1024비트로 확장하여 최종적으로 스테레오 음악에 삽입할 워터마크로 사용하였다. 평균적으로 SNR은 40dB를 넘어서서 전통적인 양자화 방식보다 10dB 이상의 음질 개선을 가져왔다. 이는 상대적으로 10배의 음질 개선도를 의미하는 것으로 매우 유의미한 결과이다. 또한 워터마크의 추출에 필요한 샘플길이는 1초 이내의 길이면 충분히 추출이 가능하고, 128Kbps의 비트레이트를 갖는 MP3 압축에 대해서도 모두 1초 이내 길이의 음악 샘플로부터 워터마크의 완전한 추출이 가능하였다. 전통적인 양자화 방식이 10초 길이의 샘플을 이용해도 대부분 워터마크의 추출에 실패한 것에 비하면 1/10에 불과한 길이로 워터마크의 추출이 가능하다.