• 제목/요약/키워드: dctA

검색결과 846건 처리시간 0.022초

저 전송률 동화상 압축에서 후처리 방법 및 후처리 방법의 주관적 객관적 평가 (Post-filtering in Low Bit Rate Moving Picture Coding, and Subjective and Objective Evaluation of Post-filtering)

  • 이영렬;김윤수;박현욱
    • 한국통신학회논문지
    • /
    • 제24권8B호
    • /
    • pp.1518-1531
    • /
    • 1999
  • MPEG 및 H.263과 같은 동화상 압축 방식에 의하여 고 압축된 영상이 복원되었을 때 블록화 현상, 코너 이상치 (coner outliers), 링잉 잡음이 발생한다. 블록화 현상은 8x8 블록의 코너 (corner) 점에서 발생하는 잡음이며, 링잉 잡음은 영상의 에지 주변에서 발생하는 잡음이다. 그 이유는 MPEG 및 H.263이 8x8 화소 블록의 DCT 계수를 양자화 (quantization)하기 때문이다. 본 논문에서는 MPEG-4 및 H.263의 복원된 영상에서 발생하는 블록화 현상, 코니 이상치, 링잉 잡음을 줄이기 위해 기존의 저자들에 의하여 제안된 방법에 대한 주관적, 객관적 평가를 수행한다. 이 신호 적응형 후처리 방법은 압축된 데이터로부터 추출한 8x8 DCT 계수의 분포 정보와 움직임 벡터 정보를 이용하여 적응적으로 양자화 효과를 (quantization effect) 줄인다. 블록화 현상은 1차원 수평 및 수직 저대역 필터에 (low pass filter) 의하여 줄게 되고, 링잉 잡음은 2차원 신호 적응 필터 (signal-adaptive filter)에 의하여 줄게 된다. 신호 적응형 후처리 방법과 MPEG-4 VM (verification model)의 후처리 방법에 대한 MSSM (Modified Single Stimulus Method)을 이용한 주관적 \ulcorner질평가, 객관적 화질평가 (PSNR), 계산량 복잡도 (complexity)에 관한 비교연구가 컴퓨터 실험에 의하여 수행된다. 컴퓨터 실험을 위하여 MPEG-4에서 입력으로 사용하는 시험용 비데오 시퀀스를 이용하였다. 주관적인 화질 평가에서 두 방법은 비슷한 결과를 보였다. 반면 객관적 평가와 계산량 복잡도 분석 측면에 있어서, 신호 적응형 후처리 방법이 MPEG-4 VM의 후처리 방법보다 우수한 성능을 보였다.

  • PDF

시각 음성인식을 위한 영상 기반 접근방법에 기반한 강인한 시각 특징 파라미터의 추출 방법 (Robust Feature Extraction Based on Image-based Approach for Visual Speech Recognition)

  • 송민규;;민소희;김진영;나승유;황성택
    • 한국지능시스템학회논문지
    • /
    • 제20권3호
    • /
    • pp.348-355
    • /
    • 2010
  • 음성 인식 기술의 발전에도 불구하고 잡음 환경하의 음성 인식은 여전히 어려운 분야이다. 이를 해결하기 위한 방안으로 음성 정보 이외에 시각 정보를 이용한 시각 음성인식에 대한 연구가 진행되고 있다. 하지만 시각 정보 또한 음성과 마찬가지로 주위 조명 환경이나 기타, 다른 요인에 따른 영상잡음이 존재하며, 이런 영상잡음은 시각 음성 인식의 성능 저하를 야기한다. 따라서 인식 성능 향상을 위해 시각 특징 파라미터를 어떻게 추출하느냐는 하나의 관심분야이다. 본 논문에서는 HMM기반 시각 음성인식의 인식 성능 향상을 위한 영상 기반 접근방법에 따른 시각 특징 파라미터의 추출 방법에 대하여 논하고 그에 따른 인식성능을 비교하였다. 실험을 위해 105명에 화자에 대한 62단어의 데이터베이스를 구축하고, 이를 이용하여 히스토그램 매칭, 입술 접기, 프레임 간 필터링 기법, 선형마스크, DCT, PCA 등을 적용하여 시각 특징 파라미터를 추출하였다. 실험결과, 제안된 방법에 의해 추출된 특징 파라미터를 인식기에 적용하였을 때의 인식 성능은 기본 파라미터에 비해 약21%의 성능 향상이 됨을 알 수 있다.

MASS ESTIMATION OF IMPACTING OBJECTS AGAINST A STRUCTURE USING AN ARTIFICIAL NEURAL NETWORK WITHOUT CONSIDERATION OF BACKGROUND NOISE

  • Shin, Sung-Hwan;Park, Jin-Ho;Yoon, Doo-Byung;Choi, Young-Chul
    • Nuclear Engineering and Technology
    • /
    • 제43권4호
    • /
    • pp.343-354
    • /
    • 2011
  • It is critically important to identify unexpected loose parts in a nuclear reactor pressure vessel, since they may collide with and cause damage to internal structures. Mass estimation can provide key information regarding the kind as well as the location of loose parts. This study proposes a mass estimation method based on an artificial neural network (ANN), which can overcome several unresolved issues involved in other conventional methods. In the ANN model, input parameters are the discrete cosine transform (DCT) coefficients of the auto-power spectrum density (APSD) of the measured impact acceleration signal. The performance of the proposed method is then evaluated through application to a large-sized plate and a 1/8-scaled mockup of a reactor pressure vessel. The results are compared with those obtained using a conventional method, the frequency ratio (FR) method. It is shown that the proposed method is capable of estimating the impact mass with 30% lower relative error than the FR method, thus improving the estimation performance.

CARA: Character Appearance Retrieval and Analysis for TV Programs

  • Jung Byunghee;Park Sungchoon;Kim Kyeongsoo
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2004년도 정기총회 및 학술대회
    • /
    • pp.237-240
    • /
    • 2004
  • This paper describes a character retrieval system for TV programs and a set of novel algorithms for detecting and recognizing faces for the system. Our character retrieval system consists of two main components: Face Register and Face Recognizer. The Face Register detects faces in video frames and then guides users to register the detected faces of interest into the database. The Face Recognizer displays the appearance interval of each character on the timeline interface and the list of scenes with the names of characters that appear on each scene. These two components also provide a function to modify incorrect results. which is helpful to provide accurate character retrieval services. In the proposed face detection and recognition algorithms. we reduce the computation time without sacrificing the recognition accuracy by using the DCT/LDA method for face feature extraction. We also develop the character retrieval system in the form of plug-in. By plugging in our system to a cataloguing system. the metadata about the characters in a video can be automatically generated. Through this system, we can easily realize sophisticated on-demand video services which provide the search of scenes of a specific TV star.

  • PDF

부분 선형 근사 모델을 이용한 적응적 비트율 제어 (An Adaptive Rate Control Using Piecewise Linear Approximation Model)

  • 조창형;정제창;최병욱
    • 방송공학회논문지
    • /
    • 제2권2호
    • /
    • pp.194-205
    • /
    • 1997
  • 동영상 압축 표준인 MPEG이나 저속 통신용 비디오 부호화 표준인 H.263등과 같은 DPCM/DCT 복합 부호화기에서 비트율 제어는 매우 중요한 요소이다. 본 논문에서는 전송매체에서의 실시간 비디오 부호화나 저장 미디어 응용을 위하여 부분 선형 근사 모델을 이용한 간단한 적응적 비트율 제어 방법을 제안한다. 선형 모델에 기반한 기존의 버퍼 제어 기법은 버퍼 충만도에 따라서 선형적으로 양자화매개변수를 제어하지만 제안된 방법은 영상 부호화에서 logarithmic관계라고 알려진 양자화 매개변수와 비트량의 비선형적인 관계를 부분적으로 선형 근사화 시킨 모델을 이용한다. 또한 보다 좋은 화질을 얻기 위하여 I 화면마다 공간영역에서 영상의 복잡도를 해석하여 적응적으로 제어한다. 실험적으로 기존의 선형 모델 방법과 비교하여 제안된 방법이 화질의 변화가 심하지 않으면 전체적으로 안정된 복원 영상을 얻었다.

  • PDF

인간시각시스템을 고려한 칼라 영상 워터마킹 (Color Image Watermarking Using Human Visual System)

  • 이주신
    • 한국정보전자통신기술학회논문지
    • /
    • 제6권2호
    • /
    • pp.65-70
    • /
    • 2013
  • 본 논문에서는 인간시각시스템을 고려한 칼라 영상 워터마킹을 제안하였다. 일반적으로 색상과 채도의 변화보다는 휘도의 변화에 더 민감한 인간의 시각의 특성을 고려하여 RGB 좌표계의 칼라 영상을 HSI 좌표계로 변환하여 워터마크를 삽입하였다. 워터마크 삽입은 원영상과 워터마크를 이산 코사인 변환하여 계수들을 합함으로써 원영상에 워터마크를 삽입하였다. 워터마크 추출은 워터마크가 삽입된 영상을 역 이산 코사인 변환하여 워터마크를 추출하였다. 실험을 위해서 원영상은 표준영상을 사용하고, 워터마크는 지문 영상을 사용하여 실험한 결과, 비가시성과 강인성을 만족하였다.

ABSOLUTE ESTIMATION METHOD OF MOSQUITO NOISE FOR A POST FILTERLING

  • Kashimura, Youhei;Sagara, Naoya;Sugiyama, Kenji
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2009년도 IWAIT
    • /
    • pp.612-617
    • /
    • 2009
  • In a DCT coding, degradations called block artifact and mosquito noise are appeared in reconstructed pictures. They should be reduced in post processing after decoding without superabundant processing. However, an estimation of mosquito noise is rare because of its difficulty. To realize an estimation of mosquito noise level, we extract a block that mosquito noise will be easy to occur. Mosquito noise level is calculated at a selected side of the block. In this processing, only the sides of high probability block are used. Then, a block value is taken by averaging. Finally, the picture value is calculated by averaging of this. Estimation method is evaluated by using the MPEG-4 decoded pictures. Quantization scale of coding and the estimated mosquito noise level are compared. As the results, we recognize the proposed method gives almost reasonable mosquito block and absolute level. Father, adaptive filter is controlled by the estimated mosquito noise level. It is recognized that the high quality of decoded picture is kept and the mosquito noise is reduced effectively at the picture with degradation.

  • PDF

An Adaptive Control for the Propagation Errors Incurred by DCT Coefficient-Dropping Transcoder

  • Kim, Jin-Soo;Kim, Jae-Gon;Seo, Kwang-Deok;Yun, Mong-Han
    • ETRI Journal
    • /
    • 제29권5호
    • /
    • pp.559-568
    • /
    • 2007
  • This paper presents a new distortion control scheme with a simple estimation model for the propagation errors incurred by dropping some parts of the bitstream in a frame dropping-coefficient dropping (FD-CD) transcoder. The primary goal of this paper is to facilitate bit-rate conversions and rate-distortion controls in the compressed domain without introducing a full decoding and reencoding system in the pixel domain. First, the error propagation behavior over several frame sequences due to coefficient dropping is investigated on the basis of statistical and empirical properties. Then, such properties are used to develop a simple estimation model for the CD distortion accounting for the characteristics of the underlying coded-frame. Finally, the proposed estimation model allows us to determine the amount of coefficient dropping and to effectively allocate rate-distortions into coded-frames. Experimental results show that the proposed estimation model accurately describes the characteristics of propagation errors adaptively in the compressed domain and can be easily applied to distortion control over different kinds of video sequences.

  • PDF

A Study on a Compensation of Decoded Video Quality and an Enhancement of Encoding Speed

  • Sir, Jaechul;Yoon, Sungkyu;Lim, Younghwan
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제6권3호
    • /
    • pp.35-40
    • /
    • 2000
  • There are two problems in H.26X compression technique. One is compressing time in encoding process and the other is degradation of the decoded video quality due to high compression rate. For transferring moving pictures in real-time, it is required to adopt massively high compression. In this case, there are a lot of losses of an original video data and that results in degradation of quality. Especially degradation called by blocking artifact may be produced. The blocking artifact effect is produced by DCT-based coding techniques because they operate without considering correlation between pixels in block boundaries. So it represents discontinuity between adjacent blocks. This paper describes methods of quality compensation for H.26x decoded data and enhancing encoding speed for real-time operation. Our goal of the quality compensation is not to make the decoded video identical to a original video but to make it perceived better through human eyes. We suggest an algorithm that reduces block artifact and clears decoded video in decoder. To enhance encoding speed, we adopt new four-step search algorithm. As shown in the experimental result, the quality compensation provides better video quality because of reducing blocking artifact. And then new four-step search algorithm with $MMX^{TM}$ implementation improves encoding speed from 2.5 fps to 17 fps.

  • PDF

Robust video watermarking algorithm for H.264/AVC based on JND model

  • Zhang, Weiwei;Li, Xin;Zhang, Yuzhao;Zhang, Ru;Zheng, Lixin
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권5호
    • /
    • pp.2741-2761
    • /
    • 2017
  • With the purpose of copyright protection for digital video, a novel H.264/AVC watermarking algorithm based on JND model is proposed. Firstly, according to the characteristics of human visual system, a new and more accurate JND model is proposed to determine watermark embedding strength by considering the luminance masking, contrast masking and spatial frequency sensitivity function. Secondly, a new embedding strategy for H.264/AVC watermarking is proposed based on an analysis on the drift error of energy distribution. We argue that more robustness can be achieved if watermarks are embedded in middle and high components of $4{\times}4$ integer DCT since these components are more stable than dc and low components when drift error occurs. Finally, according to different characteristics of middle and high components, the watermarks are embedded using different algorithms, respectively. Experimental results demonstrate that the proposed watermarking algorithm not only meets the imperceptibility and robustness requirements, but also has a high embedding capacity.