• 제목/요약/키워드: Image/Video Processing

검색결과 867건 처리시간 0.032초

비디오아티스트 슈테이너 바술카와 우디 바술카의 미적 전략 (Aesthetic Strategies in Steina and Woody Vasulka's Video Art)

  • 임산
    • 문화기술의 융합
    • /
    • 제6권3호
    • /
    • pp.261-266
    • /
    • 2020
  • 슈테이너 바술카(1940-)와 우디 바술카(1937-2019) 부부는 초기 비디오아트의 선구자로서 그들 특유의 실험적 예술을 비롯해 동시대의 아방가르드 퍼포먼스와 음악, 시각예술 세계 전반의 변화를 이끌어 냈다. 두 예술가는 디지털 수단들에 의해 변화하는 비디오이미지 프로세싱 작업을 위하여 엔지니어와 협업하며 기계장치를 개발하거나 응용하여 디지털이미지 변형 실험을 수행했다. 그들에게 비디오아트는 단순한 기록의 수단이 아니었다. 바술카 부부의 예술적 실천은 예술의 전통적인 규범이나 비평적 담론에 얽매이지 않고, 인간의 시각과 기계의 시각을 공존하게 하는 적극적인 미적 전략의 일환이었다. 특히 그들의 비디오아트는 미디어 테크놀로지가 커뮤니케이션 체계를 지배하기 시작한 시대에 비디오를 핵심적 미디어로 인식하고, 비디오카메라에 의존하지 않으면서도 움직이는 이미지를 전자적으로 조작할 수 있는 예술가의 권위를 개척했다는 점에서 더욱 그 가치를 부여할 수 있겠다. 이에 본고는 그 동안 국내에서는 아직 연구되지 않은 바술카 부부의 지난 예술의 여정을 되돌아보고, 그들의 비디오아트가 지닌 시대적 맥락과 미적 전략에 대한 학문적 관심을 제안한다.

압축 왜곡 감소를 위한 CNN 기반 이미지 화질개선 알고리즘 (CNN based Image Restoration Method for the Reduction of Compression Artifacts)

  • 이유호;전동산
    • 한국멀티미디어학회논문지
    • /
    • 제25권5호
    • /
    • pp.676-684
    • /
    • 2022
  • As realistic media are widespread in various image processing areas, image or video compression is one of the key technologies to enable real-time applications with limited network bandwidth. Generally, image or video compression cause the unnecessary compression artifacts, such as blocking artifacts and ringing effects. In this study, we propose a Deep Residual Channel-attention Network, so called DRCAN, which consists of an input layer, a feature extractor and an output layer. Experimental results showed that the proposed DRCAN can reduced the total memory size and the inference time by as low as 47% and 59%, respectively. In addition, DRCAN can achieve a better peak signal-to-noise ratio and structural similarity index measure for compressed images compared to the previous methods.

Video Expression Recognition Method Based on Spatiotemporal Recurrent Neural Network and Feature Fusion

  • Zhou, Xuan
    • Journal of Information Processing Systems
    • /
    • 제17권2호
    • /
    • pp.337-351
    • /
    • 2021
  • Automatically recognizing facial expressions in video sequences is a challenging task because there is little direct correlation between facial features and subjective emotions in video. To overcome the problem, a video facial expression recognition method using spatiotemporal recurrent neural network and feature fusion is proposed. Firstly, the video is preprocessed. Then, the double-layer cascade structure is used to detect a face in a video image. In addition, two deep convolutional neural networks are used to extract the time-domain and airspace facial features in the video. The spatial convolutional neural network is used to extract the spatial information features from each frame of the static expression images in the video. The temporal convolutional neural network is used to extract the dynamic information features from the optical flow information from multiple frames of expression images in the video. A multiplication fusion is performed with the spatiotemporal features learned by the two deep convolutional neural networks. Finally, the fused features are input to the support vector machine to realize the facial expression classification task. The experimental results on cNTERFACE, RML, and AFEW6.0 datasets show that the recognition rates obtained by the proposed method are as high as 88.67%, 70.32%, and 63.84%, respectively. Comparative experiments show that the proposed method obtains higher recognition accuracy than other recently reported methods.

MSSSIM 및 쿨백-라이블러 발산 기반 의사 율-왜곡 평가 함수와 복수개의 영상처리 필터를 이용한 동영상 전처리 방법 (Image Processing of Pseudo-rate-distortion Function Based on MSSSIM and KL-Divergence, Using Multiple Video Processing Filters for Video Compression)

  • 석진욱;조승현;김휘용;최진수
    • 방송공학회논문지
    • /
    • 제23권6호
    • /
    • pp.768-779
    • /
    • 2018
  • 본 논문에서는 동영상 화질을 최대한 유지하면서 압축 비트량 절감을 효율적으로 이루기 위해 복수개의 영상처리 필터를 영상의 블록에 따라 선택적으로 적용하고, 영상처리 필터의 선택을 위한 MSSSIM(Multi-Scale Structural SIMilarity) 및 쿨백-라이블러 발산(Kullback-Leibler divergence: KL-Divergence) 기반의 영상 처리 평가 함수를 제안한다. 영상압축의 경우, 영상 내 특징에 따라 화질과 비트량 절감의 특성이 다르며, 이에 따라 단일 목적을 가진 영상처리 필터로서는 화질을 유지하면서, 비트량 절감이라는 목적을 동시에 만족 시키기 어렵다. 이에 따라, 주관적 화질을 최대한 유지하면서, 비트량을 절감시키기 위해 주관적 화질 측도로서 MSSSIM를 사용하고 비트 량 측도를 위하여 쿨백-라이블러 발산을 사용함과 동시에 두 가지 척도를 하나의 척도로 결합시키기 위한 방법을 제안한다. 아울러 제안한 측도를 사용하여 서로 다른 특성을 가진 영상처리 필터를 전처리 필터로 사용할 경우, 주관적 화질을 최대한 유지하면서 비트량 절감을 유지할 수 있도록 동영상 압축이 가능함을 확인할 수 있었다.

디지털 영상 워터마킹에 대한 MPEG-21 DIA의 영향 분석 (The Analysis of Digital Watermarking for MPEG-21 Digital Item Adaptation)

  • 배태면;강석준;노용만;인소란
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.139-142
    • /
    • 2004
  • 본 논문에서는 MPEG-21 Digital Item Adaptation(DIA)에 의한 워터마크 신호의 영향을 실험하고 분석한다. MPEG-21 DIA에서는 다양한 소비환경에 맞게 멀티미디어 컨텐츠를 변할 수 있는 기능들을 제공하고 있다. 그러나 컨텐츠 변환기능들은 저작권 보호를 위해 컨텐츠에 삽입된 워터마크신호를 홰손시킬 수 있으므로, DIA 환경에서 워터마킹기술을 사용하기 위해서는 워터마킹기술에 대한 DIA의 영향을 분석할 필요가 있다. 본 논문에서는 일반적으로 널리 알려진 대표적인 워터마킹기술을 이용하여 MPEG-21 DIA에서 정의하고 있는 각각의 적응변환기능에 대한 워터마크의 강인성을 실험하여, 그 결과를 바탕으로 DIA 환경에서 워터마킹기술을 적용할 때 필요한 요구사항을 분석하였다.

  • PDF

독립적 컬러채널을 이용한 얼굴검출 성능개선 (Face detection enhancement using independent color channels)

  • 이영복;민현석;노용만
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 춘계학술발표대회
    • /
    • pp.95-98
    • /
    • 2008
  • 본 논문은 기존의 질감기반 (texture) 얼굴검출 시스템에서 컬러 영상을 도입하여 성능개선의 중요한 부분인 얼굴 오검출율을 줄이는 방법을 제안한다. 얼굴 영상의 컬러 성분은 흑백 성분과 비교하여 낮은 공간 주파수 영역을 가지는 특징이 있다. 질감기반 얼굴검출에서 높은 대비 (contrast) 성분의 에지는 얼굴이 아닌 영역에서 얼굴로 오인할 수가 있다. 본 논문에서는 이런 오인을 감소하기 위해 독립적인 컬러 채널 성분들을 질감기반 얼굴 검출에 각각 이용하여 그 얻어진 결과들을 융합 (fusion) 하는 방법을 제안한다. 실험결과로 제안한 칼라 채널 융합 방법을 통해 얻은 얼굴 검출율은 기존 흑백 영상과 비슷하게 유지되며 오검출율을 현저히 줄이는 것을 보였다.

영상처리를 이용한 안면신경마비 평가시스템 개발 (Development of Facial Nerve Palsy Grading System with Image Processing)

  • 장민;신상훈
    • 대한한의진단학회지
    • /
    • 제17권3호
    • /
    • pp.233-240
    • /
    • 2013
  • Objectives The objective and universal grading system for the facial nerve palsy is needed to the objectification of treatment in Oriental medicine. In this study, the facial nerve palsy grading was developed with combination of image processing technique and Nottingham scale. Methods The developed system is composed of measurement part, image processing part, facial nerve palsy evaluation part, and display part. With the video data recorded by webcam at measurement part, the positions of marker were measured at image processing part. In evaluation part, Nottingham scales were calculated in four different facial expressions with measured marker position. The video of facial movement, time history of marker position, and Nottingham scale were displayed in display part. Results & Conclusion The developed system was applied to a normal subject and a abnormal subject with facial nerve palsy. The left-right difference of Nottingham scores was large in the abnormal compared with the normal. In normal case, the change of the length between supraorbital point and infraorbital point was larger than that of the length between lateral canthus and angle of mouth. The abnormal case showed an opposite result. The developed system showed the possibilities of the objective and universal grading system for the facial nerve palsy.

비디오 재설정 및 3D 압축처리를 위한 어텐션 메커니즘 (Attentional mechanisms for video retargeting and 3D compressive processing)

  • 황재정
    • 한국정보통신학회논문지
    • /
    • 제15권4호
    • /
    • pp.943-950
    • /
    • 2011
  • 이 논문에서는 2D 및 3D 영상의 어텐션량을 측정하여 정지 및 동영상의 재설정 및 압축처리 기법을 제시하였다. 2D 어텐션은 세 개의 주요 구성, 즉, 영상의 세기, 컬러 및 방향성을 고려하였으며, 3D 영상에서 깊이 정보를 고려하였다. 시각적 어텐션은 관심있고 흥미있는 영역이나 객체를 검출하기 위해 희소성을 정량화하는 기법에 의해 구하였다. 왜곡된 스테레오 영상에서 변화된 깊이 정보를 어텐션 확률에 정합시켜서 최종적으로 저위 HVS 반응을 실제 어텐션 확률과 종합하여 스테레오 왜곡 예측기를 설계하였다. 결과로 기존 모델에 비해 효과적인 어텐션 기법을 개발하였으며 이를 비디오 재설정에 적용하여 성능을 입증하였다.

초저속 전송 네트웍을 위한 웨이브릿 변환을 이용한 비디오 코딩 (Video Coding Using Wavelet Decomposition for Very Low Bit - rate Networks)

  • 오황석;이흥규
    • 한국정보처리학회논문지
    • /
    • 제4권10호
    • /
    • pp.2629-2639
    • /
    • 1997
  • 최근 초저속 전송 매체용 비디오 코딩 기법에 대한 관심이 높아지고 있다. 그러나 기존의 블럭을 기반으로 하는 변환 코딩기법들은 비트율 제한으로 인해 블럭화 현상 등으로 화질 열화가 심하다. 본 논문에서는 초저속 전송 매체를 위하여 웨이브릿 변환과 다중해상도 움직임 추정 및 보상 기법을 이용하는 비디오 코딩 시스템을 제안한다. 제안된 시스템은 non-stationary 신호를 적응적으로 표현하며, 인간 시각 특성을 잘 반영하는 웨이브릿 변환을 사용한다. 웨이브릿 변환된 계수들은 움직임 추정 및 보상 후 예측 오차의 크기에 따라서 다양한 모드로 코딩된다. 이와 함께 일정한 화질을 유지하기 위하여 간단한 버퍼 제어 기법을 사용한다. 실험을 통하여 제안된 기법은 블럭화 현상이 줄어들며, 기존의 블럭을 기반으로 하는 변환 코딩 기법보다 복원 영상의 화질이 좋음을 보였다.

  • PDF

A Hardware/Software Codesign for Image Processing in a Processor Based Embedded System for Vehicle Detection

  • Moon, Ho-Sun;Moon, Sung-Hwan;Seo, Young-Bin;Kim, Yong-Deak
    • Journal of Information Processing Systems
    • /
    • 제1권1호
    • /
    • pp.27-31
    • /
    • 2005
  • Vehicle detector system based on image processing technology is a significant domain of ITS (Intelligent Transportation System) applications due to its advantages such as low installation cost and it does not obstruct traffic during the installation of vehicle detection systems on the road[1]. In this paper, we propose architecture for vehicle detection by using image processing. The architecture consists of two main parts such as an image processing part, using high speed FPGA, decision and calculation part using CPU. The CPU part takes care of total system control and synthetic decision of vehicle detection. The FPGA part assumes charge of input and output image using video encoder and decoder, image classification and image memory control.