• 제목/요약/키워드: Dynamic Scene

검색결과 146건 처리시간 0.031초

Color Correction Using Chromaticity of Highlight Region in Multi-Scaled Retinex

  • Jang, In-Su;Park, Kee-Hyon;Ha, Yeong-Ho
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2009년도 IWAIT
    • /
    • pp.59-62
    • /
    • 2009
  • In general, as a dynamic range of digital still camera is narrower than a real scene‘s, it is hard to represent the shadow region of scene. Thus, multi-scaled retinex algorithm is used to improve detail and local contrast of the shadow region in an image by dividing the image by its local average images through Gaussian filtering. However, if the chromatic distribution of the original image is not uniform and dominated by a certain chromaticity, the chromaticity of the local average image depends on the dominant chromaticity of original image, thereby the colors of the resulting image are shifted to a complement color to the dominant chromaticity. In this paper, a modified multi-scaled retinex method to reduce the influence of the dominant chromaticity is proposed. In multi-scaled retinex process, the local average images obtained by Gaussian filtering are divided by the average chromaticity values of the original image in order to reduce the influence of dominant chromaticity. Next, the chromaticity of illuminant is estimated in highlight region and the local average images are corrected by the estimated chromaticity of illuminant. In experiment, results show that the proposed method improved the local contrast and detail without color distortion.

  • PDF

-건설현장에서의 시공 자동화를 위한 Laser Sensor기반의 Workspace Modeling 방법에 관한 연구- (Human Assisted Fitting and Matching Primitive Objects to Sparse Point Clouds for Rapid Workspace Modeling in Construction Automation)

  • 권순욱
    • 한국건설관리학회논문집
    • /
    • 제5권5호
    • /
    • pp.151-162
    • /
    • 2004
  • Current methods for construction site modeling employ large, expensive laser range scanners that produce dense range point clouds of a scene from different perspectives. Days of skilled interpretation and of automatic segmentation may be required to convert the clouds to a finished CAD model. The dynamic nature of the construction environment requires that a real-time local area modeling system be capable of handling a rapidly changing and uncertain work environment. However, in practice, large, simple, and reasonably accurate embodying volumes are adequate feedback to an operator who, for instance, is attempting to place materials in the midst of obstacles with an occluded view. For real-time obstacle avoidance and automated equipment control functions, such volumes also facilitate computational tractability. In this research, a human operator's ability to quickly evaluate and associate objects in a scene is exploited. The operator directs a laser range finder mounted on a pan and tilt unit to collect range points on objects throughout the workspace. These groups of points form sparse range point clouds. These sparse clouds are then used to create geometric primitives for visualization and modeling purposes. Experimental results indicate that these models can be created rapidly and with sufficient accuracy for automated obstacle avoidance and equipment control functions.

Parallel Multi-task Cascade Convolution Neural Network Optimization Algorithm for Real-time Dynamic Face Recognition

  • Jiang, Bin;Ren, Qiang;Dai, Fei;Zhou, Tian;Gui, Guan
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권10호
    • /
    • pp.4117-4135
    • /
    • 2020
  • Due to the angle of view, illumination and scene diversity, real-time dynamic face detection and recognition is no small difficulty in those unrestricted environments. In this study, we used the intrinsic correlation between detection and calibration, using a multi-task cascaded convolutional neural network(MTCNN) to improve the efficiency of face recognition, and the output of each core network is mapped in parallel to a compact Euclidean space, where distance represents the similarity of facial features, so that the target face can be identified as quickly as possible, without waiting for all network iteration calculations to complete the recognition results. And after the angle of the target face and the illumination change, the correlation between the recognition results can be well obtained. In the actual application scenario, we use a multi-camera real-time monitoring system to perform face matching and recognition using successive frames acquired from different angles. The effectiveness of the method was verified by several real-time monitoring experiments, and good results were obtained.

높은 동적 범위 영상에서 색상 시각화 분석 (Analysis of Color Visualization in High Dynamic Range Image)

  • 이용환;김흥준;김봉기
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2015년도 추계학술대회
    • /
    • pp.705-708
    • /
    • 2015
  • 높은 동적 범위(HDR) 영상는 일반적인 표준 디지털 영상에서 허용하는 것보다 훨씬 높은 동적 범위를 처리하는 디지털 영상 처리 기법이다. 이러한 HDR 영상에 대한 사실적 디스플레이를 위한 톤 매핑이 많이 연구되고 있다. 그러나 화면 휘도 분석을 위한 HDR 영상의 과학적 시각화는 주목을 받지 못하고 있다. 본 논문에서는 HDR 영상에서 색상 정보의 재생과 시각화를 위한 접근 방법을 제시한다. 색상 시각화 함수들을 구현하고, HDR 영상의 일반적인 평가요소에 따라 시각화 효율성에 대해 평가한다.

  • PDF

범용 디지털 카메라를 이용한 HDR 파노라마 환경 맵 제작 시스템 개발 (Development of High Dynamic Range Panorama Environment Map Production System Using General-Purpose Digital Cameras)

  • 박은혜;황규현;박상훈
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제18권2호
    • /
    • pp.1-8
    • /
    • 2012
  • HDR (high dynamic range) 영상은 일반적인 디지털 영상보다 훨씬 더 넓은 수치 범위로 빛의 노출을 저장한다. 따라서 실세계에 존재하는 광원들에 의해 표현되는 특정 장면에 내재된 빛의 세기를 매우 정확하게 저장할 수 있다. 이러한 HDR 영상을 빠르고 정확하게 촬영할 수 있는 전문가용 HDR 카메라가 개발되었으나 높은 가격으로 인해 아직까지 일반적인 작업환경에서 이용하기에는 어려움이 있다. 낮은 비용으로 HDR영상을 생성하는 일반적인 방법은 범용 디지털카메라를 이용해 동일한 장면을 서로 다른 노출로 반복 촬영하고 상용 소프트웨어에서 이들을 입력받아 하나의 HDR 영상으로 변환하는 것이다. 하지만 이러한 방법은 복잡하고 정확한 카메라 보정을 필요로 하는 작업이다. 더욱이 이 방법을 이용해 고급 영상 콘텐츠 제작을 위한 HDR 환경 맵을 생성하는 경우 더 섬세한 수작업과 시간 투자를 필요로 한다. 본 논문에서는 이러한 촬영 작업을자동화 하기위해 개발된 HDR 파노라마 환경 맵 제작 시스템에 대해 자세히 설명한다. 그리고 영상기반 라이팅 기법을 적용하여 3D 그래픽 모델을 2D 배경영상에 삽입하는 사실적합성 작업에서 본 시스템이 효과적으로 이용될 수 있음을 실제 사례를 통해 보인다.

Modified iCAM06 기법을 이용한 HDR 영상의 tone compression 개선과 평가 (Performance Improvement of Tone Compression of HDR Images and Qualitative Evaluations using a Modified iCAM06 Technique)

  • 장재훈;이성학;송규익
    • 한국멀티미디어학회논문지
    • /
    • 제12권8호
    • /
    • pp.1055-1065
    • /
    • 2009
  • HDR(high dynamic range) 렌더링 기술은 다이내믹 레인지가 9 log unit이 넘는 휘도 범위의 일반 장면을 눈으로 보는 장면의 느낌과 최대한 유사하게 일반적인 영상매체에 출력이 가능하도록 8 bit해상도의 다이내믹 레인지로 변환하는 기술이다. 최근 가장 우수한 성능을 보이는 iCAM06 알고리듬은 iCAM (Image Appearance Modeling)과 CIECAM02를 토대로 만들어 졌으며, 기존 iCAM 모델에서는 제대로 고려하지 못한 공간 필터 링 (spatial filtering) 처리와 여러 시각현상을 고려 하여 설계하였다. 그러나 iCAM06 모델은 상당히 뛰어난 성능을 가지고 있음에도 불구하고 몇 가지 문제점을 가지고 있는데, 그 중의 하나가 사용자 설정 변수들이다. iCAM06에서 필요한 입력 변수들은 렌더링 영상에 큰 영향을 끼치지만, 실험적인 최적치로 결정되는 모호한 변수들이다. 본 논문에서는 iCAM06모델에서 사용되는 사용자 설정 입력 변수들에 대해 다양한 시조건이 고려된 최적의 값을 제공할 수 있도록 정량화된 수식을 제공하고, 또한 개선된 모델을 통하여 향상된 톤 압축의 가시성 결과를 다양한 조건에서의 HDR 영상으로 확인하였다.

  • PDF

시각 선명도 감각 특성을 이용한 개선된 고명암 대비 영상 렌더링 기법 (Enhanced High Contrast Image Rendering Method Using Visual Properties for Sharpness Perception)

  • 이근영;이성학;권혁주;송규익
    • 한국통신학회논문지
    • /
    • 제38A권8호
    • /
    • pp.669-679
    • /
    • 2013
  • HDR (high dynamic range) 영상을 LDR (low dynamic range) 영상으로 변환할 때 톤 맵핑 (tone mapping) 과정은 필수적이다. 많은 TMO (tone mapping operator)는 인간 시각 시스템의 특성들을 모방하여 발달되어 왔고 그 중 가장 대표적인 시각 특성이 국부 순응 방식이다. 그러나 TMO는 밝기나 명암, 채도 등의 영상 정보들을 압축하여 LDR 영상으로 대응시키기 때문에 압축에 의한 화질 저하가 나타난다. 본 논문에서는 TMO에 의한 화질 저하 보상을 위해 인간 시각의 선명도 특성을 기저 및 세부 영상 분할 처리에 적용하여 휘도 적응적 에지 보존 함수를 제안했다. 또한, 인간 시각 시스템에서 공간 주파수와 대비 민감도 사이의 관계를 나타내는 CSF (contrast sensitivity function)를 이용하여 선명화 필터를 설계하고, 이를 배경 휘도에 따라 적응적으로 적용하였다.

QoS 제약 조건을 갖는 VBR 비디오에 대한 서비스 품질 만족도를 고려한 동적 자원 할당 및 호 수락 제어 (A dynamic resource allocation and call admission control considering 'satisfaction degree of quality of service' for the VBR video sources with QoS constraints)

  • 유상조;김성대
    • 대한전자공학회논문지TC
    • /
    • 제38권1호
    • /
    • pp.1-13
    • /
    • 2001
  • 본 논문에서는 VBR 비디오 트래픽에 대해 통신망 내부에서의 동적인 자원 요청 및 할당을 통해, 사용자가 요구하는 서비스 품질을 만족시키는 동시에 자원의 효율적 사용을 제공할 수 있는 새로운 방법을 제안한다. 본 논문에서는 장면전환을 고려한 변형된 적응 선행 예측 방법을 사용하여 향후 스위치로 입력 레이트를 추정하고, 사용자가 요구한 평균 지연 및 손실률에 대해 현재 통신망에서 제공되고 있는 연결별 품질 만족도를 측정하여, 동적으로 필요한 대역을 할당한다. 사용자에게 연결 설정 기간 동안 일관된 서비스 품질을 제공하기 위해, 본 논문에서 정의한 ‘서비스 품질 만족도’를 이용하여 신규 호의 수락 여부를 결정한다. 모의실험을 통하여 제안된 방법은 QoS 요구사항에 따라 사용자에게 안정적인 서비스 품질을 제공하고 통신망 자원을 효율적으로 관리할 수 있음을 보인다.

  • PDF

HDR 영상 렌더링을 위한 적응적 표준 편차를 이용한 자동 레인지 고속 양방향 필터 (An Auto-range Fast Bilateral Filter Using Adaptive Standard Deviation for HDR Image Rendering)

  • 배태욱;이성학;김병익;송규익
    • 한국통신학회논문지
    • /
    • 제35권4C호
    • /
    • pp.350-357
    • /
    • 2010
  • 본 논문에서는 iCAM06의 HDR (High Dynamic Range) 영상 렌더링을 위한 적응적 표준 편차를 이용한 자동레인지 고속 양방향 필터 (auto-range fast bilateral filter, FBF)를 제안한다. 다양한 노출 시간으로 촬영한 여러영상들은 전체 다이나믹 레인지를 포함한 한 장의 HDR 영상으로 만들어진다. HDR 영상 렌더링의 대표적인 알고리즘은 iCAM06이며, 이는 국부 백색 적응 (local white point adaptation), 색 순응 (color adaptation), 및 영상 처리 변환 (image processing transformation, IPT) 같은 iCAM 구조를 기초로 한다. iCAM06의 고속 양방향 필터는 레인지 필터에서 고정 표준 편차를 사용한다. 이는 넓고 낮은 분포를 가지는 고 자극치 영역에서 불필요한 고속 양방향 필터 계산의 원인이 된다. 이를 해결하기 위하여 XYZ 각 자극치 영상을 경계값에 의해 저 자극치 영상 및 고 자극치 영상으로 나눈 후, 각 자극치 영역에 대하여 히스토그램 분포에 기초한 가변 표준 편차를 이용한다. 실험 결과에서 제안한 방법이 기존의 고속 양방향 필터보다 계산 속도가 개선되었음을 확인하였다.

Lightweight Attention-Guided Network with Frequency Domain Reconstruction for High Dynamic Range Image Fusion

  • 박재현;이근택;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.205-208
    • /
    • 2022
  • Multi-exposure high dynamic range (HDR) image reconstruction, the task of reconstructing an HDR image from multiple low dynamic range (LDR) images in a dynamic scene, often produces ghosting artifacts caused by camera motion and moving objects and also cannot deal with washed-out regions due to over or under-exposures. While there has been many deep-learning-based methods with motion estimation to alleviate these problems, they still have limitations for severely moving scenes. They also require large parameter counts, especially in the case of state-of-the-art methods that employ attention modules. To address these issues, we propose a frequency domain approach based on the idea that the transform domain coefficients inherently involve the global information from whole image pixels to cope with large motions. Specifically we adopt Residual Fast Fourier Transform (RFFT) blocks, which allows for global interactions of pixels. Moreover, we also employ Depthwise Overparametrized convolution (DO-conv) blocks, a convolution in which each input channel is convolved with its own 2D kernel, for faster convergence and performance gains. We call this LFFNet (Lightweight Frequency Fusion Network), and experiments on the benchmarks show reduced ghosting artifacts and improved performance up to 0.6dB tonemapped PSNR compared to recent state-of-the-art methods. Our architecture also requires fewer parameters and converges faster in training.

  • PDF