• 제목/요약/키워드: Saliency Enhancement

검색결과 11건 처리시간 0.034초

Salient Region Extraction based on Global Contrast Enhancement and Saliency Cut for Image Information Recognition of the Visually Impaired

  • Yoon, Hongchan;Kim, Baek-Hyun;Mukhriddin, Mukhiddinov;Cho, Jinsoo
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권5호
    • /
    • pp.2287-2312
    • /
    • 2018
  • Extracting key visual information from images containing natural scene is a challenging task and an important step for the visually impaired to recognize information based on tactile graphics. In this study, a novel method is proposed for extracting salient regions based on global contrast enhancement and saliency cuts in order to improve the process of recognizing images for the visually impaired. To accomplish this, an image enhancement technique is applied to natural scene images, and a saliency map is acquired to measure the color contrast of homogeneous regions against other areas of the image. The saliency maps also help automatic salient region extraction, referred to as saliency cuts, and assist in obtaining a binary mask of high quality. Finally, outer boundaries and inner edges are detected in images with natural scene to identify edges that are visually significant. Experimental results indicate that the method we propose in this paper extracts salient objects effectively and achieves remarkable performance compared to conventional methods. Our method offers benefits in extracting salient objects and generating simple but important edges from images containing natural scene and for providing information to the visually impaired.

운동 및 근접 모델을 이용하는 관심맵의 향상 (Enhancement of Saliency Map Using Motion and Affinity Model)

  • 길종인;최창열;김만배
    • 방송공학회논문지
    • /
    • 제20권4호
    • /
    • pp.557-567
    • /
    • 2015
  • 정지영상에서 공간 관심맵을 생성하는 다양한 방법들이 소개되어 왔고, 최근에는 동영상의 운동정보를 활용하는 운동 관심맵 예측 기법이 활발히 연구되고 있다. 운동 관심맵은 운동정보 및 영역분할을 활용하고 있지만, 일반적인 영상에서는 만족스러운 데이터를 얻는 것은 어려움이 존재한다. 또한 우수한 관심맵을 얻기 위해서는 객체 운동, 카메라 운동 등의 운동유형 정보가 필요하기 때문에 다양한 자연영상을 대상으로 적용하면 성능 저하가 발생한다. 본 논문에서는 상기 언급한 문제점들을 극복할 수 있는 운동기반 관심맵 생성 방법을 제안한다. 공간 관심맵에 운동 정보를 결합하고, 운동 복잡도를 활용한다. 또한 근접 모델을 이용하여 주변 픽셀들의 관심도를 유사하게 함으로써, 동일 객체 또는 배경 영역이 유사한 값을 가지도록 한다. 실험에서는 다양한 동영상 데이터에 제안 방법을 적용하여 성능 검증을 수행하였다. 공간 관심도의 개선 여부를 증명하기 위해서 공간 관심맵 방법과의 객관적 성능 평가를 통해서 제안 방법이 공간 관심맵보다 운동 픽셀의 경우에 평균적으로 관심도 값이 +38 정도 향상되는 것을 보여준다. 또한 참조 데이터가 있는 4개의 동영상을 대상으로 얻은 ROC는 만족스러운 결과를 보여준다.

영상의 시각적 품질향상을 위한 Saliency 맵 기반의 컬러 영상압축 (Saliency Map Based Color Image Compression for Visual Quality Enhancement of Image)

  • 정성환
    • 한국멀티미디어학회논문지
    • /
    • 제20권3호
    • /
    • pp.446-455
    • /
    • 2017
  • A color image compression based on saliency map was proposed. The proposed method provides higher quality in saliency blocks on which people's attention focuses, compared with non-saliency blocks on which the attention less focuses at a given bitrate. The proposed method uses 3 different quantization tables according to each block's saliency level. In the experiment using 6 typical images, we compared the proposed method with JPEG and other conventional methods. As the result, it showed that the proposed method (Qup=0.5*Qx) is about 3.1 to 1.2 dB better than JPEG and others in saliency blocks in PSNR at the almost similar bitrate. In the comparison of result images, the proposed one also showed less error than others in saliency blocks.

The Effects of Image Dehazing Methods Using Dehazing Contrast-Enhancement Filters on Image Compression

  • Wang, Liping;Zhou, Xiao;Wang, Chengyou;Li, Weizhi
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권7호
    • /
    • pp.3245-3271
    • /
    • 2016
  • To obtain well-dehazed images at the receiver while sustaining low bit rates in the transmission pipeline, this paper investigates the effects of image dehazing methods using dehazing contrast-enhancement filters on image compression for surveillance systems. At first, this paper proposes a novel image dehazing method by using a new method of calculating the transmission function—namely, the direct denoising method. Next, we deduce the dehazing effects of the direct denoising method and image dehazing method based on dark channel prior (DCP) on image compression in terms of ringing artifacts and blocking artifacts. It can be concluded that the direct denoising method performs better than the DCP method for decompressed (reconstructed) images. We also improve the direct denoising method to obtain more desirable dehazed images with higher contrast, using the saliency map as the guidance image to modify the transmission function. Finally, we adjust the parameters of dehazing contrast-enhancement filters to obtain a corresponding composite peak signal-to-noise ratio (CPSNR) and blind image quality assessment (BIQA) of the decompressed images. Experimental results show that different filters have different effects on image compression. Moreover, our proposed dehazing method can strike a balance between image dehazing and image compression.

TFT-LCD 영상에서 Saliency Map 기반의 얼룩성 결함 강조 (Mura Defect Enhancement based on Saliency Map in TFT-LCD Image)

  • 이은영;박길흠
    • 한국멀티미디어학회논문지
    • /
    • 제19권3호
    • /
    • pp.626-632
    • /
    • 2016
  • In this paper, we propose the defect emphasis in TFT-LCD panel image. The defect emphasis image consist of S(Shape) map and B(Brightness) map. S map based on DoG(difference of gaussian) is made with the mura defect shape characteristic. And B map use defect intensity property that defect intensity is higher than background. The experiments were conducted to evaluate the performance of the proposed defect emphasis method. The results of experiments show the validity of the defect emphasis using the proposed method.

움직임 분석 기반의 시각인지 모델을 이용한 비디오 코딩 방법 (Video Coding Method Using Visual Perception Model based on Motion Analysis)

  • 오형석;김원하
    • 방송공학회논문지
    • /
    • 제17권2호
    • /
    • pp.223-236
    • /
    • 2012
  • 본 논문에서는 인간 인지 기반 비디오 코딩을 위한 비디오 처리 방법을 개발한다. 제안하는 방법은 율-왜곡(rate-distortion) 최적화의 영향뿐만 아니라 제한적인 시, 공간 해상도, 지역적인 움직임 이력(history), visual saliency에 의한 인간 시각 인지를 고려한다. 이러한 인간의 인지적인 효과들을 고려하기 위하여 본 논문에서는 움직임 패턴을 모델링하고 Hedge 알고리듬을 사용하여 움직임 패턴을 결정하는 기법을 개발한다. 그 다음, 제안한 움직임 패턴과 기존의 visual saliency와의 결합을 통하여 인간 시각 인지 모델을 수립한다. 제안된 인간 시각 인지 모델을 구현하기 위하여 기존의 foveation filtering 방법을 확장한다. 시각적 자극이 덜한 지역만을 부드럽게(smoothing)하는 기존의 foveation filtering 기법과 비교하여 제안하는 foveation filtering 기법은 인간 시각 인지 모델에 따라 지역적으로 부드럽게 또는 지역적 특성을 향상시킴으로써, 시각적 자극이 덜한 지역에서 줄여진 대역폭을 효과적으로 시각적 자극이 큰 지역에서 사용하도록 이동 시킬 수 있는 장점이 있다. 제안된 방법의 성능은 전반적인 비디오 화질을 만족할 뿐만 아니라 인간이 인지하는 화질의 품질을 12%~44% 향상시킨다.

에지 보존 필터 및 관심영역 전송에 기반한 스케일러블 코딩 방법 (A Scalable Coding Based on Edge-Preserving Filter and the Region of Interest Based on Saliency Detection)

  • 이대현;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2016년도 하계학술대회
    • /
    • pp.33-34
    • /
    • 2016
  • 본 논문에서는 HVS(human visual system)의 특성을 고려한 새로운 스케일러블 코딩방법을 제안한다. 제안된 방법은 먼저 영상 내에서 관심영역(saliency map)을 찾고 관심영역을 제외한 부분에 에지 보존 필터를 적용한다. 그 영상은 정해진 양자 파라미터 값으로 인코딩 되어 제안된 코딩 시스템의 베이스 층(base layer)이 된다. 기존 스케일러블 코딩 표준에서의 베이스 층과 다르게 본 논문의 베이스 층은 관심 있는 중요영역(foreground)을 보존하고 또한 배경(background)의 에지 성분도 보존한다. 기본 층이 전송되면 개선층(enhancement layer)은 원 영상과 복원된 베이스 층 영상간의 차분 영상에서 관심영역 순으로 보내진다. 실험은 HEVC 를 바탕으로 수행되었고 스케일러블 코딩 표준인 SHVC 와 관심영역에서 비교를 했을 때 제안된 알고리즘이 더 높은 PSNR 을 가지는 것을 확인하였다. 또한 전체적으로 지각적인 품질(perceptual quality) 또한 향상되었음을 확인하였다.

  • PDF

중요도 지도를 사용한 화소값 사이 척력 기반 영상 대조비 향상 (Image Contrast Enhancement Based on Repelling Force between Pixel Values Using Saliency Maps)

  • 김영배;고영준;김창수
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2014년도 하계학술대회
    • /
    • pp.105-106
    • /
    • 2014
  • 본 논문에서는 중요도 지도를 사용한 화소값 사이 척력 기반 영상 대조비 향상 기법을 제안한다. 공간상에서 인접한 화소들 사이에 자주 발생하는 화소값들의 차이를 크게 하면 효과적으로 영상의 디테일을 두드러지게 할 수 있다. 대조비 증가를 위해 화소값 사이 척력을 정의하고, 유효 화소값 사이 척력들의 합을 사용하여 대조비의 증가 정도를 조절한다. 중요도 지도는 영상의 화소마다 사람의 시선이 머무르는 정도를 상대적인 수치로 나타낸 것이다. 따라서 영상 화질을 개선할 때 중요도 지도를 사용하면 사람의 시선을 끄는 화소값들의 대조비를 선택적으로 높일 수 있다. 실험 결과를 통하여 제안 기법이 우수한 화질개선 영상을 생성함을 확인한다.

  • PDF

Image-based Soft Drink Type Classification and Dietary Assessment System Using Deep Convolutional Neural Network with Transfer Learning

  • Rubaiya Hafiz;Mohammad Reduanul Haque;Aniruddha Rakshit;Amina khatun;Mohammad Shorif Uddin
    • International Journal of Computer Science & Network Security
    • /
    • 제24권2호
    • /
    • pp.158-168
    • /
    • 2024
  • There is hardly any person in modern times who has not taken soft drinks instead of drinking water. The rate of people taking soft drinks being surprisingly high, researchers around the world have cautioned from time to time that these drinks lead to weight gain, raise the risk of non-communicable diseases and so on. Therefore, in this work an image-based tool is developed to monitor the nutritional information of soft drinks by using deep convolutional neural network with transfer learning. At first, visual saliency, mean shift segmentation, thresholding and noise reduction technique, collectively known as 'pre-processing' are adopted to extract the location of drinks region. After removing backgrounds and segment out only the desired area from image, we impose Discrete Wavelength Transform (DWT) based resolution enhancement technique is applied to improve the quality of image. After that, transfer learning model is employed for the classification of drinks. Finally, nutrition value of each drink is estimated using Bag-of-Feature (BoF) based classification and Euclidean distance-based ratio calculation technique. To achieve this, a dataset is built with ten most consumed soft drinks in Bangladesh. These images were collected from imageNet dataset as well as internet and proposed method confirms that it has the ability to detect and recognize different types of drinks with an accuracy of 98.51%.

Salient Object Detection via Adaptive Region Merging

  • Zhou, Jingbo;Zhai, Jiyou;Ren, Yongfeng
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권9호
    • /
    • pp.4386-4404
    • /
    • 2016
  • Most existing salient object detection algorithms commonly employed segmentation techniques to eliminate background noise and reduce computation by treating each segment as a processing unit. However, individual small segments provide little information about global contents. Such schemes have limited capability on modeling global perceptual phenomena. In this paper, a novel salient object detection algorithm is proposed based on region merging. An adaptive-based merging scheme is developed to reassemble regions based on their color dissimilarities. The merging strategy can be described as that a region R is merged with its adjacent region Q if Q has the lowest dissimilarity with Q among all Q's adjacent regions. To guide the merging process, superpixels that located at the boundary of the image are treated as the seeds. However, it is possible for a boundary in the input image to be occupied by the foreground object. To avoid this case, we optimize the boundary influences by locating and eliminating erroneous boundaries before the region merging. We show that even though three simple region saliency measurements are adopted for each region, encouraging performance can be obtained. Experiments on four benchmark datasets including MSRA-B, SOD, SED and iCoSeg show the proposed method results in uniform object enhancement and achieve state-of-the-art performance by comparing with nine existing methods.