• 제목/요약/키워드: Grayscale Image

검색결과 121건 처리시간 0.026초

An Efficient Color Edge Detection Using the Mahalanobis Distance

  • Khongkraphan, Kittiya
    • Journal of Information Processing Systems
    • /
    • 제10권4호
    • /
    • pp.589-601
    • /
    • 2014
  • The performance of edge detection often relies on its ability to correctly determine the dissimilarities of connected pixels. For grayscale images, the dissimilarity of two pixels is estimated by a scalar difference of their intensities and for color images, this is done by using the vector difference (color distance) of the three-color components. The Euclidean distance in the RGB color space typically measures a color distance. However, the RGB space is not suitable for edge detection since its color components do not coincide with the information human perception uses to separate objects from backgrounds. In this paper, we propose a novel method for color edge detection by taking advantage of the HSV color space and the Mahalanobis distance. The HSV space models colors in a manner similar to human perception. The Mahalanobis distance independently considers the hue, saturation, and lightness and gives them different degrees of contribution for the measurement of color distances. Therefore, our method is robust against the change of lightness as compared to previous approaches. Furthermore, we will introduce a noise-resistant technique for determining image gradients. Various experiments on simulated and real-world images show that our approach outperforms several existing methods, especially when the images vary in lightness or are corrupted by noise.

초저비트율 동화상 압축을 위한 post-it 변환을 이용한 수리형태학적 상세부분(details)추출의 효율개선 (Efficiency Improvement of Morphological Details Extraction using Post-it Transformation for Very Low Bit-Rate Video Compression)

  • 허시행;어진우
    • 전기전자학회논문지
    • /
    • 제2권2호
    • /
    • pp.239-246
    • /
    • 1998
  • 영상 압축을 위한 방법으로서 수리형태학적 상세부분(details)의 추출을 위한 방법인 post-it 변환 과정 중에서 기존에는 상세부분(details)를 추출하는 단계의 참조영상을 일반 top-hat 결과로 취함으로서 상세부분(details)의 정보량이 많아 지고 밝고 어두운 상세부분(details)을 뺀 smoothed 영상이 평활화 되지 않고 오히려 공간주파수가 높아지는 단점이 있으므로 본 논문에서는 그러한 단점을 극복하기 위해 참조영상을 일반 top-hat이 아닌 재생 top-hatd의 사용을 제안함으로서 상세부분(details) 영상과 smoothed 영상의 압축효율 증대와 재생과정상의 반복연산수 감소 효과가 발생함을 보인다. 그러나 이러한 결과는 단독적으로 사용되는것이 아니라 동화상의 고효율 압축시 그 일부 과정으로 이용하며 이러한 변형 post-it 변환을 분할기반 부호화와 연계하여 동화상 비디오 시퀸스에 적용함으로서 본래 목적하였던 초저속 동화상 전송을 위한 고효율 압축을 실현하고자 한다.

  • PDF

A New Depth and Disparity Visualization Algorithm for Stereoscopic Camera Rig

  • Ramesh, Rohit;Shin, Heung-Sub;Jeong, Shin-Il;Chung, Wan-Young
    • Journal of information and communication convergence engineering
    • /
    • 제8권6호
    • /
    • pp.645-650
    • /
    • 2010
  • In this paper, we present the effect of binocular cues which plays crucial role for the visualization of a stereoscopic or 3D image. This study is useful in extracting depth and disparity information by image processing technique. A linear relation between the object distance and the image distance is presented to discuss the cause of cybersickness. In the experimental results, three dimensional view of the depth map between the 2D images is shown. A median filter is used to reduce the noises available in the disparity map image. After the median filter, two filter algorithms such as 'Gabor' filter and 'Canny' filter are tested for disparity visualization between two images. The 'Gabor' filter is to estimate the disparity by texture extraction and discrimination methods of the two images, and the 'Canny' filter is used to visualize the disparity by edge detection of the two color images obtained from stereoscopic cameras. The 'Canny' filter is better choice for estimating the disparity rather than the 'Gabor' filter because the 'Canny' filter is much more efficient than 'Gabor' filter in terms of detecting the edges. 'Canny' filter changes the color images directly into color edges without converting them into the grayscale. As a result, more clear edges of the stereo images as compared to the edge detection by 'Gabor' filter can be obtained. Since the main goal of the research is to estimate the horizontal disparity of all possible regions or edges of the images, thus the 'Canny' filter is proposed for decipherable visualization of the disparity.

패턴을 이용한 블록 절단 부호화 기반의 영상 압축 (BTC-based Image Compression using Pattern)

  • 김천식;오재환
    • 한국인터넷방송통신학회논문지
    • /
    • 제15권3호
    • /
    • pp.77-83
    • /
    • 2015
  • 블록절단 코딩 또는 BTC(Block Truncation Coding)는 회색 영상을 위한 손실 영상 압축 기술의 일종이다. 이 방법은 원본 영상을 여러 개의 블록으로 나누고 각 블록에 대해서 평균과 표준편차를 계산하여 각 블록에서의 회색 레벨의 수를 줄인다. BTC는 비디오 압축에 적합하도록 만들어졌다. BTC의 변형된 것으로 AMBTC (Absolute Moment Block Truncation Coding)가 있다. AMBTC는 BTC보다 계산이 간편하다. 본 논문에서는 압축 성능과 이미지 해상도를 높이기 위해서 패턴을 활용한 BTC 기반의 이미지 압축방법을 제안하고자 한다. 이 방법은 여러 이미지의 BTC에 빈도수가 높은 패턴 36개와 64개를 추출하여 코드 북을 만든다. 이미지를 압축할 때 해당 블록과 패턴을 비교해서 일치하는 패턴의 인덱스를 압축에 이용하는 방법이다. 제안한 방법을 실험하였고 36개의 패턴을 활용할 경우 1.37bpp의 압축 성능을 보였다. 본 논문에서 제안한 방법은 BTC 압축보다 높은 성능을 보였다. 제안한 방법의 성능은 표준 이미지를 이용하여 실험하였다.

ARPA 레이더 개발을 위한 물표 획득 및 추적 기술 연구 (A Study on Target Acquisition and Tracking to Develop ARPA Radar)

  • 이희용;신일식;이광일
    • 한국항해항만학회지
    • /
    • 제39권4호
    • /
    • pp.307-312
    • /
    • 2015
  • ARPA(Automatic Radar Plotting Aid)는 자동레이더 플로팅 장치로써, 레이더 물표의 상대침로와 상대방위로 구성된 운동벡터에 본선의 침로와 방위로 구성되는 운동벡터를 가감 연산(벡터연산)하여, 물표의 진침로와 진방위 및 최근접점과 근접시간을 계산하는 장치를 말한다. 본 연구의 목적은 ARPA 레이더를 구현하기 위한 물표의 획득 및 추적 기술을 개발하는 것으로, 이에 관한 여러 선행 연구를 검토하여 적용 가능한 알고리듬 및 기법을 조합하여 기초적인 ARPA 기능을 개발하였다. 주요 연구내용으로, 레이더 영상에서 물표를 획득하기 위하여, 회색조 변환, 가운시안 평활 필터 적용, 이진화 및 라벨링(Labeling)과 같은 순차적 영상 처리 방법을 고안하였고, 이전 영상에서의 물표가 다음 영상에서의 어느 물표인지를 결정하는데 근접이웃탐색알고리듬을 사용하였으며, 물표의 진침로와 진방위를 계산하는 거동해석에 칼만필터를 사용하였다. 또한 이러한 기법을 전산 구현하여 실선실험을 수행하였고, 이를 통해 개발된 ARPA의 기능이 실용상 사용가능함을 검증하였다.

Classifying Indian Medicinal Leaf Species Using LCFN-BRNN Model

  • Kiruba, Raji I;Thyagharajan, K.K;Vignesh, T;Kalaiarasi, G
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권10호
    • /
    • pp.3708-3728
    • /
    • 2021
  • Indian herbal plants are used in agriculture and in the food, cosmetics, and pharmaceutical industries. Laboratory-based tests are routinely used to identify and classify similar herb species by analyzing their internal cell structures. In this paper, we have applied computer vision techniques to do the same. The original leaf image was preprocessed using the Chan-Vese active contour segmentation algorithm to efface the background from the image by setting the contraction bias as (v) -1 and smoothing factor (µ) as 0.5, and bringing the initial contour close to the image boundary. Thereafter the segmented grayscale image was fed to a leaky capacitance fired neuron model (LCFN), which differentiates between similar herbs by combining different groups of pixels in the leaf image. The LFCN's decay constant (f), decay constant (g) and threshold (h) parameters were empirically assigned as 0.7, 0.6 and h=18 to generate the 1D feature vector. The LCFN time sequence identified the internal leaf structure at different iterations. Our proposed framework was tested against newly collected herbal species of natural images, geometrically variant images in terms of size, orientation and position. The 1D sequence and shape features of aloe, betel, Indian borage, bittergourd, grape, insulin herb, guava, mango, nilavembu, nithiyakalyani, sweet basil and pomegranate were fed into the 5-fold Bayesian regularization neural network (BRNN), K-nearest neighbors (KNN), support vector machine (SVM), and ensemble classifier to obtain the highest classification accuracy of 91.19%.

시각 감지 기반의 저조도 영상 이미지 적응 보상 증진 알고리즘 (Adaptive Enhancement of Low-light Video Images Algorithm Based on Visual Perception)

  • 이원;민병원
    • 사물인터넷융복합논문지
    • /
    • 제10권2호
    • /
    • pp.51-60
    • /
    • 2024
  • 저조도 환경에서 영상 이미지의 콘트라스트가 낮고 식별이 어려운 문제를 목표로 사람의 시각 감지 기반의 콘트라스트 적응 보상 증진 알고리즘을 제안한다. 첫째, 저조도 환경에서 평균 밝기, 평균 대역폭 요인의 영상 이미지 특징 요인을 추출하고, 원본 영상의 회색/색도 차이에 따라 사람의 시각적 콘트라스트 해상도 보상의 수학적 모델을 설정하며, 실제 컬러의 3원색에 대해 각각 비례 적분하여 보상한다. 다음으로 보상 정도가 명시각 차이를 적절하게 구별할 수 있는 것보다 낮을 때 보상 임계값 선형 보상이 명시각에서 전체 대역폭으로 설정된다. 마지막으로 주관적인 이미지 품질 평가와 이미지 특성 요인을 결합하여 비례 계수를 보상하는 자동 최적화 모델을 구축한다. 실험 테스트 결과는 영상 이미지 적응 증진 알고리즘이 우수한 증진 효과와 우수한 실시간 성능을 가지며 다크 비전 정보를 효과적으로 마이닝할 수 있으며 다양한 시나리오에서 널리 사용될 수 있음을 보여준다.

ODBTC를 위한 EMD 기법에 기반한 데이터 은닉 (Data Hiding Based on EMD for Ordered Block Truncation Coding)

  • 김천식;조민호;홍유식;박현숙
    • 전자공학회논문지CI
    • /
    • 제46권6호
    • /
    • pp.27-34
    • /
    • 2009
  • BTC (Block Truncation Coding)은 이미지 압축 기법의 일종으로서 간단하고 효과적이다. 그러나, 이 방법은 블록 크기를 크게 사용할 때 블록 효과가 증가하므로 이미지의 질이 좋지 않다. ODBTC(Ordered Dithering Block Truncation Coding)는 BTC와 같은 압축 능력을 유지하면서 블록 효과를 해결한 방법이다. 본 논문에서는 이와 같은 압축된 이미지를 이용하여 데이터를 하프톤 이미지에 저장하는 방법을 제안하고자 한다. EMD 방법은 Zhang과Wang[6]이 그레이스케일 이미지에 데이터를 은닉하도록 하도록 고안된 방법이다. 그런 이유로, 비트맵 이미지에는 적합하지 않다. 본 논문에서는 EMD가 어떻게 비트맵 이미지에 적용될 수 있는지를 제안한다. 또한, 본 논문의 실험에서, 우리가 제안한 방법이 하프톤 이미지에 효과적임을 증명한다.

전이 학습과 데이터 증강을 이용한 너구리와 라쿤 분류 (Classification of Raccoon dog and Raccoon with Transfer Learning and Data Augmentation)

  • 박동민;조영석;염석원
    • 융합신호처리학회논문지
    • /
    • 제24권1호
    • /
    • pp.34-41
    • /
    • 2023
  • 최근 인간의 활동 범위가 증가함에 따라 외래종의 유입이 잦아지고 있고 환경에 적응하지 못해 유기된 외래종 중 2020년부터 유해 지정 동물로 지정된 라쿤이 문제가 되고 있다. 라쿤은 국내 토종 너구리와 크기나 생김새가 유사하여 일반적으로 포획하는데 있어서 구분이 필요하다. 이를 해결하기 위해서 이미지 분류에 특화된 CNN 딥러닝 모델인 VGG19, ResNet152V2, InceptionV3, InceptionResNet, NASNet을 사용한다. 학습에 사용할 파라미터는 많은 양의 데이터인 ImageNet으로 미리 학습된 파라미터를 전이 학습하여 이용한다. 너구리와 라쿤 데이터셋에서 동물의 외형적인 특징으로 분류하기 위해서 이미지를 회색조로 변환한 후 밝기를 정규화하였으며, 조정된 데이터셋에 충분한 학습을 위한 데이터를 만들기 위해 좌우 반전, 회전, 확대/축소, 이동을 이용하여 증강 기법을 적용하였다. 증강하지 않은 데이터셋은 FCL을 1층으로, 증강된 데이터셋은 4층으로 구성하여 진행하였다. 여러 가지 증강된 데이터셋의 정확도를 비교한 결과, 증강을 많이 할수록 성능이 증가함을 확인하였다.

잘피 서식지 모니터링을 위한 딥러닝 기반의 드론 영상 의미론적 분할 (Semantic Segmentation of Drone Imagery Using Deep Learning for Seagrass Habitat Monitoring)

  • 전의익;김성학;김병섭;박경현;최옥인
    • 대한원격탐사학회지
    • /
    • 제36권2_1호
    • /
    • pp.199-215
    • /
    • 2020
  • 잘피는 연안해역에 서식하는 해양수생관속식물로 해양생태계의 중요한 역할을 하고 있어, 주기적인 잘피 서식지의 모니터링이 이루어지고 있다. 최근 효율적인 잘피 서식지의 모니터링을 위해 고해상도의 영상 획득이 가능한 드론의 활용도가 높아지고 있다. 그리고 의미론적 분할에 있어 합성곱 신경망 기반의 딥러닝이 뛰어난 성능을 보임에 따라, 원격탐사 분야에 이를 적용한 연구가 활발하게 이루어지고 있다. 그러나 다양한 딥러닝 모델, 영상, 그리고 하이퍼파라미터에 의해 의미론적 분할의 정확도가 다르게 나타나고, 영상의 정규화와 타일과 배치 크기에서도 정형화되어 있지 않은 상태이다. 이에 따라 본 연구에서는 우수한 성능을 보여주는 딥러닝 모델을 이용하여 드론의 광학 영상에서 잘피 서식지를 분할하였다. 그리고 학습 자료의 정규화 및 타일의 크기를 중점으로 결과를 비교 및 분석하였다. 먼저 정규화와 타일, 배치 크기에 따른 결과 비교를 위해 흑백 영상을 만들고 흑백 영상을 Z-score 정규화 및 Min-Max 정규화 방법으로 변환한 영상을 사용하였다. 그리고 타일 크기를 특정 간격으로 증가시키면서 배치 크기는 메모리 크기를 최대한 사용할 수 있도록 하였다. 그 결과, Z-score 정규화가 적용된 영상이 다른 영상보다 IoU가 0.26 ~ 0.4 정도 높게 나타났다. 또한, 타일과 배치 크기에 따라 최대 0.09까지 차이가 나타나는 것을 확인하였다. 딥러닝을 이용한 의미론적 분할에 있어 정규화, 타일의 배치 크기의 변화에 따른 결과가 다르게 나타났다. 그러므로 실험을 통해 이들 요소에 대한 적합한 결정 과정이 있어야 함을 알 수 있었다.