• 제목/요약/키워드: multi-scale segmentation

검색결과 56건 처리시간 0.022초

신경회로망과 다중스케일 Bayesian 영상 분할 기법을 이용한 결 분할 (Texture segmentation using Neural Networks and multi-scale Bayesian image segmentation technique)

  • 김태형;엄일규;김유신
    • 대한전자공학회논문지SP
    • /
    • 제42권4호
    • /
    • pp.39-48
    • /
    • 2005
  • 본 논문에서는 Bayesian 추정법과 신경회로망을 이용한 새로운 결 분할 방법을 제안한다 신경회로망의 입력으로는 다중스케일을 가지는 웨이블릿 계수와 인접한 이웃 웨이블릿 계수들의 문맥정보를 사용하고, 신경회로망의 출력을 사후 확률로 모델링한다. 문맥정보는 HMT(Hidden Markov Tree) 모델을 이용하여 구한다. 제안 방법은 HMT를 이용한 ML(Maximum Likelihood) 분할 보다 더 우수한 결과를 보여준다. 또한 HMT를 이용한 결 분할 방법과 제안 방법을 이용한 결 분할 각각에 HMTseg라고 불리는 다중 스케일 Bayesian 영상 분할 기술을 이용하여 후처리를 행한 결 분할 또한 제안 방법이 우수함을 보여준다.

MSER을 이용한 다중 스케일 영상 분할과 응용 (Multi-scale Image Segmentation Using MSER and its Application)

  • 이진선;오일석
    • 한국콘텐츠학회논문지
    • /
    • 제14권3호
    • /
    • pp.11-21
    • /
    • 2014
  • 다중 스케일 영상 분할은 영상 스타일링과 의료진단과 같은 여러 응용에서 매우 중요하다. 이 논문은 다중 스케일 구조를 확보하며 안정적이고 효율적인 MSER에 기반을 둔 새로운 알고리즘을 제안한다. 이 알고리즘은 영상에서 MSER를 수집한 후, 이것들을 특정한 순서대로 영상에 다시 그려 넣음으로써 영상을 분할한다. 영상 경계를 평활화하고 잡음을 제거하기 위한 계층적 모폴로지 연산을 제안한다. 알고리즘의 다중 스케일 특성을 보이기 위해, 여러 종류의 상세 단계 제어의 효과를 영상 스타일링에 적용한다. 제안한 기법은 이러한 효과를 시간이 많이 걸리는 다중 가우시언 평활화없이 수행한다. 분할 품질과 계산 시간 측면에서 민쉬프트-기반 Edison 시스템과 비교 결과를 제시한다.

다중스케일 노멀라이즈 컷을 이용한 영상분할 (Image Segmentation using Multi-scale Normalized Cut)

  • 이재현;이지은;박래홍
    • 방송공학회논문지
    • /
    • 제18권4호
    • /
    • pp.609-618
    • /
    • 2013
  • 본 논문은 기존 그래프 컷 기반 영상분할의 성능은 유지하면서 연산속도가 빠른 영상분할 방법을 제안한다. 기존 그래프 컷 기반 영상분할은 높은 성능을 보이지만 고유쌍 연산으로 인해 분할 속도가 느리다는 단점을 지닌다. 이는 고유쌍 연산에서 영상 내 모든 화소 사이의 유사도를 고려하여 정방행렬을 만들기 때문이다. 그러므로 제안하는 방법은 영상을 여러 영역으로 분할하여 작은 크기의 정방행렬을 구성하고 이를 통해 고유쌍 연산 속도를 크게 향상시킨다. 본 논문에서는 대수적 다중 격자를 이용한 다중스케일 영상분할법을 제안하고 실험 결과를 통해 제안하는 방법이 기존 영상분할 방법보다 그 성능이 더 우수함을 보인다.

Multi-scale U-SegNet architecture with cascaded dilated convolutions for brain MRI Segmentation

  • 챠이트라 다야난다;이범식
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 추계학술대회
    • /
    • pp.25-28
    • /
    • 2020
  • Automatic segmentation of brain tissues such as WM, GM, and CSF from brain MRI scans is helpful for the diagnosis of many neurological disorders. Accurate segmentation of these brain structures is a very challenging task due to low tissue contrast, bias filed, and partial volume effects. With the aim to improve brain MRI segmentation accuracy, we propose an end-to-end convolutional based U-SegNet architecture designed with multi-scale kernels, which includes cascaded dilated convolutions for the task of brain MRI segmentation. The multi-scale convolution kernels are designed to extract abundant semantic features and capture context information at different scales. Further, the cascaded dilated convolution scheme helps to alleviate the vanishing gradient problem in the proposed model. Experimental outcomes indicate that the proposed architecture is superior to the traditional deep-learning methods such as Segnet, U-net, and U-Segnet and achieves high performance with an average DSC of 93% and 86% of JI value for brain MRI segmentation.

  • PDF

Multi-scale context fusion network for melanoma segmentation

  • Zhenhua Li;Lei Zhang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제18권7호
    • /
    • pp.1888-1906
    • /
    • 2024
  • Aiming at the problems that the edge of melanoma image is fuzzy, the contrast with the background is low, and the hair occlusion makes it difficult to segment accurately, this paper proposes a model MSCNet for melanoma segmentation based on U-net frame. Firstly, a multi-scale pyramid fusion module is designed to reconstruct the skip connection and transmit global information to the decoder. Secondly, the contextural information conduction module is innovatively added to the top of the encoder. The module provides different receptive fields for the segmented target by using the hole convolution with different expansion rates, so as to better fuse multi-scale contextural information. In addition, in order to suppress redundant information in the input image and pay more attention to melanoma feature information, global channel attention mechanism is introduced into the decoder. Finally, In order to solve the problem of lesion class imbalance, this paper uses a combined loss function. The algorithm of this paper is verified on ISIC 2017 and ISIC 2018 public datasets. The experimental results indicate that the proposed algorithm has better accuracy for melanoma segmentation compared with other CNN-based image segmentation algorithms.

SOM의 통계적 특성과 다중 스케일 Bayesian 영상 분할 기법을 이용한 텍스쳐 분할 (Texture Segmentation Using Statistical Characteristics of SOM and Multiscale Bayesian Image Segmentation Technique)

  • 김태형;엄일규;김유신
    • 대한전자공학회논문지SP
    • /
    • 제42권6호
    • /
    • pp.43-54
    • /
    • 2005
  • 이본 논문에서는 Bayesian 영상 분할법과 SOM(Self Organization feature Map)을 이용한 텍스쳐(Texture) 분할 방법을 제안한다. SOM의 입력으로 다중 스케일에서의 웨이블릿 계수를 사용하고, 훈련된 SOM으로부터 관측 데이터에 대한 우도(尤度, likelihood)와 사후확률을 구하는 방법을 제시한다. 훈련된 SOM들로부터 구한 사후확률과 MAP(Maximum A Posterior) 분류법을 이용하여 텍스쳐 분할을 얻는다. 그리고 문맥 정보를 이용하여 텍스쳐 분할 결과를 개선하였다. 제안 방법은 HMT(Hidden Markov Tree)을 이용한 텍스쳐 분할보다 더 우수한 결과를 보여준다. 또한 SOM과 HMTseg라고 불리는 다중스케일 Bayesian 영상 분할 기법을 이용한 텍스쳐 분할 결과는 HMT와 HMTseg을 이용한 결과보다 더 우수한 성능을 보여준다.

색상지수 기반의 식물분할을 위한 다층퍼셉트론 신경망 (A Multi-Layer Perceptron for Color Index based Vegetation Segmentation)

  • 이문규
    • 산업경영시스템학회지
    • /
    • 제43권1호
    • /
    • pp.16-25
    • /
    • 2020
  • Vegetation segmentation in a field color image is a process of distinguishing vegetation objects of interests like crops and weeds from a background of soil and/or other residues. The performance of the process is crucial in automatic precision agriculture which includes weed control and crop status monitoring. To facilitate the segmentation, color indices have predominantly been used to transform the color image into its gray-scale image. A thresholding technique like the Otsu method is then applied to distinguish vegetation parts from the background. An obvious demerit of the thresholding based segmentation will be that classification of each pixel into vegetation or background is carried out solely by using the color feature of the pixel itself without taking into account color features of its neighboring pixels. This paper presents a new pixel-based segmentation method which employs a multi-layer perceptron neural network to classify the gray-scale image into vegetation and nonvegetation pixels. The input data of the neural network for each pixel are 2-dimensional gray-level values surrounding the pixel. To generate a gray-scale image from a raw RGB color image, a well-known color index called Excess Green minus Excess Red Index was used. Experimental results using 80 field images of 4 vegetation species demonstrate the superiority of the neural network to existing threshold-based segmentation methods in terms of accuracy, precision, recall, and harmonic mean.

MEDU-Net+: a novel improved U-Net based on multi-scale encoder-decoder for medical image segmentation

  • Zhenzhen Yang;Xue Sun;Yongpeng, Yang;Xinyi Wu
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제18권7호
    • /
    • pp.1706-1725
    • /
    • 2024
  • The unique U-shaped structure of U-Net network makes it achieve good performance in image segmentation. This network is a lightweight network with a small number of parameters for small image segmentation datasets. However, when the medical image to be segmented contains a lot of detailed information, the segmentation results cannot fully meet the actual requirements. In order to achieve higher accuracy of medical image segmentation, a novel improved U-Net network architecture called multi-scale encoder-decoder U-Net+ (MEDU-Net+) is proposed in this paper. We design the GoogLeNet for achieving more information at the encoder of the proposed MEDU-Net+, and present the multi-scale feature extraction for fusing semantic information of different scales in the encoder and decoder. Meanwhile, we also introduce the layer-by-layer skip connection to connect the information of each layer, so that there is no need to encode the last layer and return the information. The proposed MEDU-Net+ divides the unknown depth network into each part of deconvolution layer to replace the direct connection of the encoder and decoder in U-Net. In addition, a new combined loss function is proposed to extract more edge information by combining the advantages of the generalized dice and the focal loss functions. Finally, we validate our proposed MEDU-Net+ MEDU-Net+ and other classic medical image segmentation networks on three medical image datasets. The experimental results show that our proposed MEDU-Net+ has prominent superior performance compared with other medical image segmentation networks.

Black Ice Detection Platform and Its Evaluation using Jetson Nano Devices based on Convolutional Neural Network (CNN)

  • Sun-Kyoung KANG;Yeonwoo LEE
    • 한국인공지능학회지
    • /
    • 제11권4호
    • /
    • pp.1-8
    • /
    • 2023
  • In this paper, we propose a black ice detection platform framework using Convolutional Neural Networks (CNNs). To overcome black ice problem, we introduce a real-time based early warning platform using CNN-based architecture, and furthermore, in order to enhance the accuracy of black ice detection, we apply a multi-scale dilation convolution feature fusion (MsDC-FF) technique. Then, we establish a specialized experimental platform by using a comprehensive dataset of thermal road black ice images for a training and evaluation purpose. Experimental results of a real-time black ice detection platform show the better performance of our proposed network model compared to conventional image segmentation models. Our proposed platform have achieved real-time segmentation of road black ice areas by deploying a road black ice area segmentation network on the edge device Jetson Nano devices. This approach in parallel using multi-scale dilated convolutions with different dilation rates had faster segmentation speeds due to its smaller model parameters. The proposed MsCD-FF Net(2) model had the fastest segmentation speed at 5.53 frame per second (FPS). Thereby encouraging safe driving for motorists and providing decision support for road surface management in the road traffic monitoring department.

딥러닝 기반의 Multi Scale Attention을 적용한 개선된 Pyramid Scene Parsing Network (Modified Pyramid Scene Parsing Network with Deep Learning based Multi Scale Attention)

  • 김준혁;이상훈;한현호
    • 한국융합학회논문지
    • /
    • 제12권11호
    • /
    • pp.45-51
    • /
    • 2021
  • 딥러닝의 발전으로 인하여 의미론적 분할 방법은 다양한 분야에서 연구되고 있다. 의료 영상 분석과 같이 정확성을 요구하는 분야에서 분할 정확도가 떨어지는 문제가 있다. 본 논문은 의미론적 분할 시 특징 손실을 최소화하기 위해 딥러닝 기반 분할 방법인 PSPNet을 개선하였다. 기존 딥러닝 기반의 분할 방법은 특징 추출 및 압축 과정에서 해상도가 낮아져 객체에 대한 특징 손실이 발생한다. 이러한 손실로 윤곽선이나 객체 내부 정보에 손실이 발생하여 객체 분류 시 정확도가 낮아지는 문제가 있다. 이러한 문제를 해결하기 위해 의미론적 분할 모델인 PSPNet을 개선하였다. 기존 PSPNet에 제안하는 multi scale attention을 추가하여 객체의 특징 손실을 방지하였다. 기존 PPM 모듈에 attention 방법을 적용하여 특징 정제 과정을 수행하였다. 불필요한 특징 정보를 억제함으로써 윤곽선 및 질감 정보가 개선되었다. 제안하는 방법은 Cityscapes 데이터 셋으로 학습하였으며, 정량적 평가를 위해 분할 지표인 MIoU를 사용하였다. 실험을 통해 기존 PSPNet 대비 분할 정확도가 약 1.5% 향상되었다.