• 제목/요약/키워드: Scene Segmentation

검색결과 147건 처리시간 0.027초

계층적 모션 추정을 통한 장면 분할 기법 (Scene Segmentation using a Hierarchical Motion Estimation Technique)

  • 김모곤;우종선;정순기
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 하계종합학술대회 논문집(3)
    • /
    • pp.203-206
    • /
    • 2002
  • We propose the new algorithm for scene segmentation. The proposed system consists motion estimation module and motion segmentation module. The former estimates 2D-motion value for each pixel position from two images transformed by wavelet. The latter determine scene segments well fitting on dominant affine motion models. What distinguishes proposed algorithm from other methods is that it needs not other post-processing for scene segmentation. We can manipulate both multimedia data and objects in virtual environment using proposed algorithm.

  • PDF

Saliency-Assisted Collaborative Learning Network for Road Scene Semantic Segmentation

  • Haifeng Sima;Yushuang Xu;Minmin Du;Meng Gao;Jing Wang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제17권3호
    • /
    • pp.861-880
    • /
    • 2023
  • Semantic segmentation of road scene is the key technology of autonomous driving, and the improvement of convolutional neural network architecture promotes the improvement of model segmentation performance. The existing convolutional neural network has the simplification of learning knowledge and the complexity of the model. To address this issue, we proposed a road scene semantic segmentation algorithm based on multi-task collaborative learning. Firstly, a depthwise separable convolution atrous spatial pyramid pooling is proposed to reduce model complexity. Secondly, a collaborative learning framework is proposed involved with saliency detection, and the joint loss function is defined using homoscedastic uncertainty to meet the new learning model. Experiments are conducted on the road and nature scenes datasets. The proposed method achieves 70.94% and 64.90% mIoU on Cityscapes and PASCAL VOC 2012 datasets, respectively. Qualitatively, Compared to methods with excellent performance, the method proposed in this paper has significant advantages in the segmentation of fine targets and boundaries.

PROPAGATION OF MULTI-LEVEL CUES WITH ADAPTIVE CONFIDENCE FOR BILAYER SEGMENTATION OF CONSISTENT SCENE IMAGES

  • Lee, Soo-Chahn;Yun, Il-Dong;Lee, Sang-Uk
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2009년도 IWAIT
    • /
    • pp.148-153
    • /
    • 2009
  • Few methods have dealt with segmenting multiple images with analogous content. Concurrent images of a scene and gathered images of a similar foreground are examples of these images, which we term consistent scene images. In this paper, we present a method to segment these images based on manual segmentation of one image, by iteratively propagating information via multi-level cues with adaptive confidence. The cues are classified as low-, mid-, and high- levels based on whether they pertain to pixels, patches, and shapes. Propagated cues are used to compute potentials in an MRF framework, and segmentation is done by energy minimization. Through this process, the proposed method attempts to maximize the amount of extracted information and maximize the consistency of segmentation. We demonstrate the effectiveness of the proposed method on several sets of consistent scene images and provide a comparison with results based only on mid-level cues [1].

  • PDF

Construction Site Scene Understanding: A 2D Image Segmentation and Classification

  • Kim, Hongjo;Park, Sungjae;Ha, Sooji;Kim, Hyoungkwan
    • 국제학술발표논문집
    • /
    • The 6th International Conference on Construction Engineering and Project Management
    • /
    • pp.333-335
    • /
    • 2015
  • A computer vision-based scene recognition algorithm is proposed for monitoring construction sites. The system analyzes images acquired from a surveillance camera to separate regions and classify them as building, ground, and hole. Mean shift image segmentation algorithm is tested for separating meaningful regions of construction site images. The system would benefit current monitoring practices in that information extracted from images could embrace an environmental context.

  • PDF

Change Detection in Land-Cover Pattern Using Region Growing Segmentation and Fuzzy Classification

  • Lee Sang-Hoon
    • 대한원격탐사학회지
    • /
    • 제21권1호
    • /
    • pp.83-89
    • /
    • 2005
  • This study utilized a spatial region growing segmentation and a classification using fuzzy membership vectors to detect the changes in the images observed at different dates. Consider two co-registered images of the same scene, and one image is supposed to have the class map of the scene at the observation time. The method performs the unsupervised segmentation and the fuzzy classification for the other image, and then detects the changes in the scene by examining the changes in the fuzzy membership vectors of the segmented regions in the classification procedure. The algorithm was evaluated with simulated images and then applied to a real scene of the Korean Peninsula using the KOMPSAT-l EOC images. In the expertments, the proposed method showed a great performance for detecting changes in land-cover.

Parallel Dense Merging Network with Dilated Convolutions for Semantic Segmentation of Sports Movement Scene

  • Huang, Dongya;Zhang, Li
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권11호
    • /
    • pp.3493-3506
    • /
    • 2022
  • In the field of scene segmentation, the precise segmentation of object boundaries in sports movement scene images is a great challenge. The geometric information and spatial information of the image are very important, but in many models, they are usually easy to be lost, which has a big influence on the performance of the model. To alleviate this problem, a parallel dense dilated convolution merging Network (termed PDDCM-Net) was proposed. The proposed PDDCMNet consists of a feature extractor, parallel dilated convolutions, and dense dilated convolutions merged with different dilation rates. We utilize different combinations of dilated convolutions that expand the receptive field of the model with fewer parameters than other advanced methods. Importantly, PDDCM-Net fuses both low-level and high-level information, in effect alleviating the problem of accurately segmenting the edge of the object and positioning the object position accurately. Experimental results validate that the proposed PDDCM-Net achieves a great improvement compared to several representative models on the COCO-Stuff data set.

프레임 특징 비교를 이용한 압축비디오 분할 (MPEG Video Segmentation Using Frame Feature Comparison)

  • 김영호;강대성
    • 융합신호처리학회논문지
    • /
    • 제4권2호
    • /
    • pp.25-30
    • /
    • 2003
  • 최근 들어 디지털 기술의 발전은 문자, 음성, 화상, 비디오 등과 같은 멀티미디어 정보가 매우 큰 비중을 차지하고 있다 이들 중에서 비디오와 관련된 연구로는 비디오 색인 및 검색에 관한 연구가 많이 진행되고 있다. 본 논문에서는 MPEG으로 압축된 비디오 분할을 위한 새로운 알고리즘을 제안한다. Shot 검출 즉 장면전환 검출은 MPEG 비디오 시퀀스에서 분할하는 가장 기본적이면서 중요한 작업이며 비디오 색인 및 검색을 위한 첫 번째 단계이다. 일반적으로 많이 사용되는 분할 알고리즘은 이전 프레임과 현재 프레임을 비교하기 때문에 물체의 빠른 움직임이나 카메라의 움직임, 카메라 후레쉬의 섬광 등 화면 변화에 따라 오검출이 생기는 단점이 있었다 따라서 본 논문에서는 기존 알고리즘에 검출한 장면전환 지점을 사용하여 이웃 프레임들과의 특징차 비교를 통하여 한번 더 판별하였다. 실험 결과 기존 알고리즘 보다 정확한 장면전환 검출을 할 수 있었다.

  • PDF

동적 환경에서의 효과적인 움직이는 객체 추출 (An effective background subtraction in dynamic scene.)

  • 한재혁;김용진;유세운;이상화;박종일
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.631-636
    • /
    • 2009
  • 컴퓨터 비전 분야에서 전경을 추출하기 위한 영역 분할(segmentation) 방법에 대한 연구가 활발히 진행되어 왔다. 특히, 전경이 배제된 배경 영상과 현재 프레임의 차이를 이용하여 전경을 추출하는 배경 차분(background subtraction) 방법은 요구하는 계산량에 비해 우수한 품질의 전경 추출이 가능하므로 실시간 처리가 필요한 비전 시스템에 다양하게 응용되고 있다. 그러나 배경 차분 방법만을 이용하여서는 배경이 동적으로 변하는 환경에서 정확한 전경을 추출해 내지 못하는 단점이 있다. 본 논문에서는 정적인 배경과 동적인 배경이 공존하는 환경에서 영역 분할을 효과적으로 수행하는 방법을 제안한다. 제안된 방법은 정적인 배경 영역에 대해서는 기존의 배경 차분 방법을 이용하여 전경을 추출하고, 동적인 배경 영역에 대해서는 깊이 정보를 이용하여 전경을 추출하는 하이브리드 방식을 사용한다. 정적인 배경에 동적인 영상을 프로젝터로 투영하는 환경에서 제안된 방법의 효율성을 검증하였다.

  • PDF

그래프 기반 영역 분할 방법을 이용한 매체 전달량 계산과 가시성 복원 (Estimation of the Medium Transmission Using Graph-based Image Segmentation and Visibility Restoration)

  • 김상균;박종현;박순영
    • 전자공학회논문지
    • /
    • 제50권4호
    • /
    • pp.163-170
    • /
    • 2013
  • 일반적으로 외부에서 획득되는 영상은 대기 중에 존재하는 먼지, 물방울, 연무, 안개, 연기 등에 의해 화질이 감쇠되고 결과적으로 대비도 감소와 색상의 왜곡 현상이 발생한다. 그리나 안개와 배경 사이에 내재된 모호성 때문에 배경으로부터 안개를 제거하는 작업은 결코 간단한 문제가 아니다. 본 논문에서는 단일 영상에서 비용함수로서 에지의 기울기를 이용한 그래프 기반 영역 분할 방법을 이용하여 안개 제거를 위한 새로운 방법을 제안한다. 우리는 장면을 깊이 관련 정보에 따라 여러 영역으로 분리하고 전역적인 안개값을 추정한다. 매체의 전달량은 그래프 기반 영역 분할 알고리즘의 임계 함수에 의해서 직접적으로 계산된다. 매체 전달량과 안개값이 계산되면 안개 모델식에 의해서 쉽게 안개가 제거된 영상을 복원할 수 있다. 그리고 안개 영상과 복원된 영상간의 에지의 기울기 비율을 계산함으로써 기존의 연구 방법과 제안된 연구 방법의 가시성 복원 정도를 비교 평가하였다. 다양한 안개 영상에 대한 실험 결과 제안된 방법의 우수한 안개 제거 및 화질 복원 능력이 입증되었다.

무인 자동차의 주변 환경 인식을 위한 도시 환경에서의 그래프 기반 물체 분할 방법 (Graph-based Segmentation for Scene Understanding of an Autonomous Vehicle in Urban Environments)

  • 서보길;최윤근;노현철;정명진
    • 로봇학회논문지
    • /
    • 제9권1호
    • /
    • pp.1-10
    • /
    • 2014
  • In recent years, the research of 3D mapping technique in urban environments obtained by mobile robots equipped with multiple sensors for recognizing the robot's surroundings is being studied actively. However, the map generated by simple integration of multiple sensors data only gives spatial information to robots. To get a semantic knowledge to help an autonomous mobile robot from the map, the robot has to convert low-level map representations to higher-level ones containing semantic knowledge of a scene. Given a 3D point cloud of an urban scene, this research proposes a method to recognize the objects effectively using 3D graph model for autonomous mobile robots. The proposed method is decomposed into three steps: sequential range data acquisition, normal vector estimation and incremental graph-based segmentation. This method guarantees the both real-time performance and accuracy of recognizing the objects in real urban environments. Also, it can provide plentiful data for classifying the objects. To evaluate a performance of proposed method, computation time and recognition rate of objects are analyzed. Experimental results show that the proposed method has efficiently in understanding the semantic knowledge of an urban environment.