• 제목/요약/키워드: Semantic region

검색결과 94건 처리시간 0.03초

Watershed 알고리즘을 사용한 계층적 이동체 추적 알고리즘 (A Hierarchical Semantic Video Object Tracking Algorithm Using Watershed Algorithm)

  • 이재연;박현상;나종범
    • 한국통신학회논문지
    • /
    • 제24권10B호
    • /
    • pp.1986-1994
    • /
    • 1999
  • 본 논문에서는, 동영상에서 의미 있는 객체 영역을 추출하기 위해서, 첫 장의 영상 분할은 사람에 의해서 주어진 것으로 가정하고, 그 다음 프레임부터는 사람의 도움 없이 객체를 추적해 가는 반자동 방식의 이동체 추적 알고리즘을 제안한다. 제안하는 알고리즘은 계층적인 구조를 가지며, 각각의 계층에서는 seed 추출, watershed 알고리즘을 이용한 영상 분할, 영역 구분의 단계를 거쳐 영상 분할을 수행한다. 영역 구분 단계에서는, 순방향으로 추정된 움직임 벡터장으로부터 영역 분할의 판단 기준을 만들고 이를 이용하여 각각의 영역을 '객체 영역', '배경 영역', '불확실 영역'으로 구분한다. 이때, '불확실 영역'으로 구분된 영역들에 대해서는 좀 더 낮은 계층에서 위의 단계들을 반복하여 다시 수행하게 한다. 제안한 알고리즘은 컴퓨터 모의실험을 통해서 'Claire', 'Miss America', 'Akiyo', 'Mother and daughter'의 영상에서 바람직한 추적 결과를 나타냄을 확인하였다.

  • PDF

A hierarchical semantic segmentation framework for computer vision-based bridge damage detection

  • Jingxiao Liu;Yujie Wei ;Bingqing Chen;Hae Young Noh
    • Smart Structures and Systems
    • /
    • 제31권4호
    • /
    • pp.325-334
    • /
    • 2023
  • Computer vision-based damage detection enables non-contact, efficient and low-cost bridge health monitoring, which reduces the need for labor-intensive manual inspection or that for a large number of on-site sensing instruments. By leveraging recent semantic segmentation approaches, we can detect regions of critical structural components and identify damages at pixel level on images. However, existing methods perform poorly when detecting small and thin damages (e.g., cracks); the problem is exacerbated by imbalanced samples. To this end, we incorporate domain knowledge to introduce a hierarchical semantic segmentation framework that imposes a hierarchical semantic relationship between component categories and damage types. For instance, certain types of concrete cracks are only present on bridge columns, and therefore the noncolumn region may be masked out when detecting such damages. In this way, the damage detection model focuses on extracting features from relevant structural components and avoid those from irrelevant regions. We also utilize multi-scale augmentation to preserve contextual information of each image, without losing the ability to handle small and/or thin damages. In addition, our framework employs an importance sampling, where images with rare components are sampled more often, to address sample imbalance. We evaluated our framework on a public synthetic dataset that consists of 2,000 railway bridges. Our framework achieves a 0.836 mean intersection over union (IoU) for structural component segmentation and a 0.483 mean IoU for damage segmentation. Our results have in total 5% and 18% improvements for the structural component segmentation and damage segmentation tasks, respectively, compared to the best-performing baseline model.

A Hybrid Semantic-Geometric Approach for Clutter-Resistant Floorplan Generation from Building Point Clouds

  • Kim, Seongyong;Yajima, Yosuke;Park, Jisoo;Chen, Jingdao;Cho, Yong K.
    • 국제학술발표논문집
    • /
    • The 9th International Conference on Construction Engineering and Project Management
    • /
    • pp.792-799
    • /
    • 2022
  • Building Information Modeling (BIM) technology is a key component of modern construction engineering and project management workflows. As-is BIM models that represent the spatial reality of a project site can offer crucial information to stakeholders for construction progress monitoring, error checking, and building maintenance purposes. Geometric methods for automatically converting raw scan data into BIM models (Scan-to-BIM) often fail to make use of higher-level semantic information in the data. Whereas, semantic segmentation methods only output labels at the point level without creating object level models that is necessary for BIM. To address these issues, this research proposes a hybrid semantic-geometric approach for clutter-resistant floorplan generation from laser-scanned building point clouds. The input point clouds are first pre-processed by normalizing the coordinate system and removing outliers. Then, a semantic segmentation network based on PointNet++ is used to label each point as ceiling, floor, wall, door, stair, and clutter. The clutter points are removed whereas the wall, door, and stair points are used for 2D floorplan generation. A region-growing segmentation algorithm paired with geometric reasoning rules is applied to group the points together into individual building elements. Finally, a 2-fold Random Sample Consensus (RANSAC) algorithm is applied to parameterize the building elements into 2D lines which are used to create the output floorplan. The proposed method is evaluated using the metrics of precision, recall, Intersection-over-Union (IOU), Betti error, and warping error.

  • PDF

Deep learning approach to generate 3D civil infrastructure models using drone images

  • Kwon, Ji-Hye;Khudoyarov, Shekhroz;Kim, Namgyu;Heo, Jun-Haeng
    • Smart Structures and Systems
    • /
    • 제30권5호
    • /
    • pp.501-511
    • /
    • 2022
  • Three-dimensional (3D) models have become crucial for improving civil infrastructure analysis, and they can be used for various purposes such as damage detection, risk estimation, resolving potential safety issues, alarm detection, and structural health monitoring. 3D point cloud data is used not only to make visual models but also to analyze the states of structures and to monitor them using semantic data. This study proposes automating the generation of high-quality 3D point cloud data and removing noise using deep learning algorithms. In this study, large-format aerial images of civilian infrastructure, such as cut slopes and dams, which were captured by drones, were used to develop a workflow for automatically generating a 3D point cloud model. Through image cropping, downscaling/upscaling, semantic segmentation, generation of segmentation masks, and implementation of region extraction algorithms, the generation of the point cloud was automated. Compared with the method wherein the point cloud model is generated from raw images, our method could effectively improve the quality of the model, remove noise, and reduce the processing time. The results showed that the size of the 3D point cloud model created using the proposed method was significantly reduced; the number of points was reduced by 20-50%, and distant points were recognized as noise. This method can be applied to the automatic generation of high-quality 3D point cloud models of civil infrastructures using aerial imagery.

A Method for Text Information Separation from Floorplan Using SIFT Descriptor

  • Shin, Yong-Hee;Kim, Jung Ok;Yu, Kiyun
    • 대한원격탐사학회지
    • /
    • 제34권4호
    • /
    • pp.693-702
    • /
    • 2018
  • With the development of data analysis methods and data processing capabilities, semantic analysis of floorplans has been actively studied. Therefore, studies for extracting text information from drawings have been conducted for semantic analysis. However, existing research that separates rasterized text from floorplan has the problem of loss of text information, because when graphic and text components overlap, text information cannot be extracted. To solve this problem, this study defines the morphological characteristics of the text in the floorplan, and classifies the class of the corresponding region by applying the class of the SIFT key points through the SVM models. The algorithm developed in this study separated text components with a recall of 94.3% in five sample drawings.

그림의 부호화 과정과 신경기제 : fMRI 연구 (Neural Substrates of Picture Encoding: An fMRI Study)

  • 강은주;김희정;김성일;나동규;이경민;나덕렬;이정모
    • 인지과학
    • /
    • 제13권1호
    • /
    • pp.23-40
    • /
    • 2002
  • 본 연구는 fMRI를 이용하여 정상인에 있어서 자극 유형, 특히 그림 자극의 부호화와 관련된 두뇌영역을 확인하고자 하였다. Scan 1에서는 그림 자극의 부호화 과정에 관여하는 두뇌 영역을 화인하기 위하여 어의범주 판단 과정 중에 그림과 단어에 대하여 비교 관찰하였으며 Scan 2에서는 그림자극에 대하여 그림 명명과제와 어의범주 판단과제를 비교하여 과제 유형에 따른 그림의 부호화에 관여하는 두뇌 활성화 영역을 연구하였다. 피험자는 어의범주(인공물/자연물)에 따라 마우스를 눌러 반응하거나(Scan 1) 그림명명이나 범주 소속 여부를 속으로 말하도록(subvocal response)(Scan 2) 요구되었다. 자극의 유형과 무관하게 부호화 중에 좌측 전전두 영역 양측의 두정엽, 그리고 양측의 고차시각 피질 등이 공통적으로 활성화 되었다. 그림보다 단어의 부호화에는 좌측 하 전전두엽, 우측 전측 전전두 영역, 양측의 도(insula), 좌측 두정-측두엽 등 광범위한 언어/개념관련 두뇌 영역에서 더 높은 활성화가 발견되는 반면, 그림의 부호화에는 양측의 고차 시각 영역과 해마방화(parahippocampal gyrus) 영역에서 더 높은 활성화가 관찰되었다. 이는 동일한 어의판단 과제를 수행하는 과정에도 단어는 어의적/언어적 처리가 그림은 지각적 정보처리 및 novelty 관련 정보처리가 서로 다른 해부학적인 영역에 의하여 매개됨을 의미한다. 그림 명명과제나 어의범주 판단과제 모두를 속으로 말하는 수행(Scan 2)은 배측 하 전전두 영역, 즉 Broca영역의 활동 증가를 야기시켰으며, 특히 명명과제 수행에는 어의범주 판단과제를 수행할 때에 비하여 양측의 시각영역에서 더 많은 활성화가 발견되었는데, 이는 대상의 명칭을 인출하는 과정에 고차 시각정보 처리가 더 많이 관여하였을 가능성을 시사한다.

  • PDF

위치 기반 서비스에서 비연결 연산을 위한 Layer와 Region을 고려한 의미론적 캐싱 기법 (Semantic Caching Method that consider Layer and Region for Disconnected Operation in Location Based Service)

  • 이상철;이충호;김재홍;배해영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.301-303
    • /
    • 2001
  • 현재 무선단말기 보급의 확대와 시간과 공간의 제약을 뛰어넘는 장점으로 무선 인터넷 환경이 급속도로 발전하고 있다. 그러나, 본 논문의 연구 분야인 모바일 지리정보 시스템(Mobile Geographic Information System)에서 무선인터넷을 통하여 실시간 지리 정보를 얻기 위해 사용자의 무선단말기와 서버 사이에 빈번한 데이터 송수신이 이뤄져야 하며 데이터의 빠른 변화를 수용해야 한다. 그러나, 아직 현저히 낮은 대역폭을 가진 채널을 통해 통신하며, 비싼 이용 요금과 오류로 인한 자발적 또는 비자발적 연결 끊김 현상 등은 서비스 제공에 한계를 가진다. 그러므로 본 논문에서는 이동 컴퓨팅 환경의 연구를 통해 연결 끊김 현상에서도 클라이언트의 지속적인 서비스 운영을 위한 비연결 연산으로 의미론적 캐시 기법과 캐시 교체 전략에 대해 알아보며, 본 논문에서는 Layer와 Region을 고려한 의미론적 캐싱 기법을 제안하여 무선 환경에서 동적인 지도서비스를 위한 기법을 제시하였다. 이 연구를 통해 아직 많은 한계를 지닌 무선인터넷 환경에서 지리정보뿐 아니라 위치기반의 다양한 서비스 분야에 응용될 수 있으리라 기대된다.

  • PDF

스트록 필터를 이용한 문자영역 이진화에 관한 연구 (A Study on Automatic Binarization of Text Region Using a Stroke Filter)

  • 정철곤;김중규
    • 한국통신학회논문지
    • /
    • 제33권2C호
    • /
    • pp.178-183
    • /
    • 2008
  • 비디오 문자는 중요한 내용정보를 담고 있기 때문에 비디오의 내용 해석에 있어서 매우 중요한 정보이다. 본 논문에서는 스트록 필터를 이용해 자동으로 문자영역을 이진화하는 방법을 제안하였다. 제안된 문자 이진화 방법은 스트록 필터에 의한 문자컬러극성 결정단계, 스트록 필터의 응답치에 대한 이진화 단계, 그리고 국소 영역 확장 단계로 구성되어 있다. 본 방법은 스트록 필터의 응답치를 이용해 문자의 컬러 극성을 결정함으로 인해 극성 결정 성능이 뛰어나다. 또한 문자의 획 특성을 고려해 문자영역을 이진화하기 때문에 배경영역의 변화에 대하여 강인한 이진화 성능을 나타낸다. 다양한 비디오 영상에 대하여 실험한 결과, 이진화 성능이 우수함을 확인할 수 있었다.

Automatic Superimposed Text Localization from Video Using Temporal Information

  • 정철곤;김중규
    • 한국통신학회논문지
    • /
    • 제32권9C호
    • /
    • pp.834-839
    • /
    • 2007
  • The superimposed text in video brings important semantic clues into content analysis. In this paper, we present the new and fast superimposed text localization method in video segments. We detect the superimposed text by using temporal information contained in the video. To detect the superimposed text fast, we have minimized the candidate region of localizing superimposed texts by using the difference between consecutive frames. Experimental results are presented to demonstrate the good performance of the new superimposed text localization algorithm.

뇌조직 CT 영상의 자동영상분할 (Automatic Image Segmention of Brain CT Image)

  • 유선국;김남현
    • 대한의용생체공학회:의공학회지
    • /
    • 제10권3호
    • /
    • pp.317-322
    • /
    • 1989
  • In this paper, brain CT images are automatically segmented to reconstruct the 3-D scene from consecutive CT sections. Contextual segmentation technique was applied to overcome the partial volume artifact and statistical fluctuation phenomenon of soft tissue images. Images are hierarchically analyzed by region growing and graph editing techniques. Segmented regions are discriptively decided to the final organs by using the semantic informations.

  • PDF