• 제목/요약/키워드: segmentation approaches

검색결과 139건 처리시간 0.023초

시공간 영상분할을 이용한 이동 및 이동 중 정지물체 검출 (Detection of Objects Temporally Stop Moving with Spatio-Temporal Segmentation)

  • 김도형;김경환
    • 한국통신학회논문지
    • /
    • 제40권1호
    • /
    • pp.142-151
    • /
    • 2015
  • 본 논문에서는 이동 카메라 환경에서 이동 및 이동 중 정지물체를 검출하기 위한 방법을 제안한다. 이동 중에 일시적으로 정지한 물체는 검출 결과의 응용관점에서 볼 때 이동물체의 검출만큼이나 중요한데, 기존의 이동물체 검출 방법들은 이들을 배경과 구분하지 못하는 한계를 갖는다. 이러한 문제를 해결하기 위해 제안하는 방법에서는 이동 가능성 큐, 위치 가능성 큐, 그리고 색 분포 유사성 큐를 정의하여 이동물체 검출 및 지속적인 추적에 이용한다. 그래프 컷 알고리즘은 세 개의 큐를 결합하여 시공간 영상분할을 수행함으로써 이동 및 이동 중 정지물체를 검출한다. 제안하는 방법은 이동물체 뿐 아니라 이동 중 정지물체에 대해서도 검출이 가능함을 실험을 통해 증명하였다.

Separation of Text and Non-text in Document Layout Analysis using a Recursive Filter

  • Tran, Tuan-Anh;Na, In-Seop;Kim, Soo-Hyung
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제9권10호
    • /
    • pp.4072-4091
    • /
    • 2015
  • A separation of text and non-text elements plays an important role in document layout analysis. A number of approaches have been proposed but the quality of separation result is still limited due to the complex of the document layout. In this paper, we present an efficient method for the classification of text and non-text components in document image. It is the combination of whitespace analysis with multi-layer homogeneous regions which called recursive filter. Firstly, the input binary document is analyzed by connected components analysis and whitespace extraction. Secondly, a heuristic filter is applied to identify non-text components. After that, using statistical method, we implement the recursive filter on multi-layer homogeneous regions to identify all text and non-text elements of the binary image. Finally, all regions will be reshaped and remove noise to get the text document and non-text document. Experimental results on the ICDAR2009 page segmentation competition dataset and other datasets prove the effectiveness and superiority of proposed method.

딥러닝 기반 레이더 간섭 위상 언래핑 기술 고찰 (A Review on Deep-learning-based Phase Unwrapping Technique for Synthetic Aperture Radar Interferometry)

  • 백원경;정형섭
    • 대한원격탐사학회지
    • /
    • 제38권6_2호
    • /
    • pp.1589-1605
    • /
    • 2022
  • 위상 언래핑은 위성레이더 간섭기법의 필수적인 자료처리 절차다. 이에 따라 비 딥러닝 기반 언래핑 기법이 다수 개발되었으며 최근에는 딥러닝 기반 언래핑 기법이 제안되고 있다. 본 논문에서는 딥러닝 기반 위성레이더 언래핑 기법을 1) 언래핑된 위상의 예측 방법, 2) 위상 언래핑을 위한 딥러닝 모델의 구조 그리고 3) 학습데이터 제작 방법의 측면에서 최근 연구 동향을 소개하였다. 언래핑된 위상을 예측하는 방법은 모호 정수 분류방법, 위상 단절 구간 탐지 방법, 위상 예측 방법, 딥러닝과 전통적인 언래핑 기법의 연계 방법에 따라 다시 세분화하여 연구 동향을 나타냈다. 일반적으로 활용되는 딥러닝 모델 구조의 특징과 전체 위상 정보를 파악하기 위한 모델 최적화 방법에 대한 연구 사례를 소개하였다. 또한 학습데이터 제작 방법은 주로 위상 변이 제작과 노이즈 시뮬레이션 방법으로 구분하여 연구 동향을 정리하였으며 추후 발전 방향을 제시하였다. 본 논문이 추후 국내의 딥러닝 기반 위상 언래핑 연구의 발전 방향을 모색하는 데에 필요한 기반 자료로 활용되기를 기대한다.

칼라 양자화 맵의 영역 히스토그램에 기반한 조명 적응적 피부색 영역 분할 (Adaptive Skin Segmentation based on Region Histogram of Color Quantization Map)

  • 조성식;배정태;이성환
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권1호
    • /
    • pp.54-61
    • /
    • 2009
  • 피부색 정보는 비전 기반 시스템에서 인체 인식에 널리 쓰이는 중요한 정보이다. 그러나 기존의 픽셀 단위의 피부색 분할 방법은 피부색 영역 내부와 외부에 발생하는 오분할로 인해 여러 가지 피부색 관련 시스템의 인식률을 저해시키는 요인이 된다. 본 논문에서는 양자화 영역 정보로부터 프레임 간에 근접한 유사 피부색의 영역별 분할을 통한 피부색 분할 방법을 제안한다. 제안하는 방법은 피부색 영역분할을 위해 JSEG 알고리즘을 통해 영상의 칼라를 양자화하여 영역을 분할한다. 분할된 영역으로부터 근접한 유사 피부 영역의 후보를 결정하고, 각 영역의 히스토그램 비교를 통해 피부색 영역을 결정한다. 이렇게 결정된 영역으로부터 피부색 표본을 추출하여 다음 프레임을 위한 피부색 모델을 갱신한다. 성능 평가를 위해 ECHO 데이타베이스와 조명이 변화하는 환경에서 실제 촬영한 영상을 이용하여 기존 연구의 분류 방법 비교 실험을 실시하였고, 기존보다 향상된 영역 분할 및 조명 적응 성능을 보였다.

Building an Annotated English-Vietnamese Parallel Corpus for Training Vietnamese-related NLPs

  • Dien Dinh;Kiem Hoang
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2004년도 ICEIC The International Conference on Electronics Informations and Communications
    • /
    • pp.103-109
    • /
    • 2004
  • In NLP (Natural Language Processing) tasks, the highest difficulty which computers had to face with, is the built-in ambiguity of Natural Languages. To disambiguate it, formerly, they based on human-devised rules. Building such a complete rule-set is time-consuming and labor-intensive task whilst it doesn't cover all the cases. Besides, when the scale of system increases, it is very difficult to control that rule-set. So, recently, many NLP tasks have changed from rule-based approaches into corpus-based approaches with large annotated corpora. Corpus-based NLP tasks for such popular languages as English, French, etc. have been well studied with satisfactory achievements. In contrast, corpus-based NLP tasks for Vietnamese are at a deadlock due to absence of annotated training data. Furthermore, hand-annotation of even reasonably well-determined features such as part-of-speech (POS) tags has proved to be labor intensive and costly. In this paper, we present our building an annotated English-Vietnamese parallel aligned corpus named EVC to train for Vietnamese-related NLP tasks such as Word Segmentation, POS-tagger, Word Order transfer, Word Sense Disambiguation, English-to-Vietnamese Machine Translation, etc.

  • PDF

Volume-sharing Multi-aperture Imaging (VMAI): A Potential Approach for Volume Reduction for Space-borne Imagers

  • Jun Ho Lee;Seok Gi Han;Do Hee Kim;Seokyoung Ju;Tae Kyung Lee;Chang Hoon Song;Myoungjoo Kang;Seonghui Kim;Seohyun Seong
    • Current Optics and Photonics
    • /
    • 제7권5호
    • /
    • pp.545-556
    • /
    • 2023
  • This paper introduces volume-sharing multi-aperture imaging (VMAI), a potential approach proposed for volume reduction in space-borne imagers, with the aim of achieving high-resolution ground spatial imagery using deep learning methods, with reduced volume compared to conventional approaches. As an intermediate step in the VMAI payload development, we present a phase-1 design targeting a 1-meter ground sampling distance (GSD) at 500 km altitude. Although its optical imaging capability does not surpass conventional approaches, it remains attractive for specific applications on small satellite platforms, particularly surveillance missions. The design integrates one wide-field and three narrow-field cameras with volume sharing and no optical interference. Capturing independent images from the four cameras, the payload emulates a large circular aperture to address diffraction and synthesizes high-resolution images using deep learning. Computational simulations validated the VMAI approach, while addressing challenges like lower signal-to-noise (SNR) values resulting from aperture segmentation. Future work will focus on further reducing the volume and refining SNR management.

미국공병대(美國工兵隊) 관할 호수에 수반되는 여행비용의 분산 감소를 위한 시장분할법 (Visitor Segmentation as a Means of Reducing Variance in spending profiles Corps of Engineers Lakes)

  • 이주희
    • 한국산림과학회지
    • /
    • 제81권3호
    • /
    • pp.203-213
    • /
    • 1992
  • 본 연구(硏究)의 목적(目的)은 휴양객(休養客)들을 소비(消費)패턴과 여행(旅行)특성을 기준으로 유사한 소그룹으로 분할(分割)하는 데 있다. 이를 위한 자료는 미(美) 연방정부기관(聯邦政府機關)인 미공병대(美工兵隊)가 관장(管掌)하는 12곳의 휴양지(休養地) 방문객(客)들을 대상으로 조사를 실시함으로서 미국 전역(全域)에 있는 미공병대(美工兵隊) 관할호수(管轄湖水)를 방문한 휴양객들의 일반적인 소비행동(消費行動)을 유추(類推)하는 연구(硏究) 프로젝트의 일환으로 수집(蒐集)되었다. 휴양객들의 분할(分割)은 그들의 여행비용 분산(分散)을 줄임과 동시에 휴양객의 소비(消費)에 근거한 휴양지역의 경제적(經濟的) 효과(效果)를 산정(算定)하는 데 사용되는 최종수요(最終需要) 벡터를 분할(分割)하는데 도움이 된다. 본 연구에서는 휴양객들의 분할(分割)을 위해 A - priori 분석방법과 군집분석방법을 비교 사용하였다. A - priori 분석방법으로는 12개의 소(小)그룹 중(中) 타(他)지역에서 온 휴양객(休養客) 6개 그룹이 군집분석방법으로는 3개의 소그룹이 책정(策定)되었다. 3개의 소그룹을 "일일(一日) 이용객(利用客)", "숙박(宿泊) 보트 이용객(利用客)", "숙박(宿泊) 야영(野營) 이용객(利用客)"으로 분류한 결과 A-priori 분석방법보다는 보트 사용비용을 제외하고는 휴양객의 모든 비용항목(費用項目)에서 평균평방(平均平方)(Mean Spuare)이 작다는 것을 확인할 수 있었다. 연구결과를 토대로 하여 휴양객의 경제효과(經濟效果) 측정(測定)에 대한 적용(適用) 및 고려사항(考慮事項)들이 언급되었다.

  • PDF

약한 레이블을 이용한 확장 합성곱 신경망과 게이트 선형 유닛 기반 음향 이벤트 검출 및 태깅 알고리즘 (Dilated convolution and gated linear unit based sound event detection and tagging algorithm using weak label)

  • 박충호;김동현;고한석
    • 한국음향학회지
    • /
    • 제39권5호
    • /
    • pp.414-423
    • /
    • 2020
  • 본 논문은 약한 레이블 기반 음향 이벤트 검출을 위한 시간-주파수 영역분할 맵 추출 모델에서 발생하는 희소성 및 수용영역 부족에 관한 문제를 완화 시키기 위해, 확장 게이트 선형 유닛(Dilated Convolution Gated Linear Unit, DCGLU)을 제안한다. 딥러닝 분야에서 음향 이벤트 검출을 위한 영역분할 맵 추출 기반 방법은 잡음 환경에서 좋은 성능을 보여준다. 하지만, 이 방법은 영역분할 맵을 추출하기 위해 특징 맵의 크기를 유지해야 하므로 풀링 연산 없이 모델을 구성하게 된다. 이로 인해 이 방법은 희소성과 수용영역의 부족으로 성능 저하를 보이게 된다. 이런 문제를 완화하기 위해, 본 논문에서는 정보의 흐름을 제어할 수 있는 게이트 선형 유닛과 추가의 파라미터 없이 수용영역을 넓혀 줄 수 있는 확장 합성곱 신경망을 적용하였다. 실험을 위해 사용된 데이터는 URBAN-SED와 자체 제작한 조류 울음소리 데이터이며, 제안하는 DCGLU 모델이 기존 베이스라인 논문들보다 더 좋을 성능을 보였다. 특히, DCGLU 모델이 자연 소리가 섞인 환경인 세 개의 Signal to Noise Ratio(SNR)(20 dB, 10 dB, 0 dB)에서 강인하다는 것을 확인하였다.

터널 막장 3차원 지형모델 상에서의 불연속면 자동 매핑을 위한 딥러닝 기법 적용 방안 (Deep Learning Approach for Automatic Discontinuity Mapping on 3D Model of Tunnel Face)

  • 추엔 팜;신휴성
    • 터널과지하공간
    • /
    • 제33권6호
    • /
    • pp.508-518
    • /
    • 2023
  • 이 논문은 LiDAR 스캔 또는 사진측량 기술에 의해 재구성된 3D 디지털 모델을 기반으로 터널 벽면의 불연속면을 자동으로 매핑하는 새로운 접근 방식을 제안한다. 본 제안에서는 U-Net이라 불리는 딥러닝 시맨틱 영역분할 모델을 사용하며, 터널 막장면의 3D 지형 모델에서 불연속면 영역을 식별해 낸다. 제안된 딥러닝 모델은 투영된 RGB 이미지, 면의 깊이 이미지 및 국부적인 면의 표면 속성 이미지(즉, 법선 벡터 및 곡률 이미지)를 포함한 다양한 정보를 종합 학습하여 기본 3차원 이미지에서 불연속면 영역을 효과적으로 분할한다. 이후 영역분할 결과는 면의 깊이 맵과 투영 행렬을 사용하여 3D 모델로 다시 투영시키고, 3D 공간 내에서 불연속면의 위치 및 범위를 정확하게 표현한다. 영역분할 모델의 성능은 영역 분할된 결과를 해당 지면 실측 값과 비교함으로써 평가하였으며, IoU(intersection-over-union) 값이 약 0.8 정도로 나타나 영역분할 결과의 높은 정확성을 확인하였다. 여전히 학습데이터가 제한적 이었음에도 불구하고, 제안 기법은 3D 모델의 점군 데이터를 불연속면의 유사군으로 그룹화하기 위해 전 막장면의 법선 벡터와 클러스터링과 같은 비지도 학습기반 알고리즘에만 의존하던 기존 접근 방식의 한계의 극복 가능성을 보여주었다.

효율적인 개방형 어휘 3차원 개체 분할을 위한 클래스-독립적인 3차원 마스크 제안과 2차원-3차원 시각적 특징 앙상블 (Class-Agnostic 3D Mask Proposal and 2D-3D Visual Feature Ensemble for Efficient Open-Vocabulary 3D Instance Segmentation)

  • 송성호;박경민;김인철
    • 정보처리학회 논문지
    • /
    • 제13권7호
    • /
    • pp.335-347
    • /
    • 2024
  • 개방형 어휘 3차원 포인트 클라우드 개체 분할은 3차원 장면 포인트 클라우드를 훈련단계에서 등장하였던 기본 클래스의 개체들뿐만 아니라 새로운 신규 클래스의 개체들로도 분할해야 하는 어려운 시각적 작업이다. 본 논문에서는 중요한 모델 설계 이슈별 기존 모델들의 한계점들을 극복하기 위해, 새로운 개방형 어휘 3차원 개체 분할 모델인 Open3DME를 제안한다. 첫째, 제안 모델은 클래스-독립적인 3차원 마스크의 품질을 향상시키기 위해, 새로운 트랜스포머 기반 3차원 포인트 클라우드 개체 분할 모델인 T3DIS[6]를 마스크 제안 모듈로 채용한다. 둘째, 제안 모델은 각 포인트 세그먼트별로 텍스트와 의미적으로 정렬된 시각적 특징을 얻기 위해, 사전 학습된 OpenScene 인코더와 CLIP 인코더를 적용하여 포인트 클라우드와 멀티-뷰 RGB 영상들로부터 각각 3차원 및 2차원 특징들을 추출한다. 마지막으로, 제안 모델은 개방형 어휘 레이블 할당 과정동안 각 포인트 클라우드 세그먼트별로 추출한 2차원 시각적 특징과 3차원 시각적 특징을 상호 보완적으로 함께 이용하기 위해, 특징 앙상블 기법을 적용한다. 본 논문에서는 ScanNet-V2 벤치마크 데이터 집합을 이용한 다양한 정량적, 정성적 실험들을 통해, 제안 모델의 성능 우수성을 입증한다.