• 제목/요약/키워드: bounding box

검색결과 156건 처리시간 0.031초

YOLACT를 이용한 스티칭 속도 개선 방안 (Stitching speed improvement method using YOLACT)

  • 고성영;이성배;박성환;김규헌
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.10-13
    • /
    • 2020
  • 최근 초고화질 영상, 가상현실 등 프리미엄 콘텐츠에 대한 요구가 커지면서 360° VR과 8K TV 등의 시장이 확대되고 있다. 360° VR 영상을 만드는 데에 스티칭 기술이 사용되고 있고, 8K 영상을 촬영할 수 있는 장비는 매우 제한적이기 때문에 스티칭 기술을 통해 콘텐츠를 확보하려는 노력이 이어지고 있다. 스티칭 기술은 여러 영상을 합성하여 기존 카메라의 좁은 시야각 문제를 해결하고 보다 넓은 시야각의 영상을 만드는 기술이다. 최근에는 해당 분야에 관한 연구가 진행됨에 따라 이미지를 넘어 동영상 스티칭에 대한 연구가 주로 진행되고 있다, 기존 동영상 스티칭 방식은 이미지 스티칭 방식을 프레임마다 반복하기 때문에 시간이 오래 걸린다는 단점이 있다. 컴퓨터 비전 분야에서는 딥러닝을 활용하여 객체가 존재할 것으로 예측되는 부분에 사각형 모양의 경계 상자(Bounding box)를 생성하는 객체 탐지(Object detection) 분야에 관한 많은 연구가 이루어져 왔고 이를 기반으로 객체의 경계선을 검출하여 해당 영역만을 구분하는 객체 분할(Instance segmentation)에 대한 연구 또한 진행 중이다. 본 논문에서는 앞서 말한 스티칭 속도 문제를 해결하기 위하여 빠른 속도로 객체 분할이 가능한 YOLACT를 이용하여 스티칭 속도를 개선하는 방안을 제안한다.

  • PDF

조호환경 내 환자 탐지를 위한 YOLO 모델 기반 바운딩 박스 앙상블 기법 (YOLO models based Bounding-Box Ensemble Method for Patient Detection In Homecare Place Images)

  • 박준휘;김범준;김인기;곽정환
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.562-564
    • /
    • 2022
  • 조호환경이란 환자의 지속적인 추적 및 관찰이 필요한 환경으로써, 병원 입원실, 요양원 등을 의미한다. 조호환경 내 환자의 이상 증세가 발생하는 시간 및 이상 증세의 종류는 예측할 수 없기에 인력을 통한 상시 관리는 필수적이다. 또한, 환자의 이상 증세 발견 시간은 발병 시점부터의 소요 시간이 생사와 즉결되기에 빠른 발견이 매우 중요하다. 하지만, 인력을 통한 상시 관리는 많은 경제적 비용을 수반하기에 독거 노인, 빈민층 등 요양 비용을 충당하지 못하는 환자들이 수혜받는 것은 어려우며, 인력을 통해 이루어지기 때문에 이상 증세 발병 즉시 발견에 한계를 가진다. 즉, 기존까지 조호환경 내 환자 관리 방식은 경제적 비용과 이상 증세 발병 즉시 발견에 한계를 가진다는 문제점을 가진다. 따라서 본 논문은 YOLO 모델의 조호환경 내 환자 탐지 성능 비교 및 바운딩 박스 앙상블 기법을 제안한다. 이를 통해, 딥러닝 모델을 통한 환자 상시 관리가 이루어지기에 높은 경제적 비용문제를 해소할 수 있다. 또한, YOLO 모델 바운딩 박스 앙상블 기법 WBF를 통해 폐색이 짙은 조호환경 영상 데이터 내에 객체 탐지 영역 정확도 향상 방법을 연구하였다.

mask R-CNN 기반의 철도선로 객체검출 및 분류에 관한 연구 (Research on railroad track object detection and classification based on mask R-CNN)

  • 이승신;최종원;오염덕
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2024년도 제69차 동계학술대회논문집 32권1호
    • /
    • pp.81-83
    • /
    • 2024
  • 본 논문에서는 mask R-CNN의 이미지 세그먼테이션(Image Segmentation) 기법을 이용하여 철도의 선로를 식별하고 분류하는 방법을 제안한다. mask R-CNN의 이미지 세그먼테이션은 바운딩 박스(Bounding Box)를 통해 이미지에서 객체를 식별하는 R-CNN 알고리즘과는 달리 픽셀 단위로 관심 있는 객체를 검출하고 분류하는 기법으로서 오브젝트 디텍션(Object Detection)보다 더욱 정교한 객체 식별이 가능하다. 본 연구에서는 Pascal VOC 형태의 고속철도 데이터 24,205셋의 데이터를 전처리하고 MS COCO 데이터셋으로 변환하여, MMDetection의 mask R-CNN을 통해 픽셀 단위로 철도선로를 식별하고 정상/불량 상태를 분류하는 연구를 수행하였다. 선행연구에서는 YOLO를 활용하여 Polygon형태의 좌표를 바운딩 박스로 분류하였는데, 본 연구에서는 mask R-CNN을 활용함으로써 철도 선로를 더욱 정교하게 식별하였으며 정상/불량의 상태 분류는 YOLO와 유사한 성능을 보였다.

  • PDF

Aircraft Motion Identification Using Sub-Aperture SAR Image Analysis and Deep Learning

  • Doyoung Lee;Duk-jin Kim;Hwisong Kim;Juyoung Song;Junwoo Kim
    • 대한원격탐사학회지
    • /
    • 제40권2호
    • /
    • pp.167-177
    • /
    • 2024
  • With advancements in satellite technology, interest in target detection and identification is increasing quantitatively and qualitatively. Synthetic Aperture Radar(SAR) images, which can be acquired regardless of weather conditions, have been applied to various areas combined with machine learning based detection algorithms. However, conventional studies primarily focused on the detection of stationary targets. In this study, we proposed a method to identify moving targets using an algorithm that integrates sub-aperture SAR images and cosine similarity calculations. Utilizing a transformer-based deep learning target detection model, we extracted the bounding box of each target, designated the area as a region of interest (ROI), estimated the similarity between sub-aperture SAR images, and determined movement based on a predefined similarity threshold. Through the proposed algorithm, the quantitative evaluation of target identification capability enhanced its accuracy compared to when training with the targets with two different classes. It signified the effectiveness of our approach in maintaining accuracy while reliably discerning whether a target is in motion.

시추 작업장의 이동식 시추 장비 충돌 방지 시스템을 위한 프레임워크 개발 (Development of a Framework for Anti-Collision System of Moving Drilling Machines on a Drill Floor)

  • 이재용
    • 한국산학기술학회논문지
    • /
    • 제21권4호
    • /
    • pp.330-336
    • /
    • 2020
  • 다수의 대형 이동식 장비들이 운용되는 시추 작업장에는 장비 상호 간의 충돌을 방지하는 시스템이 필요하다. 장비들이 보내는 신호를 수신하여 상대적인 위치를 비교함으로써 충돌 가능성을 검사하고 필요할 때는 정지하도록 하여 사고를 방지하기 위함이다. 복수의 장비 사이에 일어나는 충돌을 검사하기 위해 장비의 형태를 단순화한 경계상자가 사용된다. 경계 상자들이 겹치는 공간을 점검하여 충돌을 파악하는 방식이다. 하지만, 시추 관련 핵심 장비 뿐 아니라, 충돌방지시스템도 소프트웨어를 수입하여 설치만 하였고, 이에 따라 기본 기술은 확보하지 못한 상태이다. 본 논문에서는 시추 작업에 사용되는 장비의 확장성과 연산속도를 고려한 충돌방지시스템의 프레임워크를 구성하여 장비와 충돌방지시스템 개발의 기반을 마련하였다. 각각의 시추 장비는 해당 소프트웨어에서 특정한 메시지 형식을 가진 오브젝트로 표현되고, 추가되는 장비나 데이터 형식에 유연하게 대처할 수 있도록 데이터를 직렬화/역직렬화 방식으로 구성하였다. 전체 시스템을 제어하는 네트워크로 부터 장비의 현 상태를 수신한 후 미리 규정된 약속에 따라 분류하고, 충돌을 검사하며, 바이패스 신호 등을 포함하여 움직임과 관련한 명령을 장비로 되돌려 보내는 데이터 처리 프로세스를 구현하였다. 상용가시화 소프트웨어를 사용하여 충돌 검사를 위한 경계 상자들이 장비와 함께 움직이며 충돌 발생 상황을 보이도록 하였다. 여러 대의 장비로 임의의 시추 작업장을 구성하고, 제시된 프레임워크가 정상적으로 작동하는 것을 확인하였다. 네트워크로부터 신호를 수신하여 처리한 후 관련 정보를 재송신 하는 데 걸리는 시간이 5ms 이하를 유지함으로써, 100ms의 장비 제어주기에 지장을 주지 않는 것을 확인하였다.

조직 기반 계층적 non-rigid 정합: Visible Human 컬러 단면 영상과 CT 다리 영상에 적용 (Hierarchical Non-Rigid Registration by Bodily Tissue-based Segmentation : Application to the Visible Human Cross-sectional Color Images and CT Legs Images)

  • 김계현;이호;김동성;강흥식
    • 대한의용생체공학회:의공학회지
    • /
    • 제24권4호
    • /
    • pp.259-266
    • /
    • 2003
  • 해부학적 구조의 변형이 존재하는 두 영상을 정합하기 위하여 연구되는 non-rigid 정합 방법은 환자간의 정합 환자와 표준영상간의 정합, 동일환자에서 변형을 갖는 부위의 정합 등 이용한 진단 및 연구에 사용되어 현재 많은 연구가 진행되고 있는 분야이다. 본 논문에서는 서로 형태와 색상 특성이 다른 Visible Human 컬러 영상파 CT 영상의 다리 부위를 정합하기 위하여 해부 영상에서 두드러진 차이를 보이는 뼈, 근육, 지방 조직을 분할하고 분할된 각 조직의 경계 단위를 계층적인 정합을 하는 조직 기반 성합 방법을 제안하였다. 제안한 조직 기반의 정합은 색상 특성이 두드러지게 변하는 경계 부위를 정확히 정합하므로 기존의 특징점을 이용한 정합 방법에 비하여 강력하고 정확한 결과를 얻음을 실험을 통하여 검증하였다. 또한 계층적인 정합은 분할된 조직의 바운딩 박스(bounding box) 정합. 전역 Rigid 정합과 지역 non-rigid 정합, 정합 보간(interpolation)을 순차적으로 실행하여 효율적인 계산 시간을 제공하였다.

Mean-Shift 알고리즘을 이용한 MPEG2 압축 영역에서의 움직이는 객체 추적 (Tracking of Moving Object in MPEG Compressed Domain Using Mean-Shift Algorithm)

  • 박성모;이준환
    • 한국통신학회논문지
    • /
    • 제29권8C호
    • /
    • pp.1175-1183
    • /
    • 2004
  • 본 논문에서는 MPEG2비디오 스트림에서 복호화 과정 없이 압축비디오에서 직접 얻을 수 있는 정보들을 활용하여 움직이는 객체를 추적하는 방법을 제안한다. 제안된 방법에서는 먼저 MPEG2의 움직임 벡터로부터 근사적으로 움직임 플로(motion flow)를 구성하고, 전역적인 움직임 플로우로부터 일반화된 Hough 변환을 이용 카메라의 기본적인 움직임인 팬(pan), 틸트(tilt), 줌(zoom)량 등을 계산하였다. 계산된 카메라 움직임은 국부적으로 일어나는 객체의 움직임을 보정하는데 사용하였다. 움직이는 객체의 추적은 사용자가 원하는 객체를 바운딩 박스 형태로 정의함으로 시동된다. 이후의 객체의 추적은 카메라 움직임이 보정된 객체의 움직임 플로우를 이용하여 Mean-Shift 알고리즘을 이용하여 추적하였다. 제안된 방법은 압축된 비디오 스트림에서 직접 정보를 얻음으로써 계산속도의 향상을 기할 수 있으나, 압축된 MPEG2 비디오에서 얻을 수 있는 정보들이 최대 블록 단위이므로 객체의 정의도 블록단위 이상의 객체로 제한된다.

적외선 카메라 영상에서의 마스크 R-CNN기반 발열객체검출 (Object Detection based on Mask R-CNN from Infrared Camera)

  • 송현철;강민식;김태은
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권6호
    • /
    • pp.1213-1218
    • /
    • 2018
  • 최근 비전분야에 소개된 Mask R-CNN은 객체 인스턴스 세분화를위한 개념적으로 간단하고 유연하며 일반적인 프레임 워크를 제시한다. 이 논문에서는 열적외선 카메라로부터 획득한 열감지영상에서 발열체인 인스턴스에 대해 발열부위의 세그멘테이션 마스크를 생성하는 동시에 이미지 내의 오브젝트 발열부분을 효율적으로 탐색하는 알고리즘을 제안한다. Mask R-CNN 기법은 바운딩 박스 인식을 위해 기존 브랜치와 병렬로 객체 마스크를 예측하기 위한 브랜치를 추가함으로써 Faster R-CNN을 확장한 알고리즘이다. Mask R-CNN은 훈련이 간단하고 빠르게 실행하는 고속 R-CNN에 추가된다. 더욱이, Mask R-CNN은 다른 작업으로 일반화하기 용이하다. 본 연구에서는 이 R-CNN기반 적외선 영상 검출알고리즘을 제안하여 RGB영상에서 구별할 수 없는 발열체를 탐지하였다. 실험결과 Mask R-CNN에서 변별하지 못하는 발열객체를 성공적으로 검출하였다.

K개의 점 데이터를 포함하는 최소MBR 탐색 (Finding the Minimum MBRs Embedding K Points)

  • 김건우;김영훈
    • 정보과학회 논문지
    • /
    • 제44권1호
    • /
    • pp.71-77
    • /
    • 2017
  • 스마트폰과 같은 GPS센서가 장착된 모바일 기기가 널리 보급되고 있다. 이러한 추세에 따라 트위터나 페이스북과 같은 소셜 미디어에서 GEO태그가 된 메시지 (즉, GPS 위치를 갖는 멀티미디어 메시지)를 손쉽게 작성할 수 있게 되었고 게시자의 위치정보를 포함하는 공간데이터가 급증하고 있다. 그러나 이러한 공간데이터에서 항상 위치 정보와 게시글 내용이 명시적인 연관성을 갖고 있지는 않다. 때문에 키워드와 위치정보 분포의 관련성에 따라 검색결과를 재구성할 필요가 있다. 우리는 크기가 가장 작은 k개의 점 데이터를 포함하는 최소경계사각형(MBR)을 찾음으로써 데이터가 가장 밀집된 사각형을 찾으며, 이는 위치 검색시스템에서 유용하게 사용될 수 있다. 본 논문은 최소경계사각형과 같이 거리가 가까운 2차원 공간데이터의 묶음을 찾기 위해 효율적인 알고리즘을 제안하였고 합성데이터와 실제 데이터를 이용한 실험을 통해 알고리즘의 효율성을 검증하였다.

수술 중 촬영된 2D XA 영상과 수술 전 촬영된 3D CTA 영상의 고속 강체 정합 기법 (Rapid Rigid Registration Method Between Intra-Operative 2D XA and Pre-operative 3D CTA Images)

  • 박태용;신용빈;임선혜;이정진
    • 한국멀티미디어학회논문지
    • /
    • 제16권12호
    • /
    • pp.1454-1464
    • /
    • 2013
  • 본 논문에서는 수술 중 촬영된 2D XA(X-ray Angiogram) 영상에 수술 전 촬영된 3D CTA (Computed Tomography Angiography) 영상 정보를 융합 가시화하기 위한 고속의 강체 정합 기법을 제안한다. 본 논문에서는 두 혈관 사이의 특징점 정보를 이용하여 예측 투영 위치 지점을 추정하는 삼각 측정을 통한 추정치 예측 기법을 제안하여 빠르고 견고한 초기 정합이 가능하다. 이에 더하여 주축을 생성하여 정렬시킨 후 경계 상자를 이용하여 혈관의 형태를 비교하는 방법으로 더욱 정확한 초기 정합이 가능하다. 다음으로 정밀정합은 선택적 거리 측정을 통하여 각 영상에서의 혈관들의 거리 차이가 최소인 위치로 영상을 정합한다. 실험으로 5명의 환자 데이터에 대하여 영상정합을 하였고, 기존 기법과 수행 속도와 정확성, 견고성 측면에서 비교 평가하였다. 실험 결과 제안 기법은 기존 기법에 비하여 최적의 위치로 빠르고 견고하게 정합되었다.