• 제목/요약/키워드: 바운딩 박스

검색결과 41건 처리시간 0.021초

시공간 정보를 이용한 자막 탐지 및 향상 기법 (A Method for Text Detection and Enhancement using Spatio-Temporal Information)

  • 정종면
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권8호
    • /
    • pp.43-50
    • /
    • 2009
  • 디지털 비디오에서 텍스트 정보는 비디오 데이터의 시청각적인 정보를 보강하고 부가 정보를 제공하기 때문에 방대한 멀티미디어의 내용을 예측할 수 있는 중요한 단서를 제공한다. 본 논문에서 제안된 방법은 주어진 영상열로부터 자막의 획 특징을 이용하여 자막을 탐지하고, 프로젝션을 이용하여 자막의 위치를 찾는다. 찾아진 자막을 포함하는 바운딩박스에 대한 기하학적인 검증을 거친 후, 서로 인접하는 프레임에 있는 바운딩박스 중 공간적으로 동일한 위치의 바운딩박스에 대한 MAD를 이용하여 바운딩박스를 추적하고, 시간적 중복성을 이용하여 바운딩박스 영역의 화질을 향상시킨다. 다양한 비디오에 대한 실험 결과는 제안된 방법의 타당성을 보인다.

YOLOv5 학습 시 바운딩 박스 개수에 따른 화재 탐지 성능 비교 (Comparison of Fire Detection Performance according to the Number of Bounding Boxes for YOLOv5)

  • 성영아;이현섭;장시웅
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.50-53
    • /
    • 2022
  • YOLOv5에서 객체 탐지를 위해 이미지를 학습 시 기존의 이미지에 위치 정보를 어노테이션 하는 과정이 필요한다. 가장 대표적인 방법이 이미지에 바운딩 박스를 그려 위치 정보를 메타정보로 저장하게 하는 것이다. 하지만 객체의 경계가 모호한 경우 바운딩 박스를 하는 것에 어려움을 겪게 된다. 그 대표적인 예시가 화재인 부분과 화재가 아닌 부분을 분류하는 것이다. 따라서 본 논문에서는 화재가 났다고 판단되는 샘플 100개의 이미지를 바운딩 박싱 개수를 달리하여 학습시켜 보았다. 그 결과 바운딩 박스를 어노테이션 시 가장자리를 가능한 크게 잡아 하나의 박스로 어노테이션하는 것보다 조금 더 세분화 하여 박스 3개로 어노테이션하여 학습시킨 모델에서 더 뛰어난 화재 탐지 성능을 보여주었다.

  • PDF

객체 바운딩 박스와 원본 이미지 결합을 이용한 합성 데이터 생성 기법 (Synthetic data generation technique using object bounding box and original image combination)

  • 이주혁;김미희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.476-478
    • /
    • 2023
  • 딥러닝은 컴퓨터 비전의 상당한 발전을 기여했지만, 딥러닝 모델을 학습하려면 대규모 데이터 세트가 필요하다. 이를 해결하기 위해 데이터 증강 기술이 주목받고 있다. 본 논문에서는 객체 추출 바운딩 박스와 원본 이미지의 바운딩 박스를 결합하여 합성 데이터 생성기법을 제안한다. 원본 이미지와 동일한 범주의 데이터셋에서 참조 이미지의 객체를 추출한 다음 생성 모델을 사용하여 참조 이미지와 원본 이미지의 특징을 통합하여 새로운 합성 이미지를 만든다. 실험을 통해, 생성 기법을 통한 딥러닝 모델의 성능향상을 보여준다.

바운딩 박스 세분화를 통한 지형 렌더링의 가속화 (Acceleration of Terrain Rendering Using Bounding Box Subdivision)

  • 이은석;이진희;조인우;신병석
    • 한국게임학회 논문지
    • /
    • 제11권6호
    • /
    • pp.71-80
    • /
    • 2011
  • 최근의 3D게임이나 가상현실을 위한 지형 시각화 응용에서는 사실적인 장면을 렌더링 하기 위해 고화질 영상을 실시간에 제공하는 GPU기반의 광선투사법을 이용한다. 이 방법은 지형데이터의 크기가 증가할수록 샘플링 해야 하는 텍셀의 개수가 증가하기 때문에 렌더링 속도가 저하된다. 이러한 문제점을 해결하기 위해서 본 논문에서는 GPU에서 사진트리를 기반으로 수행되는 바운딩 박스 세분화를 이용하여 빈 공간이 제거된 바운딩 박스를 생성하고 이를 이용하여 광선투사법을 가속화하는 방법을 제안한다. 이 방법은 각 광선마다 빈 공간 도약을 위해 트리를 탐색하여 중복된 탐색연산을 수행해야 했던 기존의 방법과 달리 바운딩 박스를 이용하여 탐색 연산을 단 1번만 수행하도록 하여 수행속도를 가속화 하였다.

조호환경 내 환자 탐지를 위한 YOLO 모델 기반 바운딩 박스 앙상블 기법 (YOLO models based Bounding-Box Ensemble Method for Patient Detection In Homecare Place Images)

  • 박준휘;김범준;김인기;곽정환
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.562-564
    • /
    • 2022
  • 조호환경이란 환자의 지속적인 추적 및 관찰이 필요한 환경으로써, 병원 입원실, 요양원 등을 의미한다. 조호환경 내 환자의 이상 증세가 발생하는 시간 및 이상 증세의 종류는 예측할 수 없기에 인력을 통한 상시 관리는 필수적이다. 또한, 환자의 이상 증세 발견 시간은 발병 시점부터의 소요 시간이 생사와 즉결되기에 빠른 발견이 매우 중요하다. 하지만, 인력을 통한 상시 관리는 많은 경제적 비용을 수반하기에 독거 노인, 빈민층 등 요양 비용을 충당하지 못하는 환자들이 수혜받는 것은 어려우며, 인력을 통해 이루어지기 때문에 이상 증세 발병 즉시 발견에 한계를 가진다. 즉, 기존까지 조호환경 내 환자 관리 방식은 경제적 비용과 이상 증세 발병 즉시 발견에 한계를 가진다는 문제점을 가진다. 따라서 본 논문은 YOLO 모델의 조호환경 내 환자 탐지 성능 비교 및 바운딩 박스 앙상블 기법을 제안한다. 이를 통해, 딥러닝 모델을 통한 환자 상시 관리가 이루어지기에 높은 경제적 비용문제를 해소할 수 있다. 또한, YOLO 모델 바운딩 박스 앙상블 기법 WBF를 통해 폐색이 짙은 조호환경 영상 데이터 내에 객체 탐지 영역 정확도 향상 방법을 연구하였다.

군중 시뮬레이션을 위한 그래프기반 모션합성에서의 충돌감지 (Detecting Collisions in Graph-Driven Motion Synthesis for Crowd Simulation)

  • 성만규
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제35권1호
    • /
    • pp.44-52
    • /
    • 2008
  • 본 논문에서는 모션켑쳐데이타를 이용한 두 캐릭터간의 빠른 충돌감지에 대한 연구를 논의한다. 본 연구의 목적이 군중 시뮬레이션이기 때문에, 제안한 알고리즘은 캐릭터를 실린더 형태로 모델링 한 후에 Rough한 충돌감지를 목표로 한다. 이를 위해 계층적인 바운딩 박스 데이타 구조인 MOBB를 제안한다. MOBB는 모션클립에 대한 시공간 바운딩 박스이며, 제안된 알고리즘에 대한 테스트 결과 2배 이상의 속도 향상이 있음을 밝힌다.

딥러닝을 이용한 실시간 말벌 분류 시스템 (Real Time Hornet Classification System Based on Deep Learning)

  • 정윤주;이영학;이스라필 안사리;이철희
    • 전기전자학회논문지
    • /
    • 제24권4호
    • /
    • pp.1141-1147
    • /
    • 2020
  • 말벌 종은 모양이 매우 유사하기 때문에 비전문가가 분류하기 어렵고, 객체의 크기가 작고 빠르게 움직이기 때문에 실시간으로 탐지하여 종을 분류하는 것은 더욱 어렵다. 본 논문에서는 바운딩 박스를 이용한 딥러닝 알고리즘을 기반으로 말벌 종을 실시간으로 분류하는 시스템을 개발하였다. 훈련 영상의 레이블링 작업 시 바운딩 박스 안에 포함되는 배경 영역을 최소화하기 위하여 말벌의 머리와 몸통 부분만을 선택하는 방법을 제안한다. 또한 실시간으로 말벌을 탐지하고 그 종을 분류할 수 있는 최선의 알고리즘을 찾기 위하여 기존의 바운딩 박스 기반 객체 인식 알고리즘들을 실험을 통하여 비교한다. 실험 결과 컨볼루션 레이어의 활성함수로 mish 함수를 적용하고, 객체 검출 블록 전에 공간집중모듈(Spatial Attention Module, SAM)을 적용한 YOLOv4 모델을 사용하여 말벌 영상을 테스트한 경우 평균 97.89%의 정밀도(Precision)와 98.69%의 재현율(Recall)을 나타내었다.

Vanishing point-based 3D object detection method for improving traffic object recognition accuracy

  • Jeong-In, Park
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권1호
    • /
    • pp.93-101
    • /
    • 2023
  • 이 논문은 영상 카메라를 이용하여 교통 객체를 인식하고자 하는 경우, 영상 내 객체 인식 정확도를 높이기 위해 소실점을 이용하여 객체에 대한 3D 바운딩 박스를 생성하는 방법이다. 최근 인공지능을 이용하여 교통 영상 카메라로 촬영된 차량을 검출하고자 하는 경우 이 3D 바운딩 박스 생성 알고리즘을 적용하고자 한다. 카메라 설치 각도와 카메라가 촬영한 영상의 방향성을 분석하여 종 방향 소실점(VP1)과 횡 방향 소실점(VP2)을 도출하고 이를 기반으로 분석 대상 동영상에서 이동하는 객체를 특정하게 된다. 이 알고리즘을 적용하면 감지된 객체의 위치, 종류, 크기 등 객체 정보 검출이 용이하고, 이를 자동차와 같은 이동류에 적용하는 경우 이를 트래킹하여 각 객체가 이동한 위치와 좌표, 이동속도 및 방향 등을 알 수 있다. 실제 도로에 적용한 결과 트래킹이 10% 향상되었으며 특히 음영지역(큰 차에 가려진 극히 적은 차량 부위)의 인식율과 트래킹이 100% 개선되는 등 교통 데이터 분석 정확성을 향상시킬 수 있었다.

대형 이미지 데이터셋 구축을 위한 객체 엣지 기반 이미지 생성 기법 (Object Edge-based Image Generation Technique for Constructing Large-scale Image Datasets)

  • 이주혁;김미희
    • 전기전자학회논문지
    • /
    • 제27권3호
    • /
    • pp.280-287
    • /
    • 2023
  • 딥러닝의 발전은 컴퓨터 비전 문제를 해결할 수 있지만, 높은 정확도를 위해서는 대규모 데이터셋이 필요하다. 본 논문에서는 객체 바운딩 박스와 이미지 엣지 성분을 이용한 이미지 생성 기법을 제안한다. 객체 탐지를 통해 이미지 내의 객체 바운딩 박스를 추출하고 이미지 엣지 성분을 함께 이미지 생성모델의 입력값으로 사용하여 새로운 이미지 데이터를 생성한다. 실험 결과, 제안 기법으로 생성된 이미지는 이미지 품질 평가에서 소스 이미지와 유사한 품질을 보였고, 딥러닝 훈련과정에서도 좋은 성능을 보였다.