• 제목/요약/키워드: 객체 세그먼테이션

검색결과 8건 처리시간 0.019초

mask R-CNN 기반의 철도선로 객체검출 및 분류에 관한 연구 (Research on railroad track object detection and classification based on mask R-CNN)

  • 이승신;최종원;오염덕
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2024년도 제69차 동계학술대회논문집 32권1호
    • /
    • pp.81-83
    • /
    • 2024
  • 본 논문에서는 mask R-CNN의 이미지 세그먼테이션(Image Segmentation) 기법을 이용하여 철도의 선로를 식별하고 분류하는 방법을 제안한다. mask R-CNN의 이미지 세그먼테이션은 바운딩 박스(Bounding Box)를 통해 이미지에서 객체를 식별하는 R-CNN 알고리즘과는 달리 픽셀 단위로 관심 있는 객체를 검출하고 분류하는 기법으로서 오브젝트 디텍션(Object Detection)보다 더욱 정교한 객체 식별이 가능하다. 본 연구에서는 Pascal VOC 형태의 고속철도 데이터 24,205셋의 데이터를 전처리하고 MS COCO 데이터셋으로 변환하여, MMDetection의 mask R-CNN을 통해 픽셀 단위로 철도선로를 식별하고 정상/불량 상태를 분류하는 연구를 수행하였다. 선행연구에서는 YOLO를 활용하여 Polygon형태의 좌표를 바운딩 박스로 분류하였는데, 본 연구에서는 mask R-CNN을 활용함으로써 철도 선로를 더욱 정교하게 식별하였으며 정상/불량의 상태 분류는 YOLO와 유사한 성능을 보였다.

  • PDF

세그먼테이션과 스타일 변환을 활용한 영상 재구성 시스템 (Image Recomposition System Using Segmentation and Style-transfer)

  • 방연준;이의진;박주형;강병근
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 하계학술대회
    • /
    • pp.19-22
    • /
    • 2021
  • 기존 영상 콘텐츠에 새로운 물체를 삽입하는 등의 영상 재구성 기술은 새로운 게임, 가상현실, 증강현실 콘텐츠를 생성하거나 인공신경망 학습을 위한 데이터 증대를 위해 사용될 수 있다. 하지만, 기존 기술은 컴퓨터 그래픽스, 사람에 의한 수동적인 영상 편집에 의존하고 있어 금전적/시간적 비용이 높다. 이에 본 연구에서는 인공지능 신경망을 활용하여 낮은 비용으로 영상을 재구성하는 기술을 소개하고자 한다. 제안하는 방법은 기존 콘텐츠와 삽입하고자 하는 객체를 포함하는 영상이 주어졌을 때, 객체 세그먼테이션 네트워크를 활용하여 입력 영상에서 객체를 분리하고, 스타일 변환 네트워크를 활용하여 입력 영상을 스타일 변환한 후, 사용자 입력과 두 네트워크의 결과를 활용하여 기존 콘텐츠에 새로운 객체를 삽입하는 것이다. 실험에서는 기존 콘텐츠는 온라인 영상을 활용하였으며 삽입 객체를 포함한 영상은 ImageNet 영상 분류 데이터 세트를 활용하였다. 실험을 통해 제안한 방법을 활용하면 기존 콘텐츠와 잘 어우러지게끔 객체를 삽입할 수 있음을 보인다.

  • PDF

레벨셋을 이용한 특정 영역의 영상 세그먼테이션 (Image Segmentation of Special Area Using the Level Set)

  • 주기세;조덕상
    • 한국정보통신학회논문지
    • /
    • 제14권4호
    • /
    • pp.967-975
    • /
    • 2010
  • 영상 세그먼테이션은 배경으로부터 객체들을 구별하는 것으로서, 영상 분석과 해석을 하는데 있어서 첫 번째 단계에 해당한다. 그러나 활성 외곽선 모델은 위상이 2개밖에 없으므로 정확하게 원하는 객체들을 추출할 수가 없다. 본 논문에서 원하는 특정한 범위의 명암도를 갖는 객체들을 추출하기 위해서 초기 곡선을 객체들 근처에 구성함으로써 바라는 윤곽을 찾는 방법을 제안한다. 초기 곡선은 히스토그램 평활화, 가우시안 평활화, 임계치를 이용하여 구한다. 제안한 방법은 초기 곡선을 관심영역에 최대 근접시키므로 계산 속도를 줄이고 원하는 영역을 정확하게 추출할 수 있다. CT 영상과 MR 영상에 적용한 결과 제안한 방법이 활성 외곽선 모델보다 더 효과적임을 보였다.

An Enhanced Two-Stage Vehicle License Plate Detection Scheme Using Object Segmentation for Declined License Plate Detections

  • Lee, Sang-Won;Choi, Bumsuk;Kim, Yoo-Sung
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권9호
    • /
    • pp.49-55
    • /
    • 2021
  • 본 논문에서는 실제 도로에서 기울어진 촬영 각도로 인하여 회전된 차량 번호판을 정확하게 탐지하기 위하여 객체 세그먼테이션(object segmentation)을 이용하는 개선된 2-단계 차량 번호판 탐지 모델을 제안한다. 기존 연구에서 제안한 3-단계 차량 번호판 탐지 파이프라인 모델은 차량 번호판이 많이 기울어져 있을수록 탐지 정확도가 낮아지는 문제가 있다. 이를 해결하기 위해서 기존의 3-단계 모델에서 사각형 형태만으로 차량 후보 영역과 차량 번호판 후보 영역을 인식하는 전위 2개의 처리 단계 대신에 임의의 형태로 객체 탐지가 가능한 객체 세그먼테이션을 이용하는 하나의 단계로 대체함으로써 탐지 과정을 단순화하였으며 궁극적으로는 임의의 형태로 기울어진 차량 이미지에 대해서도 탐지 성능을 개선하였다. 기울어진 차량 번호판 이미지를 대상으로 실시한 차량 번호판 탐지 모델의 정확도 분석 실험 결과에 의하면 기존의 3-단계 차량 번호판 탐지 모델보다 제안된 2-단계 기법이 탐지 과정을 단순화하였음에도 최대 약 20%의 탐지 정확도를 개선할 수 있는 것으로 분석되었다.

인공지능 기술을 활용한 패션 분석 기술 (Fashion analysis for Artificial intelligence)

  • 송혁;고민수;유지상
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.673-674
    • /
    • 2020
  • 의식주 중에서 자신을 표현하고 외부와의 교류를 할 수 있는 분야는 패션분야로서 인간 생활과 밀접한 관계를 가지고 있으며 사람들의 개인화된 성향 변화 및 인터넷 환경의 개선으로 트렌드는 빠르게 변화하고 있다. 인공지능 기술의 발전은 단순히 객체의 검출 및 분류에서 벗어나 패션 아이템의 분석 및 세부적인 속성을 분석할 수 있는 수준에 다다랐으며 인공지능 기술을 활용하여 사용자에게 추천할 수 있는 서비스가 출시되고 있다. 패션 트렌드의 빠른 변화 및 인공지능 기술의 발전으로 이를 활용한 플랫폼에 기반을 두어 디자이너에게는 디자인 기술을 향상시킬 수 있으며 사용자에게는 개인화된 제품을 구매할 수 있는 플랫폼 개발이 요구되고 있다. 본 논문에서는 인공지능 기술 기반 패션 분석 기술 개발을 위하여 패션 검출 모듈, 패션 검색 모듈, 패션 검색을 위한 벡터 검색 모듈, 상하의 분리를 위한 세그먼테이션 모듈, 패션 복종 분류 모듈을 개발하여 통합하였으며 패션 검색 정확도는 Top-5 기준 75.28%, 벡터 검색 속도는 벡터당 0.002m sec 이하, 세그먼테이션 추출 정확도 87.6%이상, 패션 검출 결과 IoU 0.5 환경에서 96.2%, 복종분석 90.54%의 성능을 보였다.

  • PDF

건설 현장 CCTV 영상을 이용한 작업자와 중장비 추출 및 다중 객체 추적 (Extraction of Workers and Heavy Equipment and Muliti-Object Tracking using Surveillance System in Construction Sites)

  • 조영운;강경수;손보식;류한국
    • 한국건축시공학회지
    • /
    • 제21권5호
    • /
    • pp.397-408
    • /
    • 2021
  • 건설업은 업무상 재해 발생빈도와 사망자 수가 다른 산업군에 비해 높아 가장 위험한 산업군으로 불린다. 정부는 건설 현장에서 발생하는 산업 재해를 줄이고 예방하기 위해 CCTV 설치 의무화를 발표했다. 건설 현장의 안전 관리자는 CCTV 관제를 통해 현장의 잠재된 위험성을 찾아 제거하고 재해를 예방한다. 하지만 장시간 관제 업무는 피로도가 매우 높아 중요한 상황을 놓치는 경우가 많다. 따라서 본 연구는 딥러닝 기반 컴퓨터 비전 모형 중 개체 분할인 YOLACT와 다중 객체 추적 기법인 SORT을 적용하여 다중 클래스 다중 객체 추적 시스템을 개발하였다. 건설 현장에서 촬영한 영상으로 제안한 방법론의 성능을 MS COCO와 MOT 평가지표로 평가하였다. SORT는 YOLACT의 의존성이 높아서 작은 객체가 적은 데이터셋을 학습한 모형의 성능으로 먼 거리의 물체를 추적하는 성능이 떨어지지만, 크기가 큰 객체에서 뛰어난 성능을 나타냈다. 본 연구로 인해 딥러닝 기반 컴퓨터 비전 기법들의 안전 관제 업무에 보조 역할로 업무상 재해를 예방할 수 있을 것으로 판단된다.

실시간 고해상도 동영상 스티칭을 위한 고속 콘텐츠 보존 시접선 추정 방법 (Fast Content-preserving Seam Estimation for Real-time High-resolution Video Stitching)

  • 김태하;양성엽;강병근;이희경;서정일;이의진
    • 방송공학회논문지
    • /
    • 제25권6호
    • /
    • pp.1004-1012
    • /
    • 2020
  • 본 논문은 실시간 고해상도 비디오 스티칭을 위한 새로운 콘텐츠 보존 시접선 추정 알고리즘을 제안한다. 시접선 추정은 영상 스티칭 후 중첩 영역에서의 시각적 왜곡을 최소화하기 위한 요소 기술 중 하나이다. 기존 시접선 추정 알고리즘들은 요구되는 연산량과 메모리 사용량이 높은 최적화 알고리즘에 기반을 두고 있음에도 불구하고, 추정된 시접선이 객체를 피하지 못해 객체를 자르거나 반복하는 현상을 유발한다. 또한, 프레임 간의 추정된 시접선의 시간적 일관성이 부족하여 불필요한 잦은 변동이 발생한다. 따라서, 본 논문에서는 직선의 시접선을 활용하여 효율적이고 시간적 일관성이 있으며, 심층신경망 기반 객체 세그먼테이션 알고리즘을 활용하여 객체를 피하여 시접선을 형성하는 시접선 추정 알고리즘을 제안하고자 한다. 고해상도 360° 다중 시점 동영상을 사용한 실험을 통해 제안하는 알고리즘이 기존 알고리즘보다 짧은 시간에 시각적으로 유사한 360VR 동영상을 생성하는 시접선을 추정함을 확인하였다.

인스턴스 세그멘테이션 기반 토마토 병충해 탐지 모델 구현 및 적용성 평가 (Instance Segmentation Based Tomato Pests Disease Detection for Feasibility Evaluation)

  • 김은경;박준용;문용혁
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.417-419
    • /
    • 2022
  • 농축업에 ICT 기술을 접목한 스마트 팜은 생육환경을 자동으로 조절하여 노동력 등을 줄이고도 생산성과 품질을 향상시키는 것이 큰 장점이다. 하지만, 수익으로 이어지는 출하량과 품질 유지를 위해서 병충해에 주의를 기울여야 함은 여전하다. 따라서 토마토 잎 병충해 발생 시, 적절한 대응을 통해 더 큰 피해를 막을 수 있으므로, 초기 증상을 포착하는 기법을 개발한다. 오픈 데이터 셋인 Ai hub 의 시설작물 질병 데이터셋과 추가로 확보한 샘플을 포함해 2 개의 충해, 4 개의 병해에 1,231 장으로 데이터셋을 직접 구성해서 학습했다. 객체 탐지와 세그먼테이션이 동시에 가능하며 작은 병변도 잘 탐지하는 모델을 사용해서 총 6 가지 병충해에 대한 뚜렷한 증상 탐지를 보여주었다.