• 제목/요약/키워드: 이미지 검출방법

검색결과 534건 처리시간 0.023초

딥러닝 기반 지하 공동구 내 소화기 객체 탐지 모델 개발 (Development of a Deep Learning-based Fire Extinguisher Object Detection Model in Underground Utility Tunnels)

  • 박상미;홍창희;박승화;이재욱;김정수
    • 한국재난정보학회 논문집
    • /
    • 제18권4호
    • /
    • pp.922-929
    • /
    • 2022
  • 연구목적: 본 논문은 지하공동구 내 CCTV에서 촬영된 영상에서 소화기를 탐지하기 위해 딥러닝 모델을 개발하는데 목적이 있다. 연구방법: 딥러닝 기반 지하공동구 내 소화기 탐지를 위해 다양한 소화기 이미지를 수집하였으며 CNN 알고리즘을 기반으로 하여 One-stage Detector 방식을 적용한 모델을 개발하였다. 연구결과: 지하공동구 내 CCTV 영상을 통해 10m 이내의 거리에서 촬영되는 소화기의 검출률은 96%이상으로 우수한 검출률을 보여준다. 다만 10m 이상의 거리에서는 육안으로도 확인하기 힘든 상태로, 소화기 객체 검출률이 급격하게 낮아지는 것을 확인하였다. 결론: 본 논문은 지하공동구 내 소화기 객체를 검출하는 모델을 개발하였으며, 해당 모델이 높은 성능을 보여 지하공동구 디지털트윈 모델 연동에 활용할 수 있을 것으로 판단된다.

3D 변형가능 형상 모델 기반 3D 얼굴 모델링 (3D Face Modeling based on 3D Morphable Shape Model)

  • 장용석;김부균;조성원;정선태
    • 한국콘텐츠학회논문지
    • /
    • 제8권1호
    • /
    • pp.212-227
    • /
    • 2008
  • 3D 얼굴 모델링은 33공간에서 얼굴을 자유롭게 회전 시켜 다양한 얼굴 자세를 표현하고 조명 효과도 적절하게 모델링 할 수 있으므로, 얼굴 자세, 조명, 표정 등의 표현에 있어서 2D 얼굴 모델링에 비해 보다 정교하며 사실감이 뛰어나 얼굴 인식, 게임, 아바타 등에서 많은 요구가 존재한다. 본 논문에서는 3D 변형 가능 형상 모델에 기반을 둔 3D 얼굴 모델링 방법을 제안한다. 제안된 3D 얼굴 모델링 방법은 먼저 3D 스캐너를 통하여 획득한 3D 얼굴 스캔 데이터를 이용하여 3D 얼굴 변형 가능 형상 모델을 구축한다. 다음, 3D 얼굴 모델링을 하고자 하는 얼굴의 2D 이미지 시퀀스로부터, 해당 얼굴의 특징점들을 검출하고 이들을 매칭하여, 매칭된 특징점들로부터 인수분해 기반 SfM 기법을 이용하여 해당 특징점의 3D 버텍스 좌표 값을 구한다. 이후, 구한 3D 버텍스들을 3D 변형 가능 형상 모델에 정합하여 해당 얼굴의 3D 형상 모델을 얻는다. 또한, 2D 얼굴 이미지 시퀀스들로부터 뷰 독립적인 2D 원통 좌표 텍스쳐 맵을 구하고 이를 이용하여 3D 형상 모델을 렌더링 함으로써, 최종적으로 3B 얼굴 모델을 완성한다. 제안된 3D 얼굴 모델링 방법에 의한 3D 얼굴 모델 생성 과정을 통해서, 본 논문에서 제안한 3D 얼굴 모델링 방법이 기존의 얼굴 모델링 방법들에 비해 상대적으로 빠르고 비교적 정교하게 수행됨을 볼 수 있었다.

통계적 극점 자취 알고리즘에 기초한 움직임 열화 영상의 파라메터 추출 (Estimation of Motion-Blur Parameters Based on a Stochastic Peak Trace Algorithm)

  • 최병철;홍훈섭;강문기
    • 방송공학회논문지
    • /
    • 제5권2호
    • /
    • pp.281-289
    • /
    • 2000
  • 영상을 획득하는 과정에 있어서 영상 획득 장치 또는 피사체의 흔들림은 영상에 손상을 가져온다. 이러한 손상을 움직임 열화(motion blur)라고 부르며, 영상의 선명도를 떨어뜨리는 주된 원인이 된다. 최근 연구에서 밝힌 극점자취 방법을 통해 주어진 열화영상에서 열화의 PSF(Point Spread Function) 특성을 구하는데 사용되는 중요한 파라메터를 추출 할 수 있다. 이러한 극점 자취방법으로, 노이즈에 의한 열화에 관계없이 적은 연산량으로 움직임 열화의 방향을 추출할 수 있다. 본 논문에서는 통계적 극점 자취 접근법을 새롭게 제안한다. 저주파 영역에서 움직임 열화방향의 추정오차를 줄이기 위해 ML(Maximum Likelihood)분류를 통해 오차를 유발하는 극점을 선택하여 가중치를 적용, 그 영향을 최소화한다. 선형 예측법을 사용하여, 불규칙적 자료가 극점으로 선택되는 것을 방지한다 제안된 MALM(Moving average least mean)방법은 두번째로 큰 극점의 검출을 위해 움직임의 정도를 판별하는데 사용된다. MALM방법은 자체적으로 노이즈 제거 과정을 내포하고 있으므로 노이즈가 많은 환경에서도 파라메터를 추출할 수가 있다. 실험에서 우리는 제안된 방법을 통해 얻어진 정보를 사용하여, 열화 된 이미지를 효율적으로 복구해 낼 수 있었다.

  • PDF

스네이크모델을 기반으로 한 경동맥 이미지분할 (Automatic Carotid Artery Image Segmentation using Snake Based Model)

  • 아스마툴라 초드리;메디하산;아시훌라 칸;최승호;김진영
    • 한국항행학회논문지
    • /
    • 제17권1호
    • /
    • pp.115-122
    • /
    • 2013
  • 최근 의료영상을 이용한 질병 진단법에 대한 관심이 증가하고 있는 추세이다. 관절경화증은 경동맥의 동맥을 좁게 하여 뇌로 들어가는 혈류의 일부 또는 전체를 차단하는 원인이 된다. 뇌로 흘러가는 혈류가 차단되는 경우 심각한 뇌졸중을 야기하기도 한다. 만일 초기에 경동맥 플라크를 발견하고 이를 치료하면 심각한 뇌졸중을 예방할 수 있다. 본 논문에서는 경동맥의 동맥 초음파 영상에서 경동맥 플라크를 쉽게 발견하기 위한 능동적 윤곽선 추출기법에 기반을 둔 자동 분할기법을 제안한다. 실험에서 사용되는 초음파 영상은 자동 분할기법을 적용하기 전에 적절히 정렬되어있다고 가정한다. 경동맥의 동맥 초음파 영상에 대하여 스네이크 모델을 이용하여 자동분할 방법과 수동분할 방법을 질적 비교한 결과 제안된 방법이 성공적으로 적용되었음을 보여준다. 실험결과 제안된 방법은 방사선사들이 플라크를 쉽게 찾는데 도움을 줄 수 있는 자동화 방법이 될 것으로 예상된다.

손가락 마디 추정을 이용한 비전 및 깊이 정보 기반 손 인터페이스 방법 (Vision and Depth Information based Real-time Hand Interface Method Using Finger Joint Estimation)

  • 박기서;이대호;박영태
    • 디지털융복합연구
    • /
    • 제11권7호
    • /
    • pp.157-163
    • /
    • 2013
  • 본 논문에서는 손가락 마디 추정을 이용한 비전 및 깊이 정보 기반 손 인터페이스 방법을 제안한다. 먼저 비주얼 영상 및 깊이 정보 영상을 매핑한 후 왼손과 오른손의 영역의 레이블링 및 윤곽선 잡음 보정 후 각 손 영역에 대하여 손 중심점 및 회전각을 구현한다. 그리고 손 중심점에서 일정간격의 원을 확장하여 손 경계 교차점의 중간 지점을 계산하여 손가락 끝점과 마디를 추정하여 사용자의 손가락 동작을 인식한다. 본 방법을 실험한 결과 손의 회전 및 손가락 시작점 및 끝점을 정확하게 추정하여 다양한 손동작 인식 및 제어가 가능함을 보였다. 왼손과 오른손을 사용하여 다양한 손 포즈에 대해 실험한 결과, 본 논문의 제안 방법은 평균 90% 이상의 정확도로 초당 25프레임 이상의 처리 성능을 보였다. 제안 방법은 컴퓨터간의 HCI 제어, 게임, 교육 등의 비접촉식 인터페이스 응용분야에 적용될 수 있다.

키넥트와 모바일 장치 알림 기반 온라인 모니터링 시스템 (Online Monitoring System based notifications on Mobile devices with Kinect V2)

  • 니욘사바에릭;장종욱
    • 한국정보통신학회논문지
    • /
    • 제20권6호
    • /
    • pp.1183-1188
    • /
    • 2016
  • 키넥트 센서 버전 2는 컴퓨터 비전과 엑스 박스와 같은 엔유아이 인터페이스로 마이크로소프트에서 출시한 카메라의 일종이다. 이는 높은 프레임 속도로 컬러 영상과 깊이 영상, 오디오 입력 및 스켈레톤 데이터를 취득 할 수 있다. 이러한 다양한 타입의 데이터 정보를 제공해 주기 때문에 이것은 다른 범위의 연구자들을 위한 리소스가 된다. 본 논문에서는 깊이 이미지를 사용하여 우리는 키넥트 범위내에서 특정 영역을 감시하는 시스템을 제시한다. 타켓 영역은 깊이의 최소, 최대 값의 크기에 따라서 그 공간을 모니터링 할 수 있다. 컴퓨터 비전 라이브러리 (Emgu CV)를 사용해서 만약 어떤 오브젝트가 타겟 영역에서 검출된다면 그것을 추적하고 키넥트 카메라는 RGB 이미지를 데이터베이스 서버에 전송한다. 따라서 안드로이드 플랫폼 기반 모바일 애플리케이션을 통해 키넥트 타켓 지역에서 수상한 움직임이 감지되었음을 사용자에게 통지하고 그 장면의 RGB 영상을 표시하기 위해 개발되었다. 사용자는 모니터링 영역 또는 제한 구역과 관련된 다른 경우에서 가치 있는 물건의 대해 최선의 방법으로 반응하고 실시간 통지를 얻는다.

경량화된 임베디드 시스템에서 의미론적인 픽셀 분할 마스킹을 이용한 효율적인 영상 객체 인식 기법 (Efficient Object Recognition by Masking Semantic Pixel Difference Region of Vision Snapshot for Lightweight Embedded Systems)

  • 윤희지;박대진
    • 한국정보통신학회논문지
    • /
    • 제26권6호
    • /
    • pp.813-826
    • /
    • 2022
  • 카메라를 이용한 영상 처리와 그에 따른 인공지능 기술의 발달로 다양한 분야의 기술이 발전하기 시작했다. 하지만 보드가 가벼울수록 연산이 많이 필요한 영상 처리 알고리즘을 구현하기 힘들다. 본 논문에서는 경량 임베디드 보드에서 물체 인식 알고리즘을 위한 딥러닝을 사용하는 방법을 제안한다. 비교적 적은 양의 계산으로 segmentation을 처리하는 딥러닝 알고리즘을 사용하여 ROI(Region of Interest)를 결정할 수 있다. 영역을 마스킹한 후, 더 정확한 딥러닝 알고리즘을 사용해 물체 감지를 할 수 있다. Python에서 입력 이미지를 처리하기 위해 OpenCV를 사용했고 ENet과 YOLO(You Only Look Once)를 사용하여 이미지를 처리했다. 이 알고리즘을 실행함으로써 평균 오차가 절반으로 감소해 정확한 객체 검출을 처리할 수 있고 경량 임베디드 보드에서 실시간으로 객체 인식을 실행할 수 있다. 이 연구는 자율주행과 IoT에서 저가격 경량화된 응용에 활용될 수 있을 것으로 기대된다.

대용량 소포영상에서 관심영역 고속추출 방법에 관한 연구 (The High-Speed Extraction of Interest Region in the Parcel Image of Large Size)

  • 박문성;박상은;김인수;김혜규;정회경
    • 정보처리학회논문지D
    • /
    • 제11D권3호
    • /
    • pp.691-702
    • /
    • 2004
  • 본 문은 고속으로 이송되는 컨베이어 벨트 환경에서 획득된 대용량 소포 영상에서 다양한 관심영역(ROI:Region of Interest)을 고속 추출할 수 있는 방법을 제안한다. 제안된 방법의 친 번째 단계에서는 영상을 32${\times}$32 픽셀 크기의 마스크로 나누고 그 중 내부 픽셀의 최대값과 최소값의 차이값이 최저 동적 입계값보다 큰 경우에 1차 후보로 검출한다. 두 번째 단계에서는 1차 후보 마스크를 다시 8${\times}$8크기의 서브마스크로 나누고 적셀 값의 편차(deviation)을 기준으로 최저 임계값보다 큰 마스크만 남김으로서 불필요한 영역을 제거한다. 이러한 전처리 과정을 거쳐 1차원 바코드, 2차원 바코드, 소포의 외형 경계, 레이블 및 문자와 같은 소포의 정보가 기록되어 있는 영역(ROI)을 제외한 나머지 영역을 제거한다. 후처리 과정에서는 위의 ROI 중 2차원 바코드 영역만을 추출하기 위해서 각각의 ROI에 대하여 기준축을 생성한 결과를 이용하여 각각의 영역을 검증하였다. 이와 같은 방법으로 실험한 결과 대용량 소포영상에서 약 200msec 이내에 다양한 ROI를 추출하였으며 100%의 정확도로 2차원 바코드 영역을 지정할 수 있음을 확인하였다.

압축영역에서의 대표프레임 추출 및 영역분할기반 비디오 검색 기법 (Key Frame Extraction and Region Segmentation-based Video Retrieval in Compressed Domain)

  • 강응관;김성주;송호근;최종수
    • 한국통신학회논문지
    • /
    • 제24권9B호
    • /
    • pp.1713-1720
    • /
    • 1999
  • 본 논문에서는 동영상 압축 부호화에 대한 표준안인 MPEG 기반의 압축 비디오 시퀀스로부터 DCT DC 계수를 추출하고, 이들로 구성된 DC 이미지로부터 AHIM (Accumulative Histogram Intersection Measure)을 이용하여 장면 전환 검출을 수행한 후 대표 프레임을 추출하는 방법을 제시한다. 또한, 추출된 대표 프레임을 두 단계를 거쳐 데이터베이스의 색인 정보로 저장한 후, 입력되는 질의 영상에 대해 사용자가 원하는 검색 결과를 제시하는 방법에 대해 제안한다. 즉 전처리 과정으로 추출된 대표 프레임에 대해 영역 분할을 한 후, 첫 번째 단계에서 수평 투영된 결과를 히스토그램 분포 특성으로 변환시켜 데이터베이스의 색인 정보로 저장한다. 두 번째 단계에서는 영상의 모멘트 특성을 거리함수 값으로 변환시킨다. 실험 결과 제안된 방법이 검색에 있어 우수한 성능을 갖추고 또한 상당한 양의 처리 시간과 메모리 공간을 줄일 수 있음을 확인하였다. 향후 제안한 방법은 색상과 같은 다른 색인 정보와 결합할 경우, 보다 나은 영상 색인과 검색 수단을 제공할 것이다.

  • PDF

순차 램 기반 누적 신경망을 이용한 수화 인식 (Sign Language recognition Using Sequential Ram-based Cumulative Neural Networks)

  • 이동형;강만모;김영기;이수동
    • 한국인터넷방송통신학회논문지
    • /
    • 제9권5호
    • /
    • pp.205-211
    • /
    • 2009
  • 가중치가 없는 램 기반 신경망은 가중치를 재조정하는 기존 신경망에 비해 계산량 및 인식 시간이 적은 장점을 가지고 있다. 특히 연속적인 연관성을 갖는 제스처와 같은 행위 정보는 각각의 정보들이 시계열적 상관관계를 갖는다. 이와 같은 행위 정보를 인식하려면 일반적으로 많은 계산량과 처리 시간이 요구된다. 이런 문제점을 해결하기 위해 일반적으로 전처리 과정의 삽입 및 하드웨어 인터페이스 활용 등을 이용한다. 본 논문에서는 이와 같은 추가적인 방법 없이 순차 램 기반 누적 신경망으로 연속적인 행위 정보인 한글 복합어 수화 인식 시스템을 구현하였다. 제안된 모델의 성능을 검증하기 위하여 카메라로부터 입력받은 연속적인 복합어 수화 영상을 최소한의 이미지 처리인 경계선 검출만으로 수화 인식을 실험하였다. 경계선 검출 후 이진 영상을 전처리 과정 없이 제안된 순차 램 기반 누적 신경망 시스템으로 처리된 결과는 93%의 인식률을 얻었다.

  • PDF