• 제목/요약/키워드: 객체검출

검색결과 896건 처리시간 0.026초

철근콘크리트 손상 특성 추출을 위한 최적 컨볼루션 신경망 백본 연구 (A Study on Optimal Convolutional Neural Networks Backbone for Reinforced Concrete Damage Feature Extraction)

  • 박영훈
    • 대한토목학회논문집
    • /
    • 제43권4호
    • /
    • pp.511-523
    • /
    • 2023
  • 철근콘크리트 손상 감지를 위한 무인항공기와 딥러닝 연계에 대한 연구가 활발히 진행 중이다. 컨볼루션 신경망은 객체 분류, 검출, 분할 모델의 백본으로 모델 성능에 높은 영향을 준다. 사전학습 컨볼루션 신경망인 모바일넷은 적은 연산량으로 충분한 정확도가 확보 될 수 있어 무인항공기 기반 실시간 손상 감지 백본으로 효율적이다. 바닐라 컨볼루션 신경망과 모바일넷을 분석 한 결과 모바일넷이 바닐라 컨볼루션 신경망의 15.9~22.9% 수준의 낮은 연산량으로도 6.0~9.0% 높은 검증 정확도를 가지는 것으로 평가되었다. 모바일넷V2, 모바일넷V3Large, 모바일넷 V3Small은 거의 동일한 최대 검증 정확도를 가지는 것으로 나타났으며 모바일넷의 철근콘트리트 손상 이미지 특성 추출 최적 조건은 옵티마이저 RMSprop, 드롭아웃 미적용, 평균풀링인 것으로 분석되었다. 본 연구에서 도출된 모바일넷V2 기반 7가지 손상 감지 최대 검증 정확도 75.49%는 이미지 축적과 지속적 학습으로 향상 될 수 있다.

위성영상 및 CNN을 활용한 소규모 농업용 저수지의 수표면적 시계열 분석 (Temporal Analysis of Agricultural Reservoir Water Surface Area using Remote Sensing and CNN)

  • 양미혜;남원호;이희진;김태곤
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.118-118
    • /
    • 2021
  • 최근 지구 온난화 현상으로 인한 기후변화로 이상기후 현상이 발생하고 있으며 이로 인해 장기적으로 폭염의 빈도 및 강도 상승에 따른 가뭄 피해 우려가 증가하고 있다. 농업 가뭄은 강수량 부족, 토양 수분 부족, 저수량 부족 등 농업분야에 영향을 주는 인자들과 관련되어 있어 농작물 생육 및 수확량 감소를 야기한다. 우리나라는 논농사가 주를 이루고 있어 국내 농업 가뭄은 주수원공인 농업용 저수지의 가용저수용량으로 판단 가능하다. 따라서 안정적인 농업용수 공급을 위해 수리시설물의 모니터링, 공급량 등의 분석이 이루어져야 하며, 농업 가뭄에 대비하기 위해 농업용 저수지의 가용저수용량 파악이 필요하다. 수자원 분야에서 지점자료의 시·공간적 한계점을 보완하기 위해 인공위성 자료를 활용한 연구가 활발히 이루어지고 있으며, 본 연구에서는 위성영상 자료 및 딥러닝 기반 알고리즘을 적용하여 농업용 저수지 수표면 탐지 및 시계열 분석을 목적으로 한다. 위성영상 자료는 5일 주기 및 10 m 공간해상도를 가진 Sentinel-2 위성영상 자료를 활용하고자 하였으며, 딥러닝에 적용하기 위하여 100장 이상의 영상 이미지를 구축하였다. 딥러닝 기반 알고리즘으로는 Convolutional Neural Network (CNN)을 활용하였으며, CNN은 주로 이미지 분류나 객체 검출 문제를 해결하기 위해 제안된 모델로 최근 픽셀 단위로 분류가 가능한 알고리즘이 개발되어 높은 정확도의 수표면 탐지가 가능할 것으로 판단된다. 따라서 본 연구에서는 CNN 기반 수표면 탐지 알고리즘을 개발하여 Sentinel-2 영상 기준 경기도 안성시를 대상으로 소규모 농업용 저수지의 수표면적에 대한 시계열 데이터를 분석하고자 한다.

  • PDF

이미지 인식 기반의 컵 오염 여부 측정 시스템의 설계 및 구현 (Design and Implementation of Dangerous of Image Recognition based Cup Contamination Measurement System)

  • 이태준;채희석;이상원;김재민;정회경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.213-215
    • /
    • 2022
  • 최근 이미지를 처리하는 딥러닝 기술이 화재 감지나 자율주행, 불량품 검출 등에서 다양하게 활용되고 있다. 특히, 제품이 오염되었는지 아닌지를 파악하기 위해 기존 센서 데이터에서 넘어온 오염물질을 통해 파악할 수 있지만, 제품의 균열이나 오염물질 자체를 이미지로 인식하는 기술도 다양한 분야에서 활발히 연구되고 있다. 본 논문에서는 오염되지 않은 정상적인 컵과 오염된 컵을 이미지를 통해 분류하는 시스템을 설계하고 이를 구현하였다. 이미지는 오픈 이미지와 촬영한 이미지를 사용하였고, 3D 객체 인식을 위한 Google Objectron을 활용해 컵 이미지의 상단 부분을 추출하여 이미지를 분석하였다. 본 연구를 통해 위생 분야에서 필요한 제품의 오염도를 이미지 기반으로 추출할 수 있는 연구에 다각도로 활용할 것으로 사료된다.

  • PDF

보행자 및 차량 검지를 위한 레이더 영상 융복합 시스템 연구 (A Study on Radar Video Fusion Systems for Pedestrian and Vehicle Detection)

  • 조성윤;윤여환
    • 한국인터넷방송통신학회논문지
    • /
    • 제24권1호
    • /
    • pp.197-205
    • /
    • 2024
  • 자율주행 자동차 개발 및 상용화에 있어서 주행안전도 확보가 가장 중요한 시점에서 이를 위해 전방 및 주행차량 주변에 존재하는 다양한 정적/동적 차량의 인식과 검출 성능을 고도화 및 최적화하기 위한 AI, 빅데이터 기반 알고리즘개발 등이 연구되고 있다. 하지만 레이더와 카메라의 고유한 장점을 활용하여 동일한 차량으로 인식하기 위한 연구 사례들이 많이 있지만, 딥러닝 영상 처리 기술을 이용하지 않거나, 레이더의 성능상의 문제로 짧은 거리만 동일한 표적으로 감지하고 있다. 따라서 레이더 장비와 카메라 장비에서 수집할 수 있는 데이터셋을 구성하고, 데이터셋의 오차를 계산하여 동일한 표적으로 인식하는 융합 기반 차량 인식 방법이 필요하다. 본 논문에서는 레이더와 CCTV(영상) 설치 위치에 따라 동일한 객체로 판단하기에 데이터 오차가 발생하기 때문에 설치한 위치에 따라 위치 정보를 연동할 수 있는 기술 개발을 목표로 한다.

MediaPipe를 활용한 춤동작 피드백 시각화 시스템 (Visualization System for Dance Movement Feedback using MediaPipe)

  • 김현서;정재영;최봉준;문미경
    • 한국전자통신학회논문지
    • /
    • 제19권1호
    • /
    • pp.217-224
    • /
    • 2024
  • K-POP의 가파른 성장세에 따라 댄스 콘텐츠 산업이 확산되는 추세이다. 최근 SNS의 보급이 증가하면서 자신의 댄스 영상을 촬영하고 공유하기도 한다. 그러나 춤을 처음 접하는 댄스 초보자들은 동영상을 보며 혼자서 춤을 출 때, 객관적인 피드백을 받기 어려워 춤동작을 습득하기 쉽지 않다. 본 논문에서는 MediaPipe를 활용하여 안무 영상과 사용자의 춤 영상을 비교하고 올바르게 동작을 따라 하고 있는지 검출해 주는 시스템에 대해 기술한다. 본 연구에서는 웹캠이나 카메라로 촬영한 사용자 영상과 안무 영상 간의 춤동작 유사도를 코사인 유사도와 COCO OKS를 활용해 계산하여 사용자에게 색상 지표(Color Map)를 기반으로 한 피드백을 주는 방식을 제안한다. 본 시스템을 통해 사용자의 춤동작에 대한 객관적인 피드백을 시각적으로 받을 수 있으며 초보자들도 정확한 춤동작을 습득할 수 있을 것으로 기대한다.

입 모양 인식 시스템 전처리를 위한 관심 영역 추출과 이중 선형 보간법 적용 (Region of Interest Extraction and Bilinear Interpolation Application for Preprocessing of Lipreading Systems)

  • 한재혁;김용기;김미혜
    • 정보처리학회 논문지
    • /
    • 제13권4호
    • /
    • pp.189-198
    • /
    • 2024
  • 입 모양 인식은 음성 인식의 중요 부분 중 하나로 음성 인식을 위한 입 모양 인식 시스템에서 입 모양 인식 성능을 개선하기 위한 여러 연구가 진행됐다. 최근의 연구에서는 인식 성능을 개선하기 위해 입 모양 인식 시스템의 모델 구조를 수정하는 방법이 사용됐다. 본 연구에서는 모델 구조를 수정하는 것으로 인식 성능을 개선하는 기존의 연구와 달리 모델 구조의 변화 없이 인식 성능을 개선하는 것을 목표로 한다. 모델 구조의 수정 없이 인식 성능을 개선하기 위해, 사람이 하는 입 모양 인식에서 사용되는 단서를 참고해 입 모양 인식 시스템의 기존 관심 영역인 입술 영역과 함께 턱, 뺨과 같은 다른 영역을 관심 영역으로 설정하고 각 관심 영역의 인식률을 비교해 가장 높은 성능의 관심 영역을 제안한다. 또한, 관심 영역 크기를 정규화하는 과정에서 보간법의 차이로 인해 발생하는 정규화 결과의 차이가 인식 성능에 영향을 준다고 가정하고 최근접 이웃 보간법, 이중 선형 보간법, 이중 삼차 보간법을 사용해 동일한 관심 영역을 보간하고 각 보간법에 따른 입 모양 인식률을 비교해 가장 높은 성능의 보간법을 제안한다. 각 관심 영역은 객체 탐지 인공신경망을 학습시켜 검출하고, 각 관심 영역을 정규화하고 특징을 추출하고 결합한 뒤, 결합된 특징들을 차원 축소한 결과를 저차원 공간으로 매핑하는 것으로 동적 정합 템플릿을 생성했다. 생성된 동적 정합 템플릿들과 저차원 공간으로 매핑된 데이터의 거리를 비교하는 것으로 인식률을 평가했다. 실험 결과 관심 영역의 비교에서는 입술 영역만을 포함하는 관심 영역의 결과가 이전 연구의 93.92%의 평균 인식률보다 3.44% 높은 97.36%의 평균 인식률을 보였으며, 보간법의 비교에서는 이중 선형 보간법이 97.36%로 최근접 이웃 보간법에 비해 14.65%, 이중 삼차 보간법에 비해 5.55% 높은 성능을 나타내었다. 본 연구에 사용된 코드는 https://github.com/haraisi2/Lipreading-Systems에서 확인할 수 있다.

윈도우 제어를 위한 시각적 비접촉 사용자 인터페이스 (Visual Touchless User Interface for Window Manipulation)

  • 김진우;정경부;정승도;최병욱
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권6호
    • /
    • pp.471-478
    • /
    • 2009
  • 최근 다양한 3차원 콘텐츠 및 응용 프로그램의 개발되고, 컴퓨터 사용자 계층이 다양화됨으로 인하여 인터페이스에 대한 연구가 활발히 진행되고 있다. 본 연구는 사용자가 손을 이용하여 윈도우를 효율적으로 제어할 수 있도록 하는 것을 목적으로 한다. 기존 인터페이스에 관한 연구들은 고가의 장비를 사용하거나 복잡한 제스처 인식, 또는 부가적인 도구인 마커 등을 사용하는 문제가 있다. 이러한 단점을 개선하기 위하여 새로운 시각적 비접촉 인터페이스를 제안한다. 손을 사용하여 윈도우를 제어하기 위하여 HSV 색상공간을 이용하여 손 영역을 검출한다. 그리고 거리변환 행렬과 손 외곽선의 곡률을 이용하여 손의 중심과 손가락의 위치를 파악한다. 손의 중심과 손가락 위치를 이용하여 본 논문에서 제안하는 7가지의 제어 동작 중 사용자가 의도하는 동작을 파악하여 인터페이스로써 활용한다. 제안하는 인터페이스는 스테레오 카메라를 사용함으로써 사유자가 3차원 공간에서 거리감을 가지고 제어할 수 있도록 하였다. 그리고 간단한 손동작으로 제어하고자 하는 객체를 시각적으로 접촉할 수 있도록 함으로써 직관적인 제어가 가능하도록 하였다. 마지막으로 제안하는 인터페이스를 활용한 응용을 통해서 효율성을 확인한다.

시각적 특징 맵을 이용한 자율 가상 캐릭터의 실시간 주목 시스템 (Realtime Attention System of Autonomous Virtual Character using Image Feature Map)

  • 차명희;김기협;조경은;엄기현
    • 한국멀티미디어학회논문지
    • /
    • 제12권5호
    • /
    • pp.745-756
    • /
    • 2009
  • 자율 가상 캐릭터는 인공시각을 이용하여 가상 환경을 인지하고 인지한 정보를 바탕으로 상황에 맞게 판단하여 지능적인 인간처럼 행동한다. 자율 가상 캐릭터는 주로 인공 시각을 이용하여 환경을 인식하며 현재까지 연구된 대부분의 인공 시각은 정해진 시야각에 들어온 정보를 여과 없이 모두 인지하는 방법을 사용하고 었다. 그러나 이러한 시각 체계는 한 번에 너무 많은 정보를 저장함으로 시스템의 효율성과 현실성을 떨어뜨리며, 게임과 같은 동적 환경에서는 실시간 처리가 어렵다. 따라서 실제 인간과 같은 시각 체계를 구현하려면 주목한 정보만 저장하는 시각적 주목 알고리즘이 필요하다. 본 논문에서는 인공 시각을 통해 얻은 정보 중에서 시각적으로 중요한 정보만올 저장하는 주목 시각 기법을 연구하고 이를 구현하기 위해 기존 주목 맵을 향상시켜 적용하였다. 특히 주목 맵 요소 중에서 처리 속도가 느린 방위 랩을 제거하고 침입자 검출을 적용한 동적 특정 맵을 추가하여 향상된 주목 맵을 제안하였다. 실험을 통해 자율 가상 캐릭터가 3차원 가상 환경에서 정적 동적 객체에 대한 주목 영역을 정확하게 찾는 것을 확인하였으며, 처리 속도 또한 기존 연구보다 1.6배 정도 향상되었음을 확인하였다.

  • PDF

RapidEye 위성영상을 이용한 작물재배지역 추정을 위한 FC-DenseNet의 활용성 평가 (Assessment of the FC-DenseNet for Crop Cultivation Area Extraction by Using RapidEye Satellite Imagery)

  • 성선경;나상일;최재완
    • 대한원격탐사학회지
    • /
    • 제36권5_1호
    • /
    • pp.823-833
    • /
    • 2020
  • 안정적인 작물 생산을 위하여 국내 농업지역에 대한 효과적인 작황 모니터링 기법의 요구가 증대되고 있다. 본 연구에서는 작물 재배지역 추출을 위하여 딥러닝 기법을 이용한 분류 모델을 개발하고, 이를 위성영상에 적용하고자 하였다. 이를 위하여, 식생분석에 유용한 blue, green, red, red-edge, NIR 밴드를 포함하고 있는 RapidEye 위성영상을 이용하여 작물 재배지역에 대한 훈련자료를 구축하고, 이를 활용하여 국내 양파 및 마늘 작물에 대한 재배면적을 추정하고자 하였다. 대기보정된 RapidEye 위성영상을 활용하여 훈련자료를 구축하였으며, 작물지역의 분류를 위하여 대표적인 의미론적 분할을 위한 딥러닝 모델인 FC-DenseNet을 이용하여 딥러닝 모델을 생성하였다. 최종적인 작물 재배지역은 지적도와의 결합을 통하여 객체 기반의 자료로 생성하였다. 실험결과, 대기보정된 훈련자료를 이용하여 학습된 FC-DenseNet 모델은 훈련에 사용되지 않은 타 지역의 작물 재배지역을 효과적으로 검출할 수 있음을 확인하였다.

항공사진을 이용한 3차원 도시 모형 생성 (Generation of 3-D City Model using Aerial Imagery)

  • 유복모;진경혁;유환희
    • 한국측량학회지
    • /
    • 제23권3호
    • /
    • pp.233-238
    • /
    • 2005
  • 각종 응용분야에서 3차원 도시 건물 모형에 대한 관심이 대두되면서 효율적인 3차원 도시 모형 생성에 대한 연구가 진행되고 있다. 3차원 도시 건물 모형을 생성하는 데는 항공사진, 위성영상 및 LIDAR 자료가 많이 이용되며, 대부분 건물의 고도 추출 및 건물 복원에 관한 기법 개발에 초점을 두고 있다. 항공사진, 위성영상 및 LIDAR 자료를 이용하여 3차원 도시 모형을 생성할 경우, 영상자료로부터 건물 객체를 자동으로 검출하는 것은 쉽지가 않으므로 자동 3차원 도시 모형 생성에는 많은 어려움이 있다. 최근에는 단일 자료만을 이용하지 않고 상호 융합을 하거나 혹은 관련 자료원과 통합하여 보다 효과적이고 정확한 3차원 도시 모형 생성에 관한 연구가 활발히 진행되고 있다. 항공사진과 수치지형도를 통합 활용할 경우, 수치지형도에서 건물의 수평 위치를 추출하고 이 정보를 이용하여 항공사진에서 개략적인 건물 위치를 확인함으로써 효과적인 3차원 건물 모형 생성이 가능하다. 본 연구에서는 수치지형도(1/1,000)와 항공사진(l/5,000)을 이용하여 효율적인 3차원 도시 모형 생성에 관한 연구를 수행하였다. 관심점 추출 기법과 영상정합 과정에서 탐색 범위를 제한하기 위한 수단인 수직선 궤적 이론을 이용함과 동시에 기존의 템플릿 기법과 달리 건물의 형태에 따른 가변 템플릿 정합 기법을 개발하였다. 정확도 검증을 위하여 연구 성과 수치도화시스템을 이용하여 생성한 3차원 도시 모형을 비교분석하였다.