• 제목/요약/키워드: multi-object detection

검색결과 236건 처리시간 0.025초

PCA 기반 변환을 통한 다해상도 피처 맵 압축 방법 (A Feature Map Compression Method for Multi-resolution Feature Map with PCA-based Transformation)

  • 박승진;이민훈;최한솔;김민섭;오승준;김연희;도지훈;정세윤;심동규
    • 방송공학회논문지
    • /
    • 제27권1호
    • /
    • pp.56-68
    • /
    • 2022
  • 본 논문에서는 VCM을 위한 다해상도 피처 맵에 대한 압축 방법을 제안한다. 제안하는 압축 방법은 PCA 기반의 변환을 통해 다해상도 피처 맵의 채널 및 해상도 계층 간 중복성을 제거하며 변환에 사용된 기저 벡터와 평균 벡터 그리고 변환을 통해 얻어진 변환 계수를 각각의 특성에 따라 VVC 기반 부호화기와 DeepCABAC을 통하여 압축한다. 제안하는 방법의 성능을 측정하기 위하여 OpenImageV6와 COCO 2017 validation set에 대하여 객체 검출 성능을 평가하며, MPEG-VCM 앵커 및 본 논문에서 제안하는 피처 맵 압축 앵커 대비 bpp와 mAP를 BD-rate 관점에서 비교한다. 실험 결과, 제안하는 방법은 OpenImageV6에서 피처 맵 압축 앵커 대비 25.71%의 BD-rate 성능 향상을 보이며, 특히 COCO 2017 validation set의 크기가 큰 객체들에 대해서 MPEG-VCM 앵커 대비 최대 43.72%의 BD-rate 성능이 향상됨을 보인다.

압축영역에서 움직임 벡터의 재추정을 이용한 비디오 해석 기법 (Video analysis using re-constructing of motion vectors on MPEG compressed domain)

  • 김낙우;김태용;강응관;최종수
    • 대한전자공학회논문지SP
    • /
    • 제39권3호
    • /
    • pp.78-87
    • /
    • 2002
  • 본 논문은 MPEG 비디오에서 나타나는 여러 예측 형태의 움직임 벡터를 프레임 타입에 관계없이 단일 예측방향만을 갖도록 새롭게 추정하여 비디오 영상물의 분석에 직접적으로 활용하는 방안에 대해 제시하고 있다. 또한 재추정된 각 프레임에서의 움직임 벡터를 이용한 비디오 시퀀스 내에서의 객체 추출 및 추적 기법 등에 대해서도 새롭게 제안하였다. 제안된 알고리즘은 압축 영상에 대한 전체적인 복원과정을 거치지 않고, 압축 비디오 영역으로부터 쉽게 추출될 수 있는 매크로 블록 영역 상에서 수행되었으며, 실험 결과는 제안된 방법의 높은 성능을 잘 나타내어 주고 있다.

딥러닝 및 증강현실을 이용한 재난대응 역량 강화를 위한 네트워크 자원 확보 방안 (Deployment of Network Resources for Enhancement of Disaster Response Capabilities with Deep Learning and Augmented Reality)

  • 신영환;윤주식;서순호;정종문
    • 인터넷정보학회논문지
    • /
    • 제18권5호
    • /
    • pp.69-77
    • /
    • 2017
  • 본 논문에서는 재난상황에서 딥러닝과 증강현실 기술을 활용한 재난대응 방안과 그에 따른 네트워크 자원 확보 방안을 제안한다. 딥러닝과 증강현실 기술의 특징과 현황을 파악하고, 재난분야와의 연관성에 관하여 설명한다. 딥러닝 기술을 사용하여 재난 상황을 정확하게 인지하고 관련 재난 정보를 증강현실로 구현하여 재난대응 현장 및 통합지원본부, 재난안전대책본부 등에 제공함으로써 재난대응 역량을 강화할 수 있다. 각종 재난사례 중 화재상황을 중점으로, 딥러닝 기반 화재상황 인식 및 증강현실 정보제공을 통해 효과적으로 재난대응 역량을 강화할 수 있는 방안을 제시한다. 마지막으로, 본 논문의 재난대응 방안을 활용하기 위한 네트워크 자원 확보 기법을 제시한다.

Yolov5를 적용한 교통단속 통합 시스템 설계 (Development of Integrated Traffic Control System)

  • 양영준;장성진;장종욱
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.239-241
    • /
    • 2022
  • 현재 대한민국에서는 교통 혼잡을 해결하기 위해 다인승 전용차로 (HOV, High Occupancy Vehicle Lanes)와 지정차로제를 시행하고 있다. 현행의 교통단속 시스템은 단속 지역 구역에 인원이 필수로 배정되며 무인 단속에 어려움이 있다. 또한, 고정식 교통단속시스템은 속도 위반 단속은 가능하나 운전자가 네이게이션을 통해 단속을 회피할 수 있다. 이러한 문제점을 해결하기 위해 딥러닝 객체 인식 모델인 YOLO를 통한 교통 통합 단속 시스템이 필요하다. 본 연구에서는 멀티스레딩 기술 기반의 병렬처리 차량번호 인식 기술을 적용하여 불시 단속이 가능한 이동식 교통 통합 관리시스템을 제안한다. Yolo5를 이용한 차선 인식, 차량탑승인원 판별, 차량 번호 인식 등의 알고리즘을 통합 모델을 설계하고 이를 적용한 통합시스템을 제시하였다.

  • PDF

Training Dataset Generation through Generative AI for Multi-Modal Safety Monitoring in Construction

  • Insoo Jeong;Junghoon Kim;Seungmo Lim;Jeongbin Hwang;Seokho Chi
    • 국제학술발표논문집
    • /
    • The 10th International Conference on Construction Engineering and Project Management
    • /
    • pp.455-462
    • /
    • 2024
  • In the construction industry, known for its dynamic and hazardous environments, there exists a crucial demand for effective safety incident prevention. Traditional approaches to monitoring on-site safety, despite their importance, suffer from being laborious and heavily reliant on subjective, paper-based reports, which results in inefficiencies and fragmented data. Additionally, the incorporation of computer vision technologies for automated safety monitoring encounters a significant obstacle due to the lack of suitable training datasets. This challenge is due to the rare availability of safety accident images or videos and concerns over security and privacy violations. Consequently, this paper explores an innovative method to address the shortage of safety-related datasets in the construction sector by employing generative artificial intelligence (AI), specifically focusing on the Stable Diffusion model. Utilizing real-world construction accident scenarios, this method aims to generate photorealistic images to enrich training datasets for safety surveillance applications using computer vision. By systematically generating accident prompts, employing static prompts in empirical experiments, and compiling datasets with Stable Diffusion, this research bypasses the constraints of conventional data collection techniques in construction safety. The diversity and realism of the produced images hold considerable promise for tasks such as object detection and action recognition, thus improving safety measures. This study proposes future avenues for broadening scenario coverage, refining the prompt generation process, and merging artificial datasets with machine learning models for superior safety monitoring.

자동 과일 수확을 위한 드론 탑재형 과일 인식 알고리즘 및 수확 메커니즘 (Drone-mounted fruit recognition algorithm and harvesting mechanism for automatic fruit harvesting)

  • 주기영;황보현;이상민;김병규;백중환
    • 항공우주시스템공학회지
    • /
    • 제16권1호
    • /
    • pp.49-55
    • /
    • 2022
  • 최근 드론의 역할은 농업∙건설∙물류등의 다양한 영역으로 확대되고 있으며 특히 농업인구가 고령화되는 현 상황에 따라 드론은 노동력 부족 문제를 해결할 효과적인 대안으로 떠오르고 있다. 이에 본 논문에서는 농업 현장에서의 부족한 노동력을 보완하고 높은 위치의 과일도 안전하게 수확할 수 있는 드론 탑재형 과일수확 시스템을 제안한다. 과일수확 시스템은 과일인식 알고리즘과 과일수확 메커니즘으로 구성되어 있다. 과일인식 알고리즘은 딥러닝 기반의 객체탐지 알고리즘인 You Only Look Once를 사용하였고, 가상 시뮬레이션 환경을 구축하여 가능성을 검증하였다. 또한, 하나의 모터로 구동이 가능한 과일수확 메커니즘을 제안하였다. 모터의 회전운동을 기반으로 Scotch yoke을 구동시켜 선형운동으로 변환하여 gripper가 전개된 상태에서 과실에 접근 후 과실을 잡고 돌려 수확하는 메커니즘이다. 제안된 메커니즘에 대한 다물체동역학 해석을 수행하여 구동 가능성을 검증하였다.

2019 강릉-동해 산불 피해 지역에 대한 PlanetScope 영상을 이용한 지형 정규화 기법 분석 (Analysis on Topographic Normalization Methods for 2019 Gangneung-East Sea Wildfire Area Using PlanetScope Imagery)

  • 정민경;김용일
    • 대한원격탐사학회지
    • /
    • 제36권2_1호
    • /
    • pp.179-197
    • /
    • 2020
  • 지형 정규화 기법은 영상 촬영 시의 광원, 센서 및 지표면 특성에 따라 발생하는 밝기값 상의 지형적인 영향을 제거하는 방법으로, 지형 조건으로 인해 동일 피복의 픽셀들이 서로 다른 밝기값을 지닐 때 그 차이를 감소시킴으로써 평면 상의 밝기값과 같아 보이도록 보정한다. 이러한 지형적인 영향은 일반적으로 산악 지형에서 크게 나타나며, 이에 따라 산불 피해 지역 추정과 같은 산악 지형에 대한 영상 활용에서는 지형 정규화 기법이 필수적으로 고려되어야 한다. 그러나 대부분의 선행연구에서는 중저해상도의 위성영상에 대한 지형 보정 성능 및 분류 정확도 영향 분석을 수행함으로써, 고해상도 다시기 영상을 이용한 지형 정규화 기법 분석은 충분히 다루어지지 않았다. 이에 본 연구에서는 PlanetScope 영상을 이용하여 신속하고 정확한 국내 산불 피해 지역 탐지를 위한 각 밴드별 최적의 지형 정규화 기법 평가 및 선별을 수행하였다. PlanetScope 영상은 3 m 공간 해상도의 전세계 일일 위성영상을 제공한다는 점에서 신속한 영상 수급 및 영상 처리가 요구되는 재난 피해 평가 분야에 높은 활용 가능성을 지닌다. 지형 정규화 기법 비교를 위해 보편적으로 이용되고 있는 7가지 기법을 구현하였으며, 토지 피복 구성이 상이한 산불 전후 영상에 모두 적용, 분석함으로써 종합적인 피해 평가에 활용될 수 있는 밴드 별 최적 기법 조합을 제안하였다. 제안된 방법을 통해 계산된 식생 지수를 이용하여 화재 피해 지역 변화 탐지를 수행하였으며, 객체 기반 및 픽셀 기반 방법 모두에서 향상된 탐지 정확도를 나타내었다. 또한, 화재 피해 심각도(burn severity) 매핑을 통해 지형 정규화 기법이 연속적인 밝기값 분포에 미치는 효과를 확인하였다.

항공 LiDAR 데이터를 이용한 건물추출과 상부구조물 특성분석 및 모델링 (Utilizing Airborne LiDAR Data for Building Extraction and Superstructure Analysis for Modeling)

  • 정형섭;임새봄;이동천
    • 한국측량학회지
    • /
    • 제26권3호
    • /
    • pp.227-239
    • /
    • 2008
  • 항공 레이저 스캐닝(ALS) 시스템으로부터 획득한 LiDAR 데이터를 미용하여 3차원 객체 모델링과 지형도 제작을 위해서는 데이터의 기하학적 및 의미적인 분할과 같은 체계적인 데이터 처리가 선행되어야 한다. ALS로 부터 활용 가능한 LiDAR 데이터를 획득하기 위해서는 GPS, INS 및 레이저 스캐너 데이터의 통합이 필수적이다. 본 연구에서는 건물추출과 지붕 구조물 분할을 위해서 LiDAR 데이터를 영상화하여 디지털 영상처리 기법을 적용하였다. 영상화된 데이터를 사용하는 주요 장점 중 하나는 기존의 다양한 영상처리 알고리즘을 사용할 수 있다는 점이다. 격자화 및 정량화를 거치는 영상화 과정에서 원시 LiDAR 데이터가 한정된 밝기값으로 변환되므로 평활화 및 상세 정보의 손실이 발생될 수 있지만. 평활화된 데이터는 표면분할과 모델링에 오히려 적합하다. 건물의 경계선은 윤곽선 추출 연산자를 이용하여 정확하게 추출하였으며, 건물 모양에 적합하도록 규격화하였다. 건물 지붕의 구조물의 분할은 영역확산을 기반으로 수행하였다. 이 결과 다양한 디지털 영상처리 기법을 복합적으로 적용하여 건물추출과 지붕 구조물의 면분할이 가능함을 보여주었다. 또한 지붕의 형태를 재현하기 위한 특성정보 추출에 관한 개념적 방법을 제안하였다. 지붕 데이터를 분할하고 모델링을 위해 통계적 및 기하적 특성을 이용하였으며. 제안한 방법에 의한 시뮬레이션 결과는 지붕면을 분할하고 모델링하는데 가능함을 보여주고 있다.

공공 다중CCTV 기반에서 재식별 기술을 활용한 특정대상 탐지 및 추적기법 구현 (Implementation of Specific Target Detection and Tracking Technique using Re-identification Technology based on public Multi-CCTV)

  • 황주성;뉴엔탄하이;강수경;김영규;김주용;정명석;이주연
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권4호
    • /
    • pp.49-57
    • /
    • 2022
  • 정부에서는 전국에 설치된 공공 CCTV를 이용하여 실종아동 등 범죄 예방을 위하여 많은 노력을 하고 있다. 하지만, 운용인력의 부족과 장시간 집중에 따른 집중력 약화 그리고 추적의 어려움 등이 나타나고 있다. 또한, 딥러닝 알고리즘을 통하여 실시간 객체 탐색 및 재인식 그리고 추적을 적용하는 것은 복잡한 신경망 분석의 사유로 파라미터가 증가하고 속도감소 메모리 부족이라는 현상을 나타냈다. 본 논문에서는 실시간 객체 인식이 가능한 Yolo의 적용과 Batch 및 TensorRT 기술 적용을 통하여 신경망을 경량화를 통하여 속도 개선 및 메모리 절약이 가능하도록 설계하였다. 이 논문에서는 이러한 발전된 알고리즘의 연구를 바탕으로 K-reciprocal nearest neighbor 알고리즘, Jaccard distance 비유사도 측정 알고리즘, 산출물 알고리즘 등을 개발하여 공공 CCTV 식별추적시스템 구축을 제시하였다. 그 결과, 비교분석을 통한 알고리즘 조합을 통해 공공 다중CCTV환경에서 실시간으로 객체를 인식하고 재식별하여 객체를 추적할 수 있는 한국형 공공 추적시스템을 제안하였다.

Hybrid CNN-LSTM 알고리즘을 활용한 도시철도 내 피플 카운팅 연구 (A Study on People Counting in Public Metro Service using Hybrid CNN-LSTM Algorithm)

  • 최지혜;김민승;이찬호;최정환;이정희;성태응
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.131-145
    • /
    • 2020
  • 산업혁신의 흐름에 발맞추어 다양한 분야에서 활용되고 있는 IoT 기술은 빅데이터의 접목을 통한 새로운 비즈니스 모델의 창출 및 사용자 친화적 서비스 제공의 핵심적인 요소로 부각되고 있다. 사물인터넷이 적용된 디바이스에서 누적된 데이터는 사용자 환경 및 패턴 분석을 통해 맞춤형 지능 시스템을 제공해줄 수 있어 편의 기반 스마트 시스템 구축에 다방면으로 활용되고 있다. 최근에는 이를 공공영역 혁신에 확대 적용하여 CCTV를 활용한 교통 범죄 문제 해결 등 스마트시티, 스마트 교통 등에 활용하고 있다. 그러나 이미지 데이터를 활용하는 기존 연구에서는 개인에 대한 사생활 침해 문제 및 비(非)일반적 상황에서 객체 감지 성능이 저하되는 한계가 있다. 본 연구에 활용된 IoT 디바이스 기반의 센서 데이터는 개인에 대한 식별이 불필요해 사생활 이슈로부터 자유로운 데이터로, 불특정 다수를 위한 지능형 공공서비스 구축에 효과적으로 활용될 수 있다. 대다수의 국민들이 일상적으로 활용하는 도시철도에서의 지능형 보행자 트래킹 시스템에 IoT 기반의 적외선 센서 디바이스를 활용하고자 하였으며 센서로부터 측정된 온도 데이터를 실시간 송출하고, CNN-LSTM(Convolutional Neural Network-Long Short Term Memory) 알고리즘을 활용하여 구간 내 보행 인원의 수를 예측하고자 하였다. 실험 결과 MLP(Multi-Layer Perceptron) 및 LSTM(Long Short-Term Memory), RNN-LSTM(Recurrent Neural Network-Long Short Term Memory)에 비해 제안한 CNN-LSTM 하이브리드 모형이 가장 우수한 예측성능을 보임을 확인하였다. 본 논문에서 제안한 디바이스 및 모델을 활용하여 그간 개인정보와 관련된 법적 문제로 인해 서비스 제공이 미흡했던 대중교통 내 실시간 모니터링 및 혼잡도 기반의 위기상황 대응 서비스 등 종합적 메트로 서비스를 제공할 수 있을 것으로 기대된다.