• 제목/요약/키워드: R-CNN

검색결과 251건 처리시간 0.033초

딥러닝 기반의 주행가능 영역 추출 모델에 관한 연구 (A Study on Model for Drivable Area Segmentation based on Deep Learning)

  • 전효진;조수선
    • 인터넷정보학회논문지
    • /
    • 제20권5호
    • /
    • pp.105-111
    • /
    • 2019
  • 인공지능, 빅데이터, 자율주행 등 4차 산업혁명시대를 이끄는 핵심기술은 컴퓨팅 파워의 급속한 발전과 사물인터넷에 기반한 초연결 네트워크를 통해 구현되고 서비스된다. 본 논문에서는 자율주행을 위한 기본적인 기능으로 다양한 환경에서도 정확하게 주행가능한 영역을 인식하여 추출하는 인공지능 딥러닝 모델들을 구현하고, 그 결과를 비교, 분석한다. 주행가능한 영역을 추출하는 딥러닝 모델은 영상 분할 분야에서 성능이 우수하고 자율주행 연구에서 많이 사용하는 Deep Lab V3+와 Mask R-CNN을 활용하였다. 다양한 환경에서의 주행 정보를 위해 여러 가지 날씨 조건과 주 야간 환경에서의 주행 영상 및 이미지를 제공하는 BDD 데이터셋을 학습데이터로 사용하였다. 활용한 모델들의 실험 결과, DeepLab V3+는 48.97%의 IoU를 보였으며, Mask R-CNN은 68.33%의 IoU로 더 우수한 성능을 보였다. 또한, 구현한 모델로 추출된 주행가능 영역을 이미지에 표시하여 육안으로 검사한 결과, Mask R-CNN은 83%, Deep Lab V3+는 69% 정확도로 Mask R-CNN이 Deep Lab V3+ 보다 주행가능한 영역을 추출하는 분야에서는 더 성능이 높은 것으로 확인하였다.

Faster R-CNN 기반의 관심영역 유사도를 이용한 후방 접근차량 검출 연구 (Rear-Approaching Vehicle Detection Research using Region of Interesting based on Faster R-CNN)

  • 이영학;김중수;심재창
    • 전기전자학회논문지
    • /
    • 제23권1호
    • /
    • pp.235-241
    • /
    • 2019
  • 본 논문에서는 농업 기계 시스템에서 사용하기 위한 딥러닝 알고리즘 기반의 프레임 내의 관심 영역 유사성을 이용한 새로운 후방 접근 차량 검출 알고리즘을 제안한다. 농업 기계 시스템은 후방에서 접근하는 차량만 검출해야 한다. 지나가는 자동차가 검출되면 혼란을 야기할 수 있다. 논문에서는 차량 검출을 위해 딥러닝에서 뛰어난 검출률을 나타내는 Faster R-CNN 모델을 사용하였다. 딥러닝은 뒤에서 접근하는 차량뿐만 아니라 지나가는 차량도 검출하므로 긍정오류 차량을 배제해야 한다. 본 논문에서 이를 해결하기 위해 검출된 프레임에서 관심 영역에 대한 유사성과 평균 에러를 피라미드 형태로 이용하여 접근하는 자동차만 검출하는 알고리즘을 제안하였다. 실험을 통하여 제안된 방법이 평균 98.8%의 높은 검출률을 나타내었다.

Faster R-CNN을 활용한 GPR 영상에서의 지하배관 위치추적 성능분석 (Performance Analysis of Detecting buried pipelines in GPR images using Faster R-CNN)

  • 고형용;김남기
    • 융합정보논문지
    • /
    • 제9권5호
    • /
    • pp.21-26
    • /
    • 2019
  • 도심지에는 상 하수관로, 가스관, 수소관 등 필요에 따라 여러 가지 배관이 매설된다. 매설된 배관은 시간이 경과됨에 따라 균열 등으로 노후화되면서 폭발, 누수 등의 사고 발생 위험을 가지게 된다. 이러한 위험을 방지하기 위해 많은 노후 배관 수리, 교체되지만, 배관의 위치 또한 변경될 수 있다. 변경된 배관의 위치를 확인하지 못하면 배관을 건드려서 사고가 발생할 수 있다. 본 논문에서는 GPR을 사용하여 지하 단면 영상을 얻고, Faster R-CNN을 활용하여 지하 배관의 위치를 추정해보고, augmentation을 적용하여 부족한 데이터를 늘려서 실험을 진행하였다.

ESRGAN과 Semantic Soft Segmentation을 이용한 객체 분할 (Object Segmentation Using ESRGAN and Semantic Soft Segmentation)

  • 윤동식;곽노윤
    • 사물인터넷융복합논문지
    • /
    • 제9권1호
    • /
    • pp.97-104
    • /
    • 2023
  • 본 논문은 ESRGAN(Enhanced Super Resolution GAN)과 SSS(Semantic Soft Segmentation)을 이용한 객체 분할에 관한 것이다. 본 논문의 연구진이 앞서 제안한 Mask R-CNN과 SSS를 이용한 객체 분할 방법의 분할 성능은 전반적으로 양호하지만 객체의 크기가 상대적으로 작은 경우 분할 성능이 저조해지는 문제점이 있었다. 본 논문은 이러한 문제점을 해소하기 위한 것이다. 제안된 방법은 Mask R-CNN을 통해 검출된 객체의 크기가 일정 기준치 이하인 경우, ESRGAN을 통해 초해상화를 수행한 후, SSS을 수행함으로써 소형 객체의 분할 성능을 개선하고자 한다. 제안된 방법에 따르면, 기존의 방법에 비해 크기가 작은 객체의 분할 특성을 좀 더 효과적으로 개선할 수 있음을 확인할 수 있었다.

압축센싱이 Mask R-CNN 기반의 객체검출에 미치는 영향 분석 (Analysis of the Effect of Compressed Sensing on Mask R-CNN Based Object Detection)

  • 문한솔;권혜민;이창교;서정욱
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.97-99
    • /
    • 2022
  • 산업과 기술력이 발전하면서 이에 대한 데이터의 양도 증폭하고 있으며 해당 기술력과 정보 전달에 대한 연구가 활발히 진행되고 있다. 따라서 본 논문에서는 데이터의 양을 줄이기 위해서 압축센싱을 활용하였고 해당 데이터가 객체 검출 알고리즘인 Mask R-CNN 모델에 미치는 영향을 분석하였다. 압축률이 높아질수록 이미지의 데이터 양이 줄어들면서 해상도가 낮아지는 것을 확인할 수 있었지만 객체 검출에서는 원본과 큰 차이를 보이지 않고 대부분의 객체가 검출되는 것을 확인하였다.

  • PDF

R-CNN에 기반한 블랙 스크린의 위치 추정 (Position Estimation of Black Screen Using R-CNN)

  • 김성진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.387-389
    • /
    • 2022
  • 블랙 스크린은 비디오 월 컨트롤러의 멀티스크린에 정상적인 영상이 아닌 블랙 스크린이 표출되는 현상이다. 비디오 월 컨트롤러에서 블랙 스크린이 발생하는 빈도는 높지 않지만, 운용 중에 발생하게 되면 모니터링 업무를 수행할 수 없게 되므로 치명적인 오류라고 할 수 있다. 따라서 블랙 스크린을 감지하기 위한 시스템이 개발되고 있지만, 거짓 양성의 비율이 높고 블랙 스크린이 발생한 위치를 추정하지 못하는 단점이 있다. 이에 본 논문에서는 R-CNN을 이용하여 감지 성능을 향상시키고 블랙 스크린이 발생한 위치를 추정하는 모델을 제안한다.

Recognition of Car Manufacturers using Faster R-CNN and Perspective Transformation

  • Ansari, Israfil;Lee, Yeunghak;Jeong, Yunju;Shim, Jaechang
    • 한국멀티미디어학회논문지
    • /
    • 제21권8호
    • /
    • pp.888-896
    • /
    • 2018
  • In this paper, we report detection and recognition of vehicle logo from images captured from street CCTV. Image data includes both the front and rear view of the vehicles. The proposed method is a two-step process which combines image preprocessing and faster region-based convolutional neural network (R-CNN) for logo recognition. Without preprocessing, faster R-CNN accuracy is high only if the image quality is good. The proposed system is focusing on street CCTV camera where image quality is different from a front facing camera. Using perspective transformation the top view images are transformed into front view images. In this system, the detection and accuracy are much higher as compared to the existing algorithm. As a result of the experiment, on day data the detection and recognition rate is improved by 2% and night data, detection rate improved by 14%.

Runoff Prediction from Machine Learning Models Coupled with Empirical Mode Decomposition: A case Study of the Grand River Basin in Canada

  • Parisouj, Peiman;Jun, Changhyun;Nezhad, Somayeh Moghimi;Narimani, Roya
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.136-136
    • /
    • 2022
  • This study investigates the possibility of coupling empirical mode decomposition (EMD) for runoff prediction from machine learning (ML) models. Here, support vector regression (SVR) and convolutional neural network (CNN) were considered for ML algorithms. Precipitation (P), minimum temperature (Tmin), maximum temperature (Tmax) and their intrinsic mode functions (IMF) values were used for input variables at a monthly scale from Jan. 1973 to Dec. 2020 in the Grand river basin, Canada. The support vector machine-recursive feature elimination (SVM-RFE) technique was applied for finding the best combination of predictors among input variables. The results show that the proposed method outperformed the individual performance of SVR and CNN during the training and testing periods in the study area. According to the correlation coefficient (R), the EMD-SVR model outperformed the EMD-CNN model in both training and testing even though the CNN indicated a better performance than the SVR before using IMF values. The EMD-SVR model showed higher improvement in R value (38.7%) than that from the EMD-CNN model (7.1%). It should be noted that the coupled models of EMD-SVR and EMD-CNN represented much higher accuracy in runoff prediction with respect to the considered evaluation indicators, including root mean square error (RMSE) and R values.

  • PDF

Classification of Objects using CNN-Based Vision and Lidar Fusion in Autonomous Vehicle Environment

  • G.komali ;A.Sri Nagesh
    • International Journal of Computer Science & Network Security
    • /
    • 제23권11호
    • /
    • pp.67-72
    • /
    • 2023
  • In the past decade, Autonomous Vehicle Systems (AVS) have advanced at an exponential rate, particularly due to improvements in artificial intelligence, which have had a significant impact on social as well as road safety and the future of transportation systems. The fusion of light detection and ranging (LiDAR) and camera data in real-time is known to be a crucial process in many applications, such as in autonomous driving, industrial automation and robotics. Especially in the case of autonomous vehicles, the efficient fusion of data from these two types of sensors is important to enabling the depth of objects as well as the classification of objects at short and long distances. This paper presents classification of objects using CNN based vision and Light Detection and Ranging (LIDAR) fusion in autonomous vehicles in the environment. This method is based on convolutional neural network (CNN) and image up sampling theory. By creating a point cloud of LIDAR data up sampling and converting into pixel-level depth information, depth information is connected with Red Green Blue data and fed into a deep CNN. The proposed method can obtain informative feature representation for object classification in autonomous vehicle environment using the integrated vision and LIDAR data. This method is adopted to guarantee both object classification accuracy and minimal loss. Experimental results show the effectiveness and efficiency of presented approach for objects classification.

DeepLabCut과 Mask R-CNN 기반 반려동물 행동 분류 설계 (Design of Pet Behavior Classification Method Based On DeepLabCut and Mask R-CNN)

  • 권주영;신민찬;문남미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.927-929
    • /
    • 2021
  • 최근 펫팸족(Pet-Family)과 같이 반려동물을 가족처럼 생각하는 가구가 증가하면서 반려동물 시장이 크게 성장하고 있다. 이러한 이유로 본 논문에서는 반려동물의 객체 식별을 통한 객체 분할과 신체 좌표추정에 기반을 둔 반려동물의 행동 분류 방법을 제안한다. 이 방법은 CCTV를 통해 반려동물 영상 데이터를 수집한다. 수집된 영상 데이터는 반려동물의 인스턴스 분할을 위해 Mask R-CNN(Region Convolutional Neural Networks) 모델을 적용하고, DeepLabCut 모델을 통해 추정된 신체 좌푯값을 도출한다. 이 결과로 도출된 영상 데이터와 추정된 신체 좌표 값은 CNN(Convolutional Neural Networks)-LSTM(Long Short-Term Memory) 모델을 적용하여 행동을 분류한다. 본 모델을 바탕으로 행동을 분석 및 분류하여, 반려동물의 위험 상황과 돌발 행동에 대한 올바른 대처를 제공할 수 있는 기반을 제공할 것이라 기대한다.