• 제목/요약/키워드: image algorithm

검색결과 8,962건 처리시간 0.05초

영상 기반 Semantic Segmentation 알고리즘을 이용한 도로 추출 (Road Extraction from Images Using Semantic Segmentation Algorithm)

  • 오행열;전승배;김건;정명훈
    • 한국측량학회지
    • /
    • 제40권3호
    • /
    • pp.239-247
    • /
    • 2022
  • 현대에는 급속한 산업화와 인구 증가로 인해 도시들이 더욱 복잡해지고 있다. 특히 도심은 택지개발, 재건축, 철거 등으로 인해 빠르게 변화하는 지역에 해당한다. 따라서 자율주행에 필요한 정밀도로지도와 같은 다양한 목적을 위해 빠른 정보 갱신이 필요하다. 우리나라의 경우 기존 지도 제작 과정을 통해 지도를 제작하면 정확한 공간정보를 생성할 수 있으나 대상 지역이 넓은 경우 시간과 비용이 많이 든다는 한계가 있다. 지도 요소 중 하나인 도로는 인류 문명을 위한 많은 다양한 자원을 제공하는 중추이자 필수적인 수단에 해당한다. 따라서 도로 정보를 정확하고 신속하게 갱신하는 것이 중요하다. 이 목표를 달성하기 위해 본 연구는 Semantic Segmentation 알고리즘인 LinkNet, D-LinkNet 및 NL-LinkNet을 사용하여 광주광역시 도시철도 2호선 공사 현장을 촬영한 드론 정사영상에서 도로를 추출한 다음 성능이 가장 높은 모델에 하이퍼 파라미터 최적화를 적용하였다. 그 결과, 사전 훈련된 ResNet-34를 Encoder로 사용한 LinkNet 모델이 85.125 mIoU를 달성했다. 향후 연구 방향으로 최신 Semantic Segmentation 알고리즘 또는 준지도 학습 기반 Semantic Segmentation 기법을 사용하는 연구의 결과와의 비교 분석이 수행될 것이다. 본 연구의 결과는 기존 지도 갱신 프로세스의 속도를 개선하는 데 도움을 줄 수 있을 것으로 예상된다.

UNet기반 Sentinel-1 SAR영상을 이용한 수체탐지: 섬진강유역 대상으로 (Waterbody Detection Using UNet-based Sentinel-1 SAR Image: For the Seom-jin River Basin)

  • 이도이;박소련;서동주;김진수
    • 대한원격탐사학회지
    • /
    • 제38권5_3호
    • /
    • pp.901-912
    • /
    • 2022
  • 전 세계적인 기후변화로 재해발생빈도가 증가하고 있으며, 국내에서도 이례적인 폭우 및 장마현상이 발생되고 있다. 이러한 기상이변현상은 가뭄, 홍수 등으로 이어져 2차피해를 유발할 수 있으므로 주기적인 모니터링과 신속한 탐지가 중요하다. 수체탐지를 위하여 광학영상을 활용한 연구가 지속적으로 이루어지고 있으나, 폭우를 동반하여 발생하는 홍수를 탐지하기 위해서는 구름의 영향으로 탐지하기 어렵다는 한계를 대변하기 위해 전천후 주야에 관계없이 관측가능한 합성개구레이더(synthetic aperture radar, SAR)를 활용한 연구가 필요하다. 본 연구에서는 개방데이터로서 24시간 이내에 수집 가능한 Sentinel-1 SAR 영상을 활용하여 최근 다양한 분야에서 활용되고 있는 딥러닝 알고리즘인 UNet을 적용하였다. 선행연구에서 SAR영상과 딥러닝 알고리즘을 이용하여 수체탐지 연구가 진행되고 있지만, 국내를 대상으로 소수의 연구만이 진행되었다. 따라서 SAR 영상의 딥러닝 적용가능성을 파악해보고자 UNet과 기존의 알고리즘인 임계값(thresholding) 방법을 비교하였으며, 5가지 지수와 Sentinel-2 normalized difference water index (NDWI)로 평가하였다. Intersect of union (IoU)로 정확도를 평가해 본 결과 UNet은 0.894, 임계값 방법은 0.699로 UNet의 정확도가 높은 것을 확인할 수 있었다. 본 연구를 통해 딥러닝 기반 SAR영상의 적용가능성을 확인할 수 있었으며, 고해상도의 SAR영상과 딥러닝 알고리즘을 적용한다면, 국내를 대상으로 주기적이고 정확한 수체의 변화탐지가 가능할 것이라 기대된다.

이중에너지 CT와 같은 시뮬레이션을 이용한 유효원자번호 추출을 통한 췌장 검출 가능성 연구 (A Study on the Possibility of Pancreas Detection through Extraction of Effective Atomic Number using a Simulation such as Dual-energy CT)

  • 손기홍;이수열;정명애;김대홍
    • 한국방사선학회논문지
    • /
    • 제16권5호
    • /
    • pp.537-543
    • /
    • 2022
  • 본 연구의 목적은 이중에너지 CT를 이용한 유효원자번호 정보를 통한 췌장 검출 가능성 연구이다. 10개의 다양한 인체 등가 물질의 유효원자번호를 Stoichiometric calibration을 통해 추정하였다. Stoichiometric calibration을 위해 저에너지와 고에너지에 해당하는 10개 인체 등가 물질에 대한 HU값을 이용하였다. 이를 바탕으로 반복 알고리즘을 통해 인체 등가 물질에 대한 유효원자번호 영상을 추출하였다. 연구결과에 따르면, 유효원자번호에 따른 감약의 비는 R2값이 0.9999로 추정되었고, Pancreas, water, Liver, Blood, Spongiosa, Cortical bone의 유효원자번호는 이론값과 비교하여 전체적으로 1% 이내의 정확도를 보였다. 췌장암 검사는 조영제를 사용하므로 잠재적인 조영제 부작용 가능성이 있다. 이를 해결하기 위해 조영 증강 없는 이중에너지를 이용한 유효원자번호 추출을 통해 정확하고 안전한 검사에 기여할 수 있을 것으로 사료된다. 본 연구를 바탕으로 향후 연구에서는 임상 영상을 바탕으로 췌장암의 HU값을 이용하여 췌장암 검출에 대한 연구를 수행할 것이다.

움직임 인식응용을 위한 커널 밀도 추정 기반 학습용 데이터 증폭 기법 (Data Augmentation using a Kernel Density Estimation for Motion Recognition Applications)

  • 정우순;이형규
    • 한국산업정보학회논문지
    • /
    • 제27권4호
    • /
    • pp.19-27
    • /
    • 2022
  • 머신러닝(ML, Machine Learning)기반 응용에서의 인식성능은 적용된 모델의 종류와 크기, 학습환경 및 학습에 사용되는 데이터 등 다양한 요인에 따라 결정된다. 특히 학습에 사용되는 데이터가 충분치 않을 경우 인식성능이 저하되거나 과적합(Overfitting)등의 문제가 발생하기도 한다. 이미지 인식을 주요 대상으로 하는 기존 연구들은 학습을 위한 데이터셋이 풍부하고 검증된 데이터셋을 사용하여 학습 및 인식성능을 평가할 수 있다. 하지만 사용된 센서, 인식의 대상, 인식 상황이 다른 특정 응용들의 경우 데이터셋을 직접 구축해야 한다. 이런 경우, ML모델의 성능은 데이터의 양과 품질에 따라 달라진다. 본 논문에서는 이용 가능한 학습용 데이터가 충분치 않은 움직임 인식응용에 효율적으로 사용될 수 있는 비모수 추정 방식의 일종인 커널 밀도 추정 알고리즘을 사용하여 학습용 데이터를 증폭한 후, 사용된 커널의 종류에 따라, 원본 데이터의 수 및 증폭 비율에 따라 증폭된 데이터가 원본 데이터의 특징을 잘 반영하는지 인식 정확도 변화를 토대로 비교 분석한다. 실험결과, 본 연구에서 사용한 움직임 인식응용에서는 좁은 대역폭을 가진 Tophat 커널로 증폭된 데이터셋에서 최대 14.31%의 인식 정확도 향상을 확인하였다.

BIM 모델 활용을 위한 360° 카메라 이미지의 객체 탐지 알고리즘 정확성 비교 연구 (A Study on the Accuracy Comparison of Object Detection Algorithms for 360° Camera Images for BIM Model Utilization)

  • 주현철;이주형;임종원;이재희;강인석
    • 토지주택연구
    • /
    • 제14권3호
    • /
    • pp.145-155
    • /
    • 2023
  • 최근 건설산업 분야에 BIM 기술의 활용이 보편화되면서 3D 모델과 실제 시공 부위의 오류 확인 등을 위해 다양한 객체 탐지 알고리즘들이 활용되고 있다. 객체 탐지 기술은 건축물, 교량, 터널 등 건설시설물의 종류에 따라 객체 특성이 상이하므로 객체 탐지 기술도 적절한 방법을 사용할 필요가 있다. 또한 객체 탐지를 위해서는 초기 객체 이미지가 있어야 하며 이를 위해서도 드론, 스마트폰 등 다양한 방법으로 이미지 취득이 가능하다. 본 연구에서는 철도와 도로 시설의 터널 부위에 대하여 초기 이미지 구축을 위해 터널 내부 촬영에 최적화된 360° 카메라를 이용하여 이미지를 촬영하고, 촬영된 이미지로부터 실제 객체를 탐지하기 위한 객체 탐지 방법론으로 YOLO 알고리즘, SSD 알고리즘 및 R-CNN 알고리즘을 적용하여 방법론별 객체 탐지의 정확도를 비교 분석한다. 분석 결과 Faster R-CNN 알고리즘이 SSD, YOLO v5 알고리즘에 비해 높은 인식률 및 mAP 값을 가졌으며 인식률들의 최소·최대 값의 차이가 작아 균등한 검측 능력을 나타냈다. 이러한 연구는 철도와 도로 시설공사에 BIM 적용이 확산되고 있는 점을 고려하면 360° 카메라의 활용 방법 확대와 유지보수를 위한 터널 시설 부위의 객체 탐지 방법론 적용에 활용될 수 있다.

딥러닝 알고리즘을 이용한 강우 발생시의 유량 추정에 관한 연구 (A study on discharge estimation for the event using a deep learning algorithm)

  • 송철민
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.246-246
    • /
    • 2021
  • 본 연구는 강우 발생시 유량을 추정하는 것에 목적이 있다. 이를 위해 본 연구는 선행연구의 모형 개발방법론에서 벗어나 딥러닝 알고리즘 중 하나인 합성곱 신경망 (convolution neural network)과 수문학적 이미지 (hydrological image)를 이용하여 강우 발생시 유량을 추정하였다. 합성곱 신경망은 일반적으로 분류 문제 (classification)을 해결하기 위한 목적으로 개발되었기 때문에 불특정 연속변수인 유량을 모의하기에는 적합하지 않다. 이를 위해 본 연구에서는 합성곱 신경망의 완전 연결층 (Fully connected layer)를 개선하여 연속변수를 모의할 수 있도록 개선하였다. 대부분 합성곱 신경망은 RGB (red, green, blue) 사진 (photograph)을 이용하여 해당 사진이 나타내는 것을 예측하는 목적으로 사용하지만, 본 연구의 경우 일반 RGB 사진을 이용하여 유출량을 예측하는 것은 경험적 모형의 전제(독립변수와 종속변수의 관계)를 무너뜨리는 결과를 초래할 수 있다. 이를 위해 본 연구에서는 임의의 유역에 대해 2차원 공간에서 무차원의 수문학적 속성을 갖는 grid의 집합으로 정의되는 수문학적 이미지는 입력자료로 활용했다. 합성곱 신경망의 구조는 Convolution Layer와 Pulling Layer가 5회 반복하는 구조로 설정하고, 이후 Flatten Layer, 2개의 Dense Layer, 1개의 Batch Normalization Layer를 배열하고, 다시 1개의 Dense Layer가 이어지는 구조로 설계하였다. 마지막 Dense Layer의 활성화 함수는 분류모형에 이용되는 softmax 또는 sigmoid 함수를 대신하여 회귀모형에서 자주 사용되는 Linear 함수로 설정하였다. 이와 함께 각 층의 활성화 함수는 정규화 선형함수 (ReLu)를 이용하였으며, 모형의 학습 평가 및 검정을 판단하기 위해 MSE 및 MAE를 사용했다. 또한, 모형평가는 NSE와 RMSE를 이용하였다. 그 결과, 모형의 학습 평가에 대한 MSE는 11.629.8 m3/s에서 118.6 m3/s로, MAE는 25.4 m3/s에서 4.7 m3/s로 감소하였으며, 모형의 검정에 대한 MSE는 1,997.9 m3/s에서 527.9 m3/s로, MAE는 21.5 m3/s에서 9.4 m3/s로 감소한 것으로 나타났다. 또한, 모형평가를 위한 NSE는 0.7, RMSE는 27.0 m3/s로 나타나, 본 연구의 모형은 양호(moderate)한 것으로 판단하였다. 이에, 본 연구를 통해 제시된 방법론에 기반을 두어 CNN 모형 구조의 확장과 수문학적 이미지의 개선 또는 새로운 이미지 개발 등을 추진할 경우 모형의 예측 성능이 향상될 수 있는 여지가 있으며, 원격탐사 분야나, 위성 영상을 이용한 전 지구적 또는 광역 단위의 실시간 유량 모의 분야 등으로의 응용이 가능할 것으로 기대된다.

  • PDF

Faster R-CNN을 이용한 갓길 차로 위반 차량 검출 (Detecting Vehicles That Are Illegally Driving on Road Shoulders Using Faster R-CNN)

  • 고명진;박민주;여지호
    • 한국ITS학회 논문지
    • /
    • 제21권1호
    • /
    • pp.105-122
    • /
    • 2022
  • 최근 5년간 고속도로에서 발생한 사망 사고의 통계를 살펴보면, 고속도로 전체 사망자 중 갓길에서 발생한 사망자의 사망률이 약 3배 높은 것으로 나타났다. 이는 갓길 사고 발생 시 사고의 심각도가 매우 높다는 것을 보여주며, 갓길 차로 위반 차량을 단속하여 사고를 미연에 방지하는 것이 중요하다는 것을 시시한다. 이에 본 연구는 Faster R-CNN 기법을 활용하여 갓길 차로 위반 차량을 검출할 수 있는 방법을 제안하였다. Faster R-CNN 기법을 기반으로 차량을 탐지하고, 추가적인 판독 모듈을 구성하여 갓길 위반 여부를 판단하였다. 실험 및 평가를 위해 현실세계와 유사하게 상황을 재현할 수 있는 시뮬레이션 게임인 GTAV를 활용하였다. 이미지 형태의 학습데이터 1,800장과 평가데이터 800장을 가공 및 생성하였으며, ZFNet과 VGG16에서 Threshold 값의 변화에 따른 성능을 측정하였다. 그 결과 Threshold 0.8 기준 ZFNet 99.2%, Threshold 0.7 기준 VGG16 93.9%의 검출율을 보였고, 모델 별 평균 검출 속도는 ZFNet 0.0468초, VGG16 0.16초를 기록하여 ZFNet의 검출율이 약 7% 정도 높았으며, 검출 속도 또한 약 3.4배 빠름을 확인하였다. 이는 비교적 복잡하지 않은 네트워크에서도 입력 영상의 전처리 없이 빠른 속도로 갓길 차로 위반 차량의 검출이 가능함을 보여주며, 실제 영상자료 기반의 학습데이터셋을 충분히 확보한다면 지정 차로 위반 검출에 본 알고리즘을 활용할 수 있다는 것을 시사한다.

카메라-라이다 융합 모델의 오류 유발을 위한 스케일링 공격 방법 (Scaling Attack Method for Misalignment Error of Camera-LiDAR Calibration Model)

  • 임이지;최대선
    • 정보보호학회논문지
    • /
    • 제33권6호
    • /
    • pp.1099-1110
    • /
    • 2023
  • 자율주행 및 robot navigation의 인식 시스템은 성능 향상을 위해 다중 센서를 융합(Multi-Sensor Fusion)을 한 후, 객체 인식 및 추적, 차선 감지 등의 비전 작업을 한다. 현재 카메라와 라이다 센서의 융합을 기반으로 한 딥러닝 모델에 대한 연구가 활발히 이루어지고 있다. 그러나 딥러닝 모델은 입력 데이터의 변조를 통한 적대적 공격에 취약하다. 기존의 다중 센서 기반 자율주행 인식 시스템에 대한 공격은 객체 인식 모델의 신뢰 점수를 낮춰 장애물 오검출을 유도하는 데에 초점이 맞춰져 있다. 그러나 타겟 모델에만 공격이 가능하다는 한계가 있다. 센서 융합단계에 대한 공격의 경우 융합 이후의 비전 작업에 대한 오류를 연쇄적으로 유발할 수 있으며, 이러한 위험성에 대한 고려가 필요하다. 또한 시각적으로 판단하기 어려운 라이다의 포인트 클라우드 데이터에 대한 공격을 진행하여 공격 여부를 판단하기 어렵도록 한다. 본 연구에서는 이미지 스케일링 기반 카메라-라이다 융합 모델(camera-LiDAR calibration model)인 LCCNet 의 정확도를 저하시키는 공격 방법을 제안한다. 제안 방법은 입력 라이다의 포인트에 스케일링 공격을 하고자 한다. 스케일링 알고리즘과 크기별 공격 성능 실험을 진행한 결과 평균 77% 이상의 융합 오류를 유발하였다.

인공지능 기반 콩 생장분석 방법 연구 (A Study on the Artificial Intelligence-Based Soybean Growth Analysis Method)

  • 전문석;김영태;정유석;배효준;이채원;김송림;최인찬
    • 한국산업정보학회논문지
    • /
    • 제28권5호
    • /
    • pp.1-14
    • /
    • 2023
  • 콩은 세계 5대 식량작물 중 하나로 식물성 단백질의 주요 공급원이다. 작물 특성상 기후변화에 따라 곡물 생산량에 큰 영향을 받기 때문에 국립농업과학원에서는 콩 품종별 생장 분석을 통해 작물표현형 연구를 진행중이다. 콩 품종별 생장 분석을 위한 생장 과정 사진 촬영은 자동화된 시스템으로 이루어지지만 생장 상태를 확인, 기록, 분석하는 과정은 수작업으로 진행되고 있다. 본 논문에서는 이러한 과정을 자동화 할 수 있도록 콩 작물의 영상 데이터에서 콩잎 객체를 검출하는 YOLOv5s 모델과 검출된 콩잎의 전개 여부를 판단하는 합성곱 신경망(Convolution Neural Network; CNN) 모델을 설계, 학습하였다. 두 모델을 결합하고 검출된 콩잎의 좌표데이터로 층을 구분하는 알고리즘을 구현하여 콩 작물의 시계열 데이터를 입력하여 생장을 분석하는 프로그램을 개발하였고, 그 결과 콩 작물의 제2~3복엽까지 생장 시기를 판단할 수 있었다.

Automatic Detection of Type II Solar Radio Burst by Using 1-D Convolution Neutral Network

  • Kyung-Suk Cho;Junyoung Kim;Rok-Soon Kim;Eunsu Park;Yuki Kubo;Kazumasa Iwai
    • 천문학회지
    • /
    • 제56권2호
    • /
    • pp.213-224
    • /
    • 2023
  • Type II solar radio bursts show frequency drifts from high to low over time. They have been known as a signature of coronal shock associated with Coronal Mass Ejections (CMEs) and/or flares, which cause an abrupt change in the space environment near the Earth (space weather). Therefore, early detection of type II bursts is important for forecasting of space weather. In this study, we develop a deep-learning (DL) model for the automatic detection of type II bursts. For this purpose, we adopted a 1-D Convolution Neutral Network (CNN) as it is well-suited for processing spatiotemporal information within the applied data set. We utilized a total of 286 radio burst spectrum images obtained by Hiraiso Radio Spectrograph (HiRAS) from 1991 and 2012, along with 231 spectrum images without the bursts from 2009 to 2015, to recognizes type II bursts. The burst types were labeled manually according to their spectra features in an answer table. Subsequently, we applied the 1-D CNN technique to the spectrum images using two filter windows with different size along time axis. To develop the DL model, we randomly selected 412 spectrum images (80%) for training and validation. The train history shows that both train and validation losses drop rapidly, while train and validation accuracies increased within approximately 100 epoches. For evaluation of the model's performance, we used 105 test images (20%) and employed a contingence table. It is found that false alarm ratio (FAR) and critical success index (CSI) were 0.14 and 0.83, respectively. Furthermore, we confirmed above result by adopting five-fold cross-validation method, in which we re-sampled five groups randomly. The estimated mean FAR and CSI of the five groups were 0.05 and 0.87, respectively. For experimental purposes, we applied our proposed model to 85 HiRAS type II radio bursts listed in the NGDC catalogue from 2009 to 2016 and 184 quiet (no bursts) spectrum images before and after the type II bursts. As a result, our model successfully detected 79 events (93%) of type II events. This results demonstrates, for the first time, that the 1-D CNN algorithm is useful for detecting type II bursts.