• 제목/요약/키워드: learning through the image

검색결과 925건 처리시간 0.029초

임베디드 기기를 위한 딥러닝 점자블록 인식 방법 (Deep Learning Braille Block Recognition Method for Embedded Devices)

  • 김희진;윤재혁;권순각
    • 한국산업정보학회논문지
    • /
    • 제28권4호
    • /
    • pp.1-9
    • /
    • 2023
  • 본 논문은 딥러닝을 통해 실시간으로 임베디드 기기에서 점자 블록을 인식하는 방법을 제안한다. 먼저 고성능 컴퓨터에서 점자 블록 인식을 위한 딥러닝 모델을 학습시키고, 임베디드 기기에 적용하기 위하여 학습 모델을 경량화 도구에 적용한다. 점자 블록의 보행 정보를 인식하기 위해 영상에서 점자블록과의 거리를 이용하여 경로를 판별하는 알고리즘을 사용한다. 임베디드 기기를 통해 촬영한 영상에서 YOLOv8 모델을 통해 점자 블록, 볼라드, 횡단보도를 검출한 후 점자블록 경로 판별 알고리즘을 거쳐 보행정보를 인식한다. 실시간으로 점자 블록을 검출하기 위해 모델 경량화 도구를 YOLOv8에 적용한다. YOLOv8 모델 가중치의 정밀도를 기존 32비트에서 8비트로 낮추고, TensorRT 최적화 엔진을 적용하여 모델의 최적화를 진행한다. 제안된 방법을 통해 경량화 된 모델을 기존 모델과 비교한 결과, 경로 인식 정확도는 99.05%로 기존 모델과 거의 차이가 없지만, 인식 속도는 기존 모델 대비 59% 단축되어 1초에 약 15개의 프레임을 처리할 수 있다.

적대적 생성 신경망과 딥러닝을 이용한 교량 상판의 균열 감지 (Crack Detection on Bridge Deck Using Generative Adversarial Networks and Deep Learning)

  • 지봉준
    • 한국건설순환자원학회논문집
    • /
    • 제9권3호
    • /
    • pp.303-310
    • /
    • 2021
  • 교량의 균열은 교량의 상태를 나타내는 중요한 요소이며 주기적인 모니터링 대상이다. 그러나 전문가가 육안으로 점검하는 것은 비용, 시간, 신뢰성 면에서 문제가 있다. 따라서 최근에는 이러한 문제를 극복하기 위해 자동화 가능한 딥러닝 모델을 적용하기 위한 연구가 시작되었다. 딥러닝 모델은 예측할 상황에 대한 충분한 데이터가 필요하지만 교량 균열 데이터는 상대적으로 얻기가 어렵다. 특히 교량의 설계, 위치, 공법에 따라 교량 균열의 형상이 달라질 수 있어 특정 상황에서 많은 양의 균열 데이터를 수집하기 어려움이 따른다. 본 연구에서는 적대적 생성 신경망(Generative Adversarial Network, GAN)을 통해 불충분한 균열 데이터를 생성하고 학습하는 균열 탐지 모델을 개발했다. 본 연구에서는 GAN을 이용하여 주어진 균열 데이터와 통계적으로 유사한 데이터를 성공적으로 생성했으며, 생성된 이미지를 사용하지 않을 때보다 생성된 이미지를 사용할 때 약 3% 더 높은 정확도로 균열 감지가 가능했다. 이러한 접근 방식은 교량의 균열 검출이 필요하지만 균열 데이터는 충분하지 않거나 하나의 클래스에 대한 데이터가 상대적으로 적을 때 감지 모델의 성능을 효과적으로 향상시킬 것으로 기대된다.

GAN 기반 의료영상 생성 모델에 대한 품질 및 다양성 평가 및 분석 (Assessment and Analysis of Fidelity and Diversity for GAN-based Medical Image Generative Model)

  • 장유진;유재준;홍헬렌
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제28권2호
    • /
    • pp.11-19
    • /
    • 2022
  • 최근 의료영상의 발전에 따라 의료 영상 생성에 대한 다양한 연구가 제안되고 있는데, 이와 관련하여 생성된 의료 영상의 품질과 다양성을 정확하게 평가하는 것이 중요해지고 있다. 생성된 의료 영상을 평가하는 방법으로는 전문가의 시각적 튜링 테스트(visual turing test), 특징 분포 시각화, IS, FID를 통한 정량적 평가를 통해 평가하고 있으나 의료 영상을 품질(fidelity)과 다양성(diversity) 측면에서 정량적으로 평가 하는 방법은 거의 이루어지고 있지 않다. 본 논문에서는 DCGAN과 PGGAN 생성 모델을 통해 비소세포폐암 환자의 흉부 CT 데이터 셋을 학습하여 영상을 생성하고, 이를 품질(fidelity)과 다양성(diversity) 측면에서 두 생성 모델의 성능을 평가한다. 1차원 점수 기반 평가방법인 IS, FID와 2차원 점수 기반 평가방법인 Precision 및 Recall, 개선된 Precision 및 Recall을 통해 성능을 정량적으로 평가하고, 의료영상에서의 각 평가방법들의 특징과 한계점에 대해서도 분석한다.

딥뉴럴네트워크 기반의 흡연 탐지기법 설계 (Design of detection method for smoking based on Deep Neural Network)

  • 이상현;윤현수;권현
    • 융합보안논문지
    • /
    • 제21권1호
    • /
    • pp.191-200
    • /
    • 2021
  • 컴퓨팅 기술의 발전과 데이터를 저장할 수 있는 클라우드 환경, 그리고 스마트폰의 보급으로 인하여 많은 데이터가 생산되는 환경에서 인공지능 기술이 발전되고 있다. 이러한 인공지능 기술 중에서 딥뉴럴네트워크는 이미지 인식, 이미지 분류 등에서 탁월한 성능을 제공하고 있다. 기존에는 이러한 딥뉴럴네트워크를 이용하여 산불 및 화재 예방을 위한 이미지 탐지에 대해 많은 연구가 있었지만 흡연 탐지에 대한 연구는 미흡한 실정이었다. 한편 군 부대에서는 각종 시설에 대한 감시체계를 CCTV를 통해 구축하고 있는데 화재, 폭발사고 예방을 위해 탄약고 주변에서의 흡연이나 금연구역에서의 흡연을 CCTV로 탐지하는 것이 필요한 상황이다. 본 논문에서는 딥뉴럴네트워크를 이용하여 흡연 여부를 탐지하는 방법에 대한 성능 분석을 하였으며 활성화함수, 학습률 등 실험적으로 최적화된 수치를 반영하여 흡연사진과 비흡연사진을 두 가지 경우로 탐지하는 것을 하였다. 실험 데이터로는 인터넷 상에 공개되어 있는 흡연 및 비흡연 사진을 크롤링하여 데이터를 구축하였으며, 실험은 머신러닝 라이브러리를 이용하였다. 실험결과로 학습률 0.004로 최적화 알고리즘 Adam을 사용하였을 때, 93%의 accuracy와 92%의 F1-score를 갖는 것을 볼 수 있었다. 또한 이로써 이미지의 연속인 CCTV 영상도 딥뉴럴네트워크를 이용하여 흡연 여부를 탐지할 수 있음을 알 수 있었다.

딥러닝을 이용한 소도체 영상의 등급 분석 및 단계별 평가 (Grade Analysis and Two-Stage Evaluation of Beef Carcass Image Using Deep Learning)

  • 김경남;김선종
    • 문화기술의 융합
    • /
    • 제8권2호
    • /
    • pp.385-391
    • /
    • 2022
  • 소도체의 품질평가는 축산업 분야의 중요한 문제이다. 최근 인공지능을 기반으로 한 AI 모니터 시스템을 통해 품질 관리사는 소도체 영상의 분석이나 결과 정보를 기반으로 정확한 판단에 도움을 받을 수 있다. 이러한 인공지능의 데이터셋은 성능을 판단하는 중요한 요소이다. 기존의 데이터셋은 표면의 방향이나 해상도가 달라질 수 있다. 본 논문에서는 딥러닝을 이용한 소도축 영상의 등급을 효율적으로 관리할 수 있는 단계별 분류 모델을 제안하였다. 그리고 기존의 세그멘테이션 추출된 영상의 데이터셋의 다양한 조건의 일관성을 위해 새로운 데이터셋 1,300장을 구성하였다. 새로운 데이셋을 이용한 5등급 분류에 대한 딥러닝의 인식률은 72.5%를 얻었다. 제안된 단계별 분류는 1++, 1+, 1등급과 2, 3등급의 차이가 크다는 것을 이용한 방안이다. 이로 인해 제안된 2단계 모델의 두 가지 방법에 따른 실험 결과, 73.7%, 77.2%의 인식률을 얻을 수 있었다. 이처럼 1단계 인식률을 100%를 갖는 데이터셋을 가진다면 더욱 효율적인 방법이 될 것이다.

딥러닝 기반의 초분광영상 분류를 사용한 환경공간정보시스템 활용 (Deep Learning-based Hyperspectral Image Classification with Application to Environmental Geographic Information Systems)

  • 송아람;김용일
    • 대한원격탐사학회지
    • /
    • 제33권6_2호
    • /
    • pp.1061-1073
    • /
    • 2017
  • 본 연구는 4차 산업의 핵심기술인 인공지능과 환경공간정보의 융합을 통한 정보생산 및 활용가능성을 제시하고자 대표적인 딥러닝(deep-learning) 기법인 CNN(Convolutional Neural Network)을 이용한 영상분류를 수행하였다. CNN은 학습을 통해 스스로 분류기준에 따른 커널의 속성을 결정하며, 최적의 특징영상(feature map)을 추출하여 화소를 분류한다. 본 연구에서는 CNN network를 구성하여 기존의 영상처리 기법으로 해결이 어려웠던 분광특성이 유사한 물질간의 분류 및 GIS속성정보에 따른 분류를 수행하였으며, 항공초분광센서인 CASI(Compact Airborne Spectrographic imager)와 AISA(Airborne Imaging Spectrometer for Application)로 취득된 영상을 이용하였다. 실험대상지역은 총 3곳이며, Site 1과 Site 2는 감자, 양파, 벼 등의 다양한 농작물을 포함하며, Site 3는 단독주거시설, 공동주거시설 등 세분류 토지피복도의 분류 항목으로 구성된 건물을 포함한다. 실험결과, 분류 정확도 96%, 99%로 농작물을 종류에 따라분류하였으며, 96%의 정확도로 건물을 용도에 따라 분류하였다. 본 연구의 결과를 환경공간정보 서비스에 활용하기 위하여 계절별 농작물의 종류를 제공할 수 있는 환경주제도를 제안하였으며, 기존의 토지피복도와 최신 GIS자료를 이용한 세분류 토피지복도 제작 및 갱신 가능성을 확인하였다.

3차원 얼굴 인식을 위한 PSO와 다중 포인트 특징 추출을 이용한 RBFNNs 패턴분류기 설계 (Design of RBFNNs Pattern Classifier Realized with the Aid of PSO and Multiple Point Signature for 3D Face Recognition)

  • 오성권;오승훈
    • 전기학회논문지
    • /
    • 제63권6호
    • /
    • pp.797-803
    • /
    • 2014
  • In this paper, 3D face recognition system is designed by using polynomial based on RBFNNs. In case of 2D face recognition, the recognition performance reduced by the external environmental factors such as illumination and facial pose. In order to compensate for these shortcomings of 2D face recognition, 3D face recognition. In the preprocessing part, according to the change of each position angle the obtained 3D face image shapes are changed into front image shapes through pose compensation. the depth data of face image shape by using Multiple Point Signature is extracted. Overall face depth information is obtained by using two or more reference points. The direct use of the extracted data an high-dimensional data leads to the deterioration of learning speed as well as recognition performance. We exploit principle component analysis(PCA) algorithm to conduct the dimension reduction of high-dimensional data. Parameter optimization is carried out with the aid of PSO for effective training and recognition. The proposed pattern classifier is experimented with and evaluated by using dataset obtained in IC & CI Lab.

비디오 영상에서 2차원 자세 추정과 LSTM 기반의 행동 패턴 예측 알고리즘 (Behavior Pattern Prediction Algorithm Based on 2D Pose Estimation and LSTM from Videos)

  • 최지호;황규태;이상준
    • 대한임베디드공학회논문지
    • /
    • 제17권4호
    • /
    • pp.191-197
    • /
    • 2022
  • This study proposes an image-based Pose Intention Network (PIN) algorithm for rehabilitation via patients' intentions. The purpose of the PIN algorithm is for enabling an active rehabilitation exercise, which is implemented by estimating the patient's motion and classifying the intention. Existing rehabilitation involves the inconvenience of attaching a sensor directly to the patient's skin. In addition, the rehabilitation device moves the patient, which is a passive rehabilitation method. Our algorithm consists of two steps. First, we estimate the user's joint position through the OpenPose algorithm, which is efficient in estimating 2D human pose in an image. Second, an intention classifier is constructed for classifying the motions into three categories, and a sequence of images including joint information is used as input. The intention network also learns correlations between joints and changes in joints over a short period of time, which can be easily used to determine the intention of the motion. To implement the proposed algorithm and conduct real-world experiments, we collected our own dataset, which is composed of videos of three classes. The network is trained using short segment clips of the video. Experimental results demonstrate that the proposed algorithm is effective for classifying intentions based on a short video clip.

합성곱 신경망을 이용한 정사사진 기반 균열 탐지 기법 (Crack Detection Technology Based on Ortho-image Using Convolutional Neural Network)

  • 장아름;정상기;박진한;강창훈;주영규
    • 한국공간구조학회논문집
    • /
    • 제22권2호
    • /
    • pp.19-27
    • /
    • 2022
  • Visual inspection methods have limitations, such as reflecting the subjective opinions of workers. Moreover, additional equipment is required when inspecting the high-rise buildings because the height is limited during the inspection. Various methods have been studied to detect concrete cracks due to the disadvantage of existing visual inspection. In this study, a crack detection technology was proposed, and the technology was objectively and accurately through AI. In this study, an efficient method was proposed that automatically detects concrete cracks by using a Convolutional Neural Network(CNN) with the Orthomosaic image, modeled with the help of UAV. The concrete cracks were predicted by three different CNN models: AlexNet, ResNet50, and ResNeXt. The models were verified by accuracy, recall, and F1 Score. The ResNeXt model had the high performance among the three models. Also, this study confirmed the reliability of the model designed by applying it to the experiment.

디지털 마이크로 미러 시스템에서의 손끝 인식 알고리즘 (Finger Tip Recognition Algorithm in Digital Micromirror System)

  • 최종호
    • 한국정보전자통신기술학회논문지
    • /
    • 제9권2호
    • /
    • pp.223-228
    • /
    • 2016
  • 미래 스마트 러닝을 목표로 디지털 마이크로 미러 시스템(DMS : Digital Micromirror System)이 제안되어 있다. 다양한 인터페이스를 제공하기 위해 소형 프로젝터에 CMOS 센서 모듈을 내장한 시스템이다. DMS에서의 인터페이스 제공의 기본은 프로젝터에서 투사된 영상에서 손끝을 인식하는 것이다. 그러나 프로젝트 환경에서 각종 객체의 인식률은 영상열화 요인으로 인해 매우 낮다. 따라서 본 논문에서는 프로젝트 환경에서 영상열화 요인의 영향을 최소화한 Retinex 변환과 IR 구조광을 이용한 손끝 인식 알고리즘을 제안하였다. 제안한 알고리즘의 유용성을 실험을 통해 검증한 결과, 손끝을 효율적으로 인식할 수 있음을 확인하였다. DMS에 적용할 경우 사용자 인터페이스가 강화될 수 있을 것으로 판단된다.