• Title/Summary/Keyword: learning through the image

검색결과 931건 처리시간 0.03초

동영상 안정화를 위한 옵티컬 플로우의 비지도 학습 방법 (Deep Video Stabilization via Optical Flow in Unstable Scenes)

  • 이보희;김광수
    • 지능정보연구
    • /
    • 제29권2호
    • /
    • pp.115-127
    • /
    • 2023
  • 동영상 안정화 기술은 최근 1인 미디어 시장이 거대화됨에 따라 그 중요성이 점점 커지고 있는 카메라 기술 중 하나이다. 딥러닝 기반의 기존 방법들에서는 안정화 전/후 동영상 데이터 쌍을 사용하였으나 동영상의 특성상 동기화된 안정화 전/후 데이터를 만드는 것은 많은 시간과 노력이 필요하다. 최근 이러한 문제를 완화하기 위하여 안정화 전 데이터만을 사용하는 비지도 학습 방법이 제시되고 있다. 본 논문에서는 비지도 학습 방법의 하나인 Convolutional Autoencoder 구조를 사용하여 안정화 전/후 동영상 데이터 쌍 없이 안정화 전 영상만으로 안정화 궤적을 학습하는 네트워크 구조를 제안한다. 네트워크 입력 및 출력으로 옵티컬 플로우를 사용하고 네트워크 경량화 및 노이즈 최소화를 위해 옵티컬 플로우를 Grid 단위로 맵핑하여 사용했다. 또한 비지도 학습 방법으로 안정화된 궤적을 생성하기 위해 옵티컬 플로우를 부드럽게 만드는 손실함수를 정의하였고 결과 비교를 통해 손실함수의 의도대로 부드러운 궤적을 생성하도록 네트워크가 학습되었음을 확인했다.

재실자 활동량 산출을 위한 딥러닝 기반 선행연구 동향 (Research Trends for the Deep Learning-based Metabolic Rate Calculation)

  • 박보랑;최은지;이효은;김태원;문진우
    • KIEAE Journal
    • /
    • 제17권5호
    • /
    • pp.95-100
    • /
    • 2017
  • Purpose: The purpose of this study is to investigate the prior art based on deep learning to objectively calculate the metabolic rate which is the subjective factor for the PMV optimum control and to make a plan for future research based on this study. Methods: For this purpose, the theoretical and technical review and applicability analysis were conducted through various documents and data both in domestic and foreign. Results: As a result of the prior art research, the machine learning model of artificial neural network and deep learning has been used in various fields such as speech recognition, scene recognition, and image restoration. As a representative case, OpenCV Background Subtraction is a technique to separate backgrounds from objects or people. PASCAL VOC and ILSVRC are surveyed as representative technologies that can recognize people, objects, and backgrounds. Based on the results of previous researches on deep learning based on metabolic rate for occupational metabolic rate, it was found out that basic technology applicable to occupational metabolic rate calculation technology to be developed in future researches. It is considered that the study on the development of the activity quantity calculation model with high accuracy will be done.

머신러닝 기술의 광업 분야 도입을 위한 활용사례 분석 (Case Analysis for Introduction of Machine Learning Technology to the Mining Industry)

  • 이채영;김성민;최요순
    • 터널과지하공간
    • /
    • 제29권1호
    • /
    • pp.1-11
    • /
    • 2019
  • 본 연구에서는 국내 의료, 제조, 금융, 자동차, 도시 분야와 해외 광업 분야에서 머신러닝 기술이 활용된 사례를 조사하였다. 문헌 조사를 통해 머신러닝 기술이 의학영상 정보시스템 개발, 실시간 모니터링 및 이상 진단 시스템 개발, 정보시스템의 보안 수준 개선, 자율주행차 개발, 도시 통합관리 시스템 개발 등에 광범위하게 활용되어왔음을 알 수 있었다. 현재까지 국내 광업 분야에서는 머신러닝 기술의 활용사례를 찾을 수 없었으나, 해외에서는 광상 탐사나 광산 개발의 생산성 및 안전성을 개선을 위해 머신러닝 기술을 도입한 프로젝트들을 찾을 수 있었다. 향후 머신러닝 기술의 광업 분야 도입은 점차 확산될 것으로 예상된다.

학습률 적용에 따른 흉부영상 폐렴 유무 분류 비교평가 (Comparative Evaluation of Chest Image Pneumonia based on Learning Rate Application)

  • 김지율;예수영
    • 한국방사선학회논문지
    • /
    • 제16권5호
    • /
    • pp.595-602
    • /
    • 2022
  • 본 연구는 딥러닝을 이용한 흉부 X선 폐렴 영상에 대하여 정확하고 효율적인 의료영상의 자동진단을 위해서 가장 효율적인 학습률을 제시하고자 하였다. Inception V3 딥러닝 모델에 학습률을 0.1, 0.01, 0.001, 0.0001로 각각 설정한 후 3회 딥러닝 모델링을 수행하였다. 그리고 검증 모델링의 평균 정확도 및 손실 함수 값, Test 모델링의 Metric을 성능평가 지표로 설정하여 딥러닝 모델링의 수행 결과로 획득한 결과값의 3회 평균값으로 성능을 비교 평가하였다. 딥러닝 검증 모델링 성능평가 및 Test 모델링 Metric에 대한 성능평가의 결과, 학습률 0.001을 적용한 모델링이 가장 높은 정확도와 우수한 성능을 나타내었다. 이러한 이유로 본 논문에서는 딥러닝 모델을 이용한 흉부 X선 영상에 대한 폐렴 유무 분류 시 학습률을 0.001로 적용할 것을 권고한다. 그리고 본 논문에서 제시하는 학습률의 적용을 통한 딥러닝 모델링 시 흉부 X선 영상에 대한 폐렴 유무 분류에 대한 인력의 보조적인 역할을 수행할 수 있을 거라고 판단하였다. 향후 딥러닝을 이용한 폐렴 유무 진단 분류 연구가 계속해서 진행될 시, 본 논문의 논문 연구 내용은 기초자료로 활용될 수 있다고 여겨지며 나아가 인공지능을 활용한 의료영상 분류에 있어 효율적인 학습률 선택에 도움이 될 것으로 기대된다.

CNN-LSTM 기반의 자율주행 기술 (CNN-LSTM based Autonomous Driving Technology)

  • 박가은;황치운;임세령;장한승
    • 한국전자통신학회논문지
    • /
    • 제18권6호
    • /
    • pp.1259-1268
    • /
    • 2023
  • 본 연구는 딥러닝의 합성곱과 순환신경망 네트워크를 기반으로 시각센서를 이용해 속도(Throttle)와 조향(Steering) 제어 기술을 제안한다. 학습 트랙을 시계, 반시계 방향으로 주행하며 카메라 영상 이미지와 조종 값 데이터를 수집하고 효율적인 학습을 위해 데이터 샘플링, 전처리 과정을 거쳐 Throttle과 Steering을 예측하는 모델을 생성한다. 이후 학습에 사용되지 않은 다른 환경의 테스트 트랙을 통해 검증을 진행하여 최적의 모델을 찾고 이를 CNN(Convolutional Neural Network)과 비교하였다. 그 결과 제안하는 딥러닝 모델의 성능이 뛰어남을 확인했다.

딥러닝을 활용한 전시 정원 디자인 유사성 인지 모형 연구 (Development of Deep Recognition of Similarity in Show Garden Design Based on Deep Learning)

  • 조우윤;권진욱
    • 한국조경학회지
    • /
    • 제52권2호
    • /
    • pp.96-109
    • /
    • 2024
  • 본 연구는 딥러닝 모델 중 VGG-16 및 ResNet50 모델을 활용하여 전시 정원의 유사성 평가 방법을 제시하는 것에 목적이 있다. VGG-16과 ResNet50 모델을 기반으로 전시 정원 유사성 판단을 위한 모형을 개발하였고, 이를 DRG(deep recognition of similarity in show garden design)모형이라 한다. 평가를 위한 방법으로 GAP와 피어슨 상관계수를 활용한 알고리즘을 사용하여 모형을 구축하고 1순위(Top1), 3순위(Top3), 5순위(Top5)에서 원본 이미지와 유사한 이미지를 도출하는 총 개수 비교로 유사성의 정확도를 분석하였다. DRG 모형에 활용된 이미지 데이터는 국외 쇼몽가든페스티벌 전시 정원 총 278개 작품과 국내 정원박람회인 서울정원박람회 27개 작품 및 코리아가든쇼 전시정원 이미지 17개 작품이다. DRG모형을 활용하여 동일 집단과 타 집단간의 이미지 분석을 진행하였고, 이를 기반으로 전시 정원 유사성의 가이드라인을 제시하였다. 첫째, 전체 이미지 유사성 분석은 ResNet50 모델을 기반으로 하여 데이터 증강 기법을 적용하는 것이 유사성 도출에 적합하였다. 둘째, 내부 구조와 외곽형태에 중점을 둔 이미지 분석에서는 형태에 집중하기 위한 일정한 크기의 필터(16cm × 16cm)를 적용하여 이미지를 생성하고 VGG-16 모델을 적용하여 유사성을 비교하는 방법이 효과적임을 알 수 있었다. 이때, 이미지 크기는 448 × 448 픽셀이 효과적이며, 유채색의 원본 이미지를 기본으로 설정함을 제안하였다. 이러한 연구 결과를 토대로 전시 정원 유사성 판단에 대한 정량적 방법을 제안하고, 향후 다양한 분야와의 융합 연구를 통해 정원 문화의 지속적인 발전에 기여할 것으로 기대한다.

시각장애인을 위한 딥러닝기반 심볼인식 (Deep learning based symbol recognition for the visually impaired)

  • 박상헌;전태재;김상혁;이상윤;김주완
    • 한국정보전자통신기술학회논문지
    • /
    • 제9권3호
    • /
    • pp.249-256
    • /
    • 2016
  • 최근 시각장애인 및 교통약자의 자유로운 보행을 보장하기 위한 많은 기술들이 연구되고 있다. 자유로운 보행을 위한 장치로는 영상카메라, 초음파센서 및 가속도 센서 등을 이용하는 스마트 지팡이와 스마트 안경 관련 기술이 있다. 대표적인 기술로는 물체를 식별하여 장애물을 검출하고 보행 가능 영역을 추출하는 기술, 랜드마크 심볼 정보를 인식하여 주위 환경 정보를 주는 기술 등 여러 가지 기술이 개발되고 있다. 본 논문에서는 시각장애인에게 필요한 시설의 대표 심볼을 선정하여 착용한 영상 장치의 정보로부터 심볼을 인식하는 알고리즘을 딥러닝 기술을 이용하여 연구하였다. 그 결과로 딥러닝 영상처리 분야에서 사용되는 CNN(Convolutional Neural Network)기법을 사용하여 서로 다른 딥러닝 구조를 실험을 통하여 비교하고 분석하였다.

구조형상 공간상관을 고려한 인공지능 기반 변위 추정 (Estimation of Displacements Using Artificial Intelligence Considering Spatial Correlation of Structural Shape)

  • 신승훈;김지영;우종열;김대건;진태석
    • 한국전산구조공학회논문집
    • /
    • 제36권1호
    • /
    • pp.1-7
    • /
    • 2023
  • 본 논문에서는 구조물의 부분 변위값으로 전체 구조물의 변위 형상을 예측할 수 있는 인공지능 학습기법을 개발하였으며, 개발된 기술의 성능을 실험을 통해 평가하였다. 3차원 공간에서 변위 형상 및 노드 위치 좌표의 특성을 학습에 반영할 수 있는 Image-to-Image 변위 형상 학습과 위치 특징을 결합한 변위 상관 학습 방법을 제시하였다. 개발된 인공지능 학습방법의 성능을 평가하기 위해 목업 구조 실험을 진행하였고, 3D 스캔으로 측정한 변위값과 인공지능으로 예측한 결과를 비교하였다. 비교 결과 인공지능 예측 결과는 3D 스캔 측정 결과에 비해 5.6~5.9%의 오차율을 보여 적정 성능을 보였다.

딥러닝 기반 작물 질병 탐지 및 분류 시스템 (Deep Learning-based system for plant disease detection and classification)

  • 고유진;이현준;정희자;위리;김남호
    • 스마트미디어저널
    • /
    • 제12권7호
    • /
    • pp.9-17
    • /
    • 2023
  • 작물의 병충해는 다양한 작물의 성장에 영향을 미치기 때문에 초기에 병충해를 식별하는 것이 매우 중요하다. 이미 많은 머신러닝(ML) 모델이 작물 병충해의 검사와 분류에 사용되었지만, 머신러닝의 부분 집합인 딥러닝(DL)이 발전을 이루면서 이 연구 분야에서 많은 진보가 있었다. 본 연구에서는 YOLOX 검출기와 MobileNet 분류기를 사용하여 비정상 작물의 병충해 검사 및 정상 작물에 대해서는 성숙도 분류를 진행하였다. 이 방법을 통해 다양한 작물 병충해 특징을 효과적으로 추출할 수 있으며, 실험을 위해 딸기, 고추, 토마토와 관련된 다양한 해상도의 이미지 데이터 셋을 준비하여 작물 병충해 분류에 사용하였다. 실험 결과에 따르면 복잡한 배경 조건을 가진 영상에서 평균 테스트 정확도가 84%, 성숙도 분류 정확도가 83.91% 임을 확인할 수 있었다. 이 모델은 자연 상태에서 3가지 작물에 대한 6가지 질병 검출 및 각 작물의 성숙도 분류를 효과적으로 진행할 수 있었다.

영상처리기법을 활용한 차량 검출 및 선박복원성 계산 (Vehicle Detection and Ship Stability Calculation using Image Processing Technique)

  • 김득봉;허준혁;김가람;서창범;이우준
    • 해양환경안전학회지
    • /
    • 제27권7호
    • /
    • pp.1044-1050
    • /
    • 2021
  • 우리나라는 여러 건의 여객선 사고를 겪으면서, 여객선 안전관리를 위해 다양한 제도를 운영하고 있다. 2021년 기준 우리나라 연안을 운항하는 여객선 162척 중, 차량갑판이 개방된 형태의 차도선이 105척(65 %)을 차지하고 있다. 차도선은 2~4개의 섬을 경유하는 운항 패턴을 가지고 있다. 출항지(모항)에서 안전점검은 선원과 운항관리실의 운항감독관, 해사안전감독관에 의해 실시된다. 경유지에서의 안전점검은 자체점검이 실시되는 경우가 있다. 여느 제도와 마찬가지로 제도적, 현실적 한계 등이 있다. 이를 위해 영상처리기법을 활용하여 차량을 검출하고 이를 선박 복원성 계산과 연동하는 방안을 제안하고자 본 연구를 수행하였다. 차량 검출을 위해 차영상을 이용하는 방법과 기계학습을 이용하는 방법을 사용하였다. 검출된 데이터를 선박 복원성 계산에 활용하였다. 기계학습을 통해 차량을 검출하는 경우, 차영상에 의한 차량 검출 방법보다 차량 식별에 안정적임을 알 수 있었다. 다만, 카메라가 일몰과 같은 상황에서 역광을 받는 경우와 야간과 같은 상황에서 부두와 선박 내부의 강한 조명에 의해 차량이 식별되지 않는 한계가 있었다. 안정적인 영상처리를 위해 충분한 영상 데이터 확보와 프로그램 고도화가 필요해 보인다.