• 제목/요약/키워드: learning through the image

검색결과 965건 처리시간 0.027초

YOLO 신경망 기반의 UAV 영상을 이용한 건물 객체 탐지 분석 (Analysis of Building Object Detection Based on the YOLO Neural Network Using UAV Images)

  • 김준석;홍일영
    • 한국측량학회지
    • /
    • 제39권6호
    • /
    • pp.381-392
    • /
    • 2021
  • 본 연구에서는 UAV (Unmanned Aerial Vehicle)로 촬영한 이미지를 활용하여 수치지도 지형지물 표준 코드에서 정의하고 있는 건물 8종에 대하여 딥러닝 기반의 객체 탐지 분석을 수행하였다. UAV로 촬영한 이미지 509매에 대하여 이미지 라벨링을 하였고 YOLO (You Only Look Once) v5 모델을 적용하여 학습 및 추론을 진행하였다. 실험 및 분석은 오픈소스 기반의 분석 플랫폼과 알고리즘을 적용하여 데이터를 분석하였으며 분석결과 88%~98%의 예측 확률로 건물 객체를 탐지하였다. 또한 학습데이터의 구축 및 반복 학습의 과정에서 건물 객체 탐지의 높은 정확도를 위해 필요한 학습 방식 및 모델 구축방식을 분석하였고, 학습한 모델을 다른 영상자료에 적용하는 방안을 모색하였다. 본 연구를 통해 고효율 심층 신경망과 공간정보데이터가 융합하는 모델을 제안하며 공간정보데이터와 딥러닝 기술의 융합은 향후 공간정보데이터 구축의 효율성, 분석 및 예측의 정확도 향상에 많은 도움을 제공할 것이다.

MSaGAN: Improved SaGAN using Guide Mask and Multitask Learning Approach for Facial Attribute Editing

  • Yang, Hyeon Seok;Han, Jeong Hoon;Moon, Young Shik
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권5호
    • /
    • pp.37-46
    • /
    • 2020
  • 최근 얼굴 속성 편집(facial attribute editing)의 연구는 GAN(Generative Adversarial Net)과 인코더-디코더(encoder-decoder) 구조를 활용하여 사실적인 결과를 얻고 있다. 최신 연구 중 하나인 SaGAN(Spatial attention GAN)은 공간적 주의 기제(spatial attention mechanism)를 활용하여 얼굴 영상에서 원하는 속성만을 변경할 방법을 제안하였다. 그러나 불충분한 얼굴 영역 정보로 인하여 때로 부자연스러운 결과를 얻는 경우가 발생한다. 본 논문에서는 기존 연구의 한계점을 개선하기 위하여 유도 마스크(guide mask)를 학습에 활용하고, 다중작업 학습(multitask learning) 접근을 적용한 개선된 SaGAN(MSaGAN)을 제안한다. 폭넓은 실험을 통해 마스크 손실 함수와 신경망 구조에 따른 얼굴 속성 편집의 결과를 비교하여 제안하는 방법이 기존보다 더 자연스러운 결과를 효율적으로 얻을 수 있음을 보인다.

멀티미디어를 이용한 웹기반 디지털 논리회로 가상실험실의 구현 (Implementation of A Web-based Virtual Laboratory For Digital Logic Circuits Using Multimedia)

  • 김동식;최관순;이순흠
    • 공학교육연구
    • /
    • 제5권1호
    • /
    • pp.27-33
    • /
    • 2002
  • 최근에 멀티미디어 기술과 결합된 공학교육용 가상 웹사이트가 다양한 형태로 출현함에 따라 공학교육의 인터넷 응용에 많은 관심이 모아졌다. 그러나 단방향성 통신, 단순한 텍스트나 이미지 기반의 웹 문서 그리고 동기부여가 없는 지루한 교육진행과정 등은 가상공간에서의 교육의 효율성을 저하시켜왔다. 따라서 본 논문에서는 학습과정에 있어서 효율성을 극대화하기 위한 가상실험시스템을 제안한다. 제안된 디지털 논리회로 가상실험시스템의 웹의 멀티미디어 능력을 증대시킬 수 있는 상호작용적인 학습 환경을 제공한다. 제안된 가상실험실은 실제 대학에서의 실험실 환경과 유사하게 구현하였기 때문에 학습자들은 가상실험실을 통해 유사한 실험결과를 얻을 수 있다. 제안된 가상실험실은 원리이해 학습실, 모의실험 학습실, 가상실험 학습실 그리고 관리시스템의 4가지로 구성되어 있다. 이러한 혁신적인 교수-학습환경하에서 학습효율은 물론 교수의 생산성을 크게 향상시킬 수 있을 것으로 생각된다.

게임·애니메이션·영상 기획 프로젝트 수업을 위한 PBSL(Project based Self Learning) (PBSL(Project based Self Learning) for Pre-production of Game·Animation·Visual Images)

  • 이현석
    • 디지털융복합연구
    • /
    • 제17권11호
    • /
    • pp.467-474
    • /
    • 2019
  • 디지털콘텐츠 산업의 핵심 요소인 게임 애니메이션 영상은 그 수요의 확대에 따라 관련 인력 양성이 갈수록 전문화되고 있다. 게임 애니메이션 영상 분야의 교육은 창의적 사고와 융합적 태도 그리고 문제해결 능력이 중요시 되는 창의 융합 참여형 인재양성에 있다. 이에 본 논문은 게임 애니메이션 영상 분야 창의융합 참여형 인재 양성을 위한 프리프러덕션 중심의 PBSL(Project based Self Learning) 수업모형을 제시하고자 한다. 이를 위한 연구의 전개는 창의융합 인재의 구성요소와 프로젝트 수업의 특성, 그리고 관련 직무 역량에 대해 문헌을 중심으로 고찰하였으며, 이에 따른 PBSL수업모형의 핵심요소는 창의성, 융합적 태도, 자율성으로 분류 하였다. 이를 기초하여, 창의적 사고와 융합적 태도 그리고, 학생들의 자율성이 실현될 수 있는 프로젝트 형의 'Project Based Self Learning' 수업모형을 개발한다. PBSL을 적용한 D대학교 <콘텐츠워크?> 수업에 대해 사례분석하고, 설문조사를 진행한 결과 자율성 측면이 창의성과 융합적 태도에 비해 만족도가 높게 나왔으며, 이는, 학생 스스로 프로젝트 진행에 대한 자율성과 동기부여가 향상되었음을 알 수 있다. 다만, 만족도가 낮게 분석된 융합적 측면에 대한 추후 보완이 필요하다.

A Study on Face Recognition and Reliability Improvement Using Classification Analysis Technique

  • Kim, Seung-Jae
    • International journal of advanced smart convergence
    • /
    • 제9권4호
    • /
    • pp.192-197
    • /
    • 2020
  • In this study, we try to find ways to recognize face recognition more stably and to improve the effectiveness and reliability of face recognition. In order to improve the face recognition rate, a lot of data must be used, but that does not necessarily mean that the recognition rate is improved. Another criterion for improving the recognition rate can be seen that the top/bottom of the recognition rate is determined depending on how accurately or precisely the degree of classification of the data to be used is made. There are various methods for classification analysis, but in this study, classification analysis is performed using a support vector machine (SVM). In this study, feature information is extracted using a normalized image with rotation information, and then projected onto the eigenspace to investigate the relationship between the feature values through the classification analysis of SVM. Verification through classification analysis can improve the effectiveness and reliability of various recognition fields such as object recognition as well as face recognition, and will be of great help in improving recognition rates.

A Vehicle Recognition Method based on Radar and Camera Fusion in an Autonomous Driving Environment

  • Park, Mun-Yong;Lee, Suk-Ki;Shin, Dong-Jin
    • International journal of advanced smart convergence
    • /
    • 제10권4호
    • /
    • pp.263-272
    • /
    • 2021
  • At a time when securing driving safety is the most important in the development and commercialization of autonomous vehicles, AI and big data-based algorithms are being studied to enhance and optimize the recognition and detection performance of various static and dynamic vehicles. However, there are many research cases to recognize it as the same vehicle by utilizing the unique advantages of radar and cameras, but they do not use deep learning image processing technology or detect only short distances as the same target due to radar performance problems. Radars can recognize vehicles without errors in situations such as night and fog, but it is not accurate even if the type of object is determined through RCS values, so accurate classification of the object through images such as cameras is required. Therefore, we propose a fusion-based vehicle recognition method that configures data sets that can be collected by radar device and camera device, calculates errors in the data sets, and recognizes them as the same target.

교통사고 경감을 위한 적외선 카메라와 YOLO를 사용한 블랙아이스 탐지 방법 제안 (Proposal of a Black Ice Detection Method Using Infrared Camera and YOLO for Reducing of Traffic Accidents)

  • 김형균;장민석;이연식
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 추계학술대회
    • /
    • pp.416-421
    • /
    • 2021
  • 폭설로 인한 도로 미끄러짐과 기온이 0도 이하로 낮아졌을 때, 도로와 차량 통행용 다리, 터널 출입구 쪽에서 주로 발생하는 블랙아이스는 운전자의 시야에서는 아스팔트의 이미지가 투과되어 보이기에 인식되지 않아서 자동차들이 미끄러지는 상황(슬립 현상)이 발생하고, 이로 인하여 대형 교통사고로 이어져 인명 물적 손실이 대량으로 발생하기에 적외선 카메라를 이용하여 도로 상태를 확인하고 딥러닝을 통하여 블랙아이스를 판별하는 방법을 제안하고자 한다.

  • PDF

이미지 검색: 정보과다 환경에서의 접근과 이용 (Image Retrieval: Access and Use in Information Overload)

  • 박민수
    • 문화기술의 융합
    • /
    • 제8권6호
    • /
    • pp.703-708
    • /
    • 2022
  • 학술문헌의 표와 그림에는 중요하고 가치 있는 정보가 포함되어 있다. 표와 그림은 정제된 연구의 본질을 나타내며 이는 원시 데이터세트에 가장 가까운 것이라 할 수 있다. 그렇다면, 연구자들은 검색시스템을 통하여 이러한 이미지 데이터에 쉽게 접근하여 활용할 수 있는가? 본 연구에서는 이용자연구 문헌조사와 국내외 사례조사 분석을 통하여, 이미지 데이터에 대한 이용자 인식 및 니즈를 파악하고 이미지 검색시스템에 대한 잠재적인 기대효과 및 활용방안을 모색해보고자 한다. 대다수의 연구자들은 표 및 그림 색인 기능과 기존 검색 기능을 결합한 시스템을 선호하는 것으로 나타났다. 특정 개체 유형(그림 및 표)으로 검색을 제한할 수 있는 고급 검색 기능의 제공을 매우 중요하게 평가했다. 이와 관련하여, 그림과 표에 대한 검색 제한의 구현에 가장 높은 만족도를 주었다. 전반적으로, 연구자들은 표와 그림을 색인화하는 시스템의 많은 잠재적 용도를 발견할 수 있었다. 교육, 발표, 연구 및 학습을 위한 정보와 특수한 유형의 정보를 찾는 데 도움이 될 수 있는 것으로 나타났다. 이러한 시스템의 유용성은 기능이 기존 시스템에 통합되고 풀텍스트에 원활하게 연결되며 완전한 캡션이 있는 고품질 이미지를 포함하는 경우 가장 높게 나타났다. 이용자 중심 이미지 검색시스템에 대한 기대효과와 활용방안 또한 논의되었다.

계층적 컨볼루션 신경망을 이용한 공작기계의 공구 상태 진단 (Machine Tool State Monitoring Using Hierarchical Convolution Neural Network)

  • 이경민
    • 융합신호처리학회논문지
    • /
    • 제23권2호
    • /
    • pp.84-90
    • /
    • 2022
  • 공작기계 상태 진단은 기계의 상태를 자동으로 감지하는 프로세스이다. 실제로 가공의 효율과 제조공정에서 제품의 품질은 공구 상태에 영향을 받으며 마모 및 파손된 공구는 공정 성능에 보다 심각한 문제를 일으키고 제품의 품질 저하를 일으킬 수 있다. 따라서 적절한 시기에 공구가 교체될 수 있도록 공구 마모 진행 및 공정 중 파손 방지 시스템 개발이 필요하다. 본 논문에서는 공구의 적절한 교체 시기 등을 진단하기 위해 딥러닝 기반의 계층적 컨볼루션 신경망을 이용하여 5가지 공구 상태를 진단하는 방법을 제안한다. 기계가 공작물을 절삭할 때 발생하는 1차원 음향 신호를 주파수 기반의 전력스펙트럼밀도 2차원 영상으로 변환하여 컨볼루션 신경망의 입력으로 사용한다. 학습 모델은 계층적 3단계를 거쳐 5가지 공구 상태를 진단한다. 제안한 방법은 기존의 방법과 비교하여 높은 정확도를 보였고, 실시간 연동을 통해 다양한 공작기계를 모니터링할 수 있는 스마트팩토리 고장 진단 시스템에 활용할 수 있을 것이다.

음성녹음 기반의 실감형 어학시스템 콘텐츠 개발 (Development of tangible language content system based on voice recording)

  • 나종원
    • 한국항행학회논문지
    • /
    • 제17권2호
    • /
    • pp.234-239
    • /
    • 2013
  • 기존의 어학시스템 콘텐츠의 문제점은 수업에 대한 집중력 저하와 실제 학습여부를 판단할 수 없었고, 수업 진행자의 평가로 많은 결정이 되었다. 이로 인해 음성녹음 기반에 유비쿼터스 기술과 가상현실 기술을 조합하여 강의실에 프로젝터를 설치하고 각 강의실의 RFID 리더기 부착과 학생의 RFID 태그 부착된 학생증을 통해 영어 등급에 해당하는 콘텐츠를 학습한다. 3차원 영상 콘텐츠로 가상 현실상의 외국인과의 질의응답을 음성녹음 기술을 이용하여 발음과 억양을 동시에 체크 하여 레벨 패스 또는 레벨 실패를 판가름 한다. 이렇게 구성된 시스템은 학생 교육 데이터를 중앙 서버에 DB로 저장후 피드백 과정을 통해 정보를 제공하게 된다. 본 연구로 어학 콘텐츠에서 공통적으로 가질 수 있는 문제점들을 분석하고 문제점에 대하여 음성 녹음기술을 적용하여 기존의 어학콘텐츠에서 해결하지 못했던 문제점을 해결하였고 레벨위주의 수업이 가능하였다. 또한, 흥미위주의 적극적인 수업참여가 되도록 기여하였다.