• 제목/요약/키워드: learning through the image

검색결과 925건 처리시간 0.026초

Keypoint-based Deep Learning Approach for Building Footprint Extraction Using Aerial Images

  • Jeong, Doyoung;Kim, Yongil
    • 대한원격탐사학회지
    • /
    • 제37권1호
    • /
    • pp.111-122
    • /
    • 2021
  • Building footprint extraction is an active topic in the domain of remote sensing, since buildings are a fundamental unit of urban areas. Deep convolutional neural networks successfully perform footprint extraction from optical satellite images. However, semantic segmentation produces coarse results in the output, such as blurred and rounded boundaries, which are caused by the use of convolutional layers with large receptive fields and pooling layers. The objective of this study is to generate visually enhanced building objects by directly extracting the vertices of individual buildings by combining instance segmentation and keypoint detection. The target keypoints in building extraction are defined as points of interest based on the local image gradient direction, that is, the vertices of a building polygon. The proposed framework follows a two-stage, top-down approach that is divided into object detection and keypoint estimation. Keypoints between instances are distinguished by merging the rough segmentation masks and the local features of regions of interest. A building polygon is created by grouping the predicted keypoints through a simple geometric method. Our model achieved an F1-score of 0.650 with an mIoU of 62.6 for building footprint extraction using the OpenCitesAI dataset. The results demonstrated that the proposed framework using keypoint estimation exhibited better segmentation performance when compared with Mask R-CNN in terms of both qualitative and quantitative results.

딥러닝 데이터 활용한 신호등 색 인식 알고리즘 개발 (Development of Color Recognition Algorithm for Traffic Lights using Deep Learning Data)

  • 백서하;김종호;이경수
    • 자동차안전학회지
    • /
    • 제14권2호
    • /
    • pp.45-50
    • /
    • 2022
  • The vehicle motion in urban environment is determined by surrounding traffic flow, which cause understanding the flow to be a factor that dominantly affects the motion planning of the vehicle. The traffic flow in this urban environment is accessed using various urban infrastructure information. This paper represents a color recognition algorithm for traffic lights to perceive traffic condition which is a main information among various urban infrastructure information. Deep learning based vision open source realizes positions of traffic lights around the host vehicle. The data are processed to input data based on whether it exists on the route of ego vehicle. The colors of traffic lights are estimated through pixel values from the camera image. The proposed algorithm is validated in intersection situations with traffic lights on the test track. The results show that the proposed algorithm guarantees precise recognition on traffic lights associated with the ego vehicle path in urban intersection scenarios.

사출성형 제품의 결함검출 시스템 (Defects Detection System on Injection Molded Part)

  • 박인규;이완범;최규석
    • 한국인터넷방송통신학회논문지
    • /
    • 제11권4호
    • /
    • pp.99-104
    • /
    • 2011
  • 본 논문은 사출성형 제품에 존재하는 여러 가지의 패턴의 결함을 신경회로망을 이용하여 검출하는 방법을 제안하였다. 시스템의 성능을 향상시키기 위하여 룩업테이블을 이용하였고, 기존의 이미지 비교에 의한 방법을 지양하여 결함분류를 위한 신경회로망의 학습표본을 위한 특징점을 추출하고 결함추출과 분류알고리즘을 제안하였다. 총 500개의 사출성형 제품의 패턴에 대하여 신경회로망의 학습을 통하여 약 3%의 제품의 패턴에서 결함을 검출하였고 패턴의 직경에 대한 불량으로 대부분 분류되었다. 제안된 시스템을 이용한 결함 검출 방법은 사출성형 제품의 미세한 패턴을 검출하는 데 시간과 경비를 줄일 수 있는 효과적인 대안으로 기대한다.

ResNet을 이용한 얼굴 인식 기반 출입관리시스템 개발 (Development of Access Management System based on Face Recognition using ResNet)

  • 류세열;김혜진;차경애
    • 한국멀티미디어학회논문지
    • /
    • 제22권8호
    • /
    • pp.823-831
    • /
    • 2019
  • In recent years, there has been developed systems such as a surveillance system and access control using a face recognition function instead of a password or an RFID chip, thereby reducing the risk of falsification. Moreover, deep learning technology has been applied to real-time face recognition technology in video, so it makes possible the development of access control system that improves the accuracy of recognition and efficiency of management. In this paper, we propose a real-time access management system based on face recognition using ResNet. The system is based on web server, which make it possible to manage the access by recognizing the person of the image through the camera and access information stored in the database. It can be accessed by a user application to receive various information. The implemented system identifies a person in real time and allows access control by accurately distinguishing whether they are members or not, and the test results can recognize in 0.2 seconds. The accuracy of recognition rate is up to about 97% depending on the experiment environment. With this system, access can be managed quickly and effectively, even many people rush to it.

딥러닝 기반 가창 음성합성(Singing Voice Synthesis) 모델링 (Deep Learning based Singing Voice Synthesis Modeling)

  • 김민애;김소민;박지현;허가빈;최윤정
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.127-130
    • /
    • 2022
  • 본 논문은 생성자 손실함수를 이용한 가창 음성합성 모델링에 대한 연구로서 기존 이미지 생성에 최적화된 딥러닝 알고리즘 중 BEGAN모델을 오디오 생성모델(SVS모델)에 적용시킬 때 발생할 수 있는 여러 요인에 대해 분석하고 최적의 품질을 도출하기 위한 실험을 수행하였다. 특히 BEGAN 기반 모델에서 제안된 L1 loss가 어느 시점에서 감마(𝛾)파라미터의 역할을 상실하게 한다는 점을 개선하고자 알파(𝛼)파라미터를 추가한 후 각 파라미터 값들의 구간별 실험을 통해 최적의 값을 찾아냄으로써 가창합성 생성물의 품질향상에 기여할 수 있음을 확인하였다.

  • PDF

물체인식 딥러닝 모델 구성을 위한 파이썬 기반의 Annotation 툴 개발 (Development of Python-based Annotation Tool Program for Constructing Object Recognition Deep-Learning Model)

  • 임송원;박구만
    • 방송공학회논문지
    • /
    • 제25권3호
    • /
    • pp.386-398
    • /
    • 2020
  • 본 논문에서는 물체인식 딥러닝 모델을 구성하는데 필요한 데이터 레이블링 과정을 하나의 프로그램에서 사용할 수 있는 Annotation 툴을 개발했다. 프로그램의 인터페이스는 파이썬의 기본 GUI 라이브러리를 활용하였으며, 실시간으로 데이터 수집이 가능한 크롤러 기능을 구성하였다. 기존의 물체인식 딥러닝 모델인 Retinanet을 활용하여, 자동으로 Annotation 정보를 제공하는 기능을 구현했다. 또한, 다양한 물체인식 네트워크의 레이블링 형식에 맞추어 학습할 수 있도록 Pascal-VOC, YOLO, Retinanet 등 제각기 다른 학습 데이터 레이블링 형식을 저장하도록 했다. 제안하는 방식을 통해 국산 차량 이미지 데이터셋을 구축했으며, 기존의 물체인식 딥러닝 네트워크인 Retinanet과 YOLO 등에 학습하고, 정확도를 측정했다. 차량이 진입하는 영상에서 실시간으로 차량의 모델을 구별하는 정확성은 약 94%의 정확도를 기록했다.

적응형 이진화와 Convex Hull 전처리 및 합성곱 신경망 학습 방법을 적용한 고무 오링 불량 판별 (Rubber O-ring defect detection using adaptive binarization, Convex Hull preprocessing, and convolutional neural network learning method)

  • 성은산;김현태
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.623-625
    • /
    • 2021
  • 고무 오링은 일반적인 사출 성형 방식으로 생산된다. 이때 정상적으로 성형되지 않은 제품은 무조건 불량으로 판별한다. 그러나 영상기반 판독 시 획득한 영상을 원본 그대로 판독 할 경우 정확도가 떨어지는 문제가 발생한다. 이에 획득한 영상을 적응형 이진화와 Convex Hull 알고리즘을 사용한 전처리를 통해 원본영상에서 고무 오링 부분만 추출하여 합성곱 신경망에 학습하였다. 테스트 과정에서 제안하는 전처리를 적용한 학습방법의 불량검출 성능이 제시한 기준치 보다 나은 성능을 보이는 것을 확인 할 수 있었다.

  • PDF

함수개념의 교수.학습과정에서 나타난 subject-matter knowledge와 pedagogical content knowledge 능력의 발전에 관한 연구 (The Development of Subject-matter Knowledge and Pedagogical Content Knowledge in Function Instruction)

  • 윤석임
    • 한국수학교육학회지시리즈E:수학교육논문집
    • /
    • 제21권4호
    • /
    • pp.575-596
    • /
    • 2007
  • 본 논문은 예비교사들이 함수교육과 관련된 subjective-matter knowledge와 pedagogical content knowledge를 어떻게 효율적으로 의미있게 학습하고 발전시키는 가에 대하여 조사하였다. 함수의 기본개념과 원칙, 그리고 그들이 어떻게 조직되었는지를 이해하는 능력과 의미있는 함수학습이 가능하도록 그들을 표현하고 구성하는 능력을 증진시키기 위하여 본 연구에서는 구성주의와 협동학습에 기반 한 학습방법을 채택하였다. 사전, 사후테스트와 인터뷰를 통하여 평가한 결과 소그룹 구성원들과의 상호작용 결과를 전체 구성원과의 토론을 통하여 학습하는 과정에서 보다 깊이 있고 확장된 subject-matter knowledge와 다양한 pedagogical content knowledge를 획득하게 되는 결과를 얻게 되었다.

  • PDF

고객 맞춤형 서비스를 위한 관객 행동 기반 감정예측모형 (The Audience Behavior-based Emotion Prediction Model for Personalized Service)

  • 유은정;안현철;김재경
    • 지능정보연구
    • /
    • 제19권2호
    • /
    • pp.73-85
    • /
    • 2013
  • 정보기술의 비약적 발전에 힘입어, 오늘날 기업들은 지금까지 축적한 고객 데이터를 기반으로 맞춤형 서비스를 제공하는 것에 많은 관심을 가지고 있다. 고객에게 소구하는 맞춤형 서비스를 효과적으로 제공하기 위해서는 우선 그 고객이 처한 상태나 상황을 정확하게 인지하는 것이 중요하다. 특히, 고객에게 서비스가 전달되는 이른바 진실의 순간에 해당 고객의 감정 상태를 정확히 인지할 수 있다면, 기업은 더 양질의 맞춤형 서비스를 제공할 수 있을 것이다. 이와 관련하여 사람의 얼굴과 행동을 이용하여 사람의 감정을 판단하고 개인화 서비스를 제공하기 위한 연구가 활발하게 이루어지고 있다. 얼굴 표정을 통해 사람의 감정을 판단하는 연구는 좀 더 미세하고 확실한 변화를 통해 정확하게 감정을 판단할 수 있지만, 장비와 환경의 제약으로 실제 환경에서 다수의 관객을 대상으로 사용하기에는 다소 어려움이 있다. 이에 본 연구에서는 Plutchik의 감정 분류 체계를 기반으로 사람들의 행동을 통해 감정을 추론해내는 모형을 개발하는 것을 목표로 한다. 본 연구는 콘텐츠에 의해 유발된 사람들의 감정적인 변화를 사람들의 행동 변화를 통해 판단하고 예측하는 모형을 개발하고, 4가지 감정 별 행동 특징을 추출하여 각 감정에 따라 최적화된 예측 모형을 구축하는 것을 목표로 한다. 모형 구축을 위해 사람들에게 적절한 감정 자극영상을 제공하고 그 신체 반응을 수집하였으며, 사람들의 신체 영역을 나누었다. 특히, 모션캡쳐 분야에서 널리 쓰이는 차영상 기법을 적용하여 사람들의 제스쳐를 추출 및 보정하였다. 이후 전처리 과정을 통해 데이터의 타임프레임 셋을 20, 30, 40 프레임의 3가지로 설정하고, 데이터를 학습용, 테스트용, 검증용으로 구분하여 인공신경망 모형을 통해 학습시키고 성과를 평가하였다. 다수의 일반인들을 대상으로 수집된 데이터를 이용하여 제안 모형을 구축하고 평가한 결과, 프레임셋에 따라 예측 성과가 변화함을 알 수 있었다. 감정 별 최적 예측 성과를 보이는 프레임을 확인할 수 있었는데, 이는 감정에 따라 감정의 표출 시간이 다르기 때문인 것으로 판단된다. 이는 행동에 기반한 제안된 감정예측모형이 감정에 따라 효과적으로 감정을 예측할 수 있으며, 실제 서비스 환경에서 사용할 수 있는 효과적인 알고리즘이 될 수 있을 것으로 기대할 수 있다.

Gray 채널 분석을 사용한 딥페이크 탐지 성능 비교 연구 (A Comparative Study on Deepfake Detection using Gray Channel Analysis)

  • 손석빈;조희현;강희윤;이병걸;이윤규
    • 한국멀티미디어학회논문지
    • /
    • 제24권9호
    • /
    • pp.1224-1241
    • /
    • 2021
  • Recent development of deep learning techniques for image generation has led to straightforward generation of sophisticated deepfakes. However, as a result, privacy violations through deepfakes has also became increased. To solve this issue, a number of techniques for deepfake detection have been proposed, which are mainly focused on RGB channel-based analysis. Although existing studies have suggested the effectiveness of other color model-based analysis (i.e., Grayscale), their effectiveness has not been quantitatively validated yet. Thus, in this paper, we compare the effectiveness of Grayscale channel-based analysis with RGB channel-based analysis in deepfake detection. Based on the selected CNN-based models and deepfake datasets, we measured the performance of each color model-based analysis in terms of accuracy and time. The evaluation results confirmed that Grayscale channel-based analysis performs better than RGB-channel analysis in several cases.