• 제목/요약/키워드: learning through the image

검색결과 925건 처리시간 0.028초

신경망 기반의 유기된 물체 인식 방법 (The Method of Abandoned Object Recognition based on Neural Networks)

  • 류동균;이재흥
    • 전기전자학회논문지
    • /
    • 제22권4호
    • /
    • pp.1131-1139
    • /
    • 2018
  • 본 논문에서는 합성곱 신경망을 이용한 유기된 물체 인식 방법을 제안한다. 유기된 물체 인식 방법은 영상 내에서 유기 물체에 대한 영역을 먼저 검출하며 검출된 영역이 있을 경우 해당 영역에 합성곱 신경망을 적용하여 어떤 물체를 나타내는지 인식하는 과정을 거친다. 실험은 쓰레기 무단투기를 검출하는 응용 시스템을 통해 진행되었다. 실험 결과, 유기 물체에 대한 영역을 효율적으로 검출하는 것을 볼 수 있었다. 검출된 영역은 합성곱 신경망으로 들어가 쓰레기인지 아닌지 분류되는 과정을 거쳤다. 이를 위해 자체적으로 수집한 쓰레기 데이터와 오픈 데이터베이스로 합성곱 신경망을 학습시켰다. 학습 결과, 학습에 포함되지 않은 테스트셋에 대해 약 97%의 정확도를 달성하였다.

EEG 기반 감정인식을 위한 주석 레이블링과 EEG Topography 레이블링 기법의 비교 고찰 (Comparison of EEG Topography Labeling and Annotation Labeling Techniques for EEG-based Emotion Recognition)

  • 류제우;황우현;김덕환
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제15권3호
    • /
    • pp.16-24
    • /
    • 2019
  • 최근 뇌파를 기반으로 한 인간의 감정을 인식하는 연구가 인간-로봇 상호작용 분야에서 활발히 진행되고 있다. 본 논문에서는 MAHNOB-HCI에서 사용된 자기평가와 주석 레이블링 방법과는 다른, 이미지 기반의 뇌파 Topography를 이용한 레이블링을 통해 감정을 평가하는 방법을 제안한다. 제안한 방법은 뇌파 신호를 Topography의 이미지로 변환하여 기계학습 모델을 학습하고 이를 기반으로 Valence 기반의 감정을 평가한다. 제안한 방법은 레이블링 과정을 자동화하여 지연 시간을 없애고 객관적인 레이블링을 제공할 수 있다. MAHNOB-HCI 데이터베이스를 적용한 실험에서 SVM, kNN의 기계학습 모델을 학습하여 주석 레이블링과 성능 비교를 하였으며, 제안 방법의 감정인식 정확도를 SVM에서 54.2%, kNN에서 57.7%로 확인하였다.

Convolutional Neural Network와 Stereo Image를 이용한 얼굴 인식 (Face Recognition Using Convolutional Neural Network and Stereo Images)

  • 기철민;조태훈
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 춘계학술대회
    • /
    • pp.359-362
    • /
    • 2016
  • 얼굴은 홍채, 지문 등과 같은 사람마다 가진 특수한 정보이다. 얼굴 인식에 대한 연구들은 과거부터 현재까지 지속적으로 진행되고 있으며, 이러한 연구들을 통해 여러 가지의 얼굴 인식 방법들이 나타났다. 이 중에는 스테레오로 구성된 얼굴 데이터를 이용하여 얼굴 인식을 진행하는 알고리즘들이 있다. 본 논문에서는 기계학습의 방법인 Convolutional Neural Network를 이용하여 스테레오로 구성된 얼굴 이미지를 하나의 신경망으로 학습을 진행하였다. 또한 스테레오로 구성된 얼굴 이미지는 카메라 2대를 이용하여 취득하였다. 이 방법은 얼굴 인식에서 보편적으로 많이 사용되는 알고리즘인 PCA를 이용한 스테레오 얼굴 인식의 결과보다 더욱 좋은 성능을 보였다.

  • PDF

높은 정확도를 위한 이미지 전처리와 앙상블 기법을 결합한 이미지 기반 악성코드 분류 시스템에 관한 연구 (A Study on the Image-Based Malware Classification System that Combines Image Preprocessing and Ensemble Techniques for High Accuracy)

  • 김해수;김미희
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제11권7호
    • /
    • pp.225-232
    • /
    • 2022
  • 최근 정보통신 기술의 발전이 많은 이에게 이점이 되고 있지만, 그와 동시에 새로운 프로그램의 취약점을 통해 악의적 공격 시도 또한 증가하고 있다. 악의적 공격 중 악성코드는 다양한 방식으로 동작하며 매번 새로운 방식으로 사람들에게 유포되고 이러한 악성코드들을 해결하기 위해 발견된 악성코드를 빠르게 분석하여 방어기법을 제공해야 한다. 새로운 악성코드를 기존 악성코드와 동일한 종류로 분류할 수 있다면 동작의 유사성을 가진 악성코드들의 분석된 특징을 이용해 새로운 악성코드의 방어기법을 제공할 수 있다. 따라서 악성코드를 정확하고 빠르게 분류하는 방법이 있어야 한다. 또한, 분석된 악성코드들의 패밀리 마다 데이터의 개수가 균일하지 않을 수 있으므로 이에 대한 해결방안이 필요하다. 본 논문에서는 이미지 전처리 기법과 앙상블 기법을 결합하여 개수가 균일하지 않은 데이터에서 정확도를 높이는 시스템을 제안한다.

영상장치를 이용한 차세대 스마트 LED 전광판의 불량픽셀 검출을 위한 딥러닝 구조 개발 (Development of Deep Learning Structure for Defective Pixel Detection of Next-Generation Smart LED Display Board using Imaging Device)

  • 이선구;이태윤;이승호
    • 전기전자학회논문지
    • /
    • 제27권3호
    • /
    • pp.345-349
    • /
    • 2023
  • 본 논문은 영상장치를 이용한 차세대 스마트 LED 전광판의 불량픽셀 검출을 위한 딥러닝 구조 개발에 관한 연구를 제안한다. 이 연구에서는 영상장치를 활용하여 딥러닝을 통해 실외 LED 전광판의 결함을 자동으로 검출하는 기법을 제안한다. 이를 통해 LED 전광판의 효율적인 관리와 발생할 수 있는 다양한 오류와 문제를 해결하고자 한다. 연구 과정은 3단계를 거쳐 이루어진다. 첫 번째로, 평면화된 전광판 이미지 데이터를 calibration을 통해 배경을 완전히 제거하고 필요한 전처리 과정을 거쳐 학습 데이터셋을 생성한다. 두 번째로, 생성된 데이터셋은 객체 인식 네트워크를 학습을 시키는 데 활용된다. 네트워크는 Backbone과 Head로 구성된다. Backbone에서는 CSP-Darknet을 활용하여 특징 맵을 추출하고, Head에서는 추출된 Feature Map을 기반으로 물체를 검출한다. 이 과정에서 네트워크는 Confidence score와 IoU가 일치하도록 오차를 수정하며 지속적으로 학습된다. 세 번째에서는 생성된 모델을 활용하여 실제 실외 LED 전광판에서 불량픽셀을 자동으로 검출한다. 본 논문에서 제안하는 방법을 적용하여 LED 전광판의 불량픽셀 검출에 대한 공인 측정 실험 결과로는 실제 LED 전광판에서 불량픽셀을 100% 검출한 결과를 얻을 수 있었다. 이를 통해 LED 전광판의 불량 관리와 유지보수의 효율성이 향상되었음을 확인할 수 있다. 이러한 연구 결과는 LED 전광판 관리의 획기적인 개선을 이룰 것으로 기대된다.

R2와 어텐션을 적용한 유넷 기반의 영상 간 변환에 관한 연구 (Image-to-Image Translation Based on U-Net with R2 and Attention)

  • 임소현;전준철
    • 인터넷정보학회논문지
    • /
    • 제21권4호
    • /
    • pp.9-16
    • /
    • 2020
  • 영상 처리 및 컴퓨터 비전 분야에서 하나의 영상을 통해 다른 영상으로 재구성하거나 새로운 영상을 생성하는 문제는 하드웨어의 발전에 따라 꾸준히 주목받고 있다. 그러나 컴퓨터를 통해 생성한 이미지를 사람의 눈으로 바라봤을 때 자연스럽지 않다는 문제 또한 계속해서 대두되고 있다. 최근 딥러닝 분야에 대한 연구가 활발히 진행됨에 따라 이를 활용한 영상 생성 및 개선 문제 또한 활발히 연구되고 있으며 그 중에서도 적대적 생성 신경망(Generative Adversarial Network)이라는 네트워크가 영상 생성 분야에 있어 좋은 결과를 보이고 있다. 적대적 생성 신경망이 제안된 이후 이를 기반으로 하는 다양한 네트워크가 제시됨에 따라 영상 생성 분야에서 더 자연스러운 영상을 생성하는 것이 가능해졌다. 그 중 pix2pix은 조건 적대적 생성 신경망 모델로 다양한 데이터셋에서도 좋은 성능을 보이는 범용적인 네트워크이다. pix2pix는 U-Net을 기반으로 두고 있으나 U-Net을 기반으로 하는 네트워크 중에서는 더 좋은 성능을 보이는 네트워크가 다수 존재한다. 때문에 본 연구에서는 pix2pix의 U-Net에 다양한 네트워크를 적용해 영상을 생성하고 그 결과를 상호 비교 평가한다. 각 네트워크를 통해 생성된 영상을 통해 기존의 U-Net을 사용한 pix2pix 모델보다 어텐션, R2, 어텐션-R2 네트워크를 적용한 pix2pix 모델이 더 좋은 성능을 보이는 것을 확인하고 그 중 가장 성능이 뛰어난 네트워크의 한계점을 향후 연구로 제시한다.

수학교육을 위한 화상교육 시스템의 설계 (Design of Real-Time Video System for Mathematics Education)

  • 박지수;최범순
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권1호
    • /
    • pp.29-34
    • /
    • 2021
  • 실시간 화상교육은 원격지에서 강의자와 학습자의 면대면 교육을 대체하는 효과적인 수업 운영방식으로 활용되고 있다. 하지만 기존의 영상통화 및 화상회의 시스템을 활용하는 형태가 주를 이루고 있으며 이는 영상을 통한 강의에 치중하게 되어 어학교육에서 효과성을 보이고 있다. 그러나 그 외의 교육에서는 활용도가 미비한 실정이다. 최근 코로나로 인해 영상 중심의 화상 교육이 있으면서 화상 회의 시스템이 가지는 영상 중심 화상교육의 제한점을 개선하여 강의자와 학습 참여자 모두에게 수업 중 활용할 수 있는 기능을 제공한다. 본 논문에서는 수학교육에서 효과성을 향상시킬 수 있는 실시간 화상 시스템의 설계 모델을 제시한다.

funcGNN과 Siamese Network의 코드 유사성 분석 성능비교 (Comparison of Code Similarity Analysis Performance of funcGNN and Siamese Network)

  • 최동빈;조인수;박용범
    • 반도체디스플레이기술학회지
    • /
    • 제20권3호
    • /
    • pp.113-116
    • /
    • 2021
  • As artificial intelligence technologies, including deep learning, develop, these technologies are being introduced to code similarity analysis. In the traditional analysis method of calculating the graph edit distance (GED) after converting the source code into a control flow graph (CFG), there are studies that calculate the GED through a trained graph neural network (GNN) with the converted CFG, Methods for analyzing code similarity through CNN by imaging CFG are also being studied. In this paper, to determine which approach will be effective and efficient in researching code similarity analysis methods using artificial intelligence in the future, code similarity is measured through funcGNN, which measures code similarity using GNN, and Siamese Network, which is an image similarity analysis model. The accuracy was compared and analyzed. As a result of the analysis, the error rate (0.0458) of the Siamese network was bigger than that of the funcGNN (0.0362).

스테레오 카메라를 이용한 판류형 간판의 규격 판별 (Identifying Specifications of Flat Type Signboards Using a Stereo Camera)

  • 권상일;김의명
    • 한국측량학회지
    • /
    • 제38권1호
    • /
    • pp.69-83
    • /
    • 2020
  • 간판은 보행자의 안전과 도심의 재난 예방을 위해 국가법령에 따라 간판의 규격이 정해져 있다. 간판은 규격에 따라 설치되어야 하지만 오랜 기간 동안 설치되어온 다수의 간판과 빈번하게 변화하는 점포로 인해 간판을 체계적으로 관리하기가 수월하지 않다. 이에 본 연구에서는 규격에 어긋나는 간판을 판별하는 방법론을 제안하였다. 이를 위해, 스테레오 카메라를 이용하여 간판을 촬영한 후 영상에서 간판의 3차원 좌표를 결정하여 간판의 가로와 세로 크기를 계산하여 간판의 규격을 판별하였다. 스테레오 카메라의 내부표정요소와 상호표정요소를 결정하기 위해서 실외의 3차원 건물을 검정장으로 사용하였다. 그리고 나서 약 15m ~ 22m 거리에서 촬영한 간판 영상에서 딥러닝을 이용하여 간판의 네 꼭지점에 대한 영상좌표를 추출하였다. 스테레오 카메라의 내부표정요소와 상호표정요소 그리고 간판의 네 꼭지점에 대한 영상좌표를 이용하여 간판의 3차원 좌표를 결정한 후 간판의 가로 및 세로 크기를 계산한 결과 평균적으로 약 2.7cm의 오차가 있었다. 10개의 판류형 간판에 대한 규격을 살펴본 결과 가로 크기는 모두 규격을 준수하였으나, 세로 크기는 평균적으로 약 36.5cm를 초과하였다. 이를 통해 판류형 간판의 정비가 필요한 것을 알 수 있었다.

후두내시경 영상에서의 라디오믹스에 의한 병변 분류 연구 (Research on the Lesion Classification by Radiomics in Laryngoscopy Image)

  • 박준하;김영재;우주현;김광기
    • 대한의용생체공학회:의공학회지
    • /
    • 제43권5호
    • /
    • pp.353-360
    • /
    • 2022
  • Laryngeal disease harms quality of life, and laryngoscopy is critical in identifying causative lesions. This study extracts and analyzes using radiomics quantitative features from the lesion in laryngoscopy images and will fit and validate a classifier for finding meaningful features. Searching the region of interest for lesions not classified by the YOLOv5 model, features are extracted with radionics. Selected the extracted features are through a combination of three feature selectors, and three estimator models. Through the selected features, trained and verified two classification models, Random Forest and Gradient Boosting, and found meaningful features. The combination of SFS, LASSO, and RF shows the highest performance with an accuracy of 0.90 and AUROC 0.96. Model using features to select by SFM, or RIDGE was low lower performance than other things. Classification of larynx lesions through radiomics looks effective. But it should use various feature selection methods and minimize data loss as losing color data.