• 제목/요약/키워드: 이미지 예측 모델

검색결과 212건 처리시간 0.035초

딥러닝 사진 분류기를 활용한 분리배출 가이드 안드로이드 응용 (An Android Application to Guide Waste Sorting using a Deep Learning Image Classifier)

  • 김소영;박소희;김민지;이제민;김형신
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.99-101
    • /
    • 2021
  • 쓰레기 대란, 환경파괴의 상황 속 실제 재활용 쓰레기 가운데 절반 정도만이 재활용되고 있다. 재활용률을 높이기 위해, 올바른 분리배출 방법을 쉽고 편하게 찾을 수 있는 방식이 필요하다. 본 논문에서는 올바른 분리수거를 통해 재활용률을 증진하기 위한 분리수거 분류 서비스를 제안한다. 본 논문은 ResNet-34 모델을 통해 안드로이드 카메라로 촬영한 이미지의 분리배출 클래스를 예측하고 그에 따른 분리배출 가이드를 제공하는 시스템을 설계하였다. 향후 연구에서는 모델의 정확도 향상을 위해 온디바이스와 서버 모델을 분리하고 모델의 개인 맞춤화를 진행할 예정이다.

  • PDF

딥러닝을 이용한 화재 발생 예측 이미지 분할 (Image Segmentation for Fire Prediction using Deep Learning)

  • 김태훈;박종진
    • 한국인터넷방송통신학회논문지
    • /
    • 제23권1호
    • /
    • pp.65-70
    • /
    • 2023
  • 본 논문에서는 화재로부터 실시간으로 화염과 연기를 감지하고 분할하기 위해 딥러닝 모델을 사용하였다. 이를 위해 의미론적 분할에서 우수한 성능을 보이는 U-NET을 사용하고 다중 클래스를 이용하여 화재의 불꽃과 연기를 구분 하였다. 제안된 기법을 이용하여 학습한 결과, 손실 오차와 정확도 값이 각각 0.0486과 0.97996으로 매우 양호하였다. 객체 감지에 사용되는 IOU 값도 0.849로 매우 좋았다. 학습된 모델을 이용하여 학습에 사용하지 않은 화재 이미지를 예측한 결과, 화재의 불꽃과 연기가 잘 감지되고 분할되었으며, 연기의 색상도 잘 구분되었다. 제안된 기법을 이용하여 화재 예측 및 감지 시스템 구축 등에 사용될 수 있다.

화면 간 예측에서 인코딩 정보를 고려한 딥러닝 기반 인루프 필터 (Considering Encoding Information for CNN based In-loop Filter in Inter Video Coding)

  • 김양우;이영렬
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 추계학술대회
    • /
    • pp.143-144
    • /
    • 2020
  • VVC (Versatile Video Coding)는 HEVC이후 차세대 표준 비디오 코딩으로 JVET(Joint Video Exploration)에 의해 2018년 표준화를 시작하였다. VVC에는 복원픽쳐의 변환-양자화에러에 의해 발생한 블로어, 블로킹, 링잉 아티팩트를 감소시키기 위하여 deblocking filter (DF), sample adaptive offset (SAO), adaptive loop filter(ALF)와 같은 모듈을 사용한다. 한편 CNN (Convolutional Neural Network)은 최근 이미지와 비디오 복원에 높은 성능을 보이고 있다. VVC에서 픽쳐는 CTU (Coding Tree Unit)으로 분할되고 각 CTU는 다시 CU (Coding Unit)으로 분할된다. 그리고 인코딩을 위한 중요한 정보들이 Picture, CTU, CU단위로 디코더에 전송된다. 이 논문에서는 화면 간 예측으로 인코딩 된 픽처에서 블록과 픽처정보를 이용한 딥러닝 기반의 인루프 필터 모델을 제안한다. 제안하는 모델은 화면 간 예측에서 QP, 4×4 블록단위의 모션벡터, 참조블록과의 시간적거리, CU의 깊이를 모델에 추가적인 정보로 이용한다.

  • PDF

이미지와 메타데이터를 활용한 CNN 기반의 악성코드 패밀리 분류 기법 (Malware Classification Schemes Based on CNN Using Images and Metadata)

  • 이송이;문봉교;김준태
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 춘계학술발표대회
    • /
    • pp.212-215
    • /
    • 2021
  • 본 논문에서는 딥러닝의 CNN(Convolution Neural Network) 학습을 통하여 악성코드를 실행시키지 않고서 악성코드 변종을 패밀리 그룹으로 분류하는 방법을 연구한다. 먼저 데이터 전처리를 통해 3가지의 서로 다른 방법으로 악성코드 이미지와 메타데이터를 생성하고 이를 CNN으로 학습시킨다. 첫째, 악성코드의 byte 파일을 8비트 gray-scale 이미지로 시각화하는 방법이다. 둘째, 악성코드 asm 파일의 opcode sequence 정보를 추출하고 이를 이미지로 변환하는 방법이다. 셋째, 악성코드 이미지와 메타데이터를 결합하여 분류에 적용하는 방법이다. 이미지 특징 추출을 위해서는 본고에서 제안한 CNN을 통한 학습 방식과 더불어 3개의 Pre-trained된 CNN 모델을 (InceptionV3, Densnet, Resnet-50) 사용하여 전이학습을 진행한다. 전이학습 시에는 마지막 분류 레이어층에서 본 논문에서 선택한 데이터셋에 대해서만 학습하도록 파인튜닝하였다. 결과적으로 가공된 악성코드 데이터를 적용하여 9개의 악성코드 패밀리로 분류하고 예측 정확도를 측정해 비교 분석한다.

Faster R-CNN과 DenseNet을 이용한 도형 상표 비엔나 분류 자동화 연구 (A Study on Trademark Vienna Classification Automation Using Faster R-CNN and DenseNet)

  • 이진우;김홍기;이하영;고봉수;이봉건
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.848-851
    • /
    • 2019
  • 이미지 형식으로 등록되는 상표의 특성상 상표의 검색에는 어려움이 따른다. 특허청은 도형 상표의 검색을 용이하게 하기 위해 상표가 포함하고 있는 구성요소에 도형분류코드를 부여한다. 하지만 도형 상표에 포함된 이미지를 확인하고 분류코드를 부여하는 과정은 사람이 직접 수행해야 한다는 어려움이 따른다. 이에 본 논문에서는 딥러닝을 이용하여 자동으로 도형 상표 내 객체를 인식하고 분류코드를 부여하는 방안을 제안한다. DenseNet을 이용하여 중분류를 먼저 예측한 후 각 중분류에 해당하는 Faster R-CNN 모델을 이용하여 세분류 예측을 수행하였다. 성능평가를 통해 비엔나분류 중분류별 평균 74.49%의 예측 정확도를 확인하였다.

GAN을 이용한 하이라이트 영상 예측 모델의 성능 개선 (Improving Highlight Prediction Models Using GAN)

  • 이한솔;이계민
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2019년도 추계학술대회
    • /
    • pp.225-227
    • /
    • 2019
  • 최근 다양한 개인방송 플랫폼에 의해 엄청난 양의 콘텐츠가 업로드 되고 있으며 그 중 축구와 야구와 같은 스포츠 영상이 차지하는 비율이 상당하다. 방송사에서는 시청자들이 편의를 위해 경기 영상 중 흥미를 끌거나 또는 중요한 장면을 모아 하이라이트 영상을 만들어 제공하는데, 이는 시간과 비용이 많이 소요되는 문제가 있다. 이에 본 논문에서는 스포츠 영상에서 자동으로 하이라이트를 예측하는 모델을 제안하다. 우리의 모델은 오디오와 이미지 정보를 함께 사용하며, 영상의 단기적 전후관계와 중장기적 흐름을 동시에 파악하는 모델을 제시한다. 또한 좋은 특징벡터를 추출하기 위해 GAN을 결합하는 방법을 설명한다. 제안하는 모델들을 야구 경기 영상을 이용하여 평가한다.

  • PDF

객체 중심 증강 기법을 사용한 목조 문화재 영상에서의 변위 감지 모델 (An Displacement Detection Model in Cultural Asset Images using Object-centric Augmentation)

  • 강재용;김인기;임현석;곽정환
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.137-139
    • /
    • 2021
  • 본 논문에서는 목조 문화재 영상에서의 변위를 효율적으로 감지하기 위한 객체 중심 증강 기법을 사용한 모델을 제안한다. 우선 객체 중심 증강 기법을 적용하여 변위 객체들이 이미지 공간상의 어느 곳이든 위치할 수 있게끔 데이터를 구성한 이후 사전 학습된 합성 곱 신경망을 사용하여 입력 이미지에 대한 심층 특징 벡터를 추출한다. 그 이후 심층 특징 벡터는 완전 연결 계층의 입력 값으로 들어와서 최종적으로 변위가 존재하는지 아닌지에 대한 예측을 수행하게 된다. 데이터 셋으로는 충주시 근처의 문화재에 방문해서 수집한 목조 문화재 이미지를 가지고 정상 및 비정상으로 구분한 데이터 셋을 사용하였다. 실험 결과 우리가 제안한 객체 중심 증강 기법을 사용한 모델이 객체 중심 증강 기법을 사용하지 않은 모델보다 목조 문화재에서 변위 영역을 더 잘 감지함을 확인하였다. 이러한 결과로부터 우리가 제안한 방법이 목재 문화재의 변위 검출에 있어서 매우 적합함을 보여준다.

  • PDF

YOLO 신경망 기반의 UAV 영상을 이용한 건물 객체 탐지 분석 (Analysis of Building Object Detection Based on the YOLO Neural Network Using UAV Images)

  • 김준석;홍일영
    • 한국측량학회지
    • /
    • 제39권6호
    • /
    • pp.381-392
    • /
    • 2021
  • 본 연구에서는 UAV (Unmanned Aerial Vehicle)로 촬영한 이미지를 활용하여 수치지도 지형지물 표준 코드에서 정의하고 있는 건물 8종에 대하여 딥러닝 기반의 객체 탐지 분석을 수행하였다. UAV로 촬영한 이미지 509매에 대하여 이미지 라벨링을 하였고 YOLO (You Only Look Once) v5 모델을 적용하여 학습 및 추론을 진행하였다. 실험 및 분석은 오픈소스 기반의 분석 플랫폼과 알고리즘을 적용하여 데이터를 분석하였으며 분석결과 88%~98%의 예측 확률로 건물 객체를 탐지하였다. 또한 학습데이터의 구축 및 반복 학습의 과정에서 건물 객체 탐지의 높은 정확도를 위해 필요한 학습 방식 및 모델 구축방식을 분석하였고, 학습한 모델을 다른 영상자료에 적용하는 방안을 모색하였다. 본 연구를 통해 고효율 심층 신경망과 공간정보데이터가 융합하는 모델을 제안하며 공간정보데이터와 딥러닝 기술의 융합은 향후 공간정보데이터 구축의 효율성, 분석 및 예측의 정확도 향상에 많은 도움을 제공할 것이다.

CNN 을 활용한 수박 당도 예측 (Prediction of the Sugar Content of Watermelon based on Convolutional Neural Network)

  • 강다영;김채민;유근영;이다형;김현희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.618-621
    • /
    • 2021
  • 수박의 이미지와 수박의 무게 데이터를 활용해 수박의 당도를 예측하고 모델의 정확도를 측정한다. 과피가 얇고, 부피가 작은 과일의 경우 휴대용 비파괴 당도 측정기를 통해 비교적 간편하게 당도 측정이 가능하다. 하지만 수박은 과피도 두껍고, 부피도 크기 때문에 넓은 장소와 비용을 부담해야 하는 선별장에만 당도를 측정할 수 있는 실정이다. 본 논문에서는 줄무늬가 끊어지지 않고, 원형이 아닌 타원형이 맛있는 수박이라는 속설에 부합하는 수박이 실제로 맛있는 수박인지를 확인하고자 수박 이미지를 수집하여 당도에 따라 이미지를 분류한 다음, CNN 을 적용하여 수박 당도 예측을 실시하였다. 실험 결과 타원형 수박은 당도가 높은 것으로 나타났으나 줄무늬가 끊어진 수박과 끊어지지 않은 수박 간의 당도 차이는 없는 것으로 나타났다. 향후 수박의 당도에 영향을 미칠 수 있는 다양한 변수를 활용하여 정확도를 높인다면 현재 사용되고 있는 비파괴 당도 측정기를 보완할 수 있을 것으로 기대된다.

임의의 잡음 신호 추가를 활용한 적대적으로 생성된 이미지 데이터셋 탐지 방안에 대한 연구 (Random Noise Addition for Detecting Adversarially Generated Image Dataset)

  • 황정환;윤지원
    • 한국정보전자통신기술학회논문지
    • /
    • 제12권6호
    • /
    • pp.629-635
    • /
    • 2019
  • 여러 분야에서 사용되는 이미지 분류를 위한 딥러닝(Deep Learning) 모델은 오류 역전파 방법을 통해 미분을 구현하고 미분 값을 통해 예측 상의 오류를 학습한다. 엄청난 계산량을 향상된 계산 능력으로 해결하여, 복잡하게 설계된 모델에서도 파라미터의 전역 (혹은 국소) 최적점을 찾을 수 있다는 것이 장점이다. 하지만 정교하게 계산된 데이터를 만들어내면 이 딥러닝 모델을 '속여' 모델의 예측 정확도와 같은 성능을 저하시킬 수 있다. 이렇게 생성된 적대적 사례는 딥러닝을 저해할 수 있을 뿐 아니라, 사람의 눈으로는 쉽게 발견할 수 없도록 정교하게 계산되어 있다. 본 연구에서는 임의의 잡음 신호를 추가하는 방법을 통해 적대적으로 생성된 이미지 데이터셋을 탐지하는 방안을 제안한다. 임의의 잡음 신호를 추가하였을 때 일반적인 데이터셋은 예측 정확도가 거의 변하지 않는 반면, 적대적 데이터셋의 예측 정확도는 크게 변한다는 특성을 이용한다. 실험은 공격 기법(FGSM, Saliency Map)과 잡음 신호의 세기 수준(픽셀 최댓값 255 기준 0-19) 두 가지 변수를 독립 변수로 설정하고 임의의 잡음 신호를 추가하였을 때의 예측 정확도 차이를 종속 변수로 설정하여 시뮬레이션을 진행하였다. 각 변수별로 일반적 데이터셋과 적대적 데이터셋을 구분하는 탐지 역치를 도출하였으며, 이 탐지 역치를 통해 적대적 데이터셋을 탐지할 수 있었다.