• 제목/요약/키워드: 영역기반 합성곱 신경망

검색결과 48건 처리시간 0.024초

설명 가능한 이미지 인식을 위한 채널 주의 기반 딥러닝 방법 (Deep Learning Methods for Explainable Image Recognition)

  • 백나;조인휘
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2024년도 춘계학술발표대회
    • /
    • pp.586-589
    • /
    • 2024
  • 본 실험 연구에서는 주의 메커니즘과 컨볼루션 신경망을 결합하여 모델을 개선하는 방법을 탐색하는 딥 러닝 기술을 소개한다. 이 기술은 지도 학습 방식을 위해 공개 데이터 세트의 쓰레기 분류 데이터를 사용하고, Grad-CAM 기술과 채널 주의 메커니즘 SE 를 적용하여 모델의 분류 의사 결정 과정을 더 잘 이해하기 위해 히트 맵을 생성한다. Grad-CAM 기술을 사용하여 히트 맵을 생성하면 분류 중에 모델이 집중하는 영역을 시각화할 수 있다. 이는 모델의 분류 결정을 설명하는 방법을 제공하여 다양한 이미지 카테고리에 대한 모델 결정의 기초를 더 잘 이해할 수 있다. 실험 결과는 전통적인 합성곱 신경망과 비교하여 제안한 방법이 쓰레기 분류 작업에서 더나은 성능을 달성한다는 것을 보여준다. 주의 메커니즘과 히트맵 해석을 결합함으로써 우리 모델은분류 정확도를 향상시킬 수 있다. 이는 실제 응용 분야의 이미지 분류 작업에 큰 의미가 있으며 해석 가능성에 대한 딥 러닝 연구 진행을 촉진하는 데 도움이 된다.

적외선 영상, 라이다 데이터 및 특성정보 융합 기반의 합성곱 인공신경망을 이용한 건물탐지 (Building Detection by Convolutional Neural Network with Infrared Image, LiDAR Data and Characteristic Information Fusion)

  • 조은지;이동천
    • 한국측량학회지
    • /
    • 제38권6호
    • /
    • pp.635-644
    • /
    • 2020
  • 딥러닝(DL)을 이용한 객체인식, 탐지 및 분할하는 연구는 여러 분야에서 활용되고 있으며, 주로 영상을 DL 모델의 학습 데이터로 사용하고 있지만, 본 논문은 영상뿐 아니라 공간정보 특성을 포함하는 다양한 학습 데이터(multimodal training data)를 향상된 영역기반 합성곱 신경망(R-CNN)인 Detectron2 모델 학습에 사용하여 객체를 분할하고 건물을 탐지하는 것이 목적이다. 이를 위하여 적외선 항공영상과 라이다 데이터의 내재된 객체의 윤곽 및 통계적 질감정보인 Haralick feature와 같은 여러 특성을 추출하였다. DL 모델의 학습 성능은 데이터의 수량과 특성뿐 아니라 융합방법에 의해 좌우된다. 초기융합(early fusion)과 후기융합(late fusion)의 혼용방식인 하이브리드 융합(hybrid fusion)을 적용한 결과 33%의 건물을 추가적으로 탐지 할 수 있다. 이와 같은 실험 결과는 서로 다른 특성 데이터의 복합적 학습과 융합에 의한 상호보완적 효과를 입증하였다고 판단된다.

윈도우 주의 모듈 기반 트랜스포머를 활용한 이미지 분류 방법 (Window Attention Module Based Transformer for Image Classification)

  • 김상훈;김원준
    • 방송공학회논문지
    • /
    • 제27권4호
    • /
    • pp.538-547
    • /
    • 2022
  • 최근 소개된 트랜스포머(Transformer)를 이용한 이미지 분류 방법들은 기존 합성곱 신경망 기반 방법 대비 괄목할 만한 성능 향상을 보여주고 있다. 지역적 특성을 효과적으로 고려하기 위해 이미지 영역을 복수의 윈도우 영역으로 나누어 트랜스포머를 적용하는 방법에 대한 연구가 활발히 진행되어 왔으나, 윈도우 간 관계 및 중요도에 대한 학습은 여전히 부족한 상황이다. 본 논문에서는 이러한 문제점을 극복하기 위해 각 윈도우의 중요도를 학습에 반영할 수 있는 트랜스포머 구조를 제안한다. 제안하는 방법은 각 윈도우 영역에 대한 자기주의(Self-attention) 연산을 기반으로 압축과 완전 연결 계층(Fully Connected Layer)을 통해 각 윈도우 영역의 중요도를 계산한다. 계산된 중요도는 윈도우 영역들 간의 관계를 학습한 가중치로써 각 윈도우 영역에 곱해져 특징 값을 재조정 한다. 실험 결과를 통해 제안하는 방법이 기존 트랜스포머 기반 방법의 성능을 효과적으로 향상 시킬 수 있음을 보인다.

시멘트풀의 공극분포특성에 기반한 인장강도 예측 CNN 모델 (CNN Model for Prediction of Tensile Strength based on Pore Distribution Characteristics in Cement Paste)

  • 홍성욱;한동석
    • 한국전산구조공학회논문집
    • /
    • 제36권5호
    • /
    • pp.339-346
    • /
    • 2023
  • 미세구조 특성의 불확실성은 재료 특성에 많은 영향을 준다. 시멘트 기반 재료의 공극 분포 특성은 재료의 역학적 특성에 큰 영향을 미치며, 재료에 랜덤하게 분포되어 있는 많은 공극은 재료의 물성 예측을 어렵게 한다. 공극의 특성 분석과 재료 응답 간의 상관관계 규명에 대한 기존 연구는 통계적 관계 분석에 국한되어 있으며, 그 상관관계가 아직 명확히 규명되어 있지 않다. 본 연구에서는 합성곱 신경망(CNN, convolutional neural network)을 활용한 이미지 기반 데이터 접근법을 통해 시멘트 기반 재료의 역학적 응답을 예측하고, 공극분포와 재료 응답의 상관관계를 분석하였다. 머신러닝을 위한 데이터는 고해상도 마이크로-CT 이미지와 시멘트 기반 재료의 물성(인장강도)로 구성하였다. 재료의 메시 구조 특성을 분석하였으며, 재료의 응답은 상장균열모델(phase-field fracture model)에 기반을 둔 2D 직접 인장(direct tension) 유한요소해석 시뮬레이션을 활용하여 평가하였다. 입력 이미지 영역의 기여도를 분석하여 시편에서 재료 응답 예측에 가장 큰 영향을 미치는 영역을 CNN을 통하여 식별하였다. CNN 과정 중 활성 영역과 공극분포를 비교 분석하여 공극분포특성과 재료 응답의 상관관계를 분석하여 제시하였다.

다목적 애플리케이션을 위한 피사계 심도 기반 후처리 프레임워크 (Depth-of-Field based Post-Processing Framework for Multipurpose Applications)

  • 김동희;김종현
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제63차 동계학술대회논문집 29권1호
    • /
    • pp.253-256
    • /
    • 2021
  • 본 논문에서는 합성곱 신경망을 통해 학습된 DoF(피사계 심도, Depth of field) 네트워크 아키텍처를 이용하여 객체 인식, 시점 추적, 문자 인식, 비사실적 렌더링 등 다양한 애플리케이션에 적용할 수 있는 사후 필터링 기법에 대해 살펴본다. 일반적으로 영상은 포커싱과 아웃포커싱에 의해 사용자의 관심표현이 결정되며, 이를 이용하여 영상 내 중요도를 판단한다. 영상 내에는 수많은 콘텐츠들이 혼재되어 있기 때문에 사용자가 집중적으로 보고 있는 콘텐츠를 찾아내기 어렵다. 본 논문에서는 사용자가 흥미롭고 집중적으로 보고 있는 영역을 DoF 네트워크로 학습시키고, 이를 통해 이전 기법으로는 표현할 수 없었던 DoF 기반 객체 인식, 시점 추적, 문자 인식, 비사실적 렌더링을 효율적으로 표현해낸다.

  • PDF

합성곱 신경망을 이용하는 수퍼픽셀 기반 사과잎 병충해의 분류 (Superpixel-based Apple Leaf Disease Classification using Convolutional Neural Network)

  • 김만배;최창열
    • 방송공학회논문지
    • /
    • 제25권2호
    • /
    • pp.208-217
    • /
    • 2020
  • 원예작물을 카메라로 촬영하여 병해충의 종류를 판단하려는 연구가 오랫동안 있어왔다. 일반적으로 영역분할로 병해충 영역을 추출하고, 통계적 특징을 추출한 후 다양한 기계학습 기법으로 병해충 종류를 판단한다. 최근에는 딥러닝의 종단간 학습으로 병해충을 판별하는 연구가 많이 진행되고 있다. 영역분할은 조명 등의 주변 환경 변화에 따라 만족스러운 성능이 어렵고, 전체 잎 영상을 사용하는 종단간 신경망은 학습 영상과 실제 영상과의 차이 때문에 실제 적용이 어려운 문제가 있다. 이를 해결하기 위해서 본 논문에서는 수퍼픽셀 및 합성곱신경망을 이용하는 병해충 분류 방법을 제안한다. 실험에서는 PlantVilllage의 사과 병충해 영상들을 이용하여 실험한 결과, 분류정확도는 전체영상과 수퍼픽셀이 각각 (98.29, 92.43)%이고, 다변량 F1-score는 각각 (0.98. 0.93)이다. 제안하는 수퍼픽셀 기법은 성능 측면에서 약간 저하되지만, 현실적으로 실제 환경에서 적용 가능함을 확인하였다.

빠른 영역-합성곱 신경망을 이용한 다중 스케일 보행자 검출 방법 (Multi-scale Pedestrian Detection Method using Faster Region-Convolutional Neural Network)

  • 잔꾸억후이;김응태
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2019년도 하계학술대회
    • /
    • pp.1-4
    • /
    • 2019
  • 최근에 딥러닝 기술을 적용한 보행자 검출 연구가 활발히 진행되고 있다. 연구자들은 딥러닝 네트워크를 이용하여 보행자 오검출율을 낮추는 방법에 대해 지속적으로 연구하여 성능을 꾸준히 상승시켰다. 그러나 대부분의 연구는 다중 스케일 보행자가 분포되는 저해상도 영상에서 보행자를 제대로 검출하지 못하는 어려움이 존재한다. 따라서 본 연구에서는 기존의 Faster R-CNN구조를 기반으로 하여 새로운 다중 특징 융합 레이어와 다중 스케일 앵커 박스를 적용하여 보행자 오검출율을 줄이는 MS-FRCNN(Multi-scaleFaster R-CNN)구조를 제안한다. 제안된 방식의 성능 검증을 위해 Caltech 데이터세트를 이용하여 실험한 결과, 제안된 MS-FRCNN방식이 기존의 다른 보행자 검출 방식보다 다중 스케일 보행자 검출에서 medium 조건하에 5%, all 조건하에 3.9% 나아짐을 알 수 있었다.

  • PDF

목조 문화재 영상에서의 크랙을 감지하기 위한 임베딩 유사도 기반 딥러닝 모델 (An Embedding Similarity-based Deep Learning Model for Detecting Displacement in Cultural Asset Images)

  • 강재용;김인기;임현석;곽정환
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.133-135
    • /
    • 2021
  • 본 논문에서는 목조 문화재 영상에서의 변위 현상 중 하나인 크랙이 발생하는 영역을 감지하기 위한 임베딩 유사도 기반 모델을 제안한다. 우선 변위가 존재하지 않는 정상으로만 구성된 학습 이미지는 사전 학습된 합성 곱 신경망을 통과하여 임베딩 벡터들을 추출한다. 그 이후 임베딩 벡터들을 가지고 정상 클래스에 대한 분포의 파라미터 값을 구한다. 실제 추론 과정에 사용되는 테스트 이미지에 대해서도 마찬가지로 임베딩 벡터를 구한다. 그런 다음 테스트 이미지의 임베딩 벡터와 이전에 구한 정상 클래스를 대표하는 가우시안 분포 정보와의 거리를 계산하여 이상치 맵을 생성하여 최종적으로 변위가 존재하는 영역을 감지한다. 데이터 셋으로는 충주시 근처의 문화재에 방문해서 수집한 목조 문화재 이미지를 가지고 정상 및 비정상으로 구분한 데이터 셋을 사용하였다. 실험 결과 우리가 제안한 임베딩 유사도 기반 모델이 목조 문화재에서 크랙이 발생하는 변위 영역을 잘 감지함을 확인하였다. 이러한 결과로부터 우리가 제안한 방법이 목재 문화재의 크랙 현상에 대한 변위 영역 검출에 있어서 매우 적합함을 보여준다.

  • PDF

CCTV 영상으로부터 미세먼지 추정에서 학습영상조합, 기상변수 적용이 결과에 미치는 영향 (Effect of the Learning Image Combinations and Weather Parameters in the PM Estimation from CCTV Images)

  • 원태연;어양담;성홍기;정규수;윤준희
    • 한국측량학회지
    • /
    • 제38권6호
    • /
    • pp.573-581
    • /
    • 2020
  • CCTV영상과 날씨 정보를 이용하여 미세먼지 농도를 추정하는 기법을 제안하고, 이에 대한 실험을 진행하였다. CCTV영상에 대해서는 특정 지점을 포함하는 일부 영역 영상과, 전체 영역 영상을 가지고 합성곱 신경망 (CNN)기반의 딥러닝 기법을 적용하여 PM 지수를 추정하는 방법을 제안하였다. 추가로 딥러닝에 의해서 예측된 결과 값을 습도 및 풍속 두 가지 날씨 특성과 결합한 뒤, 학습 된 회귀 모델을 사용하여 수정된 미세먼지 지수를 계산하는 후처리 실험도 함께 진행하였다. 실험 결과, CCTV영상으로부터 미세먼지 지수 추정 값은 R2가 0.58~0.89를 나타내었고, 측정기가 설치된 일부 영역 영상과 전체 영역 영상을 함께 학습시킨 결과가 가장 우수하였다. 기상변수를 이용한 후처리 적용결과는 실험지역의 모든 경우에 대하여 항상 정확도 향상을 보여주진 않았다.

시각 정보를 활용한 딥러닝 기반 추천 시스템 (A Deep Learning Based Recommender System Using Visual Information)

  • 문현실;임진혁;김도연;조윤호
    • 지식경영연구
    • /
    • 제21권3호
    • /
    • pp.27-44
    • /
    • 2020
  • 사용자의 정보 과부하 문제의 해결을 목표로 하는 추천 시스템은 개인의 선호를 추론하여 이에 부합하는 아이템을 필터링하여 제공한다. 추천 시스템 관련 기법 중 가장 성공적으로 알려져 있는 협업 필터링은 최근까지 다양한 성능 개선 시도가 이루어지고 있으며 여러 분야에 적용되고 있다. 본 연구에서는 이와 같은 협업 필터링의 성공에 기반하여 소비자의 구매 의사결정에 영향을 미칠 수 있는 시각 정보를 추천 시스템에 반영할 수 있는 VizNCS를 제안한다. 이를 위하여 먼저, 비정형 데이터인 시각 정보에서 특징을 추출하기 위해 합성곱 신경망을 사용하였다. 다음으로, 합성곱 신경망으로 부터 도출된 이미지 특성 정보를 추천 시스템에 반영하기 위하여 기존의 딥러닝 기반의 추천 시스템 중 다른 정보로 확장이 용이한 NCF 기법을 응용하였다. 본 연구에서 제안한 VizNCS의 성능 비교 실험 결과 기본 NCF보다 더 높은 성능을 보였으며 카테고리별 성능 비교 실험을 통해 시각 정보에 영향을 받는 카테고리와 그렇지 않은 카테고리를 발견하였다. 결론적으로 본 연구에서 제안한 VizNCS는 시각정보를 개인화된 추천에 직접 활용함에 따라 시각 정보에 영향을 받는 소비자들의 구매의사결정 행태를 반영할 수 있어 추천 시스템 성능 향상에 기여하였다. 또한, 지금까지 활용이 미미했던 이미지 데이터로 추천 시스템의 원천 데이터 영역을 확장함에 따라 다양한 원천 데이터의 활용 방안을 제시하였다.