• 제목/요약/키워드: Deep-Learning

검색결과 5,648건 처리시간 0.03초

모바일 디바이스 화면의 클릭 가능한 객체 탐지를 위한 싱글 샷 디텍터 (Single Shot Detector for Detecting Clickable Object in Mobile Device Screen)

  • 조민석;전혜원;한성수;정창성
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권1호
    • /
    • pp.29-34
    • /
    • 2022
  • 모바일 디바이스 화면상의 클릭 가능한 객체를 인지하기 위한 데이터셋을 구축하고 새로운 네트워크 구조를 제안한다. 모바일 디바이스 화면에서 클릭 가능한 객체를 기준으로 다양한 해상도를 가진 디바이스에서 여러 애플리케이션을 대상으로 데이터를 수집하였다. 총 24,937개의 annotation data를 text, edit text, image, button, region, status bar, navigation bar의 7개 카테고리로 세분화하였다. 해당 데이터셋을 학습하기 위한 모델 구조는 Deconvolution Single Shot Detector를 베이스라인으로, backbone network는 기존 ResNet에 Squeeze-and-Excitation block을 추가한 Squeeze-and-Excitation networks를 사용하고, Single shot detector layers와 Deconvolution module을 Feature pyramid networks 형태로 쌓아 올려 header와 연결한다. 또한, 기존 input resolution의 1:1 비율에서 오는 특징의 손실을 최소화하기 위해 모바일 디바이스 화면과 유사한 1:2 비율로 변경하였다. 해당 모델을 구축한 데이터셋에 대하여 실험한 결과 베이스라인에 대비하여 mean average precision이 최대 101% 개선되었다.

비디오 인코더를 통한 딥러닝 모델의 정수 가중치 압축 (Compression of DNN Integer Weight using Video Encoder)

  • 김승환;류은석
    • 방송공학회논문지
    • /
    • 제26권6호
    • /
    • pp.778-789
    • /
    • 2021
  • 최근 다양한 분야에서 뛰어난 성능을 나타내는 Convolutional Neural Network(CNN)모델을 모바일 기기에서 사용하기 위한 다양한 연구가 진행되고 있다. 기존의 CNN 모델은 모바일 장비에서 사용하기에는 가중치의 크기가 크고 연산복잡도가 높다는 문제점이 있다. 이를 해결하기 위해 가중치의 표현 비트를 낮추는 가중치 양자화를 포함한 여러 경량화 방법들이 등장하였다. 많은 방법들이 다양한 모델에서 적은 정확도 손실과 높은 압축률을 나타냈지만, 대부분의 압축 모델들은 정확도 손실을 복구하기 위한 재학습 과정을 포함시켰다. 재학습 과정은 압축된 모델의 정확도 손실을 최소화하지만 많은 시간과 데이터를 필요로 하는 작업이다. Weight Quantization이후 각 층의 가중치는 정수형 행렬로 나타나는데 이는 이미지의 형태와 유사하다. 본 논문에서는 Weight Quantization이후 각 층의 정수 가중치 행렬을 이미지의 형태로 비디오 코덱을 사용하여 압축하는 방법을 제안한다. 제안하는 방법의 성능을 검증하기 위해 ImageNet과 Places365 데이터 셋으로 학습된 VGG16, Resnet50, Resnet18모델에 실험을 진행하였다. 그 결과 다양한 모델에서 2%이하의 정확도 손실과 높은 압축 효율을 달성했다. 또한, 재학습 과정을 제외한 압축방법인 No Fine-tuning Pruning(NFP)와 ThiNet과의 성능비교 결과 2배 이상의 압축효율이 있음을 검증했다.

적외선 카메라와 YOLO를 사용한 블랙아이스 탐지 방법 (A Black Ice Detection Method Using Infrared Camera and YOLO)

  • 김형균;장민석;이연식
    • 한국정보통신학회논문지
    • /
    • 제25권12호
    • /
    • pp.1874-1881
    • /
    • 2021
  • 폭설로 인한 도로 미끄러짐과 함께 영하의 기온으로 도로와 차량 통행용 다리, 터널 출입구 쪽에서 주로 발생하는 블랙아이스는 운전자의 시야에서는 아스팔트의 이미지가 투과되어 보이기에 잘 인식되지 않아서 자동차들이 미끄러지는 (슬립 현상) 상황을 발생시키기에 차량이 제동력을 잃어서, 대형 교통사고로 이어져 심각한 인명과 재산상 손실을 초래하고 있다. 본 논문에서는 기존에 연구되었던 블랙아이스 감지 방법들(인공위성 촬영, 초음파 수신으로 미끄러짐의 패턴을 확인, 도로 표면의 온도측정, 차량 주행 중 타이어의 마찰력 차이를 확인하기)의 단점들을 보완하고, 블랙아이스를 감지하는 센서의 크기를 줄여서 많은 이동체에 적용할 수 있도록 하고자 적외선 카메라를 이용하여 도로 상태를 확인하고, 이 정보를 딥러닝 학습을 통하여 블랙아이스를 판별하는 방법을 제안하고자 한다.

동일 이미지 판별을 위해 Faster D2-Net을 이용한 이미지 기반의 애플리케이션 테스트 방법 (Image-Based Application Testing Method Using Faster D2-Net for Identification of the Same Image)

  • 전혜원;조민석;한성수;정창성
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권2호
    • /
    • pp.87-92
    • /
    • 2022
  • 이미지 기반 애플리케이션 테스트는 이미지 구조 비교를 통한 애플리케이션 테스트 방법을 제안한다. 이 연구는 다양한 디바이스 운영체제의 종류나 GUI에 의존 없이 다양한 기기에서 테스트가 가능하다. 기존 연구는 운영체제 변경, 화면상의 애니메이션 실행 그리고 해상도 변경의 경우 정답 이미지와 달라지기 때문에 기존의 경우 각각 변형마다 테스터를 생성해야 했다. 하지만 이 방법은 운영체제 변경, 해상도 크기의 변경, 화면상의 애니메이션 실행과 같은 변화가 발생해도 동일한 기준으로 판별하기 때문에 하나의 테스터로 테스트할 수 있다. 두 이미지의 객체들의 기본 구조를 비교하고 이미지에 차이가 존재하는 영역을 추출해서 Faster D2-Net의 특징점으로 이미지 유사성을 비교한다. Faster D2-Net 개발로 D2-Net보다 연산의 수와 공간적 손실을 줄여 애플리케이션 이미지에서 특징점을 추출하기 적합하고 수행 시간 단축이 가능했다.

사전학습 언어모델을 활용한 범죄수사 도메인 개체명 인식 (A Named Entity Recognition Model in Criminal Investigation Domain using Pretrained Language Model)

  • 김희두;임희석
    • 한국융합학회논문지
    • /
    • 제13권2호
    • /
    • pp.13-20
    • /
    • 2022
  • 본 연구는 딥러닝 기법을 활용하여 범죄 수사 도메인에 특화된 개체명 인식 모델을 개발하는 연구이다. 본 연구를 통해 비정형의 형사 판결문·수사 문서와 같은 텍스트 기반의 데이터에서 자동으로 범죄 수법과 범죄 관련 정보를 추출하고 유형화하여, 향후 데이터 분석기법을 활용한 범죄 예방 분석과 수사에 기여할 수 있는 시스템을 제안한다. 본 연구에서는 범죄 수사 도메인 텍스트를 수집하고 범죄 분석의 관점에서 필요한 개체명 분류를 새로 정의하였다. 또한 최근 자연어 처리에서 높은 성능을 보이고 있는 사전학습 언어모델인 KoELECTRA를 적용한 제안 모델은 본 연구에서 정의한 범죄 도메인 개체명 실험 데이터의 9종의 메인 카테고리 분류에서 micro average(이하 micro avg) F1-score 99%, macro average(이하 macro avg) F1-score 96%의 성능을 보이고, 56종의 서브 카테고리 분류에서 micro avg F1-score 98%, macro avg F1-score 62%의 성능을 보인다. 제안한 모델을 통해 향후 개선 가능성과 활용 가능성의 관점에서 분석한다.

햇빛 아래에서 향상된 시인성을 위한 Piece-wise Linear Enhancement Curves 기반 영상 개선 (Image Enhancement based on Piece-wise Linear Enhancement Curves for Improved Visibility under Sunlight)

  • 이준민;송병철
    • 방송공학회논문지
    • /
    • 제27권5호
    • /
    • pp.812-815
    • /
    • 2022
  • 햇빛 아래에서 디지털 기기에 표시되는 영상은 일반적으로 원본 영상보다 어둡게 인식되어 시인성이 저하된다. 더 나은 시인성을 위해서, 주변광에 적응적인 전역 휘도 보상 혹은 톤 매핑이 필요하다. 하지만 기존의 기법들은 색차 보상에 한계가 존재하고, 무거운 계산 비용 때문에 실제 환경에서 활용하는데 어려움이 존재한다. 이를 해결하기 위해 본 논문에서는 휘도와 색차를 모두 보상하는 Piece-wise Linear Enhancement Curves (PLECs) 기반 영상 개선 기법을 제안한다. 이때, PLECs은 딥러닝을 통해 회귀 되며, lookup table 형식으로 구현되어 실시간 동작이 가능하다. 실험 결과 제안 방법이 낮은 계산 비용으로 원본 영상 대비 더 나은 시인성을 가짐을 보인다

SpaceNet 건물 데이터셋과 Context-based ResU-Net을 이용한 건물 자동 추출 (Automatic Building Extraction Using SpaceNet Building Dataset and Context-based ResU-Net)

  • 유수홍;김철환;권영목;최원준;손홍규
    • 대한원격탐사학회지
    • /
    • 제38권5_2호
    • /
    • pp.685-694
    • /
    • 2022
  • 건물 정보는 다양한 도시 공간 분석에 활용되는 필수 정보 중 하나이기에 지속적인 모니터링이 필요하지만 현실적으로 어려움이 존재하고 있다. 이를 위해 광범위한 지역에 대해서도 지속적인 관찰이 가능한 위성영상으로부터 건물을 추출하기 위한 연구가 진행되고 있으며, 최근에는 딥러닝 기반의 시맨틱 세그멘테이션 기법들이 활용되고 있다. 본 연구에서는 SpaceNet의 건물 v2 무료 오픈 데이터를 이용하여 30 cm 급 Worldview-3 RGB 영상으로부터 건물을 자동으로 추출하기 위해, context-based ResU-Net의 일부 구조를 변경하여 학습을 진행하였다. 분류 정확도 평가 결과, f1-score가 2회차 SpaceNet 대회 수상작의 분류 정확도보다 높은 것으로 나타났다. 앞으로 지속적으로 Worldview-3 위성 영상을 확보할 수 있다면 본 연구의 성과를 활용하여 전세계 건물 자동 추출 모델을 제작하는 것도 가능할 것으로 판단된다.

컨볼루션 신경망(CNN)을 이용한 폭발물 성분 용량별 분류 성능 평가에 관한 연구 (A Study on the Evaluation of Classification Performance by Capacity of Explosive Components using Convolution Neural Network (CNN))

  • 이창현;조성윤;권기원;임태호
    • 인터넷정보학회논문지
    • /
    • 제23권4호
    • /
    • pp.11-19
    • /
    • 2022
  • 본 논문은 컨볼루션 신경망(CNN)을 이용하여 폭발물 성분의 용량별로 분류할 때의 성능을 평가하는 연구이다. 기존의 폭발물 분류 방식 중에 IMS 증기 탐지기 방식은 폭발물의 농도가 사용자가 장비에서 설정한 임계치를 넘어야만 폭발물의 존재 여부를 판단한다. IMS 증기 탐지기는 폭발물이 존재하더라도 임계치를 넘지 않는 양이면 폭발물이 존재하지 않는다고 판단하는 문제가 있다. 따라서 폭발물 성분의 농도가 임계치를 넘지 않는 양일 때에도 폭발물 성분을 검출하는 방안이 필요하다. 이에 따라 본 논문에서는 폭발물 시계열 데이터를 Gramian Angular Field(GAF) 알고리즘으로 이미지화를 진행한 후 이미지와 영상처리뿐만 아니라 시계열 데이터 처리에도 뛰어난 성능을 보이는 딥러닝 모델인 컨볼루션 신경망(CNN)으로 직접 label을 설정해서 지도학습을 진행한 결과 폭발물 성분의 농도가 임계치를 넘지 않는 양일 때에도 폭발물 성분이 존재한다고 판단함과 동시에 폭발물 성분의 종류와 폭발물 성분의 농도의 양을 같이 판단할 수 있는지 성능평가를 진행했다.

영농형 태양광 발전소에서 순환신경망 기반 발전량 예측 시스템 (Recurrent Neural Network based Prediction System of Agricultural Photovoltaic Power Generation)

  • 정설령;고진광;이성근
    • 한국전자통신학회논문지
    • /
    • 제17권5호
    • /
    • pp.825-832
    • /
    • 2022
  • 본 논문은 영농형 태양광 발전 시스템의 전력 생산량을 수집·저장하여 지능적인 예측 모델을 구현하기 위한 예측 및 진단 모델의 설계와 구현에 대해 논한다. 제안된 모델은 시계열 데이터에 특화된 순환신경망 기법인 RNN, LSTM, GRU 모델을 이용하여 태양광 발전량을 예측하고 각 모델의 하이퍼 파라미터를 다르게 주어 비교 분석하고, 성능을 평가했다. 그 결과 세 모델 모두 MSE, RMSE 지표는 0에 매우 가까우며, R2 지표는 1에 가까운 성능을 보였다. 이를 통해 제안하는 예측 모델은 태양광 발전량을 예측하기에 적합한 모델임을 알 수 있고, 이러한 예측을 이용하여 영농형 태양광 시스템에서 지능적인 운영관리 기능에 적용될 수 있음을 보였다.

미소 픽셀을 갖는 비행 객체 인식을 위한 데이터베이스 구축 및 관리시스템 연구 (Database Generation and Management System for Small-pixelized Airborne Target Recognition)

  • 이호섭;신희민;심현철;조성욱
    • 항공우주시스템공학회지
    • /
    • 제16권5호
    • /
    • pp.70-77
    • /
    • 2022
  • 본 논문에서, 데이터베이스 생성 및 관리 시스템은 미소 픽셀 공중 표적 인식을 위해 제안된다. 제안된 시스템은 1)비행 테스트 비디오 프레임에 의한 직접 이미지 추출, 2) 자동 이미지 보관, 3) 이미지 데이터 레이블링 및 메타 데이터 주석, 4) 컬러 채널 변환, 5) HOG/LBP 기반 소화소 대상 증강 이미지 데이터 생성의 다섯가지 주요 기능으로 구성된다. 제안하는 프로그램은 파이썬 기반의 PyQt5와 OpenCV를 이용하여 구성하였고 공중 표적 인식을 위한 이미지 데이터셋은 제안한 시스템을 이용해 생성했으며 비행 실험으로 부터 수집된 영상을 입력영상으로 사용하였다.