• 제목/요약/키워드: 합성 데이터 셋

검색결과 136건 처리시간 0.024초

Split-Attention 백본 네트워크를 활용한 차선 인식에 관한 연구 (A Study on Lane Detection Based on Split-Attention Backbone Network)

  • 송인서;이선우;권장우;원종훈
    • 한국ITS학회 논문지
    • /
    • 제19권5호
    • /
    • pp.178-188
    • /
    • 2020
  • 본 논문에서는 split-attention 네트워크를 백본으로 특징을 추출하는 차선인식 CNN 네트워크를 제안한다. split-attention은 CNN의 특징 추출 과정에서 feature map의 각 channel에 가중치를 부여하는 방법으로, 빠르게 변화하는 자동차의 주행 환경에서 안정적으로 이미지의 특징을 추출할 수 있다. Tusimple 데이터 셋을 활용하여 본 논문에서 제안하는 네트워크를 학습·평가하였으며, 백본 네트워크의 레이어 수에 따른 성능 변화를 비교·분석 하였다. 평가 결과 최대 96.26%의 정확도로 최신 연구에 준하는 결과를 얻었으며, FP의 경우 0.0234(2.34%)로 비교 연구 중 가장 좋은 결과를 보여준다. 따라서, 실제 차량의 주행 환경 등에서도 본 연구에서 제안하는 모델을 사용하여 오인식 없이 안정적인 차선 인식이 가능하다.

자기 주의 증류를 이용한 심층 신경망 기반의 그림자 제거 (Shadow Removal based on the Deep Neural Network Using Self Attention Distillation)

  • 김진희;김원준
    • 방송공학회논문지
    • /
    • 제26권4호
    • /
    • pp.419-428
    • /
    • 2021
  • 그림자 제거는 객체 추적 및 검출 등 영상처리 기술의 핵심 전처리 요소이다. 최근 심층 합성곱 신경망 (Deep Convolutional Neural Network) 기반의 영상 인식 기술이 발전함에 따라 심층 학습을 이용한 그림자 제거 연구들이 활발히 진행되고 있다. 본 논문에서는 자기 주의 증류(Self Attention Distillation)를 이용하여 심층 특징을 추출하는 새로운 그림자 제거 방법을 제안한다. 제안된 방법은 각 층에서 추출된 그림자 검출 결과를 하향식 증류를 통해 점진적으로 정제한다. 특히, 그림자 검출 결과에 대한 정답을 이용하지 않고 그림자 제거를 위한 문맥적 정보를 형성함으로써 효율적인 심층 신경망 학습을 수행한다. 그림자 제거를 위한 다양한 데이터 셋에 대한 실험 결과를 통해 제안하는 방법이 실제 환경에서 발생한 그림자 제거에 효과적임을 보인다.

주 객체 위치 검출을 위한 Grad-CAM 기반의 딥러닝 네트워크 (Grad-CAM based deep learning network for location detection of the main object)

  • 김선진;이종근;곽내정;류성필;안재형
    • 한국정보통신학회논문지
    • /
    • 제24권2호
    • /
    • pp.204-211
    • /
    • 2020
  • 본 논문에서는 약한 지도학습을 통한 주 객체 위치 검출을 위한 최적의 딥러닝 네트워크 구조를 제안한다. 제안된 네트워크는 약한 지도학습을 통한 주 객체의 위치 검출 정확도를 향상시키기 위해 컨벌루션 블록을 추가하였다. 추가적인 딥러닝 네트워크는 VGG-16을 기반으로 합성곱 층을 더해주는 5가지 추가적인 블록으로 구성되며 객체의 실제 위치 정보가 필요하지 않는 약한 지도 학습의 방법으로 학습하였다. 또한 객체의 위치 검출에는 약한 지도학습의 방법 중, CAM에서 GAP이 필요하다는 단점을 보완한 Grad-CAM을 사용하였다. 제안한 네트워크는 CUB-200-2011 데이터 셋을 이용하여 성능을 테스트하였으며 Top-1 Localization Error를 산출하였을 때 50.13%의 결과를 얻을 수 있었다. 또한 제안한 네트워크는 기존의 방법보다 주 객체를 검출하는데 더 높은 정확도를 보인다.

딥러닝 기반 음향 신호 대역 확장 시스템 (Deep Learning based Raw Audio Signal Bandwidth Extension System)

  • 김윤수;석종원
    • 전기전자학회논문지
    • /
    • 제24권4호
    • /
    • pp.1122-1128
    • /
    • 2020
  • 대역 확장(Bandwidth Extension)이란 채널 용량 부족 혹은 이동통신 기기에 탑재된 코덱의 특성으로 인해 부호화 및 복호화 과정에서 대역 제한(band limited)되거나 손상된 협대역 신호(NB, Narrow Band)를 복원, 확장하여 광대역 신호(WB, Wide Band)로 전환 시켜주는 것을 의미한다. 대역 확장 연구는 주로 음성 신호 위주로 대역 복제(SBR, Spectral Band Replication), IGF(Intelligent Gap Filling)과 같이 고대역을 주파수 영역으로 변환하여 복잡한 특징 추출 과정을 거쳐 이를 바탕으로 사라지거나 손상된 고대역을 복원한다. 본 논문에서는 딥러닝 모델 중 오토인코더(Autoencoder)를 바탕으로 1차원 합성곱 신경망(CNN, Convolutional Neural Network)들의 잔차 연결을 활용하여 복잡한 사전 전처리 과정 없이 일정한 길이의 시간 영역 신호를 입력시켜 대역 확장 시킨 음향 신호를 출력하는 모델을 제안한다. 또한 음성 영역에 제한되지 않는 음악을 포함한 여러 종류의 음원을 포함하는 데이터셋에 훈련시켜도 손상된 고대역을 복원할 수 있음을 확인하였다.

Deep Learning-Based Brain Tumor Classification in MRI images using Ensemble of Deep Features

  • Kang, Jaeyong;Gwak, Jeonghwan
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권7호
    • /
    • pp.37-44
    • /
    • 2021
  • 뇌 MRI 영상의 자동 분류는 뇌종양의 조기 진단을 하는 데 있어 중요한 역할을 한다. 본 연구에서 우리는 심층 특징 앙상블을 사용한 MRI 영상에서의 딥 러닝 기반 뇌종양 분류 모델을 제안한다. 우선 사전 학습된 3개의 합성 곱 신경망을 사용하여 입력 MRI 영상에 대한 심층 특징들을 추출한다. 그 이후 추출된 심층 특징들은 완전 연결 계층들로 구성된 분류 모듈의 입력 값으로 들어간다. 분류 모듈에서는 우선 3개의 서로 다른 심층 특징들 각각에 대해 먼저 완전 연결 계층을 거쳐 특징 차원을 줄인다. 그 이후 3개의 차원이 준 특징들을 결합하여 하나의 특징 벡터를 생성한 뒤 다시 완전 연결 계층의 입력값으로 들어가서 최종적인 분류 결과를 예측한다. 우리가 제안한 모델을 평가하기 위해 웹상에 공개된 뇌 MRI 데이터 셋을 사용하였다. 실험 결과 우리가 제안한 모델이 다른 기계학습 기반 모델보다 더 좋은 성능을 나타냄을 확인하였다.

인공신경망을 이용한 USB 인식 시스템 (A USB classification system using deep neural networks)

  • 우세형;박지수;은성배;차신
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.535-538
    • /
    • 2022
  • IoT 디바이스의 Plug & Play를 위하여 IoT 디바이스의 대표적인 유선 인터페이스인 USB의 종류를 이미지를 통하여 인식하는 모듈을 개발한다. IoT 디바이스를 구동시키기 위해서는 통신 및 디바이스 하드웨어를 구동하기 위한 드라이버가 필요하다. IoT 디바이스에 연결되는 유선 인터페이스를 스마트폰의 카메라 촬영을 통하여 얻은 이미지를 이용하여서 해당 통신 인터페이스를 인식한다. 대표적인 유선 인터페이스인 USB에 대하여 인공신경망 기반의 기계학습을 통하여 USB의 종류를 분류한다. 인공신경망의 충분한 학습을 위하여 인터넷을 통하여 USB 이미지를 수집하고, 이미지 처리를 통하여 추가적인 이미지 데이터 셋을 확보한다. 합성곱 신경망과 더불어서 다양한 심층 인공신경망으로 인식기를 구현하여서 그 성능을 비교, 평가한다.

  • PDF

다중 클래스 이상치 탐지를 위한 계층 CNN의 효과적인 클래스 분할 방법 (Effective Classification Method of Hierarchical CNN for Multi-Class Outlier Detection)

  • 김지현;이세영;김예림;안서영;박새롬
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.81-84
    • /
    • 2022
  • 제조 산업에서의 이상치 검출은 생산품의 품질과 운영비용을 절감하기 위한 중요한 요소로 최근 딥러닝을 사용하여 자동화되고 있다. 이상치 검출을 위한 딥러닝 기법에는 CNN이 있으며, CNN을 계층적으로 구성할 경우 단일 CNN 모델에 비해 상대적으로 성능의 향상을 보일 수 있다는 것이 많은 선행 연구에서 나타났다. 이에 MVTec-AD 데이터셋을 이용하여 계층 CNN이 다중 클래스 이상치 판별 문제에 대해 효과적인지를 탐구하고자 하였다. 실험 결과 단일 CNN의 정확도는 0.7715, 계층 CNN의 정확도는 0.7838로 다중 클래스 이상치 판별 문제에 있어 계층 CNN 방식 접근이 다중 클래스 이상치 탐지 문제에서 알고리즘의 성능을 향상할 수 있음을 확인할 수 있었다. 계층 CNN은 모델과 파라미터의 개수와 리소스의 사용이 단일 CNN에 비하여 기하급수적으로 증가한다는 단점이 존재한다. 이에 계층 CNN의 장점을 유지하며 사용 리소스를 절약하고자 하였고 K-means, GMM, 계층적 클러스터링 알고리즘을 통해 제작한 새로운 클래스를 이용해 계층 CNN을 구성하여 각각 정확도 0.7930, 0.7891, 0.7936의 결과를 얻을 수 있었다. 이를 통해 Clustering 알고리즘을 사용하여 적절히 물체를 분류할 경우 물체에 따른 개별 상태 판단 모델을 제작하는 것과 비슷하거나 더 좋은 성능을 내며 리소스 사용을 줄일 수 있음을 확인할 수 있었다.

  • PDF

Gaussian Blending: Improved 3D Gaussian Splatting for Model Light-Weighting and Deep Learning-Based Performance Enhancement

  • Yeong-In Lee;Jin-Nyeong Heo;Ji-Hwan Moon;Ha-Young Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권8호
    • /
    • pp.23-32
    • /
    • 2024
  • NVS는 여러 각도와 위치에서 수집한 이미지를 이용해 3차원 공간을 재현하는 연구 분야로, 증강현실, 가상현실, 자율주행, 로봇 네비게이션 등에서 중요성이 커지고 있다. 최근 주목받는 3D-GS 방법론은 기존 NeRF 보다 고품질 장면 생성, 빠른 학습 시간, 실시간 렌더링이 가능하지만, Gaussian points의 밀도 조정 과정에서 전체 Gaussian points 수의 증가로 메모리 소모량 상승과 렌더링 속도가 저하되는 문제가 있다. 이를 개선하기 위해 본 논문에서는 불필요한 Gaussian points를 제거하여 메모리 효율성을 높이는 Gaussian blending 기법과 Gaussian points 감소로 인한 표현력 손실을 최소화하는 깊이 정보 반영 손실 함수를 제안하여 모델의 성능을 보완한다. 실험 결과, Tanks & Temples 벤치마크 데이터셋에서 성능을 유지하면서 Gaussian points 수를 최대 4% 감소시키는 효과를 확인하였다. 따라서 본 논문에서 제안한 방법론은 3D-GS 모델의 경량화 가능성을 실험적으로 증명하였다.

선박용 밸브의 내부 누설 진단을 위한 음향방출신호의 머신러닝 기법 적용 연구 (Diagnosis of Valve Internal Leakage for Ship Piping System using Acoustic Emission Signal-based Machine Learning Approach)

  • 이정형
    • 해양환경안전학회지
    • /
    • 제28권1호
    • /
    • pp.184-192
    • /
    • 2022
  • 밸브의 내부 누설 현상은 밸브의 내부 부품의 손상에 의해 발생하며 배관 시스템의 사고와 운전정지를 일으키는 주요 요인이다. 본 연구는 버터플라이형 밸브의 내부 누설에 따라 배관계에서 발생하는 음향방출 신호를 이용하여 배관 가동 중 실시간 누설 진단의 가능성을 검토하였다. 이를 위해 밸브의 작동 모드별로 측정한 시간영역의 AE 원시신호를 취득하였으며 이로부터 구축한 데이터셋은 데이터 기반의 인공지능 알고리즘에 적용하여 밸브의 내부 누설 유무를 진단하는 모델을 생성하였다. 누설 유무진단을 분류의 문제로 정의하여 SVM 기반의 머신러닝과 CNN 기반의 딥러닝 분류 알고리즘을 적용하였다. 데이터의 특징 추출에 기반한 SVM 분류 모델의 경우, 이진분류 모델에서 구축된 모델에 따라 83~90%의 정확도를 나타냈으며, 다중 클래스인 경우 분류 정확도가 66%로 감소하였다. 반면, CNN 기반의 다중 클래스 분류 모델의 경우 99.85%의 분류 정확도를 얻을 수 있었다. 결론적으로 밸브 내부 누설 진단을 위한 SVM 분류모델은 다중 클래스의 정확도 향상을 위해 적절한 특징 추출이 필요하며, CNN 기반의 분류모델은 프로세서의 성능 저하만 없다면 누설진단과 밸브 개도 분류에 효율적인 접근방법임을 확인하였다.

치아 신경관 식별을 위한 자동 시상면 검출법 (Automatic Sagittal Plane Detection for the Identification of the Mandibular Canal)

  • 박현지;김동준;신영길
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제26권3호
    • /
    • pp.31-37
    • /
    • 2020
  • CT 스캔에서 치아 신경관 식별은 치과 임플란트에서 중요하다. 임플란트 계획 전에, 치과 의사들은 신경관을 수동으로 식별하기 위해 신경관 경로가 최대로 관찰되는 시상면을 찾는다. 그러나 이는 시간 소모적이며 많은 임상 경험을 필요로 한다. 위 논문에서 우리는 원하는 시상면을 자동으로 검출하기 위한 깊은 학습 기반의 프레임 워크를 제안한다. 이는 두가지 주요 기술들을 사용하여 획득된다: 1) 초기 평면들을 획득하기 위한 반복 변환 네트워크 (ITN) 방법의 수정 버전과 2) 원하는 시상면을 검출하기 위한 합성곱 신경망 기반의 정밀 탐색 법. 이 기술들의 결합은 ITN 방법을 단독으로 사용하였을 때의 한계인, 정확한 평면 검출을 용이하게 한다. 우리는 여러 개의 CT 데이터 셋에서 실험하여 우리가 제안한 방법이 ITN 방법과 비교하여 훨씬 뛰어난 결과를 얻을 수 있음을 증명하였다. 이는 치과 의사들이 신경관 경로를 효율적으로 식별할 수 있어 보다 효율적인 자동신경관 검출법에 대한 향후 연구의 기반을 제공한다.