• 제목/요약/키워드: CNN models

검색결과 460건 처리시간 0.027초

결절성 폐암 검출을 위한 상용 및 맞춤형 CNN의 성능 비교 (Performance Comparison of Commercial and Customized CNN for Detection in Nodular Lung Cancer)

  • 박성욱;김승현;임수창;김도연
    • 한국멀티미디어학회논문지
    • /
    • 제23권6호
    • /
    • pp.729-737
    • /
    • 2020
  • Screening with low-dose spiral computed tomography (LDCT) has been shown to reduce lung cancer mortality by about 20% when compared to standard chest radiography. One of the problems arising from screening programs is that large amounts of CT image data must be interpreted by radiologists. To solve this problem, automated detection of pulmonary nodules is necessary; however, this is a challenging task because of the high number of false positive results. Here we demonstrate detection of pulmonary nodules using six off-the-shelf convolutional neural network (CNN) models after modification of the input/output layers and end-to-end training based on publicly databases for comparative evaluation. We used the well-known CNN models, LeNet-5, VGG-16, GoogLeNet Inception V3, ResNet-152, DensNet-201, and NASNet. Most of the CNN models provided superior results to those of obtained using customized CNN models. It is more desirable to modify the proven off-the-shelf network model than to customize the network model to detect the pulmonary nodules.

인공 위성 사진 내 선박 탐지 정확도 향상을 위한 Watershed 알고리즘 기반 RoI 축소 기법 (Watershed Algorithm-Based RoI Reduction Techniques for Improving Ship Detection Accuracy in Satellite Imagery)

  • 이승재;윤지원
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권8호
    • /
    • pp.311-318
    • /
    • 2021
  • 해상 안보, 국제 동향 파악 등 다양한 이유로 해상 사진에서 선박을 탐지하고자하는 연구는 지속되어 왔다. 인공지능의 발달로 인해 사진 및 영상 내 객체 탐지를 위한 R-CNN 모델이 등장하였고 객체탐지의 성능이 비약적으로 상승하였다. R-CNN 모델을 이용한 해상 사진에서의 선박 탐지는 인공위성 사진에도 적용되기 시작하였다. 하지만 인공위성 사진은 넓은 지역을 투사하기 때문에 선박 외에도 차량, 지형, 건물 등 다양한 객체들이 선박으로 인식되는 경우가 있다. 본 논문에서는 R-CNN계열 모델을 이용한 인공위성 사진에서의 선박 탐지의 성능을 개선하기 위한 새로운 방법론을 제안한다. 표지자 기반 watershed 알고리즘을 통해 육지와 바다를 분리하고 morphology 연산을 수행하여 RoI를 한 차례 더 특정한 뒤 특정된 RoI에 R-CNN 계열 모델을 사용하여 선박을 탐지하여 오탐을 줄인다. 해당 방법을 이용하여 Faster R-CNN을 사용하였을 경우, Faster R-CNN만을 사용했을 때에 비해 오탐률을 80% 줄일 수 있었다.

저계수 행렬 근사 및 CP 분해 기법을 이용한 CNN 압축 (Compression of CNN Using Low-Rank Approximation and CP Decomposition Methods)

  • 문현철;문기화;김재곤
    • 방송공학회논문지
    • /
    • 제26권2호
    • /
    • pp.125-131
    • /
    • 2021
  • 최근 CNN(Convolutional Neural Network)은 영상 분류, 객체 인식, 화질 개선 등 다양한 비전 분야에서 우수한 성능을 보여주고 있다. 그러나 많은 메모리와 계산량이 요구되어 모바일 또는 IoT(Internet of Things) 장치와 같은 저전력 디바이스에 적용하기에는 제한이 따른다. 이에, CNN 모델의 임무 성능을 유지하면서 네트워크 모델을 압축하는 연구가 진행되고 있다. 본 논문에서는 행렬 분해 기술인 저계수 행렬 근사(Low-rank approximation)와 CP(Canonical Polyadic) 분해 기법을 결합한 CNN 모델 압축 기법을 제안한다. 제안기법은 하나의 행렬 분해 기법만을 적용하는 기존의 기법과 달리 CNN의 계층 유형에 따라 두 가지 분해 기법을 선택적으로 적용하여 압축 성능을 높인다. 제안기법의 성능 검증을 위하여 영상 분류 CNN 모델인 VGG-16, ResNet50, 그리고 MobileNetV2 모델을 압축하였고, 계층 유형에 따라 두 가지의 분해 기법을 선택적으로 적용함으로써 저계수 행렬 근사 기법만 적용한 경우 보다 1.5 ~ 12.1 배의 동일한 압축률에서 분류 성능이 향상됨을 확인하였다.

그라운드-롤 제거를 위한 CNN과 GAN 기반 딥러닝 모델 비교 분석 (Comparison of CNN and GAN-based Deep Learning Models for Ground Roll Suppression)

  • 조상인;편석준
    • 지구물리와물리탐사
    • /
    • 제26권2호
    • /
    • pp.37-51
    • /
    • 2023
  • 그라운드-롤(ground roll)은 육상 탄성파 탐사 자료에서 가장 흔하게 나타나는 일관성 잡음(coherent noise)이며 탐사를 통해 얻고자 하는 반사 이벤트 신호보다 훨씬 큰 진폭을 가지고 있다. 따라서 탄성파 자료 처리에서 그라운드-롤 제거는 매우 중요하고 필수적인 과정이다. 그라운드-롤 제거를 위해 주파수-파수 필터링, 커브릿(curvelet) 변환 등 여러 제거 기술이 개발되어 왔으나 제거 성능과 효율성을 개선하기 위한 방법에 대한 수요는 여전히 존재한다. 최근에는 영상처리 분야에서 개발된 딥러닝 기법들을 활용하여 탄성파 자료의 그라운드-롤을 제거하고자 하는 연구도 다양하게 수행되고 있다. 이 논문에서는 그라운드-롤 제거를 위해 CNN (convolutional neural network) 또는 cGAN (conditional generative adversarial network)을 기반으로 하는 세가지 모델(DnCNN (De-noiseCNN), pix2pix, CycleGAN)을 적용한 연구들을 소개하고 수치 예제를 통해 상세히 설명하였다. 알고리듬 비교를 위해 동일한 현장에서 취득한 송신원 모음을 훈련 자료와 테스트 자료로 나누어 모델을 학습하고, 모델 성능을 평가하였다. 이러한 딥러닝 모델은 현장자료를 사용하여 훈련할 때, 그라운드-롤이 제거된 자료가 필요하므로 주파수-파수 필터링으로 그라운드-롤을 제거하여 정답자료로 사용하였다. 딥러닝 모델의 성능 평가 및 훈련 결과 비교는 정답 자료와의 유사성을 기본으로 상관계수와 SSIM (structural similarity index measure)과 같은 정량적 지표를 활용하였다. 결과적으로 DnCNN 모델이 가장 좋은 성능을 보였으며, 다른 모델들도 그라운드-롤 제거에 활용될 수 있음을 확인하였다.

백혈병 진단을 위한 CNN 모델 비교 분석 (Comparative Analysis of CNN Models for Leukemia Diagnosis)

  • 이연지;류정화;이일구
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.279-282
    • /
    • 2022
  • 급성 림프모구성 백혈병은 골수 내 미성숙 림프구 과다증식으로 인해 골수 기능이 억제되어 발생하는 급성 백혈병이다. 성인 급성 백혈병의 30% 비율을 차지하고 있으며, 소아는 항암화학요법으로 80% 이상의 완치율을 보이는 반면, 성인은 20%~50%로 저조한 생존율을 보이고 있다. 그러나 급성 림프모구성 백혈병 진단을 위한 의료영상 데이터 기반 머신러닝 알고리즘에 관한 연구가 초동 단계이다. 본 논문에서는 신속하고 정확한 진단을 위해 CNN 알고리즘모델들을 비교분석한다. 네 가지 모델을 사용하여 급성 림프모구성 백혈병 진단 모델들을 비교분석하기 위한 실험 환경을 구축하고 주어진 의료영상 데이터에 대해 정확도가 가장 우수한 알고리즘을 선택하였다. 실험 결과에 따르면 네 가지의 CNN 모델들 중에서 InceptionV3모델이 98.9%의 정확도로 가장 우수한 성능을 보였다.

  • PDF

기하학적 특징 추가를 통한 얼굴 감정 인식 성능 개선 (Improvement of Facial Emotion Recognition Performance through Addition of Geometric Features)

  • 정호영;한희일
    • 한국인터넷방송통신학회논문지
    • /
    • 제24권1호
    • /
    • pp.155-161
    • /
    • 2024
  • 본 논문에서는 기존의 CNN 기반 얼굴 감정 분석 모델에 랜드마크 정보를 특징 벡터로 추가하여 새로운 모델을 제안한다. CNN 기반 모델을 이용한 얼굴 감정 분류 연구는 다양한 방법으로 연구되고 있으나 인식률이 매우 저조한 편이다. 본 논문에서는 CNN 기반 모델의 성능을 향상시키기 위하여 CNN 모델에 ASM으로 구한 랜드마크 기반 완전 연결 네트워크를 결합함으로써 얼굴 표정 분류 정확도를 향상시키는 알고리즘을 제안한다. CNN 모델에 랜드마크를 포함시킴으로써 인식률이 VGG 0.9%, Inception 0.7% 개선되었으며, 랜드마크에 FACS 기반 액션 유닛 추가를 통하여 보다 VGG 0.5%, Inception 0.1%만큼 향상된 결과를 얻을 수 있음을 실험으로 확인하였다.

다양한 CNN 모델을 이용한 얼굴 영상의 나이 인식 연구 (A study on age estimation of facial images using various CNNs (Convolutional Neural Networks))

  • 최성은
    • Journal of Platform Technology
    • /
    • 제11권5호
    • /
    • pp.16-22
    • /
    • 2023
  • 얼굴 영상으로부터 나이를 인식하는 기술의 응용분야가 증가함에 따라 이에 대한 연구가 활발히 진행되고 있다. 얼굴 영상으로부터 나이를 인식하기 위해서는 나이를 표현하는 특징을 추출하고, 추출된 특징으로 나이를 정확하게 분류하는 기술이 필요하다. 최근 영상 인식 분야에서 다양한 CNN 기반 딥러닝 모델이 적용되어 성능이 크게 개선되고 있으며, 얼굴 나이 인식 분야에서도 성능 개선을 위해 다양한 CNN 기반 딥러닝 모델이 적용되고 있다. 본 논문에서는 다양한 CNN 기반 딥러닝 모델의 얼굴 나이 인식 성능을 비교하는 연구를 수행하였다. 영상 인식 분야에서 많이 활용되고 있는 AlexNet, VGG-16, VGG-19, ResNet-18, ResNet-34, ResNet-50, ResNet-101, ResNet-152를 활용하여 얼굴 나이 인식을 위한 모델을 구성하고 성능을 비교하였다. 실험 결과에서 ResNet-34를 이용한 얼굴 나이 인식 모델의 성능이 가장 우수하다는 것을 확인하였다.

  • PDF

CNN 모델과 Transformer 조합을 통한 토지피복 분류 정확도 개선방안 검토 (Assessing Techniques for Advancing Land Cover Classification Accuracy through CNN and Transformer Model Integration)

  • 심우담;이정수
    • 한국지리정보학회지
    • /
    • 제27권1호
    • /
    • pp.115-127
    • /
    • 2024
  • 본 연구는 Transformer 모듈을 기반으로 다양한 구조의 모델을 구성하고, 토지피복 분류를 수행하여 Transformer 모듈의 활용방안 검토를 목적으로 하였다. 토지피복 분류를 위한 딥러닝 모델은 CNN 구조를 가진 Unet 모델을 베이스 모델로 선정하였으며, 모델의 인코더 및 디코더 부분을 Transformer 모듈과 조합하여 총 4가지 딥러닝 모델을 구축하였다. 딥러닝 모델의 학습과정에서 일반화 성능 평가를 위해 같은 학습조건으로 10회 반복하여 학습을 진행하였다. 딥러닝 모델의 분류 정확도 평가결과, 모델의 인코더 및 디코더 구조 모두 Transformer 모듈을 활용한 D모델이 전체 정확도 평균 약 89.4%, Kappa 평균 약 73.2%로 가장 높은 정확도를 보였다. 학습 소요시간 측면에서는 CNN 기반의 모델이 가장 효율적이었으나 Transformer 기반의 모델을 활용할 경우, 분류 정확도가 Kappa 기준 평균 0.5% 개선되었다. 차후, CNN 모델과 Transformer의 결합과정에서 하이퍼파라미터 조절과 이미지 패치사이즈 조절 등 다양한 변수들을 고려하여 모델을 고도화 할 필요가 있다고 판단된다. 토지피복 분류과정에서 모든 모델이 공통적으로 발생한 문제점은 소규모 객체들의 탐지가 어려운 점이었다. 이러한 오분류 현상의 개선을 위해서는 고해상도 입력자료의 활용방안 검토와 함께 지형 정보 및 질감 정보를 포함한 다차원적 데이터 통합이 필요할 것으로 판단된다.

진화연산 기반 CNN 필터 축소 (Evolutionary Computation Based CNN Filter Reduction)

  • 서기성
    • 전기학회논문지
    • /
    • 제67권12호
    • /
    • pp.1665-1670
    • /
    • 2018
  • A convolutional neural network (CNN), which is one of the deep learning models, has been very successful in a variety of computer vision tasks. Filters of a CNN are automatically generated, however, they can be further optimized since there exist the possibility of existing redundant and less important features. Therefore, the aim of this paper is a filter reduction to accelerate and compress CNN models. Evolutionary algorithms is adopted to remove the unnecessary filters in order to minimize the parameters of CNN networks while maintaining a good performance of classification. We demonstrate the proposed filter reduction methods performing experiments on CIFAR10 data based on the classification performance. The comparison for three approaches is analysed and the outlook for the potential next steps is suggested.

Runoff Prediction from Machine Learning Models Coupled with Empirical Mode Decomposition: A case Study of the Grand River Basin in Canada

  • Parisouj, Peiman;Jun, Changhyun;Nezhad, Somayeh Moghimi;Narimani, Roya
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.136-136
    • /
    • 2022
  • This study investigates the possibility of coupling empirical mode decomposition (EMD) for runoff prediction from machine learning (ML) models. Here, support vector regression (SVR) and convolutional neural network (CNN) were considered for ML algorithms. Precipitation (P), minimum temperature (Tmin), maximum temperature (Tmax) and their intrinsic mode functions (IMF) values were used for input variables at a monthly scale from Jan. 1973 to Dec. 2020 in the Grand river basin, Canada. The support vector machine-recursive feature elimination (SVM-RFE) technique was applied for finding the best combination of predictors among input variables. The results show that the proposed method outperformed the individual performance of SVR and CNN during the training and testing periods in the study area. According to the correlation coefficient (R), the EMD-SVR model outperformed the EMD-CNN model in both training and testing even though the CNN indicated a better performance than the SVR before using IMF values. The EMD-SVR model showed higher improvement in R value (38.7%) than that from the EMD-CNN model (7.1%). It should be noted that the coupled models of EMD-SVR and EMD-CNN represented much higher accuracy in runoff prediction with respect to the considered evaluation indicators, including root mean square error (RMSE) and R values.

  • PDF