• 제목/요약/키워드: ResNet-1D

검색결과 16건 처리시간 0.024초

ATLAS V2.0 데이터에서 의료영상 분할 모델 성능 비교 (Comparison of Performance of Medical Image Semantic Segmentation Model in ATLASV2.0 Data)

  • 우소연;구영현;유성준
    • 방송공학회논문지
    • /
    • 제28권3호
    • /
    • pp.267-274
    • /
    • 2023
  • 의료영상 공개 데이터는 수집에 한계가 있어 데이터셋의 양이 부족하다는 문제점이 있다. 때문에 기존 연구들은 공개 데이터셋에 과적합 되었을 우려가 있다. 본 논문은 실험을 통해 8개의 (Unet, X-Net, HarDNet, SegNet, PSPNet, SwinUnet, 3D-ResU-Net, UNETR) 의료영상 분할 모델의 성능을 비교함으로써 기존 모델의 성능을 재검증하고자 한다. 뇌졸중 진단 공개 데이터 셋인 Anatomical Tracings of Lesions After Stroke(ATLAS) V1.2과 ATLAS V2.0에서 모델들의 성능 비교 실험을 진행한다. 실험결과 대부분 모델은 V1.2과 V2.0에서 성능이 비슷한 결과를 보였다. 하지만 X-net과 3D-ResU-Net는 V1.2 데이터셋에서 더 높은 성능을 기록했다. 이러한 결과는 해당 모델들이 V1.2에 과적합 되었을 것으로 해석할 수 있다.

무선 단말기 Fingerprint 식별을 위한 딥러닝 구조 개발 (Development of Deep Learning Model for Fingerprint Identification at Digital Mobile Radio)

  • 정영규;신학철;나선필
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권1호
    • /
    • pp.7-13
    • /
    • 2022
  • RF-Fingerprint 기술은 전송된 파형에서 송신기의 하드웨어 고유 특성을 추출하는 기술로써, 디바이스 보안 분야에 매우 유용한 기술 중의 하나이다. 본 논문은 무선 단말기의 In-phase(I)와 Quadrature(Q) 값을 입력으로 동종 무선 단말기 및 이기종 무선 단말기를 식별할 수 있는 fingerprint 특징을 추출하고 이를 식별할 수 있는 딥러닝 구조를 제안한다. 동종/이기종 무선 단말기를 식별하기 위한 특징으로 I/Q를 극좌표로 변환한 후 크기 값을 시간축으로 배열한 데이터를 무선 단말기의 fingerprinting 특징으로 제안하고 이를 식별하기 위해서 수정된 1차원 ResNet 모델을 제안한다. 실험을 위해서 동일 모델 10대의 두 종류 무선 단말기를 대상으로 제안한 딥러닝 구조의 성능을 분석한다. 제안한 딥러닝 구조 및 fingerprint 특징의 성능 검증을 위해서 4000개의 데이터셋 중에서 20%인 800개 데이터셋을 이용하여 성능 분석한 결과 약 99.5%의 식별 성능을 보였다.

Effective Hand Gesture Recognition by Key Frame Selection and 3D Neural Network

  • Hoang, Nguyen Ngoc;Lee, Guee-Sang;Kim, Soo-Hyung;Yang, Hyung-Jeong
    • 스마트미디어저널
    • /
    • 제9권1호
    • /
    • pp.23-29
    • /
    • 2020
  • This paper presents an approach for dynamic hand gesture recognition by using algorithm based on 3D Convolutional Neural Network (3D_CNN), which is later extended to 3D Residual Networks (3D_ResNet), and the neural network based key frame selection. Typically, 3D deep neural network is used to classify gestures from the input of image frames, randomly sampled from a video data. In this work, to improve the classification performance, we employ key frames which represent the overall video, as the input of the classification network. The key frames are extracted by SegNet instead of conventional clustering algorithms for video summarization (VSUMM) which require heavy computation. By using a deep neural network, key frame selection can be performed in a real-time system. Experiments are conducted using 3D convolutional kernels such as 3D_CNN, Inflated 3D_CNN (I3D) and 3D_ResNet for gesture classification. Our algorithm achieved up to 97.8% of classification accuracy on the Cambridge gesture dataset. The experimental results show that the proposed approach is efficient and outperforms existing methods.

A Proposal of Sensor-based Time Series Classification Model using Explainable Convolutional Neural Network

  • Jang, Youngjun;Kim, Jiho;Lee, Hongchul
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권5호
    • /
    • pp.55-67
    • /
    • 2022
  • 센서 데이터를 활용하여 설비의 이상 진단이 가능해졌다. 하지만 설비 이상에 대한 원인 분석은 미비한 실정이다. 본 연구에서는 센서 기반 시계열 데이터 분류 모델을 위한 해석가능한 합성곱 신경망 프레임워크를 제안한다. 연구에서 사용된 센서 기반 시계열 데이터는 실제 차량에 부착된 센서를 통해 수집되었고, 반도체의 웨이퍼 데이터는 공정 과정에서 수집되었다. 추가로 실제 기계 설비에서 수집된 주기 신호 데이터를 이용 하였으며, 충분한 학습을 위해 Data augmentation 방법론인 Scaling과 Jittering을 적용하였다. 또한, 본 연구에서는 3가지 합성곱 신경망 기반 모델들을 제안하고 각각의 성능을 비교하였다. 본 연구에서는 ResNet에 Jittering을 적용한 결과 정확도 95%, F1 점수 95%로 가장 뛰어난 성능을 보였으며, 기존 연구 대비 3%의 성능 향상을 보였다. 더 나아가 결과의 해석을 위한 XAI 방법론으로 Class Activation Map과 Layer Visualization을 제안하였으며, 센서 데이터 분류에 중요 영향을 끼치는 시계열 구간을 시각적으로 확인하였다.

A Study on Recognition of Dangerous Behaviors using Privacy Protection Video in Single-person Household Environments

  • Lim, ChaeHyun;Kim, Myung Ho
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권5호
    • /
    • pp.47-54
    • /
    • 2022
  • 최근 딥러닝 기술의 발달로 사람의 행동을 인식하는 연구가 진행 중에 있다. 본 논문에서는 딥러닝 기술을 활용하여 1인 가구 환경에서 발생할 수 있는 위험 행동을 인식하는 연구를 진행하였다. 1인 가구의 특성상 개인의 프라이버시 보호가 필요하다. 본 논문에서는 개인의 프라이버시 보호를 위해 가우시안 블러 필터가 적용된 프라이버시 보호 영상에서 사람의 위험 행동을 인식한다. 위험 행동 인식 방법은 객체 검출 모델인 YOLOv5 모델을 활용하여 영상에서 사람 객체 검출 및 전처리 방법을 적용한 후 행동 인식 모델의 입력값으로 활용하여 위험 행동을 인식한다. 실험에는 ResNet3D, I3D, SlowFast 모델을 사용하였고, 실험 결과 SlowFast 모델이 프라이버시 보호 영상에서 95.7%로 가장 높은 정확도를 달성하였다. 이를 통해 개인의 프라이버시를 보호하면서 1인 가구 환경에서 사람의 위험 행동을 인식하는 것이 가능하다.

1-D PE 어레이로 컨볼루션 연산을 수행하는 저전력 DCNN 가속기 (Power-Efficient DCNN Accelerator Mapping Convolutional Operation with 1-D PE Array)

  • 이정혁;한상욱;최승원
    • 디지털산업정보학회논문지
    • /
    • 제18권2호
    • /
    • pp.17-26
    • /
    • 2022
  • In this paper, we propose a novel method of performing convolutional operations on a 2-D Processing Element(PE) array. The conventional method [1] of mapping the convolutional operation using the 2-D PE array lacks flexibility and provides low utilization of PEs. However, by mapping a convolutional operation from a 2-D PE array to a 1-D PE array, the proposed method can increase the number and utilization of active PEs. Consequently, the throughput of the proposed Deep Convolutional Neural Network(DCNN) accelerator can be increased significantly. Furthermore, the power consumption for the transmission of weights between PEs can be saved. Based on the simulation results, the performance of the proposed method provides approximately 4.55%, 13.7%, and 2.27% throughput gains for each of the convolutional layers of AlexNet, VGG16, and ResNet50 using the DCNN accelerator with a (weights size) x (output data size) 2-D PE array compared to the conventional method. Additionally the proposed method provides approximately 63.21%, 52.46%, and 39.23% power savings.

콩포장에서 노린재류의 밀도조사법 개발 (Development of Observation Methods for Density of Stink Bugs in Soybean Field)

  • 배순도;김현주;이건휘;박성태
    • 한국응용곤충학회지
    • /
    • 제46권1호
    • /
    • pp.153-158
    • /
    • 2007
  • 콩의 생식생장기에 노린재류의 밀도조사법을 개발하고자 하였다. 타락법, 포충망법 및 달관법으로 콩의 개화기(R2), 결협기(R4) 및 성숙기(R7)에 발생하는 톱다리개미허리노린재, 가로줄노린재, 풀색노린재, 알락수염노린재 및 썩덩나무노린재의 성충과 약충의 밀도를 조사한 결과 노린재류의 총 조사량은 타락법에서 5,214.2마리로 가장 많았으며, 다음은 달관법에서 2,581.8마리 였으며, 포충망법에서 103.1마리로 가장 적었다. 타락법과 달관법에 의한 노린재류의 총 조사량은 가로줄노린재 > 풀색노린재 > 썩덩나무노린재 > 톱다리개미허리노린재 > 알락수염노린재의 순서로 많았고, 발생량의 차이도 분명하였으나, 포충망법에 의한 노린재류의 총 조사량은 18-23마리로 발생량의 차이가 분명하지 않았다. 따라서 타락법에 의한 주요 노린재류의 조사밀도는 톱다리개미허리노린재 성충을 제외하곤 대체로 높았다. 하지만 타락법보다 불출법으로 콩의 개화시부터 성숙까지 톱다리개미허리노린재의 성충을 더 많이 조사할 수 있었고, 일중 조사량은 오후시간대보다 오전시간대에 많았다. 그러므로 콩포장에서 노린재류의 밀도조사법으로 톱다리개미허리노린재는 불출법으로, 가로줄노린재, 풀색노린재, 알락수염노린재 및 썩덩나무노린재는 타락법이 추천되었다. 이러한 2가지 조사법의 적용은 노린재류의 종간 행동적 특성 차이 때문이다.

시설고추 재배 시 포도주부산물의 토양의 질산화에 미치는 영향 (Evaluation of Nitrogen Mineralization and Nitrification in Soil Incorporated with Wine Sludge for Pepper)

  • Myong Suk Shin;Joung Du Shin;Hee Chun;Yong Du Kwon;Jong Sun Park
    • 생물환경조절학회지
    • /
    • 제10권4호
    • /
    • pp.219-224
    • /
    • 2001
  • 포도주 부산물이 혼합처리 시용에 따른 토양중 질소 무기화 및 과정을 구명하기 위해 평창군 비가림재배 시설하우스에 수행하였다. 질소무기화 및 질산화는 심토층보다 표토층에서 높게 나타났다. 생육전반에 걸쳐 총 질소 무기화 및 질산화 량은 처리간에 다양하였지만, 전반적으로 총 질소 무기화는 정식 후 90일 까지 증가하였지만 그 이후로는 감소하였다. 표토층에 있어 최고 질소 무기화 및 질산화는 정식후 90일에 T4구에서 관측되었다. 가장 높은 질소 무기화는 정식 후 30일에 무처리구에서 272.5mg.kg$^{-1}$과 정식 후 90일에 T4구에서 843.4 mg.kg$^{-1}$으로 나타났다. 또한 질산화량은 T4구에서 정식 후 90일에 872.2mg.kg$^{-1}$으로 가장 높게 나타났다.

  • PDF

평활화 알고리즘에 따른 자궁경부 분류 모델의 성능 비교 연구 (A Performance Comparison of Histogram Equalization Algorithms for Cervical Cancer Classification Model)

  • 김윤지;박예랑;김영재;주웅;남계현;김광기
    • 대한의용생체공학회:의공학회지
    • /
    • 제42권3호
    • /
    • pp.80-85
    • /
    • 2021
  • We developed a model to classify the absence of cervical cancer using deep learning from the cervical image to which the histogram equalization algorithm was applied, and to compare the performance of each model. A total of 4259 images were used for this study, of which 1852 images were normal and 2407 were abnormal. And this paper applied Image Sharpening(IS), Histogram Equalization(HE), and Contrast Limited Adaptive Histogram Equalization(CLAHE) to the original image. Peak Signal-to-Noise Ratio(PSNR) and Structural Similarity index for Measuring image quality(SSIM) were used to assess the quality of images objectively. As a result of assessment, IS showed 81.75dB of PSNR and 0.96 of SSIM, showing the best image quality. CLAHE and HE showed the PSNR of 62.67dB and 62.60dB respectively, while SSIM of CLAHE was shown as 0.86, which is closer to 1 than HE of 0.75. Using ResNet-50 model with transfer learning, digital image-processed images are classified into normal and abnormal each. In conclusion, the classification accuracy of each model is as follows. 90.77% for IS, which shows the highest, 90.26% for CLAHE and 87.60% for HE. As this study shows, applying proper digital image processing which is for cervical images to Computer Aided Diagnosis(CAD) can help both screening and diagnosing.

3D 특징 벡터를 이용한 영아 울음소리 분류 (Classification of infant cries using 3D feature vectors)

  • 박정현;김민서;최혁순;문남미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.597-599
    • /
    • 2022
  • 영아는 울음이라는 비언어적 의사 소통 방식을 사용하여 모든 욕구를 표현한다. 하지만 영아의 울음소리를 파악하는 것에는 어려움이 따른다. 영아의 울음소리를 해석하기 위해 많은 연구가 진행되었다. 이에 본 논문에서는 3D 특징 벡터를 이용한 영아의 울음소리 분류를 제안한다. Donate-a-corpus-cry 데이터 세트는 복통, 트림, 불편, 배고픔, 피곤으로 총 5 개의 클래스로 분류된 데이터를 사용한다. 데이터들은 원래 속도의 90%와 110%로 수정하는 방법인 템포조절을 통해 증강한다. Spectrogram, Mel-Spectrogram, MFCC 로 특징 벡터화를 시켜준 후, 각각의 2 차원 특징벡터를 묶어 3차원 특징벡터로 구성한다. 이후 3 차원 특징 벡터를 ResNet 과 EfficientNet 모델로 학습을 진행한다. 그 결과 2 차원 특징 벡터는 0.89(F1) 3 차원 특징 벡터의 경우 0.98(F1)으로 0.09 의 성능 향상을 보여주었다.