• 제목/요약/키워드: CNN Model

검색결과 963건 처리시간 0.028초

CNN-based Fast Split Mode Decision Algorithm for Versatile Video Coding (VVC) Inter Prediction

  • Yeo, Woon-Ha;Kim, Byung-Gyu
    • Journal of Multimedia Information System
    • /
    • 제8권3호
    • /
    • pp.147-158
    • /
    • 2021
  • Versatile Video Coding (VVC) is the latest video coding standard developed by Joint Video Exploration Team (JVET). In VVC, the quadtree plus multi-type tree (QT+MTT) structure of coding unit (CU) partition is adopted, and its computational complexity is considerably high due to the brute-force search for recursive rate-distortion (RD) optimization. In this paper, we aim to reduce the time complexity of inter-picture prediction mode since the inter prediction accounts for a large portion of the total encoding time. The problem can be defined as classifying the split mode of each CU. To classify the split mode effectively, a novel convolutional neural network (CNN) called multi-level tree (MLT-CNN) architecture is introduced. For boosting classification performance, we utilize additional information including inter-picture information while training the CNN. The overall algorithm including the MLT-CNN inference process is implemented on VVC Test Model (VTM) 11.0. The CUs of size 128×128 can be the inputs of the CNN. The sequences are encoded at the random access (RA) configuration with five QP values {22, 27, 32, 37, 42}. The experimental results show that the proposed algorithm can reduce the computational complexity by 11.53% on average, and 26.14% for the maximum with an average 1.01% of the increase in Bjøntegaard delta bit rate (BDBR). Especially, the proposed method shows higher performance on the sequences of the A and B classes, reducing 9.81%~26.14% of encoding time with 0.95%~3.28% of the BDBR increase.

A Novel Framework Based on CNN-LSTM Neural Network for Prediction of Missing Values in Electricity Consumption Time-Series Datasets

  • Hussain, Syed Nazir;Aziz, Azlan Abd;Hossen, Md. Jakir;Aziz, Nor Azlina Ab;Murthy, G. Ramana;Mustakim, Fajaruddin Bin
    • Journal of Information Processing Systems
    • /
    • 제18권1호
    • /
    • pp.115-129
    • /
    • 2022
  • Adopting Internet of Things (IoT)-based technologies in smart homes helps users analyze home appliances electricity consumption for better overall cost monitoring. The IoT application like smart home system (SHS) could suffer from large missing values gaps due to several factors such as security attacks, sensor faults, or connection errors. In this paper, a novel framework has been proposed to predict large gaps of missing values from the SHS home appliances electricity consumption time-series datasets. The framework follows a series of steps to detect, predict and reconstruct the input time-series datasets of missing values. A hybrid convolutional neural network-long short term memory (CNN-LSTM) neural network used to forecast large missing values gaps. A comparative experiment has been conducted to evaluate the performance of hybrid CNN-LSTM with its single variant CNN and LSTM in forecasting missing values. The experimental results indicate a performance superiority of the CNN-LSTM model over the single CNN and LSTM neural networks.

항공 영상에서의 Mask R-CNN을 이용한 차량 검출 연구 (A Study on Car Detection in Road Surface Using Mask R-CNN in Aerial Image)

  • 윤형진;이민혜;정유석;이혜성;조정원;이창우
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2019년도 춘계학술대회
    • /
    • pp.71-73
    • /
    • 2019
  • 차량이 얼마나 존재하고 어디에 존재하는지는 교통정보를 반영하는 GeoAI 기반 도시 환경의 구현에서 필수적으로 파악되어야 할 요소이다. 본 논문에서는 객체 검출 및 추출에 유용한 딥러닝 모델인 Mask R-CNN을 이용하여 차량 데이터를 학습시키고 드론으로 촬영한 실제 항공 영상에서 차량 검출 유무를 검증하였다.

  • PDF

CNN 모델을 이용한 사기 스마트 컨트랙트 탐지 (Fraudulent Smart Contract Detection Using CNN Models)

  • 박다은;박용범
    • 반도체디스플레이기술학회지
    • /
    • 제22권3호
    • /
    • pp.73-77
    • /
    • 2023
  • As the DeFi market continues to expand, fraudulent activities using smart contracts have also increased. HoneyPot and Ponzi schemes are well-known frauds that exploit smart contracts. While several studies have demonstrated the potential to detect smart contracts implementing these scams, there has been a lack of research focusing on simultaneously detecting both types of fraud. This paper addresses this gap by harnessing artificial intelligence to conduct experiments for the detection of both HoneyPot and Ponzi schemes. The study employs the CNN (Convolutional Neural Network) model, commonly used for malware detection. To effectively utilize CNN, the bytecode of smart contracts is transformed into visual representations. The experimental results showcase a recall rate of 0.89 and an F1 score of 0.85, indicating promising detection capabilities.

  • PDF

3D-CNN에서 동적 손 제스처의 시공간적 특징이 학습 정확성에 미치는 영향 (Effects of Spatio-temporal Features of Dynamic Hand Gestures on Learning Accuracy in 3D-CNN)

  • 정영지
    • 한국인터넷방송통신학회논문지
    • /
    • 제23권3호
    • /
    • pp.145-151
    • /
    • 2023
  • 3D-CNN은 시계열 데이터 학습을 위한 딥 러닝 기법 중 하나이다. 이러한 3차원 학습은 많은 매개변수를 생성할 수 있으므로 고성능 기계학습이 필요하거나 학습 속도에 커다란 영향을 미칠 수 있다. 본 연구에서는 손의 동적인 제스처 동작을 시공간적으로 학습할 때, 3D-CNN 모델의 구조적 변화 없이 입력 영상 데이터의 시공간적 변화에 따른 학습 정확성을 분석함으로써, 3D-CNN을 이용한 동적 제스처 학습의 효율성을 높이기 위한 입력 영상 데이터의 최적 조건을 찾고자 한다. 첫 번째로 동적 손 제스처 영상 데이터에서 동적 이미지 프레임의 학습구간을 설정함으로써 제스처 동작간 시간 비율을 조정한다. 둘째로는 클래스간 2차원 교차 상관 분석을 통해 영상 데이터의 이미지 프레임간 유사도를 측정하여 정규화 함으로써 프레임간 평균값을 얻고 학습 정확성을 분석한다. 이러한 분석을 통하여, 동적 손 제스처의 3D-CNN 딥 러닝을 위한 입력 영상 데이터를 효과적으로 선택하는 두 가지 방법을 제안한다. 실험 결과는 영상 데이터 프레임의 학습구간과 클래스간 이미지 프레임간 유사도가 학습 모델의 정확성에 영향을 미칠 수 있음을 보여준다.

Doc2Vec과 Word2Vec을 활용한 Convolutional Neural Network 기반 한국어 신문 기사 분류 (Categorization of Korean News Articles Based on Convolutional Neural Network Using Doc2Vec and Word2Vec)

  • 김도우;구명완
    • 정보과학회 논문지
    • /
    • 제44권7호
    • /
    • pp.742-747
    • /
    • 2017
  • 본 논문에서는 문장의 분류에 있어 성능이 입증된 word2vec을 활용한 Convolutional Neural Network(CNN) 모델을 기반으로 하여 문서 분류에 적용 시 성능을 향상시키기 위해 doc2vec을 함께 CNN에 적용하고 기반 모델의 구조를 개선한 문서 분류 방안을 제안한다. 먼저 토큰화 방법을 선정하기 위한 초보적인 실험을 통하여, 어절 단위, 형태소 분석, Word Piece Model(WPM) 적용의 3가지 방법 중 WPM이 분류율 79.5%를 산출하여 문서 분류에 유용함을 실증적으로 확인하였다. 다음으로 WPM을 활용하여 생성한 단어 및 문서의 벡터 표현을 기반 모델과 제안 모델에 입력하여 범주 10개의 한국어 신문 기사 분류에 적용한 실험을 수행하였다. 실험 결과, 제안 모델이 분류율 89.88%를 산출하여 기반 모델의 분류율 86.89%보다 2.99% 향상되고 22.80%의 개선 효과를 보였다. 본 연구를 통하여, doc2vec이 동일한 범주에 속한 문서들에 대하여 유사한 문서 벡터 표현을 생성하기 때문에 문서의 분류에 doc2vec을 함께 활용하는 것이 효과적임을 검증하였다.

뇌전증 환자의 MEG 데이터에 대한 분류를 위한 인공신경망 적용 연구 (Artificial neural network for classifying with epilepsy MEG data)

  • 한유진;김준식;김재희
    • 응용통계연구
    • /
    • 제37권2호
    • /
    • pp.139-155
    • /
    • 2024
  • 본 연구는 좌측 해마 경화를 보인 내측두엽 뇌전증(left mTLE, mesial temporal lobe epilepsy with left hippocampal sclerosis) 환자군과 우측 해마 경화를 보인 내측두엽 뇌전증(right mTLE, mesial temporal lobe epilepsy with right hippocampal sclerosis) 환자군 그리고 건강한 대조군(healthy controls; HC)으로부터 측정한 뇌자도(magnetoencephalography; MEG) 데이터로 각 그룹을 분류하는 다중 분류 작업에 다양한 인공신경망을 적용하고 그 결과를 비교해 보고자 하였다. 합성곱 신경망, 순환 신경망 그리고 그래프 신경망으로 모델링한 결과, k-fold 정확도 평균은 합성곱 신경망 기반 모델, 그래프 신경망 기반 모델, 순환 신경망 기반 모델 순으로 우수하였다. 또한, 수행 시간은 순환 신경망 기반 모델, 그래프 신경망 기반 모델, 합성곱 신경망 기반 모델 순으로 우수하였다. 정확도 성능과 시간 면에서 모두 좋은 수치를 보이며, 네트워크 데이터의 확장성이 뛰어난 그래프 신경망이 앞으로 뇌 연구에 활용되기 적합한 모델임을 강조하고자 한다.

Sentienl-1 SAR 영상을 활용한 유류 분포특성과 CNN 구조에 따른 유류오염 탐지모델 성능 평가 (Evaluation of Oil Spill Detection Models by Oil Spill Distribution Characteristics and CNN Architectures Using Sentinel-1 SAR data)

  • 박소연;안명환;이성뢰;김준우;전현균;김덕진
    • 대한원격탐사학회지
    • /
    • 제37권5_3호
    • /
    • pp.1475-1490
    • /
    • 2021
  • SAR 이미지의 통계적 특징을 이용하여 유류오염영역을 특정하는 방법은 분류규칙이 복잡하고 이상값에 의한 영향을 많이 받는다는 한계가 있어, 최근 인공신경망을 기반으로 유류오염영역을 특정하는 연구가 활발히 이루어지고 있다. 하지만, 다양한 유류오염 사례에 대해 모델의 탐지 성능 및 특성을 평가한 연구는 부족하였다. 따라서, 본 연구에서는 기본적인 구조의 CNN인 Simple CNN과 픽셀 단위의 영상 분할이 가능한 U-net을 이용하여, CNN의 구조와, 유류오염의 분포특성에 따른 모델의 탐지성능차이가 존재하는지 분석하였다. 연구결과, 축소경로만 존재하는Simple CNN과 축소경로와 확장경로가 모두 존재하는U-net의 F1 score는 86.24%와 91.44%로 나타나, 두 모델 모두 비교적 높은 탐지 정확도를 보여주었지만, U-net의 탐지성능이 더 높은 것으로 나타났다. 또한 다양한 유류오염 사례에 따른 모델의 성능 비교를 위해, 유류오염의 공간적 분포특성(유류오염 주변의 육지의 분포)과 선명도(유출된 기름과 해수의 경계면이 뚜렷한 정도)를 기준으로, 유류오염 발생사례를 4가지 유형으로 구분하여 탐지 정확도를 평가하였다. Simple CNN은 각각의 유형에 대해 F1 score가 85.71%, 87.43%, 86.50%, 85.86% 로 유형별 최대 편차가 1.71%인 것으로 나타났으며, U-net은 동일한 지표에 대해 89.77%, 92.27%, 92.59%, 92.66%의 F1 score를 보여 최대 편차가 2.90% 로 두 CNN모델 모두 유류오염 분포특성에 따른 수치상 탐지성능의 차이는 크지 않은 것으로 나타났다. 하지만 모든 유류오염 유형에서 Simple CNN은 오염영역을 과대탐지 하는 경향을, U-net은 과소탐지 하는 경향을 보여, 모델의 구조와 유류오염의 유형에 따라 서로 다른 탐지 특성을 가진다는 것을 확인하였고, 이러한 특성은 유류오염과 해수의 경계면이 뚜렷하지 않은 경우 더 두드러지게 나타났다.

CNN 기반 동물상 인식 모델 구현 (An Implementation of Animal Face Recognition Model based on Convolutional Neural Network)

  • 박용빈;임선영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.645-647
    • /
    • 2022
  • 최근 딥러닝 기반의 이미지 분류는 다양한 산업과 서비스에서 활용되고 있으며, 이미지 인식을 통한 다양한 테스트가 SNS를 통해 인기를 끌고 있다. CNN은 대표적인 이미지 분류를 위한 신경망 모델로 본 연구에서는 사진속의 얼굴에 대해 동물상 인식을 위하여 동물 얼굴 이미지 및 각 동물상을 대표하는 연예인의 이미지를 수집하고, CNN 기반의 동물상 인식 모델을 구현하였다.

하드디스크의 잔존 수명 예측에 1D CNN-LSTM 을 이용한 모델 적용 연구 (A Study on Applying a Model Using 1D CNN-LSTM to the RUL Prediction of HDD)

  • 서양진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.978-981
    • /
    • 2020
  • 제품이나 부품의 잔존 수명을 정확하게 예측할 수 있다면 고장이나 중단으로 인한 손실을 방지하는 것이 가능해질 것이다. 제품의 잔존 수명은 시계열 데이터 분석을 통해 예측될 수 있으며, 최근에는 딥러닝을 이용한 잔존 수명 예측 연구가 활발하게 진행되고 있다. 본 연구에서 우리는 컴퓨터 기반 시스템의 주요 고장 요소가 되고 있는 하드디스크의 잔존 수명을 예측하는 문제에 1D CNN-LSTM 을 이용한 모델을 적용하고, RMSE 와 R-Square 값을 이용해 적용한 모델의 성능을 평가하였다.