• 제목/요약/키워드: 부분 합성곱 신경망

검색결과 25건 처리시간 0.038초

저해상도 영상 자료를 사용하는 얼굴 표정 인식을 위한 소규모 심층 합성곱 신경망 모델 설계 (A Design of Small Scale Deep CNN Model for Facial Expression Recognition using the Low Resolution Image Datasets)

  • 살리모프 시로지딘;류재흥
    • 한국전자통신학회논문지
    • /
    • 제16권1호
    • /
    • pp.75-80
    • /
    • 2021
  • 인공 지능은 놀라운 혜택을 제공하는 우리 삶의 중요한 부분이 되고 있다. 이와 관련하여 얼굴 표정 인식은 최근 수십 년 동안 컴퓨터 비전 연구자들 사이에서 뜨거운 주제 중 하나였다. 저해상도 이미지의 작은 데이터 세트를 분류하려면 새로운 소규모 심층 합성곱 신경망 모델을 개발해야 한다. 이를 위해 소규모 데이터 세트에 적합한 방법을 제안한다. 이 모델은 기존 심층 합성곱 신경망 모델에 비해 총 학습 가능 가중치 측면에서 메모리의 일부만 사용하지만 FER2013 및 FERPlus 데이터 세트에서 매우 유사한 결과를 보여준다.

수도 레이블을 활용한 준지도 학습 기반의 도로노면 파손 탐지 (Road Surface Damage Detection Based on Semi-supervised Learning Using Pseudo Labels)

  • 전찬준;류승기
    • 한국ITS학회 논문지
    • /
    • 제18권4호
    • /
    • pp.71-79
    • /
    • 2019
  • 의미론적 분할 형태로 합성곱 신경망을 구성하여 도로노면의 파손을 탐지하는 연구가 진행되고 있다. 이러한 합성곱 신경망 형태의 모델을 생성하기 위해서는 입력 이미지와 이에 상응한 레이블된 이미지 데이터셋으로 수집해야 하고, 이러한 과정에서는 굉장히 많은 시간과 비용이 발생하게 된다. 본 논문에서는 이러한 작업을 완화하기 위하여 수도 레이블링을 활용한 준지도 학습 기반의 도로노면 파손 탐지 기술을 제안하고자 한다. 레이블된 데이터셋과 레이블되지 않은 데이터셋을 적절하게 혼합하여 도로노면 파손을 탐지하는 모델을 업데이트하고, 이를 레이블된 데이터셋만을 활용한 기존 모델과 성능을 비교한다. 주관적인 성능결과, 민감도 부분에서는 조금 저하된 성능을 보였지만, 정밀도 부분에서는 대폭 성능 향상이 있었으며, 최종적으로 $F_1-score$ 또한 높은 수치로 평가되었다.

이미지 패치 기반 합성곱 신경망을 통한 아날로그 게이지 인식 (Analog Gauge Reading with Image Patch-based Convolutional Neural Network)

  • 견민수;백승한;박종일
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 추계학술대회
    • /
    • pp.95-98
    • /
    • 2022
  • 아날로그 게이지는 여전히 많은 산업 시설에서 사용되고 있지만, 게이지 값을 사람이 수동으로 읽기 때문에 정확히 측정하기 위해 많은 시간이 소모가 되는 문제점이 있다. 이러한 이유로 최근에는 합성곱 신경망을 사용하여 아날로그 게이지 값을 자동으로 인식하는 연구가 진행되고 있다. 그러나 대부분의 선행연구들은 게이지가 촬영된 영상을 그대로 입력으로 사용하고 있으며, 이러한 방법은 사람이 게이지를 읽는 과정을 고려하였을 때 불필요한 부분이 많다. 본 논문에서는 게이지 전체 이미지를 학습에 사용하지 않고, 게이지의 특정 이미지 패치 기반으로 아날로그 게이지 값을 인식하는 방법을 제안한다. 제안하는 방법은 게이지의 중심, 눈금의 최소, 최대, 지침의 좌표를 기반으로 이미지 패치를 생성하고 채널 축으로 병합하여 학습을 진행하였으며, 최종적으로게이지의 각도를 계산한다. 이는 게이지의 평균 각도 오차를 통해 제안한 방법이 게이지 값을 인식하는데 우수한 성능이 보였으며, 게이지 이미지에 장애물이 있는 경우에도 게이지 값을 인식할 수 있음을 확인하였다.

  • PDF

Cascades 방법을 이용한 합성곱 신경망 기반 사용자 동작 추정 방법 연구 (Cascades of CNN-Based Human Pose Estimation Method Study)

  • 최룡;지수미;성연식
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.73-74
    • /
    • 2020
  • 사용자 동작 추정이란 이미지 또는 비디오에서 사용자의 관절 위치를 추정하는 과정을 말한다. 기존의 연구들은 사용자의 몸에서 관절의 큰 부분(어깨, 무릎, 골반, 손, 발 등)만을 추정하거나 손의 세부 관절을 별도로 추정 했다. 하지만 특정 분야(수화, 댄스 등)에선 몸짓과 손을 함께 사용하기에 우리는 사용자 몸의 큰 관절과 손의 세부 관절을 같이 추정하는 방법에 대한 연구를 제안한다. 본 논문에서 제안하는 사용자 동작 추정 방법은 Cascades 방법을 이용한 합성곱 신경망 기반 회귀모델을 적용한 방식이다. 손의 관절들은 다른 큰 관절들(어깨, 무릎, 골반 등)보다 작아서 정밀한 추정을 요구하기에 Cascades 방법을 사용해 보다 정밀하게 추정할 수 있다.

Wavelet 기반의 영상 디테일 향상 잡음 제거 네트워크 (WDENet: Wavelet-based Detail Enhanced Image Denoising Network)

  • 정군;위승우;정제창
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 하계학술대회
    • /
    • pp.176-179
    • /
    • 2021
  • 최근 딥 러닝 기법의 하나인 합성곱 신경망(Convolutional Neural Network, CNN)은 영상 잡음(Noise) 제거 분야에서 전통적인 기법보다 좋은 성능을 나타내고 있지만 학습하는 과정에서 영상 내 디테일한 부분이 손실될 수 있다. 본 논문에서는 웨이블릿 변환(Wavelet Transform)을 기반으로 영상 내 디테일 정보도 같이 학습하여 영상 디테일을 향상하는 잡음 제거 합성곱 신경망 네트워크를 제안한다. 제안하는 네트워크는 디테일 향상 서브 네트워크(Detail Enhancement Subnetwork)와 영상 잡음 추출 서브 네트워크(Noise Extraction Subnetwork)를 이용하게 된다. 실험을 통해 제안하는 방법은 기존 알고리듬보다 디테일 손실 문제를 효과적으로 해결할 수 있었고 객관적 품질 평가인 PSNR(Peak Signal-to-Noise Ratio)와 주관적 품질 비교에서 모두 우수한 결과가 나온 것을 확인하였다.

  • PDF

벡터 기반 데이터 증강과 인공신경망 기반 특징 전달을 이용한 효율적인 균열 데이터 수집 기법 (Efficient Collecting Scheme the Crack Data via Vector based Data Augmentation and Style Transfer with Artificial Neural Networks)

  • 윤주영;김동희;김종현
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.667-669
    • /
    • 2021
  • 본 논문에서는 벡터 기반 데이터 증강 기법(Data augmentation)을 제안하여 학습 데이터를 구축한 뒤, 이를 합성곱 신경망(Convolutional Neural Networks, CNN)으로 실제 균열과 가까운 패턴을 표현할 수 있는 프레임워크를 제안한다. 건축물의 균열은 인명 피해를 가져오는 건물 붕괴와 낙하 사고를 비롯한 큰 사고의 원인이다. 이를 인공지능으로 해결하기 위해서는 대량의 데이터 확보가 필수적이다. 하지만, 실제 균열 이미지는 복잡한 패턴을 가지고 있을 뿐만 아니라, 위험한 상황에 노출되기 때문에 대량의 데이터를 확보하기 어렵다. 이러한 데이터베이스 구축의 문제점은 인위적으로 특정 부분에 변형을 주어 데이터양을 늘리는 탄성왜곡(Elastic distortion) 기법으로 해결할 수 있지만, 본 논문에서는 이보다 향상된 균열 패턴 결과를 CNN을 활용하여 보여준다. 탄성왜곡 기법보다 CNN을 이용했을 때, 실제 균열 패턴과 유사하게 추출된 결과를 얻을 수 있었고, 일반적으로 사용되는 픽셀 기반 데이터가 아닌 벡터 기반으로 데이터 증강을 설계함으로써 균열의 변화량 측면에서 우수함을 보였다. 본 논문에서는 적은 개수의 균열 데이터를 입력으로 사용했음에도 불구하고 균열의 방향 및 패턴을 다양하게 생성하여 쉽게 균열 데이터베이스를 구축할 수 있었다. 이는 장기적으로 구조물의 안정성 평가에 이바지하여 안전사고에 대한 불안감에서 벗어나 더욱 안전하고 쾌적한 주거 환경을 조성할 것으로 기대된다.

  • PDF

신제품 개발을 위한 GAN 기반 생성모델 성능 비교 (Performance Comparisons of GAN-Based Generative Models for New Product Development)

  • 이동훈;이세훈;강재모
    • 문화기술의 융합
    • /
    • 제8권6호
    • /
    • pp.867-871
    • /
    • 2022
  • 최근 빠른 유행의 변화 속에서 디자인의 변화는 패션기업의 매출에 큰 영향을 미치기 때문에 기업들은 신제품디자인 선택에 신중할 수밖에 없다. 최근 인공지능 분야의 발달에 따라 패션시장에서도 소비자들의 선호도를 높이기 위해 다양한 기계학습을 많이 활용하고 있다. 우리는 선호도와 같은 추상적인 개념을 수치화함으로써 신제품 개발에 신뢰성을 높이는 부분에 기여하고자 한다. 이를 위해 3가지 적대적 생성 신경망(Generative adversial netwrok, GAN)을 통하여 기존에 없는 새로운 이미지를 생성하고, 미리 훈련된 합성곱 신경망(Convolution neural networkm, CNN)을 이용하여 선호도라는 추상적인 개념을 수치화시켜 비교하였다. 심층 컨볼루션 적대적 생성 신경망(Deep convolutional generative adversial netwrok, DCGAN), 점진적 성장 적대적 생성 신경망(Progressive growing generative adversial netwrok, PGGAN), 이중 판별기 적대적 생성 신경망(Dual Discriminator generative adversial netwrok, D2GAN)의 3가지 방법을 통해 새로운 이미지를 생성하였고, 판매량이 높았던 제품으로 훈련된 합성곱 신경망으로 유사도를 비교, 측정하였다. 측정된 유사도의 정도를 선호도로 간주하였으며 실험 결과 D2GAN이 DCGAN, PGGAN에 비해 상대적으로 높은 유사도를 보여주었다.

Wavelet 기반의 영상 디테일 향상 잡음 제거 네트워크 (WDENet: Wavelet-based Detail Enhanced Image Denoising Network)

  • 정군;위승우;정제창
    • 방송공학회논문지
    • /
    • 제26권6호
    • /
    • pp.725-737
    • /
    • 2021
  • 현재 카메라 성능이 점점 발전해 왔지만 카메라로부터 얻은 디지털 영상에는 잡음 (Noise)이 존재하고 이는 높은 해상도의 영상을 획득하는 데 있어서 방해요소로 작용한다. 전통적으로 잡음을 제거하기 위하여 필터링 방법을 사용해 왔고 최근 딥 러닝 기법의 하나인 합성곱 신경망 (Convolutional Neural Network)은 영상 잡음 제거 분야에서 전통적인 기법보다 좋은 성능을 나타내고 있어 많은 연구가 진행되고 있다. 하지만 합성곱 신경망으로 학습하는 과정에서 영상 내 디테일한 부분이 손실될 수 있는 문제점이 있다. 본 논문에서는 웨이블릿 변환 (Wavelet Transform)을 기반으로 영상 내 디테일 정보도 같이 학습하여 영상 디테일을 향상하는 잡음 제거 합성곱 신경망 네트워크를 제안한다. 제안하는 네트워크는 디테일 향상 서브 네트워크 (Detail Enhancement Subnetwork)와 영상 잡음 추출 서브 네트워크 (Noise Extraction Subnetwork)를 이용하게 된다. 실험은 가우시안 잡음과 실제 카메라 잡음을 통해 진행했고 제안하는 방법은 기존 알고리듬보다 디테일 손실 문제를 효과적으로 해결할 수 있었고 객관적 품질 평가와 주관적 품질 비교에서 모두 우수한 결과가 나온 것을 확인하였다.

적응형 이진화와 Convex Hull 전처리 및 합성곱 신경망 학습 방법을 적용한 고무 오링 불량 판별 (Rubber O-ring defect detection using adaptive binarization, Convex Hull preprocessing, and convolutional neural network learning method)

  • 성은산;김현태
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.623-625
    • /
    • 2021
  • 고무 오링은 일반적인 사출 성형 방식으로 생산된다. 이때 정상적으로 성형되지 않은 제품은 무조건 불량으로 판별한다. 그러나 영상기반 판독 시 획득한 영상을 원본 그대로 판독 할 경우 정확도가 떨어지는 문제가 발생한다. 이에 획득한 영상을 적응형 이진화와 Convex Hull 알고리즘을 사용한 전처리를 통해 원본영상에서 고무 오링 부분만 추출하여 합성곱 신경망에 학습하였다. 테스트 과정에서 제안하는 전처리를 적용한 학습방법의 불량검출 성능이 제시한 기준치 보다 나은 성능을 보이는 것을 확인 할 수 있었다.

  • PDF

감정 제어 가능한 종단 간 음성합성 시스템 (Emotion Transfer with Strength Control for End-to-End TTS)

  • 전예진;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.423-426
    • /
    • 2021
  • 본 논문은 전역 스타일 토큰(Global Style Token)을 기준으로 하여 감정의 세기를 조절할 수 있는 방법을 소개한다. 기존의 전역 스타일 토큰 연구에서는 원하는 스타일이 포함된 참조 오디오(reference audio)을 사용하여 음성을 합성하였다. 그러나, 참조 오디오의 스타일대로만 음성합성이 가능하기 때문에 세밀한 감정 조절에 어려움이 있었다. 이 문제를 해결하기 위해 본 논문에서는 전역 스타일 토큰의 레퍼런스 인코더 부분을 잔여 블록(residual block)과 컴퓨터 비전 분야에서 사용되는 AlexNet으로 대체하였다. AlexNet은 5개의 함성곱 신경망(convolutional neural networks) 으로 구성되어 있지만, 본 논문에서는 1개의 신경망을 제외한 4개의 레이어만 사용했다. 청취 평가(Mean Opinion Score)를 통해 제시된 방법으로 감정 세기의 조절 가능성을 보여준다.

  • PDF