• 제목/요약/키워드: 특징 추출부 학습

검색결과 47건 처리시간 0.027초

3차원 특징볼륨을 이용한 깊이영상 생성 모델 (Depth Map Estimation Model Using 3D Feature Volume)

  • 신수연;김동명;서재원
    • 한국콘텐츠학회논문지
    • /
    • 제18권11호
    • /
    • pp.447-454
    • /
    • 2018
  • 본 논문은 컨볼루션 신경망으로 이루어진 학습 모델을 통해 스테레오 영상의 깊이영상 생성 알고리즘을 제안한다. 제안하는 알고리즘은 좌, 우 시차 영상을 입력으로 받아 각 시차영상의 주요 특징을 추출하는 특징 추출부와 추출된 특징을 이용하여 시차 정보를 학습하는 깊이 학습부로 구성된다. 우선 특징 추출부는 2D CNN 계층들로 이루어진 익셉션 모듈(xception module) 및 ASPP 모듈(atrous spatial pyramid pooling) module을 통해 각각의 시차영상에 대한 특징맵을 추출한다. 그 후 각 시차에 대한 특징 맵을 시차에 따라 3차원 형태로 쌓아 3D CNN을 통해 깊이 추정 가중치를 학습하는 깊이 학습부를 거친 후 깊이 영상을 추정한다. 제안하는 알고리즘은 객체 영역에 대해 기존의 다른 학습 알고리즘들 보다 정확한 깊이를 추정하였다.

가버 웨이블릿 신경망 기반 적응 표정인식 시스템 (Adaptive Facial Expression Recognition System based on Gabor Wavelet Neural Network)

  • 이상완;김대진;김용수;변증남
    • 한국지능시스템학회논문지
    • /
    • 제16권1호
    • /
    • pp.1-7
    • /
    • 2006
  • 본 논문에서는 6개의 특징점을 이용하는 가버 웨이블릿 신경망 기반 적응 표정인식 시스템을 제안한다. 특징 추출부를 포함하는 초기 네트워크의 구성은 Levenberg-Marquardt 기반의 학습방법이 사용되며, 따라서 특징 추출부 결정에 있어서 경험적 요소를 배재시킬 수 있다. 또한 새로운 사용자에 대한 적응 네트워크를 구성하기 위해서 개선된 보상함수를 가지는 Q-학습과, 비지도 퍼지 신경망 모델을 사용하였다. Q-학습을 통해서는 개인 사용자에 대해 분리도가 좋은 특징벡터를 얻을 수 있는 가버필터 세트를 얻을 수 있으며, 퍼지 신경망을 통해서는 사용자의 얼굴변화에 맞게 인식기를 변화시킬 수 있다. 따라서 제안된 시스템은 사용자의 얼굴변화를 따라갈 수 있는 좋은 적응 성능을 보이고 있다.

합성곱 신경망의 학습 가속화를 위한 방법 (A Method for accelerating training of Convolutional Neural Network)

  • 최세진;정준모
    • 문화기술의 융합
    • /
    • 제3권4호
    • /
    • pp.171-175
    • /
    • 2017
  • 최근 CNN(Convolutional Neural Network)의 구조가 복잡해지고 신견망의 깊이가 깊어지고 있다. 이에 따라 신경망의 학습에 요구되는 연산량 및 학습 시간이 증가하게 되었다. 최근 GPGPU 및 FPGA를 이용하여 신경망의 학습 속도를 가속화 하는 방법에 대한 연구가 활발히 진행되고 있다. 본 논문에서는 NVIDIA GPGPU를 제어하는 CUDA를 이용하여 CNN의 특징추출부와 분류부에 대한 연산을 가속화하는 방법을 제시한다. 특징추출부와 분류부에 대한 연산을 GPGPU의 블록 및 스레드로 할당하여 병렬로 처리하였다. 본 논문에서 제안하는 방법과 기존 CPU를 이용하여 CNN을 학습하여 학습 속도를 비교하였다. MNIST 데이터세트에 대하여 총 5 epoch을 학습한 결과 제안하는 방법이 CPU를 이용하여 학습한 방법에 비하여 약 314% 정도 학습 속도가 향상된 것을 확인하였다.

방향선소와 고유벡터 특징을 이용한 전기광학적 패턴인식 시스템 (Electrooptic pattern recognition system by the use of line-orientation and eigenvector features)

  • 신동학;장주석
    • 한국광학회지
    • /
    • 제8권5호
    • /
    • pp.403-409
    • /
    • 1997
  • 다양한 특징들을 광학적으로 병렬추출하여 패턴인식을 수행하는 시스템을 제안하고 실험하였다. 추출하려는 특징은 6개의 방향선소들 및 선소특징만으로 구별되지 않는 패턴들에 대한 공분산행렬의 고유벡터들이다. 이 시스템은 크게 특징추출부와 패턴인식부로 구성된다. 전자는 여러 특징을 병렬적으로 추출하기 위해 다중 Vander Lugt 필터를 사용하여 광학적으로 구현되었으며, 후자는 이들 추출된 특징들을 사용하여 패턴인식이 수행되도록 컴퓨터에서 구현되었다. 패턴인식 방법으로는, 추출된 특징을 인공신경망에 학습을 시키는 방법과 단순히 선소들의 논리적인 개수를 사용하는 방법, 두 가지가 각각 사용되었다. 여기서는 선소들로만 구성된 15개의 영문자 패턴들에 대해 실험하였고 그 실험결과를 보고한다.

  • PDF

Support Vector Machine과 원형 조명을 이용한 납땜 검사 시스템 (Solder Joint Inspection System using Support Vector Machine and Circular Illumination)

  • 심광재;윤태수;김항준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.494-496
    • /
    • 1999
  • 본 논문에서는 SV(Support Vector Machine)과 3단의 칼라 원형 조명장치를 이용한 효율적인 납땜 검사 시스템을 제안한다. 원형 조명장치를 이용하여 납땜부의 표면의 경사도에 의해서 생기는 명암의 분포로부터 납땜 검사를 위한 특징값을 추출한다. SVM은 추출된 특징값을 이용하여 납땜 영상을 정의된 타입중의 하나로 분류한다. SVM은 두 부류의 경계를 최대로 하는 최적경계를 학습하므로 납땜 영상과 같이 각 부류의 경계가 모호한 문제에 대해서 적은 수의 학습 데이터를 사용해도 우수한 성능을 나타낸다. 제안된 시스템은 현산업에서 사용되고 있는 다양한 표면실장형 부품에 대해서 적용해 본 결과 적은 학습 데이터에도 효율적으로 적용될 수 있음을 보였다.

  • PDF

Support Vector Machine 과 원형 조명을 이용한 납땜 검사 시스템 (Solder Joint Inspection System using Support Vector Machine and Circular Illumination)

  • 심광재;윤태수;김항준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.607-609
    • /
    • 2000
  • 본 논문에서는 SVM(Support Vector Machine)과 3단의 칼라 원형 조명장치를 이용한 효율적인 납땜 검사시스템을 제안한다. 원형 조명장치를 이용하여 납땜부의 표면의 경사도에 의해서 생기는 명암의 분포로부터 납땜 검사를 위한 특징값을 추출한다. SVM은 추출된 특징값을 이용하여 납땜 영상을 정의된 타입중의 하나로 분류한다. SBM은 두 부류의경계를 최대로 하는 최적경계를 학습하므로 납땜 영상과 같이 각 부류의 경계가 모호한 문제에 대해서 적은 수의 학습 데이터를 사용해도 우수한 성능을 나타낸다. 제안된 시스템은 현산업에서 사용되고 있는 다양한 표면실장형 부품에 대해서 적용해 본 결과 적은 학습 데이터에도 효율적으로 적용될 수 있음을 보였다.

  • PDF

모델 기반 지각적 그룹핑을 이용한 3차원 다면체의 인식 및 형상 복원 (Recognition and Reconstruction of 3-D Polyhedral Object using Model-based Perceptual Grouping)

  • 박인규;이경무;이상욱
    • 한국통신학회논문지
    • /
    • 제26권7B호
    • /
    • pp.957-967
    • /
    • 2001
  • 본 논문에서는 모델 기반 지각적 그룹핑을 이용한 3차원 다면체의 인식 및 형상 복원에 관한 새로운 기법을 제안한다. 2차원 입력 영상과 여기에서 추출된 특징들의 3차원 특징을 거리 측정기를 이용하여 추출하여 인식 및 복원의 기본 특징으로 이용한다. 이 때, 모델의 3차원 기하학적 정보는 결정 트리 분류기에 의하여 학습되며 지각적 그룹핑은 이와 같은 모델 기반으로 이루어진다. 또한, 1차 그룹핑의 결과로 얻어진 3차원 직선 특징간의 관계는 Gestalt 그래프로 표현되며 이것의 부그래프 분할을 통하여 인식을 위한 후보 그룹이 생성된다. 마지막으로 각각의 후보 그룹은 3차원 모델과 정렬되어 가장 잘 부합되는 그룹을 인식 결과로 생성하게 된다. 그리고 정렬의 결과로서 2차원 텍스춰를 추출하여 3차원 모델에 매핑함으로써 실제적인 3차원 형상을 복원할 수 있다. 제안하는 알고리듬의 성능을 평가하기 위하여 불록 영상과 지형 모델 보드 영상에 대하여 실험을 수행하였다. 실험 결과, 모델 기반의 그룹핑 기법은 결과 그룹의 수를 상당히 감소시켰으며 또한 잡음과 가리워짐에 강건한 인식과 복원 결과가 얻어졌다.

  • PDF

동물 X-ray 영상에서 경골고원각도 자동 검출을 위한 심층신경망 기법 (A Deep Neural Network Technique for Automatic Measurement of Tibial Plateau Angle from Animal X-ray Images)

  • 김지민 ;김형규 ;류정현 ;이선주 ;김호준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.579-580
    • /
    • 2023
  • 본 논문에서는 동물의 십자인대 질환의 진단지표인 경골고원각도(TPA)를 자동으로 측정하는 딥러닝 소프트웨어 기법을 제안한다. 동물 X-ray 영상에서 나타나는 피사체의 위치와 형태에 대한 다양한 변이는 TPA(Tibial Plateau Angle) 지표 산출에 필요한 특징점 검출과정에서 학습 효율을 현저하게 저하시킨다. 이에 본 연구에서는 YOLO(You Only Look Once) 기반 모델을 사용하여 일차적으로 경골영역의 분할 단계를 수행하고, 이어서 경골 상단부의 과간융기와 복사뼈의 중심점을 찾는 과정을 Resnet 기반의 특징점 추출 모듈로서 구현함으로써 학습의 효율과 지표 검출의 정확도를 향상시켰다. 총 201 개의 실제 X-ray 영상을 사용하여 학습 속도와 영역 분할 및 특징점 추출의 정확도 측면을 고려함으로 제안된 이론의 타당성을 실험적으로 평가하였다.

순환 퍼지연상기억장치를 이용한 음성경계 추출 (Word Boundary Detection of Voice Signal Using Recurrent Fuzzy Associative Memory)

  • 마창수;김계영
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권9호
    • /
    • pp.1171-1179
    • /
    • 2004
  • 본 논문에서는 음성인식의 전처리 단계로서 음성 영역과 비음성 영역 사이의 경계를 검출하는 음성경계 추출에 대하여 기술한다. 본 논문에서는 음성경계 추출을 위해 두 가지의 특징벡터를 사용한다. 첫 번째는 백색잡음(white noise)에 강건한 시간 영역의 정보인 정규화된 RMS이고, 두 번째는 주파수 영역의 정보인 정규화된 멜주파수 대역 최대 에너지(met-frequency band maximum energy)이다. 본 논문에서 사용하는 음성경계 추출 알고리즘은 학습을 통해 규칙을 생성하고 음성의 시간 정보를 적용하기 위해 순환노드를 추가한 순환 퍼지연상기억장치이다. 퍼지부의 가중치 학습은 헤비안 학습 방법을 사용하고, 순환부의 가중치 학습을 위해서는 오류 역전파(error back-propagation) 알고리즘을 사용한다. 실험에서는 KAIST에서 제공한 연령과 성별로 구분된 음성 자료를 사용하였다.

딥러닝 기반 문화재 영상에 대한 4 배 및 8 배 초해상화 (Deep Learning based x4 and x8 Super-Resolution for Cultural Property Images)

  • 손채연;김수예;김주영;김문철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 추계학술대회
    • /
    • pp.118-122
    • /
    • 2020
  • 문화재 영상 데이터는 방대한 양으로 인해 고해상도로 모두 저장이 어렵거나 시간이 지나 상대적으로 화질이 낮은 영상들이 다수 존재하기에 초해상화가 필요한 상황이 많다. 따라서 본 논문에서 처음으로 문화재 영상에 특화된 4 배 및 8 배 딥러닝 기반 초해상화 방식을 제안한다. 문화재 영상 데이터는 배경이 단조롭고 물체가 영상 중간에 위치한다는 특징이 있어 이를 고려해 중간 부분에서만 패치를 추출하는 방식을 적용하여 의미 있는 패치로 학습이 되도록 한다. 또 자연 영상 데이터 셋인 DIV2K 를 사용해 학습하는 방식과 직접 구성한 문화재 데이터 셋을 이용해 학습하는 방식, 그 둘을 적절히 함께 사용하여 학습하는 전이 학습 방법까지 세 가지로 학습하여 초해상화의 성능을 향상시키는 방법을 제안한다. 그 결과, 쌍삼차 보간법(Bicubic interpolation)보다 4 배 초해상화에서는 약 1.25dB, 8 배 초해상화에서는 약 1.26dB 의 성능 개선을 확인하였으며, 단순 DIV2K 로 학습한 방식보다는 4 배에서는 0.06dB, 8 배에서는 0.17dB 의 성능 개선을 확인하였다.

  • PDF