• Title/Summary/Keyword: 특징 추출부 학습

Search Result 47, Processing Time 0.022 seconds

Depth Map Estimation Model Using 3D Feature Volume (3차원 특징볼륨을 이용한 깊이영상 생성 모델)

  • Shin, Soo-Yeon;Kim, Dong-Myung;Suh, Jae-Won
    • The Journal of the Korea Contents Association
    • /
    • v.18 no.11
    • /
    • pp.447-454
    • /
    • 2018
  • This paper proposes a depth image generation algorithm of stereo images using a deep learning model composed of a CNN (convolutional neural network). The proposed algorithm consists of a feature extraction unit which extracts the main features of each parallax image and a depth learning unit which learns the parallax information using extracted features. First, the feature extraction unit extracts a feature map for each parallax image through the Xception module and the ASPP(Atrous spatial pyramid pooling) module, which are composed of 2D CNN layers. Then, the feature map for each parallax is accumulated in 3D form according to the time difference and the depth image is estimated after passing through the depth learning unit for learning the depth estimation weight through 3D CNN. The proposed algorithm estimates the depth of object region more accurately than other algorithms.

Adaptive Facial Expression Recognition System based on Gabor Wavelet Neural Network (가버 웨이블릿 신경망 기반 적응 표정인식 시스템)

  • Lee, Sang-Wan;Kim, Dae-Jin;Kim, Yong-Soo;Bien, Zeungnam
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.16 no.1
    • /
    • pp.1-7
    • /
    • 2006
  • In this paper, adaptive Facial Emotional Recognition system based on Gabor Wavelet Neural Network, considering six feature Points in face image to extract specific features of facial expression, is proposed. Levenberg-Marquardt-based training methodology is used to formulate initial network, including feature extraction stage. Therefore, heuristics in determining feature extraction process can be excluded. Moreover, to make an adaptive network for new user, Q-learning which has enhanced reward function and unsupervised fuzzy neural network model are used. Q-learning enables the system to ge optimal Gabor filters' sets which are capable of obtaining separable features, and Fuzzy Neural Network enables it to adapt to the user's change. Therefore, proposed system has a good on-line adaptation capability, meaning that it can trace the change of user's face continuously.

A Method for accelerating training of Convolutional Neural Network (합성곱 신경망의 학습 가속화를 위한 방법)

  • Choi, Se Jin;Jung, Jun Mo
    • The Journal of the Convergence on Culture Technology
    • /
    • v.3 no.4
    • /
    • pp.171-175
    • /
    • 2017
  • Recently, Training of the convolutional neural network (CNN) entails many iterative computations. Therefore, a method of accelerating the training speed through parallel processing using the hardware specifications of GPGPU is actively researched. In this paper, the operations of the feature extraction unit and the classification unit are divided into blocks and threads of GPGPU and processed in parallel. Convolution and Pooling operations of the feature extraction unit are processed in parallel at once without sequentially processing. As a result, proposed method improved the training time about 314%.

Electrooptic pattern recognition system by the use of line-orientation and eigenvector features (방향선소와 고유벡터 특징을 이용한 전기광학적 패턴인식 시스템)

  • 신동학;장주석
    • Korean Journal of Optics and Photonics
    • /
    • v.8 no.5
    • /
    • pp.403-409
    • /
    • 1997
  • We proposed a system that can perform pattern recognition based on parrallel optical feature extraction and performed experiments on this. The feature to be extracted are both 6 simple line orientations and two eigenvectors of the covariance matrix of the patterns that cannot be distinguished with the line orientation features alone. Our system consists of a feature-extraction part and a pattern-recognition part. The former that extracts the features in parallel with the multiplexed Vander Lugt filters was implemented optically, while the latter that performs the pattern recognition by the use of the extracted features was implemented in a computer. In the pattern recognition part, two methods are tested;one is to use an artificial neural network, which is trained to recognize the features directly, the other is to count the numbers of specific features simply and then to compare them with the stored reference feature numbers. We report the preliminary experimental results tested for 15 alpabet patterns with only straight line segments.

  • PDF

Solder Joint Inspection System using Support Vector Machine and Circular Illumination (Support Vector Machine과 원형 조명을 이용한 납땜 검사 시스템)

  • 심광재;윤태수;김항준
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10b
    • /
    • pp.494-496
    • /
    • 1999
  • 본 논문에서는 SV(Support Vector Machine)과 3단의 칼라 원형 조명장치를 이용한 효율적인 납땜 검사 시스템을 제안한다. 원형 조명장치를 이용하여 납땜부의 표면의 경사도에 의해서 생기는 명암의 분포로부터 납땜 검사를 위한 특징값을 추출한다. SVM은 추출된 특징값을 이용하여 납땜 영상을 정의된 타입중의 하나로 분류한다. SVM은 두 부류의 경계를 최대로 하는 최적경계를 학습하므로 납땜 영상과 같이 각 부류의 경계가 모호한 문제에 대해서 적은 수의 학습 데이터를 사용해도 우수한 성능을 나타낸다. 제안된 시스템은 현산업에서 사용되고 있는 다양한 표면실장형 부품에 대해서 적용해 본 결과 적은 학습 데이터에도 효율적으로 적용될 수 있음을 보였다.

  • PDF

Solder Joint Inspection System using Support Vector Machine and Circular Illumination (Support Vector Machine 과 원형 조명을 이용한 납땜 검사 시스템)

  • 심광재;윤태수;김항준
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.607-609
    • /
    • 2000
  • 본 논문에서는 SVM(Support Vector Machine)과 3단의 칼라 원형 조명장치를 이용한 효율적인 납땜 검사시스템을 제안한다. 원형 조명장치를 이용하여 납땜부의 표면의 경사도에 의해서 생기는 명암의 분포로부터 납땜 검사를 위한 특징값을 추출한다. SVM은 추출된 특징값을 이용하여 납땜 영상을 정의된 타입중의 하나로 분류한다. SBM은 두 부류의경계를 최대로 하는 최적경계를 학습하므로 납땜 영상과 같이 각 부류의 경계가 모호한 문제에 대해서 적은 수의 학습 데이터를 사용해도 우수한 성능을 나타낸다. 제안된 시스템은 현산업에서 사용되고 있는 다양한 표면실장형 부품에 대해서 적용해 본 결과 적은 학습 데이터에도 효율적으로 적용될 수 있음을 보였다.

  • PDF

Recognition and Reconstruction of 3-D Polyhedral Object using Model-based Perceptual Grouping (모델 기반 지각적 그룹핑을 이용한 3차원 다면체의 인식 및 형상 복원)

  • 박인규;이경무;이상욱
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.26 no.7B
    • /
    • pp.957-967
    • /
    • 2001
  • 본 논문에서는 모델 기반 지각적 그룹핑을 이용한 3차원 다면체의 인식 및 형상 복원에 관한 새로운 기법을 제안한다. 2차원 입력 영상과 여기에서 추출된 특징들의 3차원 특징을 거리 측정기를 이용하여 추출하여 인식 및 복원의 기본 특징으로 이용한다. 이 때, 모델의 3차원 기하학적 정보는 결정 트리 분류기에 의하여 학습되며 지각적 그룹핑은 이와 같은 모델 기반으로 이루어진다. 또한, 1차 그룹핑의 결과로 얻어진 3차원 직선 특징간의 관계는 Gestalt 그래프로 표현되며 이것의 부그래프 분할을 통하여 인식을 위한 후보 그룹이 생성된다. 마지막으로 각각의 후보 그룹은 3차원 모델과 정렬되어 가장 잘 부합되는 그룹을 인식 결과로 생성하게 된다. 그리고 정렬의 결과로서 2차원 텍스춰를 추출하여 3차원 모델에 매핑함으로써 실제적인 3차원 형상을 복원할 수 있다. 제안하는 알고리듬의 성능을 평가하기 위하여 불록 영상과 지형 모델 보드 영상에 대하여 실험을 수행하였다. 실험 결과, 모델 기반의 그룹핑 기법은 결과 그룹의 수를 상당히 감소시켰으며 또한 잡음과 가리워짐에 강건한 인식과 복원 결과가 얻어졌다.

  • PDF

A Deep Neural Network Technique for Automatic Measurement of Tibial Plateau Angle from Animal X-ray Images (동물 X-ray 영상에서 경골고원각도 자동 검출을 위한 심층신경망 기법 )

  • Jimin Kim;Hyungkyu Kim;Jeonghyeon Ryu;Sunju Lee;Hojoon Kim
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.579-580
    • /
    • 2023
  • 본 논문에서는 동물의 십자인대 질환의 진단지표인 경골고원각도(TPA)를 자동으로 측정하는 딥러닝 소프트웨어 기법을 제안한다. 동물 X-ray 영상에서 나타나는 피사체의 위치와 형태에 대한 다양한 변이는 TPA(Tibial Plateau Angle) 지표 산출에 필요한 특징점 검출과정에서 학습 효율을 현저하게 저하시킨다. 이에 본 연구에서는 YOLO(You Only Look Once) 기반 모델을 사용하여 일차적으로 경골영역의 분할 단계를 수행하고, 이어서 경골 상단부의 과간융기와 복사뼈의 중심점을 찾는 과정을 Resnet 기반의 특징점 추출 모듈로서 구현함으로써 학습의 효율과 지표 검출의 정확도를 향상시켰다. 총 201 개의 실제 X-ray 영상을 사용하여 학습 속도와 영역 분할 및 특징점 추출의 정확도 측면을 고려함으로 제안된 이론의 타당성을 실험적으로 평가하였다.

Word Boundary Detection of Voice Signal Using Recurrent Fuzzy Associative Memory (순환 퍼지연상기억장치를 이용한 음성경계 추출)

  • Ma Chang-Su;Kim Gye-Young
    • Journal of KIISE:Software and Applications
    • /
    • v.31 no.9
    • /
    • pp.1171-1179
    • /
    • 2004
  • We describe word boundary detection that extracts the boundary between speech and non-speech. The proposed method uses two features. One is the normalized root mean square of speech signal, which is insensitive to white noises and represents temporal information. The other is the normalized met-frequency band energy of voice signal, which is frequency information of the signal. Our method detects word boundaries using a recurrent fuzzy associative memory(RFAM) that extends FAM by adding recurrent nodes. Hebbian learning method is employed to establish the degree of association between an input and output. An error back-propagation algorithm is used for teaming the weights between the consequent layer and the recurrent layer. To confirm the effectiveness, we applied the suggested system to voice data obtained from KAIST.

Deep Learning based x4 and x8 Super-Resolution for Cultural Property Images (딥러닝 기반 문화재 영상에 대한 4 배 및 8 배 초해상화)

  • Son, Chaeyeon;Kim, Soo Ye;Kim, Juyoung;Kim, Munchurl
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.11a
    • /
    • pp.118-122
    • /
    • 2020
  • 문화재 영상 데이터는 방대한 양으로 인해 고해상도로 모두 저장이 어렵거나 시간이 지나 상대적으로 화질이 낮은 영상들이 다수 존재하기에 초해상화가 필요한 상황이 많다. 따라서 본 논문에서 처음으로 문화재 영상에 특화된 4 배 및 8 배 딥러닝 기반 초해상화 방식을 제안한다. 문화재 영상 데이터는 배경이 단조롭고 물체가 영상 중간에 위치한다는 특징이 있어 이를 고려해 중간 부분에서만 패치를 추출하는 방식을 적용하여 의미 있는 패치로 학습이 되도록 한다. 또 자연 영상 데이터 셋인 DIV2K 를 사용해 학습하는 방식과 직접 구성한 문화재 데이터 셋을 이용해 학습하는 방식, 그 둘을 적절히 함께 사용하여 학습하는 전이 학습 방법까지 세 가지로 학습하여 초해상화의 성능을 향상시키는 방법을 제안한다. 그 결과, 쌍삼차 보간법(Bicubic interpolation)보다 4 배 초해상화에서는 약 1.25dB, 8 배 초해상화에서는 약 1.26dB 의 성능 개선을 확인하였으며, 단순 DIV2K 로 학습한 방식보다는 4 배에서는 0.06dB, 8 배에서는 0.17dB 의 성능 개선을 확인하였다.

  • PDF