• 제목/요약/키워드: Layer-by-layer learning

검색결과 642건 처리시간 0.031초

GPGPU와 Combined Layer를 이용한 필기체 숫자인식 CNN구조 구현 (Implementation of handwritten digit recognition CNN structure using GPGPU and Combined Layer)

  • 이상일;남기훈;정준모
    • 문화기술의 융합
    • /
    • 제3권4호
    • /
    • pp.165-169
    • /
    • 2017
  • CNN(Convolutional Nerual Network)는 기계학습 알고리즘 중에서도 이미지의 인식과 분류에 뛰어난 성능을 보이는 알고리즘 중 하나이다. CNN의 경우 간단하지만 많은 연산량을 가지고 있어 많은 시간이 소요된다. 따라서 본 논문에서는 CNN 수행과정에서 많은 처리시간이 소모되는 convolution layer와 pooling layer, fully connected layer의 연산수행을 SIMT(Single Instruction Multiple Thread)구조의 GPGPU(General-Purpose computing on Graphics Processing Units)를 통하여 병렬로 연산처리를 수행했다. 또한 convolution layer의 출력을 저장하지 않고 pooling layer의 입력으로 바로 사용함으로 메모리 접근횟수를 줄여 성능 향상을 기대했다. 본 논문에서는 이 실험검증을 위하여 MNIST 데이터 셋을 사용하였고 이를 통하여 제안하는 CNN 구조가 기존의 구조보다 12.38% 더 좋은 성능을 보임을 확인했다.

선형 활성화 함수를 이용한 개선된 퍼지 단층 퍼셉트론 (An Enhanced Fuzzy Single Layer Perceptron With Linear Activation Function)

  • 박충식;조재현;김광백
    • 한국정보통신학회논문지
    • /
    • 제11권7호
    • /
    • pp.1387-1393
    • /
    • 2007
  • 기존의 단층 퍼셉트론은 출력 노드가 선형 분리 가능한 패턴들만을 분류할 수 있고 XOR과 같은 비선형 문제에 대해서는 분류할 수 없는 단점이 있다. 퍼지 단층 퍼셉트론은 퍼지 소속 함수(Fuzzy Membership Function)를 적용하여 단층 구조로 XOR 문제와 같은 고전적인 문제를 개선하였다. 그러나 퍼지 단층 퍼셉트론은 기존의 단층 퍼셉트론과 마찬가지로 결정 경계선이 진동하는 경우가 생기며 초기 가중치의 범위와 학습률에 따라 수렴성이 매우 낮아지는 단점이 있다. 따라서 본 논문에서는 바이어스항을 도입하여 결정 경계선이 진동하는 것을 방지하여 수렴성을 개선시키고 선형 활성화 함수를 제안하고 학습률과 모멘텀 개념을 도입 한 개선된 델타규칙을 적용함으로써 학습 시간을 단축시키는 개선된 퍼지 단층 퍼셉트론 알고리즘을 제안한다. 제안된 방법과 퍼지 단층 퍼셉트론간의 학습 성능을 분석하기 위하여 인공 신경망에서 벤치마크로 사용되는 XOR 문제와 패턴 분류에 적용하여 Epoch 수와 수렴성을 비교한 결과, 제안된 방법이 기존의 퍼지 단층 퍼셉트론보다 학습 시간이 적게 소요되고 수렴성이 개선된 것을 확인하였다.

AI 기반 이동통신 물리계층 기술 동향과 전망 (Physical-Layer Technology Trend and Prospect for AI-based Mobile Communication)

  • 장갑석;고영조;김일규
    • 전자통신동향분석
    • /
    • 제35권5호
    • /
    • pp.14-29
    • /
    • 2020
  • The 6G mobile communication system will become a backbone infrastructure around 2030 for the future digital world by providing distinctive services such as five-sense holograms, ultra-high reliability/low-latency, ultra-high-precision positioning, ultra-massive connectivity, and gigabit-per-second data rate for aerial and maritime terminals. The recent remarkable advances in machine learning (ML) technology have recognized its efficiency in wireless networking fields such as resource management and cell-configuration optimization. Further innovation in ML is expected to play an important role in solving new problems arising from 6G network management and service delivery. In contrast, an approach to apply ML to a physical-layer (PHY) target tackles the basic problems in radio links, such as overcoming signal distortion and interference. This paper reviews the methodologies of ML-based PHY, relevant industrial trends, and candiate technologies, including future research directions and standardization impacts.

내용 기반 이미지 검색을 위한 개선된 SIM 방법 (Improved SIM Algorithm for Contents-based Image Retrieval)

  • 김광백
    • 지능정보연구
    • /
    • 제15권2호
    • /
    • pp.49-59
    • /
    • 2009
  • 내용기반 이미지 검색은 색상, 질감 등의 이미지 자체의 자질들을 이용하여 검색하므로 텍스트 기반 이미지 검색의 객관성 부족과 모든 이미지에 사람이 주석을 달아야 하는 단점을 보완할 수 있는 이미지 검색 방법이다. 이러한 내용 기반 이미지 검색에서 사용되는 방식 중 SIM(Self-organizing Image browsing Map) 방식은 SOM 알고리즘을 이용하여 이미지들을 브라우징 가능한 그룹으로 맵핑하고 그 결과를 바탕으로 이미지를 검색하게 된다. 하지만 비슷한 이미지라 할지라도 이미지의 밝기, 피사체의 움직임 등에 의하여 색상 정보가 다르게 나타나게 되면 SOM 알고리즘의 학습 과정에서 유사한 이미지들을 그룹화한 노드를 BMU로 선택하지 못하고 떨어져 있는 다른 노드를 선택하게 된다. 이 경우 학습이 진행되면서 유사한 이미지들이 군집하는 과정을 거치지만 학습이 완료될 때까지 다른 유사 이미지들을 그룹화한 노드에 맵핑이 되지 못하는 경우가 발생한다. 그 결과, 검색 결과에 나타나지 못하여 적합 이미지 검색률이 낮아 질 수 있다. 따라서 본 논문에서는 HSV 색상모델을 이용하여 양자화하고 이미지의 색상 특징 벡터를 추출한 뒤 SOM 알고리즘을 이용하여 이미지들을 브라우징 가능한 그룹으로 맵핑한다. 이때 SIM 방식의 문제점인 유사 이미지가 따로 맵핑되어 적합 이미지 검색률이 낮아지는 것을 줄이기 위하여 SOM을 두 개의 층으로 구성한다. 첫 번째 층에서 이미지의 색상 자질을 이용하여 학습을 완료한 후, 학습이 완료된 첫 번째 층 맵의 각 노드들의 연결 가중치를 이용하여 두 번째 층에서 다시 한번 학습을 수행한다. 두 개의 층으로 학습이 완료된 두 번째 층의 SOM에 질의 이미지의 특징 벡터를 입력하여 BMU를 선택하고 BMU와 연결된 첫 번째 층의 노드를 최종 선택하여 이미지를 검색한다. 실험결과, 제안된 이미지 검색 방법이 기존의 이미지 검색 방법 보다 적합 이미지의 검색 성공률이 높은 것을 확인 할 수 있었다.

  • PDF

대각귀환 신경망을 이용한 비선형 적응 제어 (Adaptive Control of the Nonlinear Systems Using Diagonal Recurrent Neural Networks)

  • 류동완;이영석;서보혁
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1996년도 하계학술대회 논문집 B
    • /
    • pp.939-942
    • /
    • 1996
  • This paper presents a stable learning algorithm for diagonal recurrent neural network(DRNN). DRNN is applied to a problem of controlling nonlinear dynamical systems. A architecture of DRNN is a modified model of the Recurrent Neural Network(RNN) with one hidden layer, and the hidden layer is comprised of self-recurrent neurons. DRNN has considerably fewer weights than RNN. Since there is no interlinks amongs in the hidden layer. DRNN is dynamic mapping and is better suited for dynamical systems than static forward neural network. To guarantee convergence and for faster learning, an adaptive learning rate is developed by using Lyapunov function. The ability and effectiveness of identifying and controlling a nonlinear dynamic system using the proposed algorithm is demonstrated by computer simulation.

  • PDF

콘볼류션 신경망을 이용한 손글씨 숫자 인식 구현 (Implementation of Handwriting Number Recognition using Convolutional Neural Network)

  • 박태주;송특섭
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.561-562
    • /
    • 2021
  • CNN(Convolutional Neural Network)은 다양한 이미지를 인식하는데 많이 사용되고 있다. 본 발표에서는 딥러닝의 CNN 기법을 적용해서 사람이 직접 손으로 쓴 한 자리 숫자를 인식하였다. 딥러닝 네트워크는 합성곱 레이어, 풀링 레이어, 플래튼 레이어로 구성하였고 마지막으로 최적화 방법, 학습률과 손실 함수를 설정하였다.

  • PDF

뇌파의 입력패턴벡터 추출 및 패턴인식 (Input Pattern Vector Extraction and Pattern Recognition of EEG)

  • 이용구;이선엽;최우승
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권5호
    • /
    • pp.95-103
    • /
    • 2006
  • 본 논문에서는 뇌파인식을 위한 입력패턴벡터를 추출하고 패턴인식을 위한 뇌파 학습 알고리즘을 설계하였다. 입력패턴벡터의 구성을 위해 알파리듬과 베타리듬의 주파수와 진폭이 사용되었고, 뇌파패턴인식을 위한 알고리즘은 초기 참조벡터의 학습을 위해 SOM을 이용하고, 종속 부류층의 출력뉴런의 부류지정을 위하여 out-star 학습법을 사용하였다. 제안된 알고리즘의 입력 층과 종속 클래스 층 사이의 연결강도는 SOM과 LVQ 알고리즘을 이용하여 초기 참조벡터의 설정 및 학습이 가능하게 하였고, 패턴벡터를 종속 부류층의 뉴런에 의해 종속 클래스로 분류하고, 종속 클래스 층과 출력 층 사이의 연결강도는 분류된 종속 부류를 클래스로 지정하는 학습을 하게 된다. 뇌파 패턴 분류를 위하여 제안된 학습알고리즘을 이용하여 시뮬레이션 되었고 기존의 LVQ 학습방식보다 우수한 분류성공률을 확인하였다.

  • PDF

A Method for Improving Resolution and Critical Dimension Measurement of an Organic Layer Using Deep Learning Superresolution

  • Kim, Sangyun;Pahk, Heui Jae
    • Current Optics and Photonics
    • /
    • 제2권2호
    • /
    • pp.153-164
    • /
    • 2018
  • In semiconductor manufacturing, critical dimensions indicate the features of patterns formed by the semiconductor process. The purpose of measuring critical dimensions is to confirm whether patterns are made as intended. The deposition process for an organic light emitting diode (OLED) forms a luminous organic layer on the thin-film transistor electrode. The position of this organic layer greatly affects the luminescent performance of an OLED. Thus, a system for measuring the position of the organic layer from outside of the vacuum chamber in real-time is desired for monitoring the deposition process. Typically, imaging from large stand-off distances results in low spatial resolution because of diffraction blur, and it is difficult to attain an adequate industrial-level measurement. The proposed method offers a new superresolution single-image using a conversion formula between two different optical systems obtained by a deep learning technique. This formula converts an image measured at long distance and with low-resolution optics into one image as if it were measured with high-resolution optics. The performance of this method is evaluated with various samples in terms of spatial resolution and measurement performance.

Robust Multi-Layer Hierarchical Model for Digit Character Recognition

  • Yang, Jie;Sun, Yadong;Zhang, Liangjun;Zhang, Qingnian
    • Journal of Electrical Engineering and Technology
    • /
    • 제10권2호
    • /
    • pp.699-707
    • /
    • 2015
  • Although digit character recognition has got a significant improvement in recent years, it is still challenging to achieve satisfied result if the data contains an amount of distracting factors. This paper proposes a novel digit character recognition approach using a multi-layer hierarchical model, Hybrid Restricted Boltzmann Machines (HRBMs), which allows the learning architecture to be robust to background distracting factors. The insight behind the proposed model is that useful high-level features appear more frequently than distracting factors during learning, thus the high-level features can be decompose into hybrid hierarchical structures by using only small label information. In order to extract robust and compact features, a stochastic 0-1 layer is employed, which enables the model's hidden nodes to independently capture the useful character features during training. Experiments on the variations of Mixed National Institute of Standards and Technology (MNIST) dataset show that improvements of the multi-layer hierarchical model can be achieved by the proposed method. Finally, the paper shows the proposed technique which is used in a real-world application, where it is able to identify digit characters under various complex background images.

Multi-Layer Perceptron과 Random Forest를 이용한 실린더 판재의 성형 조건 예측 (Application of Multi-Layer Perceptron and Random Forest Method for Cylinder Plate Forming)

  • 김성겸;황세윤;이장현
    • 대한조선학회논문집
    • /
    • 제57권5호
    • /
    • pp.297-304
    • /
    • 2020
  • In this study, the prediction method was reviewed to process a cylindrical plate forming using machine learning as a data-driven approach by roll bending equipment. The calculation of the forming variables was based on the analysis using the mechanical relationship between the material properties and the roll bending machine in the bending process. Then, by applying the finite element analysis method, the accuracy of the deformation prediction model was reviewed, and a large number data set was created to apply to machine learning using the finite element analysis model for deformation prediction. As a result of the application of the machine learning model, it was confirmed that the calculation is slightly higher than the linear regression method. Applicable results were confirmed through the machine learning method.