• 제목/요약/키워드: multi-layer perceptron

검색결과 436건 처리시간 0.025초

신경망 기반 눈 영역 추정에 의한 실시간 얼굴 검출 기법 (Real-Time Face Detection by Estimating the Eye Region Using Neural Network)

  • 김주섭;김재희
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 하계종합학술대회 논문집(4)
    • /
    • pp.21-24
    • /
    • 2001
  • In this paper, we present a fast face detection algorithm by estimating the eye region using neural network. To implement a real time face detection system, it is necessary to reduce search space. We limit the search space just to a few pairs of eye candidates. For the selection of them, we first isolate possible eye regions in the fast and robust way by modified histogram equalization. The eye candidates are paired to form an eye pair and each of the eye pair is estimated how close it is to a true eye pair in two aspects : One is how similar the two eye candidates are in shape and the other is how close each of them is to a true eye image A multi-layer perceptron neural network is used to find the eye candidate region's closeness to the true eye image. Just a few best candidates are then verified by eigenfaces. The experimental results show that this approach is fast and reliable. We achieved 94% detection rate with average 0.1 sec Processing time in Pentium III PC in the experiment on 424 gray scale images from MIT, Yale, and Yonsei databases.

  • PDF

시간지연 회귀 신경회로망을 이용한 피치 악센트 인식 (Automatic Recognition of Pitch Accents Using Time-Delay Recurrent Neural Network)

  • Kim, Sung-Suk;Kim, Chul;Lee, Wan-Joo
    • The Journal of the Acoustical Society of Korea
    • /
    • 제23권4E호
    • /
    • pp.112-119
    • /
    • 2004
  • This paper presents a method for the automatic recognition of pitch accents with no prior knowledge about the phonetic content of the signal (no knowledge of word or phoneme boundaries or of phoneme labels). The recognition algorithm used in this paper is a time-delay recurrent neural network (TDRNN). A TDRNN is a neural network classier with two different representations of dynamic context: delayed input nodes allow the representation of an explicit trajectory F0(t), while recurrent nodes provide long-term context information that can be used to normalize the input F0 trajectory. Performance of the TDRNN is compared to the performance of a MLP (multi-layer perceptron) and an HMM (Hidden Markov Model) on the same task. The TDRNN shows the correct recognition of $91.9{\%}\;of\;pitch\;events\;and\;91.0{\%}$ of pitch non-events, for an average accuracy of $91.5{\%}$ over both pitch events and non-events. The MLP with contextual input exhibits $85.8{\%},\;85.5{\%},\;and\;85.6{\%}$ recognition accuracy respectively, while the HMM shows the correct recognition of $36.8{\%}\;of\;pitch\;events\;and\;87.3{\%}$ of pitch non-events, for an average accuracy of $62.2{\%}$ over both pitch events and non-events. These results suggest that the TDRNN architecture is useful for the automatic recognition of pitch accents.

Design of hetero-hybridized feed-forward neural networks with information granules using evolutionary algorithm

  • 노석범;오성권;안태천
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2005년도 추계학술대회 학술발표 논문집 제15권 제2호
    • /
    • pp.483-487
    • /
    • 2005
  • We introduce a new architecture of hetero-hybridized feed-forward neural networks composed of fuzzy set-based polynomial neural networks (FSPNN) and polynomial neural networks (PM) that are based on a genetically optimized multi-layer perceptron and develop their comprehensive design methodology involving mechanisms of genetic optimization and Information Granulation. The construction of Information Granulation based HFSPNN (IG-HFSPNN) exploits fundamental technologies of Computational Intelligence(Cl), namely fuzzy sets, neural networks, and genetic algorithms(GAs) and Information Granulation. The architecture of the resulting genetically optimized Information Granulation based HFSPNN (namely IG-gHFSPNN) results from a synergistic usage of the hybrid system generated by combining new fuzzy set based polynomial neurons (FPNs)-based Fuzzy Neural Networks(PM) with polynomial neurons (PNs)-based Polynomial Neural Networks(PM). The design of the conventional genetically optimized HFPNN exploits the extended Group Method of Data Handling(GMDH) with some essential parameters of the network being tuned by using Genetie Algorithms throughout the overall development process. However, the new proposed IG-HFSPNN adopts a new method called as Information Granulation to deal with Information Granules which are included in the real system, and a new type of fuzzy polynomial neuron called as fuzzy set based polynomial neuron. The performance of the IG-gHFPNN is quantified through experimentation.

  • PDF

다층 신경 망을 이용한 비중심F분포 확률계산 (Computation of Noncentral F Probabilities using multilayer neural network)

  • 구선희
    • 정보처리학회논문지B
    • /
    • 제9B권3호
    • /
    • pp.271-276
    • /
    • 2002
  • ANOVA 검정에서 검정통계량은 단일 또는 이중 비중심F분포를 따르며 비중심F분포는 일반적인 선형 가설 검정에서 검정함수 계산에 적용되고 있다. 기존 비중심F분포의 함수 계산에 대한 연구로 여러 접근 방법이 제시되었지만, 하나의 정확한 함수값을 구하는데도 많은 시간이 소요되는 문제점이 발생되었다. 본 논문에서는 기존 함수 계산의 문제점을 해결하기 위하여 다층 퍼셉트론 네트워크로부터 역전파 학습 알고리즘을 적용하여 비중심F분포의 함수값을 구하는 방법을 제안하였다. 제안된 신경망에 의한 함수값과 기존 Patnaik이 제시한 분포식에 의한 함수값의 차이를 표와 그림을 통하여 비교하였으며, 정확성과 계산속도를 고려할 때 Patnaik의 함수식에 의한 방법보다 신경망을 이용한 방법이 효율적임을 알 수가 있다.

GPU를 이용한 신경망 구현 (Implementation of Neural Networks using GPU)

  • 오경수;정기철
    • 정보처리학회논문지B
    • /
    • 제11B권6호
    • /
    • pp.735-742
    • /
    • 2004
  • 본 논문은 일반적인 그래픽스 하드웨어를 이용하여 더욱 빠른 신경망을 구현하고, 구현된 시스템을 영상 처리 분야에 적용함으로써 효용성을 검증한다. GPU의 병렬성을 효율적으로 사용하기 위하여, 다수의 입력벡터와 연결가중치벡터를 모아서 많은 내적연산을 하나의 행렬곱 연산으로 대체하였고, 시그모이드와 바이어스 항 덧셈 연산도 GPV 상에서 픽셀세이더로 구현하였다. ATI RADEON 9800 XT 보드를 이용하여 구현된 신경망 시스템은 CPU를 사용한 기존의 시스템과 비교하여 정확도의 차이 없이 30배 정도의 속도 향상을 얻을 수 있었다.

합성단위 자동생성을 위한 자동 음소 분할기 후처리에 대한 연구 (The Postprocessor of Automatic Segmentation for Synthesis Unit Generation)

  • 박은영;김상훈;정재호
    • 한국음향학회지
    • /
    • 제17권7호
    • /
    • pp.50-56
    • /
    • 1998
  • 본 논문은 자동 음소 분할기의 음소 경계 오류를 보상하기 위한 후처리 (Postprocessing)에 관한 연구이다. 이는 현재 음성 합성을 위한 음성/언어학적 연구, 운율 모델링, 합성단위 자동 생성 연구 등에 대량의 음소 단위 분절과 음소 레이블링된 데이터의 필요성에 따른 연구의 일환이다. 특히 수작업에 의한 분절 및 레이블링은 일관성의 유지가 어렵고 긴 시간이 소요되므로 자동 분절 기술이 더욱 중요시 되고 있다. 따라서, 본 논문은 자동 분절 경계의 오류 범위를 줄일 수 있는 후처리기를 제안하여 자동 분절 결과를 직접 합성 단위로 사용할 수 있고 대량의 합성용 운율 데이터 베이스 구축에 유용함을 기술한다. 제안된 후처리기는 수작업으로 조정된 데이터의 특징 벡터를 다층 신경회로망 (MLP:Multi-layer perceptron)을 통해 학습을 한 후, ETRI(Electronics and Telecommunication Research Institute)에서 개발된 음성 언어 번역 시스템을 이용한 자동 분절 결과와 후처리기인 MLP를 이용하여 새로운 음소 경계를 추출한다. 고립단어로 발성된 합성 데이터베이스에서 후처리기로 보정된 분절 결과는 음성 언어 번역 시스템의 분할율보 다 약 25%의 향상된 성능을 보였으며, 절대 오류(|Hand label position-Auto label position |)는 약 39%가 향상되었다. 이는 MLP를 이용한 후처리기로 자동 분절 오류의 범위를 줄 일 수 있고, 대량의 합성용 운율 데이터 베이스 구축 및 합성 단위의 자동생성에 이용될 수 있음을 보이는 것이다.

  • PDF

CNN을 이용한 소비 전력 파형 기반 명령어 수준 역어셈블러 구현 (Implementation of Instruction-Level Disassembler Based on Power Consumption Traces Using CNN)

  • 배대현;하재철
    • 정보보호학회논문지
    • /
    • 제30권4호
    • /
    • pp.527-536
    • /
    • 2020
  • 정보보호용 디바이스의 부채널 정보인 소비 전력 파형을 이용하면 내장된 비밀 키 뿐만 아니라 동작 명령어를 복구할 수 있음이 밝혀졌다. 최근에는 MLP 등과 같은 딥러닝 모델을 이용한 프로파일링 기반의 부채널 공격들이 연구되고 있다. 본 논문에서는 마이크로 컨트롤러 AVR XMEGA128-D4가 사용하는 명령어에 대한 역어셈블러를 구현하였다. 명령어에 대한 템플릿 파형을 수집하고 전처리하는 과정을 자동화하였으며 CNN 딥러닝 모델을 사용하여 명령-코드를 분류하였다. 실험 결과, 전체 명령어는 약 87.5%의 정확도로, 사용 빈도가 높은 주요 명령어는 99.6%의 정확도로 분류될 수 있음을 확인하였다.

Predicting concrete properties using neural networks (NN) with principal component analysis (PCA) technique

  • Boukhatem, B.;Kenai, S.;Hamou, A.T.;Ziou, Dj.;Ghrici, M.
    • Computers and Concrete
    • /
    • 제10권6호
    • /
    • pp.557-573
    • /
    • 2012
  • This paper discusses the combined application of two different techniques, Neural Networks (NN) and Principal Component Analysis (PCA), for improved prediction of concrete properties. The combination of these approaches allowed the development of six neural networks models for predicting slump and compressive strength of concrete with mineral additives such as blast furnace slag, fly ash and silica fume. The Back-Propagation Multi-Layer Perceptron (BPMLP) with Bayesian regularization was used in all these models. They are produced to implement the complex nonlinear relationship between the inputs and the output of the network. They are also established through the incorporation of a huge experimental database on concrete organized in the form Mix-Property. Thus, the data comprising the concrete mixtures are much correlated to each others. The PCA is proposed for the compression and the elimination of the correlation between these data. After applying the PCA, the uncorrelated data were used to train the six models. The predictive results of these models were compared with the actual experimental trials. The results showed that the elimination of the correlation between the input parameters using PCA improved the predictive generalisation performance models with smaller architectures and dimensionality reduction. This study showed also that using the developed models for numerical investigations on the parameters affecting the properties of concrete is promising.

모바일 기기를 위한 음성인식의 사용자 적응형 후처리 (User Adaptive Post-Processing in Speech Recognition for Mobile Devices)

  • 김영진;김은주;김명원
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제13권5호
    • /
    • pp.338-342
    • /
    • 2007
  • 본 논문에서는 모바일 환경에서 고립단어 음성인식을 할 경우 화자종속 방법을 이용하여 성능을 높이는 사용자 적응형 후처리 방법을 제안한다. 이 방법은 인식기의 정확한 인식 결과를 위한 추가적인 처리들로 구성된다. 즉 인식기의 출력과 정확한 최종 결과들 간의 관계를 학습하여 이를 잘못된 인식기의 출력을 수정하는 데에 사용한다. 학습에는 패턴인식에 강인한 다층 퍼셉트론을 사용하며 학습 시간을 고려하여 모델을 세분화하고 동적으로 동작할 수 있도록 구현한다. 이 결과 인식기의 오류에 대해 41%를 수정하는 성과(오류 수정률: 41%)를 보였다.

신경회로망을 이용한 흉부 X-선 영상에서의 폐 영역분할 (Lung Area Segmentation in Chest Radiograph Using Neural Network)

  • 김종효;박광석;민병구;임정기;한만청;이충웅
    • 대한의용생체공학회:학술대회논문집
    • /
    • 대한의용생체공학회 1990년도 춘계학술대회
    • /
    • pp.33-37
    • /
    • 1990
  • In this paper, a new method for lung area segmentation in chest radiographs has been presented. The movivation of this study is to include fuzzy informations about the relation between the image date structure and the area to be segmented in the segmentation process efficiently. The proposed method approached the segmentation problem in the perspective of pattern classification, using trainable pattern classifier, multi-layer perceptron. Having been trained with 10 samples, this method gives acceptable segmentation results, and also demonstrated the desirable property of giving better results as the training continues with more training samples.

  • PDF