• 제목/요약/키워드: Multi-Layer-Perceptron

검색결과 436건 처리시간 0.026초

神經網을 利用한 韓國語 數字音 認識에 관한 硏究 (A Study on the Spoken KOrean-Digit Recognition Using the Neural Netwok)

  • 박현화;강해동;배건ㅅ성
    • 한국음향학회지
    • /
    • 제11권3호
    • /
    • pp.5-13
    • /
    • 1992
  • 한국어 숫자음이 단음절인 특성을 이용하여 각 숫자음에 대해 시간정합을 필요로 하지 않으면서 일정한 수를 갖는 특징벡터를 추출하여 다층구조 신경망으로 인식실험을 하였다. 음성신호의 시작점/끝점과 더불어 모음의 최대 피크점을 기준으로 해석구간을 초성, 중성, 종성의 세 부분으로 나누었으며, 음성신호의 특징벡터로는 반사계수, 켑스트럼, ${\Delta}$켑스트럼, ${\Delta}$에너지 등을 이용하여, 각 특징벡터 및 입력층과 은닉층의 노드 수에 따른 인식율 및 학습속도 등을 비교하였다. 신경망의 입력층의 특징벡터로서 반사계수를 사용한 경우보다 켑스트럼을 사용했을 때가 더 좋은 인식율을 보였다. ${\Delta}$켑스트럼의 특성이 전체 인식율에 미치는 영향이 그다지 크지 않았는데, 이는 한국어 숫자음이 단음절로 구성되어 있는 특징을 이용해 분석 구간을 stationary한 특성을 갖는 세 부분으로 구분하였기 때문이라 생각된다. 각 숫자음에 대해 150개의 켑스트럼을 사용한 경우에 97.8%의 인식율을 얻었다.

  • PDF

명암도 동시발생 행렬과 웨이블릿 특징 조합에 기반한 지문 분류 방법 (A Fingerprint Classification Method Based on the Combination of Gray Level Co-Occurrence Matrix and Wavelet Features)

  • 강승호
    • 한국멀티미디어학회논문지
    • /
    • 제16권7호
    • /
    • pp.870-878
    • /
    • 2013
  • 본 논문에서는 생체인증 시스템의 하나인 지문인식 시스템의 정확도와 효율성을 높이기 위한 새로운 지문 분류 방법을 제안한다. 기존 연구에 따르면 지문은 융선과 골의 방향과 형상에 따라 몇 가지 유형으로 분류할 수 있다. 지문 데이터베이스를 사전에 유형에 따라 분류해 놓고 인식 대상인 지문의 유형을 정확하게 분류할 수 있다면 지문 인식 시간을 크게 줄일 수 있다. 왜냐하면 선택된 부류 안의 지문들만을 상대로 인증 대상인 지문과 비교하면 되기 때문이다. 본 논문은 우선 지문 영상으로부터 실제 지문 정보가 위치하는 관심영역 추출 방법을 제시한다. 다음엔 추출된 관심영역을 대상으로 질감 인식기반의 명암도 동시발생 행렬과 웨이브릿 변환을 통한 특징 추출 방법을 제시하고 기존의 명암도 동시발생 행렬만을 이용한 특징 추출 방법과 다층 퍼셉트론 및 서포트 벡터 머신을 사용해 성능을 비교한다.

지능형 IoT 미러 시스템을 활용한 인터랙티브 콘텐츠 서비스 구현 (Development of Interactive Content Services through an Intelligent IoT Mirror System)

  • 정원석;서정욱
    • 한국항행학회논문지
    • /
    • 제22권5호
    • /
    • pp.472-477
    • /
    • 2018
  • 본 논문에서는 지능형 IoT (internet of things) 미러 시스템을 통해 사용자의 우울증 예방을 위한 인터랙티브 콘텐츠 서비스를 구현한다. 인터랙티브 콘텐츠 서비스를 위해 IoT 미러 장치는 뇌파 헤드셋 디바이스로부터 집중도 및 명상도 데이터를 측정하고, 웹캠을 통해 다층 퍼셉트론 알고리즘으로 분류된 "슬픔", "분노", "혐오감", "중립", "행복" 및 "놀람"과 같은 표정 데이터를 측정한 후, oneM2M 표준을 준용한 IoT 서버로 전송한다. IoT 서버에 수집된 데이터는 제안한 병합 레이블링 과정을 거쳐 세 가지의 우울 단계(RED, YELLOW, GREEN)를 분류하는 기계학습 모델을 생성한다. 실험을 통해 k-최근접 이웃 모델로 우울 단계를 분류한 결과 약 93%의 정확도를 얻을 수 있었고, 분류된 우울 단계에 따라 가족, 친구 및 사회복지사에게 소셜 네트워크 서비스 에이전트를 통해 알림 메시지를 전송하여 사용자와 보호자 간의 인터랙티브 콘텐츠 서비스를 구현하였다.

도래각 추정을 위한 3단계 인공신경망 알고리듬 (Three Stage Neural Networks for Direction of Arrival Estimation)

  • 박선배;유도식
    • 한국항행학회논문지
    • /
    • 제24권1호
    • /
    • pp.47-52
    • /
    • 2020
  • 도래각추정은 표적으로부터 생성, 혹은 반사된 신호를 분석하여 표적의 방향을 추정하는 것으로 다양한 분야에 활용되고 있다. 인공신경망은 생물의 신경망을 모방한 기계학습의 한 분야로 패턴인식에서 좋은 성능을 보인다. 이러한 인공신경망을 도래각 추정에 활용하는 연구가 진행되어왔으나, 다양한 신호대잡음비 환경에 대응하는데에 제한이 있는 상황이다. 본 논문에서는 도래각 추정을 위한 3단계 인공신경망 알고리듬을 제안한다. 제안하는 알고리듬은 잡음제거과정을 통해 단일 신호대잡음비 환경에서 학습한 모델을 다양한 환경에 적용해도 성능감소를 최소화할 수 있다. 또한 도래각 시프트 과정을 통해 학습 난이도를 낮출 수 있고 효율적인 추정이 가능하다. 우리는, 제안하는 알고리듬과 다른 부공간 기법, Cramer-Rao bound (CRB)와의 성능 비교를 통해 제안하는 알고리듬이 낮은 신호대잡음비 환경, 표적들의 도래각이 가까운 환경 등 특정한 열악한 관측환경에서 타 기법에 비해 좋은 성능을 보이는 것을 확인하였다.

힘 센서를 이용한 접촉감지부에서 신경망기반 인간의 접촉행동 인식 (Human Touching Behavior Recognition based on Neural Network in the Touch Detector using Force Sensors)

  • 류정우;박천수;손주찬
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권10호
    • /
    • pp.910-917
    • /
    • 2007
  • 인간-로봇 상호작용에서 접촉은 인간에게 정서적 안정을 줄 수 있는 중요한 상호작용 방법 중 하나이다. 그러나 지금까지 음성과 영상을 기반으로 인간-로봇 상호작용이 이루어지는 연구가 대부분이었다. 본 논문에서는 접촉을 통한 인간-로봇 상호작용을 위해 인간의 접촉행동을 인식하는 방법을 제안한다. 제안한 인식 방법에서 인식 과정은 전처리 단계와 인식 단계로 나뉜다. 전처리 단계는 접촉감지부에서 생성된 데이타로부터 인식할 수 있는 특징들을 계산하는 단계이고 인식 단계는 인식기를 통해 접촉행동으로 분류하는 단계이다. 접촉감지부는 힘 센서인 FSR 센서를 이용하여 제작하였고 인식기는 신경망 모델인 다층퍼셉트론을 사용하였다. 실험은 남자 여섯 명에 의해 생성된 세 가지 접촉행동; '때리다', '쓰다듬다', '간질이다' 데이타를 가지고, 사람별로 인식기를 생성하여 cross-validation으로 평가한 결과 82.9%의 평균인식률을 보였고, 사람별 구분 없이 한 개의 인식기로 실험한 결과는 74.5%의 평균 인식률을 보였다.

한국어 파열음 인식을 위한 피쳐 셉 입력 인공 신경망 모델에 관한 연구 (A STUDY ON THE IMPLEMENTATION OF ARTIFICIAL NEURAL NET MODELS WITH FEATURE SET INPUT FOR RECOGNITION OF KOREAN PLOSIVE CONSONANTS)

  • 김기석;김인범;황희융
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1990년도 하계학술대회 논문집
    • /
    • pp.535-538
    • /
    • 1990
  • The main problem in speech recognition is the enormous variability in acoustic signals due to complex but predictable contextual effects. Especially in plosive consonants it is very difficult to find invariant cue due to various contextual effects, but humans use these contextual effects as helpful information in plosive consonant recognition. In this paper we experimented on three artificial neural net models for the recognition of plosive consonants. Neural Net Model I used "Multi-layer Perceptron ". Model II used a variation of the "Self-organizing Feature Map Model". And Model III used "Interactive and Competitive Model" to experiment contextual effects. The recognition experiment was performed on 9 Korean plosive consonants. We used VCV speech chains for the experiment on contextual effects. The speech chain consists of Korean plosive consonants /g, d, b, K, T, P, k, t, p/ (/ㄱ, ㄷ, ㅂ, ㄲ, ㄸ, ㅃ, ㅋ, ㅌ, ㅍ/) and eight Korean monothongs. The inputs to Neural Net Models were several temporal cues - duration of the silence, transition and vot -, and the extent of the VC formant transitions to the presence of voicing energy during closure, burst intensity, presence of asperation, amount of low frequency energy present at voicing onset, and CV formant transition extent from the acoustic signals. Model I showed about 55 - 67 %, Model II showed about 60%, and Model III showed about 67% recognition rate.

  • PDF

신경회로망 기반 고장 진단 시스템을 위한 고장 신호별 특징 벡터 결정 방법 (Feature Vector Decision Method of Various Fault Signals for Neural-network-based Fault Diagnosis System)

  • 한형섭;조상진;정의필
    • 한국소음진동공학회논문집
    • /
    • 제20권11호
    • /
    • pp.1009-1017
    • /
    • 2010
  • As rotating machines play an important role in industrial applications such as aeronautical, naval and automotive industries, many researchers have developed various condition monitoring system and fault diagnosis system by applying various techniques such as signal processing and pattern recognition. Recently, fault diagnosis systems using artificial neural network have been proposed. For effective fault diagnosis, this paper used MLP(multi-layer perceptron) network which is widely used in pattern classification. Since using obtained signals without preprocessing as inputs of neural network can decrease performance of fault classification, it is very important to extract significant features of captured signals and to apply suitable features into diagnosis system according to the kinds of obtained signals. Therefore, this paper proposes the decision method of the proper feature vectors about each fault signal for neural-network-based fault diagnosis system. We applied LPC coefficients, maximum magnitudes of each spectral section in FFT and RMS(root mean square) and variance of wavelet coefficients as feature vectors and selected appropriate feature vectors as comparing error ratios of fault diagnosis for sound, vibration and current fault signals. From experiment results, LPC coefficients and maximum magnitudes of each spectral section showed 100 % diagnosis ratios for each fault and the method using wavelet coefficients had noise-robust characteristic.

선형예측계수와 뇌파의 변화를 이용한 신경회로망 기반 운전자의 졸음 감지 시스템 (Neural-network-based Driver Drowsiness Detection System Using Linear Predictive Coding Coefficients and Electroencephalographic Changes)

  • 정의필;한형섭
    • 융합신호처리학회논문지
    • /
    • 제13권3호
    • /
    • pp.136-141
    • /
    • 2012
  • 운전 중 운전자의 졸음은 교통 사망사고를 일으키는 중요한 요인이며 음주운전보다도 더 위험할 수 도 있다. 이러한 이유로 운전자의 졸음을 판별하고 경고하는 시스템 개발이 최근에 매우 중요한 이슈로 떠올랐다. 그중에서도 졸음과 가장 밀접한 관련이 있는 생체 신호인 뇌파 (Electroencephalogram, EEG)와 안구전도 (Electrooculogram, EOG)를 분석하는 연구가 주류를 이루고 있다. 본 논문에서는 실험 프로토콜에 의거하여 측정된 뇌파를 주파수별로 분석하여 운전자의 상태별 뇌파 데이터베이스를 구축하고 선형예측(Linear Predictive coding, LPC) 계수를 특징벡터로 한 신경회로망 기반 운전자 졸음 감지 시스템을 제안한다. 실험결과로 졸음의 뇌파분석에서 알파파가 감소하며 세타파가 증가하는 추세를 보였으며, LPC 계수가 각성, 졸음 및 수면상태의 특징을 잘 반영하였다. 특히 제안한 시스템은 적은 샘플(250ms)을 가지고도 96.5%라는 높은 분류 결과를 얻어 짧은 순간에 일어날 수 있는 운전 시 돌발 상황을 실시간으로 검출 가능성을 확인하였다.

다양한 합성곱 신경망 방식을 이용한 모바일 기기를 위한 시작 단어 검출의 성능 비교 (Performance comparison of wake-up-word detection on mobile devices using various convolutional neural networks)

  • 김상홍;이보원
    • 한국음향학회지
    • /
    • 제39권5호
    • /
    • pp.454-460
    • /
    • 2020
  • 음성인식 기능을 제공하는 인공지능 비서들은 정확도가 뛰어난 클라우드 기반의 음성인식을 통해 동작한다. 클라우드 기반의 음성인식에서 시작 단어 인식은 대기 중인 기기를 활성화하는 데 중요한 역할을 한다. 본 논문에서는 공개 데이터셋인 구글의 Speech Commands 데이터셋을 사용하여 스펙트로그램 및 멜-주파수 캡스트럼 계수 특징을 입력으로 하여 모바일 기기에 대응한 저 연산 시작 단어 검출을 위한 합성곱 신경망의 성능을 비교한다. 본 논문에서 사용한 합성곱 신경망은 다층 퍼셉트론, 일반적인 합성곱 신경망, VGG16, VGG19, ResNet50, ResNet101, ResNet152, MobileNet이며, MobileNet의 성능을 유지하면서 모델 크기를 1/25로 줄인 네트워크도 제안한다.

신경망을 이용한 MODIS NDVI의 자동화 변화탐지 기법 (Automatic Change Detection of MODIS NDVI using Artificial Neural Networks)

  • 정명희
    • 전자공학회논문지CI
    • /
    • 제49권2호
    • /
    • pp.83-89
    • /
    • 2012
  • 지구의 중요한 천연자원인 산림을 포함한 자연 식생환경은 지난 1세기 동안 많은 변화를 겪으며 기후에도 영향을 미치게 되어 현재 지구적 차원의 관심 속에서 다양한 연구가 진행되고 있다. 원격탐사는 분광적 특성을 이용하여 식생의 특성을 탐지할 수 있어 식생자원을 모니터링하는데 매우 효율적인 수단이다. 이러한 연구에서는 보통 원격탐사 측정을 분석하여 관찰된 화소가 식생을 포함하고 있는 정도를 나타내는 식생지수가 사용되고 있는데 NDVI가 이중 가장 많이 사용되는 식생지수이다. 본 논문에서는 MODIS NDVI 시계열 자료를 이용하여 자동으로 식생의 변화를 탐지해 가는 방법론이 제안되어 있다. 변화탐지를 위해 비모수 방법의 신경망 모형이 사용되었고 특성벡터로는 한 화소에서 다중 시기의 NDVI 차이와 더불어 NDVI 시계열 자료의 시간상의 관계가 함께 고려될수 있도록 제안되었다. 사용된 모형의 테스트를 위해 2006년부터 2011년까지 한반도 지역에 대한 MODIS MYD13Q1 자료가 사용되었다.