• 제목/요약/키워드: 특징 파라미터 추출

검색결과 225건 처리시간 0.035초

PCA와 HOG특징을 이용한 최적의 pRBFNNs 패턴분류기 기반 보행자 검출 시스템의 설계 (Design of Pedestrian Detection System Based on Optimized pRBFNNs Pattern Classifier Using HOG Features and PCA)

  • 임명호;박찬준;오성권;김진율
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2015년도 제46회 하계학술대회
    • /
    • pp.1345-1346
    • /
    • 2015
  • 본 논문에서는 보행자 및 배경 이미지로부터 HOG-PCA 특징을 추출하고 다항식 기반 RBFNNs(Radial Basis Function Neural Network) 패턴분류기과 최적화 알고리즘을 이용하여 보행자를 검출하는 시스템 설계를 제안한다. 입력 영상으로부터 보행자를 검출하기 위해 전처리 과정에서 HOG(Histogram of oriented gradient) 알고리즘을 통해 특징을 추출한다. 추출된 특징은 고차원이므로 패턴분류기 분류 시 많은 연산과 처리속도가 따른다. 이를 개선하고자 PCA (Principal Components Analysis)을 사용하여 저차원으로의 차원 축소한다. 본 논문에서 제안하는 분류기는 pRBFNNs 패턴분류기의 효율적인 학습을 위해 최적화 알고리즘인 PSO(Particle Swarm Optimization)을 사용하여 구조 및 파라미터를 최적화시켜 모델의 성능을 향상시킨다. 사용된 데이터로는 보행자 검출에 널리 사용되는 INRIA2005_person data set에서 보행자와 배경 영상을 각각 1200장을 학습 데이터, 검증 데이터로 구성하여 분류기를 설계하고 테스트 이미지를 설계된 최적의 분류기를 이용하여 보행자를 검출하고 검출률을 확인한다.

  • PDF

휴대형 단말기용 심전도 신호의 잡음 제거 및 해석 방법 (A Method for Denosing and Analyzing ECG Signals for a Portable Device)

  • 조신영;오세준;김상철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.1494-1497
    • /
    • 2010
  • 휴대형 심전도 단말기의 신호에서 잡음을 제거하고, 파형의 특징점을 찾아 임상파라미터를 추출하는 방법을 제안한다. 실험 결과, 본 방법으로 생성되는 심전도 형태와 임상 파라미터는 전문가의 소견으로 실제 사용상 만족할 만한 수준이었다. 우리의 조사에 의하면, 휴대형 단말기에서와 같이 잡음 수준이 높은 심전도 신호의 잡음 제거 및 해석에 대한 연구는 거의 발표된 적이 없다.

열악한 환경에 강인한 화자인증을 위한 위상 기반 특징 추출 기법 (A Phase-related Feature Extraction Method for Robust Speaker Verification)

  • 권철홍
    • 한국정보통신학회논문지
    • /
    • 제14권3호
    • /
    • pp.613-620
    • /
    • 2010
  • 화자인증 시스템은 훈련 환경과 인식 환경이 다른 경우 인식 성능이 크게 저하된다. 이러한 훈련과 인식 환경의 불일치는 다양한 잡음과 상이한 채널 환경 때문이다. 본 논문은 화자인증 시스템의 강인성 개선을 위하여 음성신호의 위상에 기반한 특정 추출 기법을 제안한다. 이 방법은 음성신호의 위상으로부터 순시 주파수를 계산하여 대역별로 순시 주파수를 모두 모아 구한 히스토그램으로부터 특징 계수를 추출한다. 이 특징 파라미터를 적용한 결과 조 용한 환경뿐만 아니라 잡음환경 그리고 채널 왜곡 환경에서도 화자인증 시스템의 성능이 개선됨을 알 수 있다.

Modified-MECC를 이용한 음성 특징 파라미터 추출 방법 (Method of Speech Feature Parameter Extraction Using Modified-MFCC)

  • 이상복;이철희;정성환;김종교
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 하계종합학술대회 논문집(4)
    • /
    • pp.269-272
    • /
    • 2001
  • In speech recognition technology, the utterance of every talker have special resonant frequency according to shape of talker's lip and to the motion of tongue. And utterances are different according to each talker. Accordingly, we need the superior moth-od of speech feature parameter extraction which reflect talker's characteristic well. This paper suggests the modified-MfCC combined existing MFCC with gammatone filter. We experimented with speech data from telephone and then we obtained results of enhanced speech recognition rate which is higher than that of the other methods.

  • PDF

신경망 학습 과정중 불필요한 입력 정보 및 파라미터들의 제거 (Elimination of Redundant Input Information and Parameters during Neural Network Training)

  • 원용관;박광규
    • 한국정보처리학회논문지
    • /
    • 제3권3호
    • /
    • pp.439-448
    • /
    • 1996
  • 형태 인식에서 유익한 특징정보의 선정 및 추출이 대단히 중요한 역할을 한다. 본 논문은 유익한 특징정보의 선정과 신경망의 학습을 동시에 수행할 수 있는 알고리 즘을 기술한다. 알고리즘은 근본적으로 반복적으로 수행되는 세 단계로 구성되어 있는데, 이들은 학습, 연결자 제거, 그리고 입력 신경세포 제거이다. 초기 학습을 실행한후, 먼저 적은 절대값을 갖는 연결자들이 제거 된다. 그런 후, 내부 계층 신경 세포들과 은 숫자의 결자들을 갖는 입력 신경세포들이 제거된다. 이 과정은 제거된 입력 신경세포들에 상응하는 특징정보들을 제외시키는 것과 동일하다. 만약, 에러값이 증가 하면, 연결자 제거 및 입력 신경세포 제거 과정의 반복으로 구성된 신경망의 재학습을 실행한다. 그 결과, 알고리즘은 다른 공간계로의 변환없이 특징정보 추출 공간내에서 중요한 특징들을 선정하게 된다. 또한, 즉징정보 선정인 형태 분류 관점에서의 성능과 긴밀하게 연결되어 수행되므로, 선정 된 특징정보들은 형태 분류에 가장 좋은 정보를 제공한다. 이 알고리즘은 불필요 또는 그다지 중요하지 않은 정보의 추출로 인한 경제 적 손실을 피할수 있게 한다. 더구나, 마지막에 얻어진 신경망은 인식 성능에 저해 요인이 될 수있는 불필요한 파라미터들, 즉 가중 연결자 및 바이어스를 포함하지 않는다. 응용결과,, 본 알고리즘은 가장 좋은 정보를 갖는 특징들만을 남기며, 성능 저하를 일으 키지 않으면서도 특징 벡터의 차원을 현저하게 줄였다.

  • PDF

경기장 모델을 이용한 가상 영상 삽입 시스템의 설계 및 구현 (Design and Implementation of a Virtual Image Insertion System with a Sports Field Model)

  • 유성;한송이;이성환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.391-393
    • /
    • 2001
  • 본 논문에서 제안하는 가상 영상 삽입 시스템은 카메라의 조작이나 시스템 운영자의 개입 없이 모든 처리 과정이 자동으로 진행된다. 이를 위해 시스템은 경기장 좌표계를 정의하고 삽입할 영상의 크기와 위치를 정하는 과정, 경기장의 특징점들을 추출하는 과정, 경기장 좌표계와 참조 영상의 특징점들로부터 투영 변환 파라미터를 추출하는 과정, 실제 동영상에서 삽입 위치를 찾고 추적하여 가상 영상을 삽입하는 과정을 거치게 된다. 본 논문에서 제안한 시스템의 성능을 검증하기 위해 방송용 NTSC 비디오 데이터를 대상으로 실험을 하였으며 그 결과 각 모듈들과 시스템이 효율적임을 입증하였다.

  • PDF

견고한 입술 영역 추출을 이용한 립리딩 시스템 설계 및 구현 (Design & Implementation of Lipreading System using Robust Lip Area Extraction)

  • 이은숙;이호근;이지근;김봉완;이상설;이용주;정성태
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 춘계학술발표대회논문집
    • /
    • pp.524-527
    • /
    • 2003
  • 최근 들어 립리딩은 멀티모달 인터페이스 기술의 응용분야에서 많은 관심을 모으고 있다. 동적 영상을 이용한 립리딩 시스템에서 해결해야 할 주된 문제점은 상황 변화에 독립적인 얼굴 영역과 입술 영역을 추출하는 것이다. 본 논문에서는 움직임이 있는 영상에서 화자의 얼굴영역과 입술영역을 컬러, 조명등의 변화에 독립적으로 추출하기 위해 HSI 모델과 블록 매칭을 이용하였고 특징 점 추출에는 이미지 기반 방법인 PCA 기법을 이용하였다. 추출된 입술 파라미터와 음성 데이터에 각각 HMM 기반 패턴 인식 방법을 개별적으로 적용하여 단어를 인식하였고 각각의 인식 결과를 가중치를 주어 합병하였다. 실험 결과에 의하면 잡음으로 음성 인식률이 낮아지는 경우에 음성인식과 립리딩을 함께 사용함으로써 전체적인 인식 결과를 향상시킬 수 있었다.

  • PDF

음성인식에서 특이 특징벡터의 제거에 대한 연구 (A Study on the Removal of Unusual Feature Vectors in Speech Recognition)

  • 이창영
    • 한국전자통신학회논문지
    • /
    • 제8권4호
    • /
    • pp.561-567
    • /
    • 2013
  • 음성 인식을 위해 추출되는 특징벡터 중 일부는 드물게 나타나는 특이 패턴이다. 이들은 음성인식 시스템의 훈련에서 파라미터의 과도맞춤을 일으키며, 그 결과 새로운 입력 패턴의 인식을 저해하는 구조적 위험을 초래한다. 본 논문에서는 이러한 특이 패턴을 제거하는 하나의 방법으로서, 어느 크기 이상의 벡터를 제외시켜 음성인식 시스템의 훈련을 수행하는 방법에 대해 연구한다. 본 연구의 목적은 인식률을 저해시키지 않는 한도에서 가장 많은 특이 특징벡터를 제외시키는 것이다. 이를 위하여 우리는 하나의 절단 파라미터를 도입하고, 그 값의 변화가 FVQ(Fuzzy Vector Quantization)/HMM(Hidden Markov Model)을 사용한 화자독립 음성 인식에 미치는 영향을 조사하였다. 실험 결과, 인식률을 저하시키지 않는 특이 특징벡터의 수가 3%~6% 정도임을 확인하였다.

오디오 부호화기를 위한 스펙트럼 변화 및 MFCC 기반 음성/음악 신호 분류 (Speech/Music Signal Classification Based on Spectrum Flux and MFCC For Audio Coder)

  • 이상길;이인성
    • 한국정보전자통신기술학회논문지
    • /
    • 제16권5호
    • /
    • pp.239-246
    • /
    • 2023
  • 본 논문에서는 오디오 부호화기를 위한 스펙트럼 변화 파라미터와 Mel Frequency Cepstral Coefficients(MFCC) 파라미터를 이용하여 음성과 음악 신호를 분류하는 개루프 방식의 알고리즘을 제안한다. 반응성을 높이기 위해 단구간 특징 파라미터로 MFCC를 사용하고 정확도를 높이기 위해 장구간 특징 파라미터로 스펙트럼 변화를 사용하였다. 전체적인 음성/음악 신호 분류 결정은 단구간 분류와 장구간 분류를 결합하여 이루어진다. 패턴인식을 위해 Gaussian Mixed Model(GMM)을 사용하였고, Expectation Maximization(EM) 알고리즘을 사용하여 최적의 GMM 파라미터를 추출하였다. 제안된 장단구간 결합 음성/음악 신호 분류 방법은 다양한 오디오 음원에서 평균적으로 1.5% 분류 오류율을 보였고 단구간 단독 분류 방법 보다 0.9%, 장구간 단독 분류 방법보다 0.6%의 분류 오류율의 성능 개선을 이룰 수 있었다. 제안된 장단구간 결합 음성/음악 신호 분류 방법은 USAC 오디오 분류 방법보다 타악기 음악 신호에서 9.1% 분류 오류율, 음성신호에서 5.8% 분류 오류율의 성능 개선을 이룰 수 있었다.

피싱 웹사이트 URL의 수준별 특징 모델링을 위한 컨볼루션 신경망과 게이트 순환신경망의 퓨전 신경망

  • 부석준;김혜정
    • 정보보호학회지
    • /
    • 제29권3호
    • /
    • pp.29-36
    • /
    • 2019
  • 폭발적으로 성장하는 소셜 미디어 서비스로 인해 개인간의 연결이 강화된 환경에서는 URL로써 전파되는 피싱 공격의 위험성이 크게 강조된다. 최근 텍스트 분류 및 모델링 분야에서 그 성능을 입증받은 딥러닝 알고리즘은 피싱 URL의 구문적, 의미적 특징을 각각 모델링하기에 적절하지만, 기존에 사용하는 규칙 기반 앙상블 방법으로는 문자와 단어로부터 추출되는 특징간의 비선형적인 관계를 효과적으로 융합하는데 한계가 있다. 본 논문에서는 피싱 URL의 구문적, 의미적 특징을 체계적으로 융합하기 위한 컨볼루션 신경망 기반의 퓨전 신경망을 제안하고 기계학습 방법 중 최고의 분류정확도 (0.9804)를 달성하였다. 학습 및 테스트 데이터셋으로 45,000건의 정상 URL과 15,000건의 피싱 URL을 수집하였고, 정량적 검증으로 10겹 교차검증과 ROC커브, 정성적 검증으로 오분류 케이스와 딥러닝 내부 파라미터를 시각화하여 분석하였다.