• 제목/요약/키워드: 스펙트럼 특징

검색결과 352건 처리시간 0.023초

DMS 모델과 이중 스펙트럼 특징을 이용한 HMM에 의한 음성 인식 (HMM-based Speech Recognition using DMS Model and Double Spectral Feature)

  • 안태옥
    • 한국산학기술학회논문지
    • /
    • 제7권4호
    • /
    • pp.649-655
    • /
    • 2006
  • 본 논문은 화자 독립의 음성인식을 위한 연구로써, DMS 모델에 의한 DMSVQ(Dynamic Multi-Section Vector Quantization) 코드북과 이중 스펙트럼 특징을 이용한 HMM(Hidden Markov Model) 음성인식 방법을 제안한다. 정적 스펙트럼 특징으로서는 LPC ?S스트럼 계수를 이용하였고, 동적 스펙트럼 특징으로는 LPC ?S스트럼의 회귀계수를 사용하였다. 이들 두개의 스펙트럼 특징들을 각각 VQ 코드북으로 양자화되고, DMS 모델을 이용한 HMM은 입력으로써 정적 스펙트럼 특징과 동적 스펙트럼 특징을 받아드림으로써 모델링된다. 제안된 방법에 의한 인식 실험은 기존의 다양한 인식 방법에 의한 인식 실험들과 비교를 위해 동일한 데이터와 조건 하에서 수행하였다. 실험 결과, 본 연구에서 제안한 방법이 기존의 방법들보다 우수한 방법임을 입증하였다.

  • PDF

지각적 표현에 기초한 비음 인식에 관한 연구 (Nasal Consonants Recognition Based on the Perceptual Representation)

  • 김기철;조정완
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
    • /
    • pp.120-125
    • /
    • 1989
  • 음성 신호에는 언어정보이외에 여러 요인에 의한 정보가 포함되어 있어서, 문자와 일대일로 대응되는 분절을 정확하게 검출하기가 어렵다. 본 연구에서는 선형 예측계수 (LPC) 스펙트럼의 첨두 부분을 강조한 이진 (binary) 스펙트럼을 제안하고, 이를 바탕으로 음의 안정영역과 천이영역을 통합하여 음향특징을 추출하고자 한다. 각 영역의 특징은 이진 스펙트럼을 누적하여 구하며, 통합적인 특징은 각 영역의 특징을 결합한 관계적 특징으로 나타낸다. 제 2 차 포르만트 주파수의 궤적을 관계적 특징으로 하여, 양순 비음과 치조 비음을 구별한 결과, 모음의 문맥과 화자에 비교적 독립적인 인식결과를 얻을 수 있었다. 또한 이진 스펙트럼이 원래의 스펙트럼에 포함된 정보를 유지하는지 검토하기 위해, 같은 거리척도 (distance measure) 에 의해 인식 실험한 결과 이진 스펙트럼의 성능이 오히려 우수하게 나타났으며, 관계적 이진 스펙트럼의 경우 화자에 따른 변화가 더욱 적었다. 음성에 백색 잡음 (Gaussian white noise)을 더하여 잡음음성 (noisy speech) 을 만든 뒤, 같은 방법으로 실험한 결과도 유사한 인식결과를 얻을 수 있어 제안된 이진 스펙트럼의 유효성을 확인하였다.

  • PDF

스펙트럼 대비 MFCC 특징의 음악 장르 분류 성능 분석 (Study on the Performance of Spectral Contrast MFCC for Musical Genre Classification)

  • 서진수
    • 한국음향학회지
    • /
    • 제29권4호
    • /
    • pp.265-269
    • /
    • 2010
  • 본 논문에서는 새로운 형태의 스펙트럼 특징인 스펙트럼 대비 MFCC (SCMFCC)를 제안하고 음악 장르 분류 성능을 분석하였다. 음악 장르 분류를 위해서는 장르 간의 차이를 두드러지게 할 수 있는 특징을 사용해야 하므로, 음악의 화음 구조 및 강약을 잘 표현하는 스펙트럼 대비 특징들이 관심을 받아왔다. 본 논문에서 제안된 SCMFCC는 멜 켑스트럼 상에서 스펙트럼의 대비를 이용하여 기존의 MFCC를 음악 분류에 적합하도록 변형했다. 널리 사용되고 있는 음악 장르 데이터베이스에서 실험을 수행하여, 제안된 SCMFCC 특징의 음악 장르 분류 성능을 기존의 다른 특징들과 비교하였다.

LPC 켑스트럼 및 FFT 스펙트럼에 의한 성별 인식 알고리즘

  • 최재승;정병구
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2012년도 추계학술대회
    • /
    • pp.63-65
    • /
    • 2012
  • 본 논문에서는 입력된 음성이 남성화자인지 여성화자인지를 구분하는 FFT 스펙트럼 및 LPC 켑스트럼 입력에 의한 성별인식 알고리즘을 제안한다. 본 논문에서는 특히 남성화자와 여성화자의 특징벡터를 비교 분석하여, 이러한 남녀의 음향학적인 특징벡터의 차이점을 이용하여 신경회로망에 의한 성별 인식에 대한 실험을 수행한다. 특히 12차의 LPC 켑스트럼 및 8차의 저역 FFT 스펙트럼의 특징벡터를 사용한 경우에, 남성화자 및 여성화자에 대해서 양호한 남녀 성별인식률이 구해졌다.

  • PDF

음향학적 모델에 의한 스펙트럼 필터 알고리즘 (Spectrum Filter Algorithm based on Acoustic Model)

  • 최재승
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 추계학술대회
    • /
    • pp.770-772
    • /
    • 2016
  • 본 논문에서는 음성신호처리 시스템에 유용하게 사용되는 음성신호의 특징 파라미터를 출력하는 스펙트럼 필터모델을 사용하여, 배경잡음 환경 하에서 음성신호 중의 잡음을 제거하는 알고리즘을 제안한다. 따라서 본 논문에서는 배경잡음을 제거할 때 고려해야 할 인간의 청각특성이 포함된 음성의 진폭 스펙트럼에 의한 청각필터의 특성을 도입한다. 본 논문의 실험에서 사용한 성능평가의 방법으로는 음절 명료도의 테스트에 적합한 주관적인 평가인 주파수 영역에서의 스펙트럼 왜곡률(Spectral Distortion, SD)을 사용하여 실험결과를 비교하고 고찰한다.

  • PDF

부밴드 스펙트럼의 무게중심을 이용한 강인한 오디오 인식기 (Robust Audio Identification Using Spectro-Temporal Subband Centroids)

  • 서진수;이승재
    • 한국음향학회지
    • /
    • 제27권5호
    • /
    • pp.239-243
    • /
    • 2008
  • 본 논문에서는 스펙트럼의 주파수 및 시간 방향의 특성을 결합한 오디오 인식 방법을 제안하였다. 특히 스펙트럼의 형태를 모사하기 위해 부밴드로 나누고 주파수와 시간 방향의 무게중심을 구하고 정규화하여 인식기에 사용하였다. 무게중심 값은 스펙트럼의 형태적 특징을 잘 나타내면서도 간결하여 인식기에 사용되는 특징 DB의 크기를 줄여줄 수 있는 장점이 있다. 수 천곡 규모의 오디오에 대해서, 부밴드 스펙트럼의 주파수와 시간 방향 무게중심의 인식 성능을 비교하였다. 실험 결과 주파수와 시간 방향 특징을 결합하면 상보적으로 인식 성능을 높일 수 있음을 발견하고, 선형 변환을 이용하여 주파수와 시간 방향 특징을 하나로 결합하는 방법을 제안하였다.

로그 전력 스펙트럼을 이용한 초음파 영상에서의 장기인식 (Organ Recognition in Ultrasound images Using Log Power Spectrum)

  • 박수진;손재곤;김남철
    • 한국통신학회논문지
    • /
    • 제28권9C호
    • /
    • pp.876-883
    • /
    • 2003
  • 본 논문에서는 초음파 영상에서 로그 전력 스펙트럼(log power spectrum)을 이용한 장기 인식 알고리듬을 제시한다. 제안한 알고리듬은 크게 특징추출과 특징분류의 두 단계로 구성된다. 특징추출에서는 이동불변의 성질을 가지는 로그 전력 스펙트럼을 이용하여 전처리를 수행한 입력 영상으로부터 장기 조직의 반향(echo of the tissue) 성분을 추출한다. 특징 분류에서는 마하라노비스(Mahalanobis) 거리를 사용하여 입력영상으로부터 추출한 특징벡터와 각 영상 부류의 평균벡터 사이의 유사도를 측정한다. 실제 초음파 영상에 대한 실험결과는 제안된 알고리듬이 전력 스펙트럼(power spectrum)과 유클리드(Euclid) 거리를 이용한 인식 알고리듬보다 최대 30% 향상된 인식률을, 또 가중 큐프런시(weighted quefrency) 복소 켑스트럼(complex cepstrum)을 이용한 알고리듬보다 10∼40% 향상된 인식률을 보여준다.

마이크로 라만 스펙트럼에서 퇴행성 뇌신경질환 분류를 위한 특징 추출 방법 연구 (A Method of Feature Extraction on Micro-Raman Spectra for Classification of Neuro-degenerative Disorders)

  • 박아론;백성준
    • 전자공학회논문지SC
    • /
    • 제48권2호
    • /
    • pp.80-85
    • /
    • 2011
  • 알츠하이머병(AD: Alzheimer's disease)과 파킨슨병(PD: Parkinson's disease)은 가장 흔한 퇴행성 뇌신경질환이다. 본 연구에서는 라만 스펙트럼을 이용하여 AD와 PD를 분류하기 위해 특징 추출하는 방법을 제안하였다. 혈소판으로부터 측정한 라만 스펙트럼에 먼저 smoothing을 적용한 다음 기준선의 왜곡을 제거하고 스펙트럼의 기준 피크를 중심으로 그 위치를 정렬하는 순서로 이루어진 전처리 과정을 적용하였다. 전처리 과정을 수행한 스펙트럼에서 AD와 PD를 구별할 수 있는 특징을 조사하였고 그 결과 743과 $757cm^{-1}$ 영역의 피크 비와 1248과 $1448cm^{-1}$ 영역의 피크 크기가 가장 변별력 있는 특징임을 확인하였다. 실험 결과에 따르면, 총 216개의 라만 스펙트럼에 대한 MAP(maximum a posteriori probability) 분류 실험에서 이 세 개의 특징만으로도 약 95.8%의 분류율을 보였다.

형광 X-선 스펙트럼의 잡음 특징 분석 (Noise Characteristic Analysis of X-Ray Fluorescence Spectrum)

  • 이재환;천선일;양상훈;박동선
    • 한국산학기술학회논문지
    • /
    • 제13권5호
    • /
    • pp.2298-2304
    • /
    • 2012
  • 형광 X-선 스펙트럼을 분석 방법은 RoHS 성분 및 중금속 함량 분석 등 여러 분야에 응용이 가능하며 비교적 빠른 시간 안에 함량 분석 결과를 얻을 수 있다. 형광 X-선 스펙트럼에는 잡음 및 여러 요인이 포함되어 있어 분석 정확도를 떨어뜨린다. 본 논문에서는 여러 요인 중 잡음의 특징을 분석하여 형광 X-선 스펙트럼 분석의 정확도를 높이고자 한다. 형광 X-선 스펙트럼은 산탄잡음(푸아송 잡음)의 특징을 가지고 있으며, 따라서 작은 신호에서는 잡음의 크기가 상대적으로 크고, 큰 신호에서는 잡음의 크기가 상대적으로 작은 특징을 가지고 있다. 기존에 잡음을 분석하고 제거하는 방법 및 알고리즘은 이러한 특징을 반영하지 않은 일반적인 목적으로 사용되는 방법으로 일반적인 알고리즘을 사용하여 잡음을 제거하게 되면 왜곡된 결과를 얻게 된다. 정확한 잡음 분석을 기반으로 효율적인 잡음 제거 알고리즘을 설계할 수 있고, 또한 높은 정확도의 원소 함량 분석 결과를 기대할 수 있다.

DHMM을 이용한 한국어 음성 인식 (Korean Speech Recognition using DHMM)

  • 안태옥;이강성;유형근;이형준;조형제;변용규;김순협
    • 한국음향학회지
    • /
    • 제10권1호
    • /
    • pp.52-60
    • /
    • 1991
  • 본 연구는 스펙트럼의 동적 특징을 한 파라메타로 하는 DHMM(Dynamic Hidden Markov Model)을 이용한 단독어인식에 관한 것으로 정적 스펙트럼 특징뿐 아니라 동적 스펙트럼 특징을 평가할 수 있는 DHMM에 근거한 음성 인식 실험을 논의 한다. 정적특징으로는 LPC cepstrum 계수를 이용하였고, 동적특징으로는 LPC cepstrum 의 회귀계수를 사용하였다. 이들 두 개의 특징 벡터들을 각각 집단화하여 만든 두 VQ codebook과 입력으로 받아들인 정적 벡터및 동적벡터로 단어들을 DHMM(Dynamic Hidden Markov Model)으로 모델링 하였다. 전체적인 실험에서 기존의 HMM을 이용한 인식실험에서는 88.8%의 인식율을 얻었는데 반해, DHMM을 이용한 인식실험에서는 92.7%의 인식율을 보였다.

  • PDF