• 제목/요약/키워드: 성도 길이 정규화

검색결과 39건 처리시간 0.024초

VTN을 이용한 화자 정규화에 관한 연구 (A Study on Speaker Normalization using VTN)

  • 손창희;손종목;배건성
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.499-502
    • /
    • 2001
  • 본 연구에서는 화자에 따라 서로 다른 성도의 길이에 의해 발생하는 음성인식 시스템의 성능 저하를 줄이기 위하여, VTN(Vocal Tract Normalization)을 음성인식 시스템에 적용하고, 주소 인식 실험을 통하여 인식 성능을 평가하였다. 또, VTN을 CMN과 동시에 적용하여 인식 실험을 하였다. 실험에서는 화자간 성도길이의 차이를 반영하기 위하여 13개의 Warping 계수에 대해 필터 뱅크를 이용한 선형 Warping 방법을 적용하였다. 실험결과, Baseline 인식 시스템에 비하여 VTN을 적용하면, WER(Word Error Rate)이 1.24% 감소하였고, CMN과 VTN을 동시에 적용한 실험에서는 Baseline 인식 시스템과 비교하여 WER이 0.33% 감소 하였지만 VTN을 적용한 실험결과와 비교하면 오히려 0.91% 증가하였다.

  • PDF

벡터와 신경망 모델에서 데이터 퓨전 기법을 이용한 정보검색의 효율성 향상 (Improving the Effectiveness of Information Retrieval Using Data Fusion Method in the Vector and Neural Network Model)

  • 최성환
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2001년도 제8회 학술대회 논문집
    • /
    • pp.137-142
    • /
    • 2001
  • 본 논문에서는 벡터모델과 신경망 모델을 이용하여 데이터 퓨전의 관점에서 다중증거로서 가중치, 문헌분리가, 엔트로피, 공기유사도를 적절히 결합하여 질의를 확장하는 방법을 제안한다. 실험결과 코사인 정규화 가중치 알고리즘, 문서길이 정규화 가중치 알고리즘과 결합하여 질의를 확장하는 것이 정규화시키지 않고 단순히 문헌빈도와 역문헌빈도의 조합을 이용한 가중치 알고리즘과 결합했을 때 보다 평균 정확률 향상이 더 높게 나타났다. 또한 다양한 공기기반 유사도를 이용하여 질의확장을 한 결과 벡터모델과 신경망 모델에서 코사인 공기유사도에 기반하여 질의확장한 경우가 다른 공기유사도에 비해 더 좋은 성능을 보였다.

  • PDF

DHMM 음성 인식 시스템을 위한 양자화 기반의 화자 정규화 (Quantization Based Speaker Normalization for DHMM Speech Recognition System)

  • 신옥근
    • 한국음향학회지
    • /
    • 제22권4호
    • /
    • pp.299-307
    • /
    • 2003
  • 화자독립 음성인식기에서 화자사이의 성도 길이의 영향을 최소화시켜 인식 성능을 개선하는 화자 정규화에 대한 많은 연구가 있어 왔다. 본 연구에서는 벡터양자화기를 이용하여 화자 검증이 가능하다는 사실에 착안하여 벡터 양자화기를 이용한 비교적 간단한 선형 워핑 화자정규화방법을 제안한다. 제안하는 방법에서는 먼저 정규화에 이용될 최적의 코드북을 생성한 다음, 이 코드 북을 이용하여 화자의 선형 워핑계수를 추출하고 추출된 워핑계수는 멜 켑스트럼 추출시에 사용되는 멜스케일 필터뱅크를 워핑하기 위해 이용된다. 본고에서 제안한 워핑계수 추출 및 적용 방법의 성능을 확인하기 위해 이산 HMM을 이용한 13가지의 단음절 한글 숫자음 인식기를 이용하여 인식실험을 수행하였으며, 실험 결과 약 29%의 오인식률 감소를 보여 제안하는 화자 정규화방법이 다른 라인서치 워핑계수추출 방법보다 간단한 동시에 효용가치가 있음을 확인하였다.

영어 감정발화와 중립발화 간의 운율거리를 이용한 감정발화 분석 (An analysis of emotional English utterances using the prosodic distance between emotional and neutral utterances)

  • 이서배
    • 말소리와 음성과학
    • /
    • 제12권3호
    • /
    • pp.25-32
    • /
    • 2020
  • 본 연구는 영어 발화에 나타난 7가지 감정들(calm, happy, sad, angry, fearful, disgust, surprised)을 분석하고자 감정발화(672개)와 감정중립 발화(48개)와의 운율적 거리를 측정하였다. 이를 위해 외국어 발음평가에 사용되었던 방법을 적용하여 음의 높낮이(Hz), 음의 강도(dB), 음의 길이(sec)와 같은 운율의 3요소를 유클리디언 거리로 계산하였는데 기존연구에서 더 나아가 유클리디언 거리계산 정규화 방법, z-score 방법 그리고 z-score 정규화 방법을 추가해 총 4가지 그룹(sqrF0, sqrINT, sqrDUR; norsqrF0, norsqrINT, norsqrDUR; sqrzF0, sqrzINT, sqrzDUR; norsqrzF0, norsqrzINT, norsqrzDUR)의 방법을 분석에 사용하였다. 그 결과 인지적 측면과 음향적 측면의 분석 모두에서 유클리디언 운율거리를 정규화한 norsqrF0, norsqrINT, norsqrDUR이 일관성 있게 가장 효과적인 측정방법으로 나타났다. 유클리디언 거리계산 정규화 방법으로 감정발화와 감정중립 발화를 비교했을 때, 전반적으로 감정에 따른 운율의 변화는 음의 높낮이(Hz)가 가장 크고 그다음 음의 길이(sec), 그리고 음의 강도(dB)가 가장 작게 나타났다. Tukey 사후검증 결과 norsqrF0의 경우 calm

엄지손가락 영상을 이용한 비접촉식 바이오인식 (Contactless Biometric Using Thumb Image)

  • 임나은;한재현;이의철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권12호
    • /
    • pp.671-676
    • /
    • 2016
  • 최근 금융과 기술이 결합된 핀테크 기술이 각광받고 있고 모바일 기기에서 바이오 정보를 이용한 간편 결제를 이용하는 사람들이 늘어나고 있다. 본 논문에서는 기존의 지문, 홍채, 정맥 인식과 같은 생체인식 시스템과 달리 별도의 센서 추가 없이 스마트폰의 후면 카메라로 촬영된 엄지손가락 후면 영상을 이용한 새로운 비접촉식 바이오인식 방법을 제안한다. 제안하는 방법에서는 엄지손가락의 길이, 너비, 주름 정보를 특징으로 사용한다. 이를 위해 가이드라인에 맞춘 엄지손가락 영상을 촬영하고, 조명 정규화, 피부색 영역 검출, 크기 정규화 및 정렬 과정을 거친 후 상관계수 계산을 통해 유사도를 측정한다. 인식 정확도 측정을 위해 동일인 매칭 및 타인 매칭을 진행하였으며, 오거부율이 1.55%일 때, 1.68%의 오수락율의 결과를 얻었다. 타인 매칭 결과에 대한 분포가 정규분포에 가깝게 나타나 보안성 측면에서 더욱 중요한 오수락율이 적다는 장점을 가진다. 오거부율이 15% 수준일 때 오수락율을 0%까지 낮출 수 있어 보안성을 우선시 하는 금융시장에서 본인 확인 목적의 바이오인식 방법으로 활용될 수 있을 것으로 판단된다.

대규모 외생 변수 및 Deep Neural Network 기반 금융 시장 예측 및 성능 향상 (Financial Market Prediction and Improving the Performance Based on Large-scale Exogenous Variables and Deep Neural Networks)

  • 천성길;이주홍;최범기;송재원
    • 스마트미디어저널
    • /
    • 제9권4호
    • /
    • pp.26-35
    • /
    • 2020
  • 미래의 주가를 예측하기 위한 시도는 과거부터 꾸준히 연구되어왔다. 그러나 일반적인 시계열 데이터와 달리 금융 시계열 비정상성(non-stationarity)과 장기 의존성(long-term dependency), 비선형성(non-linearity) 등 예측을 하는 것에 있어서 여러 가지 방해 요인이 존재한다. 또한, 광범위한 데이터의 변수는 기존에 사람이 직접 선택하는 것에 한계가 있으며 모델이 변수를 자동으로 잘 추출할 수 있도록 하여야 한다. 본 논문에서는 비정상성 데이터를 정규화할 수 있는 슬라이딩 타임스텝 정규화(sliding time step normalization) 방법과 LSTM 형태의 오토인코더(AutoEncoder)를 사용하여 모든 변수로부터 압축된 변수로 미래 주가를 예측하는 방법, 기간을 나누어 전이 학습을 하는 이동 전이 학습(moving transfer learning)을 제안한다. 또한, 실험을 통하여 100개의 주요 금융 변수들만을 사용하는 것보다 뉴럴 네트워크를 통해서 가능한 많은 변수를 사용하였을 때 성능이 우수함을 보이며, 슬라이딩 타임스텝 정규화 방법을 사용하여 모든 구간에서 데이터의 비정상성에 대해 정규화를 수행함으로써 성능 향상에 효과적임을 보인다. 이동 전이 학습 방법은 스텝 별 테스트 구간에서 모델의 성능을 평가하고 전이학습을 함으로써 긴 테스트 구간에서 성능 향상에 효과적임을 보인다.

로켓 노즐 공력하중 특성에 대한 고속 풍동시험 (High Speed Wind Tunnel Test on the Aerodynamic Load Characteristics of Rocket Nozzle)

  • 라승호;옥호남;김인선;최성욱
    • 한국항공우주학회지
    • /
    • 제32권9호
    • /
    • pp.35-40
    • /
    • 2004
  • 본 연구에서는 최적화된 스커트 형상을 설계하기 위한 기초 자료를 얻기 위하여 스커트 의 확산각 및 길이 변화에 따른 노즐의 공력하중 특성을 고속 풍동시험을 통하여 조사하였다. 적절한 스커트를 사용하면 없을 때에 비해 김발의 구동력을 1/10 수준까지도 줄일 수 있었으며 시험 결과는 추후 스커트 형상 설계 데이터베이스로 활용하기 위해 정규화 하였다.

BENT함수와 bent 수열을 중심으로 본 상관성이 우수한 수열군

  • 정하봉
    • 정보보호학회지
    • /
    • 제2권3호
    • /
    • pp.41-49
    • /
    • 1992
  • 레이다 시스템, ranging 시스템, 확산 대역 통신 (spread spectrum communication) 시스템, 그리고 요즈음 각광받고 있는 코드분할방식 다중통신 (CDMA com-munication) 시스템에서는 주지하다시피 상관성(correlation) 이 좋은 수열(sequence)들위 사용이 필수 불가결하다. 수열의 상관성은 그 수열 자신의 상관성이냐 다른 수열간의 상관성이냐에 따라 자기상관관계(crosscorrelation)로 나누어 생각할 수 있고 수열의 주기성의 유무에 따라 주기적 상관관계(Periodic correlation)와 비주기적 상관관계(aperiodic correla-tion)로 나누어 볼 수 있다. 여기서 수열의 상관성이 좋다는 말은 정규화된 수열의 자기상관계수(autocorrelation coefficient)와 수열 간의 교차상관 계수(crosscorrelation coefficient)의 최대 크기가 수열의 길이에 비해 상대적으로 작은 값을 갖는다는 것을 의미한다. 본 논문에서는 주기성을 갖는 이진수열군의 하나인 bent수열과 이 bent수열을 구성하는데 기본이 되는 bent함수를 중심으로 주기적 상관성이 우수한 여러 수열군에 대해 알아보고자 한다.

  • PDF

윤곽선 변동율을 이용한 물체의 2차원 형태 기술 (Two-Dimensional Shape Description of Objects using The Contour Fluctuation Ratio)

  • 김민기
    • 한국멀티미디어학회논문지
    • /
    • 제5권2호
    • /
    • pp.158-166
    • /
    • 2002
  • 본 논문에서는 윤곽선 세그먼트의 양 끝점을 잇는 직선과 곡선의 길이의 비율로 윤곽선 변동율을 정의하고, 이로부터 윤곽선의 형태를 기술하는 방법을 제안하였다. 윤곽선 변동율은 윤곽선 세그먼트로부터 계산되기 때문에 회전이나 크기 변형에 불변하는 윤곽선 세그먼트를 추출해야 한다. 이를 위하여 전체 윤곽선의 길이에 비례하는 상대적인 길이로 윤곽선을 분할하고 윤곽선 상의 모든 점을 분할점으로 하는 중첩된 윤곽선 세그먼트를 이용하였다. 윤곽선 변동율은 윤곽선 세그먼트의 단위 길이에 따라 국소적 또는 전역적인 특징을 나타내므로, 윤곽선 변동율의 분포를 나타내는 특징 벡터로 물체의 형태를 기술하고, 단위 길이별로 특징 벡터를 비교하여 윤곽선 형태의 유사도를 계산한다. 제안된 방법을 구현하여 15종의 물고기 영상에 대하여 회전 및 크기 변형을 가한 총 165개의 영상에 대하여 실험한 결과, 회전 및 크기 변형에 대한 불변성은 물론 정규화된 체인코드 히스토그램(NCCH)과 링 프로젝션(TRP)을 이용한 방법에 비하여 군집화 능력이 우수함을 확인할 수 있었다.

  • PDF

새로운 시간축 정규화 방법을 이용한 한국어 고립단어 인식기 (Korean isolated word recognizer using new time alignment method of speech signal)

  • 남명우;박규홍;노승용
    • 대한전자공학회논문지SP
    • /
    • 제38권5호
    • /
    • pp.567-575
    • /
    • 2001
  • 본 논문에서는 음성신호의 발성길이와 상관없이 일정한 크기의 파라미터를 얻을 수 있는 새로운 방법을 제안하였다. 음성인식기의 성능은 음성신호에서 추출된 파라미터간의 유사도(패턴간의 거리)를 어떻게 비교하는지에 따라 결정된다. 그러나 화자에 따른 음성신호의 변이나 발성속도의 차이는 음성신호에서 일정한 크기의 파라미터 추출을 어렵게 한다. 제안한 방법은 음성신호에서 얻어진 파라미터를 스펙토그램의 형태로 표현한 뒤 2차원 DCT(Discrete Cosine Transform)를 이용해 일정한 크기의 파라미터로 정규화시키는 방법이다. 제안한 방법의 유효성을 입증하기 위해 청각세포를 모델링한 32개의 대역통과 필터로부터 얻어진 음성신호의 파라미터를 2차원 DCT 방법으로 가공한 후, 신경 회로망의 입력으로 사용하였다. 또한 기존 방법과의 인식률 비교를 위해 기존의 정규화된 입력을 구하는 방법 중 하나를 선택하여 비교 실험을 수행하였다. 실험결과 제안한 방법은 기존 방법에 비해 화자종속 및 화자독립 고립단어 인식에서 더 높은 인식률과 빠른 인식속도를 얻을 수 있었다.

  • PDF