• 제목/요약/키워드: LPC 분석

검색결과 88건 처리시간 0.025초

TMS320C32 DSP를 이용한 실시간 화자종속 음성인식 하드웨어 모듈(VR32) 구현 (Real-Time Implementation of Speaker Dependent Speech Recognition Hardware Module Using the TMS320C32 DSP : VR32)

  • 정익주;정훈
    • 한국음향학회지
    • /
    • 제17권4호
    • /
    • pp.14-22
    • /
    • 1998
  • 본 연구에서는 Texas Instruments 사의 저가형 부동소수점 디지털 신호 처리기 (Digital Singnal Processor, DSP)인 TMS320C32를 이용하여 실시간 화자종속 음성인식 하 드웨어 모듈(VR32)을 개발하였다. 하드웨어 모듈의 구성은 40MHz의 TMS320C32 DSP, 14bit 코덱인 TLC32044(또는 8bit μ-law PCM 코덱), EPROM과 SRAM 등의 메모리와 호 스트 인터페이스를 위한 로직 회로로 이루어졌다. 뿐만 아니라 이 하드웨어 모듈을 PC사에 서 평가해보기 위한 PC 인터페이스용 보드 및 소프트웨어도 개발하였다. 음성인식 알고리 즘의 구성은 에너지와 ZCR을 기반으로 한 끝점검출(Endpoint Detection) 침 10차 가중 LPC 켑스터럼(Weighted LPC Cepstrum) 분석이 실시간으로 이루어지며 이후 Dynamic Time Warping(DTW)를 통하여 최고 유사 단어를 결정하고 다시 검증과정을 거쳐 최종 인식을 수행한다. 끝점검출의 경우 적응 문턱값(Adaptive threshold)을 이용하여 잡음에 강인한 끝 점검출이 가능하며 DTW 알고리즘의 경우 C 및 어셈블리를 이용한 최적화를 통하여 계산 속도를 대폭 개선하였다. 현재 인식률은 일반 사무실 환경에서 통상 단축다이얼 용도로 사 용할 수 있는 30 단어에 대하여 95% 이상으로 매우 높은 편이며, 특히 배경음악이나 자동 차 소음과 같은 잡음환경에서도 잘 동작한다.

  • PDF

에너지 연산자에 기초한 간단한 피치 추적 방법 (A Simple Pitch Tracking Algorithm based on the Energy Operator)

  • Tai-Ho Lee
    • 융합신호처리학회논문지
    • /
    • 제5권1호
    • /
    • pp.1-5
    • /
    • 2004
  • 유성음의 피치주파수 궤적을 추정할 수 있는 새로운 방법을 제시하였다. 이 방법은 에너지연산자[1]를 두 번 적용하는데 기초하고 있다. Kaiser의 에너지연산자는 정현파의 진폭과 주파수 정보를 추출하는 기능을 가지고 있다. 변조모형에 의하면 유성음은 피치 신호로 변조된 포만트들의 합성으로 파악될 수 있으므로 이 파형의 진폭 포락선을 추출해서 피치 신호와 유사한 파형을 얻는다. 이 파형의 평균 주파수를 검출하여 피치 주파수를 구하는 것이다. 앞부분은 Gopalan의 접근법[9]과 마찬가지이나, 뒷부분의 LPC-스펙트럼 분석등의 과정 대신 또 한번 에너지 연산자를 적용하도록 하여 매우 단순화되고 온라인 적용이 가능한 알고리듬을 얻었다. 추정 결과는 거친 편이지만 온라인으로 피치 궤적의 일반적 스케치를 얻는데 유용할 것으로 기대된다.

  • PDF

자극과 맥락의 정서성이 기억 부호화에 미치는 영향: ERP 연구 (The Effect of Emotional Content and Context on Memory Encoding: ERP Studies)

  • 박선희;박태진
    • 인지과학
    • /
    • 제21권2호
    • /
    • pp.387-408
    • /
    • 2010
  • 이 연구는 자극의 정서성에 따른 부호화 기전의 차이와 맥락의 정서성이 중립 단어의 부호화 기전에 미치는 영향을 알아보기 위해 수행되었으며, 특히 정서자극의 우수한 기억 수행이 주의자원 배분에 기인한 것인지 밝히는 것을 목적으로 하였다. 이 연구는 연구 목적을 달성하기 위해 정서자극과 비정서적 단어를 연속으로 제시하여 자극과 맥락의 정서성이 기억 수행과 ERP 평균 진폭에 미치는 영향을 분석하였다. 정서자극으로는 IAPS(International Affective Picture System) 자극을 사용하였으며, 긍정, 중립, 부정자극을 제시하였다. 행동 분석결과, 정서자극이 중립자극보다 우수한 기억 수행을 보인 반면, 정서맥락 내 단어는 중립맥락 내 단어에 비해 저조한 기억 수행을 보였다. 또한 ERP의 LPC(Late Positive Complex) 진폭분석 결과, 정서자극이 중립자극에 비해 높은 진폭을 보인 반면, 정서맥락 내 단어는 중립맥락 내 단어에 비해 낮은 진폭을 나타냈다. 이 결과는 정서자극에 대한 주의 선점이 정서맥락 내 단어의 기억 수행을 방해한다는 자원할당 모형의 설명에 부합하는 것으로서, 정서자극에 대한 주의자원 배분 설명을 지지하는 것이다.

  • PDF

Walsh변환을 이용한 한국어 숫자음 음성분석에 관한 연구 (A Study on Korean Speech Analysis using Walsh Transform)

  • 김계현;김준현
    • 대한전기학회논문지
    • /
    • 제37권4호
    • /
    • pp.251-256
    • /
    • 1988
  • This work describes a speech analysis of Korean number ('1'-'10') which are spoken by several speakers using Fast Walsh Transform(FWHT) method. FWHT includes only addition and subtraction operations, therefore faster and needs less memory than FFT(Fast Fourier Transfifrm) or LPC(Linear Predictive Coding) analysis method. We have investigated that FWHT method can find speaker independent feature(which represents same cue about some word independent of different speakers) The results of this experiment, the 70% of same words(korean number '2')which spoken by several speakers have had slmilar patterns.

  • PDF

발성 속도에 따른 가변전송률 CELP 부호화기 설계에 관한 연구 (A Study on a Design of the Variable Bit-Rate Vocoder by Measuring of the Speaking Rate)

  • 나덕수;배명진
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 하계종합학술대회 논문집(4)
    • /
    • pp.273-276
    • /
    • 2001
  • CELP 부호화기는 선형 예측 합성에 의한 분석 부호화의 원칙에 기본을 두고 있다. 그리고 음성 신호의 스펙트럼을 LPC 분석을 통해 부호화하는데 고정 윈도우를 사용하여 부호화한다. 그러나 음성신호는 화자의 발성속도에 따라 파형의 변화가 시간적으로 빠르게 변화하기도 하고, 반대로 유사한 파형이 일정시간 유지되기도 한다. 따라서 윈도우의 크기를 발성속도에 맞추어 분석한다면 보다 효율적인 부호화를 할 수 있다. 본 논문에서는 발성속도에 따라 전송률을 달리 적용하는 방법을 제안한다. 발성속도의 측정은 스펙트럼 변화도를 이용하여 측정하였고, 발성속도가 빠를 때는 프레임 크기를 줄여 시간적으로 빠르게 변화하는 신호에 적응적으로 분석하고 대신 파라미터 표현에 비트를 줄인다. 반대로 발성속도가 느릴 때는 프레임 크기를 키우고 파라미터 표현에 비트를 더 할당한다. 제안한 방법을 실험하기 위해 G.723.1 5.3kbps ACELP 부호화기를 이용하였다 음질의 열하 없이 평균 16.34% 전송률 감소효과를 얻을 수 있었다.

  • PDF

AMR 기반 저 전력 인공 대역 확장 기술 개발 (Developing a Low Power BWE Technique Based on the AMR Coder)

  • 구본강;박희완;주연재;강상원
    • 한국음향학회지
    • /
    • 제30권4호
    • /
    • pp.190-196
    • /
    • 2011
  • 대역폭 확장 (Bandwidth Extension)은 300-3400 Hz 대역의 협대역 음성 신호를 50-7000 Hz 대역의 광대역 음성신호로 확장하여 협대역 음성신호의 음질과 명료도를 높이는 기술이다. 본 논문에서는 협대역 음성 정보만을 이용해서 광대역 음성신호를 추정하는 인공 대역폭 확장 기술을 설계하여, ITU-T 협대역 표준 음성 코덱인 AMR (adaptive multi-rate) 복호화기에 내장시킴 (embedded)으로써, 대역폭 확장 모듈에서의 LPC 분석 및 LSP 해석과 관련된 계산량을 감소시켰고, 알고리즘 지연도 줄였다. 그리고 SDS (single distance search) 고속 탐색 방식을 대역폭 확장 시스템의 코드북 매핑에 적용하여, 최종적으로 저 전력 대역 확장 AMR 복호화기를 설계하였다. 제안된 대역폭 확장 방법은 AMR 복호화기 후단에 독립적으로 설치되는 기존 DTE (decode then extend)방식에 비해 28 % 정도의 계산량을 줄이고 알고리즘 지연도 20 msec 줄였다. 또한 제안방식은 피치정보를 이용한 classified 코드북 매핑 방식을 사용하여 스펙트럼 포락선을 확장하였고, 코드 벡터 탐색 시 가중치를 적용하여 광대역 합성 음성의 성능을 향상시켰다.

베이즈 분류기를 이용한 수중 배경소음하의 과도신호 분류 (Classification of Transient Signals in Ocean Background Noise Using Bayesian Classifier)

  • 김주호;복태훈;팽동국;배진호;이종현;김성일
    • 한국해양공학회지
    • /
    • 제26권4호
    • /
    • pp.57-63
    • /
    • 2012
  • In this paper, a Bayesian classifier based on PCA (principle component analysis) is proposed to classify underwater transient signals using $16^{th}$ order LPC (linear predictive coding) coefficients as feature vector. The proposed classifier is composed of two steps. The mechanical signals were separated from biological signals in the first step, and then each type of the mechanical signal was recognized in the second step. Three biological transient signals and two mechanical signals were used to conduct experiments. The classification ratios for the feature vectors of biological signals and mechanical signals were 94.75% and 97.23%, respectively, when all 16 order LPC vector were used. In order to determine the effect of underwater noise on the classification performance, underwater ambient noise was added to the test signals and the classification ratio according to SNR (signal-to-noise ratio) was compared by changing dimension of feature vector using PCA. The classification ratios of the biological and mechanical signals under ocean ambient noise at 10dB SNR, were 0.51% and 100% respectively. However, the ratios were changed to 53.07% and 83.14% when the dimension of feature vector was converted to three by applying PCA. For correct, classification, it is required SNR over 10 dB for three dimension feature vector and over 30dB SNR for seven dimension feature vector under ocean ambient noise environment.

Task 수행성향에 따른 제품 인터렉션 디자인의 사용행태 비교 문화적 연구 - 피들러의 상황 리더쉽 이론을 중심으로 - (Comparative cultural research Interaction usage by following task based on Fiedler s contingency theory of leadership)

  • 서미영;김정하
    • 한국HCI학회논문지
    • /
    • 제6권1호
    • /
    • pp.17-20
    • /
    • 2011
  • Fred.E Fiedler는 상황 리더쉽 이론에서 사회 문화적 특성에 따른 Work-style을 근거하여 문화집단을 과업지향적인(Task-oriented) 집단과 관계지향적인 (Relationship-oriented)집단으로 나눈다. 본 연구는 제품사용에 있어 Task를 수행하는 성향의 정도가 제품 인터렉션에 영향을 미칠 것이라는 가설을 세우고, 이를 검증하기 위하여 Fred.E Fiedler의 상황 리더쉽 이론을 근거로 하는 LPC 실험결과의 성향 정도에 따른 제품 사용 인터렉션을 연구한다. Task-oriented 성향과 가까운 문화권 집단은 제품사용에 있어 의도한 목적을 단 시간 빠르게 수행(usability)하는 퍼포먼스의 인터렉션을 중시하고, Relationship-oriented 성향과 가까운 문화권 집단은 제품사용에 있어 목적을 수행(usability)할 때 의미부여(refelctive)적인 측면을 더 중요하게 생각할 것이라는 가설을 증명하기 위한 실험으로 비교적 Task의 의미부여(refelctive)가 동등하고 빈번하게 잘 일어나는 기기인 모바일 단말기 사용에 있어 이 두 집단의 주소록의 주기능과 부기능 사용행태를 비교하고 데이터를 수집, 분석하여 가설을 검증한다. 이 연구결과, 주소록 사용에 있어서 피들러의 상황이론에 의한 Task 수행성향은 모바일 단말기 인터렉션 사용에 영향과의 연관성은 다소 낮게 나타났으며, 관련하여 본 실험 도중 몇 가지 흥미로운 패턴을 발견할 수 있었는데, 이를 기반으로 향후 모바일 단말기의 주소록의 사용자 지향적인 디자인 방향성에 대한 가이드라인을 제시하였다.

  • PDF

원격 제어 기능을 포함한 교육용 모바일 로봇 시스템의 설계 및 구현 (A Design and Implementation of Educational Mobile Robot System including Remote Control Function)

  • 정중수;정광욱
    • 한국컴퓨터정보학회논문지
    • /
    • 제20권4호
    • /
    • pp.33-40
    • /
    • 2015
  • 본 논문에서는 원격 제어 기능을 갖는 교육용 로봇 시스템을 임베디드 환경에서 설계 및 구현하였다. 로봇 시스템의 기반이 되는 센싱 정보 처리와 소프트웨어 설계, 및 프로그래밍 실습 교육을 위한 템프릿 설계 기법을 제시하였다. 시스템의 개발 환경으로 CPU는 Cortex-M3 코어를 사용한 LPC1769 프로세서, 디버깅 환경은 LPCXPRESSO, 펌웨어 개발 언어는 C언어를, OS는 FreeRTOS를 사용하였다. 시스템 동작 과정은 무선 RF 통신을 이용하여 서버의 제어 명령을 수신하여, 교육용 로봇의 다양한 센서를 구동시킨다. 교육 과정으로는 로봇의 기본 동작 프로그램을 제공하여 실습생으로 하여금 컴파일 및 로딩이후 데모 동작을 우선 실행하도록 하였다. 이후 이의 데모 기능의 프로그래밍 기술을 교육하기 위해 단계별로 교육하도록 하였다. 로봇 동작과정에 대한 실습과 그에 대한 프로그래밍 기법이다. 또한 서버와 로봇간 통신 기법은 RF 통신환경에서 독자적인 프로토콜이 설계되었고, 로봇 센싱 데이터 처리과정을 분석하여 만족할 만한 성능 처리 결과를 제시하였다.

구개상의 두께에 따른 한국어 자음의 발음 변화에 관한 컴퓨터 분석 - 치조음, 경구개음- (A COMPUTER ANALYSIS ON THE KOREAN CONSONANT SOUND DISTORTION IN RELATION TO THE PALATAL PLATE THICKNESS -Dentoalveolar and hard palatal consonant-)

  • 우이형;최대균;최부병;박남수
    • 대한치과보철학회지
    • /
    • 제25권1호
    • /
    • pp.71-94
    • /
    • 1987
  • This study was carried out to investigate the sound distortion following the alternation of the palatal plate thickness. For this study, 2 healthy male subjects (24-year-old) were selected. Born in Seoul, they both spoke Seoul dialect. First, their sounds of /na(나)/, /da(다)/, /1a(라)/, /ja(자)/, /cha(차)/, /ta(타)/, without inserting plates were recorded, and then the sounds with palatal plates of different thickness were recorded, successively. The plate was fabricated in 3 types, each palatal thickness being 1.0mm, 2.5mm, dentoalveolar portion 2.5mm, other residual portion was 1.0mm, successively. Each type plates named B, C, D-type, in succession. Series of analysis were administered through Computer(16 bit) to analyze the sound distortions. These experiments were analyzed by the LPC (without weighting, pre-weighting, post-weighting) of the consonants, vowels portion, formant frequency of the vowels and word duration of the consonants. The findings led to the following conclusions: 1. There was no correlation of the distortion rate on the 2 informants. 2. Generally, vowels were not affected by the palatal plate thickness in the formant analysis, however, more distortion was detected in the LPC analysis, especially C, D-type plates. 3. Consonants distortion was more evident in the C, D-type plate. 4. The second formant was most disturbed and reduced in the all consonants with insertion of the palatal plate, especially C, D-type plate. 5. Word duration was shortened in the plate inserted(except /ja/, /cha/), especially C, D-type. 6. It was found that dentoalveolar, hard palatal sounds were severely distorted in plate inserted, and they were mainly affected by the dentoalveolar portion thickness. 7. There was correlation between palatal thickness and consonants quality.

  • PDF