• 제목/요약/키워드: Zero-crossing rate

검색결과 113건 처리시간 0.027초

배경잡음을 고려한 4배 가변 압축률을 갖는 ADPCM의 C6000 DSP 실시간 구현 (Implementation of Quad Variable Rates ADPCM Speech CODEC on C6000 DSP considering the Environmental Noise)

  • 김대성;한경호
    • 전력전자학회:학술대회논문집
    • /
    • 전력전자학회 2002년도 전력전자학술대회 논문집
    • /
    • pp.727-729
    • /
    • 2002
  • In this paper, we proposed quad variable rates ADPCM coding method and its implementation on C6000 DSP, which is modified from the standard ADPCM of ITU G.726 for speech quality improvement considering the environmental noise Four coding rates, 16Kbps, 24Kbps, 32Kbps and 40Kbps are used for speech window samples and the rate decision threshold is decided by the environmental noise level. The object of the proposed method is to reduce the coding rate while retaining the speech quality and the speech quality is considerably close to 40Kbps single rate coder with the coding rate close to 16Kbps single rate coder under the environmental noise. The environmental noise level affects the coding rate and the noise level is calculated per every speech window samples. At high noise level, more samples are coded at higher rates to enhance the quality, but at low noise level, only the big speech signals are coded at higher rates and more speech samples are coded at lower coding rates to reduce the coding rates. The influence of the noise on tile speech signal is considerably high for small signals and the small signal has the higher ZCR (zero crossing rate). The method is simulated in PC and to be implemented on C6000 floating point DSP board in real time operations.

  • PDF

음성 인식률 개선방법에 관한 연구 (A Study on Improved Method of Voice Recognition Rate)

  • 김영포;이한영
    • 한국전자통신학회논문지
    • /
    • 제8권1호
    • /
    • pp.77-83
    • /
    • 2013
  • 본 논문에서는 음성 인식률 개선에 관한 방법을 제시하고 연구하였다. 기존의 음성 검출 방법 중 많이 이용되고 있는 HMM(Hidden Markov Model) 알고리즘을 이용하여서 음성을 검출하였다. 실험은 음성 검출과 음성 인식의 두 가지 방법으로 진행하였다. 음성 검출은 음성의 단위로 영교차율을 구하여 데이터의 유무를 판별하였다. 음성 인식은 음성의 형상의 패턴을 분석한 후 학습된 패턴과 비교 하는 형식으로 분석하였다. 실험 결과, 제안된 음성 형상의 패턴인식 이용한 알고리즘은 92%의 음성 인식률을 얻어 80%의 기존 HMM 알고리즘에 비해서 약 12%의 향상된 인식률을 얻을 수 있었다.

Design of Roll Rate Estimator using GPS Signal for Spinning Vehicle

  • Lee, Sunyong;Jin, Mihyun;Choi, Heon Ho;Lee, Sang Jeong
    • Journal of Positioning, Navigation, and Timing
    • /
    • 제5권3호
    • /
    • pp.109-118
    • /
    • 2016
  • The present paper proposes a method that can estimate a roll rate of spinning vehicles utilizing GPS receivers. The proposed method analyzes a relation between received signal and correlation value and utilizes a phenomenon that received signal power that changes according to a signal incident direction affects a correlation value. That is, a roll-rate estimation method using zero crossing detection method for correlation value, which has sinusoidal periodicity according to rotations of vehicles, is proposed. A correlation value in real environments experiences a jitter so that the proposed method includes a pre-processing filter and detection threshold setting way is also considered to reduce the effect of received signal power. In order to verify the operation of the proposed method and analyze the performance, a signal generator and software-defined receiver (SDR) are designed. The signal generator generates intermediate frequency (IF) signal by taking the rotation of vehicles, antenna gain, and signal power into consideration, and a correlation value is acquired by taking the generated IF signals into consideration. Using the generated correlation value, the operation of the proposed roll rate estimation method is verified and the performance is analyzed.

음성인식을 위한 혼돈시스템 특성기반의 종단탐색 기법 (A New Endpoint Detection Method Based on Chaotic System Features for Digital Isolated Word Recognition System)

  • 장한;정길도
    • 전자공학회논문지SC
    • /
    • 제46권5호
    • /
    • pp.8-14
    • /
    • 2009
  • 음성 인식 연구에서 잡음이 있는 상태에서 음성 발음상의 시작점과 종단점을 찾는 것은 매우 중요하다. 기존 음성인식 시스템의 오차는 대부분 참고템플릿의 시작점과 종단점을 왜란이나 잡음으로 인해 자동적으로 찾지 못했을 경우 발생한다. 따라서 음성 신호상에서 필요 없는 부분을 제거할 수 있는 방법이 필요하다. 기존의 음성 종단점을 찾는 방법으로는 시간도메인 측정방법, 미세시간 에너지 분석, 영교차율 방법이 있다. 위의 방법들은 저주파 신호 노이즈의 영향에 정밀성을 보장을 못한다. 따라서 본 논문에서는 시간영역상에서 리야프노프 지수를 이용한 종단점 인식 알고리즘을 제안하였다. 기존의 방법들과의 비교를 통해 제안한 방법의 성능 우수성을 보였으며, 시뮬레이션 및 실험을 통해 잡음환경에서도 음성종단 인식이 가능함을 보였다.

가정용 전력 모니터링 시스템 및 장치식별 알고리즘 개발 (Development of Home Electrical Power Monitoring System and Device Identification Algorithm)

  • 박성욱;서진수;왕보현
    • 한국지능시스템학회논문지
    • /
    • 제21권4호
    • /
    • pp.407-413
    • /
    • 2011
  • 본 연구에서는 가정용 전력 모니터링 시스템을 구현하고 실험가구에 적용하여 평가하였으며, 평가과정에서 확보한 기기별 전력 사용 패턴 정보를 이용하여 자동 기기 식별 알고리즘을 개발하였다. 실험가구에 적용해본 결과, 기기별 전력사용 정보와 월별 예상 사용량 정보가 전력 소비 절감에 도움이 된다는 응답을 얻을 수 있었다. 그리고 시스템을 보다 편리하게 사용하기 위해서는 설치의 편의성과 UI를 개선해야한다는 응답을 얻었다. 본 연구에서는 UI 개선을 위하여 일반냉장고, TV, 전기밥솥, 김치냉장고, 세탁기를 자동으로 식별하는 알고리즘을 구현하였다. 자동 장치 식별 알고리즘은 전력 모니터링 과정에서 수집한 전력 소비 패턴을 관찰하여 Zero-Crossing Rate(ZC), Variation of On State(VO), Slope of On State(SO), Duty Cycle(DC) 등 4가지 특징을 규정하여 이용하였으며, 특징을 적용하는 시간 구간은 기기가 동작하는 시간이 25% 이상이 되는 2시간 길이의 구간을 이용하였다. 제안된 알고리즘은 테스트 set에 동일한 기기를 포함하는 경우 82.1%의 성능을 얻을 수 있었다.

숫자음성 자동 인식에 관한 일실험 (An Experiment of a Spoken Digits-Recognition System)

  • 오영환
    • 대한전자공학회논문지
    • /
    • 제15권6호
    • /
    • pp.23-28
    • /
    • 1978
  • 본 논문은 복수화자를 대상으로 한 숫자음성자동 시스템의 개발을 위한 기초 실험 결과의 보고다. ZCR, 대수 에너지등의 파라메터에 의한 무성자음의 분류, 선형예측에 의한 formant 주파수의 추정 및 그를 이용한 모음 및 유성자음의 인식을 행했다. 성인 남성 한 사람의 숫자음에 대한 인식실험의 결과, 음소(phoneme) 결합시의 과도 부분이나, 음소 인식 단계에서의 국소적 오인식을 흡수 할 수 있는 algorithm을 채용함으로써 양호한 인식 결과를 얻을 수 있었다. 앞으로, 독수제자를 대상으로 한 인식실험, 인식시스템의 개선과 한께 국어의 음성학적 제성질의 연구를 해 나갈 예정이다.

  • PDF

ZCR과 PARCOR 계수를 이용한 숫자음성 인식 (Spoken digit recognition Using the ZCR and PARCOR Coefficient)

  • 김학윤
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1985년도 학술발표회 논문집
    • /
    • pp.75-78
    • /
    • 1985
  • 본 연구는 시간 영역의 parament를 이용하여 한국어 숫자음(영, 일, 이, 삼, 사, 오, 육, 칠, 팔, 구)을 인식했다. 입력 음성 신호 X(n)의 Beginning Point와 Ending point를 ZCR(Zero-crossing Rate), Magnitude, Energy, Autocorrelation을 이용 Beginning point와 Ending point를 구하고 자음부의 인식은 위 계수들을 이용하여 행했다. 또, 유성음 부분에서는 PARCOR(Partial Autocorrelation), LPC(Linear Predictive Coding)를 이용 모음부와 유성자음을 인식하여 모음을 6개 부류(ㅏ, ㅑ, ㅗ, ㅜ, ㅠ, ㅣ)로 구분 인식했다. 이 방법에 의하면 입력 음성 신호 X(n)의 B.P(Beginning Point)와 E.P(Ending Point)를 쉽게 추출 가능하며 또한 각 Parameter를 이용하여 94.4%의 인식율을 얻었다.

  • PDF

AR모델을 이용한 중앙주파수의 근피로 변화에 관한 연구 (A Study on Muscle Fatigue Changes using AR Model-based Median Frequency in EMG)

  • 조은석;차샘;이상식;이기영
    • 한국정보전자통신기술학회논문지
    • /
    • 제2권1호
    • /
    • pp.17-22
    • /
    • 2009
  • 본 연구에서는 근전도의 근피로와 관계된 특징인자인 영교차율 및 저대역에너지, 푸리에변환과 AR모델에 의한 중앙주파수를 추출하여 근피로에 이를 때까지의 변화를 평가해 봄으로써 근피로 정도나 시점까지의 변화 정도를 비교 및 고찰하고자 한다. 측정 대상으로 20대 남녀 각각 3인이 참여하였으며 상완 이두근의 등장성운동으로 소진할 때까지의 근전도를 측정 기록하여 실험하였다.

  • PDF

듀얼 모드형 고신뢰 PLC 모뎀 칩 설계 및 구현 (Design and Implementation of the Dual-Mode Type Reliable PLC Modem Chip)

  • 이원태;최성수;윤성하;이영철
    • 전기학회논문지
    • /
    • 제57권3호
    • /
    • pp.488-493
    • /
    • 2008
  • This paper represents a dual-mode type transmission technique for a high reliable narrow-band power line communication(PLC) modem, and its design and implementation of a system-on-chip(SoC). The proposed transmission technique is based on a Chirp modulation for the purpose of overcoming time variations of power line channel environments in the narrow-bandwidth of the frequency range of 95-145.5 kHz. The designed modem is fabricated utilizing a mixed 0.18 ${\mu}m$ CMOS technology. Especially, according to the power line channel environments the data transmission rate can be selectively changed into 2.5 kbps and 480 bps. The total hardware complexity of the implemented chip is about 50,000 gates, the power consumption is about 26mW, and the operating frequency is up to 5.12 MHz.

음성/음악 판별을 위한 특징 파라미터와 분류기의 성능비교 (Performance Comparison of Feature Parameters and Classifiers for Speech/Music Discrimination)

  • 김형순;김수미
    • 대한음성학회지:말소리
    • /
    • 제46호
    • /
    • pp.37-50
    • /
    • 2003
  • In this paper, we evaluate and compare the performance of speech/music discrimination based on various feature parameters and classifiers. As for feature parameters, we consider High Zero Crossing Rate Ratio (HZCRR), Low Short Time Energy Ratio (LSTER), Spectral Flux (SF), Line Spectral Pair (LSP) distance, entropy and dynamism. We also examine three classifiers: k Nearest Neighbor (k-NN), Gaussian Mixure Model (GMM), and Hidden Markov Model (HMM). According to our experiments, LSP distance and phoneme-recognizer-based feature set (entropy and dunamism) show good performance, while performance differences due to different classifiers are not significant. When all the six feature parameters are employed, average speech/music discrimination accuracy up to 96.6% is achieved.

  • PDF