• 제목/요약/키워드: Zero-Crossing Time

검색결과 124건 처리시간 0.027초

한국어 음성인식에서 음성의 특성을 고려한 음소 경계 검출 (Phoneme Segmentation in Consideration of Speech feature in Korean Speech Recognition)

  • 서영완;송점동;이정현
    • 인터넷정보학회논문지
    • /
    • 제2권1호
    • /
    • pp.31-38
    • /
    • 2001
  • 음소 단위로 구축된 음성 데이터는 음성인식과 음성합성 및 분석 등의 분야에서 매우 중요한 문제이다. 일반적으로 음소는 유성음과 무성음으로 구분된다. 이러한 유성음과 무성음은 많은 특징적 차이가 있지만, 기존의 음소 경계 검출 알고리즘은 이를 고려하지 않고 시간 축을 기준으로 이전 프레임과의 스펙트럼 비교만을 통하여 음소의 경계를 결정한다. 본 논문에서는 음소 경계 검출을 위하여 유성음과 무성음의 특징적 차이를 고려한 블록기반의 분류 알고리즘을 설계하였다. 분류 알고리즘을 사용하기 위한 스펙트럼 비교 방법은 MFCC(kel-Frequency Cepstrum Coefficient)를 기반으로 한 거리 측정 법을 사용하였고 유성음과 무성음의 구분은 에너지 영 교차율, 스펙트럼 비, 포만트 주파수를 이용하였다. 본 논문의 실험결과 3-4음절 고립단어를 대상으로 약 7%,의 정확도를 얻음으로써 기존의 음소 경계 검출 시스템보다 약 8%의 정확도 향상을 보였다.

  • PDF

직접대역확산 기법을 적용한 전력선 모뎀의 구현 (Implementation of Power Line Modem Using a Direct Sequence Spread Spectrum Technique)

  • 송문규;김대우;사공석진;차균현
    • 한국통신학회논문지
    • /
    • 제18권2호
    • /
    • pp.218-230
    • /
    • 1993
  • 전력선을 통신선로로 이용시 전송신호는 전력선 채널특성인 주파수 선택적인 페이딩(fading)과 간섭 그리고 시변감쇠에 많은 영향을 받을 수 있다. 이러한 영향은 시변이며 임의의 주파수에서 일어나므로 예측하기 어렵다. 본 논문에서는 가정 혹은 소규모 사무실 내에서 비교적 저속 데이터를 안전하게 전송하는 전력선 모뎀을 구현하기 위해 대역확산 기법 중 실현이 비교적 용이하고 잡음 특성이 우수한 직접확산 방식을 적용하였다. 대역확산 기법을 적용할 경우 PN(pseudo noise)부호 발생회로와 복잡한 동기회로 등의 부가적인 하드웨어가 요구되지만, 본 논문에서는 이러한 하드웨어의 일부를 시스템 자체에 내장된 프로세서를 이용한 소프트웨어로 처리하였고, 복잡한 동기회로 대신 60 Hz의 전력신호를 이용한 간단한 동기 회로를 구성하였다. 구현된 동기회로는 대역확신 기법에 본질적인 동기획득 시간의 소요 문제를 제거할 수 있으며, 아울러 60 Hz의 전력신호 자체의 영교차 지터의 영향을 피하도록 설계되었다. 결과적으로 본 논문에서는 대역확산 기법을 적용하면서도 대역확산에 필요한 일부 하드웨어를 소프트웨어화함으로써 소형, 경량화를 이루며, 전력선 상에서 데이타를 안전하게 전송하는 전력선 모뎀을 구현하였다.

  • PDF

차량 잡음 환경에서 엔트로피 기반의 음성 구간 검출 (Voice Activity Detection Based on Entropy in Noisy Car Environment)

  • 노용완;이규범;이우석;홍광석
    • 융합신호처리학회논문지
    • /
    • 제9권2호
    • /
    • pp.121-128
    • /
    • 2008
  • 정확한 음성 구간 검출은 음성 인식 및 음성 코딩 그리고 음성 통신 시스템 등과 같은 음성 어플리케이션의 성능에 큰 영향을 미친다. 본 논문에서는 실제 운전하고 있는 상태에서 다양한 차량 노이즈 환경의 음성 구간 검출 방법을 제안한다. 기존의 음성 구간 검출은 시간 에너지, 주파수 에너지, 영 교차율, spectral entropy 등 다양한 방법을 사용하였으며 잡음 환경에서 급격하게 성능이 저하되는 단점이 있었다. 본 논문에서는 기존의 spectral entropy를 기반으로 하여 MFB(Mel-frequency Filter Banks) spectral entropy, 기울기 FFT(Fast Fourier Transform) spectral entropy, 기울기 MFB spectral entropy를 이용한 음성 구간 검출 방법을 제안한다. MFB는 멜 스케일과 FFT를 곱한 것으로 멜 스케일은 인간이 소리를 인지할 때 주파수에 대해 비선형적인 스케일이며 음성의 특징을 잘 반영한다. 제안한 MFB spectral entropy 방법은 다양한 차량 잡음 환경에서 음성 및 비음성 분별 능력을 향상시킬 수 있으며 실험 결과 93.21%의 음성 구간 검출율을 나타내었다. 이는 기존의 spectral entropy 방법과 비교할 때 MFB를 이용한 음성 구간 검출 방법이 3.2%의 검출율이 향상되었다.

  • PDF

음성의 묵음구간 검출을 통한 DTW의 성능개선에 관한 연구 (A Study on the Improvement of DTW with Speech Silence Detection)

  • 김종국;조왕래;배명진
    • 음성과학
    • /
    • 제10권4호
    • /
    • pp.117-124
    • /
    • 2003
  • Speaker recognition is the technology that confirms the identification of speaker by using the characteristic of speech. Such technique is classified into speaker identification and speaker verification: The first method discriminates the speaker from the preregistered group and recognize the word, the second verifies the speaker who claims the identification. This method that extracts the information of speaker from the speech and confirms the individual identification becomes one of the most efficient technology as the service via telephone network is popularized. Some problems, however, must be solved for the real application as follows; The first thing is concerning that the safe method is necessary to reject the imposter because the recognition is not performed for the only preregistered customer. The second thing is about the fact that the characteristic of speech is changed as time goes by, So this fact causes the severe degradation of recognition rate and the inconvenience of users as the number of times to utter the text increases. The last thing is relating to the fact that the common characteristic among speakers causes the wrong recognition result. The silence parts being included the center of speech cause that identification rate is decreased. In this paper, to make improvement, We proposed identification rate can be improved by removing silence part before processing identification algorithm. The methods detecting speech area are zero crossing rate, energy of signal detect end point and starting point of the speech and process DTW algorithm by using two methods in this paper. As a result, the proposed method is obtained about 3% of improved recognition rate compare with the conventional methods.

  • PDF

전력선을 이용한 전자식 안정기 조광 신호 전송과 특성 측정 (Dimming Control Signal Transmisson of Electronic Ballast on the Power Line and Characteristics Measurement)

  • 이상곤;정은택;강복연;양병렬;유홍균
    • 한국통신학회논문지
    • /
    • 제19권4호
    • /
    • pp.691-700
    • /
    • 1994
  • 본 논문에서는 전력선을 이용한 조광용 전자식 안정기의 원격 제어신호 전송 방식을 고안하였다. 기존의 방식은 상측파기 완전히 전단된 두개의 신호가 N 주기의 간격으로 전송하는 방식이며, 제안된 방식은 다른 상측파 내의 임의의 명령에 따라 일정 위상에서 파가 절단된 신호를 전송하는 방식이다. 이 방식은 파형을 절단하는데서 오는 전송전력의 손실을 최소한으로 줄일 수 있다. 구현에 있어서 파형의 절단 위치 결정과 수신신호 위상을 결정하기 위한 타이머가 필요하기 때문에 타이머가 내장된 마이크로프로세소를 이용해 정확한 위상 계산을 하도록 했다. 결과적으로 전력선을 이용한 전자식 안정기의 원격 제어신호의 전송기법에 있어서 기존의 방식보다 전력전송 효율이 좋은 원격 제어기를 구현하였고 그특성을 측정하였다.

  • PDF

Feature Extraction and Evaluation for Classification Models of Injurious Falls Based on Surface Electromyography

  • Lim, Kitaek;Choi, Woochol Joseph
    • 한국전문물리치료학회지
    • /
    • 제28권2호
    • /
    • pp.123-131
    • /
    • 2021
  • Background: Only 2% of falls in older adults result in serious injuries (i.e., hip fracture). Therefore, it is important to differentiate injurious versus non-injurious falls, which is critical to develop effective interventions for injury prevention. Objects: The purpose of this study was to a. extract the best features of surface electromyography (sEMG) for classification of injurious falls, and b. find a best model provided by data mining techniques using the extracted features. Methods: Twenty young adults self-initiated falls and landed sideways. Falling trials were consisted of three initial fall directions (forward, sideways, or backward) and three knee positions at the time of hip impact (the impacting-side knee contacted the other knee ("knee together") or the mat ("knee on mat"), or neither the other knee nor the mat was contacted by the impacting-side knee ("free knee"). Falls involved "backward initial fall direction" or "free knee" were defined as "injurious falls" as suggested from previous studies. Nine features were extracted from sEMG signals of four hip muscles during a fall, including integral of absolute value (IAV), Wilson amplitude (WAMP), zero crossing (ZC), number of turns (NT), mean of amplitude (MA), root mean square (RMS), average amplitude change (AAC), difference absolute standard deviation value (DASDV). The decision tree and support vector machine (SVM) were used to classify the injurious falls. Results: For the initial fall direction, accuracy of the best model (SVM with a DASDV) was 48%. For the knee position, accuracy of the best model (SVM with an AAC) was 49%. Furthermore, there was no model that has sensitivity and specificity of 80% or greater. Conclusion: Our results suggest that the classification model built upon the sEMG features of the four hip muscles are not effective to classify injurious falls. Future studies should consider other data mining techniques with different muscles.

효율적인 음성신호의 전송을 위한 4배속 가변 변환율 ADPCM기법 및 DSP를 이용한 실시간 구현 (Variable Quad Rate ADPCM for Efficient Speech Transmission and Real Time Implementation on DSP)

  • 한경호
    • 조명전기설비학회논문지
    • /
    • 제18권1호
    • /
    • pp.129-136
    • /
    • 2004
  • 본 논문에서는 ADPCM을 이용하여 보다 효율적인 음성전송을 위한 4배속 가변임계값을 갖는 음성 부호화법을 제안하였으며 TMS320C6711-DSP를 사용하여 제안된 알고리즘의 실시간 음성 처리 구현을 다루었다. 본 논문에서는 ADPCM 알고리즘을 개선하여 입력 신호 및 주변 환경에 따라 변환율을 16[kbps], 24[kbps], 32[kbps], 40[kbps]로 가변하는 음성부호화 방법을 제시하고 이를 DSP를 이용하여 Encoding과 Decoding을 실시간으로 구현하여 좋은 음질의 음성 신호를 보다 적은 비트 수로 전송하고자 하였다. 이를 위하여 영교차율(Zero Crossing Rate)을 이용하여 소음의 우세한 정도를 구분하여, 임계값을 가변 시키도록 하였으며 소음이 우세한 환경에서는 4가지 변환율 가운데 낮은 변환율을 사용하도록 하여 전송 비트 수를 줄이도록 하였으며, 소음이 열세한 환경에서는 높은 변환율을 사용하도록 하여 좋은 음질을 갖도록 하였다. 음성 대화의 많은 구간이 거의 묵음인 구간이 많으므로, 음질은 40[kbps] 수준의 음질을 유지하면서 이 보다 낮은 데이터 비트수를 유지할 수 있음을 시뮬레이션과 실험으로 보였다. 구현에 사용된 TMS320C6711-DSK board는 128[K]의 플래쉬 메모리를 가지고 있고 1333MIPS의 처리속도를 가지므로 제안된 알고리즘을 실시간 구현하기에 충분한 조건을 가지고 있다.

인공 신경망을 이용한 보청기용 실시간 환경분류 알고리즘 (Real Time Environmental Classification Algorithm Using Neural Network for Hearing Aids)

  • 서상완;육순현;남경원;한종희;권세윤;홍성화;김동욱;이상민;장동표;김인영
    • 대한의용생체공학회:의공학회지
    • /
    • 제34권1호
    • /
    • pp.8-13
    • /
    • 2013
  • Persons with sensorineural hearing impairment have troubles in hearing at noisy environments because of their deteriorated hearing levels and low-spectral resolution of the auditory system and therefore, they use hearing aids to compensate weakened hearing abilities. Various algorithms for hearing loss compensation and environmental noise reduction have been implemented in the hearing aid; however, the performance of these algorithms vary in accordance with external sound situations and therefore, it is important to tune the operation of the hearing aid appropriately in accordance with a wide variety of sound situations. In this study, a sound classification algorithm that can be applied to the hearing aid was suggested. The proposed algorithm can classify the different types of speech situations into four categories: 1) speech-only, 2) noise-only, 3) speech-in-noise, and 4) music-only. The proposed classification algorithm consists of two sub-parts: a feature extractor and a speech situation classifier. The former extracts seven characteristic features - short time energy and zero crossing rate in the time domain; spectral centroid, spectral flux and spectral roll-off in the frequency domain; mel frequency cepstral coefficients and power values of mel bands - from the recent input signals of two microphones, and the latter classifies the current speech situation. The experimental results showed that the proposed algorithm could classify the kinds of speech situations with an accuracy of over 94.4%. Based on these results, we believe that the proposed algorithm can be applied to the hearing aid to improve speech intelligibility in noisy environments.

얼굴인식 및 표정 인식을 위한 얼굴 및 얼굴요소의 윤곽선 추출 (Facial Feature Retraction for Face and Facial Expression Recognition)

  • 이경희;변혜란;정찬섭
    • 한국감성과학회:학술대회논문집
    • /
    • 한국감성과학회 1998년도 추계학술발표 논문집
    • /
    • pp.25-29
    • /
    • 1998
  • 본 논문은 얼굴 인식 또는 표정 인식 분야에 있어서 중요한 특징을 나타내는 얼굴과 얼굴의 주요소인 눈과 입, 눈썹의 영역 추출 및 그의 윤곽선·추출에 관한 방법을 제시한다. 얼굴요소의 영역 추출은 엣지 정보와 이진화 영상을 병합하여 이용한 프로젝션 분석을 통하여 얼굴 및 각 얼굴요소를 포함하는 최소포함사각형(MER: Minimum Enclosing Rectangle)을 추출하였다. 얼굴 영상에 관련된 윤곽선 연구에는 가변 템플릿(Deformable Template), 스네이크(Snakes: Active Contour Model)를 이용하는 연구들이 이루어지고 있는데 가변 템플릿 방법은 수행시간이 느리고 추출된 윤곽선의 모양이 획일 된 모양을 갖는 특성이 있다. 본 논문에서는 사람마다 얼굴요소의 모양의 개인차가 반영되고 빠른 수렴을 할 수 있는 스네이크 모델을 정의하여 눈, 입, 눈썹, 얼굴의 윤곽선 추출 실험을 하였다. 또한 스네이크는 초기 윤곽선의 설정이 윤곽선의 추출 곁과에 큰 영향을 미치므로, 초기 윤곽선의 설정 과정이 매우 중요하다. 본 논문에서는 얼굴 및 각 얼굴요소를 포함하는 각각의 최소 포함 사각형(MER)을 추출하고, 이 추출된 MER 내에서 얼굴 및 각 얼굴요소의 일반적인 모양을 초기 윤곽선으로 설정하는 방법을 사용하였다. 실험결과 눈, 입, 얼굴의 MER의 추출은 모두 성공하였고, 눈썹이 흐린 사람들의 경우에만 눈썹의 MER추출이 졸지 않았다. 추출된 MER을 기반으로 하여 스네이크 모델을 적용한 결과, 눈, 입, 눈썹, 얼굴의 다양한 모양을 반영한 윤곽선 추출 결과를 보였다. 특히 눈의 경우는 1차 유도 엣지 연산자에 의한 엣지 와 2차 유도 연산자를 이용한 영점 교차점(Zero Crossing)과 병합한 에너지 함수를 설정하여 보다 더 나은 윤곽선 추출 결과를 보였다. 얼굴의 윤곽선의 경우도 엣지 값과 명도 값을 병합한 에너지 함수에 의해 비교적 정확한 결과를 얻을 수 있었다.잘 동작하였다.되는 데이타를 입력한후 마우스로 원하는 작업의 메뉴를 선택하면 된다. 방법을 타액과 혈청내 testosterone 농도 측정에 응용하여 RIA의 결과와 비교하여 본 바 상관관계가 타액에서 r=0.969, 혈청에서 r=0.990으로 두 결과가 잘 일치하였다. 본 실험에서 측정된 한국인 여성의 타액내 testosterone농도는 107.7$\pm$12.0 pmol/l이었고, 남성의 타액내 농도는 274.2$\pm$22.1 pmol/l이었다. 이상의 결과로 보아 본 연구에서 정립된 EIA 방법은 RIA를 대신하여 소규모의 실험실에서도 활용할 수 있을 것으로 사려된다.또한 상실기 이후 배아에서 합성되며, 발생시기에 따라 그 영향이 다르고 팽창과 부화에 관여하는 것으로 사료된다. 더욱이, 조선의 ${\ulcorner}$구성교육${\lrcorner}$이 조선총독부의 관리하에서 실행되었다는 것을, 당시의 사범학교를 중심으로 한 교육조직을 기술한 문헌에 의해 규명시켰다.nd of letter design which represents -natural objects and was popular at the time of Yukjo Dynasty, and there are some documents of that period left both in Japan and Korea. "Hyojedo" in Korea is supposed to have been influenced by the letter design. Asite- is also considered to have been "Japanese Letter Jobcheso." Therefore, the purpose of this study is to look into the origin of the letter designs in the Chinese character culture

  • PDF

스마트그리드의 탭 전환 자동 전압 조정기의 다중 스위칭 제어 방법 및 활용 방안에 관한 연구 (A Study on the Utilization and Control Method of Hybrid Switching Tap Based Automatic Voltage Regulator on Smart Grid)

  • 박광윤;김정률;김병기
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권12호
    • /
    • pp.31-39
    • /
    • 2012
  • 본 논문에서는 수용가의 에너지 절감과 최대수요전력 제어를 위하여 마이크로프로세서를 이용한 자동 전압 조정기(AVR)를 제안한다. 제안한 자동 전압 조정기(HS-AVR : Hybrid Switching Automatic Voltage Regulator)는 토로이달 코어에 1개의 직렬 권선과 분리된 4개의 분로 권선으로 구성되어 있는 단권변압기를 사용한다. 변압기의 전압 조정은 직렬 권선과 분로 권선의 연결 방법에 따라 감압/승압이 가능하다. 스위치는 릴레이와 트라이악을 병행하여 사용한다. 스위치의 조작 시 발생하는 권선의 여자돌입전류를 제어하기 위하여 트라이악을 이용하여 연결 상태를 변경하고, 연결 상태 유지 시에는 릴레이를 이용함으로써 스위치 소비 전력을 최소화 한다. 제어 신호는 여자 돌입 전류를 줄이기 위하여 전압 파형에 동기화 하여 제어되며 이를 위하여 소프트웨어 PLL을 사용한다. 소프트웨어 PLL은 전압 파형의 제로크로스, 전압 최고점 등의 동기화에 사용함으로써 스위치와 시스템을 최소화한다. 기존 전압 조절 스위치나 자동 전압 조정기 구조는 여자 돌입 전류로 인한 스위치 접점 손상을 막기 위하여 최대전류를 수용할 수있는 용량으로 구성함으로써 장치 크기가 매우 커지는 문제점이 있었다. 본 논문은 이런 문제를 해결하여 자동 전압 조정기의 크기를 줄이고 효율을 높이는 방법을 제안하였다.