• 제목/요약/키워드: Speech transmission performance

검색결과 56건 처리시간 0.023초

유리창의 레이저 탐지음에 대한 음성명료도 분석 (Speech Intelligibility Analysis on the Laser Detected Sound of the Glass Windows)

  • 김석현;이현우;김희동
    • 한국음향학회지
    • /
    • 제28권2호
    • /
    • pp.127-134
    • /
    • 2009
  • 본 연구에서는 다양한 두께의 유리창을 대상으로 레이저 원격 도청 가능성을 검토한다. MLS 신호음을 사용하여 유리창을 진동시키고 레이저 도플러센서로 진동음을 탐지한다. 탐지된 진동음으로부터 음성정보의 인식 수준인 음성명료도를 객관적으로 평가한다. 평가에는 변조전송함수에 근거하여 결정되는 음성전송지수를 사용한다. 또한, 외부 스피커와 유리창 교란기로 각각 교란파를 발생시켜, 배경소음과 도청방지기의 음성명료도에 대한 교란효과를 평가한다. 다양한 두께의 유리창을 대상으로 레이저 원격 도청음의 음성인식 수준과 국산 도청 방지장치의 도청방지 성능을 평가하는 데에 본 연구의 목적이 있다.

T자형 복도 공간의 비상 방송용 확성기 배치별 음압 레벨과 음성 명료도 비교 (Comparison of Sound Pressure Level and Speech Intelligibility of Emergency Broadcasting System at T-junction Corridor Space)

  • 정정호;이성찬
    • 한국화재소방학회논문지
    • /
    • 제33권1호
    • /
    • pp.105-112
    • /
    • 2019
  • 본 연구에서는 T자형의 복도 연결 공간에서 비상 방송음이 명료하고 고르게 전달되는지를 건축음향 시뮬레이션을 이용하여 알아보았다. 복도 공간의 흡음성능 변화, 비상 방송용 확성기의 설치 위치와 간격을 변화시켜 보았으며 변화에 따른 음압 레벨 분포, 음성 전달 지수(STI, RASTI) 분포를 비교하였다. 시뮬레이션 결과 명료한 음성 전달을 위해서는 비상 방송용 확성기를 T자형 복도 연결부의 중심에서 약 10 m를 이격시켜 설치하는 것이 좋은 것으로 나타났다. NFSC의 25 m 설치 간격을 좁히는 경우 더욱 명료하고 충분한 음량을 갖는 비상 방송음이 고르게 전달될 수 있는 것으로 나타났다.

주거 공간에서 고령자 청력손실을 고려한 소음 및 잔향에 따른 음성 전송 성능의 주관적 평가 (Effect of noise and reverberation on subjective measure of speech transmission performance for elderly person with hearing loss in residential space)

  • 오양기;류종관;송한솔
    • 한국음향학회지
    • /
    • 제37권5호
    • /
    • pp.369-377
    • /
    • 2018
  • 본 논문은 주거공간에서 고령자 청력손실을 고려한 소음 및 잔향에 따른 음성 전송 성능을 청취실험을 통해 평가하였다. 주거환경 소음으로 바닥충격음, 교통소음, 공기전달음과 배수소음을 대상으로 하였으며, 공동주택의 잔향환경을 모사하기 위해 실내음향 컴퓨터시뮬레이션을 실시하여 충격응답를 추출하였다. 청취실험 음원은 고령자 청력손실(65세 남성)을 반영하기 위해 소음 및 단어 음원의 고주파대역의 음압레벨을 저감시킨 음원(고령자 음원)과 정상청력을 반영한 원음(청년 음원)을 대상으로 하였다. 청취실험은 각각 3개의 소음레벨($L_{Aeq}$ 30, 40, 50 dB)과 잔향시간(0.5, 1.0, 1.5 s)을 갖는 음환경 조건에서 제시된 단어($L_{Aeq}$ 55 dB)의 음성요해도(speech intelligibility)와 듣기 어려운 정도(listening difficulty)를 평가하는 것으로 하였다. 청취실험 결과, 음성레벨이 55 dB($L_{Aeq}$)일 때 잔향시간 1.0 s 이하 조건에서 충격소음(점핑음) 50 dB($L_{i,Fmax,AW}$)와 정상소음(도로, 음악, 배수 소음) 40 dB($L_{Aeq}$) 이하의 소음레벨에서는 고령자 및 청년 음원 모두 90 % 이상의 음성요해도와 30 % 이하의 듣기 어려운 정도를 확보할 수 있을 것으로 판단된다. 고령자 청력손실을 반영한 고령자 음원의 경우 청년 음원 보다 음성요해도는 0 % ~ 5 % 낮았고 듣기 어려운 정도는 2 % ~ 10 % 높은 것으로 나타났다.

지하 전력 구내에서 신호 전송 시스템의 실현에 관한 연구 (A Study on the Implementation of Signal Transmission System Within Electric Culvert)

  • 진달복;오상기;최성주;나채동
    • 한국조명전기설비학회지:조명전기설비
    • /
    • 제7권3호
    • /
    • pp.49-56
    • /
    • 1993
  • 본 논문에서는 지하전력구 환경하에서 통신신뢰도가 높고 확장성이 용이하며 복합전송(음성+데이터+영상신호)이 가능한 누설동축케이블을 전송 매체로 하여 지하전력구내 신호전송시스템을 설계 및 설치하였다.그리고 시험시스템에서 각종 전송특성시험을 실시하여 성능을 평가하였다. 음성신호의 경우, 전송손실 특성은 설계치보다 5∼10[dB]정도의 수신레벨이 향상되었으며 통화 품질평가시험에서 통화강도가 3(QSA 값), 명료도가 4(QRK 값)정도의 양호한 특성을 나타냈다. 또한 데이터 및 영상신호 전송특성에 대한 감시제어기능시험에서는 98[%]의 통신성공율을 확보할 수 있었다.그리고 전송로 및 시스템의 전송특성 측정결과에 의해서 중계기 없이 전송범위를 6[km]까지 확대할 수 있는 LCX 통신시스템을 전력구내 종합관리 시스템의 기본 구성방법으로 제시하였다.

  • PDF

효율적인 음성신호의 전송을 위한 4배속 가변 변환율 ADPCM기법 및 DSP를 이용한 실시간 구현 (Variable Quad Rate ADPCM for Efficient Speech Transmission and Real Time Implementation on DSP)

  • 한경호
    • 조명전기설비학회논문지
    • /
    • 제18권1호
    • /
    • pp.129-136
    • /
    • 2004
  • 본 논문에서는 ADPCM을 이용하여 보다 효율적인 음성전송을 위한 4배속 가변임계값을 갖는 음성 부호화법을 제안하였으며 TMS320C6711-DSP를 사용하여 제안된 알고리즘의 실시간 음성 처리 구현을 다루었다. 본 논문에서는 ADPCM 알고리즘을 개선하여 입력 신호 및 주변 환경에 따라 변환율을 16[kbps], 24[kbps], 32[kbps], 40[kbps]로 가변하는 음성부호화 방법을 제시하고 이를 DSP를 이용하여 Encoding과 Decoding을 실시간으로 구현하여 좋은 음질의 음성 신호를 보다 적은 비트 수로 전송하고자 하였다. 이를 위하여 영교차율(Zero Crossing Rate)을 이용하여 소음의 우세한 정도를 구분하여, 임계값을 가변 시키도록 하였으며 소음이 우세한 환경에서는 4가지 변환율 가운데 낮은 변환율을 사용하도록 하여 전송 비트 수를 줄이도록 하였으며, 소음이 열세한 환경에서는 높은 변환율을 사용하도록 하여 좋은 음질을 갖도록 하였다. 음성 대화의 많은 구간이 거의 묵음인 구간이 많으므로, 음질은 40[kbps] 수준의 음질을 유지하면서 이 보다 낮은 데이터 비트수를 유지할 수 있음을 시뮬레이션과 실험으로 보였다. 구현에 사용된 TMS320C6711-DSK board는 128[K]의 플래쉬 메모리를 가지고 있고 1333MIPS의 처리속도를 가지므로 제안된 알고리즘을 실시간 구현하기에 충분한 조건을 가지고 있다.

DPCM 음성 부호화기의 부정합현상에 관한 연구 (On the Mismatch Phenomena in DPCM Coding of Speech)

  • 유득수;조동호;은종관
    • 대한전자공학회논문지
    • /
    • 제23권5호
    • /
    • pp.597-604
    • /
    • 1986
  • This paper describes various mismatch phenomena in differential pulse code modulation (DPCM) coding, such as the mismatch effects of probability density functin(pdf), signal variance, and correlation. At a high transmission rate(i.e., above 32 kbits/s), the performance of DPCM can be improved by matching the pdf shape between the input signal and the quantizer. However, the same gain cannot be obtained at a lower transmission rate. Also, it is shown that the gamma quantizer is realtively robust to the variation of pdf shaper and signal variance. Moreover, as the transmission rate increases, the performance of DPCM for the input signal with large variance is worse than that of DPCM for the signal with small variance due to the increase of overload noise. According to our simuladiton results, the mismatch effects of pdf shape and variance appear to yield more degradatin than that of correlation in a DPCM system.

  • PDF

패킷 중요도 결정에 의한 VoIP 통화 품질 향상 기술 (Improving Speech Quality of VoIP by Packet Prioritization)

  • 윤제열;박호종
    • 한국음향학회지
    • /
    • 제29권5호
    • /
    • pp.347-353
    • /
    • 2010
  • VoIP 시스템의 통화 품질은 패킷의 전송 손실에 의하여 크게 저하되며, 각 패킷의 손실에 의한 음질 저하 정도는 해당 패킷의 특성에 따라 결정된다. 따라서 각 패킷 손실에 의한 음질 저하를 미리 분석하여 전송 과정에서 손실되는 패킷을 선택적으로 조정하면 VoIP 통화 품질을 향상시킬 수 있다. 본 논문에서는 DS 기반의 네트워크를 사용하는 VoIP에서 각 패킷에 전송 우선순위를 할당하여 통화 품질을 향상시키는 구조를 제안하고, 이를 위한 패킷 중요도 결정 방법을 제안한다. Gilbert 모델에 따른 패킷 손실 환경에서 제안한 방법의 성능을 측정하였으며, 객관적 음질 평가와 주관적 음질 평가를 통하여 VoIP 통화 품질이 향상되는 것을 확인하였다.

음소 인식을 위한 스파이크그램 기반의 음성 특성 추출 기술 (Speech Feature Extraction based on Spikegram for Phoneme Recognition)

  • 한석현;김재원;안순호;신성현;박호종
    • 방송공학회논문지
    • /
    • 제24권5호
    • /
    • pp.735-742
    • /
    • 2019
  • 본 논문에서는 스파이크그램을 기반으로 음소 인식을 위한 특성을 추출하는 방법을 제안한다. 음소 인식에 널리 사용되는 푸리에 변환 기반의 특성은 청각 기관의 동작에 부합하는 과정으로 구해지지 않으며 프레임 단위로 추출되어 높은 시간 해상도를 가지지 못한다. 따라서 음소 인식의 성능 향상을 위해 높은 시간 해상도를 가지면서 인간의 청각기관을 모델링 하는 새로운 음성 특성 추출 기술이 요구된다. 본 논문에서는 청각 기관의 특성 추출 및 전달 과정을 모델링 하는 기법인 스파이크그램을 사용하여 음성 신호를 분석하고, 이로부터 음소 인식을 위한 특성을 추출하는 방법을 제안한다. 심층 신경망 기반의 음소 인식기를 사용하여 제안한 특성의 음소 인식 성능을 측정하였고, 짧은 음소에 대해 제안 특성이 기존 푸리에 변환 기반의 특성보다 우수한 성능을 가지는 것을 확인하였다. 이 결과로부터 청각 모델을 기반으로 추출된 새로운 음성 특성을 사용하여 음소 인식이 가능함을 확인할 수 있다.

4 kbps PSI-VSELP 음성 부호화 알고리듬 (A 4 kbps PSI-VSELP Speech Coding Algorithm)

  • 최용수;강홍구;박상욱;윤대희
    • 한국음향학회지
    • /
    • 제15권6호
    • /
    • pp.59-65
    • /
    • 1996
  • 본 논문에서는 기존의 4.8 kbps VSELP에 상응하는 음질을 갖는 4 kbps PSI-VSELP(Pitch Synchrononus Innovation-Vector Sum Excited Linear Prediction) 음성 부호화기를 제안한다. 'Half-rate'는 4kbps 내외에서 지역에 따라 다소 차이가 있으므로 기존의 half-rate 부호화기를 사용하기 위해서는 비트율을 감소시킬 필요가 생긴다. 이때, 비트율 감소에 따른 성능저하를 최소화하기 위해서는 전송 변수가 부호화기의 성능에 미치는 영향을 고려하여 비트 할당을 결정하는 것이 바람직하다. 본 논문에서는 이러한 접근 방식으로 비트율 감소 연구를 수행한 후, 제안된 부호화기에 대한 4 kbps 비트 할당을 결정한다. VSELP 부호화기의 음질 향상을 위해서, 성능에 가장 중요한 영향을 미치는 기저 벡터는 반복 폐회로 훈련 과정을 통해 최적화하며, PSI 기법을 VSELP 부호화기에 도입한다. 제안된 음성 부호화기의 성능을 평가하기 위해 배경 잡음과 채널 에러가 없는 환경에서 실험을 하였다. 실험 결과, 제안된 4 kbps PSI-VSELP는 4.8 kbps VSELP에 비해 객관적 음질은 낮았지만, 주과적 음질은 더 높게 나타났다.

  • PDF

화상 전화용 음성 보코더의 실시간 구현 (Real-Time Implementation of Speech Vocoder For Video Telephony)

  • 남일룡;서성대;남현도
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1998년도 하계학술대회 논문집 G
    • /
    • pp.2414-2416
    • /
    • 1998
  • This paper presents real-time implementation of speech vocoder for PSTN video telephony using ITU G.723 16Kbps ADPCM algorithm. The ADPCM encoder accepts 8-bit PCM compressed signals and expends it to a 14-bit-per-sample. The predicted values are subtracted from encoded signals to produce difference signals. Adaptive quantization is performed on the difference signal to produce a 2-bit, output for transmission over the channel. Computer simulations and experiments were performed to evaluate the performance of the speech vocoder.

  • PDF