• Title/Summary/Keyword: 음성레벨

검색결과 138건 처리시간 0.023초

음성 Cassette Deck를 이용한 Minicomputer의 I/O 장치 (I/O device of Minicomputer Using the Audio Cassette Deck)

  • 이주근;박찬곤
    • 대한전자공학회논문지
    • /
    • 제12권3호
    • /
    • pp.1-7
    • /
    • 1975
  • 이 논문은 음성카셋트 Deck을 이용하여 고밀도로 data를 기록 또는 재생하는 한 방법을 검토하였다. 기록에 있어서는 NRZ-TM의 혼합에 의한 한 방식으로서 data를 정 및 부 bit로 분리하여 두개의 트랙에 각각 기록한다. 재생방법은 피이크. 쎈스에 의하여 검출신호의 레벨변동에 의한 정형, 펄스의 시간편차를 제거하고 오차의 정정이 자동적으로 이루어 지며 크럭. 펄스가 검출신호 자체에서 자동적으로 발생한다. 이 방식은 음성카셋트 Deck의 내부회로는 변경하기 않고 외부에 새로운 부착만으로서 음성과 data를 병용할 수 있다. Data펄스 25Hz-4KHz의 주파수까지 기록이 가능하고 최고 전송속도는 787(bps)이다.

  • PDF

저주파 대역에서 M레벨 FSK시스템의 오율에 관한 연구 (A study for the Error performance of M-FSK system on the Low frequency band)

  • 김성철;박경호
    • 한국정보통신학회논문지
    • /
    • 제11권9호
    • /
    • pp.1672-1678
    • /
    • 2007
  • 유비쿼터스의 기반기술로서 전송방식과 전송로의 특성은 정보전송의 품질을 좌우하는 요소이며, 음성 데이터, 그래픽 등 동화상 데이터를 포함한 멀티미디어를 저주파 대역에서 임펄스성 잡음 하에서 데이터 전송의 고속 시스템 구축 등이 절실하다. 데이터 전송속도는 전송로의 대역폭과 펄스속도 및 통신방식 에 관계된다. 본 논문은 디지털데이터를 아날로그 신호로 처리하는 통신방식 중 임펄스와 가우스잡음레벨에 고려한 2, 4, 8레벨의 FSK방식의 오율에 관해 연구하여 FDM의 다중화 시스템 설계에 기여하고자 한다.

TMS320C6701 DSP를 이용한 MPEG-4 오디오 HVXC 코덱의 실시간 구현 (Real-time Implementation of HVXC codec conforming to MPEG-4 audio using TMS320C6701 DSP)

  • 강경옥;홍진우;김진웅;나훈;정대권
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1999년도 학술대회
    • /
    • pp.261-266
    • /
    • 1999
  • 본 논문에서는 인터넷 폰이나 디지털 이동통신에서와 같이 낮은 비트율이 요구되는 응용분야에서 사용될 수 있는 HVXC 부호화 및 복호화 알고리즘을 TMS320C6701 160MHz DSP를 사용하여 실시간 동작을 구현한 내용을 기술한다. 사용한 최적화 방법으로는 기본적으로 연산 시간이 많이 소요되는 함수 루틴에 대한 C 언어레벨의 최적화 및 어셈블리어 레벨의 최적화를 수행하였고, TMS320C6701 DSP 내부 프로그램 메모리를 프로그램 캐쉬로 사용하였다. 또한, 계산량이 많은 부분과 테이블 참조가 필요한 연산을DSP의 내부 데이터 메모리 영역에서 수행하여 소요시간을 단축하였으며, 음성신호 및 비트스트림의 입출력에는 background DMA(direct memory access) 방식을 이용하였다. 이와 같은 최적화결과 2kbps 및 4kbps의 비트율에서 압축 및 복원을 실시간으로 수행할 수 있다.

  • PDF

다중 레벨 변복조 기법을 사용한 TDMA 방식의 WLL 모뎀 개발

  • 이성춘;류재호;황성수;이용환
    • 정보와 통신
    • /
    • 제16권10호
    • /
    • pp.64-74
    • /
    • 1999
  • 무선 채널에서 제한된 주파수 대역폭을 최대로 활용하여 비디오 데이터를 전송하기 위해서는 고효율의 변복조 기법, 페이딩 보상 기업 및 효율적인 오류 정정 기법이 요구된다. 본 고에서는 RF 주파수가 2GHz 대역이고 주파수 대역폭이 200 KHz를 갖는 TDMA 방식에 의한 WLL 모뎀(이하 AdWiLL$^{TM}$이라 한다) 설계에 대하여 기술한다. AdWiLL$^{TM}$모뎀의 핵심 기술로는 채널 특성을 실시간으로 분석하여 최적의 송수신 조건을 결정하는 channel probing 기술, 페이딩 환경에서 다중 레벨 QAM변복조를 가능하게 하는 적응출력제어 기술, WLL전파 환경과 서비스가 고려된 연접 부호(concatenated coding)를 통한 순방향 오류 정정(FEC) 기술, 송수신 성능 향상을 위한 범포밍 기술이 포함된다. 구현된 모뎀으 고정 무선 채널 환경에서 16 채널에서 32Kbps ADPCM 음성 신호를 동시에 송신할 수 있으며, 협대역 ISDN에서 제공하는 전송속도로 비디오 데이터의 전송이 가능함을 보였다.

  • PDF

음성 인식을 위한 개선된 평균 예측 LMS 필터를 이용한 DNN 기반의 강인한 음성 특징 추출 및 신호 잡음 제거 기법 (DNN based Robust Speech Feature Extraction and Signal Noise Removal Method Using Improved Average Prediction LMS Filter for Speech Recognition)

  • 오상엽
    • 융합정보논문지
    • /
    • 제11권6호
    • /
    • pp.1-6
    • /
    • 2021
  • 음성 인식 분야에서 DNN이 적용됨에 따라 음성 인식의 이용이 증대되고 있으나 기존의 GMM 보다 병렬 훈련에 대한 계산의 양이 많아야 되며, 데이터의 양이 적으면 오버피팅이 발생한다. 이를 해결하기 위해 데이터의 양이 작은 경우에도 강인한 음성 특징 추출과 음성 신호 잡음 제거에 효율적인 방안을 제시한다. 음성 특징 추출은 음성에 대한 프레임 에너지의 차이와 음성 신호에 영향을 받는 영 교차율과 레벨 교차율을 적용하여 음성 에너지의 효율적 추출을 한다. 또한, 잡음 제거를 위해 음성 신호에 대한 검출에서 음성의 고유 특성을 유지하면서 음성 정보 손상이 적은 평균 예측 LMS 필터를 개선하여 음성 신호의 잡음을 제거하여 데이터양이 적은 경우의 문제를 해결한다. 개선된 LMS 필터는 입력 신호에 대한 활성 파라미터 임계치를 조정하여 입력된 음성 신호에 대한 잡음을 처리하는 방법을 사용한다. 본 논문에서 제안한 방법을 사용하여 기존의 프레임 에너지를 이용한 방법과 비교한 결과 음성의 시작점의 오차율은 7%, 끝나는 점 오차율에서 11% 향상된 성능을 확인하였다.

강인한 음성인식을 위한 통계적 특징벡터 추출방법의 개선 (An Improvement of Stochastic Feature Extraction for Robust Speech Recognition)

  • 김회린;고진석
    • 한국음향학회지
    • /
    • 제23권2호
    • /
    • pp.180-186
    • /
    • 2004
  • 음성 신호에 존재하는 잡음은 음성 인식기의 성능을 현저하게 감소시킨다. 이것은 잡음이 훈련 조건과 인식 조건 사이의 불일치를 가져오기 때문이다. 본 논문에서는 이러한 불일치를 최소화하기 위해서 통계적 특징벡터의 추출방법을 개선하기 위한 방법을 연구하였다. 밴드 SNR에 따라 잡음 스펙트럼의 차감 레벨을 조절하는 기존의 멀티 밴드 잡음 차감법 (MSS)을 개선하기 위하여 잡음 정규화 상수를 이용하여 잡음 스펙트럼의 차감 레벨을 보다 정확하게 조절하는 방법 (M-MSS)을 제시하였다. 다음으로, 기존의 통계적 특징벡터 추출방법 (SFE)에서 잡음 차감법을 파워 스펙트럼 영역에 적용함으로써 성능을 개선하였다(M-SFE). 마지막으로, 위의 두 가지 방법의 장점을 결합하기 위해서 밴드 SNR에 근거한 통계적 특징벡터 추출방법 (MMSS-MSFE)을 제안하였다. 제안된 방법들은 다양한 잡음 환경 하에서 화자독립 고립 단어 인식으로 성능을 평가하였다. 기본적인 잡음 차감법 (SS)에 비하여 M-MSS, M-SFE와 MMSS-MSFE의 평균 에러율은 각각 18.6%, 15.1%와 33.9% 감소하였다. 위의 결과로부터 제안한 방법이 잡음에 강인한 음성인식을 위해 매우 효과적임을 입증하였다.

SOLA를 이용한 더빙 신호의 시간축 동기화 (Time-Synchronization Method for Dubbing Signal Using SOLA)

  • 이기승;지철근;차일환;윤대희
    • 방송공학회논문지
    • /
    • 제1권2호
    • /
    • pp.85-95
    • /
    • 1996
  • 본 논문에서는 음성 신호의 시간축 변화에 널리 사용되고 있는 SOLA(Synchronized Over-Lap and ADD)기법을 사용하여 더빙된 신호를 본래의 음성 신호와 시간적으로 일치시키는 기법을 제안하였다. 방송 녹음의 경우, 큰 레벨의 배경 잡음등으로 인하여 스튜디오에서의 재녹음이 필요한 경우가 발생하게 된다. 이러한 재녹음 신호는 원래의 녹음 시간과 비교하여 대략 200msec의 시간차이를 갖게 되며, 이러한 시간차이는 화면과 음성과의 합성시 입모양이 서로 불일치하는 현상을 야기시킨다. 본 논문에서는 이러한 문제점을 해결하기 먼저 에너지궤적을 통해 원녹음 신호와 더빙 신호간의 어절 시작점을 서로 일치시키고, 어절내의 음소 위치를 동기화시키기 위하여 LPC 켑스트럼 분석과 DTW(Dynamic Time Warping)을 적용하였다. 음소가 서로 일치하는 지점은 원래의 녹음 신호와 더빙된 신호간의 LPC켑스트럼 자승 오차가 취소로 되는 지점을 탐색함으로서 결정된다. 음성의 합성시에는 인접 프레임간의 위상 관계가 서로 일치하도록 SOLA 방법을 사용하였다. 컴퓨터를 이용하여 모의 실험을 수행한 결과, 제안된 알고리즘을 통해 시간축 보정된 음성 신호는 음성 파형, 스펙트로그램 및 청취상으로 원래의 녹음 신호와 시간적으로 서로 일치함을 확인할 수 있었다.

  • PDF

잡음환경하의 연속 음성인식을 위한 유사음소단위 분석 (An Analysis on Phone-Like Units for Korean Continuous Speech Recognition in Noisy Environments)

  • 신광호;임수호;서준배;김주곤;정호열;정현열
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
    • /
    • pp.123-126
    • /
    • 2004
  • 본 논문은 잡음환경 하에서의 효율적인 문맥의존 음향 모델 구성에 대한 기초연구로서 잡음환경 하에서의 유사 음소단위 수에 따른 연속 음성인식 성능을 비교, 평가한 결과에 대한 보고이다. 기존의 연구[1,2]로부터 연속음성 인식의 경우 문맥종속모델은 변이음을 고려한 39유사음소를 이용한 경우가 48유사음소를 이용하는 것보다 더 좋은 인식성능을 나타냄을 알 수 있었다. 이 연구 결과를 바탕으로 본 연구에서는 잡음환경에서도 효율적인 문맥 의존 음향모델을 구성하기 위한 기초 연구를 수행하였다. 다양한 잡음환경을 고려하기 위해 White, Pink, LAB 잡음을 신호 대 잡음비(Signal to Noise Ratio) 5dB, 10dB, 15dB 레벨로 음성에 부가한 후 각 유사음소단위 수에 따른 연속음성인식 실험을 수행하였다. 그 결과, 39유사음소를 이용한 경우가 48유사음소를 이용한 경우보다 clear 환경인 경우에 약 $7\%$$17\%$ 향상된 단어인식률과 문장 인식률을 얻을 수 있었으며, 각 잡음환경에서도 39유사음소를 이용한 경우가 48유사음소를 이용한 경우보다 평균 적으로 $17\%$$28\%$ 향상된 단어인식률과 문장인식률을 얻을 수 있어 39유사음소 단위가 한국어 연속음성인식에 더 적합하고 잡음환경에서도 유효함을 확인할 수 있었다.

  • PDF

에너지와 인근 피치간에 유사도를 이용한 잡음레벨 검출에 관한 연구 (A Study on the Noise-Level Measurement Using the Energy and Relation of Closed Pitch)

  • 강인규;이기영;배명진
    • 음성과학
    • /
    • 제11권3호
    • /
    • pp.157-164
    • /
    • 2004
  • Human has average pitch-level when speak naturally. That is 'Habitual pitch level'. However, if noise added at speech, the pitch-wave is changed irregularly. We can estimate noise level of speech by using this point. This paper calculates energy level of the input speech, pitch period from of above limited energy level by NAMDF (Normalized Average Magnitude Difference Function) method, after cut each frame by pitch period unit, and propose a method that estimate noise level through closed pitch of input speech.

  • PDF

우수한 교실음향 구현을 위한 설계기준 및 개선방향조사

  • 정정호
    • 방재기술
    • /
    • 통권42호
    • /
    • pp.17-25
    • /
    • 2007
  • 쾌적하고 명료성이 높은 교실내의 음향환경은 학생들의 학업 성취도 및 교사의 언어전달 이해 향상을 이룩할 수 있는 중요한 사항이다. 이러한 우수한 교육환경을 위해서는 우선 우리나라의 교실 음향 실태 파악과 함께 교육시설의 음향상태 및 소음에 의한 학업 성취도, 심리적, 사회적 영향에 대한 정량적 조사가 이루어 져야 한다. 국내 교육시설의 음향 실태 파악을 통해 교육시설에서의 음향 및 소음 기준을 수립하여 교육시설내의 음환경 개선을 추진해야 한다. 교실 음향개선을 합리적으로 평가할 수 있는 지표로서 잔향시간과 배경소음이 가장 중요한 요소로 알려져 있다. 교실의 우수한 음환경을 위해 적절한 잔향시간은 $0.4\sim0.6$초, 배경소음은 NC-$25\sim30$수준이 확보되어야 하는 것으로 조사되었다. 또한 교사의 음성레벨과 배경소음과의 비(S/N비)는 최소 10 dB이상 되어야 강의 내용 전달이 가능하며, 각종 기계설비에서 발생되는 소음 및 진동은 저소음 기기 선정을 통해 최소화하여야 한다. 인접 실에서 발생되는 소음을 충분히 차단하기 위해서는 차음성능 우수한 구조의 벽계로 개선되어야 하며, 기밀성이 높은 출입문사용과 적절한 출입구 배치를 통해 인접한 교실로의 소음 전달을 최소화 할 수 있다.

  • PDF