통합 검색 | Korea Science

음성 압축기를 사용한 통신 시스템에서의 음성 인식 성능 분석 (Performance Analysis of Speech Recognition in Communication Systems using Speech Coder)

한상욱;정희석;박호종
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
- /
- pp.179-182
- /
- 2002
본 논문에서는 음성 압축기를 사용하는 디지털 이동통신 환경에서 한글 음성 인식기의 성능을 분석하기 위하여 다양한 표준 음성 압축기를 이용하여 음성 압축기의 구조, 전송률, 전송 채널의 에러율에 대한 성능을 측정하여 비교하였다. 동일한 구조의 음성 압축기에 대하여 전송률의 증가에 따라 음성 인식률이 증가하지만, 음성 압축기의 구조에 따라 동일 전송률에서도 많은 성능 차이가 발생하는 것을 확인하였다. 특히 IS-127 EVRC의 인식 성능이 매우 떨어지는 것을 알 수 있고, EVRC의 잡음 제거기와 가변 전송률에 의하여 음성 인식 성능이 저하되는 것을 확인하였다. 이를 통하여 청취 음질과 음성 인식 성능 사이의 상관 관계가 높지 않는 것을 알 수 있다. 모든 음성 압축기에 대하여 채널 에러율과 음성 인식기의 성능은 매우 밀접한 관계가 있음을 확인하였고, 평균적으로 채널 에러율 $1.0\%$에서 인식률이 $0.6\%$ 감소하고, 에러 $5.0\%$에서 인식률이 $1.8\%$ 감소한다.
PDF

수중 MANET에서 VoIP 트래픽의 전송 성능 (Transmission Performance of VoIP Traffics on Underwater MANET)

김영동
- 한국전자통신학회논문지
- /
- 제11권12호
- /
- pp.1187-1192
- /
- 2016
수중 MANET의 설계, 구축 및 운용에서 전송성능의 측정 및 분석은 네트워크 차원의 전송 파라미터를 중심으로 수행됨에 따라 성능 분석 결과가 네트워크 수준의 성능에 국한되고 있어 사용자 수준의 전송품질과 관련한 전송성능을 분석 고찰하기에는 미흡한 점이 있다. 본 논문에서는 수중 MANET에서 네트워크 수준의 전송성능 분석의 단점을 보완하고자 사용자 수준에서 요구되는 응용트래픽 관점에서 전송성능을 분석한다. 수중 MANET에서 활용도가 증가할 것으로 예상되는 음성트래픽을 대상으로 전송성능을 분석하고, MOS, CCR 및 EED 등의 음성 전송품질 요구조건에 적합한 수중 MANET 조건을 제시한다. 본 연구는 NS-2를 기반으로 구축된 컴퓨터 시뮬레이션을 사용하여 수행하며, 음성 트래픽으로는 VoIP 규격을 사용한다.
https://doi.org/10.13067/JKIECS.2016.11.12.1187 인용 PDF KSCI

이중 모드 G.723.1 음성부호화기에 의한 DTMF 톤 전송성능 개선 (An Imporvement of DTMF Tone Transmission Based on Dual Mode G.723.1 Vocoder)

허호영
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 1998년도 학술발표대회 논문집 제17권 2호
- /
- pp.415.1-418
- /
- 1998
G.723.1은 부호화 방식은 제한된 계산량으로 낮은 전송율에서 음성을 가장 잘 표현할 수 있도록 최적화되어 있어서, 음성주파수 대역에 있는 DTMF톤의 경우 왜곡이 발생되어 전송성능이 떨어지는 문제점이 있다. 본 논문에서는 DTMF톤의 투명한 전송을 위해 LSP 계수를 이용한 톤 신호 검출에 기반을 둔 음성모드와 톤모드의 이중모드를 가지는 변형된 G.723.1 음성부호화 방식을 제안한다. 제안된 방식에서 음성모드 부호화기는 기존의 방식과 동일하며, 톤모드의 경우 부호화 단계에서 spectral smoothing 및 피치주기 검출 방식 등을 수정함으로써 수신단의 변경없이 DTMF톤의 전송왜곡을 개선시킨다. 본 논문에서는 컴퓨터 모의실험을 통해 제안된 방법이 DTMF 전송성능을 개선시킴을 확인하였다.
PDF

Joint CDMA/PRMA의 성능향상 기법에 관한 연구

국광호;이강원;박정우;강석열
- 한국시뮬레이션학회:학술대회논문집
- /
- 한국시뮬레이션학회 2001년도 춘계 학술대회 논문집
- /
- pp.134-134
- /
- 2001
이동통신 망을 통한 멀티미디어 통신의 수요 급증으로, 차세대 이동통신 시스템에서는 패킷 교환에 기초한 망 구조가 사용될 것으로 예측된다. VOD(Voice Activity Detector)를 갖는 음성 단말은 데이터를 발생시키는 talk spurt(평균이 t$_1$인 지수분포를 따름)와 데이터를 발생시키지 않는 silence period(평균이 t$_2$인 지수분포를 따름)의 두가지 상태를 갖는 마코프 체인으로 모델링된다. Goodman at. al.은 음성 단말들이 talk spurt동안만 데이터를 전송하게 함으로써 더 많은 가입자들을 수용할 수 있는 PRMA(Packet Reservation Multiple Access) 기법을 제안되었다. PRMA 방식에서는 시간 축이 슬롯들로 구성되며 여러개의 슬롯들로 프레임이 형성된다. Silence period 상태에 있던 음성 단말은 talk spurt 상태가 되면 talk spurt의 첫 번째 데이터를 하나의 슬롯을 통해 전송하게 된다. 이때 단말들은 각 슬롯에서 데이터를 전송할 수 있는 확률을 나타내는 채널 접근 확률(channel access probability)에 의해 데이터를 전송하게 되며 전송에 성공하면 슬롯을 예약함으로서 다음 프레임부터는 동일한 위치의 슬롯을 통해 데이터들을 전송하게 된다. DS/CDMA(Direct Sequence/code Division Multiple Access)는 이동통신 단말의 수용 용량상의 이점, 소프트 핸드오버 능력, 보다 용이하게 셀 계획을 세울 수 있는 점 등에 의해 차세대 이동통신 망에서 채택될 예정이다. CDMA 시스템은 간섭(interference)에 의해 용량이 제한을 받게 되며, MAI(Multiple Access Interference)가 시스템의 성능에 많은 영향을 미치게 된다. Brand, et. al.은 간섭의 분산을 줄이기 위해 PRMA 개념을 DS/CDMA 환경으로 확장한 Joint CDMA/PRMA 프로토콜을 제안하였다. 이때 각 슬롯에서의 데이터 전송확률을 그 슬롯에서 예약상태에 있는 음성 단말의 수에 의존하게 하는 방식을 사용하였으며 데이터 전송확률을 나타내는 채널 접근 확률들을 시뮬레이션을 통해 유도하였다. 한편 음성 단말에게는 실시간 서비스를 제공해 주어야 하는 대신 데이터 단말에게는 실시간 서비스를 제공해 주지 않아도 되므로, 트래픽이 많을 때에는 음성 단말의 데이터 전송에 우선권을 주는 것이 바람직하다. 이를 위해서 Brand, et. al.은 채널 접근 확률을 각 슬롯의 트래픽 상태에 따라 적응적으로 산출하는 기법을 제안하였다. 본 연구에서는 Joint CDMA/PRMA의 성능이 채널 접근 함수의 효율성에 많이 의존하게 되므로 보다 효율적인 채널 접근 확률을 구하는 방법을 제안한다. 즉 채널 액세스 확률을 각 슬롯에서 예약상태에 있는 음성 단말의 수뿐만 아니라 각 슬롯에서 예약을 하려고 하는 단말의 수에 기초하여 산출하는 방법을 제안하고 이의 성능을 분석하였다. 시뮬레이션에 의해 새로 제안된 채널 허용 확률을 산출하는 방식의 성능을 비교한 결과 기존에 제안된 방법들보다 상당한 성능의 향상을 볼 수 있었다.
PDF

블루투스 네트워크 환경에서의 효율적인 음성전송 시스템 구현 (Implementation of an Efficient Voice Transmission System in Bluetooth Network Rnvironments)

김명종;박지훈;김홍국
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송공학회 2008년도 동계학술대회
- /
- pp.125-128
- /
- 2008
IPTV의 상용화에 맞추어 사용자와 TV간의 정보 교환에 의한 대화형 서비스들이 제공되고 있으며, 특히 음성인식 기술은 이러한 서비스를 실현하기 위한 중요한 기술 중의 하나로 대두되고 있다. TV에서의 음성인식 수행을 위해서는 가정환경과 같은 제한된 공간에서 효율적으로 사용자의 음성을 TV에 전송할 수 있는 근거리 무선통신 수단이 필요하게 된다. 특히, 리모트 컨트롤러와 같은 저전력 시스템 환경에서 구현이 가능해야 한다. 따라서 이러한 제한된 조건에서 최적의 성능을 갖는 음성 전송 시스템 개발이 요구되고 있다. 본 논문에서는 블루투스 환경 하에서 음성인식을 위해 필요한 음성전송 시스템을 실시간 구현한다. 효율적인 음성전송을 위해 G.711을 기본 코덱으로 사용하며, 음성전송 시 발생하는 패킷손실에 따른 음성 품질 저하를 줄이기 위해 G.711 패킷손실 은닉 알고리즘을 음성전송 시스템에 적용한다. 특히 G.711 패킷 손실 은닉 알고리즘 수행을 위해 블루투스 프로토콜 스택application layer에 RTP 프로토콜을 적용하여 패킷 손실 여부를 확인하고, 패킷 손실 발생 시 패킷손실 은닉 알고리즘을 통해 음성의 품질 저하를 줄인다. 구현된 시스템의 성능을 평가한 결과, G.711 패킷 손실 알고리즘을 적용하여 2~10%의 패킷손실 환경에서 14.7%의 음질개선을 얻을 수 있었다.
PDF

낮은 전송률 음성 부호화 연구 동향 (Trends of Low Bit-Rate Speech Coding)

강홍구
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
- /
- pp.27-30
- /
- 1995
음성 신호를 압축한 후, 주관적 왜곡 없이 복원하기 위한 부호화 연구는 대역 제한된 채널에 적용하기 위해 전송률을 더욱 낮추기 위한 연구 분야와 전송률은 높더라도 복잡도 및 성능 면에서 효과적인 연구 분야로 나눌 수 있다. 본 논문에서는 기존 시스템의 절반에 해당하는 전송률에서도 비슷한 성능을 유지함으로써 디지털 셀룰라 표준화안으로의 가능성이 가장 높은 음성 부호화 방법들에 대해 비교 설명하고, 전송률을 좀 더 낮추기 위해 진행되고 있는 새로운 연구 경햐에 대해 고찰한다. 또한, 전송률은 높더라도 기존 방법에 비해 복잡도는 매우 낮은 부호화기에 대한 설명을 통해 향후 연구 방향에 대해 언급하고자 한다.
PDF

가상 셀룰라 망(VCN)에서의 음성 패킷 지연 특성 (Delay characteristics of speech packets in virtual cellular network(VCN))

정명순;김화종
- 한국통신학회논문지
- /
- 제23권9A호
- /
- pp.2305-2312
- /
- 1998
본 논문에서는 Virtual Cellular Network(VCN)을 사용하는 무선 통신망에서 음성 패킷의 지연 특성을 분석하였다. 주기적으로 발생하는 음성 패킷이 슬롯-알로하 프로토콜로 전송될 때의 전송 특성을 Markov Chain으로 모델링하여 정상 상태(steady state)에서의 지연 확률 분포를 구하였고, 무선 채널의 평균 수신확률(prbability of capture), 재전송 방식 등이 성능에 미치는 영향을 분석하였다. 이를 위하여 무선 단말기의 수신 확률의 변화에 따른 음성 패킷의 전송 지연 누적 확률 함수를 구하였다. 재전송 방식의 평균 backoff 시간이 성능에 미치는 영향을 알아보기 위해 음성 패킷 발생 주기(N 슬롯시간)당 평균 재전송 횟수, NPr을 파라미터로 정의하였으며 여러가지의 프레임 크기 N에 대하여 1% outage delay를 비교하였다. 성능 실험 결과 NPr의 최적의 범위는 4~7임을 알 수 있었다. 따라서 프레임 크기 N이 주어졌을 때의 재전송 시도 확률 Pr을 구할 수 있다. 또한 전송큐의 크기가 유한함으로써 발생하는 blocking 확률과 전송큐의 적절한 크기를 구하였다.
PDF

VoIP의 음성품질/대역효율 개선을 위한 음성패킷 처리 (Voice Packet Processing Scheme for Voice Quality and Bandwidth Efficiency in VoIP)

김재원;손동철
- 한국멀티미디어학회논문지
- /
- 제7권7호
- /
- pp.896-904
- /
- 2004
본 논문에서는 10msec 프레임의 가변전송률 G.729 음성부호화기를 설계하여 VoIP에서의 대역 효율을 개선하고, 부전송률 부호화기 도입을 통한 인터넷 프로토콜에서 발생하는 패킷 손실구간의 음성 품질을 개선할 수 있는 방안을 도출하였다. 가변 전송률 음성부호화기 설계는 음성 통화중 발생하는 약 60% 정도의 묵음 구간을 활용하는 기법으로서 활성 음성구간은 8kbps로 전송하고,비 활성 음성구간은 1kbps로 전송함에 의하여 고정 전송률 방식의 음성 부호화기에 비하여 평균 패킷 전송량을 약 50% 감소시켜 대역 효율을 개선할 수 있다. 제안 방법의 성능은 동일 프레임 크기를 갖는 ITU-T G.729B방식과 감지 활성도의 변화분과 음성품질 손상 구간의 비율을 기준으로 비교 평가하였다. 그리고 인터넷 환경에서의 패킷 손실에 의한 음성 품질 저하 방지는 4kbps 부전송률 음성부호화기 도입과 오류 발생 전후의 패킷에 의한 오류은닉 방법을 활용하였으며, 성능은 재생 음성품질로서 평가하였다. 본 논문에서 설계한 가변 전송률 부호화 방식은 고정 전송률 방식에 대비하여 평균 음성 패킷의 전송량을 1/2로 감소시켜 대역효율 개선이 가능하며, 감소된 전송률을 손실 패킷구간에 활용하는 경우 8kbps 고정 전송률 방식과 동일 대역이용에서 3dB의 음성품질 개선이 가능하여 VoIP 성능 개선이 가능하리라 사료된다.
PDF

FDDI 음성/데이타 집적 전송에서의 성능 분석에 관한 연구 (A Study on the Performance Evaluation for the Integrated Voice/Data Transmission with FDDI)

홍성식;박호균;이재광;류황빈
- 한국통신학회논문지
- /
- 제17권3호
- /
- pp.277-287
- /
- 1992
본 논문에서는 음성 트래픽을 동기 모드로, 데이타 트래픽을 비동기 모드로 집적시켜 전송하는 FDDI 통신망에 대하여 수학적 분석과 시뮬레이션을 수행하여 성능을 분석 한다. 음성과 데이타의 평균 패킷 대기 시간을 구하기 위하여, 음성은 Marcov 모델에서 발음 부분과 묵음 부분이 교대로 나타나는 모델로 하며, 데이타는 TRT와 TTRT의 차이 시간동안 전송하는 모델로 하는 경우, 음성과 데이타의 패킷 대기 시간을 구하여 동기모드와 비동기 모드 사이의 전송관계에 대하여 연구하였다. 연구 결과 동기/ 비동기 집적 방식으로 음성과 데이타를 집적하여 전송하여도 음성 채널 용량의 제약없이 데이타를 집적 시킬 수 있었으며, 데이타 전송도 작은 대기 시간내에 신속하게 전송할 수가 있었다.
PDF

USAC 의 DAB+ 전송 방안에 관한 연구 (A Study on the USAC Transport Mechanism for Digital Audio Broadcasting Plus)

양규태;백승권;이봉호;임형수
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송공학회 2015년도 하계학술대회
- /
- pp.28-31
- /
- 2015
본 논문에서는 음성 및 음악 모두에 대해 최고의 품질을 제공하는 최신 오디오 코덱인 USAC 을 DAB+에 적용하기 위한 전송 방안을 제안한다. 기존 DAB+는 AAC+ v2 로 불리는 HE-AAC v2 (High Efficiency Advanced Audio Coding version 2) 오디오 코덱을 사용하였다. 하지만 AAC+ v2 는 낮은 데이터 전송률에서 음악에서는 좋은 품질을 제공하나 음성에서는 상대적으로 품질이 떨어지는 단점이 있다. 반면 USAC 은 낮은 데이터 전송률에서 음악 및 음성에 모두 좋은 품질과 높은 압축 성능을 제공할 수 있는 최신 오디오 코덱 기술이다. USAC 의 성능을 최대한 보장하기 위해서는 DAB+와 달리 VBR 을 적용하는 효과적이다. 따라서 본 논문에서는 USAC VBR 스트림을 DAB+에 전송하는 방안을 제안한다. 제안된 전송 방안을 적용할 경우 최적의 음악 및 음성 품질을 효율적으로 제공할 수가 있다.
PDF

검색결과 337건 처리시간 0.023초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)