• 제목/요약/키워드: 음성압축

검색결과 218건 처리시간 0.046초

원격 진료를 위한 실시간 생체 신호 취득, 전송 및 압축, 저장 시스템의 설계 및 구현 (Design and Implementation of a Real-time Bio-signal Obtaining, Transmitting, Compressing and Storing System for Telemedicine)

  • 정인교;김영준;박인수;이인성
    • 전자공학회논문지SC
    • /
    • 제45권4호
    • /
    • pp.42-50
    • /
    • 2008
  • 본 논문에서는 원격 의료 서비스를 위한 생체 신호 취득 및 전송 시스템의 실시간 신뢰성을 보장하기 위하여 ZigBee와 SIP/RTP를 기반으로 하는 실시간 생체 신호 전송 시스템의 성능 개선 방법을 제안하고 구현하였다. 기존의 시스템은 ZigBee기반의 유비쿼터스 센서 네트워크를 기반으로 사용자의 ECG 및 기타 생체 신호를 수집한다. 이 때 연속된 ECG 전송에 의하여 채널이 과다하게 점유되어 ECG 이외의 생체 신호를 전송할 때 패킷의 손실이 발생한다. 또한 하나의 RTP 세션을 통해 사용자의 음성과 ECG 및 기타 생체 신호를 순차적으로 전송하기 때문에 과중한 전송 스레드 부하와 지연이 발생한다. 따라서 본 논문에서는 ECG 전송 모듈의 채널 점유 문제를 해결하기 위해 Bluetooth를 보조 전송 수단으로 사용하고 복수의 RTP 세션과 전송 스레드를 사용하여 전송지연을 감소시키는 방법을 사용하였다. 또한 이산 웨이블릿 리프팅과 다단계 벡터 양자화 기반의 압축 방법을 적용하여 전송 및 저장되는 ECG를 압축하여 관리하는 구조를 제안하고 구현하였다. ECG의 압축은 데이터의 전송량을 감소시켜 시스템의 실시간 신뢰성을 향상시키며 데이터베이스의 저장 공간을 효율적으로 사용할 수 있도록 한다. 결과적으로 기존의 시스템에 대하여 유비쿼터스 센서 네트워크의 안정성을 확보할 수 있었고 실시간 전송 모듈의 프로세스 점유율을 약 20% 감소시킬 수 있었으며 실제 측정한 ECG를 압축한 결과 25.6:1의 압축률에서 약 3.25%의 PRD를 가지는 효율적인 ECG 관리가 이루어질 수 있었다.

IMS망에서 PTT서비스의 통화 처리 성능 향상을 위한 프로토콜 압축 기법 (A Protocol Compression Scheme for Improving Call Processing of Push-To-Talk Service over IMS)

  • 정인환
    • 한국멀티미디어학회논문지
    • /
    • 제12권2호
    • /
    • pp.257-271
    • /
    • 2009
  • 본 논문에서는 유/무선 통합 패킷 망인 IMS(IP Multimedia Subsystem)에서 대표적인 응용 서비스인 PTT(Push-To-Talk) 서비스의 통화 처리 성능 향상을 위한 프로토콜 압축 기법을 제안한다. IMS망에서 PTT서비스를 하기 위해서는 현재 상용화 되어있는 Mobile망과 TRS(Trunked Radio System)망과 동일한 호 설정을 가져야 하며 다수의 단말기들 사이에 동일한 내용을 실시간으로 교환할 수 있어야하기 때문에 빠른 호 설정 및 통화 시에 대역특이 충분해야한다. 본 논문에서 제안한 A+SigComp기법은 PTT의 호 설정 프로토콜인 SIP의 세션 설정 단계의 지연 시간을 약 10% 줄였으며 A+ROHC기법은 음성 통화시 교환되는 RTP 헤더의 크기를 줄임으로써 전송 효율 약 5% 높였다.

  • PDF

어텐션 알고리듬 기반 양방향성 LSTM을 이용한 동영상의 압축 표준 예측 (Video Compression Standard Prediction using Attention-based Bidirectional LSTM)

  • 김상민;박범준;정제창
    • 방송공학회논문지
    • /
    • 제24권5호
    • /
    • pp.870-878
    • /
    • 2019
  • 본 논문에서는 어텐션 알고리듬 (attention algorithm) 기반의 양방향성 LSTM (bidirectional long short-term memory; BLSTM) 을 동영상의 압축 표준을 예측하기 위해 사용한다. 자연어 처리 (natural language processing; NLP) 분야에서 순환적 신경망 (recurrent neural networks; RNN) 의 구조를 이용하여 문장의 다음 단어를 예측하거나 의미에 따라 문장을 분류하거나 번역하는 연구들은 계속되어왔고, 이는 챗봇, 음성인식 스피커, 번역 애플리케이션 등으로 상용화되었다. LSTM 은 RNN에서 gradient vanishing problem 을 해결하고자 고안됐고, NLP 분야에서 유용하게 사용되고 있다. 제안한 알고리듬은 BLSTM과 특정 단어에 집중하여 분류할 수 있는 어텐션 알고리듬을 자연어 문장이 아닌 동영상의 비트스트림에 적용해 동영상의 압축 표준을 예측하는 것이 가능하다.

멀티채널 오디오 (MPEG-2) 부호화 기술 (Multi-Channel Audio Coding Technologies)

  • 홍진우
    • 전자통신동향분석
    • /
    • 제10권3호통권37호
    • /
    • pp.15-27
    • /
    • 1995
  • 멀티미디어에서 비디오의 품질이 향상되고, 디지털 텔레비젼 (ADTV)이나 고선명 텔레비젼(HDTV) 등의 개발에 의해 화면 크기가 증가하면서 이에 어울리는 실감있는 오디오의 전송 및 재생이 요구된다. 따라서 멀티채널 오디오의 도입과 더불어 효율적이고, 경제적인 방법으로 낮은 비트율로 고품질의 멀티채널 오디오를 제공하기 위한 부호화 기술이 필요하게 된다. 최근에 인간의 청각 특성을 고려한 심리음향 모델을 이용한 멀티채널 오디오의 압축 부호화 기술이 MPEG-2 오디오의 국제 표준으로 제정되었다. MPEG-2 오디오 표준은 MPEG-1 오디오 표준을 기초로 하여 현장감을 필요로 하는 오디오를 위해 기본 스테레오 채널외에 중앙채널, 서라운드 채널, 그리고 저주파 효과채널을 부가한 방식으로 다채널, 음성다중 등의 부가서비스를 제공하기에 적합하다. 본고에서는 MPEG-2 오디오 표준의 계층 II를 중심으로 한 표준의 특징, 알고리즘, 데이터 구조, 그리고 응용분야 등에 대해 기술한다.

$OakDSPCore^{\circledR}$를 애용한 MPEG-I Layer 3 decoder 의 DSP 실시간 구현 (DSP real-time implementation of the MPEG-I Layer 3 decoder using $OakDSPCore^{\circledR}$)

  • 하호진;강상원
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 2호
    • /
    • pp.151-156
    • /
    • 1999
  • 본 논문에서는 국제 표준화기구(ISO) 산하의 동영상 전문가 그룹(MPEG)의 오디오 압축방법들중 하나인 MPEG-I layer 3 의 복호화기를 고정 소수점으로 변환한 후, $OakDSPCore^{\circledR}$를 기반으로 전 과정을 어셈블리어로 실시간 구현하였다. 실시간 구현에 사용된 $OakDSPCore^{\circledR}$는 DSP Group사에서 개발된 저전력 소비형 16-비트 고정 소수점 DSPCore로서 40MIPS의 성능을 가지고 있으며, 음성/오디오, 통신, 디지털 셀룰라폰 같은 소비자의 맞게 ASIC화할 수 있는 장점을 가지고 있다. 구현된 MP3 복호화기는 약33 MIPS의 복잡도를 나타내며, 사용된 메모리양은 프로그램 ROM 3.1K words, 데이터 ROM(table) 10.82K words 및 ROM 6.1K words이다. 구현된 MP3 복호화기는 OMNI-MEDIASOUND에서 제공하는 4개의 test 벡터들을 bit-exact하게 통과하였다.

  • PDF

Wavelet Packet을 이용한 고압축신호 개선에 관한 연구 (A Study on High-Compressed Signal Enhancement using Wavelet Packet)

  • 민웅규;장성욱;양성일;권영헌
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 2호
    • /
    • pp.85-88
    • /
    • 1999
  • Adapted Local Trigonometric Transforms은 매우 높은 energy compaction을 가지므로 음성 및 영상신호에 이용하려는 시도가 이루어지고 있다. [1] 그러나 이 경우 복원 된 신호에는 시간 영역에서 불연속점이 발생하여 일종의 tick noise가 발생한다. 또한 phase성분을 잃게 되어 금속성 잡음도 추가하여 나타난다. 본 논문에서는 이러한 문제점을 해결하기 위한 Polynomial fitting 방식과 Wavelet Packet Transforms 방식을 제안한다. Polynomial fitting 방식으로는 시간축상에서 발생하는 문제를 해결하고 Wavelet Packet Transforms으로 Phase 문제를 해결한다. [2,3] 실험결과, 압축이전의 신호와 비교할 때 SNR에 있어서 개선을 보이며 tick noise와 금속성 잡음이 제거된 개선된 신호음을 확인 할 수 있었다.

  • PDF

음성신호의 압축원리를 이용한 사운드 마스킹 효과로 음향 환경 최적화 (Optimize the Acoustic Environment Using a Sound Masking Effects of the Audio Signal Compression Principle)

  • 안숙향
    • 한국전기전자재료학회논문지
    • /
    • 제28권11호
    • /
    • pp.748-751
    • /
    • 2015
  • Sound Masking System technology as by sound the same on all bands and artificially generates a constant sound shield People want to hear or recognize the people with the noise generated from the interior of the way. Prevent hearing or prevent recognition by using the technology to control the audible frequency band Continue to emit constant and uniform shielding sound audible frequency band Even the security content of speech (20 Hz~20 KHz). That interception laser eavesdropping, internal solicitations, during recording Or delay the decoding was a result of the effect of interference calculated Experience noise disturbance index is applied around the Stress Index is the average index is 10.16 was a luxury for the average index is then applied to the index 3.07 Noise is significantly lower stress level has improved noise conditions.

심리음향모델을 적용한 난청 보정 알고리즘의 연구 (The Study of the Sensorineural Hearing Loss Compensation Algorithm using Psychoacoustics Model)

  • 노형철;김헌중;한헌수;차형태
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.189-192
    • /
    • 2000
  • 본 논문에서는 청각 장애인의 보다 향상된 보청 환경을 조성하고자 청각손실을 심리음향 모델을 적용하여 감음 신경성 난청을 보정하는 알고리즘을 제안한다. 제안한 알고리즘에서는 난청의 유형은 내이에서부터 중추 뇌에 걸친 감음계와 신경계의 장애에서 비롯되는 감음신경성 난청(sensorineural hearing loss)으로 주파수 영역상에서 MTH(minimum hearing threshold)가 균일하지 않게 상승하게되어 가청영역이 좁아지는 문제점을 해결하기 위한 방법으로 각각의 주파수 밴드마다 멀티밴드 압축 알고리즘을 적용하였다. 그러나 이 경우 각각의 주파수 밴드에 따른 서로 다른 가청 영역의 영향에 의한 변형된 스펙트럼 모양으로 인해 spectral contrast reduction과 변형된 마스킹 특성으로 인해 음성 변별력에 제한을 가하게 된다. 이것은 주변 주파수 성분들에 의한 마스킹 효과에 의한 것으로, 신호에 대한 난청인이 느끼는 지각 영역(perceptual domain)에서의 해석과 심리음향 모델 파라미터를 통한 보청기의 개발이 이루어져야 하며, 본 논문에서 그 알고리즘을 적용하였다.

  • PDF

TMS320C6701 DSP를 이용한 MPEG-4 오디오 HVXC 코덱의 실시간 구현 (Real-time Implementation of HVXC codec conforming to MPEG-4 audio using TMS320C6701 DSP)

  • 강경옥;홍진우;김진웅;나훈;정대권
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1999년도 학술대회
    • /
    • pp.261-266
    • /
    • 1999
  • 본 논문에서는 인터넷 폰이나 디지털 이동통신에서와 같이 낮은 비트율이 요구되는 응용분야에서 사용될 수 있는 HVXC 부호화 및 복호화 알고리즘을 TMS320C6701 160MHz DSP를 사용하여 실시간 동작을 구현한 내용을 기술한다. 사용한 최적화 방법으로는 기본적으로 연산 시간이 많이 소요되는 함수 루틴에 대한 C 언어레벨의 최적화 및 어셈블리어 레벨의 최적화를 수행하였고, TMS320C6701 DSP 내부 프로그램 메모리를 프로그램 캐쉬로 사용하였다. 또한, 계산량이 많은 부분과 테이블 참조가 필요한 연산을DSP의 내부 데이터 메모리 영역에서 수행하여 소요시간을 단축하였으며, 음성신호 및 비트스트림의 입출력에는 background DMA(direct memory access) 방식을 이용하였다. 이와 같은 최적화결과 2kbps 및 4kbps의 비트율에서 압축 및 복원을 실시간으로 수행할 수 있다.

  • PDF

OakDSPCore$\circledR$를 이용한 MP3 복호화기의 실시간 구현 (Real-time implementation of the MP3 decoder using ODSPCore$\circledR$)

  • 하호진;강상원
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1999년도 학술대회
    • /
    • pp.59-63
    • /
    • 1999
  • 본 논문에서는 국제 표준화기구(ISO) 산하의 동영상 전문가 그룹(MPEG)의 오디오 압축방법들중 하나인 MPEG-I layer 3의 복호화기를 고정 소수점으로 변환한 후, OalkDSPCore$\circledR$를 기반으로 전 과정을 어셈블리어로 실시간 구현하였다. 실시간 구현에 사용된 OakDSPCor$\circledR$는 DSPGroup사에서 개발된 저전력 소비형 16-비트 고정소수점 DSPCore로서 40MIPS의 성능을 가지고 있으며, 음성/오디오, 통신, 디지털 셀룰라폰 같은 소비자의 맞게 ASIC화할 수 있는 장점을 가지고 있다. 구현된 MP3 복호화기는 약33 MIPS의 복잡도를 나타내며, 사용된 메모리양은 프로그램 ROM 3.1Kwords, 데이터 ROM(table)10.82Kwords 및 RAM6.1Kwords이다. 구현된 MP3 복호화기는 OMNI-MEDIASOUND에서 제공하는 4개의 test 벡터들을bit-exact하게 통과하였다.

  • PDF