• 제목/요약/키워드: 음성 코딩

검색결과 127건 처리시간 0.028초

효율적인 데이터 통신을 위한 Sliding Window 크기에 따른 패킷 헤더 압축 성능 개선 방안 (Performance of Packet Header Compression with Sliding Window Size for Efficient Data Communication)

  • 차혜진;김강석;홍만표
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.187-189
    • /
    • 2014
  • 패킷 네트워크에서 음성, 영상 트래픽이 IP, UDP, RTP 를 이용하여 전송 될 때 중복 헤더가 사용되어 통신의 비효율을 초래한다. 이를 방지 하기 위해 ROHC(Robust Header Compression)가 적용된다. 이는 인접 패킷 헤더 간의 차이 값이 규칙적으로 증가하는 영역은 그 차이 값만을 전송한다. 차이 값은 WLSB 인코딩 과정을 거쳐 전송이 되는데 인코팅 시 Sliding Window 값이 사용된다. Sliding Window 크기에 따라 헤더 압축률이 변하고 대역폭에도 영향을 미치게 된다. 본 논문에서는 효과적인 Sliding Window 값을 구하여 기존 ROHC 에 적용 하여 네트워크 통신의 효율성을 향상 시키고자 한다.

뉴스에서 시멘틱 디코딩의 음성대화시스템을 위한 히든 벡터 상태 마코브모델의 상세설계 (A Detailed Design of Hidden Vector State Markov Model for Semantic Decoding of Spoken Dialogue System on News)

  • 레콩탄
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.339-342
    • /
    • 2012
  • Nowadays, Spoken Dialogue System is rapidly growing by investing a lot from researches as well as organizations. One of concrete evidences is that the appearance of commercial systems such as Siri, SVoice, DARPA, CLASSiC, GSearch etc. Moreover, Spoken Dialogue System is widely believed to be the future direction of software development. In Spoken Dialogue System, users interact to software by using their own voice instead of use their hands, keyboard, and mouse. This paper continuously presents our development of the Spoken Dialogue System on News. Particularly, we propose detailed design such as semantic concepts, semantic frames, slots, and so on for applying Hidden Vector State Model into our Spoken Dialogue System for Spoken Language Understanding.

LVDS를 이용한 daisy-chain 방식의 다중 LCD 시스템 개발 (Multiple LCD System Development of daisy-chain Method using LVDS)

  • 김재철
    • 한국정보통신학회논문지
    • /
    • 제16권12호
    • /
    • pp.2747-2754
    • /
    • 2012
  • 본 논문에서 PC 컨텐츠의 활용을 극대화시키는 부가기능을 갖는 다중 LCD(Liquid Crystal Display) 시스템을 개발하였다. 이는 host LCD와 slave LCD로 구성되어 있다. Host LCD는 NTSC(National Television System Committee), PAL(Phase Alternation Line), SECAM(S$\acute{e}$quentiel couleur avec m$\acute{e}$moire) 신호를 받아 영상 및 음성을 데코딩하여 출력한다. 이 데코딩된 신호들을 LVDS(Low Voltage Differential Signaling) 신호로 변환하여 slave LCD단으로 전송을 하는 기능을 갖는다. 그리고 CF 메모리, USB 메모리등을 장착하여 멀티미디어 데이터를 출력하도록 한다. Slave LCD는 host LCD와 달리 튜너부분이 없고 메모리 장착이 되지 않아 자체 TV 신호 수신 및 영상 신호 재생을 하지 못한다. 다만, LVDS 영상 신호를 받아 LCD 팬널에 출력하는 기능만 갖도록 한다. 본 논문에서 개발한 다중 LCD 시스템은 제품이 단순하여 상대적으로 고장률이 낮고, 가격이 저렴하고 제어부분의 간소화로 디스플레이의 전력이 낮으며, host LCD의 채널, 볼륨 및 영상 출력에 대하여 전체 slave LCD를 제어할 수 있는 제품으로서의 가격 및 기능 경쟁력을 갖추고 있다.

실시간 동시통번역의 정책기반 성능 비교 연구 (Policy-based performance comparison study of Real-time Simultaneous Translation)

  • 이정섭;문현석;박찬준;서재형;어수경;이승준;구선민;임희석
    • 한국융합학회논문지
    • /
    • 제13권3호
    • /
    • pp.43-54
    • /
    • 2022
  • 동시통번역은 문장의 일부만으로 번역을 시작하는 온라인 디코딩으로 지연 대비 번역 성능을 평가 지표로 사용한다. 동시통번역 연구의 공통의 목적은 지연 대비 번역 성능을 높이는 것으로, 지연과 번역 성능 사이의 적절한 절충점을 찾는 것이다. 본 논문은 이러한 동시통번역의 현재 연구 흐름을 반영하여 한국어에서 고정 정책 기반 동시통번역의 비교 실험을 진행하였다. 또한, 한국어에서 동시통번역은 토큰화 과정에서 많은 분절이 발생하여 다른 언어 대비 불필요한 지연이 발생하게 되고, 이를 해결하기 위한 n-gram 토큰화 방안 등의 후속 연구의 필요성에 대해 제시하였다.

인지 모델과 웨이블릿 패킷 변환을 이용한 잡음 제거기 설계 (Design of the Noise Suppressor Using the Perceptual Model and Wavelet Packet Transform)

  • 김미선;박서영;김영주;이인성
    • 한국음향학회지
    • /
    • 제25권7호
    • /
    • pp.325-332
    • /
    • 2006
  • 본 논문은 인지 모델과 웨이블릿 패킷 변환을 이용하여 단일 채널에서 유색잡음 또는 비정지적 성격의 잡음을 제거하는데 목적을 두고 있다. 이러한 잡음은 부대역을 나누어 접근해야하며, 잔여잡음과 음성의 왜곡으로 인한 문제를 해결하기 위해 웨이블릿 패킷 변환 후 웨이블릿 계수 문턱값을 적절히 개선해야 한다. 본 논문에서 부대역은 웨이블릿 패킷변환 후에 스케일과 임계대역을 매칭하여 설계하였으며, 웨이블릿 계수 문턱값은 세그멘탈 신호대잡음비 (seg_SNR)와 노이즈마스킹 임계값 (Noise Masking Threshold W)을 이용하여 적응적으로 계산했다. 결과적으로 TTA 표준인 EVRC 잡음 제거기와 유사한 성능을 가졌으며, 웨이블릿 변환 후 웨이블릿 계수에 Universal 문턱값을 적용하는 것보다 PESQ-MOS 값이 0.29 높았다. 인코딩과 디코딩 후 PESQ-MOS 값은 EVRC 잡음 제거기보다 0.23 정도 우수한 성능을 가졌다.

차량용 FM 부가 방송 수신 전광판의 구현 (The Implementation of Sign Board Receiving DARC for Vehicle)

  • 김남두;최재석;김영길
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2002년도 추계종합학술대회
    • /
    • pp.560-565
    • /
    • 2002
  • 본 논문은 FM 부가방송을 수신하여 다양한 정보와 사용자 문구 및 이미지를 전광판에 표시하고 GPS를 탑재하여 위치 기반의 정보를 음성 및 문구로 표시하는 시스템을 구현하였다. 기존의 전광판 시스템이 단순 광고만 반복하거나 다양한 정보를 휴대폰 망을 통해 수신하였지만 FM 부가방송을 수신하여 저렴하게 정보를 사용할 수 있다. 본 시스템은 6부분으로 구성이 되어있다. DARC는 정보의 종류, 뉴스, 증권, 기상, 시간에 따라 분류하고 분류된 데이터는 적당한 표시 시점에 표시된다. GPS는 위치정보와 방향정보 위성 정보를 수집하여 전달하고 이는 주 프로그램에서 연산되어 정보를 표출할 내용과 시점을 계산하게 된다. LED 전광판 제어를 위해 주 프로그램은 2개의 이미지 버퍼를 두고 이미지 엔진을 개발하여 여러 가지 효과 및 내용을 표시할 수 있게 했다. 외부 메모리에는 위치 기반의 정보 파일 출력될 내용의 편성 내용, 출력 방법을 저장하게 하고 이는 FAT 16방식으로 저장된다. 외부 메모리는 데이터 보관 및 시스템에 관계없이 정보를 사용할 수 있게 해준다. USB는 PC와의 통신경로로 사용되고 PC에 프로그램에 의해 본 시스템을 제어할 수 있게 해준다. 음성은 G72l의 음성 압축 방식을 사용하고 이를 소프트웨어적으로 디코딩하여 출력한다. 본 시스템은 차량에 설치되어 DARC에서 수신된 다양한 정보를 표출하고 위치에 따라 음성 및 전광판에 위치 기반 내용이 표시되는 것을 확인할 수 있었다.

  • PDF

주파수 도약 통신에 적합한 정보부호화 기법 (Information Coding Schemes for the Frequency Hopping Communication)

  • 박대철;김용선;한성우;전용억;전병민
    • 방송공학회논문지
    • /
    • 제4권1호
    • /
    • pp.32-43
    • /
    • 1999
  • 본 논문은 전파의 간섭이 심한 극한통신 상황에서 통신 정보의 감청, 방해를 극복하는 능력을 갖는 주파수도약 통신시스템을 이용하여 음성 및 데이터 정보를 안정적으로 전송할 수 있는 방법을 다루었다. 일반적인 FEC 및 비트 인터리빙 방법을 적용할 경우, 시스템이 복잡해지고 오류 정정 부호화 및 비트 인터리빙 처리에 많은 시간이 소요된다. 본 논문에서는 구조가 간단하면서 극한조건의 주파수도약통신 상황에서 음성 및 데이터를 무선간섭에 대처할 수 있도록 주파수도약 시스템에 적합한 부호화하는 정보 부호화 기법인 다수 오류 정정 기법 및 블록 인터리빙 기법이 제안되었다. 송신기에서 저속 데이터를 일정한 블록 단위로 반복 프레임을 구성하여 20Kbps 도약홉 프레임 셀을 전송하고 수신기에서는 블록 디코딩 및 majority 오류 정정 기법을 사용하여 도약 채널에서 발생되는 연집 오류 혹은 랜덤 오류를 정정한다. 제안한 방법을 정보부호화/복호화 처리 단축 및 계산 복잡도를 단순화시키면서 채널 극복 성능을 개선하였고 시스템 시험을 통하여 성능을 확인하였다.

  • PDF

윈도우가 적용된 자기상관에 의한 선형예측부호의 개선 (Improvement of the Linear Predictive Coding with Windowed Autocorrelation)

  • 이창영;이채봉
    • 한국전자통신학회논문지
    • /
    • 제6권2호
    • /
    • pp.186-192
    • /
    • 2011
  • 본 논문은 선형예측부호의 개선을 위한 새로운 과정을 제안한다. 코딩에 따른 오차를 줄이기 위하여, 신호에 윈도우를 적용하는 과정과 선형예측 과정의 순서를 바꾸었다. 이 처방은 윈도우를 적용한 자기상관을 이용하여 선형예측부호를 추출하는 것에 해당한다. 기존의 방법에서는 보다 적은 파라미터에 대해 레빈슨-더빈의 재귀적 계산법을 적용하는 것이 가능한 반면, 본 논문에서 제안된 방법에서는 더 많은 작업 파라미터에 대한 역행렬 계산이 필요하므로, 보다 긴 계산 시간이 요구된다. 하지만, 여러 음성 음소에 대해 테스트한 결과, 제안된 방법에 의하면 기존의 기술에 비해 약 5 % 적은 파워 왜곡이 얻어짐이 밝혀졌다. 따라서 부호화의 신뢰성에 관한 한, 기존의 기술에 비해 본 논문에서 제안된 방법이 더 나은 것으로 사료된다. 40명에 의해 발성된 50 고립단어에 대한 화자종속 음성인식 시험에서도 제안된 방법이 보다 우수한 성능을 보여주었다.

선 스펙트럼 주파수의 청각 적응 부호화 (Perceptual and Adaptive Quantization of Line Spectral Frequency Parameters)

  • 한우진;김은경;오영환
    • 한국음향학회지
    • /
    • 제19권8호
    • /
    • pp.68-77
    • /
    • 2000
  • 선 스펙트럼 주파수를 양자화하기 위한 대부분의 방법들이 가중 유클리드 거리에 기반하고 있는 반면, 본 논문에서는 청각 마스킹 효과에 기반한 에러 척도를 사용하여 선 스펙트럼 주파수를 효과적으로 양자화하는 방법을 제안하였다. 제안한 방법에서는 noise-to-mask ratio (NMR)를 선 스펙트럼 주파수의 양자화에 적합하도록 변형한 새로운 에러 척도를 유도하고, 이를 사용하여 선 스펙트럼 주파수를 양자화한다. 한편, 본 논문에서는 양자화하고자 하는 음성 프레임이 갖는 청각적인 특성을 고려하여 동적으로 비트를 할당하는 적응 양자화 알고리즘을 제안하였다. 성능 평가를 위해서 11948 프레임의 테스트 자료를 기존의 방법과 제안한 방법으로 각자 양자화하고 perceptually transparent frame의 비운 및 이때의 평균 비트율을 비교한 결과, 기존의 방법이 1800 bps의 비트율에서 89.9%의 perceptually transparent frame을 얻은 데 비해, 제안한 방법은 770 bps의 평균 비트율에서 95.5%의 perceptually transparent frame을 얻음으로써 제안한 방법이 효과적임을 보였다.

  • PDF

고품질 AT-DMB 서비스를 위한 계층적 미디어 처리용 시뮬레이터 개발 (Development of Hierarchical Media Processing for High Quality AT-DMB Service)

  • 전도영;김민성;장승민;유홍연;홍성훈
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2008년도 심포지엄 논문집 정보 및 제어부문
    • /
    • pp.86-88
    • /
    • 2008
  • 지상파 방송(DMB: Digital Multimedia Broadcasting)은 음성, 영상, 데이터와 같은 다양한 멀티미디어 신호를 디지털 방식으로 변조하여 이동 중에 방송을 청취 할 수 있는 차세대 디지털방송 서비스이다. 하지만 한정된 대역폭으로 인한 비디오 전송율의 한계에 따라 최대 CIF(Common Interleaved Frame)급 화면해상도까지 서비스가 가능하다. 그러나 지상파 DMB 전송 고도화망에서는 계층 변조(Hierarchical Modulation)전송 기법을 통하여 추가의 전송대역폭을 확보할 수 있다. 또한 스케일러블 비디오 코딩(Scalable Video Coding)부호화 방식을 이용하여 고전송효율/고품질의 이동 멀티미디어 방송서비스를 제공할 수 있는 고품질 AT(Advanced Terrestrial)-DMB 시스템이 가능하다. 이러한 고품질 AT-DMB의 개발에 있어서 여러 방식들이 제시됨에 따라 시뮬레이터를 통한 다중화 시스템의 분석이 필요하다. 본 논문에서는 고품질 AT-DMB가 가능한 스케일러블 비디오 방식을 JM8.8을 사용하여 구현하였으며, 다중화 시스템의 실험을 하였다. 또한 시뮬레이터를 통하여 확보된 계층 간의 화질 차이와 엔지니어를 위해 비트스트림의 분석화면 및 PSNR을 제공 하였다.

  • PDF