• 제목/요약/키워드: 양자화 시스템

검색결과 319건 처리시간 0.027초

벡터 양자화를 이용한 한국어 억양 곡선 생성 (Generation of Korean Intonation using Vector Quantization)

  • 안혜선;김형순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.209-212
    • /
    • 2001
  • 본 논문에서는 text-to-speech 시스템에서 사용할 억양 모델을 위해 벡터 양자화(vector quantization) 방식을 이용한다. 어절 경계강도(break index)는 세단계로 분류하였고, CART(Classification And Regression Tree)를 사용하여 어절 경계강도의 예측 규칙을 생성하였다. 예측된 어절 경계강도를 바탕으로 운율구를 예측하였으며 운율구는 다섯 개의 억양 패턴으로 분류하였다. 하나의 운율구는 정점(peak)의 시간축, 주파수축 값과 이를 기준으로 한 앞, 뒤 기울기를 추출하여 네 개의 파라미터로 단순화하였다. 운율구에 대해서 먼저 운율구가 문장의 끝일 경우와 아닐 경우로 분류하고, 억양 패턴 다섯 개로 분류하여. 모두 10개의 운율구 set으로 나누었다. 그리고 네 개의 파라미터를 가지고 있는 운율구의 억양 패턴을 벡터 양자화 방식을 이용하여 분류(clusteing)하였다 운율의 변화가 두드러지는 조사와 어미는 12 point의 기본주파수 값을 추출하고 벡터 양자화하였다. 운율구와 조사 어미의 codebook index는 문장에 대한 특징 변수 값을 추출하고 CART를 사용하여 예측하였다. 합성할 때에는 입력 tort에 대해서 운율구의 억양 파라미터를 추정한 다음, 조사와 어미의 12 point 기본주파수 값을 추정하여 전체 억양 곡선을 생성하였고 본 연구실에서 제작한 음성합성기를 통해 합성하였다.

  • PDF

실용적 안정성을 보장하는 양자화기 데이터 율 조건 (Data Rate Condition for Quantizer Achieving Practical Stability)

  • 양장훈
    • 한국항행학회논문지
    • /
    • 제22권3호
    • /
    • pp.228-232
    • /
    • 2018
  • 많은 사물들이 네트워크를 통해서 연결되고 제어되면서 제어 시스템에서 양자화 오류를 다루는 문제의 중요성이 증가하고 있다. 따라서, 본 논문에서는 제어시스템의 실용적 안정성을 달성하기 위해서 양자화기에서 필요로 하는 데이터 율에 대한 조건을 제시한다. 먼저, 프로세스 잡음이 없는 조건에서 데이터율이 궤환 시스템 행렬의 고유값, 초기 상태의 크기, 초기 양자화 오류의 크기 및 제어 이득 등에 의해서 결정됨을 보이고, 프로세스 잡음이 있는 경우 프로세스 잡음의 최대 크기에 의한 추가적인 데이터율이 발생함을 보인다. 또한, 점근적 분석을 통해서 네트워크 제어를 위한 데이터율을 감소시키기 위해서는 이를 고려한 제어기의 설계가 필요함을 보인다. 간단한 예제를 통해서 균일 양자화기 및 로그형 양자화기가 데이터 율에 따라서 어떤 실용적 안정성을 보이는지를 확인한다.

고정 타임슬롯 모드를 사용하는 PCM 시스템에서 디지털 음성 데이터 보안 기법 (Cipher method of digital voice data using fixed time slot mode in PCM system)

  • 임성렬
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.782-785
    • /
    • 2010
  • 본 논문은 연속된 음성 신호를 전송로 상에 전송하기 위해 음성 신호를 G.711 표준 권고인 PCM으로 다중화한 후 고정 타임슬롯을 배정하여 전송하는 시스템에서 PCM 화된 디지털 음성 데이터를 실시간으로 암호화하여 전송하는 스트림 암호화 기법에 관한 것이다. 실시간으로 처리되는 음성 데이터의 암호화 시에는 하드웨어 방식이 적합한 데, 본 논문에서는 고정 타임슬롯을 배정받는 음성 데이터의 실시간 암호화 기법에 관한 것이다. 일반적으로 아날로그 음성 신호 코딩 시에 국내에서는 북미 방식인 ${\mu}-law$ 코딩 기법을 적용하는 데 이는 표본화한 음성 데이터를 양자화전에 압축하고 복호화 후 신장하는 비선형 양자화 기법을 적용하는 것으로 표본화된 값을 8 비트의 PCM 데이터로 변화하여 E1(2.048Mbps) 급 속도로 전송한다. 본 논문에서는 PCM 전송로 상에 전송되기 전의 직렬 입력 데이터를 암호화 장치를 거쳐 해당 타임슬롯에 해당하는 8 비트의 데이터를 실시간으로 암호화하여 전송로 상으로 전송하고 역으로 수신 단에서는 PCM 전송로를 거친 직렬 입력 데이터를 암호화된 타임슬롯을 판별하여 해당 타임슬롯의 데이터를 복호화하여 원래 데이터를 복원한다. 본 논문에서는 고정 타임슬롯을 배정받은 PCM 데이터를 암호화하여 전송한 후 수신 단에서 복호화 과정을 거친 후 타임슬롯 단위로 데이터 암호화/복호화가 가능함을 보여준다.

양자화 전송 중계 기반 분산 다중 안테나 통신 시스템 (Distributed MIMO Systems Based on Quantize-Map-and-Forward (QMF) Relaying)

  • 홍비;최완
    • 한국통신학회논문지
    • /
    • 제39A권7호
    • /
    • pp.404-412
    • /
    • 2014
  • 이동 단말기에 다중 안테나를 장착하는 것은 단말기의 크기와 전력 소모 문제로 현실적인 어려움을 안고 있다. 본 논문에서는 셀룰러 네트워크에서 단일 안테나를 가지는 이동 단말기의 전송 용량 증대를 위해, 다중안테나 통신 (MIMO)을 통해서 얻을 수 있는 선형적인 전송 용량 증대를 달성하는 신호 중계 기반 분산 다중 안테나기법을 제안하고 성능을 분석한다. 분산 다중안테나 시스템을 위한 단말 간 신호 중계에 증폭 후 전달 기법(Amplify-and-Forward)을 사용할 경우에 비해 양자화 후 전달 (Quantize-Map-and-Forward) 기법을 사용하는 경우, 처리율 측면에서 보다 우수한 성능을 달성할 수 있음을 실험을 통해서 보인다. 또한, 선형적 전송 용량 증대폭을 보다 향상시키기 위해 양자화 후 전달 중계 방식을 활용하여 다중접속채널을 구성하는 방법을 제안하고, 이러한 다중접속채널 구성이 가능한 조건을 충족시키기 위한 단말기 선택을 가능하게 하는 후보 이동 단말기 수를 분석하였다. 이러한 분산 다중 안테나 통신 기법은 셀룰러 시스템에서 지역적으로 분리된 클러스터들을 서비스하기 때문에 주파수 재사용을 가능하게 하며, 이로 인해 클러스터의 숫자에 비례하는 전체 셀룰러 용량 증대에 기여한다.

M-PSK 성운을 이용한 새로운 이중계층 차분 동 이득 전송 기술 (A Novel Dual-Layer Differential Equal Gain Transmission Technique Using M-PSK Constellations)

  • 김영주;서창원
    • 한국전자파학회논문지
    • /
    • 제26권7호
    • /
    • pp.627-635
    • /
    • 2015
  • LTE-Advanced(LTE-A), IEEE802.11ac, 그리고 다중송수신 안테나를 사용하는 레이더 시스템에서 사용할 수 있는 이중계층 차분 동이득 코드북 설계 방법을 제안하고, 성능을 분석한다. 코드북의 코드워드 인자로 M진 위상 편이를 사용하여 단말기에서는 저비용의 전력 증폭기를 사용할 수 있도록 하고, 특히 고출력의 송신 전력을 사용하는 레이더 시스템에서 동이득 전송의 기본 요구사항을 만족시킨다. 차분 코드북은 무선 채널의 시간 상관 특성에 의해 선부호화 행렬 내 양자화된 채널 정보도 천천히 변화하도록 코드북을 설계한다. 이는 시간 상관 특성에 따른 채널 공간 내 일부분 만을 양자화하여 피드백하기 때문에 기존과 동일한 크기의 코드북을 구성해도 가상적으로 보다 정확한 채널정보를 양자화할 수 있어 채널 용량이 증가하는 효과를 갖는다. 제안하는 이중계층 코드북은 LTE 코드북 설계 요구조건을 유지하며, 동이득 전송이 필수인 레이더 시스템에 적용될 뿐만 아니라, 기존의 8진 동이득 코드북보다 향상된 성능을 보인다.

가우시안 분포에서 Maximum Log Likelihood를 이용한 벡터 양자화 기반 음성 인식 성능 향상 (Vector Quantization based Speech Recognition Performance Improvement using Maximum Log Likelihood in Gaussian Distribution)

  • 정경용;오상엽
    • 디지털융복합연구
    • /
    • 제16권11호
    • /
    • pp.335-340
    • /
    • 2018
  • 정확한 인식률을 보이고 있는 상업적인 음성인식 시스템은 화자종속 고립데이터로부터 학습 모델을 사용한다. 그러나 잡음 환경에서 데이터양에 따라 음성인식의 성능이 저하되는 문제점이 있다. 본 논문에서는 가우시안 분포에서 Maximum Log Likelihood를 이용한 벡터 양자화 기반 음성 인식 성능 향상을 제안한다. 제안하는 방법은 음성에 대한 특징을 가지고 벡터 양자화와 Maximum Log Likelihood 음성 특징 추출 방법을 이용하여 유사 음성에 대한 음성 인식의 정확성을 높이는 최적 학습 모델 구성 방법이다. 이를 위해 HMM을 기반으로 음성 특징을 추출하는 방법을 사용한다. 제안하는 방법을 사용하여 기존 시스템에서 생성되어 사용되는 음성 모델에 대한 부정확한 음성 모델에 대한 정확성을 향상시킬 수 있으므로 음성 인식에 강인한 모델을 구성할 수 있다. 제안하는 방법은 음성 인식 시스템에서 향상된 인식의 정확도를 보인다.

순환신경망과 벡터 양자화를 이용한 비정상 소나 신호 탐지 (Abnormal sonar signal detection using recurrent neural network and vector quantization)

  • 이기배;고건혁;이종현
    • 한국음향학회지
    • /
    • 제42권6호
    • /
    • pp.500-510
    • /
    • 2023
  • 수동소나 신호에는 정상신호와 비정상 신호가 같이 존재하는 경우가 대부분이다. 정상신호와 혼재된 비정상 신호는 주로 정상신호만을 학습하는 오토인코더를 이용하여 탐지된다. 하지만 기존의 오토인코더는 혼재된 신호로부터 왜곡된 정상신호를 복원하므로 부정확한 탐지를 수행할 수 있다. 이러한 한계를 개선하고자, 본 논문에서는 순환신경망과 벡터 양자화 기반의 비정상 신호 탐지 모델을 제안한다. 제안된 모델은 학습된 잠재벡터들을 대표하는 코드 북을 생성하고, 제안된 코드벡터의 탐색을 통해 보다 정확하게 비정상 신호를 탐지한다. 공개된 수중 음향 데이터를 이용한 실험에서 제안된 기법이 적용된 오토인코더와 변이형 오토인코더는 기존 모델에 비해 최소 2.4 % 향상된 탐지 성능과 최소 9.2 % 높은 비정상 신호 추출 성능을 보였다.

음성의 음향적 검사 (Sound Spectrographic Analysis)

  • 홍수기
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 1994년도 제2회 학술대회 심포지움
    • /
    • pp.128-137
    • /
    • 1994
  • 신호처리의 목적은 신호를 변형하여 우리가 원하는 형태로 만드는 것으로 신호를 변환시키는 장치 즉 시스템이 신호에 응답하여 다른 형태의 신호를 만들어 내는 것을 신호처리라 한다. 현재는 음성신호 처리시에 대부분 입력시호인 아날로그 신호(Analog Signal)를 표본화(Sampling)하고 양자화(Quantizing)하여 디지털 신호(Digital Signal)로 변환한 후 필요한 신호처리를 수행한다. 디지털 신호를 처리하므로써 정확성, 신뢰성, 처리속도를 증가시키게 되고 전자시스템(Electronic System)의 크기를 줄일 수가 있다. (중략)

  • PDF

인간 시각 시스템의 공간 지각 특성을 이용한 개선된 이진트리 벡터양자화 (The Improved Binary Tree Vector Quantization Using Spatial Sensitivity of HVS)

  • 유성필;곽내정;안재형
    • 정보처리학회논문지B
    • /
    • 제11B권1호
    • /
    • pp.21-26
    • /
    • 2004
  • 칼라 양자화는 칼라 카메라로부터 입력된 자연 색의 칼라 영상을 컴퓨터 모니터에 표현하기 위해 더 적은 칼라 팔레트로 구성하는 것이다. 이것은 자연색 중에서 인간이 인식한 수 있는 색은 수 백가지 정도일 뿐 아니라 실제 칼라 영상에 나타나는 색은 이 보다는 훨씬 적다는 것을 바탕으로 한다. 본 논문에서는 인간의 시각 특성중 공간 지각 특성을 고려한 개선된 고유벡터를 이용한 이진 트리 벡터양자화 기법을 제안한다. 제안 방법은 고유벡터를 이용한 이진 트리 벡터 양자화의 두 노드로 분할하는 과정에 영상의 블록 내의 칼라의 변화에 따른 인간의 시각의 반응 정도를 가중피로 결합하여 양자화를 하였다. 제안 방법은 기존의 방법보다 색상이 선명해지며 유사한 영역의 분한에 뛰어난 성능을 보여 주었으며 주관적인 화질 평가와 PSNR에서도 좋은 결과를 보였다.

MPEG 동영상 컨텐츠 보호를 위한 양자화-적응적 워터마킹 알고리즘 (A Quantization-adaptive Watermarking Algorithm to Protect MPEG Moving Picture Contents)

  • 김주혁;최현준;서영호;김동욱
    • 대한전자공학회논문지SP
    • /
    • 제42권6호
    • /
    • pp.149-158
    • /
    • 2005
  • 본 논문에서는 동영상 컨텐츠의 위${\cdot}$변조, 불법사용 및 복제를 방지하기 위하여 비가시성과 공격에 대한 강인성을 동시에 만족하는 blind 워터마킹 방법을 제안하였다. 이 방법은 MPEG-2 동영상 압축시스템을 대상으로 하며, 이 압축시스템의 적응적 양자화에 부합하도록 양자화 스케일 코드에 따라 삽입할 워터마크 비트 수를 조절하도록 설계하였다. 워터마크의 삽입위치는 영상의 주파수 특성에 따라 삽입할 영상블록을 선정하고, 선정된 영상블록의 가로, 세로, 대각선의 주파수 특성과 블록내의 각 계수의 주파수 특성을 고려하여 계수를 선정하였다. 또한 각 계수에 삽입할 워터마크 비트 수는 양자화 스텝을 고려하여 결정하였다. 이 알고리즘은 C/C++ 언어로 구현하였으며, 자체 제작한 MPEG-2 시스템을 테스트 베드로 하여 비가시성과 강인성을 실험하였다. 실험결과 삽입한 워터마크의 비가시성이 충분히 만족되었고, 일반적인 공격방법에 대해 추출된 워터마크의 에러율이 $10\%$ 이하의 강인성을 보였다. 따라서 제안한 방법은 MPEG-2 시스템을 사용하는 동영상 압축, 특히 네트워크 적응적 압축이 필요한 응용분야에서 매우 유용하게 사용될 수 있으리라 사료된다.