통합 검색 | Korea Science

분산 음성 인식 시스템을 위한 특징 계수 양자화 방식 설계 (Design of a Quantization Algorithm of the Speech Feature Parameters for the Distributed Speech Recognition)

이준석;윤병식;강상원
- 한국음향학회지
- /
- 제24권4호
- /
- pp.217-223
- /
- 2005
본 논문에서는 분산 음성 인식 시스템에서 사용되는 멜켑스트럼 계수를 양자화 하기 위하여 예측 구조를 갖는 BC-TCQ 양자화기를 제안하였다. 분산 음성 인식 시스템을 위한 효율적인 멜켑스트럼 계수 양자화기를 설계하기 위하여, 인접 프레임간의 높은 상관도를 이용한 1차 AR 예측 필터를 적용하였다. 그리고 예측 필터에 의해서 구해지는 예측 에러 벡터는 BC-TCQ를 사용하여 양자화를 수행하였다. 본 연구에서 제안된 예측 BC-TCQ멜켑스트럼 계수 양자화기는 분산 음성 인식 시스템을 위해 ETSI 규격에서 사용되는 split VQ 멜켑스트럼 계수 양자화 방식보다 cepstral distortion (CD) 측면에서 훨씬 좋은 성능을 보이며, 인코딩 연산 복잡도 및 메모리 요구량에서도 더 유리하다.
PDF KSCI

불균형 이진트리와 DCT 계수를 이용한 벡터양자화 코드북 (Vector Quantization Codebook Design Using Unbalanced Binary Tree and DCT Coefficients)

이경환;최정현;이법기;정원식;김경규;김덕규
- 한국통신학회논문지
- /
- 제24권12B호
- /
- pp.2342-2348
- /
- 1999
기존의 코드북 설계방법의 많은 계산량과 초기 코드북 문제를 해결하기 위해 영상에 대한 DCT-기반 벡터양자화 코드북 설계방식이 제안되었다. 이 방법은 훈련벡터들의 DCT 계수들에 대한 분산을 각각 구하여 그 중 최대값을 가지는 계수를 분할키로 하고 그 평균값을 분할경계값으로 하여 균형 이진트리를 만들어 종단노드들을 최종코드북으로 하는 방법인데, 에지부분의 열화가 생기는 단점이 있다. 본 논문에서는 중복된 벡터가 많은 평탄영역 벡터들의 노드 분할을 억제하고 다양한 에지영역의 코드벡터들을 포함하는 코드북을 만들기 위해, 각 노드들의 분할키들을 비교하여 값이 가장 큰 노드부터 분할하는 불균형 이진트리를 이용한 벡터양자화 코드북 설계 방법을 제안하였다. 모의실험 결과 에지부분의 복원성과 PSNR 측면에서 기존의 방법에 비해 좋은 결과를 얻을 수 있었다.
PDF

3D 특징 벡터를 이용한 영아 울음소리 분류 (Classification of infant cries using 3D feature vectors)

박정현;김민서;최혁순;문남미
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2022년도 추계학술발표대회
- /
- pp.597-599
- /
- 2022
영아는 울음이라는 비언어적 의사 소통 방식을 사용하여 모든 욕구를 표현한다. 하지만 영아의 울음소리를 파악하는 것에는 어려움이 따른다. 영아의 울음소리를 해석하기 위해 많은 연구가 진행되었다. 이에 본 논문에서는 3D 특징 벡터를 이용한 영아의 울음소리 분류를 제안한다. Donate-a-corpus-cry 데이터 세트는 복통, 트림, 불편, 배고픔, 피곤으로 총 5 개의 클래스로 분류된 데이터를 사용한다. 데이터들은 원래 속도의 90%와 110%로 수정하는 방법인 템포조절을 통해 증강한다. Spectrogram, Mel-Spectrogram, MFCC 로 특징 벡터화를 시켜준 후, 각각의 2 차원 특징벡터를 묶어 3차원 특징벡터로 구성한다. 이후 3 차원 특징 벡터를 ResNet 과 EfficientNet 모델로 학습을 진행한다. 그 결과 2 차원 특징 벡터는 0.89(F1) 3 차원 특징 벡터의 경우 0.98(F1)으로 0.09 의 성능 향상을 보여주었다.
https://doi.org/10.3745/PKIPS.y2022m11a.597 인용 PDF

Stack LSTM 기반 한국어 의존 파싱을 위한 음절과 형태소의 결합 단어 표상 방법 (Improving Stack LSTMs by Combining Syllables and Morphemes for Korean Dependency Parsing)

나승훈;신종훈;김강일
- 한국어정보학회:학술대회논문집
- /
- 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
- /
- pp.9-13
- /
- 2016
Stack LSTM기반 의존 파싱은 전이 기반 파싱에서 스택과 버퍼의 내용을 Stack LSTM으로 인코딩하여 이들을 조합하여 파서 상태 벡터(parser state representation)를 유도해 낸후 다음 전이 액션을 결정하는 방식이다. Stack LSTM기반 의존 파싱에서는 버퍼 초기화를 위해 단어 표상 (word representation) 방식이 중요한데, 한국어와 같이 형태적으로 복잡한 언어 (morphologically rich language)의 경우에는 무수히 많은 단어가 파생될 수 있어 이들 언어에 대해 단어 임베딩 벡터를 직접적으로 얻는 방식에는 한계가 있다. 본 논문에서는 Stack LSTM 을 한국어 의존 파싱에 적용하기 위해 음절-태그과 형태소의 표상들을 결합 (hybrid)하여 단어 표상을 얻어내는 합성 방법을 제안한다. Sejong 테스트셋에서 실험 결과, 제안 단어표상 방법은 음절-태그 및 형태소를 이용한 방법을 더욱 개선시켜 UAS 93.65% (Rigid평가셋에서는 90.44%)의 우수한 성능을 보여주었다.
PDF

Stack LSTM 기반 한국어 의존 파싱을 위한 음절과 형태소의 결합 단어 표상 방법 (Improving Stack LSTMs by Combining Syllables and Morphemes for Korean Dependency Parsing)

나승훈;신종훈;김강일
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
- /
- pp.9-13
- /
- 2016
Stack LSTM기반 의존 파싱은 전이 기반 파싱에서 스택과 버퍼의 내용을 Stack LSTM으로 인코딩하여 이들을 조합하여 파서 상태 벡터(parser state representation)를 유도해 낸후 다음 전이 액션을 결정하는 방식이다. Stack LSTM기반 의존 파싱에서는 버퍼 초기화를 위해 단어 표상 (word representation) 방식이 중요한데, 한국어와 같이 형태적으로 복잡한 언어 (morphologically rich language)의 경우에는 무수히 많은 단어가 파생될 수 있어 이들 언어에 대해 단어 임베딩 벡터를 직접적으로 얻는 방식에는 한계가 있다. 본 논문에서는 Stack LSTM 을 한국어 의존 파싱에 적용하기 위해 음절-태그과 형태소의 표상들을 결합 (hybrid)하여 단어 표상을 얻어내는 합성 방법을 제안한다. Sejong 테스트셋에서 실험 결과, 제안 단어 표상 방법은 음절-태그 및 형태소를 이용한 방법을 더욱 개선시켜 UAS 93.65% (Rigid평가셋에서는 90.44%)의 우수한 성능을 보여주었다.
PDF

3레그형 인버터를 사용한 2상 유도전동기의 직접토크제어에 관한 연구 (A Study on Direct Torque Control of Two-Phase Induction Motor Using Three-Leg Inverter)

김경환;김동기;윤덕용
- 전력전자학회:학술대회논문집
- /
- 전력전자학회 2017년도 전력전자학술대회
- /
- pp.393-394
- /
- 2017
유도전동기는 속도 제어가 어렵기 때문에 이를 위한 고가의 벡터제어 인버터가 널리 사용되어 왔다. 이 때문에 최근에는 이를 저가화하기 위하여 제어 알고리즘이 단순하고 구현이 용이한 직접토크제어 방식에 대한 연구가 이루어지고 있다. 한편으로 소용량의 저전력 응용 분야에서는 기계적으로 구조가 단순하고 가격이 저렴한 2상 유도전동기를 적용하려는 노력이 활발해지고 있다. 2상 유도전동기용 인버터의 대표적인 토폴로지는 3상 IPM 소자를 그대로 이용할 수 있는 3레그형이다. 그러나, 3레그형 인버터에서는 출력 전압 벡터가 비대칭 육각형의 형태로 나타나므로 2상 유도전동기에 이러한 직접토크제어 방식을 적용하면 전동기의 발생 토크에 리플이 증가하는 문제가 있다. 본 논문에서는 3레그형 인버터를 사용하는 2상 유도전동기에 직접토크제어 방식을 적용하고 이때 문제가 되는 전동기의 토크 리플을 저감하는 방법에 관하여 연구하였으며, 이것의 유효성은 시뮬레이션을 통하여 유효성을 검증하였다.
PDF

텍스트와 음성의 앙상블을 통한 다중 감정인식 모델 (Multi-Emotion Recognition Model with Text and Speech Ensemble)

이명호;임명진;신주현
- 스마트미디어저널
- /
- 제11권8호
- /
- pp.65-72
- /
- 2022
COVID-19로 인해 대면으로 이루어지던 상담 방식이 비대면으로 진행되면서 비대면 상담의 중요성이 높아지고 있다. 비대면 상담은 온라인으로 언제 어디서든 상담할 수 있고, COVID-19에 안전하다는 장점이 있다. 그러나 비언어적 표현의 소통이 어려워 내담자의 마음을 이해하기 어렵다. 이에 비대면 상담 시 내담자의 마음을 잘 알기 위해서는 텍스트와 음성을 정확하게 분석하여 감정을 인식하는 것이 중요하다. 따라서 본 논문에서는 텍스트 데이터는 자음을 분리한 후 FastText를 사용하여 벡터화하고, 음성 데이터는 Log Mel Spectrogram과 MFCC를 사용하여 각각 특징을 추출하여 벡터화한다. 벡터화된 데이터를 LSTM 모델을 활용하여 5가지 감정을 인식하는 다중 감정인식 모델을 제안한다. 다중 감정인식은 RMSE을 활용하여 계산한다. 실험 결과 텍스트와 음성 데이터를 각각 사용한 모델보다 제안한 모델의 RMSE가 0.2174로 가장 낮은 오차를 확인하였다.
PDF KSCI

나무구조 벡터양자화 기반의 차분 인덱스 할당기법 (A Differential Index Assignment Scheme for Tree-Structured Vector Quantization)

한종기;정인철
- 한국통신학회논문지
- /
- 제28권2C호
- /
- pp.100-109
- /
- 2003
가변길이 나무구조 벡터양자화기(VLTSVQ : variable-length tree-structured vector quantizer)를 기반으로 하는 영상 부호화 방식인 차분 인덱스(DI : Differential index) 할당기법을 제안하였다. 각 소스벡터는 VLTSVQ의 단말 노드로 양자화가 되어지고, 각 단말 노드는 유일한 이진 벡터로 표현된다. 제안한 방법은 영상의 화질은 유지하면서 압축률을 개선하기 위해 이웃하는 영상 블록들간의 상관성을 이용하였다. 모의실험을 통하여 제안한 방법이 기존 방법들에 비해 매우 높은 압축률을 보였으며, 화소간의 상관성이 높은 영상에 대해서는 63.2%의 발생 비트율 감소를 확인하였다. 그리고 영상내의 이웃블록들간 상관성이 커질수록 더 큰 비트율이 감소됨을 보였다. 제안한 부호화 기법은 일반적으로 이웃된 화소들간에 높은 상관성을 가진 MR(magnetic resonance)영상 부호화에 효율적으로 사용될 수 있다.
PDF KSCI

동적 비트 할당을 통한 다차원 벡터 근사 트리 (Multi-Dimensional Vector Approximation Tree with Dynamic Bit Allocation)

복경수;허정필;유재수
- 한국콘텐츠학회논문지
- /
- 제4권3호
- /
- pp.81-90
- /
- 2004
최근 컴퓨팅 환경의 급속한 발전으로 다양한 응용에서 다차원 데이터에 대한 활용이 증가되고 있다. 본 논문에서는 내용 기반 다차원 데이터 검색을 위한 벡터 관사 트리를 제안한다 제안하는 색인 구조는 공간 분할 방식과 벡터 근사화 기법을 이용하여 영역 정보를 표현하기 때문에 하나의 노드 안에 많은 영역 정보를 저장하여 트리의 높이를 감소시킨다 또한 다차원의 데이터 공간에 동적인 비트로 할당하여 다차원색인 구조의 문제점인 '차원의 저주 현상'을 해결한다. 또한 군집화된 데이터에 대해서 효과적인 표현 기법을 제공한다. 자식 노드의 영역 정보는 부모 노드를 기준으로 상대적으로 표현함으로서 좀더 정확한 영역을 표현할 수 있다. 제안하는 색인 구조의 우수성을 보이기 위해 실험을 통해 기존에 제안된 색인구조와의 비교 분석을 수행한다.
PDF

예측 비디오 코딩을 위한 통합 움직임 보상 알고리즘 (Integration of Motion Compensation Algorithm for Predictive Video Coding)

음호민;박근수;송문호
- 전자공학회논문지S
- /
- 제36S권12호
- /
- pp.85-96
- /
- 1999
많은 경우의 예측 비디오 압축 표준에서는, BMA에 의해 매크로 블록당 하나의 움직임 벡터가 계산되는 방식인 BMC방식이 널리 사용되고 있다. 그러나 BMC에 의해 예측된 움직임 벡터 필드는 블록당 하나의 움직임 벡터를 사용하기 때문에 불연속적이며, 불연속적인 움직임 벡터 필드로 인해 블록화 현상을 나타낸다. 따라서 이를 제거하는 효과적인 방법은 움직임 벡터 필드를 평활화(smoothing)하는 방법일 것이다. 최적 평활화 과정은 비디오 시퀀스의 움직임 종류에 따라 다를 것이다. 본 논문에서는 움직임 벡터를 평활화하는 몇 개의 방법들을 고려할 것이다. 어떠한 방법이든 BMA로 구한 움직임 벡터는 더 이상 최적화된 움직임 벡터가 아닐 것이므로, BFD(displaced frame difference)의 놈(norm)을 최소화하는 최적 움직임 벡터를 찾아야 한다. 본 논문에서는 conjugate gradient 알고리즘을 사용하여 DFD의 놈을 최소화하는 최적움직임 벡터를 찾는 통합 알고리즘을 제안한다. 이 통합 알고리즘은 ATMC(affine transform based motion compensation), BTMC(bilinear transform based motion compensation), 그리고 본 논문에서 제안하는 FMC(filtered motion compensation)의 세가지 방식에 대하여 적용되고 BMC에 대비해서 평가되어 졌다.
PDF

검색결과 203건 처리시간 0.026초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)