통합 검색 | Korea Science

의사 형태소 단위의 연속 음성 인식 (Pseudo-Morpheme-Based Continuous Speech Recognition)

이경님
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
- /
- pp.309-314
- /
- 1998
언어학적 단위인 형태소의 특성을 유지하면서 음성인식 과정에 적합한 분리 기준의 새로운 디코딩 단위인 의사형태소를 정의하였다. 이러한 필요성을 확인하기 위해 새로이 정의된 37개의 품사 태그를 갖는 의사 형태소를 표제어 단위로 삼아 발음사전 생성과 형태소 해석에 초점을 두고 한국어 연속음성 인식 시스템을 구성하였다. 각 음성신호 구간에 해당되는 의사 형태소가 인식되면 언어모델을 사용하여 구성된 의사 형태소 단위의 상위 5개 문장을 기반으로 시작 시점과 끝 시점, 그리고 확률 값을 가진 의사 형태소 격자를 생성하고, 음성 사전으로부터 태그 정보를 격자에 추가하였다. Tree-trellis 탐색 알고리즘 기반에 의사 형태소 접속정보를 사용하여 음성언어 형태소 해석을 수행하였다. 본 논문에서 제안한 의사 형태소를 문장의디코딩 단위로 사용하였을 경우, 사전의 크기면에서 어절 기반의 사전 entry 수를 현저히 줄일 수 있었으며, 문장 인식률면에서 문자기반 형태소 단위보다 약 20% 이상의 인식률 향상을 얻을 수있었다. 뿐만 아니라 형태소 해석을 수행하기 위해 별도의 분석과정 없이 입력값으로 사용되며, 전반적으로 문자을 구성하는 디코딩 수를 안정화 시킬 수 있었다. 이 결과값은 상위레벨 언어처리를 위한 입력？으로 사용될 뿐만 아니라, 언어 정보를 이용한 후처리 과정을 거쳐 더 나은 인식률 향상을 꾀할 수 있다.
PDF

VMEbus 를 이용한 음성 서비스 시스템의 구현 및 성능평가 (Implementation and Performance Evaluation of the System for Speech Services using VMEbus)

권오일;강경용;김동하;이태원
- 한국음향학회지
- /
- 제15권1호
- /
- pp.93-101
- /
- 1996
본 논문에서는 전화가입자에게 보다 향상된 여러 가지 음성 서비스를 제공하기 위한 음성 처리 시스템을 구현하였다. 음성 신호처리만을 수행하는 전용 보드를 개발하고 하나의 마스터 보드가 여러 장의 DSP(Digital Signal Processing) 보드를 제어하여 음성의 저장과 재생기능을 수행하는 시스템을 다중 보드 구성에 적합한 방식인 VME버스를 사용하여 하드웨어를 구성하였다. 마스터 보드로서는 CPU30 보드를 사용하였고 DSP 보드로는 음성 입출력을 위한 전용 하드웨어인 SPM(Signal Processing Module) 보드를 제작하여 시스템 성능 평가를 하였다.
PDF

응급구조에서의 음향데이터 분석을 위한 음성 부재구간 검출 기술 (Voice inactivity detection for Analysis of Acoustic data of Emergency Rescue)

황승현;장준혁
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2015년도 추계학술발표대회
- /
- pp.1348-1349
- /
- 2015
본 논문에서는 응급구조의 신고 상황에서의 수보자의 보다 정확하고 신속한 대응를 위하여 수화자의 음향환경을 분석하여 주변상황에 대한 정보를 알고자 심화 신경망 기반의 음성 부재구간 검출 기법을 제안한다. 제안한 알고리즘은 음성 신호에서의 23차의 Mel-filter bank를 추출하고 이를 심화 신경망 기법을 이용하여 음성 부재구간을 검출한다. 객관적인 성능 평가를 위해 제안된 기법은 실제 응급구조 상황에서 평가되었으며, 기존의 음성검출기를 이용한 음성 부재구간 검출 성능에 비하여 향상된 성능을 보였다.
https://doi.org/10.3745/PKIPS.y2015m10a.1348 인용 PDF

변형된 AMDF를 이용한 음성 신호의 피치 주기 검출에 관한 연구 (A Study on Pitch Period Detection of Speech Signal Using Modified AMDF)

서현수;배상범;김남호
- 한국정보통신학회:학술대회논문집
- /
- 한국해양정보통신학회 2005년도 춘계종합학술대회
- /
- pp.515-519
- /
- 2005
음성 신호 처리에서 중요한 요소인 피치 주기는 음성 인식, 화자 식별, 음성 분석 및 합성 등의 많은 분야에 이용되고 있으며, 피치 검출에 관련된 다양한 알고리즘이 지금까지 연구되고 있다. 피치검출에 사용되는 알고리즘의 하나인 AMDF(average magnitude difference function)는 각 valley점의 거리를 피치 주기로 계산한다. 이 때 피치 주기 검출을 위한 valley점 선정에 있어서 계산량이 증가하는 문제점이 발생한다. 따라서 본 논문에서는 변형된 AMDF를 이용하여 전체 최소 valley점을 음성 신호의 피치 주기로 검출하는 간단한 알고리즘을 사용하였으며, 시뮬레이션을 통해 기존의 방법들과 비교하였다.
PDF

은닉 마르코프 모델을 이용한 음성에서의 감정인식 (Emotion recognition in speech using hidden Markov model)

김성일;정현열
- 융합신호처리학회논문지
- /
- 제3권3호
- /
- pp.21-26
- /
- 2002
본 논문은 분노, 행복, 평정, 슬픔, 놀람 등과 같은 인간의 감정상태를 인식하는 새로운 접근에 대해 설명한다. 이러한 시도는 이산길이를 포함하는 연속 은닉 마르코프 모델(HMM)을 사용함으로써 이루어진다. 이를 위해, 우선 입력음성신호로부터 감정의 특징 파라메타를 정의한다. 본 연구에서는 피치 신호, 에너지, 그리고 각각의 미분계수 등의 운율 파라메타를 사용하고, HMM으로 훈련과정을 거친다. 또한, 화자적응을 위해서 최대 사후확률(MAP) 추정에 기초한 감정 모델이 이용된다. 실험 결과로서, 음성에서의 감정 인식률은 적응 샘플수의 증가에 따라 점차적으로 증가함을 보여준다.
PDF

ITU-T G.729/G.729E와 호환성을 갖는 광대역 음성/오디오 부호화기 (A New Wideband Speech/Audio Coder Interoperable with ITU-T G.729/G.729E)

김경태;이민기;윤대희
- 대한전자공학회논문지SP
- /
- 제45권2호
- /
- pp.81-89
- /
- 2008
광대역 신호는 16 kHz로 표본화되어 50-7000 Hz로 밴드 제한된 신호를 말하며, 전화대역 음성 신호에 비해서 높은 자연성(naturalness)과 명료성(intelligibility)을 가진다. 이런 특징으로 광대역 부호화기는 화상회의, 디지털 AM 방송 및 고음질 음성통신 등에 사용될 수 있다. 본 논문에서는 가변대역 특징을 갖는 광대역 음성 오디오 부호화기를 제안하였다. 제안된 부호화기는 대역분한 구조를 가진다. 저주파 대역은 전화대역 음성 부호화기로 많이 사용되고 있는 8 kbit/s ITU-T G.729나 보다 높은 전송률로 오디오 신호까지 처리할 수 있는 11.8 kbit/s ITU-T G.729 Annex E로 부호화한다. 고주파 대역은 청각 모델을 기반으로 한 파라미터 부호화 방법으로 부호화한다. 제안된 고주파 대역 부호화는 감마톤 필터뱅크(gammatone filterbank)를 이용하여 입력신호를 임계대역으로 분할한 후, 각각의 임계대역 신호를 양자화한다. 저주파 대역 부호화기와 고주파 대역 부호화기는 서로 독립되어 있으므로, 복호화기에서는 채널 조건에 따라 전화대역 합성신호와 광대역 합성신호를 선택할 수 있는 특징이 있다. 성능 평가 결과, 제안된 부호화기는 낮은 전송률과 짧은 지연 시간으로 음성과 오디오 신호 모두에 대해 ITU-T G.722.1 24 kbit/s와 동등한 음질을 제공한다는 것을 확인하였다.
PDF KSCI

가변스텝사이즈를 적용한 웨이블렛 기반 적응 알고리즘의 Fast running FIR filter에 관한 연구 (Fast running FIR filter structure Using variable step size based on Wavelet adaptive algorithm)

이재균;박재훈;김시우;이채욱
- 융합신호처리학회 학술대회논문집
- /
- 한국신호처리시스템학회 2006년도 하계 학술대회 논문집
- /
- pp.67-72
- /
- 2006
적응신호처리 분야에서 LMS(Least Mean Square) 알고리즘은 수식이 간단하고, 적은 계산 량으로 인해 널리 사용되고 있지만, 시간영역의 적응알고리즘은 입력신호의 고유치 분포 폭이 넓게 분포할 때는 수렴속도가 느려지는 단점이 있다. 본 논문에서는 적응 신호처리의 수렴속도를 향상 시키고 복잡한 계산 량을 줄이는 새로운 fast running FIR 필터 구조를 제안한다. 그리고 제안한 알고리즘을 가변스텝 사이즈 웨이블렛 기반 적응 알고리즘에 적용한다. 실제로 합성 음성을 사용하여 적응 잡음 제거기에 적용하여 컴퓨터 시뮬레이션을 통해 제안한 알고리즘과 기존 알고리즘과의 성능을 비교한다.
PDF

U-Sports용 음성통신 서비스 모델 제안 및 Hands-free 기기의 구현 (A Design of Voice Communication Service for U-Sports)

허명선;이종덕;김재오;양윤석;안현식;정구민
- 융합신호처리학회논문지
- /
- 제9권3호
- /
- pp.208-212
- /
- 2008
본 논문에서는 휴대용 단말기와 Bluetooth를 이용하여 레져 스포츠를 즐기면서 음성통신을 할 수 있는 서비스 모델을 제안하고 이에 필요한 Hands-free 기기를 구현한다. 제안한 서비스 모델은 Bluetooth를 이용하여 음성 네트워크를 형성하고, 선점형 알고리듬을 이용하여 다수의 사용자들과 음성 공유를 할 수 있도록 한다. 제안하는 서비스 모델은 두 가지로 나눌 수 있다. 하나는 Hands-free 기기만을 이용하여 최대 4명의 사용자까지 음성통신을 하는 모델이고, 다른 하나는 휴대용 단말기를 마스터로 하여 최대 3명의 사용자까지 음성통신을 하는 모델이다. 두 번째 모델은 Scatternet과 Call Forwarding을 이용하여 음성통신 중에도 전화통화가 가능하도록 한다. Scatternet을 이용할 경우, 음성통신을 위한 피코넷과 휴대용 단말기와의 피코넷이 하나의 Scatternet을 형성한다. Call Forwading을 이용할 경우, 음성 네트워크를 형성하기 전에 각 휴대용 단말기의 정보를 교환하여 음성통신 중에 전화가 왔을 경우 마스터인 단말기를 통해 해당 사용자가 전화 통화를 할 수 있다.
PDF

기계학습을 이용한 음성 신호처리 연구동향

김태수
- 전자공학회지
- /
- 제43권5호
- /
- pp.35-40
- /
- 2016
PDF KSCI

선형워핑함수의 화자정규화에 의한 음성 인식시스템의 성능향상 (Performance Improvement of Speech Recognition System Based on Speaker Normalization Through Linear Warping Function)

최석용;정경용;이정현
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2000년도 추계학술발표논문집 (하)
- /
- pp.879-882
- /
- 2000
화자종속 음성인식 시스템은 훈련 데이터가 화자들 사이의 음향적 변이를 충분히 모델링 할 수 있을 때, 화자독립 시스템보다 더 성능이 졸은 것으로 알려져 있다. 화자 정규화 기술은 입력음성의 스펙트럼을 수정하여 화자들 사이의 변이를 줄인다. 최근 성공적인 화자 정규화 알고리즘은 신호처리단계에 화자 특유 주파수 워핑을 통합했다. 이런 알고리즘은 입력음성에 담겨있는 음향적 특징을 다 사용하지 않는다. 본 논문에서는 화자의 음향적 특징으로 세 개의 포만트 주파수를 이용하였고, 수집된 포만트 주파수들로부터 워핑함수를 정의하는데 선형회귀를 사용한 화자 정규화 방법을 제안한다. 이 방법을 사용하여 인식 성능을 향상할 수 있었다.
PDF

검색결과 474건 처리시간 0.03초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)