통합 검색 | Korea Science

HMM(Hidden Markov Model) 음성인식 알고리즘을 이용한 효율적인 음성인식 모듈 개발 설계에 관한 연구 (A Study on the Speech Recognition Moduleas Design Using HMM Speech Recognition Algorithm)

김정훈;류홍석;강재명;강성인;이상배
- 한국지능시스템학회:학술대회논문집
- /
- 한국퍼지및지능시스템학회 2002년도 추계학술대회 및 정기총회
- /
- pp.337-340
- /
- 2002
본 논문에서는 휠체어 시스템에 화자 독립 고립단어 인식을 위한 임베디드 시스템 설계에 관한 내용을 서술한다. 실제 환경에서는 잡음이 포함되어 있어 인식률을 저하시키므로, 잡음을 제거하는 방식 중 가장 간단한 방식인 스펙트럼 차감법(Spectral subtraction method)을 사용하여 잡음을 제거했다 전처리 단계에서는 12차 LPC&Cepstrum 방식을 사용했고, 인식 알고리즘은 DHMM (Discrete Hidden Markov Model)을 전반부 인식기로 사용했다. 이 알고리즘을 적용하기 위해서는 데이터 간소화를 위해 벡터양자화(Vector Quantization) 처리가 전제되어야한다 또한 인식알고리즘은 인식률을 향상을 위해 후처리 인식기로 신경망(MLP:Multi-layer Perceptron)을 통해서 인식률을 향상시켰다 화자 독립 시스템에 맞는 인식 단어의 구성은 총 7개단어로 남녀 총 25명 목소리로 구성하였다. 그리고 하드웨어 구성은 32-bits floating point 방식인 TMS320C32를 적용했고, 메모리 부분은 4Mbyte로 설계를 했으며, 메인보드의 설계는 현재 완성 단계에 있다.

Noise Elimination Using Improved MFCC and Gaussian Noise Deviation Estimation

Sang-Yeob, Oh
- 한국컴퓨터정보학회논문지
- /
- 제28권1호
- /
- pp.87-92
- /
- 2023
음성 인식 시스템의 지속적인 발전으로 음성에 대한 인식율은 급속도로 발전되었지만 사용 환경에서의 잡음과 여러 음성이 혼합되어 발생하는 잡음으로 정확한 음성을 인식할 수 없는 단점을 가진다. 환경 잡음이 있는 음성을 처리할 때 음성 인식률을 높이기 위해서는 잡음을 제거해야 하며, 기존의 HMM, CHMM, GMM, 그리고 AI 모델이 적용된 DNN에서도 예상치 못한 잡음이 발생하거나 기본적으로 디지털 신호에 양자화 잡음이 추가되면 소스 신호가 변경되거나 손상되어 인식률이 저하된다. 이를 해결하기 위해 각 음성 프레임에 대한 음성 신호의 특징을 효율적으로 추출하기 위해 MFCC를 개선하여 처리하였으며, 음성 신호에 대한 잡음을 제거하기 위해 가우시안 모델을 적용한 잡음 편차 추정을 이용한 잡음 제거 방법을 개선하여 적용하였다. 제안된 모델에 대한 성능 평가는 음성에 대한 정확성 평가를 위해 교차 상관 계수를 사용하여 처리하였으며, 제안하는 방법의 인식률을 평가한 결과 이들에 대한 상관 계수에 대한 평균값 차이는 0.53 dB 개선된 것을 확인하였다.
https://doi.org/10.9708/jksci.2023.28.01.087 인용 PDF HTML

시각특성과 DCT를 이용한 영상부호화에 관한 연구 (A Study on Image Coding using the Human Visual System and DCT)

남승진;최성남;전중남;박규태
- 한국통신학회논문지
- /
- 제17권4호
- /
- pp.323-335
- /
- 1992
본 논문에서는 인간의 시각특성을 반영한 적응 DCT 영상 부호화에 관하여 연구하였다. 인간의 시각은 특정한 중간 주파수 대역에 가장 민감하며, 저주파 대역과 고주파 대역에 대하여 상대적으로 덜 민감하다. 이러한 특성은 많은 심리시각적 실험을 통하여 MTF(Modulation transfer function)라는 수식으로 모델링되었다. DCT는 공간영역의 에너지를 주파수 영역으로 변환하므로 MTF를 효율적으로 이용할 수 있다. 또한 시각의 공간 마스킹 특성에 의하여 변화가 많은 영역의 잡음은 변화가 적은 영역의 잡음에 비하여 인간의 시각에 덜 민감하다. 제안된 부호화 방법은 시각의 공간주파수 반응 특성을 양자화 행렬로 채택하였으며, 영상의 변화도에 따라 변환 블럭을 차등양자화 함으로써 주관적 화질의 향상을 꾀하였다. 각 블럭의 변화도를 측정하기 위한 방법으로 공간 영역에서 간단한 연산을 행하였으며, 이에 따라 변화가 적은 블럭을 상대적으로 정확하게 양자화하였다. 실험결과 낮은 비트율에서 시각특성을 반영한 제안된 부호화 방법이 주관적으로 우수한 성능을 보임을 확인하였다.
PDF

다중 레벨 양자화 기법을 적용한 오디오 핑거프린트 추출 방법 (Audio Fingerprint Extraction Method Using Multi-Level Quantization Scheme)

송원식;박만수;김회린
- 한국음향학회지
- /
- 제25권4호
- /
- pp.151-158
- /
- 2006
본 논문은 필립스의 음악 검색 기법을 기반으로 필터 뱅크 에너지 변화량과 음악의 통계적인 특성을 이용한 오디오 핑거프린트 추출 방법을 제안하였다. 기존의 필립스 방식은 제한된 주파수 영역을 너무 많은 필터 뱅크로 분할하여 분석함으로써 밴드들 사이에 연계성 및 왜곡에 대한 민감도가 증가하는 특징을 보일 수 있다. 제안된 방법은 필터 뱅크의 밴드 수를 줄여 왜곡에 대한 강인성을 증진시키고, 필터 뱅크 에너지의 변화량의 부호와 크기 정보를 통계적 특성을 고려한 양자화 기법을 이용해 2비트로 할당함으로써 오디오 핑거프린트의 고유성을 확보하였다. 추출된 2비트는 4개의 레벨로 정보를 표현함으로 각 레벨 사이에 연계성이 존재하게 된다. 이 같은 레벨 사이의 연계성은 유사도 측정 시 이용될 뿐만 아니라 오디오 핑거프린트를 기준으로 검색 영역을 확장하는 제안된 방식에서는 효율적인 검색 영역을 선택할 수 있는 정보로 활용 되었다. 제안된 방식은 다양한 주변 잡음환경 (거리, 백화점, 자동차, 사무실, 식당)에서의 실험을 통하여 주변 잡음에 강인한 특성을 보일 뿐만 아니라 검색 속도 또한 향상되는 특징을 보였다.
https://doi.org/10.7776/ASK.2006.25.4.151 인용 PDF KSCI

고강도매질 CR 영상의 잡음 모델링 (Noise Modeling for CR Images of High-strength Materials)

황중원;황재호
- 대한전자공학회논문지SP
- /
- 제45권5호
- /
- pp.95-102
- /
- 2008
이 논문은 고강도매질 CR(Computed Radiography) 영상의 잡음을 모델링하는 적절한 접근법을 제시한다. 잡음 유형의 통계적이고 비선형적 특성이 구체적으로 고안되었다. CR영상은 컴퓨터 처리에 의해 코드화되기 이전 이미 훼손된다. 다양한 형태의 잡음은 비록 디지털화된 상태로 검출된다 하더라도 통상 방사선 영상을 오염시킨다. 양자 방출시의 포아송 분포는 CR 영상판에서의 광자 분포에서 포아송 잡음 분포를 항상 유지하지 않는다. 그 통계적 특성은 재질 특성에 의해 상대적이며 경우의존적이다. 통계적 잡음모델링 과정에서 통상적인 포아송, 이항 내지는 가우스 통계분포의 가정이 고려되었으며 아울러 비선형 효과 또한 포함시켰다. 이는 잡음 영역의 고저 전 방사선량에 걸쳐 추정하는 해석적 모델을 구현한다. 그리고 이 분석적 접근은 고강도 강판튜브 스텝웨지의 방사선측정실험을 통해 관측한 CR 영상데이터에서 구현되었다. 그 결과는 매질의 두께변화에 따른 잡음의 일관성, 잡음분포특성, SNR 및 비선형 보간을 측정하는 상호비교의 파라미터연구에 유용하다.
PDF KSCI

2단 양자화기를 사용한 1차 DPLL의 성능 개선에 관한 연구 (A Study on the Performance of a Modified Binary Quantized first-Order DPLL)

강치우;김진헌
- 대한전자공학회논문지
- /
- 제21권3호
- /
- pp.6-12
- /
- 1984
기존의 2단 양자화된 1차 디지탈 위상포착회로(DPLL)의 포착시간과 정상상태에서의 위상오차를 줄이기 위한 방법을 연구하였다. 기본적인 DPLL에 하향(falling) 영전위교차시간을 검출하여 위상을 교정하는 회로를 첨가하여 그 성능을 개선하기 위한 연구를 하였으며 기본적인 DPLL의 성능과 비교하였다. 그래프방식을 사용하여 잡음이 없는 상태에서 위상스텝 및 주파수 스텝입력에 대한 DPLL의 위상포착과정을 시각적으로 해석하였다. 정현파 입력에 협대역임의잡음(narrow band random noise)이 섞여 있을 때 DPLL의 성능을 분석하기 위해서 Chapman-Kolmogorov 방정식을 사용하였다. 이 방법은 컴퓨터에 의한 모의 시험을 통하여 입증되었다. 수정된 DPLL의 정상상태의 위상오차와 평균포착시간이 기본적인 DPLL의 그것들과 비교되었다. 수정된 DPLL의 포착시간은 거의 두 배 정도 빨라졌으며 정상상태의 위상오차는 신호대잡음비가 커짐에 따라 개선의 폭이 중가하여 결국 영에 접근함을 알 수 있었다.
PDF

2비트 시그마-델타 변조를 이용한 새로운 폴라 트랜스미터 (Novel Polar Transmitter with 2-Bit Sigma-Delta Modulation)

임지연;전상훈;김경학;홍성철;김동욱
- 한국전자파학회논문지
- /
- 제18권8호
- /
- pp.970-976
- /
- 2007
본 논문에서는 2비트 시그마-델타 변조기를 도입한 새로운 구조의 폴라 트랜스미터에 대해 논의한다. 제안된 구조에서는 2비트 시그마-델타 변조 방식을 도입하여 양자화 잡음을 낮추도록 하였다. 전력 증폭기는 2비트 디지털 처리된 진폭 신호를 받아들이기 위하여 2진법의 형태로 분할되도록 고안되었다. 새로운 구조의 폴라 트랜스미터를 EDGE 시스템에 적용하여 시뮬레이션 한 결과, 전체 전송 대역에서 스펙트럼 특성이 개선되는 것을 확인할 수 있었다. 2비트 변조기에 세밀한 양자화 방식을 적용함으로써 오버 샘플링 비가 2배 이상 증가한 정도의 잡음 감소 특성을 얻을 수 있었고 오버 샘플링 비를 증가시키지 않고도, 트랜스미터 출력 신호의 주파수 잡음을 10dB 이상 낮출 수 있었다. 또한, 전력 증폭기를 2진법으로 분할한 결과 다이나믹 영역이 5dB 정도까지 증가하는 효과를 얻었다.
https://doi.org/10.5515/KJKIEES.2007.18.8.970 인용 PDF KSCI

저 전송률 동화상 압축에서 후처리 방법 및 후처리 방법의 주관적 객관적 평가 (Post-filtering in Low Bit Rate Moving Picture Coding, and Subjective and Objective Evaluation of Post-filtering)

이영렬;김윤수;박현욱
- 한국통신학회논문지
- /
- 제24권8B호
- /
- pp.1518-1531
- /
- 1999
MPEG 및 H.263과 같은 동화상 압축 방식에 의하여 고 압축된 영상이 복원되었을 때 블록화 현상, 코너 이상치 (coner outliers), 링잉 잡음이 발생한다. 블록화 현상은 8x8 블록의 코너 (corner) 점에서 발생하는 잡음이며, 링잉 잡음은 영상의 에지 주변에서 발생하는 잡음이다. 그 이유는 MPEG 및 H.263이 8x8 화소 블록의 DCT 계수를 양자화 (quantization)하기 때문이다. 본 논문에서는 MPEG-4 및 H.263의 복원된 영상에서 발생하는 블록화 현상, 코니 이상치, 링잉 잡음을 줄이기 위해 기존의 저자들에 의하여 제안된 방법에 대한 주관적, 객관적 평가를 수행한다. 이 신호 적응형 후처리 방법은 압축된 데이터로부터 추출한 8x8 DCT 계수의 분포 정보와 움직임 벡터 정보를 이용하여 적응적으로 양자화 효과를 (quantization effect) 줄인다. 블록화 현상은 1차원 수평 및 수직 저대역 필터에 (low pass filter) 의하여 줄게 되고, 링잉 잡음은 2차원 신호 적응 필터 (signal-adaptive filter)에 의하여 줄게 된다. 신호 적응형 후처리 방법과 MPEG-4 VM (verification model)의 후처리 방법에 대한 MSSM (Modified Single Stimulus Method)을 이용한 주관적 \ulcorner질평가, 객관적 화질평가 (PSNR), 계산량 복잡도 (complexity)에 관한 비교연구가 컴퓨터 실험에 의하여 수행된다. 컴퓨터 실험을 위하여 MPEG-4에서 입력으로 사용하는 시험용 비데오 시퀀스를 이용하였다. 주관적인 화질 평가에서 두 방법은 비슷한 결과를 보였다. 반면 객관적 평가와 계산량 복잡도 분석 측면에 있어서, 신호 적응형 후처리 방법이 MPEG-4 VM의 후처리 방법보다 우수한 성능을 보였다.
PDF

모서리 잡음 제거를 위한 Loop 필터링 기법 (Loop-Filtering for Reducing Comer outlier)

홍윤표;전병우
- 대한전자공학회논문지SP
- /
- 제41권5호
- /
- pp.217-223
- /
- 2004
블록 기반의 손실 영상 압축 방식에서는 블록마다 다른 양자화 오류로 인하여 블록 경계를 따라 불연속성이 나타날 수 있다. 이러한 블록화 현상은 압축률이 높아질수록 심각하여 화질에 큰 영향을 미친다. 이러한 블록화 현상을 막기 위해 많은 알고리즘들이 제안되었다 그러나 블록화 현상에 대한 연구 중 모서리 잡음이라고 불리는 현상에 대한 연구가 미진하였다. 모서리 잡음은 블록 경계가 교차하는 지점에서 영상 경계가 불연속적으로 나타나게 되는 것을 말한다. 본 논문에서는 블록 기반영상 압축방식에서 발생하는 모서리 잡음의 발생과정과 특성을 분석하고 이 문제를 해결하기 위한 검출과 제거 알고리즘을 제안한다. 실험 결과는 제안 방법이 주관적 화질을 향상시키는 것을 보여준다.
PDF KSCI

분산 동영상 부호화 시스템을 위한 효과적인 상관 잡음 모델링 및 성능평가 (Efficient Correlation Noise Modeling and Performance Analysis for Distributed Video Coding System)

문학수;이창우;이성원
- 한국통신학회논문지
- /
- 제36권6C호
- /
- pp.368-375
- /
- 2011
분산 동영상 부호화 시스템에서는 복호기에서 Wyner-Ziv 프레임을 복원하기 위해서 부호기에서 생성된 패리티비트를 사용하게 된다. 이때 오류 정정 부호로 터보 부호나 LDPC 부호가 사용되는데 복호기에서는 원 Wyner-Ziv 프레임을 모르기 때문에 오류 정정을 위한 효과적인 상관 잡음 모델링이 필요하다. 본 논문에서는 복호기에서 Wyner-Ziv 프레임과 부가정보 간의 상관 잡음을 효과적으로 모델링하기 위한 방법을 제안하고 추정한 상관 잡음 모델이 분산 동영상 부호화 시스템에 미치는 영향을 분석한다. 또한 모의실험을 위해 H.264 intraframe 부호화 방법으로 부호화된 키 프레임을 사용하였는데 부호기에서 동적으로 키 프레임 양자화 파라미터 값을 추정하기 위한 방법을 제안하고 성능을 해석한다.
https://doi.org/10.7840/KICS.2011.36C.6.368 인용 PDF KSCI

검색결과 196건 처리시간 0.023초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)