Search | Korea Science

Voice Recognition using a Phoneme based Similarity Algorithm in Home Networks (음소 기반의 유사율 알고리즘을 이용한 Home Network 환경에서의 음성 인식)

Lee, Chang-Sub;Yu, Jae-Bong;Park, Joon-Seok;Yang, Soo-Ho;Kim, Yu-Seop;Park, Chan-Young
- Proceedings of the Korea Information Processing Society Conference
- /
- 2005.05a
- /
- pp.767-770
- /
- 2005
네트워크상에서 전달되는 음성데이터는 전달되는 과정에서 잡음 등의 외부 요인으로 인하여 데이터에 손실이 생기는 문제가 발생한다. 이렇게 전달된 음성데이터가 음성 인식기를 통과하면 바로 음성 인식기를 통과했을 때 보다 인식률이 낮아진다. 본 연구에서는 홈 네트워크를 제어하는데 있어서 음성 인식률을 향상시키기 위해서 음성 데이터를 입력받아, 이를 음소단위 기반의 유사율 알고리즘을 적용시켜 이미 구축된 홈 네트워크 용어 관련 사전에 등록된 단어와의 유사성을 검토하여 추출된 결과로 홈 네트워크를 제어하는 방안을 제안한다. 음소단위 기반의 유사율 알고리즘과 다중발화를 이용했을 때 Threshold 값이 85% 일 경우 사전에 구축된 단어와 매칭된 인식률은 100%였으며, 사전에 없는 단어의 오인식률은 2%로 감소되었다.
PDF

Transcoding Algorithm from 8 kbps G.729A to 5.3 kbps G.723.1 (8 kbps G.729A에서 5.3 kbps G.723.1로의 상호부호화 알고리듬)

윤성완;정성교;박영철;윤대희
- Proceedings of the IEEK Conference
- /
- 2000.09a
- /
- pp.823-826
- /
- 2000
유/무선 통신 시스템에서는 통신망마다 각각 다른 음성 부호화기를 사용하므로 음성신호는 두 번의 부/복호화 과정을 거치게 된다. 이로 인해 음질저하, 계산량 증가, 그리고 전달 지연 증가 등의 문제가 발생된다. 본 논문에서는 위의 문제점들을 개선하기 위하여 패킷 음성통신과 무선 이동 통신에 사용되는 음성 부호화기의 상호부호화를 위한 알고리듬을 제안한다 효율적인 음성 패킷 변환 방법을 제안하였으며, 8 kbps G.729A 패킷을 5.3 kbps G.723.1 패킷으로 변환하는 방법을 제안한다. 제안된 음성 패킷 변환 방법은 LSP 변환과정, 적응코드북 변환과정 그리고 고정 코드북 고속 탐색 과정으로 구성된다. 여러 가지 음성 신호로 모의 실험한 결과, 본 논문에서 제안된 상호부호화 알고리듬이 두 번의 부/복호화 과정을 거친 경우보다 짧은 전달 지연 시간과 적은 계산량으로 동등한 음질의 음성신호로 복호화함을 확인하였다.
PDF

An Efficient Transcoding Algorithm Between G. 723.1 And G. 729A Speech Coders (G.723. 1 음성부호화기의 G.729A 음성부호화기의 상호 부호화 알고리듬)

윤성완;정성교;박영철;최용수;윤대희
- The Journal of Korean Institute of Communications and Information Sciences
- /
- v.26 no.4B
- /
- pp.457-462
- /
- 2001
유/무선 통신 시스템에서는 통신망보다 서로 다른 음성 부호화기를 사용하므로 음성신호는 두 번의 부/복호화과정을 거치게 되어 음질저하, 연산량 증가, 그리고 전달 지연 증가 등의 문제가 발생된다. 본 논문에서는 위의 문제점들을 개선하기 위하여 유/무선 음성통신에 사용되는 음성 부호화기의 상호 부호화 알고리듬을 제안하고, 5.3 kbps G. 723.1의 패킷과 8 kbit/s G.729.A 패킷을 서로 변환하는 방법을 제안한다. 여러 가지 음성 상호 대해 객관적 음질 평가와 주관적 선호도 평가를 수행한 결과, 제안된 상호 부호화 알고리듬이 이중 부/복호화보다 짧은 전달 지연 시간과 26-37% 적은 연산량으로 동등한 음질의 음성신호를 복호화함을 확인하였다.
PDF

An Implementation of Multimedia Game using Speech Recognition for Windows (Windows환경에서 음성인식을 이용한 멀티미디어 게임의 구현)

윤재선
- Proceedings of the Acoustical Society of Korea Conference
- /
- 1998.06e
- /
- pp.335-338
- /
- 1998
본 논문에서는 음성인식 알고리즘인 HMM을 사용하여 Windows 환경에서 온라인으로 사용할 수 있는 음성인식 게임“Voice Illust Magic”개발에 관하여 소개한다. 사용자와 컴퓨터가 상호작용(Interaction)할 수 있는 매체를 마우스와 키보드뿐만 아니라 게임에 필요한 명령어를 음성인식으로 실행함으로써 정보전달이 매우 효과적으로 이루어져 사용자가 접근하기 쉽고 편리하게 되었으며 의사전달 효율을 높일 수 있었다. 음성인식 과정을 온라인으로 마이크를 통해 들어온 음성을 자동으로 끝점을 검출한 후, Mel-Cepstrum을 추출하여 Word 단위의 reference HMM과 비교하여 최적의 model이 선택되면, 윈도우즈에게 메시지를 보내어 마우스나 키보드가 동작하는 것과 마찬가지로 실행되도록 하였다. 또한, 입력 음성을 모든 reference pattern과 비교하는 것이 아니라 그 상황에 적용될 수 있는 표준 패턴을 한정함으로써 탐색시간을 줄일 수 있었으며 높은 인식률을 나타내었다.
PDF

Transmission of Channel Information Using Voice Packet in the Vocoder (음성압축기의 음성패킷을 이용한 채널에러 정보 전달)

Cha Sungho;Park Hochong
- Proceedings of the Acoustical Society of Korea Conference
- /
- autumn
- /
- pp.7-10
- /
- 2000
본 논문은 이동통신상에서 송신측의 송신 채널 에러정보를 수신측에서 송신측으로 전달하는 음성패킷을 이용하여 송신측에 알려주어 압축과정에 이용하게 할 수 있는 방법을 제안한다. ACELP(Algebraic CELP)구조 방식을 가지고 있는 음성압축기들 중 G.729을 사용하며 음성 패킷정보 중 Pitch Delay와 Fixed Codebook를 이용하여 전송음성 패킷안에 상대방의 송신 채널정보를 싣는다. 수신측에서 받은 패킷이 Erasure로 판단되었을 때 패킷정보들 중 Fixed Codebook Index를 만들게 되는 4개의 Optimal 펄스 중 2개의 펄스만 사용하며 나머지 2개의 펄스는 약속된 임의의 위치에 위치시킨 후 송신측에 전송시킨다. 상대방에서 약속에 맞는 위치의 펄스를 보내왔을 때를 체크함으로써 자신의 송신채널 상태를 알 수 있게 된다 송신채널에$5\%$ Erasure 채널 에러가 발생했을 때 채널정보를 가진 패킷의 음질은 약 0.1dB 정도 떨어지게 된다. 하지만 음성압축 전송 시 송신채널의 정보를 이용하여 무선채널에러에 강하게 할 수 있다.
PDF

기능성 음성 질환(Functional Voice Disorders)과 성대의 움직임

안철민
- Proceedings of the KSLP Conference
- /
- 2003.11a
- /
- pp.190-192
- /
- 2003
음성은 단순히 성대에서 만들어지는 것이 아니다. 호흡을 시작으로 성대의 접촉과 점막 진동에 의해 만들어진 소리가 공명강을 거쳐 입술, 혀의 움직임을 거쳐 최종적으로 의미를 전달하는 소리로 완성된다. 기능성 음성 질환은 이러한 과정 중에서 발성 방법과 같은 기능적 문제에 의하여 발생하게 된다. 따라서 기능성 음성 질환이 있을 때 이러한 과정의 움직임에 대한 조사가 필요하다. (중략)
PDF

Design and Implementation of the Mobile Lecture Support System (모바일 기반 강의 지원 시스템 설계 및 구현)

Kim, JunSik;Choi, YoungGil;Park, Suhyun
- Proceedings of the Korean Institute of Information and Commucation Sciences Conference
- /
- 2016.05a
- /
- pp.457-459
- /
- 2016
This lecture support system can be used to smoothly transfer the sound in the auditorium or the particular outdoor space. Commercial lecture support system is useful but very expensive. Therefore in this paper we have designed and developed lecture support system using a mobile phone. We can exactly hear the lecture in difficult situation using this system. The system provides the ability to save a lecture in the storage, so we can hear the lecture repeatedly.
PDF

음성인식

김형순
- Proceedings of the KSPS conference
- /
- 1994.02a
- /
- pp.156-165
- /
- 1994
반도체 및 컴퓨터 응용기술 등의 급속한 발전과 더불어 인간의 가장 자연스러운 의사 전달수단인 음성을 인간과 기계 사이의 의사소통의 매개체로 사용하기 위한 음성인식기술에 관한 연구가 활발히 진행되고 있으며, 일부 상품화된 음성인식 시스템들이 다양한 응용분야에 걸쳐 등장하고 있다. 본 고에서는 지금까지 개발되어온 음성인식기술의 방법론 및 기술적으로 해결해야 할 과제들을 살펴보고, 음성인식기술에 관한 국내외 연구동향과 음성인식의 응용분야, 그리고 앞으로의 전망에 대해 논의한다. 이 과정에서 음성학 및 언어학적 지식이 음성인식에서 차지하는 중요성에 대해서도 일부 언급한다.
PDF

A Study of Voice Service Architecture Using MPLS Technology Based on ATM (ATM기반 MPLS 기술을 이용한 음성서비스 제공 구조 연구)

Yoon, Hyeon-Sik;Yang, Sun-Hee
- Proceedings of the Korea Information Processing Society Conference
- /
- 2002.11b
- /
- pp.1301-1304
- /
- 2002
통신 환경이 변하면서, 기존의 서비스에 따라 크게 음성망과 패킷망으로 구분되던 망 구조가 하나의 통합된 망에서 모든 서비스를 제공하는 구조로 진화하고 있다. 그리고, 이러한 서비스를 가능하게 하는 기술로서 VoIP(Voice over IP)가 최근까지도 계속 각광받고 있다. 그러나, 많은 노력에도 불구하고, 음성서비스와 같은 실시간 서비스의 엄격한 품질 요구조건을 보장하는 문제 때문에 VoIP 기술의 실제 적용이 지연되고 있다. 이에 본 논문에서는 통합망의 패킷 전달망을 ACE2000 MPLS 시스템 기반의 MPLS 망으로 구축함으로써 음성서비스의 품질을 보장하는 망 구조를 제시하고자 한다. 아울러 TE Server를 이용해서, 음성호를 전달하는 ER-LSP(Explicit Routed Label Switched Path)를 설정하는 호 설정 절차를 제시하였다.
PDF

A Microphone Array Beamformer for the Performance Enhancement of Speech Recognizer in Car (차량환경에서 음성인식 성능 향상을 위한 마이크로폰 어레이 빔형성 기법)

Han Chul-Hee;Kang Hong-Goo;Hwang Youngsoo;Youn Dae-Hee
- The Journal of the Acoustical Society of Korea
- /
- v.24 no.7
- /
- pp.423-430
- /
- 2005
In this paper. a microphone array beamforming algorithm that reduces the signal distortion caused by reverberation and near-field effect in car environment is proposed. When reverberation or near-field effect is present, an optimum beamformer should be constructed with a steering vector consisting of transfer functions between source and microphones, but it is generally difficult to estimate transfer functions on-line without knowledge of the source signal. Instead, a sub-optimal beamforming algorithm that reduces signal distortion is proposed. It is constructed with steering vectors consisting of relative transfer functions between reference sensor and other sensors. In order to evaluate the performance of the proposed algorithm. we had recorded noisy speech database in a car, and performed speech recognition experiments with HMM Toolkit (HTK) released by Cambridge University. The recognition rate of the proposed algorithm was 15 percents higher than that of the conventional far-field beamformers in best case.
PDF KSCI

Search Result 485, Processing Time 0.027 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)