• Title/Summary/Keyword: 음성효율

Search Result 871, Processing Time 0.027 seconds

A Method of Automated Quality Evaluation for Voice-Based Consultation (음성 기반 상담의 품질 평가를 위한 자동화 기법)

  • Lee, Keonsoo;Kim, Jung-Yeon
    • Journal of Internet Computing and Services
    • /
    • v.22 no.2
    • /
    • pp.69-75
    • /
    • 2021
  • In a contact-free society, online services are becoming more important than classic offline services. At the same time, the role of a contact center, which executes customer relation management (CRM), is increasingly essential. For supporting the CRM tasks and their effectiveness, techniques of process automation need to be applied. Quality assurance (QA) is one of the time and resource consuming, and typical processes that are suitable for automation. In this paper, a method of automatic quality evaluation for voice based consultations is proposed. Firstly, the speech in consultations is transformed into a text by speech recognition. Then quantitative evaluation based on the QA metrics, including checking the elements in opening and closing mention, the existence of asking the mandatory information, the attitude of listening and speaking, is executed. 92.7% of the automated evaluations are the same to the result done by human experts. It was found that the non matching cases of the automated evaluations were mainly caused from the mistranslated Speech-to-Text (STT) result. With the confidence of STT result, this proposed method can be employed for enhancing the efficiency of QA process in contact centers.

Wireless Speech Recognition System using Psychoacoustic Model (심리음향 모델을 이용한 무선 음성인식 시스템)

  • Noh, Jin-Soo;Rhee, Kang-Hyeon
    • Journal of the Institute of Electronics Engineers of Korea CI
    • /
    • v.43 no.6 s.312
    • /
    • pp.110-116
    • /
    • 2006
  • In this paper, we implement a speech recognition system to support ubiquitous sensor network application services such as switch control, authentication, etc. using wireless audio sensors. The proposed system is consist of the wireless audio sensor, the speech recognition algorithm using psychoacoustic model and LDPC(low density parity check) for correcting errors. The proposed speech recognition system is inserted in a HOST PC to use the sensor energy effectively mil to improve the accuracy of speech recognition, a FEC(Forward Error Correction) system is used. Also, we optimized the simulation coefficient and test environment to effectively remove the wireless channel noises and correcting wireless channel errors. As a result, when the distance between sensor and the source of voice is less then 1.0m FAR and FRR are 0.126% and 7.5% respectively.

Joint CDMA/PRMA의 성능향상 기법에 관한 연구

  • 국광호;이강원;박정우;강석열
    • Proceedings of the Korea Society for Simulation Conference
    • /
    • 2001.05a
    • /
    • pp.134-134
    • /
    • 2001
  • 이동통신 망을 통한 멀티미디어 통신의 수요 급증으로, 차세대 이동통신 시스템에서는 패킷 교환에 기초한 망 구조가 사용될 것으로 예측된다. VOD(Voice Activity Detector)를 갖는 음성 단말은 데이터를 발생시키는 talk spurt(평균이 t$_1$인 지수분포를 따름)와 데이터를 발생시키지 않는 silence period(평균이 t$_2$인 지수분포를 따름)의 두가지 상태를 갖는 마코프 체인으로 모델링된다. Goodman at. al.은 음성 단말들이 talk spurt동안만 데이터를 전송하게 함으로써 더 많은 가입자들을 수용할 수 있는 PRMA(Packet Reservation Multiple Access) 기법을 제안되었다. PRMA 방식에서는 시간 축이 슬롯들로 구성되며 여러개의 슬롯들로 프레임이 형성된다. Silence period 상태에 있던 음성 단말은 talk spurt 상태가 되면 talk spurt의 첫 번째 데이터를 하나의 슬롯을 통해 전송하게 된다. 이때 단말들은 각 슬롯에서 데이터를 전송할 수 있는 확률을 나타내는 채널 접근 확률(channel access probability)에 의해 데이터를 전송하게 되며 전송에 성공하면 슬롯을 예약함으로서 다음 프레임부터는 동일한 위치의 슬롯을 통해 데이터들을 전송하게 된다. DS/CDMA(Direct Sequence/code Division Multiple Access)는 이동통신 단말의 수용 용량상의 이점, 소프트 핸드오버 능력, 보다 용이하게 셀 계획을 세울 수 있는 점 등에 의해 차세대 이동통신 망에서 채택될 예정이다. CDMA 시스템은 간섭(interference)에 의해 용량이 제한을 받게 되며, MAI(Multiple Access Interference)가 시스템의 성능에 많은 영향을 미치게 된다. Brand, et. al.은 간섭의 분산을 줄이기 위해 PRMA 개념을 DS/CDMA 환경으로 확장한 Joint CDMA/PRMA 프로토콜을 제안하였다. 이때 각 슬롯에서의 데이터 전송확률을 그 슬롯에서 예약상태에 있는 음성 단말의 수에 의존하게 하는 방식을 사용하였으며 데이터 전송확률을 나타내는 채널 접근 확률들을 시뮬레이션을 통해 유도하였다. 한편 음성 단말에게는 실시간 서비스를 제공해 주어야 하는 대신 데이터 단말에게는 실시간 서비스를 제공해 주지 않아도 되므로, 트래픽이 많을 때에는 음성 단말의 데이터 전송에 우선권을 주는 것이 바람직하다. 이를 위해서 Brand, et. al.은 채널 접근 확률을 각 슬롯의 트래픽 상태에 따라 적응적으로 산출하는 기법을 제안하였다. 본 연구에서는 Joint CDMA/PRMA의 성능이 채널 접근 함수의 효율성에 많이 의존하게 되므로 보다 효율적인 채널 접근 확률을 구하는 방법을 제안한다. 즉 채널 액세스 확률을 각 슬롯에서 예약상태에 있는 음성 단말의 수뿐만 아니라 각 슬롯에서 예약을 하려고 하는 단말의 수에 기초하여 산출하는 방법을 제안하고 이의 성능을 분석하였다. 시뮬레이션에 의해 새로 제안된 채널 허용 확률을 산출하는 방식의 성능을 비교한 결과 기존에 제안된 방법들보다 상당한 성능의 향상을 볼 수 있었다.

  • PDF

Building of an Intelligent Ship's Steering Control System Based on Voice Instruction Gear Using Fuzzy Inference (퍼지추론에 의한 지능형 음성지시 조타기 제어 시스템의 구축)

  • 서기열;박계각
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.7 no.8
    • /
    • pp.1809-1815
    • /
    • 2003
  • This paper presents a human friendly system using fuzzy inference as a Part of study to embody intelligent ship. We also build intelligent ship's steering system to take advantage of speech recognition that is a part of the human friendly interface. It can bring an effect such as labor decrement in ship. In order to design the voice instruction based ship's steering gear control system, we build of the voice instruction based learning(VIBL) system based on speech recognition and intelligent learning method at first. Next, we design an quartermaster's operation model by fuzzy inference and construct PC based remote control system. Finally, we applied the unposed control system to the miniature ship and verified its effectiveness.

Gain Compensation Method for Codebook-Based Speech Enhancement (코드북 기반 음성향상 기법을 위한 게인 보상 방법)

  • Jung, Seungmo;Kim, Moo Young
    • Journal of the Institute of Electronics and Information Engineers
    • /
    • v.51 no.9
    • /
    • pp.165-170
    • /
    • 2014
  • Speech enhancement techniques that remove surrounding noise are stressed to preprocessor of speech recognition. Among the various speech enhancement techniques, Codebook-based Speech Enhancement (CBSE) operates efficiently in non-stationary noise environments. But, CBSE has some problems that inaccurate gains can be estimated if mismatch occur between input noisy signal and trained speech/noise codevectors. In this paper, the Normalized Weighting Factor (NWF) is calculated by long-term noise estimation algorithm based on Signal-to-Noise Ratio, compensated to the conventional inaccurate gains. The proposed CBSE shows better performance than conventional CBSE.

The Study on The Voice Channel Expansion Using Code Division Multiplexing (부호분할 다중화 기법을 이용한 음성 회선 확대 방안연구)

  • 권기형;진용옥
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.25 no.8A
    • /
    • pp.1206-1212
    • /
    • 2000
  • The subscriber loop subnet at domestic wired telephony networks uses one circuit per one subscriber and the transmission network subnet uses TDM that is composed to 30 voice channels and is assigned to 64kbps per one voice channel of 2.048Mbps in El. On the contrary, the subscriber networks for cellular networks is extent to channel capacity and make it efficiency use CDMA method but the transmission network is used to the same as telephony. In this paper, The subscriber loop at wired network also is shown to increasing effective and lower expensive using CDM.

  • PDF

An Agent Based IP Transcript System in VoIP Network (VoIP망에서 Agent 기반 IP 녹취 시스템)

  • Lim Jae-Jin;Kim Soo-Hee;Jung In-Sang;Jung In-Hwan
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.05a
    • /
    • pp.1243-1246
    • /
    • 2006
  • 초고속 통신망의 확대 적용으로 인터넷의 빠른 성장과 함께 음성과 비디오 그리고 데이터를 통합하고자 하는 노력이 시도되고 있다. VoIP(Voice over IP)는 IP를 이용하여 음성과 데이터를 패킷 형태로 통합하여 실시간으로 전송하는 기술이다[1]. 패킷 네트워크에서 VoIP 시그널링 기술을 이용하면 망 자원으 효율적 이용 및 PSTN에 가까운 음질 그리고 인터넷과 연계한 다양한 음성서비스 지원이 가능하다. 콜센터에서도 VoIP를 사용하게 됨에 따라 VoIP망에서의 녹취 시스템이 필요하다. VoIP 녹취 시스템은 상담원과 고객 간의 통화 내용을 자동으로 녹음하여 보관함으로써 고객의 요구사항을 명확하게 파악할 수 있으며 녹취 데이터의 통계 자료 제공으로 효율적인 관리가 가능하고, 선택 녹취, 스케쥴링 녹취, 상담원의 평가 자료를 제공하여 고객 관리의 질적인 향상을 지원한다. 본 논문에서는 성능에 큰 영향을 주지 않고 기존의 VoIP 녹취 시스템의 문제점을 해결한 에이전트를 포함한 VoIP 녹취 시스템을 제안한다.

  • PDF

An Efficient Vocoder for Digital Cellular System (디지틀 셀룰라 시스템을 위한 효율적인 음성부호화 기술)

  • 강상원;이인성;한경호
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.18 no.9
    • /
    • pp.1348-1357
    • /
    • 1993
  • In this paper, we present code-excited linear prediction coding using trellis coded vector excitation, termed trellis code-excited linear prediction coding (TCELP), for an efficient 8 kbps digital cellular vocoder. A training sequence-based algorithm is developed for designing an optimized codebook subject to the TCELP structure. Also, we discuss the encoding complexity of the TCELP system and trellis symbol release rules that avoid excessive encoding delay. finally, simulation results results for the TCELP coder are given at the bit rate of 8 kbps.

  • PDF

Search Algorithm Embodiment which uses the Image and Speech Signal from the Vido (동영상에서 이미지와 음성신호를 이용한 검색 알고리즘 구현)

  • Shin, In-Kyoung;Rhee, Sang-Burm
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2010.06b
    • /
    • pp.88-91
    • /
    • 2010
  • 정보통신망 및 멀티미디어 기술의 발전으로 인해 정보의 형태는 단순한 텍스트 데이터에서 멀티미디어 데이터로 전환되고 있다. 멀티미디어 기술은 저장, 재생, 압축 등 관련 기술의 빠른 발전과 미디어의 사회, 문화적 역할이 계속 증가함에 따라 우리 사회 전반에 걸쳐 매우 광범위하게 사용되고 있으며, 이로 인해 동영상 검색등의 많은 검색을 요구 하고 있으나, 동영상 검색의 문제점은 생산되는 컨텐츠에서 동영상이 가지고 있는 비중은 계속해서 높아지지만 쌓아진 데이터를 검색하기엔 몇 가지 문제점이 있다. 첫 번째는 데이터의 중복성이고 두 번째는 제목, 내용 그리고 Keyword가 일치하지 않으며, 세 번째는 저자권 침해 등이 있다. 본 연구에서는 본 논문에서는 빠르게 변화되고 있는 정보화 시대에 맞게 동영상에서 음성과 얼굴영역을 검출하여, 검색 시 효율적이고 정확한 데이터의 검색이 이루어 질 수 있도록 검색 알고리즘을 제안하고 소개하며, 이중 두 번째의 문제점인 제목, 내용 그리고 Keyword의 불일치한 점에 두어 검색 시 영상의 이미지 검색과 음성을 통하여 keyword를 찾아 효율적이고 검색율의 높일 방법을 연구한다.

  • PDF

An Energy-Efficient Broadcast Method based on Nack Mechanism for Bluetooth Low Energy Environment (Bluetooth Low Energy 환경에서 에너지 효율을 위한 Nack 기반 Broadcast 전송 기법 연구)

  • Jung, Yeon-Seung;Son, Bong-Ki;Lee, Jae-Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.10a
    • /
    • pp.457-459
    • /
    • 2015
  • Bluetooth Low Energy 기술은 IoT 환경의 개인 영역 통신 시스템의 발달과 함께 저전력 근거리 통신 기술의 대표되는 기술로써 현재까지 에너지 효율을 우선시하여 개발되어 왔다. 하지만 홈 네트워크 환경이나 공공지역에서 서비스되는 음성안내 등의 환경에서 Bluetooth Low Energy 기술이 적용될 경우 Broadcast 형태의 음성 데이터 전달이 요구될 수 있으며, 이 경우 Bluetooth Low Energy를 포함한 대부분의 저전력 근거리 통신 기술에서는 Duty Cycle 등의 에너지 고효율 정책으로 인하여 Broadcast 데이터 수신에 대한 신뢰성이 보장되기 힘들기 때문에, 보편적으로 n-repetition 방식의 데이터 전달 방식을 적용하고 있다. 본 고에서는 이러한 n-repetition 방식의 데이터 전달에 대한 중복 송신에서 발생되는 에너지 소모를 개선시키고자 Nack 기반의 선택적 재전송 형태의 새로운 Broadcast 기법을 제안하며, 실험을 통하여 이에 대한 효율성을 검증하였다.