• 제목/요약/키워드: Voice communication

검색결과 1,027건 처리시간 0.027초

RVR에 의한 자율주행로봇의 정밀제어에 관한연구 (A Study on Precise Control of Autonomous Travelling Robot Based on RVR)

  • 심병균;;김종수;하언태
    • 한국산업융합학회 논문집
    • /
    • 제17권2호
    • /
    • pp.42-53
    • /
    • 2014
  • Robust voice recognition (RVR) is essential for a robot to communicate with people. One of the main problems with RVR for robots is that robots inevitably real environment noises. The noise is captured with strong power by the microphones, because the noise sources are closed to the microphones. The signal-to-noise ratio of input voice becomes quite low. However, it is possible to estimate the noise by using information on the robot's own motions and postures, because a type of motion/gesture produces almost the same pattern of noise every time it is performed. In this paper, we propose an RVR system which can robustly recognize voice by adults and children in noisy environments. We evaluate the RVR system in a communication robot placed in a real noisy environment. Voice is captured using a wireless microphone. Navigation Strategy is shown Obstacle detection and local map, Design of Goal-seeking Behavior and Avoidance Behavior, Fuzzy Decision Maker and Lower level controller. The final hypothesis is selected based on posterior probability. We then select the task in the motion task library. In the motion control, we also integrate the obstacle avoidance control using ultrasonic sensors. Those are powerful for detecting obstacle with simple algorithm.

바이오매트릭스 정보를 이용한 모바일 기반의 통합 OTP 프레임워크의 유효성 검증 (Availability Verification of Integration OTP Framework using Biometrics Information)

  • 차병래;김남호;김종원
    • 한국항행학회논문지
    • /
    • 제15권1호
    • /
    • pp.39-53
    • /
    • 2011
  • 모바일 장치의 광범위한 응용과 더불어 통신 보안과 연구가 최근 중요한 관심사가 되고 있다. 본 논문에서는 바이오매트릭스의 지문과 음성의 특징을 이용한 모바일 통합 OTP의 일회용 암호 키 토큰을 생성하는 방법을 제안한다. 강력한 개인 인증에 사용되는 바이오매트릭스의 지문과 음성 정보를 이용하여 모바일 환경의 가변적이고 안전한 일회용 암호 키를 생성하는 OTP 프레임워크를 제안하였으며, 또한 제안 기법에 대한 dendrogram을 이용한 지문과 음성 특징 점에 의한 준동형적 가변성 그리고 지문과 음성 특징 점의 분포를 시뮬레이션 하여 유효성을 검증하였다.

텔레메틱스 기반의 통화음질향상을 위한 잡음제거 알고리즘의 성능비교 (Performance Comparison of Noise Reduction Algorithms for Enhancing Voice Quality based on Telematics)

  • 김형국;최홍재
    • 한국ITS학회 논문지
    • /
    • 제11권1호
    • /
    • pp.86-91
    • /
    • 2012
  • 다양한 잡음환경에 노출되는 텔레메틱스 기반의 음성 통화 시스템에서 고품질의 통화 품질을 제공하기 위해서는 저연산량을 가지며 효과적으로 배경 잡음을 제거할 수 있는 잡음제거 알고리즘이 요구된다. 본 논문에서는 Mel-Filter 기반의 잡음제거 알고리즘을 제안하며, 제안된 알고리즘을 기존 잡음제거 알고리즘들과 비교하여 설명한다. 자동차 잡음과 배블 잡음 환경에서 잡음제거 알고리즘의 성능 측정 결과, 제안된 Mel-Filter 기반의 잡음제거 알고리즘이 기존 잡음제거 알고리즘들에 비해 비슷한 PESQ 성능에 적은 연산량을 가지는 장점을 가지고 있으며, 제안된 잡음제거 알고리즘이 텔레메틱스 단말기에서 효과적으로 잡음을 제거할 수 있음을 입증하였다.

고객센터를 통한 고객지식 확보 전략: 음성인식기술의 적용 사례 (A Study on Customer Knowledge Acquisition Strategy via a Customer Center: A Case of Voice Recognition Technology Application)

  • 홍병선;고준
    • 지식경영연구
    • /
    • 제19권1호
    • /
    • pp.147-174
    • /
    • 2018
  • Recently, firms have been putting forth significant efforts to fulfill various demands and high expectations of customers. The role and importance of customer centers as a direct contact point for customer relationship management are more emphasized than previously. A customer center draws attention as a new alternative to secure corporate competitiveness as it contributes to sales increase, being in a position to satisfy customers' needs by ensuring customers' access to information. A customer center is an aggregation of various information and communication technologies. In particular, a voice recognition/analysis technology based on big data can elaborate customer services further, enhance customer satisfaction, and trigger constant interactions with customers. A customer center can be transformed to a hub of customer knowledge and the embodiment of business intelligence in the front line of business. This article is a case study on how the customer center of the K life insurance company regarding customer center operation collects and analyzes customer information and how it has established its voice recognition/analysis system based on big data to improve customer experience management. Factors affecting the successful introduction and implementation of voice recognition/analysis system to a firm, are examined.

The Comparisons of GRBAS Perceptual Judgments according to Levels of Utterances

  • Pyo, Hwa-Young;Sim, Hyun-Sub
    • 음성과학
    • /
    • 제8권1호
    • /
    • pp.135-142
    • /
    • 2001
  • The present study was performed to investigate adequate levels of utterances which can give essential as well as useful information about the patients' voice, by examining the degrees of correlation between the levels of utterances (vowels, words, and phrase paragraph reading) and the entire utterance including all of the levels. For this purpose, a total of 10 individual utterance samples (5 vowels, 3 words, 1 phrase, 1 paragraph reading) were collected from each of the 30 subjects with voice disorder patients, and four experienced voice therapists evaluated them using GRBAS. The results showed that four therapists highly agreed upon on 'G' parameter. The coefficient of the correlation between each level of utterance and entire utterance tended to be above 0.70. Judgements of the vowel /$\varepsilon$/ as well as /o/ highly correlated with the judgement of the entire utterance. Regardless of severity, the judgement of the entire utterance highly correlated with the judgements of the vowel /u/ and the paragraph reading. These results suggest that experienced voice therapists can precisely evaluate patients' voice quality with only one sustained vowel in the clinic field, as is done with the entire utterance evaluation.

  • PDF

시각장애인용 웹사이트 자동생성 툴 개발 (Development of Automatic Creating Web-Site Tool for the Blind)

  • 백현기;하태현
    • 디지털콘텐츠학회 논문지
    • /
    • 제8권4호
    • /
    • pp.467-474
    • /
    • 2007
  • 본 연구는 시각장애인을 위해 음성 인식, 음성 합성 기술을 이용하여 일반인과 마찬가지로 개인의 특성에 맞는 홈페이지를 구축하게 하는 웹 사이트 자동 생성 툴을 개발 하였다. 이 연구에서 개발한 툴을 이용하여 시각 장애인은 개인 맞춤 정보 생성 기능과 관리기능을 통해 일반인과 의사소통을 원활하게 할 수 있다. 또한 이 툴은 기본적인 명령어를 음성인식으로 처리할 수 있게 지원하며, 음성출력이 지원되는 TTS등을 추가적으로 제공한다. 따라서 본 연구개발의 결과물은 시각장애인들이 사회적 소외감을 없애며, 정보화 시대에 동등한 위치에서 생활 할 수 있도록 하는데 중요한 역할을 할 것이다.

  • PDF

잡음 환경에서 음성 인식률 향상에 필요한 MEMS 장치 개발에 관한 연구 (The research on the MEMS device improvement which is necessary for the noise environment in the speech recognition rate improvement)

  • 양기웅;이형근
    • 한국정보통신학회논문지
    • /
    • 제22권12호
    • /
    • pp.1659-1666
    • /
    • 2018
  • 입력된 소리가 음성과 음향이 혼재된 경우 잡음의 영향으로 음성 인식률이 저하됨을 알 수 있으며 S/W적 처리 한계를 극복코자 H/W 장치인 MEMS 장치를 개발하여 음성 인식률을 향상시켰다. MEMS 마이크로폰 장치는 음성을 입력하는 장치로서 다양한 모양으로 구현되어 사용된다. 기존 MEMS 마이크로폰은 일반적으로 우수한 성능을 발휘하나 잡음 과 같은 특수 환경에선 음성과 음향이 혼재되어 처리 성능이 저하되는 문제점이 발생됨을 알 수 있었다. 이러한 문제점을 개선코자 초기 입력장치에 음성 특성을 구분하여 검출할 수 있는 신규 고안된 MEMS 장치를 사용하여 향상시켰다.

Voice Frequency Synthesis using VAW-GAN based Amplitude Scaling for Emotion Transformation

  • Kwon, Hye-Jeong;Kim, Min-Jeong;Baek, Ji-Won;Chung, Kyungyong
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권2호
    • /
    • pp.713-725
    • /
    • 2022
  • Mostly, artificial intelligence does not show any definite change in emotions. For this reason, it is hard to demonstrate empathy in communication with humans. If frequency modification is applied to neutral emotions, or if a different emotional frequency is added to them, it is possible to develop artificial intelligence with emotions. This study proposes the emotion conversion using the Generative Adversarial Network (GAN) based voice frequency synthesis. The proposed method extracts a frequency from speech data of twenty-four actors and actresses. In other words, it extracts voice features of their different emotions, preserves linguistic features, and converts emotions only. After that, it generates a frequency in variational auto-encoding Wasserstein generative adversarial network (VAW-GAN) in order to make prosody and preserve linguistic information. That makes it possible to learn speech features in parallel. Finally, it corrects a frequency by employing Amplitude Scaling. With the use of the spectral conversion of logarithmic scale, it is converted into a frequency in consideration of human hearing features. Accordingly, the proposed technique provides the emotion conversion of speeches in order to express emotions in line with artificially generated voices or speeches.

자동차 ECU제어를 위한 음성인식 패턴매칭레벨에 관한 연구 (A Study on Voice Recognition Pattern matching level for Vehicle ECU control)

  • 안종영;김영섭;김수훈;허강인
    • 한국인터넷방송통신학회논문지
    • /
    • 제10권1호
    • /
    • pp.75-80
    • /
    • 2010
  • 자동차 환경에서의 음성인식은 잡음처리가 매우 중요한 요소이다. 하드웨어 및 소프트웨어로 적인 접근방법으로 많은 연구가 되어 지고 있다. 하드웨어적인 방법으로는 Low-pass filter를 기본으로한 잡음처리 필터가 많이 연구되어 가시적인 성과를 보이고 있고, 소프트웨어적으로는 Noise canceler, 신경망 등 패턴인식 알고리듬의 연구가 이루어지고 있다. 본 논문에서는 시계열 패턴인식에 적용 가능한 알고리듬인 DTW(Dynamic Time Warping)를 자동차 잡음환경에 적용하여 그 음성인식을 위한 파라미터 패턴에 대한 매칭 레벨을 분류하여 잡음환경 적합한 패턴 매칭 레벨을 분석 하였다.

삼중 보안 기능을 가지는 스마트 도어락 개발 (Development of the Smart Doorlock with Triple Security Function)

  • 문서영;민경원;서재섭;이선우;고윤석
    • 한국전자통신학회논문지
    • /
    • 제15권1호
    • /
    • pp.115-124
    • /
    • 2020
  • 본 논문에서는 현대 사회에서 도어락의 보안성 취약으로 인한 범죄사건들에 대해 보완이 필요하다고 생각하여 보안능력을 강화한 3중 보안 시스템 스마트 도어락을 연구하였다. 앱 이클립스 프로그램을 기반으로 제작한 핸드폰 어플을 통해 도어락 ON&OFF시스템과 음성인식기능, 광학식 지문센서를 사용한 지문인식 기능을 최종으로 잠금과 잠금해제가 가능한 삼중 보안 도어락을 실험, 제작하였다. 끝으로, 실험 제작된 3중 도어락에 대한 앱 기반 동작 실험, 음성 인식 동작실험, 실험지문 인식 동작실험에 대한 평가결과를 통해 도어락의 보안성을 강화할 수 있음을 확인할 수 있었다.