• 제목/요약/키워드: Voice/Data

검색결과 1,254건 처리시간 0.026초

QCELP Implementation on TMS320C30 DSP Board TMS320C30 DSP를 이용한 QCELP Codec의 실현

  • 한경호
    • The Journal of the Acoustical Society of Korea
    • /
    • 제14권1E호
    • /
    • pp.83-87
    • /
    • 1995
  • 디지털 이동통신에서 사용되는 음성 압축기술의 한가지인 QCELP를 TI사의 TMS320C30을 사용한 DSP 보드를 이요하여 구현하였다. 음성을 받아 QCELP 방식으로 압축하는 프로그램은 TI의 C 코드로 작성하여 DSP 보드의 RAM에 download하여 수행되도록 하였다. PC에는 DSP 보드에서 생성된 voice 데이타를 받아 file로 저장하는 작업을 하게된다. 이것도 C 코드로 작성하였다. 외부 마이크로 입력된 음성신호는 A/D 변환을 거쳐 PCM 데이타가 된다. PCM 데이타는 DSP에 입력되어 QCELP방식으로 압축된 음성 데이타 패킷이 된다. 이 패킷은 PC로 보내 file로 저장하게 된다. 음성을 듣고자 할 경우, 압축된 음성 데이타 패킷을 PC가 DSP보드로 보내어 QCELP방식으로 음성을 합성, 재생한다. 이것을 D/A변환을 거쳐 실지음성이 된다. DSP보드와 PC는 각각의 프로그램 수행상태를 나타내는 Software flag로서로 패킷 데이타를 주고 받을때 결정한다.

  • PDF

Transformer 네트워크를 이용한 음성신호 변환 (Voice-to-voice conversion using transformer network)

  • 김준우;정호영
    • 말소리와 음성과학
    • /
    • 제12권3호
    • /
    • pp.55-63
    • /
    • 2020
  • 음성 변환은 다양한 음성 처리 응용에 적용될 수 있으며, 음성 인식을 위한 학습 데이터 증강에도 중요한 역할을 할 수 있다. 기존의 방법은 음성 합성을 이용하여 음성 변환을 수행하는 구조를 사용하여 멜 필터뱅크가 중요한 파라미터로 활용된다. 멜 필터뱅크는 뉴럴 네트워크 학습의 편리성 및 빠른 연산 속도를 제공하지만, 자연스러운 음성파형을 생성하기 위해서는 보코더를 필요로 한다. 또한, 이 방법은 음성 인식을 위한 다양한 데이터를 얻는데 효과적이지 않다. 이 문제를 해결하기 위해 본 논문은 원형 스펙트럼을 사용하여 음성 신호 자체의 변환을 시도하였고, 어텐션 메커니즘으로 스펙트럼 성분 사이의 관계를 효율적으로 찾아내어 변환을 위한 자질을 학습할 수 있는 transformer 네트워크 기반 딥러닝 구조를 제안하였다. 영어 숫자로 구성된 TIDIGITS 데이터를 사용하여 개별 숫자 변환 모델을 학습하였고, 연속 숫자 음성 변환 디코더를 통한 결과를 평가하였다. 30명의 청취 평가자를 모집하여 변환된 음성의 자연성과 유사성에 대해 평가를 진행하였고, 자연성 3.52±0.22 및 유사성 3.89±0.19 품질의 성능을 얻었다.

모델적응 HMM을 이용한 모바일환경에서의 음성인식에 관한 연구 (A study on Voice Recognition using Model Adaptation HMM for Mobile Environment)

  • 안종영;김상범;김수훈;허강인
    • 한국인터넷방송통신학회논문지
    • /
    • 제11권3호
    • /
    • pp.175-179
    • /
    • 2011
  • 본 논문에서는 모바일 환경에서의 음성인식 개선에 관한 내용으로 기존의 HMM에서 특징보상기법을을 적용한 방식으로 예측잡음이 아닌 실제 오염된 데이터를 적용하여 인식모델을 잡음상황에 맞도록 적응시키는 모델적응 HMM을 사용하였다. 음성인식 시 기존의 방법에서는 주변노이즈를 고려하지 않은 참조패턴을 사용하였으나 본 연구에서는 주변노이즈를 고려한 참조패턴을 생성하여 인식률을 향상 시키는 방법으로 모바일 환경에서의 음성 인식률을 향상 시켰다.

음성과 데이터가 집적된 Cut-Through 교환망의 성능 분석 (Performance Analsis of an Integranted Voice/Data Cut-Through Switching Network)

  • 윤영식;은종관
    • 한국통신학회논문지
    • /
    • 제14권4호
    • /
    • pp.360-368
    • /
    • 1989
  • 본 논문에서는 cut-through 스위칭 방식으로 음성과 데이터를 집적하였을때, 그 성능을 분석하고 패켓 스위칭 방식과 비교하였다. 우선 음성과 데이터 패켓이 네트웍 내의 한 node를 cut-through할 확률을 유도하고, 각각의 네트웍 delay의 Laplace transform을 구했다. 분석결과로 부터 cut-through 스위칭 방식이 패켓 스위칭 방식보다 성능이 우수함을 알 수 있다.

  • PDF

CDMA 이동 통신 시스템에서 음성과 데이터의 동시 서비스를 위한 역방향 트래픽 채널 할당 방법과 컴퓨터 시뮬레이션을 이용한 용량 분석 (Performance Analysis of Reverse Traffic Channels for Mixed Voice and Data Services Using Computer Simulation in CDMA Cellular Systems)

  • 최우용
    • 한국통신학회논문지
    • /
    • 제25권5A호
    • /
    • pp.651-659
    • /
    • 2000
  • 본 연구에서는 CDMA 이동 통신 시스템에서 음성 호와 데이터 호가 동시에 서비스될 때 기지국의 역방향 트래픽 채널에 대한 용량 분석을 위해 컴퓨터 시뮬레이션을 통한 분석 방법을 제안하고자 한다. 특히 음성 호는 호당 하나의 트래픽 채널을 할당 받지만 데이터 호의 효율적인 서비스를 위해 데이터 호는 호 당 서비스를 위해 필요한 최소 트래픽 채널 개수가 있고 트래픽 채널의 용량이 허용하는 한 어떤 최대 트래픽 채널 개수까지 할당 가능하다고 가정한다. 제안된 시뮬레이션 분석 방법에 따른 계산 결과도 제시될 것이다.

  • PDF

Voice Similarities between Sisters

  • Ko, Do-Heung
    • 음성과학
    • /
    • 제8권3호
    • /
    • pp.43-50
    • /
    • 2001
  • This paper deals with voice similarities between sisters who are supposed to have common physiological characteristics from a single biological mother. Nine pairs of sisters who are believed to have similar voices participated in this experiment. The speech samples obtained from one pair of sisters were eliminated in the analysis because their perceptual score was relatively low. The words were measured in both isolation and context, and the subjects were asked to read the text five times with about three seconds of interval between readings. Recordings were made at natural speed in a quiet room. The data were analyzed in pitch and formant frequencies using CSL (Computerized Speech Lab) and PCQuirer. It was found that data of the initial vowels are much more similar and homogeneous than those of vowels in other positions. The acoustic data showed that voice similarities are strikingly high in both pitch and formant frequencies. It is assumed that statistical data obtained from this experiment can be used as a guideline for modelling speaker identification and speaker verification.

  • PDF

Implementation of Extracting Specific Information by Sniffing Voice Packet in VoIP

  • Lee, Dong-Geon;Choi, WoongChul
    • International journal of advanced smart convergence
    • /
    • 제9권4호
    • /
    • pp.209-214
    • /
    • 2020
  • VoIP technology has been widely used for exchanging voice or image data through IP networks. VoIP technology, often called Internet Telephony, sends and receives voice data over the RTP protocol during the session. However, there is an exposition risk in the voice data in VoIP using the RTP protocol, where the RTP protocol does not have a specification for encryption of the original data. We implement programs that can extract meaningful information from the user's dialogue. The meaningful information means the information that the program user wants to obtain. In order to do that, our implementation has two parts. One is the client part, which inputs the keyword of the information that the user wants to obtain, and the other is the server part, which sniffs and performs the speech recognition process. We use the Google Speech API from Google Cloud, which uses machine learning in the speech recognition process. Finally, we discuss the usability and the limitations of the implementation with the example.

The Influences of Trust in Leader on the Employees' Voice Behavior: The Mediating Role of Psychological Safety

  • Du, Jiaxing
    • Asia Pacific Journal of Business Review
    • /
    • 제6권1호
    • /
    • pp.1-19
    • /
    • 2021
  • This research is based on the relevant research literature on the voice behavior, this study examines the influence of trust in leader on voice behavior. And this study examines the role of psychological safety as a mediating between trust in leader and voice behavior. This study uses SPSS for data analysis. The results of the study are as follows: This study explains the impact of trust in leader on psychological safety, and explains the impact of trust in leader on organization members' voice behavior, as well as the impact of psychological safety on organization members' voice behavior. And this study also explains the influence of psychological safety as an intermediary effect on trust in leader and voice behavior. Overall, the higher the level of organization members' trust in leader, the more they will increase the level of psychological safety of the organization members, which will prompt the organization members to make more voice behavior.

AI기반 음성인식 서비스 특성과 상호 작용성 및 이용 의도 간의 구조적 관계 (The Structural Relationships of between AI-based Voice Recognition Service Characteristics, Interactivity and Intention to Use)

  • 이서영
    • 한국IT서비스학회지
    • /
    • 제20권5호
    • /
    • pp.189-207
    • /
    • 2021
  • Voice interaction combined with artificial intelligence is poised to revolutionize human-computer interactions with the advent of virtual assistants. This paper is analyzing interactive elements of AI-based voice recognition services such as sympathy, assurance, intimacy, and trust on intention to use. The questionnaire was carried out for 284 smartphone/smart TV users in Korea. The collected data was analyzed by structural equation model analysis and bootstrapping. The key results are as follows. First, AI-based voice recognition service characteristics such as sympathy, assurance, intimacy, and trust have positive effects on interactivity with the AI-based voice recognition service. Second, the interactivity with the AI-based voice recognition service has positive effects on intention to use. Third, AI-based voice recognition service characteristics such as interactional enjoyment and intimacy have directly positive effects on intention to use. Fourth, AI-based voice recognition service characteristics such as sympathy, assurance, intimacy and trust have indirectly positive effects on intention to use the AI-based voice recognition service by mediating the effect of the interactivity with the AI-based voice recognition service. It is meaningful to investigate factors affecting the interactivity and intention to use voice recognition assistants. It has practical and academic implications.

Gender Classification of Speakers Using SVM

  • Han, Sun-Hee;Cho, Kyu-Cheol
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권10호
    • /
    • pp.59-66
    • /
    • 2022
  • 본 논문에서는 음성 데이터에서 특징벡터를 추출한 후 이를 분석하여 화자의 성별을 분류하는 연구를 진행하였다. 본 연구는 고객이 전화 등 음성을 통해 서비스를 요청할 시 요청한 고객의 성별을 자동으로 인식함으로써 직접 듣고 분류하지 않아도 되는 편의성을 제공한다. 학습된 모델을 활용하여 성별을 분류한 후 성별마다 요청 빈도가 높은 서비스를 분석하여 고객 맞춤형 추천 서비스를 제공하는 데에 유용하게 활용할 수 있다. 본 연구는 공백을 제거한 남성 및 여성의 음성 데이터를 기반으로 각각의 데이터에서 MFCC를 통해 특징벡터를 추출한 후 SVM 모델을 활용하여 기계학습을 진행하였다. 학습한 모델을 활용하여 음성 데이터의 성별을 분류한 결과 94%의 성별인식률이 도출되었다.