• Title/Summary/Keyword: 음성감정인식

Search Result 142, Processing Time 0.027 seconds

Design And Implementation of a Speech Recognition Interview Model based-on Opinion Mining Algorithm (오피니언 마이닝 알고리즘 기반 음성인식 인터뷰 모델의 설계 및 구현)

  • Kim, Kyu-Ho;Kim, Hee-Min;Lee, Ki-Young;Lim, Myung-Jae;Kim, Jeong-Lae
    • The Journal of the Institute of Internet, Broadcasting and Communication
    • /
    • v.12 no.1
    • /
    • pp.225-230
    • /
    • 2012
  • The opinion mining is that to use the existing data mining technology also uploaded blog to web, to use product comment, the opinion mining can extract the author's opinion therefore it not judge text's subject, only judge subject's emotion. In this paper, published opinion mining algorithms and the text using speech recognition API for non-voice data to judge the emotions suggested. The system is open and the Subject associated with Google Voice Recognition API sunwihwa algorithm, the algorithm determines the polarity through improved design, based on this interview, speech recognition, which implements the model.

A Study on the Extraction of the Meaning in the User Behavior and the Possibility to Apply for the Interface of the Wearable Computer (웨어러블 컴퓨터의 인터페이스를 위한 사용자 행동의 의미추출과 적용가능성에 관한 연구)

  • Kwon, Suk-Kyoung;Jung, Ji-Hong
    • 한국HCI학회:학술대회논문집
    • /
    • 2006.02b
    • /
    • pp.112-117
    • /
    • 2006
  • 웨어러블 컴퓨터는 사용자를 중심으로 의복과 기술이 결합된 기기로서 직관적이며 유연한 인터페이스가 요구된다. 현재 직관적인 입력방식으로 음성인식과 동작인식에 대한 연구가 활발하게 진행되고 있다. 동작인식의 경우 손동작을 이용한 장갑형태가 가장 많으며, 대부분 사용자 행동의 의미를 고려하지 않은 인위적인 제스처로 학습을 필요로 한다. 본 연구에서는 사용자가 일상적으로 하는 행동에서 의미를 추출하고, 웨어러블 컴퓨터의 인터페이스로서 적용가능성을 보고자 한다. 행동은 자극에 대한 신체의 움직임이다. 문헌을 통하여 신체의 움직임에 대한 66개의 동사를 추출하고 구체적인 움직임에 구문조사를 실시하였다. 조사된 구문에 대한 상황과 의미를 조사한 결과 행동은 의미에 따라 감정표현, 의사전달, 정보교류, 자기제어, 기기제어, 무의식적, 의례적의 7가지로 분류할 수 있었다. 그 중 의사소통과 대상을 제어하기 위한 행동을 중심으로 접근하였다. 행동의 의미와 현재 사용되고 있는 UI의 의미를 비교하여 인터페이스를 대응시켜 보았다.

  • PDF

Design of a Mirror for Fragrance Recommendation based on Personal Emotion Analysis (개인의 감성 분석 기반 향 추천 미러 설계)

  • Hyeonji Kim;Yoosoo Oh
    • Journal of Korea Society of Industrial Information Systems
    • /
    • v.28 no.4
    • /
    • pp.11-19
    • /
    • 2023
  • The paper proposes a smart mirror system that recommends fragrances based on user emotion analysis. This paper combines natural language processing techniques such as embedding techniques (CounterVectorizer and TF-IDF) and machine learning classification models (DecisionTree, SVM, RandomForest, SGD Classifier) to build a model and compares the results. After the comparison, the paper constructs a personal emotion-based fragrance recommendation mirror model based on the SVM and word embedding pipeline-based emotion classifier model with the highest performance. The proposed system implements a personalized fragrance recommendation mirror based on emotion analysis, providing web services using the Flask web framework. This paper uses the Google Speech Cloud API to recognize users' voices and use speech-to-text (STT) to convert voice-transcribed text data. The proposed system provides users with information about weather, humidity, location, quotes, time, and schedule management.

Speech Parameters for the Robust Emotional Speech Recognition (감정에 강인한 음성 인식을 위한 음성 파라메터)

  • Kim, Weon-Goo
    • Journal of Institute of Control, Robotics and Systems
    • /
    • v.16 no.12
    • /
    • pp.1137-1142
    • /
    • 2010
  • This paper studied the speech parameters less affected by the human emotion for the development of the robust speech recognition system. For this purpose, the effect of emotion on the speech recognition system and robust speech parameters of speech recognition system were studied using speech database containing various emotions. In this study, mel-cepstral coefficient, delta-cepstral coefficient, RASTA mel-cepstral coefficient and frequency warped mel-cepstral coefficient were used as feature parameters. And CMS (Cepstral Mean Subtraction) method were used as a signal bias removal technique. Experimental results showed that the HMM based speaker independent word recognizer using vocal tract length normalized mel-cepstral coefficient, its derivatives and CMS as a signal bias removal showed the best performance of 0.78% word error rate. This corresponds to about a 50% word error reduction as compare to the performance of baseline system using mel-cepstral coefficient, its derivatives and CMS.

Development of intelligent IoT control-related AI distributed speech recognition module (지능형 IoT 관제 연계형 AI 분산음성인식 모듈개발)

  • Bae, Gi-Tae;Lee, Hee-Soo;Bae, Su-Bin
    • Annual Conference of KIPS
    • /
    • 2017.11a
    • /
    • pp.1212-1215
    • /
    • 2017
  • 현재 출시되는 AI스피커들의 기능들을 재현하면서 문제점을 찾아서 보완하고 특히 우리나라 1인 가구의 급격한 증가로 인한 다양한 사회 문제들의 해소 방안으로 표정인식을 통해 먼저 사용자에게 다가가는 감정적인 대화가 가능한 인공지능 서비스와 인터넷 환경에 무관한 홈 IoT 제어 그리고 시각데이터 제공이 가능한 다중 AI 스피커를 제작 하였다.

Development of Perfume-Injection Module of Robotic Cellular Phone (로보틱셀폰(RCP)의 감성발향 모듈의 개발)

  • 최재일;임찬영;김승우
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2004.05a
    • /
    • pp.770-773
    • /
    • 2004
  • IT(Information Technology)분야의 발전과 함께 RT(Robot Technology)분야도 21세기의 유망한 첨단기술로 손꼽히고 있다. 현재의 로봇은 그동안 주류를 이루던 산업용 로봇과는 달리 소프트컴퓨팅, 인간친화 인터페이스, 상호작용기술, 음성인식, 물체인식, 사용자 의도파악 등 갖가지 최첨단 기술들이 요구되는 퍼스널 로봇이 각광을 받고 있으며, 특히 오락용, 교육용 로봇들로 대표되는 엔터테인먼트 로봇(Entertainment Robot)분야가 요즘 국내·외에서 활발히 연구되고 있는 실정이다. 엔터테인먼트 로봇은 정형화된 작업만을 하는 것이 아니라 다양한 환경에서 여러 가지 작업을 해야만 한다. 따라서, 장난감 로봇처럼 인간과의 감정대화가 가능한 지능 시스템을 갖춰야만 한다. 그러므로 본 논문에서는 IT분야와 RT분야의 접목으로 시너지 효과를 크게 얻을 수 있는 새로운 기술 개념인 RCP(Robotic Cellular Phone)에 대한 개념을 정의하고, RCP의 기능성 모듈 중 하나인 감성발향 모듈에 대한 기본적인 이론과 실험적 결과를 통하여 로보틱 셀폰의 감성발향 모듈의 우수성을 확인한다.

  • PDF

Development of Emotional-Vibration Module of Robotic Cellular Phone (로보틱셀폰(RCP)의 감성진동 모듈의 개발)

  • 최재일;임찬영;김승우
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2004.05a
    • /
    • pp.766-769
    • /
    • 2004
  • IT(Information Technology)분야의 발전과 함께 RT(Robot Technology)분야도 21fl기의 유망한 첨단기술로 손꼽히고 있다. 현재의 로봇은 그동안 주류를 이루던 산업용 로봇과는 달리 소프트컴퓨팅, 인간친화 인터페이스, 상호작용기술, 음성인식, 물체인식, 사용자 의도파악 등 갖가지 최첨단 기술들이 요구되는 퍼스널 로봇이 각광을 받고 있으며, 특히 오락용, 교육용 로봇들로 대표되는 엔터테인먼트 로봇(Entertainment Robot)분야가 요즘 국내·외에서 활발히 연구되고 있는 실정이다. 엔터테인먼트 로봇은 정형화된 작업만을 하는 것이 아니라 다양한 환경에서 여러 가지 작업을 해야만 한다. 따라서, 장난감 로봇처럼 인간과의 감정대화가 가능한 지능 시스템을 갖춰야만 한다. 그러므로 본 논문에서는 If분야와 RT분야의 접목으로 시너지 효과를 크게 얻을 수 있는 새로운 기술 개념인 RCP(Robotic C태ular Phone)에 대한 개녕을 정의하고, RCP의 기능성 모듈 중 하나인 감성진동 모들에 대한 기본적인 이론과 실험적 결과를 롱하여 로보틱 셀폰의 감성진동 모듈의 우수성을 확인한다.

  • PDF

A study on speech disentanglement framework based on adversarial learning for speaker recognition (화자 인식을 위한 적대학습 기반 음성 분리 프레임워크에 대한 연구)

  • Kwon, Yoohwan;Chung, Soo-Whan;Kang, Hong-Goo
    • The Journal of the Acoustical Society of Korea
    • /
    • v.39 no.5
    • /
    • pp.447-453
    • /
    • 2020
  • In this paper, we propose a system to extract effective speaker representations from a speech signal using a deep learning method. Based on the fact that speech signal contains identity unrelated information such as text content, emotion, background noise, and so on, we perform a training such that the extracted features only represent speaker-related information but do not represent speaker-unrelated information. Specifically, we propose an auto-encoder based disentanglement method that outputs both speaker-related and speaker-unrelated embeddings using effective loss functions. To further improve the reconstruction performance in the decoding process, we also introduce a discriminator popularly used in Generative Adversarial Network (GAN) structure. Since improving the decoding capability is helpful for preserving speaker information and disentanglement, it results in the improvement of speaker verification performance. Experimental results demonstrate the effectiveness of our proposed method by improving Equal Error Rate (EER) on benchmark dataset, Voxceleb1.

Digital Mirror System with Machine Learning and Microservices (머신 러닝과 Microservice 기반 디지털 미러 시스템)

  • Song, Myeong Ho;Kim, Soo Dong
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.9 no.9
    • /
    • pp.267-280
    • /
    • 2020
  • Mirror is a physical reflective surface, typically of glass coated with a metal amalgam, and it is to reflect an image clearly. They are available everywhere anytime and become an essential tool for us to observe our faces and appearances. With the advent of modern software technology, we are motivated to enhance the reflection capability of mirrors with the convenience and intelligence of realtime processing, microservices, and machine learning. In this paper, we present a development of Digital Mirror System that provides the realtime reflection functionality as mirror while providing additional convenience and intelligence including personal information retrieval, public information retrieval, appearance age detection, and emotion detection. Moreover, it provides a multi-model user interface of touch-based, voice-based, and gesture-based. We present our design and discuss how it can be implemented with current technology to deliver the realtime mirror reflection while providing useful information and machine learning intelligence.

A Comparison of Effective Feature Vectors for Speech Emotion Recognition (음성신호기반의 감정인식의 특징 벡터 비교)

  • Shin, Bo-Ra;Lee, Soek-Pil
    • The Transactions of The Korean Institute of Electrical Engineers
    • /
    • v.67 no.10
    • /
    • pp.1364-1369
    • /
    • 2018
  • Speech emotion recognition, which aims to classify speaker's emotional states through speech signals, is one of the essential tasks for making Human-machine interaction (HMI) more natural and realistic. Voice expressions are one of the main information channels in interpersonal communication. However, existing speech emotion recognition technology has not achieved satisfactory performances, probably because of the lack of effective emotion-related features. This paper provides a survey on various features used for speech emotional recognition and discusses which features or which combinations of the features are valuable and meaningful for the emotional recognition classification. The main aim of this paper is to discuss and compare various approaches used for feature extraction and to propose a basis for extracting useful features in order to improve SER performance.