• Title/Summary/Keyword: Voice recognition system

Search Result 334, Processing Time 0.03 seconds

Intelligent Countenance Robot, Humanoid ICHR (지능형 표정로봇, 휴머노이드 ICHR)

  • Byun, Sang-Zoon
    • Proceedings of the KIEE Conference
    • /
    • 2006.10b
    • /
    • pp.175-180
    • /
    • 2006
  • In this paper, we develope a type of humanoid robot which can express its emotion against human actions. To interact with human, the developed robot has several abilities to express its emotion, which are verbal communication with human through voice/image recognition, motion tracking, and facial expression using fourteen Servo Motors. The proposed humanoid robot system consists of a control board designed with AVR90S8535 to control servor motors, a framework equipped with fourteen server motors and two CCD cameras, a personal computer to monitor its operations. The results of this research illustrate that our intelligent emotional humanoid robot is very intuitive and friendly so human can interact with the robot very easily.

  • PDF

A Study on the Improvement of Speaker Recognition System by Voice Activity Detection (음성구간검출을 통한 화자식별 시스템의 성능개선에 관한 연구)

  • 신동성;정영훈;배명진
    • Proceedings of the IEEK Conference
    • /
    • 2001.09a
    • /
    • pp.789-792
    • /
    • 2001
  • 성능향상에 관한 실험을 하였다. 화자식별 방식은 등록된 음성과 테스트 음성을 비교하여 결정논리에 의하여서 화자를 식별하는 방식이다. 이러한 시스템에서 전처리(preprocessing)를 어떻게 해 주느냐에 따라서 인식률에 큰 영향을 미치게 된다. 본 논문에서는 전처리 과정 중에서 음성구간 검출에 대한 실험을 수행하여 성능을 비교 하였다. 본 논문에서는 시간영역에서 안정구간(stationary region)과 전이구간(transition region)에서 Normalized AMDF를 적용하였을 때 피치점에서 골(valley)의 기울기가 크다는 점을 이용하여 유성을 검출하였다. 그리고 검출된 유성음 구간 앞뒤로 인접 샘플의 자기상관관계함수(Autocorrelation)의 비를 이용하여 무성음을 검출하였다. 결과적으로 처리시간은 비슷하였으나 전체 인식률은 약 2%정도 개선되었다.

  • PDF

A Study on Connected Word Recognition for the Implementation of a Real-Time Voice Dialing System (실시간 음성 다이얼링 시스템 구현을 위한 연결어 인식에 관한 연구)

  • 김천영;양진우;유형근;이형준;홍진우;이강성;안태옥
    • The Journal of the Acoustical Society of Korea
    • /
    • v.12 no.3
    • /
    • pp.13-25
    • /
    • 1993
  • 본 논문은 음성 다이얼링 시스템을 구현하기 위한 연결어 인식에 관한 연구이다. 적용된 인식 알고리즘은 기준패턴을 생성할 때 DMS 모델을 이용한 One-stage DMS/DP 알고리즘이고, 인식 대상어는 광운대학교 부서명 150 단어이다. 연결어 인식을 실시간으로 처리하기 위한 방법으로써 본 논문에서는 음절과 단어 단위의 DMS 템플리트를 구성하여 실험하였고 이 실험결과로부터 실시간과 인식률을 고려한 최적의 인식은 단어단위 템플리트에서 20 구간의 DMS 템플리트를 구성하여 실험하였고 이 실험결과로부터 실시간과 인식률을 고려한 최적의 인식은 단어단위 템플리트에서 20구간의 DMS 모델을 적용하였을 때 수행되었고, 이때 다중화자종속과 화자독립의 인식률은 각각 97.2%, 86.8%이다. 실험된 결과를 이용하여 음성 다이얼링 모델 시스템을 DSP 전용칩인 TMS320C30 프로세서를 내장한 DSP 보오드, 486 PC와 DIAL 모뎀을 이용해서 구현하였고, 전체 다이얼링 시간은 약 7~14초가 소요되었다.

  • PDF

Design and Implementation of the Speech Recognition-based Dynamic EPG Control System in Digital Broadcasting environment (디지털 TV 환경에서 음성인식을 통한 동적 EPG 제어 시스템 설계 및 구현)

  • Kim, Seong-Won;Na, Hee-Joo;Si, Jang-Hyun;Kim, Jung-Hwan;Jung, Moon-Ryul
    • 한국HCI학회:학술대회논문집
    • /
    • 2007.02a
    • /
    • pp.216-221
    • /
    • 2007
  • 디지털 방송은 수많은 프로그램과 기존의 아날로그 방송에서 볼 수 없었던 다양한 서비스를 제공하며 발전하고 있다. 하지만 시청자들에게는 방송 서비스 채널과 기능이 많아질수록 원하는 채널을 검색하고 전환하는 과정이 어렵고 복잡한 일이 되어 버릴 수 밖에 없을 것이다. 이에 본 논문에서는 이러한 정보 획득과정의 축소를 위해 전통적인 리모콘으로 채널을 검색하고 이동하는 절차를 벗어나 음성인식을 통한 동적 EPG(Electronic Program Guide) 제어 시스템을 설계하고 구현하고자 한다. 이는 EPG정보와 시청자의 TV시청 성향 및 History를 기반으로 구동되는 시스템으로 음성대화의 구조적 정의가 가능한 VXML(VoiceXML) 인터프리터를 활용한다. 본 논문에서 제안하는 대화형 인터페이스는 다양한 디지털방송 서비스에 접목이 가능 할 것이며, 새로운 형태의 디지털 가전기기 파일럿 인터페이스 개발에 도움이 될 것이라 기대한다.

  • PDF

Multidimensional Affective model-based Multimodal Complex Emotion Recognition System using Image, Voice and Brainwave (다차원 정서모델 기반 영상, 음성, 뇌파를 이용한 멀티모달 복합 감정인식 시스템)

  • Oh, Byung-Hun;Hong, Kwang-Seok
    • Annual Conference of KIPS
    • /
    • 2016.04a
    • /
    • pp.821-823
    • /
    • 2016
  • 본 논문은 다차원 정서모델 기반 영상, 음성, 뇌파를 이용한 멀티모달 복합 감정인식 시스템을 제안한다. 사용자의 얼굴 영상, 목소리 및 뇌파를 기반으로 각각 추출된 특징을 심리학 및 인지과학 분야에서 인간의 감정을 구성하는 정서적 감응요소로 알려진 다차원 정서모델(Arousal, Valence, Dominance)에 대한 명시적 감응 정도 데이터로 대응하여 스코어링(Scoring)을 수행한다. 이후, 스코어링을 통해 나온 결과 값을 이용하여 다차원으로 구성되는 3차원 감정 모델에 매핑하여 인간의 감정(단일감정, 복합감정)뿐만 아니라 감정의 세기까지 인식한다.

A Study on The Automatic Caption System for Hearing Impaired Person (청각장애인을 위한 자동 자막 시스템)

  • Park, Hyon-Gun;Lee, Hee-Suk;Lee, Sang-Moon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2010.07a
    • /
    • pp.335-336
    • /
    • 2010
  • 장애인도 비장애인과 정보접근 기회를 동일하게 가질 권리가 있다. 하지만 청각장애인은 의사소통 수단이나 정보획득의 수단으로부터 소외됨으로써 다양한 사회적 참여에서 배제되기 일쑤였다. 따라서 이 논문에서는 청각장애인을 위한 음성인식을 이용한 자동 자막 시스템을 제안한다. 이 논문에서 제안하는 시스템은 음성 특징 파라미터 추출과 DTW에 의한 음성인식을 통해 음성을 추출하여 화면에 자막으로 나타나게 하는 시스템이다.

  • PDF

Wearable system for sound visualization and disaster alarm for the Hearing-Impaired (청각장애인을 위한 사운드-시각화 및 재난 경보 웨어러블 시스템)

  • Lee, Se-Hoon;Kong, Jin-yong;Yeom, Dae-hoon;Kang, Eun-ho;Baek, Yong-Tae
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2017.07a
    • /
    • pp.257-258
    • /
    • 2017
  • 본 논문에서는 청각 장애인들은 시각에 의존하지 않고는 소리를 인지할 수 없다는 문제를 해결하기 위해 사운드를 시각화하는 웨어러블 시스템을 구현하였다. 시스템의 음성 인식 센서가 음성을 인식해 웨어러블 디스플레이에 전송된 메시지를 확인하고, 기상 재난 메시지를 웨어러블에서 실시간으로 확인하여 안전사고를 예방할 수 있게 하여 청각장애인의 어려움을 해결하였다.

  • PDF

The Development of Customized Communication System for the Senior Living Alone (독거노인을 위한 맞춤형 의사소통 시스템의 개발)

  • Kim, Ga-Young;Lee, Hyun-Dong;Kim, Dong-Hyun;Cho, Dae-Soo
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2018.07a
    • /
    • pp.183-184
    • /
    • 2018
  • 우리나라의 노인자살률은 OECD 국가 중에 1위이다. 인위적 고독사인 '자살'의 가장 큰 원인인 우울증을 의사소통을 통해 예방하고자 한다. 본 논문에서는 상황에 따라 독거노인에게 스피커가 먼저 질문하는 형식인 시스템을 제안한다. 음성인식 시스템인 스피커를 활용하여 독거노인의 의사소통을 증대시키고, 질문뿐만이 아니라 식사 여부, 약 복용 여부 관련 일상 알람도 주기 때문에 규칙적인 생활을 하는 데 도움을 준다.

  • PDF

Multimodal Biometric Using a Hierarchical Fusion of a Person's Face, Voice, and Online Signature

  • Elmir, Youssef;Elberrichi, Zakaria;Adjoudj, Reda
    • Journal of Information Processing Systems
    • /
    • v.10 no.4
    • /
    • pp.555-567
    • /
    • 2014
  • Biometric performance improvement is a challenging task. In this paper, a hierarchical strategy fusion based on multimodal biometric system is presented. This strategy relies on a combination of several biometric traits using a multi-level biometric fusion hierarchy. The multi-level biometric fusion includes a pre-classification fusion with optimal feature selection and a post-classification fusion that is based on the similarity of the maximum of matching scores. The proposed solution enhances biometric recognition performances based on suitable feature selection and reduction, such as principal component analysis (PCA) and linear discriminant analysis (LDA), as much as not all of the feature vectors components support the performance improvement degree.

A Design of a Personalized Dietary Coaching System Using Voice Recognition (음성인식을 이용한 사용자 맞춤형 식단 코칭 시스템 설계)

  • Oh, Yoori;Ahn, Younsun;Kim, Yoonhee
    • Annual Conference of KIPS
    • /
    • 2015.04a
    • /
    • pp.105-107
    • /
    • 2015
  • 현대인들의 건강한 식생활에 대한 관심이 높아짐에 따라 식단 관리의 중요성이 부각되고 있다. 이에 따라 식단 관리 서비스를 제공하는 시스템이 등장하고 있다. 하지만 기존의 많은 앱들은 복잡하고 시간이 많이 소요되는 입력방식으로 사용자들의 지속적인 앱 사용에 걸림돌이 되었다. 또한 사용자에게 실질적으로 필요하고 유용한 정보를 제공하지 않는다. 따라서 빠르고 쉬운 식단입력으로 즉각적이고 유의미한 정보를 제공하는 시스템이 필요하다. 본 논문에서 제안하는 시스템은 음성인식, 글자인식 등의 다양한 입력방식을 이용하여 편리한 식단입력이 가능하고 입력된 식단을 통하여 식품 영양학적 분석을 하는 모바일 앱이다. 또한 제안한 모바일 앱은 실시간으로 사용자의 식사 계획 및 결정에 활용 가능한 정보를 제공한다.