• Title/Summary/Keyword: 음성 명령

Search Result 111, Processing Time 0.024 seconds

Smart mirror using speech recognition (음성인식기능을 이용한 스마트 미러)

  • Yun, Tae-Jin;Jeong, Min-Woo;Choi, Gyu-Hwi;Yang, Won-Gyu;Lee, Byung-Jin
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2018.07a
    • /
    • pp.431-432
    • /
    • 2018
  • 본 논문은 라즈베리파이(Raspberry Pi)와 각종 센서 위치 정보를 관련된 정보를 거울에 출력해주는 스마트 미러(Smart Mirror)를 제안한다. 스마트 미러는 온도 습도 등의 다양한 센서를 통해 사용자 주변 환경과 외부 환경을 결합하여 사용자에게 풍부한 정보를 제공할 수 있다. 다양한 센서와 구글 클라우드 스피치 오픈 API를 이용하여 위치 정보를 기반으로 날씨와 일정 및 음성 인식을 통해 인식된 명령에 따라 원하는 정보를 보여주는 스마트 미러를 구현하였다.

  • PDF

Development of Intention Reading System for the Disabled (장애인을 위한 사용자 의도 파악 시스템 개발에 관한 연구)

  • Lee, Young-Jin;Chu, Gil-Whoan;Kim, Jae-Hean;Chung, Myung-Jin
    • Proceedings of the KIEE Conference
    • /
    • 1999.07g
    • /
    • pp.3018-3020
    • /
    • 1999
  • 본 논문에서는 손과 발을 자기의 의지대로 움직일 수 없는 장애인들이 전동 휠체어나 로봇 팔과 같은 보조 장치를 손, 발의 사용 없이 조작 할 수 있는 시스템 개발을 위한 연구에 대해서 소개한다. 손과 발을 사용하지 않고 전동 휠체어나 로봇 팔을 조작하려면 장애인의 의도를 파악하고 이 정보에 의한 구동 방식이 필요하게 된다. 본 연구에서는 장애인의 눈동자의 움직임과 머리의 움직임 그리고 음성 신호를 이용하여 보조 장치들을 구동시키고자 한다. 이를 구현하기 위해서는 시선의 방향을 측정할 수 있는 기술과 머리의 위치와 방향을 측정하는 기술, 그리고 음성으로 표현되는 간단한 명령들을 인식할 수 있는 기술이 필요하며, 이러한 기술의 통합을 바탕으로 보조장치들을 구동시키기 위한 편리한 사용자 지향의 인터페이스 기술을 개발하고자 한다.

  • PDF

Design of Application Control System Using Google Home (구글 홈을 활용한 응용프로그램 제어 시스템의 설계)

  • Kim, Dong-Hyun;Kim, Hwi-Min
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2019.07a
    • /
    • pp.135-136
    • /
    • 2019
  • 일반적으로 컴퓨터에서 문서 작업을 하기 위해서는 사용자는 컴퓨터 화면을 볼 수 있는 시각과 키보드와 마우스를 조작하기 위하여 손을 사용해야 한다. 시각과 손이 불편한 대부분 장애우는 컴퓨터를 조작하기 어렵다. 장애우들을 보조해주는 정보통신 보조기기의 가격은 비싸며 기기 보급을 지원해주는 사업이 있지만, 사업에 선정되기 어렵다는 문제가 있다. 이 논문에서는 구글 홈을 이용하여 텍스트, 워드, 엑셀, 한글 등 다양한 응용프로그램을 음성을 이용하여 제어하기 위한 시스템을 제안한다. 제안한 시스템은 구글 어시스턴트가 다이어로그플로우로 설계한 인텐트를 웹 훅을 이용해 서버에서 컴퓨터로 접근하여 응용프로그램을 제어한다.

  • PDF

Examination of a Voice Interaction Model for Smart TV through Conversation Patterns (대화 패턴 연구를 통한 스마트TV 음성 상호작용 모델의 탐구)

  • Choi, Jinhae
    • The Journal of the Korea Contents Association
    • /
    • v.17 no.2
    • /
    • pp.96-104
    • /
    • 2017
  • As new smart devices are evolved into the intelligent agent who can reflect user intention and use context, user experience design for easy and convenient usability becomes a core competitive edge. Under the assumption that human centered natural interaction is necessary for the optimal smart TV experience, this study explores the types of voice interaction which are peculiar to TV watching context. In order to build a model for the users to naturally interact with Smart TV, conversation patterns were collected by requesting key features of Smart TV to intelligent agent. Collected sentences were applied to CfA model and classified by responses to activate features. The classified conversation patterns were divided into feature activation and information search. This study has identified that CfC1 occurred when voice interaction between Smart TV and users was vague and CfC2 occurred when the requests were complex or conditional. In conclusion, Simple Request Type is the most efficient model and voice interaction is more appropriate to use to clarify users' vague requests.

A Study on Speech Recognition in a Running Automobile (주행중인 자동차 환경에서의 음성인식 연구)

  • 양진우;김순협
    • The Journal of the Acoustical Society of Korea
    • /
    • v.19 no.5
    • /
    • pp.3-8
    • /
    • 2000
  • In this paper, we studied design and implementation of a robust speech recognition system in noisy car environment. The reference pattern used in the system is DMS(Dynamic Multi-Section). Two separate acoustic models, which are selected automatically depending on the noisy car environment for the speech in a car moving at below 80km/h and over 80km/h are proposed. PLP(Perceptual Linear Predictive) of order 13 is used for the feature vector and OSDP (One-Stage Dynamic Programming) is used for decoding. The system also has the function of editing the phone-book for voice dialing. The system yields a recognition rate of 89.75% for male speakers in SI (speaker independent) mode in a car running on a cemented express way at over 80km/h with a vocabulary of 33 words. The system also yields a recognition rate of 92.29% for male speakers in SI mode in a car running on a paved express way at over 80km/h.

  • PDF

Sentence Type Identification in Korean Applications to Korean-Sign Language Translation and Korean Speech Synthesis (한국어 문장 유형의 자동 분류 한국어-수화 변환 및 한국어 음성 합성에의 응용)

  • Chung, Jin-Woo;Lee, Ho-Joon;Park, Jong-C.
    • Journal of the HCI Society of Korea
    • /
    • v.5 no.1
    • /
    • pp.25-35
    • /
    • 2010
  • This paper proposes a method of automatically identifying sentence types in Korean and improving naturalness in sign language generation and speech synthesis using the identified sentence type information. In Korean, sentences are usually categorized into five types: declarative, imperative, propositive, interrogative, and exclamatory. However, it is also known that these types are quite ambiguous to identify in dialogues. In this paper, we present additional morphological and syntactic clues for the sentence type and propose a rule-based procedure for identifying the sentence type using these clues. The experimental results show that our method gives a reasonable performance. We also describe how the sentence type is used to generate non-manual signals in Korean-Korean sign language translation and appropriate intonation in Korean speech synthesis. Since the method of using sentence type information in speech synthesis and sign language generation is not much studied previously, it is anticipated that our method will contribute to research on generating more natural speech and sign language expressions.

  • PDF

A Study on Isolated Words Speech Recognition in a Running Automobile (주행중인 자동차 환경에서의 고립단어 음성인식 연구)

  • 유봉근
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06e
    • /
    • pp.381-384
    • /
    • 1998
  • 본 논문은 주행중인 자동차 환경에서 운전자의 안전성 및 편의성의 동시 확보를 위하여, 보조적인 스위치 조작없이 상시 음성의 입, 출력이 가능하도록 한다. 이때 잡음에 강인한 threshold 값을 구하기 위하여, 일정한 시간마다 기준 에너지와 영교차율(Zero Crossing Rate)을 변경하며, 밴드패스 필터(bandpass filter)를 이용하여 1차, 2차로 나누어 실시간 상태에서 자동으로, 정확하게 끝점검출(End Point Detection)을 처리한다. 기준패턴(reference pattern)은 DMS(Dynamic Multi-Section)을 사용하며, 화자의 변별력을 높이기 위하여 2개의 모델사용을 제안한다. 또한 주행중인 차량의 잡음환경에 강인하기 위하여 일반주행(80km/h 이내), 고속주행(80km/h 이상)등으로 나누며 차량의 가변잡음 크기에 따라 자동으로 선택하도록 한다. 음성의 특징 벡터와 인식 알고리즘은 PLP 13차와 One-Stage Dynamic Programming (OSDP)를 이용한다. 실험결과, 자주 사용되는 차량 편의장치 제어명령 33개에 대하여 중부, 영동 고속도로(시속 80Km/h 이상)에서 화자독립 89.75%, 화자종속 90.08%의 인식율을 구하였으며, 경부 고속도로에서는 화자독립 92.29%, 화자종속 92.42%의 인식율을 구하였다. 그리고 저속 주행중인 자동차 환경(80km/h 이내, 시멘트, 아스팔트 등의 서울시내 및 시외독립)에서는 화자독립 92.89%, 화자종속 94.44% 인식율을 구하였다.

  • PDF

Development of Walking Assist Smartphone Case for Blind People (시각장애인의 보행보조를 위한 스마트폰 케이스 구현)

  • Choi, Jin-Woo;Jeong, Gu-Min
    • The Journal of Korea Institute of Information, Electronics, and Communication Technology
    • /
    • v.8 no.3
    • /
    • pp.239-242
    • /
    • 2015
  • In this paper, we propose a walking assisting system for blind people using Android smartphone and Arduino board. In our proposed system, we use an Android smartphone case and an external ultrasonic sensor to detect the obstacles ahead. In this manner, blind people is able to aware unexpected objects by smartphone speakers or vibration functionality. In addition, the walking assisting system is also designed a notice system which will be triggered by built-in smartphone camera flash when blind people walk in some darkness place. The experimental results from real experiments on blind people have demonstrated the applicability of our walking assisting system, when it not only efficiently helps blind people avoid obstacles ahead but also possible traffic collisions in darkness condition.

Ordering system for the disabled and the weak using a KIOSK with speech recognition technology (키오스크를 이용한 장애인 및 약자를 위한 음성인식 주문시스템)

  • Lee, Hyo-Jai;Hong, Changho;Cho, Sung Ho;Yoon, Chaiwon;Kim, Dongwan;Choi, Seunghwa
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2021.05a
    • /
    • pp.544-546
    • /
    • 2021
  • Recently, the number of unmanned stores is increasing due to COVID-19. In unmanned stores, payments are mainly made using kiosks, but some people with physical disabilities or people with disabilities who use wheelchairs are not easy to use it. Also, young children and the elderly are also having difficulty using new technologies such as kiosks as they get older. In this study, in order to compensate for these problems, we intend to design and implement a system capable of performing order by a speech recognition function as well as a visual system when a user interacts with a kiosk.

  • PDF

Design of a Low Power Voice Signal Processing and Control Module using a $\mu$-controller for Totally Implantable Middle Ear system (마이크로컨트롤러를 이용한 완전 이식형 인공중이용 저전력 음성 신호처리 및 제어 모듈의 설계)

  • 강호경;정의성;임형규;박일용;윤영호;김민규;송병섭;조진호
    • Journal of the Institute of Electronics Engineers of Korea SC
    • /
    • v.41 no.5
    • /
    • pp.49-56
    • /
    • 2004
  • A low power consuming voice signal processing and control module was designed using a small $\mu$-controller for use in a totally implantable middle ear system. The module was designed that it can control the implanted system as well as process the fitting algorithm of input sound signal. In ordinary operation mode, the $\mu$-controller processes the applied sound signal for compensating the hearing loss of the patients. When the control signal is applied from the IR receiving module, the $\mu$-controller interrupts the signal processing and executes the order of the control signals such as power on/off, volume up/down. The designed module was implemented and verified the performance of the system through several experiments.