Search | Korea Science

Development of a User-Customizable Voice Command Application for Android Phones (안드로이드폰용 사용자 정의 음성명령 앱 개발)

Gwak, Juri;Lee, Joohyeon;Lim, Hyojin;Lee, Ki Yong
- Proceedings of the Korea Information Processing Society Conference
- /
- 2014.11a
- /
- pp.1171-1174
- /
- 2014
최근 Siri, S Voice 등과 같이 스마트폰에 음성으로 명령을 내리는 기능이 보편화되고 있다. 하지만 기존의 음성명령 시스템은 사전에 정의된 명령어가 아니면 사용이 불가능하며 어떤 명령어들이 사용가능한지 확인하기도 어렵다. 본 논문에서는 사용자에게 좀 더 편리한 인터페이스를 제공하기 위한 목적으로, 사용자가 직접 음성명령을 등록할 수 있는 안드로이드폰용 음성명령 앱을 개발한다. 본 논문에서 개발한 음성명령 앱은 사용자가 등록한 임의의 음성을 인식하여 안드로이드폰에 설치된 애플리케이션을 실행시키거나, 특정 번호로 전화를 걸거나, 특정 번호로 문자메시지를 보낼 수 있다. 본 논문에서 개발한 앱을 통해 사용자는 보다 편리하게 스마트폰에 음성명령을 내릴 수 있다.
https://doi.org/10.3745/PKIPS.y2014m11a.1171 인용 PDF

Cursor Moving by Voice Command using Fuzzy Inference (퍼지 추론을 이용한 음성 명령에 의한 커서 조작)

추명경;손영선
- Proceedings of the Korean Institute of Intelligent Systems Conference
- /
- 2000.11a
- /
- pp.209-212
- /
- 2000
본 논문에서 마우스 대신에 음성으로 명령을 입력하여 퍼지 추론을 통해 윈도우 화면상의 커서를 이동시키는 인터페이스를 구현하였다. 입력된 음성이 대체로 짧은 언어이기에 이를 인식하기 위하여 고립단어 인식에 강한 DTW방식을 사용하였다. DTW방식의 단점중인 하나가 음성길이가 비슷한 명령을 입력하였을 때 표준패턴 중 오차 값이 가장 작은 패턴으로 인식하는 것이다. 예를들면 아주 많이 이동해 라는 음성이 입력되었을 때 동일한 음성길이를 가진 아주 많이 오른쪽으로 인식하는 경우가 있다. 이런 오류를 해결하고자 각 패턴의 DTW 오차 값 범위와 표준 패턴의 음성길이를 기준으로 임계값을 퍼지 추론하여 명령으로서 수락 여부를 결정하였다. 판단이 애매한 부분은 사용자에게 질의를 하여 응답에 따라 수락 여부를 결정하였다.
PDF

A study on real-time implementation of speech recognition and speech control system using dSPACE board (dSPACE 보드를 이용한 음성인식 명령처리시스템 실시간 구현에 관한 연구)

김재웅;정원용
- Proceedings of the Korea Institute of Convergence Signal Processing
- /
- 2000.12a
- /
- pp.173-176
- /
- 2000
음성은 인간이 가진 가장 편리한 제어전송수단으로 이를 통한 제어는 인간에게 많은 편리함을 제공할 것이다. 본 논문에서는 다층구조 신경망(Multi-Layer Perceptron)을 이용하여 간단한 음성인식 명령처리시스템을 Matlab 상에서 구성해 보았다. 음성인식을 통한 제어의 목적을 위해 화자종속, 고립단어인식기를 목표로 설정하여 연구를 수행하였다. 음성의 시작점과 끝점을 검출하기 위해 단구간 에너지와 영교차율(ZCR)을 이용하였고 인식기의 특징파라미터로는 12차 LPC켑스트럼 계수를 사용하였다. 그리고 신경망의 출력값을 기동, 정지시에 활성화되도록 3개의 계층으로 하였고, 신경망의 뉴런의 개수를 각각 12, 12, 2으로 설정하였다. 먼저 기준음성패턴으로 학습시킨 후에 Matlab 환경하에 동작하는 dSPACE 실시간처리보드에 변환된 C프로그램을 다운로드하고, 음성을 입력하여 인식 후 dSPACE보드의 D/A컨버터의 출력단에 연결된 DC모터를 기동, 정지제어를 수행하였다. 실시간 음성인식 명령처리 시스템 구현을 통하여 원격제어와 같은 음성명령을 통한 제어가 가능함을 확인할 수 있었다.
PDF

Cursor Moving by Voice Command using DTW method (DTW방식을 이용한 음성 명령에 의한 커서 조작)

추명경;손영선
- Journal of the Korean Institute of Intelligent Systems
- /
- v.11 no.1
- /
- pp.82-87
- /
- 2001
본 논문에서는 마우스 대신에 음성으로 명령을 입력하여 퍼지 추론을 통해 위도우 화면상의 커서를 이동시키는 인터페이스를 구현하였다. 입력된 음성이 대체로 짧은 언어이기에 이를 인식하기 위하여 고립단어 인식에 강한 DTW방식을 사용하였다. DTW방식의 단점중인 하나가 음성길이가 비슷한 명령을 입력하였을 때 표준패턴 중 오차 값이 가장 작은 패턴으로 인식하는 것이다. 예를 들면 \"아주 많이 이동해\"하는 음성이 입력되었을 때 비슷한 음성길이를 가진 \"아주 많이 오른쪽\"으로 인식하는 경우가 있다. 이런 오류를 해결하고자 각 패턴의 DTW오차 거리 값과 표준 패턴의 음성길이를 기준으로 임계값을 퍼지 추론하여 명령으로서의 수락 여부를 결정하였다. 판단이 애매한 부분은 사용자에게 질의를 하여 응답에 따라 수락 여부를 결정하였다.
PDF

A Method for Selecting Voice Game Commands to Maximize the Command Distance (명령어간 거리를 최대화하는 음성 게임 명령어의 선택 방법)

Kim, Sangchul
- Journal of Korea Game Society
- /
- v.19 no.4
- /
- pp.97-108
- /
- 2019
Recently interests in voice game commands have been increasing due to the diversity and convenience of the input method, but also by the distance between commands. The command distance is the phonetic difference between command utterances, and as such distance increases, the recognition rate improves. In this paper, we propose an IP(Integer Programming) modeling of the problem which is to select a combination of commands from given candidate commands for maximizing the average distance. We also propose a SA(Simulated Annealing)-based algorithm for solving the problem. We analyze the characteristics of our method using experiments under various conditions such as the number of commands, allowable command length, and so on.
https://doi.org/10.7583/JKGS.2019.19.4.97 인용 PDF KSCI

음성정보기술 국제 표준화 동향

홍기형
- Korea Information Processing Society Review
- /
- v.11 no.2
- /
- pp.33-41
- /
- 2004
언제, 어디서, 어떤 장치를 사용하더라도 정보의 검색이나 접근이 가능해지는 유비쿼터스 환경이 가시화되고 있어, 음성을 사용한 사용자 인터페이스의 중요성이 증대하고 있다. 음성인식, 합성, 화자인증 등 음성 등의 음성처리엔진의 기술 수준이 상용화 단계에 접어들고, 이동 중과 같이 모니터 등 시각적 인터페이스의 사용이 용이하지 않은 상황에서도 정보 접근기 요구가 증대함에 따라 음성은 정보시스템 의 중요한 인터페이스로 자리매김 하고 있다. 음성정보기술은 인간의 가장 자연스러운 상호작용 수단인 음성을 이용하여. 시스템에 명령을 내리고, 시스템의 명령 수행 결과를 음성으로 전달하는 음성을 이용한 정보 시스템 인터페이스를 구현하기 위 한 기술을 의미한다. 또한, 음성정보시스템은 음성을 이용한 사용자인터페이스가 가능한 정보시스템을 뜻하며, (그림 1)과 같이 음성처리엔진, 사용자 접속망, 사용자 프로파일 및 음성응용시스템으로 구성된다.(중략)
PDF

A Development of an URL Navigator using Speech Recognition (음성인식을 이용한 URL Navigator 개발)

Jeon, Han-Gil;Hong, In-Suk;Kim, Yoon-Joong
- Proceedings of the Korea Information Processing Society Conference
- /
- 2009.04a
- /
- pp.122-125
- /
- 2009
기존의 인터넷 익스플로러는 높은 보급률의 이점을 지니고 있지만 인터넷을 이용하기 위한 기본지식의 필요성과 키보드, 마우스와 같은 장치를 이용한 입력방식은 장애인 및 고령층의 사용자들이 이용하기에는 불편하다. 이와 같은 문제점을 해결하고자 본 논문에서는 웹 서비스 기술을 이용하여 기존의 음성인식 시스템을 웹 서비스로 재구성하고 클라이언트가 음성인식 웹 서비스를 요청하고 음성명령이 가능하도록 인터넷 익스플로러에 음성명령이 가능한 Navigaotr를 Toolbar 형태의 프로그램을 구현하였다. 본 시스템은 클라이언트가 사용하는 음성 Navigator Toolbar와 웹 서비스를 통해서 음성 서비스를 제공하는 음성 서비스 프로바이더로 구성된다. 음성 Navigator Toolbar는 인터넷 환경에서 음성데이터를 바이너리 포맷형식인 DIME을 이용하여 음성 서비스 프로바이더로 전송하고 반환 결과를 가지고 URL Navigator를 통해 인터넷 페이지를 이동시킨다. 음성 서비스 프로바이더는 사용자가 전송한 음성데이터를 인식기를 통해 인식하고 결과를 가지고 정보 Database를 검색하여 실제 인터넷 주소를 사용자에게 반환한다.
https://doi.org/10.3745/PKIPS.y2009m04a.122 인용 PDF

Voice Command Web Browser Using Variable Vocabulary Word Recognizer (가변어휘 단어 인식기를 사용한 음성 명령 웹 브라우저)

이항섭
- The Journal of the Acoustical Society of Korea
- /
- v.18 no.2
- /
- pp.48-52
- /
- 1999
In this paper, we describe a Voice Command Web Browser using a variable vocabulary word recognizer that can do Internet surfing with Korean speech recognition on the Web. The feature of this browser is that it can handle the links and menus of the web browser by speech. Therefore, we can use speech interface together with mouse for web browsing. To recognize the recognition candidates dynamically changing according to Web pages, we use the variable vocabulary word recognizer. The recognizer was trained using POW (Phonetically Optimized Words) 3,848 words. So that it can recognize new words which did not exist in training data. The preliminary test results showed that the performance of speaker-independent and vocabulary-independent recognition is 93.8% for 32 Korean words. The Voice Command Web Browser was developed on windows 95/NT using Netscape Navigator and reflected usability test results in order to offer easy interface to users unfamiliar with speech interface. In on-line experiment of speaker-independent and environment-independent situation, Voice Command Web Browser showed recognition accuracy of 90%.
PDF

Electric Appliances Controlling Service System and Method Using Web Browser Capable of Recognizing Voice (음성 인식 가능한 웹 브라우저를 이용한 가전기기 제어 서비스 시스템 및 그 방법)

Choi, Eunjeong;Cho, Soosun;Lee, Dongwoo;Shin, Heesuk;Park, Junsuk
- Proceedings of the Korea Information Processing Society Conference
- /
- 2004.05a
- /
- pp.1605-1608
- /
- 2004
본 논문은 음성 인식이 가능한 브라우저를 이용하여 가전을 제어하기 위한 서비스 시스템 및 그 방법에 관한 것이다. 상기 가전기기 제어 서비스 시스템에서는, 웹 브라우저 실행 장치가 홈 서버로부터 가전기기 제어를 위한 웹 페이지를 불러와 명령 리스트를 사용자에게 들려주면, 사용자는 필요한 명령을 선택하여 음성으로 입력하고, 웹 브라우저 실행 장치가 이를 인식하여 홈 서버로 전송함으로써, 홈 서버가 사용자의 음성 명령에 따라 각종 가전기기들을 제어한다.
PDF

Edge Computing-Based Voice Command Smart Home Control System (에지 컴퓨팅 기반 음성 명령 스마트홈 제어 시스템 구축)

Kim, So-Chul;Yoon, Seo-Jeong;Ko, Hyungyu
- Proceedings of the Korea Information Processing Society Conference
- /
- 2022.11a
- /
- pp.764-766
- /
- 2022
본 시스템은 스마트폰에서 사용자의 음성을 이용해 집 안이나 밖에서 IoT 단말을 효율적으로 제어할 수 있는 시스템으로, 인식된 음성에 맞춰 가전제품 기동, 조명 조절 등 IoT 단말을 컨트롤한다. 사용자의 음성은 Json 형태의 명령으로 변환되어 에지 컴퓨팅 기술을 통해 저사양 단말이 고사양 단말의 유휴자원을 활용하며 명령에 따른 IoT 단말 컨트롤이 진행된다. 이러한 아키텍처는 IoT 단말 데이터를 외부에 노출하지 않고 컴퓨팅 자원을 효율적으로 운용할 수 있는 시스템을 제공한다.
https://doi.org/10.3745/PKIPS.y2022m11a.764 인용 PDF

Search Result 112, Processing Time 0.025 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)