통합 검색 | Korea Science

안드로이드폰용 사용자 정의 음성명령 앱 개발 (Development of a User-Customizable Voice Command Application for Android Phones)

곽주리;이주현;임효진;이기용
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2014년도 추계학술발표대회
- /
- pp.1171-1174
- /
- 2014
최근 Siri, S Voice 등과 같이 스마트폰에 음성으로 명령을 내리는 기능이 보편화되고 있다. 하지만 기존의 음성명령 시스템은 사전에 정의된 명령어가 아니면 사용이 불가능하며 어떤 명령어들이 사용가능한지 확인하기도 어렵다. 본 논문에서는 사용자에게 좀 더 편리한 인터페이스를 제공하기 위한 목적으로, 사용자가 직접 음성명령을 등록할 수 있는 안드로이드폰용 음성명령 앱을 개발한다. 본 논문에서 개발한 음성명령 앱은 사용자가 등록한 임의의 음성을 인식하여 안드로이드폰에 설치된 애플리케이션을 실행시키거나, 특정 번호로 전화를 걸거나, 특정 번호로 문자메시지를 보낼 수 있다. 본 논문에서 개발한 앱을 통해 사용자는 보다 편리하게 스마트폰에 음성명령을 내릴 수 있다.
https://doi.org/10.3745/PKIPS.y2014m11a.1171 인용 PDF

퍼지 추론을 이용한 음성 명령에 의한 커서 조작 (Cursor Moving by Voice Command using Fuzzy Inference)

추명경;손영선
- 한국지능시스템학회:학술대회논문집
- /
- 한국퍼지및지능시스템학회 2000년도 추계학술대회 학술발표 논문집
- /
- pp.209-212
- /
- 2000
본 논문에서 마우스 대신에 음성으로 명령을 입력하여 퍼지 추론을 통해 윈도우 화면상의 커서를 이동시키는 인터페이스를 구현하였다. 입력된 음성이 대체로 짧은 언어이기에 이를 인식하기 위하여 고립단어 인식에 강한 DTW방식을 사용하였다. DTW방식의 단점중인 하나가 음성길이가 비슷한 명령을 입력하였을 때 표준패턴 중 오차 값이 가장 작은 패턴으로 인식하는 것이다. 예를들면 아주 많이 이동해 라는 음성이 입력되었을 때 동일한 음성길이를 가진 아주 많이 오른쪽으로 인식하는 경우가 있다. 이런 오류를 해결하고자 각 패턴의 DTW 오차 값 범위와 표준 패턴의 음성길이를 기준으로 임계값을 퍼지 추론하여 명령으로서 수락 여부를 결정하였다. 판단이 애매한 부분은 사용자에게 질의를 하여 응답에 따라 수락 여부를 결정하였다.
PDF

dSPACE 보드를 이용한 음성인식 명령처리시스템 실시간 구현에 관한 연구 (A study on real-time implementation of speech recognition and speech control system using dSPACE board)

김재웅;정원용
- 융합신호처리학회 학술대회논문집
- /
- 한국신호처리시스템학회 2000년도 추계종합학술대회논문집
- /
- pp.173-176
- /
- 2000
음성은 인간이 가진 가장 편리한 제어전송수단으로 이를 통한 제어는 인간에게 많은 편리함을 제공할 것이다. 본 논문에서는 다층구조 신경망(Multi-Layer Perceptron)을 이용하여 간단한 음성인식 명령처리시스템을 Matlab 상에서 구성해 보았다. 음성인식을 통한 제어의 목적을 위해 화자종속, 고립단어인식기를 목표로 설정하여 연구를 수행하였다. 음성의 시작점과 끝점을 검출하기 위해 단구간 에너지와 영교차율(ZCR)을 이용하였고 인식기의 특징파라미터로는 12차 LPC켑스트럼 계수를 사용하였다. 그리고 신경망의 출력값을 기동, 정지시에 활성화되도록 3개의 계층으로 하였고, 신경망의 뉴런의 개수를 각각 12, 12, 2으로 설정하였다. 먼저 기준음성패턴으로 학습시킨 후에 Matlab 환경하에 동작하는 dSPACE 실시간처리보드에 변환된 C프로그램을 다운로드하고, 음성을 입력하여 인식 후 dSPACE보드의 D/A컨버터의 출력단에 연결된 DC모터를 기동, 정지제어를 수행하였다. 실시간 음성인식 명령처리 시스템 구현을 통하여 원격제어와 같은 음성명령을 통한 제어가 가능함을 확인할 수 있었다.
PDF

DTW방식을 이용한 음성 명령에 의한 커서 조작 (Cursor Moving by Voice Command using DTW method)

추명경;손영선
- 한국지능시스템학회논문지
- /
- 제11권1호
- /
- pp.82-87
- /
- 2001
본 논문에서는 마우스 대신에 음성으로 명령을 입력하여 퍼지 추론을 통해 위도우 화면상의 커서를 이동시키는 인터페이스를 구현하였다. 입력된 음성이 대체로 짧은 언어이기에 이를 인식하기 위하여 고립단어 인식에 강한 DTW방식을 사용하였다. DTW방식의 단점중인 하나가 음성길이가 비슷한 명령을 입력하였을 때 표준패턴 중 오차 값이 가장 작은 패턴으로 인식하는 것이다. 예를 들면 \"아주 많이 이동해\"하는 음성이 입력되었을 때 비슷한 음성길이를 가진 \"아주 많이 오른쪽\"으로 인식하는 경우가 있다. 이런 오류를 해결하고자 각 패턴의 DTW오차 거리 값과 표준 패턴의 음성길이를 기준으로 임계값을 퍼지 추론하여 명령으로서의 수락 여부를 결정하였다. 판단이 애매한 부분은 사용자에게 질의를 하여 응답에 따라 수락 여부를 결정하였다.
PDF

명령어간 거리를 최대화하는 음성 게임 명령어의 선택 방법 (A Method for Selecting Voice Game Commands to Maximize the Command Distance)

김상철
- 한국게임학회 논문지
- /
- 제19권4호
- /
- pp.97-108
- /
- 2019
최근 입력 방식의 다양성이나 편리성 때문에 음성 게임 명령어에 대한 관심이 증가하고 있다. 음성 명령어의 인식률은 인식 엔진의 성능뿐만이 아니라, 명령어간의 거리에도 영향을 받는다. 명령어간 거리란 명령어 발음간의 음성적 차이를 말하는데, 이 거리가 클수록 인식률이 높아진다. 본 논문에서 우리는 명령별 명령어 후보들이 주어졌을 때 명령어간의 평균 거리를 최대화하는 명령어 조합을 선택하는 문제를 IP(Integer Programming)으로 모델링한다. 또한 명령어 선택 문제의 해를 구하는 SA(Simulated Annealing) 기반의 방법을 제안한다. 우리의 방법을 명령어 수, 허용되는 명령어 길이 등의 다양한 조건에 하에서 실험한 결과를 토대로 특징을 분석한다.
https://doi.org/10.7583/JKGS.2019.19.4.97 인용 PDF KSCI

음성정보기술 국제 표준화 동향

홍기형
- 정보처리학회지
- /
- 제11권2호
- /
- pp.33-41
- /
- 2004
언제, 어디서, 어떤 장치를 사용하더라도 정보의 검색이나 접근이 가능해지는 유비쿼터스 환경이 가시화되고 있어, 음성을 사용한 사용자 인터페이스의 중요성이 증대하고 있다. 음성인식, 합성, 화자인증 등 음성 등의 음성처리엔진의 기술 수준이 상용화 단계에 접어들고, 이동 중과 같이 모니터 등 시각적 인터페이스의 사용이 용이하지 않은 상황에서도 정보 접근기 요구가 증대함에 따라 음성은 정보시스템 의 중요한 인터페이스로 자리매김 하고 있다. 음성정보기술은 인간의 가장 자연스러운 상호작용 수단인 음성을 이용하여. 시스템에 명령을 내리고, 시스템의 명령 수행 결과를 음성으로 전달하는 음성을 이용한 정보 시스템 인터페이스를 구현하기 위 한 기술을 의미한다. 또한, 음성정보시스템은 음성을 이용한 사용자인터페이스가 가능한 정보시스템을 뜻하며, (그림 1)과 같이 음성처리엔진, 사용자 접속망, 사용자 프로파일 및 음성응용시스템으로 구성된다.(중략)
PDF

음성인식을 이용한 URL Navigator 개발 (A Development of an URL Navigator using Speech Recognition)

전한길;홍인숙;김윤중
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2009년도 춘계학술발표대회
- /
- pp.122-125
- /
- 2009
기존의 인터넷 익스플로러는 높은 보급률의 이점을 지니고 있지만 인터넷을 이용하기 위한 기본지식의 필요성과 키보드, 마우스와 같은 장치를 이용한 입력방식은 장애인 및 고령층의 사용자들이 이용하기에는 불편하다. 이와 같은 문제점을 해결하고자 본 논문에서는 웹 서비스 기술을 이용하여 기존의 음성인식 시스템을 웹 서비스로 재구성하고 클라이언트가 음성인식 웹 서비스를 요청하고 음성명령이 가능하도록 인터넷 익스플로러에 음성명령이 가능한 Navigaotr를 Toolbar 형태의 프로그램을 구현하였다. 본 시스템은 클라이언트가 사용하는 음성 Navigator Toolbar와 웹 서비스를 통해서 음성 서비스를 제공하는 음성 서비스 프로바이더로 구성된다. 음성 Navigator Toolbar는 인터넷 환경에서 음성데이터를 바이너리 포맷형식인 DIME을 이용하여 음성 서비스 프로바이더로 전송하고 반환 결과를 가지고 URL Navigator를 통해 인터넷 페이지를 이동시킨다. 음성 서비스 프로바이더는 사용자가 전송한 음성데이터를 인식기를 통해 인식하고 결과를 가지고 정보 Database를 검색하여 실제 인터넷 주소를 사용자에게 반환한다.
https://doi.org/10.3745/PKIPS.y2009m04a.122 인용 PDF

가변어휘 단어 인식기를 사용한 음성 명령 웹 브라우저 (Voice Command Web Browser Using Variable Vocabulary Word Recognizer)

이항섭
- 한국음향학회지
- /
- 제18권2호
- /
- pp.48-52
- /
- 1999
본 논문에서는 웹 브라우저 상에서 한국어 음성인식을 이용하여 정보검색을 할 수 있는 가변어휘 단어 인식기를 사용한 음성 명령 웹 브라우저에 대하여 기술한다. 이 시스템의 특징은 웹 브라우저 상에서 보여지는 링크를 가지는 HyperText Word들과 웹 브라우저 메뉴를 음성으로 인식할 수 있는 것으로, 마우스 click 뿐만이 아니라 음성인식을 이용하여서도 웹 브라우저를 사용할 수 있다는 것이다. 웹 브라우저를 통해서 보여지는 문서에서 추출되는 인식 후보들은 각 문서에 따라 고정되지 않고 계속하여 변화하므로, 이러한 가변적인 인식 후보들을 인식하기 위해 가변어휘 단어 인식기를 사용하였다. 가변어휘 단어 인식기는 훈련용 음성 데이터와 무관한 임의의 새로운 어휘를 훈련 없이 인식해 낼 수 있는 인식기로 POW (Phonetically Optimized Words) 3,848 단어를 사용하여 훈련한 결과 32단어에 대해 93.8%의 단어 인식률을 보인다. 음성 명령 웹 브라우저는 Windows 95/NT 환경에서 Netscape Navigator를 사용하여 개발되었으며, 사용자가 음성을 사용하는 새로운 인터페이스를 배울 필요 없이 바로 사용할 수 있도록 사용자 편의성 부분도 고려하여 개발되었다. 개발된 음성 명령 웹 브라우저는 환경 독립, 화자 독립에 대해 On-line으로 실험한 결과 평균 90%의 인식성능을 보인다.
PDF

음성 인식 가능한 웹 브라우저를 이용한 가전기기 제어 서비스 시스템 및 그 방법 (Electric Appliances Controlling Service System and Method Using Web Browser Capable of Recognizing Voice)

최은정;;이동우;신희숙;박준석
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2004년도 춘계학술발표대회
- /
- pp.1605-1608
- /
- 2004
본 논문은 음성 인식이 가능한 브라우저를 이용하여 가전을 제어하기 위한 서비스 시스템 및 그 방법에 관한 것이다. 상기 가전기기 제어 서비스 시스템에서는, 웹 브라우저 실행 장치가 홈 서버로부터 가전기기 제어를 위한 웹 페이지를 불러와 명령 리스트를 사용자에게 들려주면, 사용자는 필요한 명령을 선택하여 음성으로 입력하고, 웹 브라우저 실행 장치가 이를 인식하여 홈 서버로 전송함으로써, 홈 서버가 사용자의 음성 명령에 따라 각종 가전기기들을 제어한다.
PDF

에지 컴퓨팅 기반 음성 명령 스마트홈 제어 시스템 구축 (Edge Computing-Based Voice Command Smart Home Control System)

김소철;윤서정;고현규
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2022년도 추계학술발표대회
- /
- pp.764-766
- /
- 2022
본 시스템은 스마트폰에서 사용자의 음성을 이용해 집 안이나 밖에서 IoT 단말을 효율적으로 제어할 수 있는 시스템으로, 인식된 음성에 맞춰 가전제품 기동, 조명 조절 등 IoT 단말을 컨트롤한다. 사용자의 음성은 Json 형태의 명령으로 변환되어 에지 컴퓨팅 기술을 통해 저사양 단말이 고사양 단말의 유휴자원을 활용하며 명령에 따른 IoT 단말 컨트롤이 진행된다. 이러한 아키텍처는 IoT 단말 데이터를 외부에 노출하지 않고 컴퓨팅 자원을 효율적으로 운용할 수 있는 시스템을 제공한다.
https://doi.org/10.3745/PKIPS.y2022m11a.764 인용 PDF

검색결과 112건 처리시간 0.03초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)