DOI QR코드

DOI QR Code

Object Magnification and Voice Command in Gaze Interface for the Upper Limb Disabled

상지장애인을 위한 시선 인터페이스에서의 객체 확대 및 음성 명령 인터페이스 개발

  • Park, Joo Hyun (Research Institute of ICT Convergence, Sookmyung Women's University) ;
  • Jo, Se-Ran (Dept. of IT Engineering, Sookmyung Women's University) ;
  • Lim, Soon-Bum (Dept. of IT Engineering, Sookmyung Women's University)
  • Received : 2021.01.21
  • Accepted : 2021.07.15
  • Published : 2021.07.30

Abstract

Eye tracking research for upper limb disabilities is showing an effect in the aspect of device control. However, the reality is that it is not enough to perform web interaction with only eye tracking technology. In the Eye-Voice interface, a previous study, in order to solve the problem that the existing gaze tracking interfaces cause a malfunction of pointer execution, a gaze tracking interface supplemented with a voice command was proposed. In addition, the reduction of the malfunction rate of the pointer was confirmed through a comparison experiment with the existing interface. In this process, the difficulty of pointing due to the small size of the execution object in the web environment was identified as another important problem of malfunction. In this study, we propose an auto-magnification interface of objects so that people with upper extremities can freely click web contents by improving the problem that it was difficult to point and execute due to the high density of execution objects and their arrangements in web pages.

Keywords

1. 서론

상지장애인을 위해 키보드와 마우스와 같이 손을 이용한 입력 장치의 대체 방안으로 시선 추적 기술연구가 활발하게 진행되고 있다[1]. 시선 추적 기술로 GUI를 자유롭게 조작하기 위해서는 포인터의 이동과 객체의 실행이 기본적으로 수행되어야 한다[2]. 특히, 객체의 실행은 하이퍼링크를 통해 다양한 콘텐츠를 제공하고 있는 웹 환경에서 가장 중요한 탐색수단이 된다[3]. 상지장애인을 위한 시선 추적 연구가 기기 제어 방면에서 효과를 나타내고 있지만, 시선 추적 기술만으로 웹 인터랙션을 수행하기에는 부족한 것이 현실이다.

웹 환경에서 콘텐츠의 탐색과 제어를 자유롭게 조작하기 위해서는 포인터의 이동과 링크를 포함한 객체의 실행이 가장 기본이 된다. 선행 연구인 Eye-Voice[4] 인터페이스에서는 기존의 시선 추적 인터페이스들[5,6]이 포인터 실행의 오작동을 일으키는 문제를 해결하기 위해 음성명령으로 보완한 시선 추적 인터페이스를 제안하고, 기존의 인터페이스와의 비교 실험을 통해 포인터의 오작동률 감소를 확인하였다. 이 과정에서 웹 환경의 실행 객체의 작은 크기로 인한 포인팅의 어려움이 오작동의 또 다른 중요한 문제점으로 확인되었다.

본 연구에서는 웹페이지에서 작은 크기의 실행 객체와 그 객체들의 배치 밀도가 높아 포인팅 및 실행이 어려웠던 문제점을 개선하여 상지장애인이 웹 콘텐츠를 자유롭게 클릭할 수 있도록 객체의 자동 확대인터페이스를 제안한다. 선행 연구에서 개발된 Eye-Voice 인터페이스를 개선하여 시선의 움직임에 따라 포인터로 추적되는 웹 브라우저의 클릭 가능한 객체만을 추출하여 크기를 동적으로 확대하여 포인터로 실행할 수 있는 범위를 확장했다. 또한, Eye-voice 인터페이스 환경에서 포인팅 된 객체를 동적으로 확대해주는 확대 기능을 적용하였을 때, 확대 비율에 따른 실행의 정확도 평가를 통해 적정 확대 비율 확인하였다.

2. 관련 연구

2.1 시선 추적을 이용한 기기 제어 인터페이스에서의 객체 확대 기능

시선 추적 기술을 이용하여 웹 콘텐츠를 탐색한 연구는 다음과 같다. 첫 번째, 응시 시간을 이용한 기기 제어 연구이다. 이 방식은 화면상의 객체를 응시하고 있는 시간을 계산하여 설정한 시간에 도달했을 때, 현재 포인터가 위치한 객체를 실행하는 방식이다. 이 방식의 대표적인 연구로는 Butterfleye가 있으며, Butterfleye는 응시하고 있는 객체의 임계치 시간에 도달하면 투명한 대형 실행 버튼을 제공하여, 클릭을 할 수 있도록 제공한다[5]. 하지만, 클릭을 원할 때마다 대형 버튼 호출을 위해 설정된 임계치 시간까지 눈을 깜빡이지 않고 기다려야 하며, 임계치 시간이 되기 전 눈을 깜빡이게 되면 시간이 마우스 포인터가 바뀌었다고 인식되어 시간이 다시 계산되는 불편함과 그로 인한 눈의 피로가 발생한다.

두 번째, 실행시키고자 하는 객체 위에 포인터가 배치되었을 때, 눈의 깜박임으로 객체를 실행시키는 포인터 실행 방식이다. 웹 환경에서의 제어 GazeThe Web 연구[6]는 웹 콘텐츠를 탐색할 때 깜빡임으로 포인터를 실행시키고, 문자를 입력한다. 특히 링크 콘텐츠에 포인터가 배치되면 연속적인 줌인(링크의 확대 및 축소가 연속적으로 실행) 기능을 제공하여 손쉽게 링크를 선택하고 포인터를 실행하도록 제공하지만, 링크 콘텐츠를 제외하고는 줌인 기능이 제공되지 않아 작은 객체를 시선 추적 기능으로 클릭하기에는 불편함이 존재하며, 반복적으로 커지고 작아지는 줌인 효과 역시 사용자의 눈의 피로를 발생시킨다.

마지막으로 복합 제어 방식의 연구가 있다. 이 방법은 시선 추적 기술을 기반하여 외부 버튼 및 음성인식 기술 등 결합하여 기기를 제어하는 방식이다[7]. [7]는 시선 추적 기술로 포인터의 이동을 외부 버튼으로 포인터의 실행을 수행한다. 또한, 가상 키보드와 음성 인식으로 문자를 입력하도록 하였다. 하지만 포인터 실행을 위한 외부 버튼을 생성하였지만, 객체를 확대하는 기능은 제공하지 않고 있어, 포인팅 및 실행 객체 실행의 정확도를 보장하고 있지는 않다.

일반 사용자에게는 웹 브라우저의 메뉴 및 콘텐츠의 크기는 큰 문제가 되지 않는다. 하지만 상지 장애인이 시선추적 기술을 사용하는 환경은 신체가 고정되어 모니터 앞으로 몸을 움직이기 힘들다. 웹 브라우저의 메뉴 또는 웹페이지는 포함하고 있는 실행객체의 높은 배치 밀도와 작은 크기로 인하여 정확한 포인팅이 어렵다. 따라서 본 연구에서는 웹 환경에서 시선이 이동하는 경로에 클릭이 가능한 객체만을 추출하여 자동 확대해 클릭을 쉽게 할 수 있도록 하였다. 시선의 이동과 클릭하기까지의 과정에서 눈의 깜빡임과 지속적인 응시로 인해 객체 실행의 오류와 피로감에서 벗어날 수 있도록 선행 연구 Eye-Voice 인터페이스의 음성 명령 기능과 빈번한 실행 버튼 호출과 링크에만 제공되었던 확대 기능을 클릭 가능한 다양한 객체에 적용하여 웹의 활용 가능 범위를 확대하였다는 것에 큰 의미가 있다고 할 수 있다.

2.2 선행 연구

본 연구의 선행 연구로 손 사용이 불편한 상지 장애인이 시선 추적 기술로 포인터를 움직이고, 웹 브라우저를 탐색할 때 포인터 실행의 오류를 줄이는 음성명령 시선추적 인터페이스 Eye-Voice를 개발하였다. Eye-Voice는 시선 추적 기술로 포인터의 움직임을 실행하고, 웹 브라우저를 탐색하는 동안 부정확한 포인터 실행(깜빡임, 응시) 방법을 사용하지 않고 “okay”라고 음성명령을 내려 자연스러운 클릭을 즉각적으로 실행할 수 있도록 설계하였다. 또한 기존 시선 인터페이스들과의 포인터 실행의 오작동 감소에 관한 비교 실험을 진행한 결과 Eye-Voice가 포인터 실행의 오작동률을 낮추었으며 효과가 있음을 검증하였다. 본 연구는 Eye-Voice 인터페이스를 기반으로 사용자의 시선이 이동하는 경로에 객체를 자동확대해주는 웹 확장 프로그램으로 기능을 확대하여 개발을 진행하고자 한다.

3. 추적 실행 객체 확대 인터페이스 설계 및 구현

3.1 시스템 목표 및 개요

본 시스템은 상지장애인이 마우스의 사용 없이도 PC의 메뉴 및 객체를 자유롭게 선택하고 실행시킬 수 있는 Eye-Voice 인터페이스에서 사용자의 시선의 움직임에 따라 실행 객체를 확대해주는 인터페이스 개발을 목표로 한다. 본 인터페이스 설계의 핵심은 상지장애인이 웹 환경에서 클릭을 수행하고자 할 때, 실행 객체의 높은 배치 밀도와 작은 크기로 인해 포인팅하기 어려웠던 문제를 사용자의 시선 이동 경로에 있는 클릭 가능한 객체만을 추출하여 자동으로 그 크기가 확대되도록 설계하였다.

3.2 시스템 주요 기능 설계

객체 포인팅의 정확도 및 웹 브라우저 사용의 편리성을 향상하기 위해 웹 브라우저의 확대 인터페이스를 설계하였다. 확대 인터페이스는 두 가지의 확대기능을 포함한다. 첫 번째 기능은 웹 콘텐츠 내 추적된 실행 객체의 확대 기능이다. 포인터로 추적되는웹 브라우저의 실행 객체의 크기를 동적으로 확대하여 포인터 실행할 수 있는 범위를 확대했다. 확대 기능이 적용될 객체는 웹페이지 내에 존재하며, 하이퍼링크가 결합된 객체를 대상으로 하였다.

두 번째 확대 인터페이스의 기능은 웹 브라우저메뉴의 확대 및 재배치이다. 웹 브라우저의 메뉴는 화면 조작을 위해 자주 사용되는 메뉴로 선정하였으며, 선정된 메뉴들은 기능에 따라 네비게이션 기능과 보기 기능으로 구별하였다. 네비게이션 기능에는 페이지 액션과 탭 액션이 있다. 페이지 액션으로 ‘뒤로 가기’, ‘앞으로 가기’ 기능이 메뉴에 포함되고 탭 액션으로 ‘창 닫기’, ‘홈으로 가기’ 기능이 메뉴에 포함된다. 보기 기능에는 화면 재실행 기능의 ‘새로 고침’과화면 비율을 지정하는 기능의 ‘확대’, ‘축소’ 기능이 메뉴에 포함된다. 웹페이지의 화면이 전환되어도 빠르게 접근 및 실행할 수 있도록 웹 브라우저 화면을 중심으로 양측에 배치하였다.

3.3 구현 및 결과

본 논문에서 제안하는 시스템의 구성도는 Fig. 1 과 같다. 크롬 확장 프로그램이 구동되면 시선 추적 모듈과 음성 인식 모듈이 백그라운드에서 실행된다. 시선 추적 모듈은 실시간 시선 좌표에 따라 포인터를 모니터에 배치하며, 음성 인식 기능을 이용하여 포인터를 실행한다. 이때, 시선의 이동에 따라 클릭이 가능한 실행 객체일 경우 객체의 크기를 동적으로 확장시키도록 하였다. 객체의 확대 기능은 웹페이지가 로드될 때 HTML 요소를 검사한다. HTML 요소에 따라 실행 객체를 판별하고, 실행 객체라고 판단되는 요소는 그 크기를 확대한다. 음성 인식 모듈은 프로그램이 실행됨과 동시에 백그라운드에서 음성을 인식 받을 수 있는 상태로 유지한다. 음성 입력이 들어오면 실행 객체의 유형에 따라 텍스트를 화면에 디스플레이 하거나, 실행 객체를 실행한다. 시선 추적 및 음성 명령 기능은 Python 언어[8]로 tobii_research API[9]와 Google Cloud Speech API[10]를 이용하여 개발하였으며, 확대 인터페이스의 기능은 JavaScript, HTML[11], CSS를 이용하여 개발하였다. 개발 단계와 사용자 테스트 진행 시 사용된 데모 도구는 아이트래커 Tobii Etyetracket X130[12]이다.

MTMDCW_2021_v24n7_903_f0001.png 이미지

Fig. 1. Overall System Diagram.

실행 객체의 확대는 웹 브라우저에서 구현되며, 웹페이지 내 실행 객체의 확대 기능과 브라우저의 메뉴 확대 및 재배치 기능을 포함한다.

실행 객체의 확대 기능은 브라우저 내 웹 콘텐츠 위에서 시선이 이동할 때 실행 가능 객체일 경우 즉시 확대되고, 시선이 해당 객체에서 떠났을 때 원래의 크기로 돌아오도록 구현하였다. 실행 가능한 객체 확대를 위해서는 먼저, 객체의 유형 판단이 실행된다. 웹페이지가 브라우저상에 로드될 때마다 확장 프로그램에서 DOM을 통해 해당 페이지에 존재하는 실행 객체를 판단한다. 실행 객체는 웹페이지의 HTML 요소를 판단 기준으로 설정하였다. HTML의 ,

References

  1. J.H. Park, Multimodal Interface to Improve Digital Device Accessibility for the People with Disabilities in Web Environment, Doctoral Dissertation of Sookmyung Women's University, 2020.
  2. A. Murata, R. Uetsugi, and T. Hayami, "Study on Cursor Shape Suitable for Eye-Gaze Input System," Proceedings of SICE Annual Conference(SICE), pp. 926-931, 2012.
  3. J.-R. Choi, A Digital Publishing Framework for Crowdsourcing based Adaptive ebook Contents, Doctors Dissertation of Sookmyung Women's University, 2017.
  4. J.H. Park, M.H. Park, and S.B. Lim, "A Proposal of Eye-Voice Method based on the Comparative Analysis of Malfunctions on Pointer Click in Gaze Interface for the Upper Limb Disabled," Journal of Korea Multimedia Society, Vol. 23, No. 4, pp. 566-573, 2020.
  5. A. Chetcuti and C. Porter, "Butterfleye : Supporting the Development of Accessible Web Applications for Users with Severe MotorImpairment," Proceedings of the 30th International BCS Human Computer Interaction Conference, pp. 1-3, 2016.
  6. R. Menges, C. Kumar, D.J. Muller, and K. Sengupta, "GazeTheWeb: A Gaze-Controlled Web Browser," Proceedings of the 14th Web for All Conference on The Future of Accessible Work, Article No. 25, 2017.
  7. S. Kwak, I. Kim, D. Sim, S.H. Lee, and S.S. Hwang, "A Computer Access System for the Physically Disabled Using Eye-Tracking and Speech Recognition," Journal of the HCI Society of Korea, Vol. 12, No. 4, pp. 5-15, 2017.
  8. Python(2020). https://www.python.org/ (accessed March 24, 2020).
  9. Tobii_reserach API(2020). http://developer. tobiipro.com/ (accessed March 24, 2020).
  10. Google Cloud Speech API(2020). https://cloud.google.com/speech-to-text/?hl=ko (accessed March 24, 2020).
  11. HTML(2011). https://www.w3.org/TR/2011/WD-html5-20110405/ (accessed March 24, 2020).
  12. Tobii Etyetracket X130(2019). https://www.tobiipro.com/ (accessed March 24, 2020).