• 제목/요약/키워드: Gesture Recognition.

검색결과 557건 처리시간 0.021초

립모션 기반의 윈도우즈 애플리케이션 제어 모델에 관한 연구 (A Study on the Windows Application Control Model Based on Leap Motion)

  • 김원
    • 한국융합학회논문지
    • /
    • 제10권11호
    • /
    • pp.111-116
    • /
    • 2019
  • 최근 컴퓨터 능력의 급속한 발전으로 인간과 컴퓨터간의 상호 작용을 편리하게 연결할 수 있는 많은 기술들이 연구되고 있는 상황으로, 전통적인 입력장치를 사용한 GUI에서 3D 모션, 햅틱, 멀티 터치와 같은 신체를 이용한 NUI로 패러다임이 변화되고 있는 추세이다. 인간의 동작을 센서를 이용하여 컴퓨터에 전달하는 많은 연구가 이루어지고 있으며, 3D 객체를 획득할 수 있는 광학 센서의 개발과 더불어 산업 및 의료 분야, 사용자 인터페이스 분야 등으로 응용 범위가 확장되고 있다. 본 논문에서는 립모션을 기반으로 사용자의 손동작에 따라 기본 입력장치인 마우스를 대신하여 제스처를 통한 타 프로그램 실행 및 윈도우즈 제어가 가능하며, 안드로이드 앱과 융합하여 메인 클라이언트와 연결을 통하여, 음성인식과 버튼을 사용해 각종 미디어와 음성 명령 기능을 통한 제어가 가능한 모델을 제안한다. 제안 모델을 통하여 영상, 음악과 같은 인터넷 미디어를 클라이언트 컴퓨터 뿐만 아니라 앱을 통한 원거리 제어가 가능하여, 편리하게 미디어를 시청할 수 있을 것으로 기대된다.

신경망을 활용한 손목재활 수부 동작 인식 최적화 기법 (Optimization Technique to recognize Hand Motion of Wrist Rehabilitation using Neural Network)

  • 이수현;이영근
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권2호
    • /
    • pp.117-124
    • /
    • 2021
  • 본 연구는 손목 재활을 위한 신경망을 이용하여 수부 동작 인식해주는 연구이다. 수부의 재활은 손상을 받은 수부의 기능을 최대로 회복시켜 일상생활과 직업, 취미생활을 가능하게 하는 것을 목표로 한다. 하지만 어느 장소를 찾아 치료를 하는 것은 경제적, 시간적으로 매우 비효율적이다. 이런 문제점을 해결하고자 본 연구에서는 환자가 직접 스마트 기기를 이용해 재활 치료를 하고자 한다. 이를 활용하면 비용이나 시간적인 면에서 매우 도움이 될 것이다. 본 연구에서는 총 10명의 사람으로부터 4 종류의 재활 운동에 대한 데이터를 수집하여 손목재활 데이터셋을 만들었다. 수부 제스쳐 인식은 신경망을 이용하여 모델을 구성하였다. 그 결과 93%의 정확도를 얻었으며, 본 시스템의 유용성을 검증하였다.

손 동작 인식을 통한 인간 - 컴퓨터 인터페이스용 저가형 비주얼 모션 데이터 글러브 (Inexpensive Visual Motion Data Glove for Human-Computer Interface Via Hand Gesture Recognition)

  • 한영모
    • 정보처리학회논문지B
    • /
    • 제16B권5호
    • /
    • pp.341-346
    • /
    • 2009
  • 모션 데이터 글러브는 손의 움직임을 측정하여 컴퓨터에 입력하는 대표적인 인간과 컴퓨터간의 인터페이스 도구로서, 홈 오토에이션, 가상 현실, biometrics, 모션 캡쳐 등의 컴퓨터 신기술에 사용되는 필수 장비이다. 본 논문에서는 대중화를 위하여, 별도의 특수 장비 없이 사용 가능한 저가형 비주얼 모션 데이터 글러브를 개발하고자 한다. 본 방식의 특징은 기존의 모션 데이터 글러브에 사용되었던, 고가의 모션 센싱 섬유를 사용하지 않음으로써, 저가형으로 개발이 가능하다는 것이다. 따라서 제작이 용이하고 대중화에 크게 기여할 수 있다는 장점을 가진다. 본 방식에서는 모션 센싱 섬유를 사용하는 기계적인 방식대신 광학적 모션 캡쳐 기술을 개량한 비주얼 방식을 채택한다. 기존의 비주얼 방식에 비해 본 방식은 다음과 같은 장점과 독창성을 가진다. 첫째, 기존의 비주얼 방식은 가려짐 현상을 제거하고 3차원 자세 복원을 위해 많은 수의 카메라와 장비를 사용하는 데 비해, 본 방식은 모노비전 방식을 채택하여 장비가 간소하고 저가형 개발이 가능하다. 둘째, 기존의 모노비전방삭은 가려짐 현상에 취약하여 영상에서 가려진 부분은 3차원 자세 복원이 어려웠다. 하지만 본 논문은 독창적으로 설계된 막대 모양의 지시자를 사용하여, 영상에서 가려진 부분도 3차원 자세 복원이 가능하다. 셋째, 기존의 모노 비전 방식은 비선형 수치해석 형태의 영상 해석 알고리즘을 사용하는 경우가 많아서 초기화나 계산시간 면에서 불편하였다. 하지만, 본 논문에서는 독창적인 공식화 방법을 사용하여 닫힌 형태의 영상해석 알고리즘을 도출함으로써 이와 같은 불편을 개선하였다. 넷째, 기존의 닫힌 형태의 알고리즘은 공식화 과정에서 근사화 방법을 도입하는 경우가 많아서 정확도가 떨어지고 특이점에 의한 응용분야에 제한이 있었다. 하지만 본 방식은 오일러 각과 같은 국부적인 매개화나 근사화 등을 사용하는 대신 지수형태의 트위스트좌표계를 사용하는 독창적인 공식화 방법을 사용하여, 공식화 단계에서의 근사화 방법 없이 닫힌 형태의 알고리즘을 도출함으로써 이 문제들을 개선하였다.

원형 근전도 센서 어레이 시스템의 센서 틀어짐에 강인한 손 제스쳐 인식 (Hand Gesture Recognition Regardless of Sensor Misplacement for Circular EMG Sensor Array System)

  • 주성수;박훈기;김인영;이종실
    • 재활복지공학회논문지
    • /
    • 제11권4호
    • /
    • pp.371-376
    • /
    • 2017
  • 본 논문에서는 원형 근전도 시스템 장비를 사용하여 근전도 패턴인식을 할 때, 장비의 센서 위치와 무관하게 패턴 인식이 가능한 알고리즘을 제안한다. 6가지 동작의 8채널 근전도 신호를 1초간 측정한 데이터를 이용하여 14개의 특징점을 추출하였다. 또한 8개의 채널에서 추출된 112개의 특징점을 나열하여 주성분분석을 하고 영향력이 높은 데이터만을 추려내어 8개의 입력 신호로 줄였다. 모든 실험은 k-NN 분류기를 이용하여 데이터를 학습시키고 5-fold 교차 검증을 사용하여 데이터를 검증하였다. 기계학습에서 데이터를 학습시킬 때, 어떤 데이터를 학습하느냐에 따라 그 결과가 크게 달라진다. 기존의 연구들에서 사용하는 학습 데이터를 사용 할 경우 99.3%의 정확도를 확인하였다. 그러나 센서의 위치가 22.5도 정도만 틀어지더라도 67.28%의 정확도로 명확하게 떨어짐을 보았다. 본 논문에서 제안하는 학습 방법을 사용 할 경우 98%의 정확도를 보이고 장비의 센서의 위치가 바뀌더라도 98% 근처의 정확도를 유지함을 보였다. 이러한 결과를 사용하여 원형 근전도 시스템을 사용하는 사용자들의 편의성을 크게 증대시켜 줄 수 있을 것으로 보인다.

W3C 기반 상호연동 가능한 멀티모달 커뮤니케이터 (W3C based Interoperable Multimodal Communicator)

  • 박대민;권대혁;최진혁;이인재;최해철
    • 방송공학회논문지
    • /
    • 제20권1호
    • /
    • pp.140-152
    • /
    • 2015
  • 최근 사용자와 컴퓨터간의 양방향 상호작용을 가능하게 하는 HCI(Human Computer Interaction) 연구를 위해 인간의 의사소통 체계와 유사한 인터페이스 기술들이 개발되고 있다. 이러한 인간과의 의사소통 과정에서 사용되는 커뮤니케이션 채널을 모달리티라고 부르며, 다양한 단말기 및 서비스 환경에 따라 최적의 사용자 인터페이스를 제공하기 위해서 두 개 이상의 모달리티를 활용하는 멀티모달 인터페이스가 활발히 연구되고 있다. 하지만, 멀티모달 인터페이스를 사용하기에는 각각의 모달리티가 갖는 정보 형식이 서로 상이하기 때문에 상호 연동이 어려우며 상호 보완적인 성능을 발휘하는데 한계가 있다. 이에 따라 본 논문은 W3C(World Wide Web Consortium)의 EMMA(Extensible Multimodal Annotation Markup language)와 MMI(Multimodal Interaction Framework)표준에 기반하여 복수의 모달리티를 상호연동할 수 있는 멀티모달 커뮤니케이터를 제안한다. 멀티모달 커뮤니케이터는 W3C 표준에 포함된 MC(Modality Component), IM(Interaction Manager), PC(Presentation Component)로 구성되며 국제 표준에 기반하여 설계하였기 때문에 다양한 모달리티의 수용 및 확장이 용이하다. 실험에서는 시선 추적과 동작 인식 모달리티를 이용하여 지도 탐색 시나리오에 멀티모달 커뮤니케이터를 적용한 사례를 제시한다.

시각장애인의 길 탐색을 위한 대화형 인터랙티브 촉각 지도 개발 (A Conversational Interactive Tactile Map for the Visually Impaired)

  • 이예린;이동명;루이스 카바조스 케로;호르헤 이란조 바르톨로메;조준동;이상원
    • 감성과학
    • /
    • 제23권1호
    • /
    • pp.29-40
    • /
    • 2020
  • 시각장애인들에게는 길 찾기 및 탐색이 어려운 과제이기 때문에, 이들의 독립적이고 자율적인 이동성 향상에 대한 연구가 필요하다. 그러나 기존의 점자 촉각 지도는 여러 문제점을 가지고 있다. 이를 해결하기 위해 기술의 발달과 함께 촉각 지도에 다른 인터랙션 방식을 더하려는 시도들이 존재해왔다. 본 연구는 이러한 흐름 속에서 새로운 대화형 인터랙티브 촉각 지도 인터페이스를 개발하였다. 촉각 탐색을 하는 동안 사용자의 터치를 인식하여 음성 피드백을 제공하며, 사용자가 음성 에이전트와 대화를 나눌 수 있고 이를 통해 관심 지점에 대한 정보나 경로 안내를 받을 수 있다. 사용성 테스트를 진행하기 위해 프로토타입을 제작하였으며, 실제 시각장애인들을 대상으로 프로토타입 사용 후 설문 및 인터뷰를 통한 실험을 진행하였다. 점자를 사용한 기존 촉각 지도보다 본 연구에서 제작된 인터랙티브 촉각 지도 프로토타입이 시각장애인들에게 더욱 높은 사용성을 제공하였다. 시각장애인들은 본 연구의 프로토타입을 사용했을 때 더 빨리 시작 지점 및 관심 지점을 찾을 수 있었고 더 높은 독립성 및 확신을 가질 수 있었다고 보고하였다. 본 연구는 시각장애인의 지도 이용 및 경험을 향상시킬 수 있는 새로운 촉각 지도 인터페이스를 제시하였다. 실험에서 프로토타입의 개선 방향에 대한 다양한 피드백을 받을 수 있었다. 아직 개발 단계에 있기 때문에, 이를 반영한 후속 연구를 통해 이를 더욱 발전시킬 수 있을 것이다.

스마트카의 인터페이스를 위한 경험 디자인 가이드라인 (Experience Design Guideline for Smart Car Interface)

  • 유훈식;주다영
    • 디자인융복합연구
    • /
    • 제15권1호
    • /
    • pp.135-150
    • /
    • 2016
  • 통신 기술의 발달, 지능형교통체계(ITS: Intelligent Transport Systems)의 확산으로 자동차는 단순한 기계장치에서 종합편의 기능을 가진 제2의 생활 공간으로 변모하고 있으며, 이를 위한 인터페이스로써의 역할을 하는 플랫폼으로 진화하고 있다. 탑승자들에게 다양한 정보를 제공하는 인터페이스 영역이 확장됨에 따라 스마트카 기반의 사용자 경험(UX: User Experience) 연구에 대한 중요성이 높아지고 있다. 이 연구는 스마트카의 사용자 경험 요소에 대한 가이드라인을 제안하는데 목적을 두고 있다. 연구의 수행을 위해 기존 연구를 기반으로 스마트카의 사용자 경험 요소를 기능(function), 상호작용(interaction), 표면(surface)으로 정의하였으며, UX/UI 전문가들의 논의를 통해 각 요소 별로 8개의 대표 기술, 14개의 대표 기능, 8개의 유리창의 위치를 정의하였다. 이 후 100명의 운전자를 대상으로 정의된 스마트카 사용자 경험 요소들에 대한 우선순위를 설문조사 방식으로 분석하였다. 분석을 통해 사용자들은 차량에 주요 기술을 적용함에 있어서 안전, 주행, 감성의 순으로, 조작 방식에 있어서는 음성인식, 터치, 제스처, 물리적 버튼, 아이트레킹의 순으로, 디스플레이 위치에 대해서는 운전석을 중심으로 전방에서 후방으로 높은 우선순위를 가지고 있는 것을 알 수 있었다. 성별에 따른 분석에 있어서는 2개의 기능 외에는 큰 차이를 보이지 않아 남성과 여성에 대한 가이드가 공통되게 적용될 수 있음을 알 수 있었다.