• 제목/요약/키워드: $\pi$-gesture

검색결과 7건 처리시간 0.023초

기계 장치와의 상호작용을 위한 실시간 저비용 손동작 제어 시스템 (A Real Time Low-Cost Hand Gesture Control System for Interaction with Mechanical Device)

  • 황태훈;김진헌
    • 전기전자학회논문지
    • /
    • 제23권4호
    • /
    • pp.1423-1429
    • /
    • 2019
  • 최근에, 효율적인 상호작용을 지원하는 시스템 인 휴먼 머신 인터페이스(HMI)가 인기를 끌고있다. 본 논문에서는 차량 상호작용방법 중 하나로 새로운 실시간 저비용 손동작 제어 시스템을 제안한다. 계산 시간을 줄이기 위해 RGB 카메라를 사용하여 손 영역을 감지할 때 많은 계산이 필요하므로 TOF (Time-of-Flight) 카메라를 사용하여 깊이 정보를 취득한다. 또한, 푸리에 기술자를 사용하여 학습 모델을 줄였다. 푸리에 디스크립터는 전체 이미지에서 적은 수의 포인트만 사용하므로 학습 모델을 소형화 할 수 있다. 제안 된 기법의 성능을 평가하기 위해 데스크탑과 라즈베리 pi 2의 속도를 비교했다. 실험 결과에 따르면 소형 임베디드와 데스크탑의 성능 차이는 크지 않다. 제스처 인식 실험에서 95.16 %의 인식률이 확인되었다.

Prosodic Boundary Effects on the V-to-V Lingual Movement in Korean

  • Cho, Tae-Hong;Yoon, Yeo-Min;Kim, Sa-Hyang
    • 말소리와 음성과학
    • /
    • 제2권3호
    • /
    • pp.101-113
    • /
    • 2010
  • The present study investigated how the kinematics of the /a/-to-/i/ tongue movement in Korean would be influenced by prosodic boundary. The /a/-to-/i/ sequence was used as 'transboundary' test materials which occurred across a prosodic boundary as in /ilnjəʃ$^h$a/ # / minsakwae/ ('일년차#민사과에' 'the first year worker' # 'dept. of civil affairs'). It also tested whether the V-to-V tongue movement would be further influenced by its syllable structure with /m/ which was placed either in the coda condition (/am#i/) or in the onset condition (/a#mi). Results of an EMA (Electromagnetic Articulagraphy) study showed that kinematical parameters such as the movement distance (displacement), the movement duration, and the movement velocity (speed) all varied as a function of the boundary strength, showing an articulatory strengthening pattern of a "larger, longer and faster" movement. Interestingly, however, the larger, longer and faster pattern associated with boundary marking in Korean has often been observed with stress (prominence) marking in English. It was proposed that language-specific prosodic systems induce different ways in which phonetics and prosody interact: Korean, as a language without lexical stress and pitch accent, has more degree of freedom to express prosodic strengthening, while languages such as English have constraints, so that some strengthening patterns are reserved for lexical stress. The V-to-V tongue movement was also found to be influenced by the intervening consonant /m/'s syllable affiliation, showing a more preboundary lengthening of the tongue movement when /m/ was part of the preboundary syllable (/am#i/). The results, together, show that the fine-grained phonetic details do not simply arise as low-level physical phenomena, but reflect higher-level linguistic structures, such as syllable and prosodic structures. It was also discussed how the boundary-induced kinematic patterns could be accounted for in terms of the task dynamic model and the theory of the prosodic gesture ($\pi$-gesture).

  • PDF

Design of OpenCV based Finger Recognition System using binary processing and histogram graph

  • Baek, Yeong-Tae;Lee, Se-Hoon;Kim, Ji-Seong
    • 한국컴퓨터정보학회논문지
    • /
    • 제21권2호
    • /
    • pp.17-23
    • /
    • 2016
  • NUI is a motion interface. It uses the body of the user without the use of HID device such as a mouse and keyboard to control the device. In this paper, we use a Pi Camera and sensors connected to it with small embedded board Raspberry Pi. We are using the OpenCV algorithms optimized for image recognition and computer vision compared with traditional HID equipment and to implement a more human-friendly and intuitive interface NUI devices. comparison operation detects motion, it proposed a more advanced motion sensors and recognition systems fused connected to the Raspberry Pi.

딥러닝 기반의 얼굴과 제스처 인식을 활용한 원격 제어 (Remote Control System using Face and Gesture Recognition based on Deep Learning)

  • 황기태;이재문;정인환
    • 한국인터넷방송통신학회논문지
    • /
    • 제20권6호
    • /
    • pp.115-121
    • /
    • 2020
  • IoT 기술과 이 확산됨에 따라 얼굴 인식을 활용하는 다양한 응용들이 등장하고 있다. 본 논문은 딥러닝 기반의 얼굴 인식과 손 제스처 인식을 활용하는 원격 제어 시스템을 설계 구현한 내용을 기술한다. 얼굴 인식을 활용하는 응용시스템은 카메라로부터 실시간으로 영상을 촬영하는 부분과 영상으로부터 얼굴을 인식하는 부분, 그리고 인식된 결과를 활용하는 부분으로 구성된다. 영상을 실시간으로 촬영하기 위해서 어디서나 장착 가능한 싱글보드 컴퓨터인 라즈베리파이를 이용하고, 서버 컴퓨터에는 FaceNet 모델을 활용하여 얼굴 인식 소프트웨어를 개발하고 OpenCV를 이용한 손 제스처 인식 소프트웨어도 개발하였다. 사용자를 알려진 사용자와 위험한 사용자 그리고 모르는 사용자의 3 그룹으로 구분하고, 얼굴 인식과 손 제스처가 모두 통과된 알려진 사용자에 대해서만 자동 도어락을 오픈하는 응용을 설계 구현하였다.

그로브 제스처 센서를 활용한 모션 및 음성 인식 스마트 미러에 관한 연구 (A Study on the Motion and Voice Recognition Smart Mirror Using Grove Gesture Sensor)

  • 최희태;고창훈;정지민;신예슬;박형근
    • 한국전자통신학회논문지
    • /
    • 제18권6호
    • /
    • pp.1313-1320
    • /
    • 2023
  • 본 논문에서는 그로브 제스처를 사용하여 스마트 미러의 화면을 제어하고 음성인식 기능을 통해 화면에 웹 브라우저 검색 기능과 거울화면을 제어할 수 있는 스마트 미러를 제안하였다. 스마트 미러의 하드웨어 구성은 LCD모니터에 아크릴 판을 결합하고 반사율 37% 투과율 36%의 하프미러필름을 아크릴판에 부착하여 거울처럼 사용함과 동시에 거울에 디스플레이를 표시하도록 제작하였다. 제안한 스마트 미러는 사용자가 직접 거울을 터치하거나 키보드를 조작하는 등의 번거로운 작업 없이 그로브 제스처 센서를 통해 간단한 손동작만으로 화면을 제어할 수 있는 기능을 구현하였으며 음성인식 기능과 GoogleAssistant를 도입하여 사용자가 내린 음성명령에 일치하는 결과를 화면에 출력하였다.

라즈베리 파이와 립 모션을 이용한 지화 번역 시스템 설계 및 구현 (Design and Implementation of Finger Language Translation System using Raspberry Pi and Leap Motion)

  • 정필성;조양현
    • 한국정보통신학회논문지
    • /
    • 제19권9호
    • /
    • pp.2006-2013
    • /
    • 2015
  • 청각 장애인은 소리를 듣고 음성으로 표현하는 의사소통에 어려움이 있기 때문에 주로, 구화, 수화, 필담 등을 이용하여 의사소통을 진행한다. 청각 장애인과 건청인과의 의사소통을 위해서는 수화가 가장 좋은 방법이지만 수화 사용방법을 이해해야만 하는 어려움이 따른다. 본 논문은 청각 장애인과 건청인간의 의사소통을 위한 수단으로 지화 번역 시스템을 설계 및 구현하였다. 지화 입력 수단으로 손가락 모양과 손동작을 추적할 수 있는 립 모션을 사용하였다. 입력된 정보를 처리하고 번역하기 위해서 저전력 싱글 보드 컴퓨터인 라즈베리 파이를 활용하였다. 시스템 개발을 위하여 Node.js와 MongoDB를 활용하여 플랫폼에 구애받지 않고 다양한 환경에서 사용할 수 있도록 구현하였다. 클라이언트용 애플리케이션은 HTML5를 기반으로 구현하여 웹 브라우징이 가능한 스마트 디바이스를 지원한다.

지화인식 기반의 음성 및 SNS 공유 시스템 구현 (System implementation share of voice and sign language)

  • 강정훈;양대식;오민석;서정욱
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 추계학술대회
    • /
    • pp.644-646
    • /
    • 2016
  • 본 논문에서는 청각 장애인은 소리를 듣고 음성으로 표현하는 의사소통에 어려움이 있기 때문에 주로, 구화, 수화, 필담 등을 이용하여 의사소통을 진행한다. 청각 장애인과 건청인과의 의사소통을 위해서는 수화가 가장 좋은 방법이지만 수화 사용방법을 이해해야만 하는 어려움이 따른다. 청각 장애인과 건청인간의 의사소통을 위한 수단으로 지화번역 시스템을 설계 및 구현 하였다. 지화 입력 수단 으로는 손가락 모양과 손동작을 추적 할 수 있는 립 모션을 사용하였다. 입력된 정보를 처리하고 번역하기 위해서 저전력 싱글 보드 컴퓨터인 라즈베리 파이를 활용 하였다.

  • PDF