• Title/Summary/Keyword: 소리 인식

Search Result 214, Processing Time 0.03 seconds

The winner is determined by using the Kinect and measured changes in EEG (Kinect를 이용한 손 제스처 인식과 EEG 변화 분석 연구)

  • Choi, JeongMook;Kim, Jin;Choi, Jae Hong;Lee, HwaMin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.11a
    • /
    • pp.1676-1679
    • /
    • 2013
  • 컴퓨터의 발달과 함께 입력 형태 또한 다양해졌다. 가령, Kinect는 움직이는 동작이나 원근거리, 그리고 소리까지 입력받을 수 있다. 이 연구는 Kinect를 통하여 손가락의 움직임을 입력받은 후, 그에 따른 게임의 결과를 출력한다. MindWave를 사용하여 EEG 데이터의 시각화를 통하여 사용자가 출력 내용을 이해하기 쉽게 구현하였다.

Toward the Virtual Touch Pad using Mobile Devices and Acoustic Input (모바일 디바이스와 어쿠스틱 인풋을 이용한 가상 터치 인식 기술 설계)

  • Oh, Junho;Choi, Jaehoon;Kang, Jaewoo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.11a
    • /
    • pp.815-817
    • /
    • 2010
  • 본 논문은 모바일 디바이스에 설치된 어쿠스틱 센서를 이용하여 가상의 터치패드를 구현하는 방법을 제시한다. 어쿠스틱 센서를 이용한 가상 터치패드 구현은 기존의 터치패드 방식에서 나타나는 대형화에 대한 한계를 극복함과 동시에 설치 및 유지비용을 낮추는데 큰 기여를 할 것으로 기대된다. 2 대의 아이폰에 설치되어 있는 단일채널 마이크 2 개, 자이로스코프와 가속도계, 블루투스 통신을 사용하여, 정해진 경계면에서 나오는 소리의 위치를 식별하고, 이를 화면과 동기화하여 간단한 조작을 가능하게 한다.

Audio Information Authoring Technology for 3D Contents of COSMOS (COSMOS의 3D 콘텐츠 음향정보 자동등록 기술)

  • Ji, Su-Mi;Kwon, Soon-Il;Baik, Sung-Wook
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.04a
    • /
    • pp.451-454
    • /
    • 2011
  • COSMOS (COntentS Making Omnipotent System)는 컴퓨터 게임이나 3차원 애니메이션 제작이 가능하도록 그래픽 랜더링, 특수효과, 물리엔진, 인공지능 엔진 등의 기능을 갖춘 범용성 3차원 콘텐츠 저작 시스템이며, 무엇보다도 직관적인 인터페이스 기능을 통해 사용자의 편리성을 제공해 준다. 본 논문은 COSMOS에서 음향 정보를 자동으로 3D 콘텐츠 구성 요소에 배합될 수 있도록 하는 기술에 대한 내용이다. 본 기술의 도입을 통해 COSMOS에서는 사용자의 의성어 소리를 인식하여, 그 의미에 적합한 디지털 사운드를 검색한 후에 사용자의 의도에 맞추어 변환하여 이와 관련된 콘텐츠 구성 요소와 일치 시켜줌으로써 보다 직관적으로 콘텐츠 저작 기능을 제공할 수 있다.

Implementation of a Baby Monitoring System for Parents (부모를 위한 아기 돌봄이 시스템 구현)

  • Park, Jun-Wan;Hong, Yoon-Ki;Song, Bo-Jeong;Ha, Na-Ri;Kang, Seok-Hoon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.11a
    • /
    • pp.83-86
    • /
    • 2011
  • 본 논문에서는 잠을 자주 깨는 아기를 키우는 부모의 어려움을 덜어주기 위한 IT 융합 시스템을 제안한다. 제안된 시스템은 필요 시 요람을 자동으로 움직여주는 기능 및 아기의 상태, 대소변 유무를 스마트폰을 통해 원격으로 전송해 주는 기능을 포함하고 있다. 제안된 시스템의 요람 내부에 설치된 소음센서가 아기 울음 소리를 인식하면, 그 신호가 중앙 제어 부로 보내지고 요람이 적당한 강도로 움직이기 시작한다. 동시에 낙수음(落水音)을 아기에게 들려줌으로써 엄마 뱃속에 있을 때와 같은 편안함을 준다. 또한, 요람에 장착된 태블릿 카메라를 통해 원격으로 아기의 현재 상태를 확인 할 수 있다. 이러한 시스템은 부모가 아기를 요람에 두고서도 스마트폰을 통해 아기의 상태를 항시 체크하면서 다른 일을 할 수 있도록 하여 생산성을 높이는 효과도 있을 것으로 기대된다.

Development of Korean Sign Language Translator for Speech and Hearing Impaired (언어·청각장애인을 위한 한국 수어 번역기 개발)

  • Su-Beom Jo;Dong-Kyu Lee;Young-Chan Jo;Dongmahn Seo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.575-576
    • /
    • 2023
  • 한국 수어는 소리로 말을 배울 수 없어서 사용하는 '보이는 언어'이고 한국수화언어를 줄인 말이다. 한국어나 영어와 같이 독립된 언어로 한국어와는 문법 체계가 다른 대한민국 농인의 고유한 언어이다. 하지만, 한국 사회에서는 수어를 일상어로 사용하는 농인이 수어만으로 다른 사람과 대화하거나 서비스 등을 이용하기에는 쉽지 않은 구조이다. 이에 본 논문에서는 택시라는 상황을 가정해 택시 안에서 학습된 모델이 농인의 수어를 인식하고 택시 기사에게 해당 의미를 전달하는 시스템을 제안한다. 제안 시스템을 통해 택시 기사는 농인(수어사용자)에게 응답할 수 있다. 본 논문에서는 한국수어 번역기 웹서비스를 설계 및 구현하여 실제 환경에서의 활용 가능성을 검증한다.

Emotion Recognition Method Using Heart-Respiration Connectivity (심장과 호흡의 연결성을 이용한 감성인식 방법)

  • Lee, Dong Won;Park, Sangin;Whang, Mincheol
    • Science of Emotion and Sensibility
    • /
    • v.20 no.3
    • /
    • pp.61-70
    • /
    • 2017
  • Physiological responses have been measured to recognize emotion. Although physiological responses have been interrelated between organs, their connectivities have been less considered for emotion recognizing. The connectivities have been assumed to enhance emotion recognition. Specially, autonomic nervous system is physiologically modulated by the interrelated functioning. Therefore, this study has been tried to analyze connectivities between heart and respiration and to find the significantly connected variables for emotion recognition. The eighteen subjects(10 male, age $24.72{\pm}2.47$) participated in the experiment. The participants were asked to listen to predetermined sound stimuli (arousal, relaxation, negative, positive) for evoking emotion. The bio-signals of heart and respiration were measured according to sound stimuli. HRV (heart rate variability) and BRV (breathing rate variability) spectrum were obtained from spectrum analysis of ECG (electrocardiogram) and RSP (respiration). The synchronization of HRV and BRV spectrum was analyzed according to each emotion. Statistical significance of relationship between them was tested by one-way ANOVA. There were significant relation of synchronization between HRV and BRV spectrum (synchronization of HF: F(3, 68) = 3.605, p = 0.018, ${\eta}^2_p=0.1372$, synchronization of LF: F(3, 68) = 5.075, p = 0.003, ${\eta}^2_p=0.1823$). HF difference of synchronization between ECG and RSP has been able to classify arousal from relaxation (p = 0.008, d = 1.4274) and LF's has negative from positive (p = 0.002, d = 1.7377). Therefore, it was confirmed that the heart and respiration to recognize the dimensional emotion by connectivity.

The Conducting Motion Recognizing System Using Acceleration Sensors for the Virtual Orchestra (가속도 센서를 이용한 지휘 동작 인식 시스템)

  • Son, Dong-Kwan;Lee, Hui-Sung;Noh, Young-Hae;Wohn, Kwang-Yun;Goo, Bon-Cheol
    • 한국HCI학회:학술대회논문집
    • /
    • 2006.02a
    • /
    • pp.124-129
    • /
    • 2006
  • 음악은 소리를 즐긴다는 뜻을 담고 있다. 감상자에게 단순한 청각적 자극을 넘어 즐거움을 주기 위해선 음악적인 경험이 뒷받침되어야 한다. 가상 현실을 이용한 사용자와 시스템 간의 상호작용을 음악 경험 제공에 접목하려는 시도는, 새로운 경험을 통해 일반인들이 보다 쉽게 음악을 접하고 체험함으로써 음악을 통해 즐거움을 얻을 수 있도록 도움을 주는 데에 그 목적이 있다. 가상 오케스트라를 구현하고 지휘 동작을 재현하는 것은 이러한 가능성을 극대화하는 연구이다. 본 논문에서는 가상 오케스트라를 구현하기 위해 필수적인 중간 단계로, 사용자의 지휘 동작을 감지하여 연주의 박자(속도)를 제어하는 지휘 시뮬레이션 시스템을 제시한다. 실제의 지휘 동작을 분석하고, 동작의 변화를 인식하기 위하여 가속도 센서를 이용, 공간상에서 지휘봉의 움직임을 가속도 정보로 수집하여 이에 상응하는 박자의 제어를 구현한다. 사용자의 박자 명시에 따라 변화하는 상하 방향의 가속도를 센서를 통해 전압 신호로 입력 받고, DSP 의 A/D conversion 모듈에서 디지털 신호로 변환, 일정 수준 이상의 신호를 박자 정보로 직렬통신을 통해 컴퓨터에 전달한다. 컴퓨터에서는 Max/MSP를 이용하여 각 박자 사이의 시간 간격을 측정하고 상응하는 MIDI 음악을 재생하는 방식으로 시스템이 구현된다. 기존 연구에서 사용된 CCD 카메라에 의한 Motion Tracking 을 보완하여 동작의 크기에 따라 음량을 조절한다. 본 논문에서 제시되는 시스템은 지휘 동작에서 가장 특징적으로 나타나는 상하 방향의 급격한 가속도 변화를 직접 입력 받기 때문에 기존 시스템에 비해 지휘 동작의 인식 성공률을 높일 수 있으며, 화상 처리 및 계산에 의한 지연을 최소화할 수 있다. 또한, 장치의 규모를 소형화하여 보다 지휘봉의 형태에 가까운 인터페이스를 제공하며, 적합한 응용 콘텐츠를 접목할 경우 게임 컨트롤러로의 발전 가능성이 있다.

  • PDF

Adaptive Keyframe-Based Tracking for Augmented Books (증강 책을 위한 적응형 키프레임 기반 트래킹)

  • Yoo, Jae-Sang;Cho, Kyu-Sung;Yang, Hyun-S.
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.16 no.4
    • /
    • pp.502-506
    • /
    • 2010
  • An augmented book is an application that augments such multimedia elements as virtual 3D objects generated by computer graphics, movie clips, or sound clips to a real book using AR technologies. It is intended to bring additional education and entertainment effects to users. For augmented books, this paper proposes an adaptive keyframe-based page tracking method to estimate the camera's 6 DOF pose in real-time after recognizing a page and performing wide-baseline keypoint matching. For a page tracking, proposed method in this paper chooses a proper keyframe and performs a tracking in two step of coarse-to-fine stage. As a result, the proposed method in this paper guarantees a robust tracking to view-point and illumination variations and real-time.

Multi-channel input-based non-stationary noise cenceller for mobile devices (이동형 단말기를 위한 다채널 입력 기반 비정상성 잡음 제거기)

  • Jeong, Sang-Bae;Lee, Sung-Doke
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.17 no.7
    • /
    • pp.945-951
    • /
    • 2007
  • Noise cancellation is essential for the devices which use speech as an interface. In real environments, speech quality and recognition rates are degraded by the auditive noises coming near the microphone. In this paper, we propose a noise cancellation algorithm using stereo microphones basically. The advantage of the use of multiple microphones is that the direction information of the target source could be applied. The proposed noise canceller is based on the Wiener filter. To estimate the filter, noise and target speech frequency responses should be known and they are estimated by the spectral classification in the frequency domain. The performance of the proposed algorithm is compared with that of the well-known Frost algorithm and the generalized sidelobe canceller (GSC) with an adaptation mode controller (AMC). As performance measures, the perceptual evaluation of speech quality (PESQ), which is the most widely used among various objective speech quality methods, and speech recognition rates are adopted.

Efficient Sound Source Localization System Using Angle Division (영역 분할을 이용한 효율적인 음원 위치 추정 시스템)

  • Kim, Yong-Eun;Cho, Su-Hyun;Chung, Jin-Gyun
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • v.46 no.2
    • /
    • pp.114-119
    • /
    • 2009
  • Sound source localization systems in service robot applications estimate the direction of a human voice. Time delay information obtained from a few separate microphones is widely used for the estimation of the sound direction. Correlation is computed in order to calculate the time delay between two signals. Inverse cosine is used when the position of the maximum correlation value is converted to an angle. Because of nonlinear characteristic of inverse cosine, the accuracy of the computed angle is varied depending on the position of the specific sound source. In this paper, we propose an efficient sound source localization system using angle division. By the proposed approach, the region from $0^{\circ}$ to $180^{\circ}$ is divided into three regions and we consider only one of the three regions. Thus considerable amount of computation time is saved. Also, the accuracy of the computed angle is improved since the selected region corresponds to the linear part of the inverse cosine function. By simulations, it is shown that the error of the proposed algorithm is only 31% of that of the conventional a roach.