• 제목/요약/키워드: 상상 음성

검색결과 5건 처리시간 0.02초

동작 상상뇌파와 음성인식을 이용한 드론 컨트롤러 (Drone controller using motion imagery brainwave and voice recognition)

  • 박명철;오대성;한지훈;오효준;김유신;정진용;박상욱;정윤성;손영웅
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제62차 하계학술대회논문집 28권2호
    • /
    • pp.257-258
    • /
    • 2020
  • 기존의 드론 조작은 초보자에게 어려웠다. 초보자의 경우 드론을 조종하다가 드론이 추락하거나 장애물에 걸려 프로펠러 등의 부품들이 손상되는 경우를 빈번하게 마주한다. 본 연구에서는 초보자 또한 드론 파손의 걱정 없이 드론의 조작을 더욱 쉽게 개선시키는 것을 전제로 뇌파와 보조입력인 음성인식을 이용한 드론 컨트롤러 기술을 적용하고자 한다. 현재 대중적으로 출시되어 있는 드론의 경우 호버링 기능을 포함시켜 드론의 추락 위험을 줄여주는 기능을 탑재하고 있다. 하지만 속도가 빠른 드론의 조작에 있어 미숙한 초보자들은 장애물과의 충돌 그리고 드론 착륙 시 기체손상 등의 위험에 대비하기 힘들다. 본 논문은 이러한 문제점들을 개선하기 위해 기존의 드론 컨트롤러 대신 특정한 동작을 상상할 때 발현되는 동작상상뇌파와 음성입력을 적용한 '동작상상뇌파와 음성인식을 이용한 드론 컨트롤러' 기술을 제안한다. 기존의 드론 컨트롤러와는 다르게 빅 데이터 처리기술인 머신러닝을 이용하여 뇌파 데이터를 처리하고 그 데이터들과 입력되는 뇌파 값을 비교하여 드론을 제어한다. 또한 뇌파의 발현이 안정적이지 못하는 상황을 대비한 보조입력인 음성인식을 이용하여 드론의 기체손상을 최소화 시킬 수 있다.

  • PDF

무선 에너지 전송 기술 (Wireless Energy Transfer Technology)

  • 강승열;김용해;이명래;정태형
    • 전자통신동향분석
    • /
    • 제23권6호
    • /
    • pp.59-69
    • /
    • 2008
  • IT 혁명의 근간이 되는 무선통신기술은 개인간의 통신을 가능하게 하여, 단순 정보 전달에서 음성 및 화상 통화가 언제, 어느 곳에서도 가능하게 되었다. 그러나 이런 단말기를 작동하게 하는 전력 또는 에너지는 여전히 유선으로 공급하거나 전지를 충전하여 사용한다. 만일 무선 통신뿐만 아니라 무선 에너지 전송까지 가능하다면 IT 기술은 또 다른 도약을 하게 될 것이다. 무선 에너지 전송은 백 년 전의 테슬라로부터 시작되어 지금까지 지속되어온 인류의 꿈이었다. 본 기고문에서는 20세기 초 무선 에너지 전송을 상상한 테슬라로부터 근래의 다양한 무선 에너지 전송 기술을 소개한다. 전자기파 방사를 이용한 기술과 전자기 유도현상을 이용한 무선 에너지 전송 기술을 개괄하고, 이러한 기존 기술을 넘어 근거리에서 공진 현상을 이용한 비방사 방식으로 에너지를 전송하는 MIT의 무선 에너지 전송 기술을 소개한다.

EEG기반 언어 인식 시스템을 위한 국제음성기호를 이용한 모음 특징 추출 연구 (EEG based Vowel Feature Extraction for Speech Recognition System using International Phonetic Alphabet)

  • 이태주;심귀보
    • 한국지능시스템학회논문지
    • /
    • 제24권1호
    • /
    • pp.90-95
    • /
    • 2014
  • 인간과 기계를 연결하는 새로운 인터페이스인 Brain-computer interface (BCI)를 이용해 휠체어를 제어하거나 단어를 입력하는 등, 사용자를 위한 다양한 장치를 개발하는 연구들이 진행되어 왔다. 특히 최근에는 뇌파를 이용한 음성인식을 구현하고 이를 통해 무음통신 등에 적용하려는 시도들이 있었다. 본 논문에서는 이러한 연구의 일환으로 electroencephalogram (EEG) 기반의 언어 인식 시스템을 개발하기 위한 기초 단계로서, 국제음성기호에 기반을 둔 모음들의 특징을 추출하는 방법에 대한 연구를 진행하였다. 실험은 건장한 세 명의 남성 피험자를 대상으로 진행되었으며, 한 개의 모음을 제시하는 첫 번째 실험 과정과 두 개의 연속된 모음을 제시하는 두 번째 실험 과정으로 두 단계에 나누어서 실험이 진행되었다. 습득된 64개의 채널중 선택적으로 32개의 채널만을 사용해 특징을 추출하였으며, 사고 활동과 관련된 전두엽과 언어활동에 관련된 측두엽을 기준으로 영역을 선택하였다. 알고리즘 적용을 위해서 특징으로는 신호의 고유 값을 사용하였고, support vector machine (SVM)을 이용하여 분류를 수행하였다. 실험 결과, 첫 번째 단계의 실험을 통해서, 언어의 뇌파를 분석하기 위해서는 10차원 이상의 특징 벡터를 사용해야 됨을 알게 되었고, 11차원의 특징 벡터를 사용할 경우, 평균분류율은 최고 95.63 %로 /a/와 /o/를 분류할 때 나타났고, 가장 낮은 분류율을 보이는 모음은 /a/와 /u/로 86.85 %였다. 두 번째 단계의 실험에서는 두 개 이상의 모음을 발음하는 것이 단일 모음 발음과 어떤 차이가 있는지 확인해 보았다.

Deep Belief Network를 이용한 뇌파의 음성 상상 모음 분류 (Vowel Classification of Imagined Speech in an Electroencephalogram using the Deep Belief Network)

  • 이태주;심귀보
    • 제어로봇시스템학회논문지
    • /
    • 제21권1호
    • /
    • pp.59-64
    • /
    • 2015
  • In this paper, we found the usefulness of the deep belief network (DBN) in the fields of brain-computer interface (BCI), especially in relation to imagined speech. In recent years, the growth of interest in the BCI field has led to the development of a number of useful applications, such as robot control, game interfaces, exoskeleton limbs, and so on. However, while imagined speech, which could be used for communication or military purpose devices, is one of the most exciting BCI applications, there are some problems in implementing the system. In the previous paper, we already handled some of the issues of imagined speech when using the International Phonetic Alphabet (IPA), although it required complementation for multi class classification problems. In view of this point, this paper could provide a suitable solution for vowel classification for imagined speech. We used the DBN algorithm, which is known as a deep learning algorithm for multi-class vowel classification, and selected four vowel pronunciations:, /a/, /i/, /o/, /u/ from IPA. For the experiment, we obtained the required 32 channel raw electroencephalogram (EEG) data from three male subjects, and electrodes were placed on the scalp of the frontal lobe and both temporal lobes which are related to thinking and verbal function. Eigenvalues of the covariance matrix of the EEG data were used as the feature vector of each vowel. In the analysis, we provided the classification results of the back propagation artificial neural network (BP-ANN) for making a comparison with DBN. As a result, the classification results from the BP-ANN were 52.04%, and the DBN was 87.96%. This means the DBN showed 35.92% better classification results in multi class imagined speech classification. In addition, the DBN spent much less time in whole computation time. In conclusion, the DBN algorithm is efficient in BCI system implementation.

상호텍스트성을 활용한 디지털 자화상 창작 (A Study on the Creation of Digital Self-portrait with Intertextuality)

  • 임수연
    • 문화기술의 융합
    • /
    • 제8권1호
    • /
    • pp.427-434
    • /
    • 2022
  • 본 연구의 목적은 관람자에게 자아 인식의 문제에 천착하게 하는 몰입의 경험을 제공하는 자화상을 창작하는 것이다. 우리는 관람자로부터 획득한 음성과 이미지 정보를 활용하여 인터랙티브 자화상을 구현하는 방안을 제시한다. 관람자의 음성 정보는 텍스트로 변환되어 시각화되는데, 텍스트 시각화를 위한 픽셀 정보로 관람자의 얼굴 이미지가 활용된다. 텍스트는 개인의 경험과 기억을 바탕으로 자신만의 감성, 상상, 의도 등이 다양하게 혼합되어 있는 결과물이다. 사람들은 각자 다른 방식으로 특정 텍스트에 대한 상이한 해석력을 발휘한다. 제안한 디지털 자화상은 텍스트가 가진 상호텍스트성을 활용하여 내적인 면에서 관람자의 자의식을 재현할 뿐 아니라 텍스트에 내재된 의미들을 확장한다. 넓은 의미에서의 상호텍스트성은 텍스트와 텍스트, 주체와 주체 사이에서 일어나는 모든 지식의 총체를 가리킨다. 따라서 텍스트로 표현된 자화상은 관객과 텍스트, 관객과 관객, 텍스트와 텍스트 사이에서 다양한 관계를 파생시키며 확장해간다. 또한 본 연구는 제안한 자화상이 외적인 면에서도 텍스트가 가진 조형성을 확인하고 시공간성을 재창조할 수 있다는 것을 보여준다. 이 동적 자화상은 실시간으로 관람자들의 관심사를 반영하고 갱신되며 창작되는 특성을 지닌다.