• 제목/요약/키워드: 무음성 인터페이스

검색결과 5건 처리시간 0.017초

음악적 사용자 인터페이스: 음악이 가전제품에 미치는 정서적 효과 (Towards Musical User Interface : The Emotional Effects of Music on Home Appliances Usability)

  • 김종완;태은주;한광희
    • 감성과학
    • /
    • 제11권1호
    • /
    • pp.39-56
    • /
    • 2008
  • 음악과 사용자 인터페이스, 인간-컴퓨터 상호작용(HCI) 관련 연구에서는 기본적으로 실제 음악보다는 음악적인 속성을 반영한 음악적 소리를 사용한 경우가 많았다. 본 연구에서는 실제음악이 가전제룸의 객관적, 주관적 사용성에 정보적, 정서적 효과를 줄 수 있는지 살펴보았다. 무음조건, 소리 조건, 음악 조건에 대하여 실험 1, 2에서 각각 김치냉장고, 에어컨 리모컨을 프로트타임으로 제작으로 실험 참가자들은 준비된 과제를 시행하였고, 과제수행 결과 및 주관적인 만족도를 통해 기술하도록 하였다. 결과 실험1, 2 모두 객관적인 과제 수행에 있어서 유의미한 향상이 나오지는 않았으나 지각된 사용서에 있어서는 무음 조건보다는 소리 조건이, 소리 조건보다는 음악조건이 더 높았다. 즉 음악의 사용자 인터페이스 적용은 과제 수행에 최소한 방해를 주지 않으면서 주관적인 만족을 향상시킬 수 있는 방안으로 결론지을 수 있다. 본 연구는 가전 제품 설계에 있어 정서적, 미적인 효과에 대한 기반을 제공하고 시각장애인을 위한 연구에 적응할 수 있을 것이다. 가전 제품의 수행 과제, 사용 맥락 및 환경, 제품에 맞는 음악의 속성 및 종류에 대한 체계적인 추후 연구가 이루어진다면 음악을 이용한 사용자 인터페이스에 대한 구체적인 가이드라인을 제공할 수 있을 것이다.

  • PDF

초음파 도플러를 이용한 음성 인식 (Automatic speech recognition using acoustic doppler signal)

  • 이기승
    • 한국음향학회지
    • /
    • 제35권1호
    • /
    • pp.74-82
    • /
    • 2016
  • 본 논문에서는 음성 신호 대신 초음파 도플러 신호를 이용하여 음성을 인식하는 새로운 음성 인식 방법을 제안하였다. 제안된 방법은 주변 잡음에 대한 강인성과 무 접촉식 센서 사용에 따른 사용자의 불편함 감소를 포함하는 기존의 음성/무음성 인식 방법에 비해 몇 가지 장점을 갖는다. 제안된 방법에서는 40 kHz의 주파수를 갖는 초음파 신호를 입 주변에 방사하여, 반사된 신호를 취득하고, 취득된 신호의 도플러 주파수 변화를 이용하여 음성 인식을 구현하였다. 단일 채널 초음파 신호를 사용하는 기존의 연구와 달리, 다양한 위치에서의 취득된 초음파 신호를 음성 인식에 사용하기 위해 다채널 취득 장치를 고안하였다. PCA(Principal Component Analysis)특징 변수를 사용한 음성 인식에는 좌-우 모델을 갖는 은닉 마코프 모델을 사용하였다. 제안된 방법의 검증을 위해 60개의 한국어 고립어에 대해 6명의 화자로부터 취득된 초음파 도플러 신호를 인식에 사용하였으며, 기존 음성기반 음성인식 기법과 비교할 만한 수준의 인식율을 얻을 수 있었다. 또한 실험 결과 제안된 방법은 기존의 단일 채널 음성 인식 방법과 비교하여 우수한 성능을 나타내었으며, 특히 잡음 환경에서도 90 % 이상의 인식율을 얻을 수 있었다.

초음파 도플러 신호를 이용한 음성 합성 (Speech synthesis using acoustic Doppler signal)

  • 이기승
    • 한국음향학회지
    • /
    • 제35권2호
    • /
    • pp.134-142
    • /
    • 2016
  • 본 논문에서는 40 kHz 초음파 신호를 입 주변에 쏘고, 되돌아오는 초음파 신호를 이용해 음성신호를 합성하는 방법을 소개하고 성능을 평가하였다. 발성하고 있는 입주변에 초음파를 방사하게 되면, 입술, 턱, 뺨 등의 움직임으로 인한 변위로 도플러 현상이 발생하고, 이에 따라 반사 신호에는 본래의 주파수 성분과는 다른 도플러 주파수가 관찰되는데, 본 논문에서는 이러한 도플러 주파수를 이용하여 음성 파라메터를 추정하도록 하였다. 음성합성에 앞서서 초음파 도플러 신호와 음성 신호 간의 상관관계를 각 주파수 별로 분석하였으며, 이로부터 초음파 도플러 신호를 이용한 음성 신호의 합성 가능성을 살펴보았다. 변환에는 초음파 도플러의 정적, 동적 특성을 함께 반영한 특징 변수를 사용하였으며 결합-혼합 가우시안 기법을 이용하여 음성 파라메터로 변환하였다. 5명의 피 실험자를 이용한 음성 합성 실험에서 필터뱅크 에너지 값을 초음파신호의 특징변수로, LPC(Linear Predictive Coefficient) 켑스트럼 계수를 음성 변수로 사용하는 경우 가장 우수한 변환 성능을 나타내었다. 음성신호에서 추출한 여기신호를 이용하여 합성음을 생성하고, 이를 청취하였을 때 72.2 %의 평균 인식율이 얻어짐을 확인할 수 있었다.

LSTM 순환 신경망을 이용한 초음파 도플러 신호의 음성 패러미터 추정 (Estimating speech parameters for ultrasonic Doppler signal using LSTM recurrent neural networks)

  • 주형길;이기승
    • 한국음향학회지
    • /
    • 제38권4호
    • /
    • pp.433-441
    • /
    • 2019
  • 본 논문에서는 입 주변에 방사한 초음파 신호가 반사되어 돌아올 때 발생하는 초음파 도플러 신호를 LSTM(Long Short Term Memory) 순환 신경망 (Recurrent Neural Networks, RNN)을 이용해 음성 패러미터를 추정하는 방법을 소개하고 다층 퍼셉트론 (Multi-Layer Perceptrons, MLP) 신경망을 이용한 방법과 성능 비교를 하였다. 본 논문에서는 LSTM 순환 신경망을 이용해 초음파 도플러 신호로부터 음성 신호의 푸리에 변환 계수를 추정하였다. LSTM 순환 신경망을 학습하기 위한 입력 및 기준값으로 초음파 도플러 신호와 음성 신호로부터 각각 추출된 멜 주파수 대역별 에너지 로그값과 푸리에 변환 계수가 사용되었다. 테스트 데이터를 이용한 실험을 통해 LSTM 순환 신경망과 MLP의 성능을 평가, 비교하였고 척도로는 평균 제곱근 오차(Root Mean Squared Error, RMSE)가 사용되었다.각 실험의 RMSE는 각각 0.5810, 0.7380로 나타났다. 약 0.1570 차이로 LSTM 순환 신경망을 이용한 방법의 성능 우세한 것으로 확인되었다.

휴대전화 상황에서 맥락과 일치하는 사람음과 단순 기계음이 사용자의 주관적 경험에 미치는 영향 (The effect of the human voice that is consistent with context and the mechanical melody on user's subjective experience in mobile phones)

  • 조유숙;엄기민;주효민;석지혜;한광희
    • 감성과학
    • /
    • 제12권4호
    • /
    • pp.531-544
    • /
    • 2009
  • HCI 분야에서 사용성은 시스템의 객관적인 사용성에 초점을 둔 것에서 점차 사용자들이 시스템을 사용하면서 느끼는 주관적인 경험을 중시하는 개념으로 확장, 변화하고 있다. 오늘날 대부분의 사람들은 휴대전화를 소지하고 사용한다. 휴대전화와 같이 인간과의 상호작용 빈도가 높은 인터페이스에서 보다 긍정적인 사용자의 주관적 경험을 유발하는 것은 중요하다고 볼 수 있다. 본 연구에서는 감정을 표현하는 인터페이스가 인간에게 보다 긍정적인 사용자 경험을 유발할 것이라는 가설 하에 감정을 표현하는 인간 목소리를 통해 청각적 피드백을 제공하는 휴대전화 프로토타입(prototype)을 제작한 후, 감정을 표현하기에 적절하지 않은 기계음을 통해 청각피드백을 제공하는 휴대전화 조건과의 비교를 통해 어떠한 조건에서 사용자들이 보다 더 긍정적인 사용자 경험을 느끼는지, 어떠한 조건을 더 선호하는지에 대해 알아보았다. 구체적으로, 참가자들은 4가지 종류의 휴대전화 프로토타입(청각적 피드백이 없는 무음 조건, 사람의 목소리를 통해 청각적 피드백을 제시하는 조건, 기계음을 통해 청각적 피드백을 제시하는 조건, 기계음과 사람의 목소리를 모두 제공하는 혼합음 조건)을 경험한 후, 그에 대한 경험적 사용성(재미, 흥미, 불쾌감), 유희적 측면(HQ) 그리고 선호도를 평정하였다. 결과적으로, 사용자들은 사람의 목소리를 통해 정서를 표현하는 조건의 휴대전화에 대해 청각적 피드백을 제공하지 않는 휴대전화나 기계음을 통해 청각적 피드백을 제시하는 휴대전화와 비교해서 상대적으로 높은 지각적 재미와 유희(HQ)를 느끼는 것으로 드러났다. 하지만 선호도는 다른 조건에 비해 낮은 수준의 평정치를 보이는 것으로 나타났다.

  • PDF