• 제목/요약/키워드: 음성획득장치

검색결과 14건 처리시간 0.028초

관객 반응정보 수집을 위한 음성신호 기반 감정인식 시스템 (A Speech Emotion Recognition System for Audience Response Collection)

  • 강진아;김홍국
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2013년도 하계학술대회
    • /
    • pp.56-57
    • /
    • 2013
  • 본 논문에서는 연극공연을 관람하는 관객의 반응정보를 수집하기 위하여, 청각센서를 통해 관객의 음성을 획득하고 획득된 음성에 대한 감정을 예측하여 관객 반응정보 관리시스템에 전송하는 음성신호 기반 감정인식 시스템을 구현한다. 이를 위해, 관객용 헤드셋 마이크와 다채널 녹음장치를 이용하여 관객음성을 획득하는 인터페이스와 음성신호의 특징벡터를 추출하여 SVM (support vector machine) 분류기에 의해 감정을 예측하는 시스템을 구현하고, 이를 관객 반응정보 수집 시스템에 적용한다. 실험결과, 구현된 시스템은 6가지 감정음성 데이터를 활용한 성능평가에서 62.5%의 인식률을 보였고, 실제 연극공연 환경에서 획득된 관객음성과 감정인식 결과를 관객 반응정보 수집 시스템에 전송함을 확인하였다.

  • PDF

VoiceXML을 이용한 VUI 지원 웹브라우저 개발 (Development of a Voice User Interface for Web Browser using VoiceXML)

  • 예상후;장민석
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제11권2호
    • /
    • pp.101-111
    • /
    • 2005
  • 현재의 웹정보들은 주로 HTML로 기술되어 있으며, 이러한 정보를 얻기 위해 사용자들은 마우스와 키보드와 같은 입력장치를 사용한다. 이와 같이 기존의 GUI 환경은 인간의 가장 자연스러운 정보획득 수단의 하나인 음성을 지원하지 못하고 있다. 이러한 문제를 해결하기 위해 음성 인터페이스를 가진 여러 제품들이 개발되고 있다. 하지만 이들은 상호대화성이나 기존 웹환경을 수용한다는 측면에서 부족한 면을 가지고 있다. 본 논문에서는 현재 무르익어 가는 음성인식 기술과 XML의 파생언어인 VoiceXML을 이용하여, 기존의 인터페이스 환경을 XML 기반의 대화형 음성인터페이스 환경으로 대체하고자 한다. 이를 통해 기존의 인터페이스 환경을 수용한 VUI(Voice User Interface) 환경을 사용자에게 제공할 수 있다. 기존의 환경을 수용하기 위해 "XML Island" 기술을 이용하여 VoiceXML 문서를 HTML 문서에 포함시키며, 대표적인 정보획득화면인 메뉴, 게시판, 검색 엔진에 대한 대화형 음성 시나리오를 제안하고 있다.

이동환경에서 치열영상과 음성을 이용한 멀티모달 화자인증 시스템 구현 (An Implementation of Multimodal Speaker Verification System using Teeth Image and Voice on Mobile Environment)

  • 김동주;하길람;홍광석
    • 전자공학회논문지CI
    • /
    • 제45권5호
    • /
    • pp.162-172
    • /
    • 2008
  • 본 논문에서는 이동환경에서 개인의 신원을 인증하는 수단으로 치열영상과 음성을 생체정보로 이용한 멀티모달 화자인증 방법에 대하여 제안한다. 제안한 방법은 이동환경의 단말장치중의 하나인 스마트폰의 영상 및 음성 입력장치를 이용하여 생체 정보를 획득하고, 이를 이용하여 사용자 인증을 수행한다. 더불어, 제안한 방법은 전체적인 사용자 인증 성능의 향상을 위하여 두 개의 단일 생체인식 결과를 결합하는 멀티모달 방식으로 구성하였고, 결합 방법으로는 시스템의 제한된 리소스를 고려하여 비교적 간단하면서도 우수한 성능을 보이는 가중치 합의 방법을 사용하였다. 제안한 멀티모달 화자인증 시스템의 성능평가는 스마트폰에서 획득한 40명의 사용자에 대한 데이터베이스를 이용하였고, 실험 결과, 치열영상과 음성을 이용한 단일 생체인증 결과는 각각 8.59%와 11.73%의 EER를 보였으며, 멀티모달 화자인증 결과는 4.05%의 EER를 나타냈다. 이로부터 본 논문에서는 인증 성능을 향상하기 위하여 두 개의 단일 생체인증 결과를 간단한 가중치 합으로 결합한 결과, 높은 인증 성능의 향상을 도모할 수 있었다.

현장 작업자 위험대응을 위한 음성챗봇을 이용한 안전관리 서비스 (Safety management service using voice chatbot for risks response of field workers)

  • 강윤희;박창수;이용학;김동호;김의구;강명주
    • Journal of Platform Technology
    • /
    • 제11권6호
    • /
    • pp.79-88
    • /
    • 2023
  • 최근 산업 재해는 산업화로 인해 지속적으로 증가하고 있으며, 작업현장에서 위험요소로 인한 손실을 줄이기위해 작업자의 안전관리는 필수사항으로 인식되고 있다. 작업자의 안전관리를 위해서는 산업현장의 특성을 고려한 맞춤형 안전관리 인공지능 기술의 적용이 요구된다. 현장의 안전관리는 작업 및 공정별 안전사고 유형 및 위험성 분석을 기반으로 상황에 따른 작업자의 실시간 위험 감지 및 대응을 위한 서비스 설계를 고려한다. 제안된 안전관리 서비스는 IoT 기반의 센서 자료를 획득하기 위한 작업자 디바이스, 획득한 센서 자료를 수집하기 위한 엣지장치와 작업자의 재해 대응을 지원하는 음성챗봇으로 구성된다. 음성챗봇은 재해 현장의 작업자의 위험대응을 위한 상호작용을 수행하는 주요한 역할을 수행한다. 이 논문은 작업자의 상황에 따른 작업안전을 위한 IoT 기반의 시스템과 서버 상의 음성챗봇을 활용한 실시간 위험대응 서비스 시스템을 기술한다. 안전관리 서비스 제공을 위한 엣지 수준에서의 대응처리를 위해 스토리기반 음성챗봇을 활용하도록 한다.

  • PDF

MEMS센서와 확장칼만필터를 적용한 팔의 자세정보 실시간 획득방법 (Real-Time Acquisition Method of Posture Information of Arm with MEMS Sensor and Extended Kalman Filter)

  • 최원석;김희수;김재현;조영기
    • 한국콘텐츠학회논문지
    • /
    • 제20권6호
    • /
    • pp.99-113
    • /
    • 2020
  • 미래에는 일상생활에서 우리 삶을 편의를 위한 로봇이나 드론들이 증가할 것이다. 그리고 이것을 제어하기 위한 방법으로 현재 리모컨이나 사람의 음성에 의한 방법이 가장 보편적으로 사용되고 있다. 하지만 리모컨은 사람이 찾아서 일일이 조작해야하며 음성의 경우에는 주변 노이즈를 무시할 수 없다. 그래서 본 논문에서는 팔의 자세정보만으로 무선으로 간편하게 주변 드론이나 로봇들을 제어 할 수 있다는 전제하에 실시간으로 정확하게 팔의 자세정보를 획득하기 위한 경제적인 자세정보 획득방법에 대하여 연구하였다. 이를 위해서 확장 칼만필터를 이용하여 팔의 자세정보에 대한 노이즈를 제거하였으며 팔의 움직임을 감지하기 위하여 저가의 MEMS 타입의 센서를 적용하여 장치의 경제성을 확보하였으며 팔의 착용성을 증대시키기 위하여 FPGA를 활용하여 최대한 칩 하나에 모든 기능을 집적화시켜 소형 경량의 자세정보 획득장치를 개발하였다. 그 결과 1 ms의 실시간성을 확보하였고 확장칼만필터를 적용하여 노이즈가 제거된 정확한 팔의 자세정보를 획득하고 실시간으로 팔의 자세정보를 전시하였다. 이를 통해서 팔의 실시간 자세정보를 이용하여 명령을 생성할 수 있는 기초가 마련되었다.

조타명령의 음성인식을 위한 최적 특징파라미터 검출에 관한 연구 (Optimal Feature Parameters Extraction for Speech Recognition of Ship's Wheel Orders)

  • 문성배;채양범;전승환
    • 해양환경안전학회지
    • /
    • 제13권2호
    • /
    • pp.161-167
    • /
    • 2007
  • 이 논문은 선박의 자동조타장치를 음성인식으로 제어할 수 있는 시스템을 개발하기 위한 기초연구로 SMCP(IMO Standard Marine Communication Phrases)에 제시된 조타명령문의 구성 형태를 분석하여 화자의 의도를 예측할 수 있는 특정 파라미터를 추출하였다. 그리고 이 파라미터를 이용하여 1차 패턴인식 과정으로부터 도출된 후보단어 집합으로부터 최종 단어를 결정하는 후처리 인식 프로시저를 설계하였다. 이 프로시저의 유용성을 검증하기 위하여 음성인식용으로 총 525개의 조타명령문을 획득하였고, 표준패턴 기반의 인식과정 인식률과의 비교실험을 수행하였다. 실험결과 의도예측 특정 파라미터를 이용한 인식 프로시저의 인식률이 약 42.3% 향상되어 유효함을 알 수 있었다.

  • PDF

멀티 해상도 스크린 기반의 컨퍼런스 중계방송 기술 연구 (A Study on Multi-resolution Screen based Conference Broadcasting Technology)

  • 김영애;양지희;박구만
    • 방송공학회논문지
    • /
    • 제23권2호
    • /
    • pp.253-260
    • /
    • 2018
  • 1인 미디어 방송 서비스는 기존의 방송 서비스와 다르게 고가의 장비 없이 제작자의 영상과 음성을 획득하는 디바이스와 전송 플랫폼만 있으면 제작자가 원하는 독창적 주제로 자신만의 방송을 제작할 수 있다. 본 논문에서는 이러한 개인 방송 서비스 프레임워크를 세미나 또는 학회와 같은 컨퍼런스에 적용함으로써 새로운 중계방송 시스템을 개발 및 구현하였다. 각 컨퍼런스 행사장마다 영상과 음성 획득 장치를 설치하고, 스트리밍 서버를 통해 이들을 통합하여 중계방송 함으로써 개인의 모바일 디바이스 또는 노트북, 태블릿 PC와 같은 멀티 해상도 스크린을 통해 시청이 가능하도록 하였다. 사용자는 원하는 스크린을 통해 실시간 스트리밍 및 VOD 서비스뿐만 아니라 컨퍼런스 관련 추가적인 정보를 제공받을 수 있다는 장점이 있다. 즉, 컨퍼런스 참석자들에게 개인 모바일 디바이스를 통해 정보를 얻을 수 있도록 함으로써 편의성을 제공하고 컨퍼런스 참여도 향상의 효과와 향후 연구를 위한 기반 기술이 될 것으로 기대한다.

립모션 기반의 윈도우즈 애플리케이션 제어 모델에 관한 연구 (A Study on the Windows Application Control Model Based on Leap Motion)

  • 김원
    • 한국융합학회논문지
    • /
    • 제10권11호
    • /
    • pp.111-116
    • /
    • 2019
  • 최근 컴퓨터 능력의 급속한 발전으로 인간과 컴퓨터간의 상호 작용을 편리하게 연결할 수 있는 많은 기술들이 연구되고 있는 상황으로, 전통적인 입력장치를 사용한 GUI에서 3D 모션, 햅틱, 멀티 터치와 같은 신체를 이용한 NUI로 패러다임이 변화되고 있는 추세이다. 인간의 동작을 센서를 이용하여 컴퓨터에 전달하는 많은 연구가 이루어지고 있으며, 3D 객체를 획득할 수 있는 광학 센서의 개발과 더불어 산업 및 의료 분야, 사용자 인터페이스 분야 등으로 응용 범위가 확장되고 있다. 본 논문에서는 립모션을 기반으로 사용자의 손동작에 따라 기본 입력장치인 마우스를 대신하여 제스처를 통한 타 프로그램 실행 및 윈도우즈 제어가 가능하며, 안드로이드 앱과 융합하여 메인 클라이언트와 연결을 통하여, 음성인식과 버튼을 사용해 각종 미디어와 음성 명령 기능을 통한 제어가 가능한 모델을 제안한다. 제안 모델을 통하여 영상, 음악과 같은 인터넷 미디어를 클라이언트 컴퓨터 뿐만 아니라 앱을 통한 원거리 제어가 가능하여, 편리하게 미디어를 시청할 수 있을 것으로 기대된다.

병렬 SOA 구조의 파장가변 레이저를 이용한 단면 영상획득 (Acquirement of cross-sectional image by using wavelength swept laser within the two SOAs parallel configuration)

  • 김훈섭;엄진섭
    • 산업기술연구
    • /
    • 제28권B호
    • /
    • pp.239-244
    • /
    • 2008
  • We have realized the swept source optical coherence tomography(SS-OCT) by using the self-fabricated wavelength swept laser(wavelength tuning range : 80nm, line-width : 0.12nm, wavelength sweeping rate : 50Hz). In addition, we have used the dual balanced detector that could make a mirror image in OCT display suppressed. We can also fabricate the comb filter of Michelson interferometer type for fast-signal processing in OCT. Using this SS-OCT system for measuring an mirror, a 1mm-depth glass and an onion, we confirmed that the in vivo epidermal cross-sectional images for them can be obtained appropriately.

  • PDF