• 제목/요약/키워드: 시각 음성인식

검색결과 130건 처리시간 0.04초

모바일기기를 이용한 상황인식-흰지팡이 (Situation-awareness White Cane Using a Mobile Device)

  • 전동희;전준욱;백화현;문미경
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권11호
    • /
    • pp.167-173
    • /
    • 2014
  • 흰지팡이는 시각장애인이 보행을 위하여 사용하는 지팡이이다. 시각장애인의 보행 안전성을 향상시키기 위해 스마트 전자 흰지팡이에 대한 연구와 개발이 꾸준히 진행되고 있다. 본 논문에서는 흰지팡이와 모바일기기 간의 통신을 통해 시각장애인의 보행활동에 도움을 줄 수 있는 몇 가지 상황들에 대해 안내해주는 상황인식 흰지팡이의 개발내용에 대해 기술한다. 상황인식 흰지팡이에는 시각장애인이 손쉽게 누를 수 있는 형태로 버튼들이 설치되어 있고, 이를 누르면 시각장애인의 목에 걸려있는 스마트 모바일기기와의 블루투스 연동을 통해 상황인식 결과값을 음성으로 알림 받는다. 이를 통해 시각장애인의 보행 환경에 대한 불안전 요소를 감소시켜줄 수 있으며 그 결과 보행 안전성이 향상될 수 있을 것이다.

이러닝 콘텐츠에서 비음성 사운드에 대한 학습자 인식 분석 (Learners' Perceptions toward Non-speech Sounds Designed in e-Learning Contents)

  • 김태현;나일주
    • 한국콘텐츠학회논문지
    • /
    • 제10권7호
    • /
    • pp.470-480
    • /
    • 2010
  • 이러닝 콘텐츠에는 시각자료와 함께 다양한 청각자료를 포함하고 있음에도 불구하고 그동안 학습자료에서 청각정보 설계에 대한 연구는 극히 제한적으로 이루어져 왔다. 청각정보의 한 유형인 비음성 사운드가 학습자들에게 피드백 제공 및 행위유도를 즉시적으로 할 수 있다는 장점을 감안한다면 비음성 사운드의 체계적 설계가 요구된다. 이에 본 논문은 다차원척도법을 활용하여 학습자들이 이러닝 콘텐츠에 설계된 비음성 사운드를 어떠한 방식으로 인식하고 있는지를 경험적으로 탐색하는 것을 목적으로 수행되었다. 한국교육학술정보원에서 제공하는 이러닝 콘텐츠에 설계된 비음성 사운드 중 대표성이 있는 11개의 비음성 사운드가 선정되었다. A 대학교 3학년 학생 66명을 대상으로 11개의 비음성 사운드들 간의 유사 정도에 대해 응답하도록 하였고 그 결과가 다차원 공간에 표현되었다. 연구결과, 학습자들은 비음성 사운드의 길이와 비음성 사운드가 전달하는 긍정적 혹은 부정적 분위기에 따라 비음성 사운드를 구분하여 인식하고 있는 것으로 나타났다.

발화구간 검출을 위해 학습된 CNN 기반 입 모양 인식 방법 (Lip Reading Method Using CNN for Utterance Period Detection)

  • 김용기;임종관;김미혜
    • 디지털융복합연구
    • /
    • 제14권8호
    • /
    • pp.233-243
    • /
    • 2016
  • 소음환경에서의 음성인식 문제점으로 인해 1990년대 중반부터 음성정보와 영양정보를 결합한 AVSR(Audio Visual Speech Recognition) 시스템이 제안되었고, Lip Reading은 AVSR 시스템에서 시각적 특징으로 사용되었다. 본 연구는 효율적인 AVSR 시스템을 구축하기 위해 입 모양만을 이용한 발화 단어 인식률을 극대화하는데 목적이 있다. 본 연구에서는 입 모양 인식을 위해 실험단어를 발화한 입력 영상으로부터 영상의 전처리 과정을 수행하고 입술 영역을 검출한다. 이후 DNN(Deep Neural Network)의 일종인 CNN(Convolution Neural Network)을 이용하여 발화구간을 검출하고, 동일한 네트워크를 사용하여 입 모양 특징 벡터를 추출하여 HMM(Hidden Markov Mode)으로 인식 실험을 진행하였다. 그 결과 발화구간 검출 결과는 91%의 인식률을 보임으로써 Threshold를 이용한 방법에 비해 높은 성능을 나타냈다. 또한 입모양 인식 실험에서 화자종속 실험은 88.5%, 화자 독립 실험은 80.2%로 이전 연구들에 비해 높은 결과를 보였다.

로봇 감성 기술 (Robot Emotion Technology)

  • 박천수;류정우;손주찬
    • 전자통신동향분석
    • /
    • 제22권2호통권104호
    • /
    • pp.1-9
    • /
    • 2007
  • 공공 서비스, 홈 서비스, 엔터테인먼트, 매개치료, 개호 등의 다양한 분야에서 인간과 로봇간의 상호작용을 통한 감성적인 교류에 대한 연구가 활발히 진행되고 있다. 점차시각, 음성 인식을 통한 사용자 중심의 감성 인식에서 촉각 기반의 상호 작용을 통한감성을 생성하고 다양한 형태로 감성을 표현하는 로봇들에 대한 개발이 이루어질 것이다. 이에, 본 고에서는 내.외부 센서들을 통한 감성에 영향을 주는 감성적 문맥 인식기술과 로봇 감성 및 행동 표현에 대한 기술 개발 동향에 대하여 살펴 보도록 한다.

객체 인식을 활용한 시각장애인용 지하철 길 안내 시스템 (Subway Guidance System for the Visually Impaired Using Object Recognition)

  • 윤성철;박종혁;주세환;한윤원;김성완;김종득
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.1278-1281
    • /
    • 2021
  • 본 논문에서는 시각장애인들의 지하철 이용의 불편함을 최소화할 수 있는 내비게이션 앱을 개발하였다. 스마트폰 카메라가 전방을 인식하여 사물을 판단 후 장애물 혹은 위험요소를 사용자에게 음성으로 전달한다. 또한, 사용자의 원활한 지하철 이용을 위해 공공데이터를 활용하여 지하철 환승 정보, 화장실, 출구 정보 등의 이동 편의를 위한 실질적인 정보를 제공한다. 시각장애인은 본 앱을 활용하여 지하철을 더욱 편하고 안전하게 이용할 수 있다.

시각장애인을 위한 물품인식 제어장치의 설계와 제어방법에 관한 연구 (Design of a control device for the blind to recognize household medicines)

  • 서경덕;안광진;안지윤;하경욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.972-973
    • /
    • 2023
  • 2022년 등록된 장애인은 265만 3,000명으로 전체 인구 대비 5.2%를 기록했으며, 그중 시각장애인은 9.5%에 해당한다. 그들은 여가문화 활동, 대중교통 이용, 무인기 이용에 어려운 점이 있듯이 일상생활에 많은 불편한 점이 있다. 특히 제품의 미비한 점자 시스템으로 인한 문제점을 해결하기 위해 '물품인식 제어장치'를 고안했으며, 제품의 바코드를 스캔한 후 제품에 대한 정보를 점자로 출력과 동시에 음성으로 출력하여 시각장애인에게 올바른 정보를 제공한다.

딥러닝 기반 이미지 인식 기술을 활용한 동전 자동분류 스마트 저금통 (Implementation of Automatic Coin Sorting Smart Piggy Bank using Deep Learning based Image Recognition Technology)

  • 유연승;장영진;심현정;이슬비;김정길
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.320-322
    • /
    • 2020
  • 기계학습은 인공지능의 한 클래스로 최근 이미지 및 음성인식, 지능적 웹 검색, 자율 주행 자동차 등의 영역에서 성공적 발전을 바탕으로 우리의 일상에 폭넓게 이용되고 있다. 본 논문에서는 Keras 오픈소스 라이브러리를 이용해 딥러닝을 이용한 기계학습 기반의 동전 인식 소프트웨어를 구현하였고, 이를 이용해 동전 자동분류 스마트 저금통을 설계하였다. 동작 검증을 위하여 스마트 저금통의 모든 발생 이벤트는 Parse-server와 mongoDB를 이용하여 시각화 및 어플리케이션 및 웹사이트를 연결하였다.

키오스크를 이용한 장애인 및 약자를 위한 음성인식 주문시스템 (Ordering system for the disabled and the weak using a KIOSK with speech recognition technology)

  • 이효재;홍창호;조성호;윤채원;김동완;최승화
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.544-546
    • /
    • 2021
  • 최근 COVID-19로 인하여 무인점포가 늘어나고 있는 추세이다. 무인 점포에는 주로 키오스크를 이용해서 결제를 하고 있는데, 일부 신체 장애를 가진 사람들이나 휠체어를 이용하는 장애인들은 그 사용이 쉽지 않다. 또한 어린아이들이나 노인들도 나이가 많아질수록 키오스크와 같은 새로운 기술을 사용하는 것에 어려움을 보이고 있다. 본 연구에서는 이러한 문제점을 보완하기 위해 사용자가 키오스크와 상호작용을 할 때 시각적인 요소 뿐만 아니라 음성인식 기능을 추가하여 음성으로 주문명령을 수행할 수 있는 시스템을 설계하였다.

  • PDF

장애인을 위한 음성 인터페이스 설계 (Designing Voice Interface for The Disabled)

  • 최동욱;이지훈;문남미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.697-699
    • /
    • 2019
  • IT 기술의 발달에 따라 전자기기의 이용량은 증가하였지만, 시각장애인들이나 지체 장애인들이 이용하는 데에 어려움이 있다. 따라서 본 논문에서는 Google Cloud API를 활용하여 음성으로 프로그램을 제어할 수 있는 음성 인터페이스를 제안한다. Google Cloud에서 제공하는 STT(Speech To Text)와 TTS(Text To Speech) API를 이용하여 사용자의 음성을 인식하면 텍스트로 변환된 음성이 시스템을 통해 응용 프로그램을 제어할 수 있도록 설계한다. 이 시스템은 장애인들이 전자기기를 사용하는데 많은 편리함을 줄 것으로 예상하며 나아가 장애인들뿐 아니라 비장애인들도 활용 가능할 것으로 기대한다.