• 제목/요약/키워드: 시각 음성인식

검색결과 130건 처리시간 0.031초

시각장애인을 위한 음성안내 나침반 개발 (Development of a Voice Compass Device to Guide the Person who are Blind)

  • 김창걸;최미나;송병섭
    • 재활복지공학회논문지
    • /
    • 제1권1호
    • /
    • pp.7-11
    • /
    • 2007
  • 시각장애인이 보행 및 이동시 올바른 방향 정립을 통해 목적지에 쉽게 갈 수 있도록 하기 위해 음성을 이용하여 사용자의 방향을 알려줄 수 있는 시각장애인용 음성안내 나침반을 개발하였다. 개발된 음성안내 나침반은 자기 센서를 이용하여 지자계를 인식함으로써 방향을 인지할 수 있는 센서부와 소리를 녹음하는 보이스레코더 IC, 방향정보를 소리를 통해 사용자에게 전달하는 스피커 그리고 이들을 제어하는 마이크로프로세서로 구성된다. 개발된 음성안내 나침반은 32방향의 방향 분해능을 가지며 사용자의 편리를 위해 사용자가 설정한 일정시간 간격으로 계속적으로 진행하는 방향을 알려줄 수 있도록 설계되었다. 개발된 음성안내 나침반은 시각장애인의 이동뿐만 아니라 각종 스포츠와 레저에도 이용될 수 있도록 설계되었으며 시각장애인을 이용한 실험을 통하여 그 성능을 입증하였다.

  • PDF

멀티모달 인터페이스(3차원 시각과 음성 )를 이용한 지능적 가상검객과의 전신 검도게임 (A Full Body Gumdo Game with an Intelligent Cyber Fencer using Multi-modal(3D Vision and Speech) Interface)

  • 윤정원;김세환;류제하;우운택
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제9권4호
    • /
    • pp.420-430
    • /
    • 2003
  • 본 논문에서는 멀티모달(multi-modal) 인터페이스를 통해 지능적 가상검객과 체감형 검도게임을 할 수 있는 시스템을 제안한다. 제안된 검도게임 시스템은 멀티모달 인터페이스(시각과 청각), 인공지능(AI), 피드백(스크린과 사운드) 등 크게 세 가지 모듈로 구성된다. 첫 번째로, 멀티모달 인터페이스는 시각기반, 3차원 인터페이스를 이용하여 사용자가 자유롭게 3차원 공간에서 움직일 수 있도록 하고, 음성기반 인터페이스를 이용하여 사용자가 현실감 있는 검도게임을 즐길 수 있도록 한다. 두 번째, 인공지능은 가상검객에게 멀티모달 인터페이스에서 입력되는 시각과 음성을 인식하여 가상검객의 반응을 유도한다. 마지막으로, 대형 스크린과 스피커를 통한 시청각 피드백은 체감형 상호작용을 통하여 사용자가 몰입감을 느끼며 검도게임을 경험할 수 있도록 한다. 따라서 제안된 시스템은 전신의 움직임으로 사용자에게 몰입감의 검도게임을 제공한다. 제안된 시스템은 오락 외에 교육, 운동, 예술행위 등 다양한 분야에 적용될 수 있다.

음성인식 기반 인터렉티브 미디어아트의 연구 - 소리-시각 인터렉티브 설치미술 "Water Music" 을 중심으로-

  • 이명학;강성일;김봉화;김규정
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 1부
    • /
    • pp.354-359
    • /
    • 2008
  • 소리-시각 인터랙티브 설치미술인 "Water Music" 은 관객의 음성에 따라서 변하는 물결의 파동을 표현한다. 음정인식 기반 인터페이스 기술을 이용하여 벽면에 비디오 프로젝션 된 시각적 물결이미지로 나타난다. 물결이미지는 동양화의 붓으로 그린 물결과 작은 원형의 입자들을 생성하여 표현된 영상으로 구성된다. 관객은 입김을 불어 넣거나 소리를 냄으로써 화면에서 연속적으로 생성되는 컴퓨터 프로그램 기반 물결의 움직임과 상호 반응할 수 있다. 이러한 공생적인 소리 시각 환경은 관객에게 생각으로 그리고 신체적으로 환영적 공간을 경험하도록 한다. 본 설치작업에서 관객과 상호 반응 할 수 있는 움직이는 물결을 생성하기 위하여 적용된 주요 프로그램은 Visual C++ and DirectX SDK이며, 풀 프레임 3D 렌더링 기술과 파티클 시스템이 사용되었다.

  • PDF

빅데이터 분석을 활용한 음성 인식 스피치 교정 애플리케이션 (Voice Recognition Speech Correction Application Using Big Data Analysis)

  • 김한결;김도우;임세명;홍두표
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.533-535
    • /
    • 2019
  • 최근 청년 실업률의 증가에 따른 취업 경쟁이 날이 갈수록 심해지고 있다. 채용과정에서 면접의 비중을 높이는 기업도 갈수록 증가하고 있다. 또한 대기업에서는 면접의 객관성을 확보하기 위해 AI 면접을 도입했다. 이러한 면접의 도입으로 인해 취업 준비생들의 면접 준비에 드는 비용 부담이 증가하였다. 최근 AI분야에서 음성 인식과 자연어 처리에 대한 개발이 활발히 이루어지고 있다. 본 논문은 녹음된 면접 음성을 음성 인식 기술 중 STT(Speech To Text) 와 TTS(Text To Speech)를 활용하여 면접의 음성을 문자로, 면접 질문의 문장을 음성으로 변환한다. 또한 자연어 처리 및 감성어 사전(KNU)을 활용하여 면접 문장의 형태소 분석하고 긍정 및 부정 단어별 정보를 시각화 하여 나타낼 수 있게 구현하였다.

시각장애인의 문맹률을 낮추기 위한 스마트 점자학습 보드 (Smart Braille Learning Board to lower illiteracy rate for the Blind)

  • 김성경;이효정;장윤희;김인수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.977-979
    • /
    • 2022
  • 본 논문에서는 시중에서 판매되는 점자학습 기기의 단점들을 보완한 점자학습 보드를 제안한다. 학습 보드는 다음과 같은 기능을 수행한다. 첫째, 자음, 모음 등의 기초적인 글자 학습, 단어와 문장 학습, 게임학습, 총 세 가지의 학습 모드를 지원하는 기능. 둘째, 사용자의 학습 데이터를 분석하여 마지막 학습 일자, 학습 진행 상황 등의 다양한 요소를 고려한 학습, 복습 내용을 자동으로 업로드하는 기능. 셋째, 기기에 연동된 애플리케이션을 통해 학습상태를 확인하고 기기를 조작하는 기능. 넷째, 학습 보드와 앱의 음성안내, 생체인식을 사용한 로그인, 음성인식을 통한 언어 변환, 보드 자동 교체 등의 사용자 편의성을 위한 기능이다. 본 논문은 이를 통해 점자학습에 대한 접근성을 높여 시각장애인의 문맹률 감소를 목표로 한다.

YOLO알고리즘을 활용한 시각장애인용 식사보조 시스템 개발 (Development a Meal Support System for the Visually Impaired Using YOLO Algorithm)

  • 이군호;문미경
    • 한국전자통신학회논문지
    • /
    • 제16권5호
    • /
    • pp.1001-1010
    • /
    • 2021
  • 시각이 온전한 사람들은 식사를 할 때 시각에 대한 의존도를 깊게 인지하지 못한다. 그러나 시각장애인은 식단에 어떤 음식이 있는지 알지 못하기 때문에 옆에 있는 보조인이 시각장애인 수저로 음식의 위치를 시계방향 또는 전후좌우 등 일정한 방향으로 설명하여 그릇 위치를 확인한다. 본 논문에서는 시각장애인이 스마트폰의 카메라를 이용하여 자신의 식단을 비추면 각각의 음식 이미지를 인식하여 음성으로 음식의 이름을 알려주는 식사보조 시스템의 개발 내용에 대해 기술한다. 이 시스템은 음식과 식기도구(숟가락)의 이미지를 학습한 YOLO모델을 통해 숟가락이 놓인 음식을 추출해 내고, 이 음식이 무엇인지를 인식하여 이를 음성으로 알려준다. 본 시스템을 통해 시각장애인은 식사보조인의 도움없이 식사를 할 수 있음으로써 자립의지와 만족도를 높일 수 있을 것으로 기대한다.

시각장애인의 보행보조를 위한 스마트폰 케이스 구현 (Development of Walking Assist Smartphone Case for Blind People)

  • 최진우;정구민
    • 한국정보전자통신기술학회논문지
    • /
    • 제8권3호
    • /
    • pp.239-242
    • /
    • 2015
  • 시각장애인들은 외출을 하기 위해 보행 보조기기를 사용하고 있다. 또한, 최근에는 보행 보조기기뿐만 아니라 음성인식 명령기능을 탑재한 스마트폰도 이용하고 있다. 이러한 추세에 따라, 본 논문에서는 시각장애인 보행 보조를 위한 스마트 폰 케이스를 설계하고 구현하였다. 조도 센서와 스마트폰 카메라 플래시를 이용하여 어두운 장소에서 자신의 위치를 알려주는 자기 위치 알림 시스템과 초음파 센서를 이용하여 장애물을 감지하고 시각장애인들에게 음성으로 경고를 해주는 음성 경고 시스템을 제공한다. 이를 이용하면 시각장애인은 어두운 곳에서 자신의 위치를 알리고, 전방의 장애물을 피해갈 수 있어서 보다 안전하게 보행하여 사고를 방지할 수 있다.

한국어 음성합성과 인식을 이용한 웹 브라우저 설계 및 구현 (Design and Implementation of Web browser Using Voice synthesis & Recognition for Korean language)

  • 조경환;최훈일;조철환;장영건
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.278-280
    • /
    • 2000
  • 인터넷의 중요성이 증가함에 따라, 웹 브라우저에 음성 인터페이스를 추가하는 연구와 개발이 이루어지고 있다. 그러나, 아직까지 기존의 모든 웹 문서가 HTML로 작성되어 있어, 효과적인 음성 인터페이스를 하기에는 많은 어려움이 있으며, 음성이 느린 출력 매체이므로 사용자가 빠르게 인지할 수 있는 방안이 연구되어야 한다. 본 논문에서는 사용자의 웹 액세스를 높이기 위하여, 웹 브라우저에 연결되는 웹 문서에서, 각각의 객체를 추출한 후, 사용자가 그 객체에 바로 액세스를 하거나 한국어 음성으로 그 정보를 알 수 있는 방법을 사용하여, 음성으로 제어할 수 있는 한국어 음성 웹 브라우저를 설계하고 구현하였다. 음성합성과 인식을 사용하여 브라우저를 제어하기 때문에, 노약자나 어린이 또는 시각장애인들이 쉽게 웹 서핑을 할 수 있도록 도와줄 수 있고, 또한 현재 사용되고 있는 웹 문서에서의 객체추출을 사용하기 때문에 특별히 문서의 변환이 필요 없는 장점이 있다.

  • PDF

청각장애인을 위한 음성인식 기반 메시지 전송 시스템 (Speech Recognition based Message Transmission System for the Hearing Impaired Persons)

  • 김성진;조경우;오창헌
    • 한국정보통신학회논문지
    • /
    • 제22권12호
    • /
    • pp.1604-1610
    • /
    • 2018
  • 음성인식 서비스는 청각장애인에게 화자의 음성을 텍스트로 변환하여 시각화함으로써 의사소통의 보조적인 수단으로 사용되고 있다. 하지만 강의실 및 회의실과 같은 개방된 환경에서는 다수의 청각장애인에게 음성인식 서비스를 제공하기 힘들다. 이를 위해 주변 환경에 따라 음성 인식 서비스를 효율적으로 제공하기 위한 방법이 필요하다. 본 논문에서는 화자의 음성을 인식하여 변환된 텍스트를 다수의 청각장애인에게 메시지로 전달하는 시스템을 제안한다. 제안하는 시스템은 다수의 사용자에게 동시에 메시지를 전달하기 위해 MQTT 프로토콜을 사용한다. MQTT 프로토콜의 QoS level 설정에 따른 제안 시스템의 서비스 지연을 확인하기 위해 종단 간 지연을 측정하였다. 측정 결과 가장 신뢰성이 높은 QoS level 2와 0간의 지연이 111ms로 대화 인식에 큰 영향을 끼치지 않음을 확인하였다.

시각장애인을 위한 딥러닝과 이미지인식을 이용한 스마트 옷장 (A Smart Closet Using Deep Learning and Image Recognition for the Blind)

  • 최소희;김주하;오재동;공기석
    • 한국인터넷방송통신학회논문지
    • /
    • 제20권6호
    • /
    • pp.51-58
    • /
    • 2020
  • 시각장애인의 대다수는 독립적인 의생활을 하는데 어려움을 겪는다. 최근 스마트 가전 시장의 성장으로 가구나 가전에 인공지능이나 IoT를 추가하는 제품이 늘어나고 있다. 본 논문에서는 시각장애인의 독립적인 의생활을 지원하기 위해 옷장 내부를 관리하는 기능, 음성 대화를 통해 정보를 요청하는 음성인식 기능 그리고 CNN 알고리즘을 이용한 옷 정보에 대한 인식 기능을 가진 스마트 옷장을 제안한다. 본 논문에서는 옷을 인식하는 과정에서 정확도를 높이기 위해 모델의 층 개수를 변경하고 Maxpooling을 조정하여 모델을 생성하였다. 모델 생성 시 Early Stopping Callback 옵션을 적용하여 학습 정확도를 보장해주었다. 과적합을 방지해주기 위하여 Dropout을 추가했다. 이러한 과정으로 만들어진 최종 모델은 옷 인식 정확도가 80%가 되는 것을 확인할 수 있다.