• 제목/요약/키워드: 시각 음성인식

검색결과 129건 처리시간 0.03초

음성정보기술 국제 표준화 동향

  • 홍기형
    • 정보처리학회지
    • /
    • 제11권2호
    • /
    • pp.33-41
    • /
    • 2004
  • 언제, 어디서, 어떤 장치를 사용하더라도 정보의 검색이나 접근이 가능해지는 유비쿼터스 환경이 가시화되고 있어, 음성을 사용한 사용자 인터페이스의 중요성이 증대하고 있다. 음성인식, 합성, 화자인증 등 음성 등의 음성처리엔진의 기술 수준이 상용화 단계에 접어들고, 이동 중과 같이 모니터 등 시각적 인터페이스의 사용이 용이하지 않은 상황에서도 정보 접근기 요구가 증대함에 따라 음성은 정보시스템 의 중요한 인터페이스로 자리매김 하고 있다. 음성정보기술은 인간의 가장 자연스러운 상호작용 수단인 음성을 이용하여. 시스템에 명령을 내리고, 시스템의 명령 수행 결과를 음성으로 전달하는 음성을 이용한 정보 시스템 인터페이스를 구현하기 위 한 기술을 의미한다. 또한, 음성정보시스템은 음성을 이용한 사용자인터페이스가 가능한 정보시스템을 뜻하며, (그림 1)과 같이 음성처리엔진, 사용자 접속망, 사용자 프로파일 및 음성응용시스템으로 구성된다.(중략)

  • PDF

스마트폰 자이로센서를 이용한 시각장애인용 광학문자인식 방법 (An Optical Character Recognition Method using a Smartphone Gyro Sensor for Visually Impaired Persons)

  • 권순각;김흥준
    • 한국산업정보학회논문지
    • /
    • 제21권4호
    • /
    • pp.13-20
    • /
    • 2016
  • 현대 사회에서 스마트폰은 장착된 고화질의 카메라를 이용하여 광학문자인식시스템을 구현할 수 있다. 광학문자시스템으로부터 인식된 문자들은 또한 TTS를 이용하여 시각장애인들에게 음성 서비스를 제공할 수 있다. 문자 정보가 들어있는 객체에 대하여 스마트 폰 카메라를 사용하여 촬영하는 것도 시각장애인들에게는 다소 어려운 일이다. 왜냐하면 피사체의 촬영 이미지를 볼 수가 없기 때문이다. 이러한 문제점을 해결하기 위하여 본 논문에서는 스마트폰의 자이로 센서를 사용하여 시각장애인들의 올바른 촬영을 유도하는 방법을 제안한다. 구현된 프로그램을 사용하여 모의 실험한 결과, 제안된 방법은 같은 객체로부터 보다 많은 문자를 인식하는 것을 확인할 수 있었다.

장애인복지를 위한 정보통신의 발전방향 (New developmental direction of telecommunications for Disabilities Welfare)

  • 박민수
    • 한국정보통신학회논문지
    • /
    • 제4권1호
    • /
    • pp.35-43
    • /
    • 2000
  • 본 연구는 장애인이 일반인과 똑같이 정보사회에 적응시키기 위해 장애인복지를 위한 정보통신의 발전방향을 연구하였다. 연구의 방법으로는 델파이기법을 도입하였으며, 조사방법으로는 문헌적조사방법과 면담조사방법을 병행하여 연구분석의 틀에 의해 분석하였다. 정보통신에 대한 장애인의 문제점을 살펴보면, 정보통신 접근의 불편, 보편적 서비스 저하, 장애인의 PC 통신 이용 저조, 장애인복지의 낙후, 정보통신요금의 부담, 정보화교육의 부족, 장애인정보의 부족, 장애인복지 정책결정에 장애인 미참여 등으로 분석되었다. 장애인에 필요한 정보통신기술을 살펴보면, 지체장애인에게는 음성인식기술ㆍ화상인식기술ㆍ호흡압력감지기술, 시각장애인에게는 표시기술ㆍ음성인식기술ㆍ문자인식기술ㆍ지적변환처리기술ㆍ화상인식음성합성기술, 청각ㆍ언어장애인에게는 음성신호처리기술ㆍ음성인식기술ㆍ기적변환처리기술ㆍ문자인식기술ㆍ화상인식기술ㆍ음성합성기술이 필요하다. 장애인복지를 위한 정보통신을 발전시키기 위해서는 장애인정보통신위원회의 구성, 보편적 서비스의 제공, 정보화교육의 실시, 연구개발의 지원, 중소정보통신기업의 지원 육성, 소프트웨어산업의 육성, 장애인용 표준화 작업 추진이 요구된다.

  • PDF

음성인식시스템과 다목적 시각 언어를 연동한 실시간 쇼핑 시스템 (The Real-time Shopping System using Multipurpose Visual Language with Voice Recognize)

  • 김영종
    • 한국산학기술학회논문지
    • /
    • 제16권6호
    • /
    • pp.4164-4169
    • /
    • 2015
  • 본 논문에서는 다목적 시각 언어 시스템(MVLS, Multipurpose Visual Language System)에 음성인식 리모컨을 연동한 실시간 쇼핑 시스템을 설계하였다. 이 시스템은 기존의 일반적인 온라인 및 오프라인 쇼핑 시스템을 그대로 이용하면서, 사용자가 원하는 편리한 방법으로 추가 시킨 MVLS 데이터를 이용함으로써, 전체 쇼핑 시스템의 구조를 큰 변화 없이 활용할 수 있는 장점을 가지고 있다. 또한, 사용자 관점에서는, 국가기관 및 민간단체의 각종 보고서와 시장동향을 토대로 조사한 방법에 의해, 키보드나 마우스 등 상대적으로 사용하기 어려운 매체가 아닌, 음성인식 리모컨 또는 스마트폰을 활용하여 원하는 상품을 구매할 수 있다는 장점도 가지고 있다. 이는 특히, IT 매체 소외 계층으로 볼 수 있는, 노약자나 장애우 등도 쉽고 편리하게 원하는 제품을 구매할 수 있는 특징을 포함하고 있다. 또한, 쇼핑몰이나 판매자 입장에서도 구매자의 쇼핑 정보의 수집을 보다 쉽고 빠르며 효율적으로 수집할 수 있어서, 차후 판매 전략을 수립하는데 큰 도움이 될 수 있다.

딥러닝 기반 사용자 친화형 키오스크 시스템 (An User-Friendly Kiosk System Based on Deep Learning)

  • 강수연;이유진;정현아;조승아;이형규
    • 한국산업정보학회논문지
    • /
    • 제29권1호
    • /
    • pp.1-13
    • /
    • 2024
  • 본 연구는 키오스크 사용 증가로 인한 변화에 대응하기 위해 사용자 특성을 고려한 맞춤형 동적 키오스크 화면을 제공하는 것을 목표로 한다. 디지털 취약계층인 시각장애인, 노인, 어린이, 휠체어 사용자 등의 특성에 따른 화면 구성의 최적화를 위해 객체 탐지, 걸음걸이 인식, 음성발화 인식기술을 종합하여 사용자의 특성(휠체어 사용 여부, 시각 장애, 연령 등)을 실시간으로 분석하고, 이를 기반으로 9개의 카테고리로 사용자를 분류한다. 키오스크 화면은 사용자의 특성에 따라 동적으로 조정되어 효율적인 서비스 제공이 가능하다. 본 연구는 임베디드 환경에서 시스템 통신 및 운용이 이루어졌으며, 사용된 객체 탐지, 걸음걸이 인식, 음성발화 인식 기술은 각각 74%, 98.9%, 96%의 정확도를 보여준다. 제안된 기술은 프로토타입을 구현하여 그 효용성을 검증하였으며, 이를 통해 본 연구가 디지털 격차의 축소와 사용자 친화적인 "배리어 프리 키오스크" 서비스 제공의 가능성을 보였다.

입술 움직임 영상 선호를 이용한 음성 구간 검출 (Speech Activity Detection using Lip Movement Image Signals)

  • 김응규
    • 융합신호처리학회논문지
    • /
    • 제11권4호
    • /
    • pp.289-297
    • /
    • 2010
  • 본 논문에서는 음성인식을 위한 음성구간 검출과정에서 유입될 수 있는 동적인 음향에너지 이외에 화자의 입술움직임 영상신호까지 확인함으로써 외부 음향잡음이 음성인식 대상으로 오인식되는 것을 방지하기 위한 한 가지 방법이 제시된다. 우선, 연속적인 영상이 PC용 영상카메라를 통하여 획득되고 그 입술움직임 여부가 식별된다. 다음으로, 입술움직임 영상신호 데이터는 공유메모리에 저장되어 음성인식 프로세서와 공유한다. 한편, 음성인식의 전처리 단계인 음성구간 검출과정에서 공유메모리에 저장되어진 데이터를 확인함으로써 화자의 발성에 의한 음향에너지인지의 여부가 입증된다. 최종적으로, 음성인식기와 영상처리기를 연동시켜 실험한 결과, 영상카메라에 대면해서 발성하면 음성인식 결과의 출력에 이르기까지 연동처리가 정상적으로 진행됨을 확인하였고, 영상카메라에 대면치 않고 발성하면 연동처리시스템이 그 음성인식 결과를 출력치 못함을 확인하였다. 또한, 오프라인하의 입술움직임 초기 특정값 및 템플릿 초기영상을 온라인하에서 추출된 입술움직임 초기특정값 및 템플릿 영상으로 대체함으로써 입술움직임 영상 추적의 변별력을 향상시켰다. 입술움직임 영상 추적과정을 시각적으로 확인하고 실시간으로 관련된 패러미터를 해석하기 위해 영상처리 테스트베드를 구축하였다, 음성과 영상처리 시스템의 연동결과 다양한 조명환경 하에서도 약 99.3%의 연동율을 나타냈다.

음성 인식 사용자 인터페이스를 통한 가전기기 제어 기법 (Home Appliance Control through Speech Recognition User Interface)

  • 송욱;장현수;엄영익
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.265-268
    • /
    • 2006
  • 유비쿼터스 컴퓨팅 환경이 확대됨에 따라, 기존의 키보드와 마우스만을 사용자 인터페이스로 주로 사용했던 방법에서 벗어나 좀 더 사용자 중심의 멀티모달 유저 인터페이스 적응이 요구되고 있다. 이에 XHTML+Voice는 음성 및 시각을 모두 제공할 수 있는 새로운 서비스 패러다임으로서 기존의 음성정보만을 제공하거나 시각적인 정보만을 제공하는 시스템과는 달리 XHTML내에 VoiceXML을 삽입함으로써 두 언어의 장점을 모두 활용할 수 있다. 본 논문에서는 VoiceXML의 이러한 장점을 살려 스마트 홈을 구성하는 여러 가전기기들의 인터페이스를 미리 템플릿으로 만들어 두어 모바일 디바이스를 통해 이것들을 제어하는 시나리오를 제안하고 구현하는 방법에 대해 실험하였다.

  • PDF

가상비콘을 이용한 시각장애인 대상 간판 음성 안내 구현 (Implementation of Signboard Voice Guidance Service for Visually Impaired Person Using Virtual Beacon)

  • 이윤호;박광중;권순각
    • 한국산업정보학회논문지
    • /
    • 제23권6호
    • /
    • pp.1-8
    • /
    • 2018
  • 본 논문에서는 가상비콘을 이용한 시각 장애인 대상 간판 음성 안내 서비스를 구현한다. 물리적으로 위치를 측정하는 물리적 비콘 방식 대신, Wi-Fi, GPS 등의 여러 수단을 통해 위치를 측정하는 가상비콘을 이용하여 물리적인 설치비용 없이 손쉽게 위치를 추가하고, 해당 위치 기반의 서비스를 제공할 수 있다. 본 논문에서는 이러한 가상비콘으로 등록된 지점에 시각장애인이 도착하였을 때, 사진촬영을 유도하여 촬영된 간판에 대한 다양한 정보를 전달하는 서비스를 제공한다.

시각장애인을 위한 ICT융합 자율주행 서비스 로봇 설계 및 구현 (Design and Implementation of ICT Convergence Autonomous Driving Service Robot for the Visually Impaired)

  • 구예찬;권세진;남가빈;이웅기
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.1003-1005
    • /
    • 2022
  • 코로나-19의 여파와 기술의 발전으로 비대면 거래가 증가하고 있는 추세다. 비대면 거래가 증가하면서 무인점포도 늘어나고 있고, 늘어남에 따라서 시각장애인들은 무인점포를 이용하는데 어려움을 겪고 있다. 본 논문에서는 자율주행 로봇에 음성인식 기술과 딥러닝 기술을 적용하여 시각장애인에게 도움을 줄 수 있도록 ICT융합 로봇을 구현하였다. 무인점포 뿐만이 아니라 안내가 필요한 다양한 장소에서도 적용될 수 있을 것으로 기대한다.

모바일기기를 이용한 상황인식-흰지팡이 (Situation-awareness White Cane Using a Mobile Device)

  • 전동희;전준욱;백화현;문미경
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권11호
    • /
    • pp.167-173
    • /
    • 2014
  • 흰지팡이는 시각장애인이 보행을 위하여 사용하는 지팡이이다. 시각장애인의 보행 안전성을 향상시키기 위해 스마트 전자 흰지팡이에 대한 연구와 개발이 꾸준히 진행되고 있다. 본 논문에서는 흰지팡이와 모바일기기 간의 통신을 통해 시각장애인의 보행활동에 도움을 줄 수 있는 몇 가지 상황들에 대해 안내해주는 상황인식 흰지팡이의 개발내용에 대해 기술한다. 상황인식 흰지팡이에는 시각장애인이 손쉽게 누를 수 있는 형태로 버튼들이 설치되어 있고, 이를 누르면 시각장애인의 목에 걸려있는 스마트 모바일기기와의 블루투스 연동을 통해 상황인식 결과값을 음성으로 알림 받는다. 이를 통해 시각장애인의 보행 환경에 대한 불안전 요소를 감소시켜줄 수 있으며 그 결과 보행 안전성이 향상될 수 있을 것이다.