• 제목/요약/키워드: Smart Speaker

검색결과 87건 처리시간 0.031초

On-Line Blind Channel Normalization for Noise-Robust Speech Recognition

  • Jung, Ho-Young
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제1권3호
    • /
    • pp.143-151
    • /
    • 2012
  • A new data-driven method for the design of a blind modulation frequency filter that suppresses the slow-varying noise components is proposed. The proposed method is based on the temporal local decorrelation of the feature vector sequence, and is done on an utterance-by-utterance basis. Although the conventional modulation frequency filtering approaches the same form regardless of the task and environment conditions, the proposed method can provide an adaptive modulation frequency filter that outperforms conventional methods for each utterance. In addition, the method ultimately performs channel normalization in a feature domain with applications to log-spectral parameters. The performance was evaluated by speaker-independent isolated-word recognition experiments under additive noise environments. The proposed method achieved outstanding improvement for speech recognition in environments with significant noise and was also effective in a range of feature representations.

  • PDF

스마트 스피커에서의 음악 재생 발화 오류 교정 (Utterance Error Correction of Playing Music on Smart Speaker)

  • 이다니엘;고병일;김응균
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.482-486
    • /
    • 2018
  • 본 논문에서는 스마트 스피커 환경에서 음악 재생 발화의 오류를 교정하는 음악 재생 발화 교정 모델을 제안한다. 음악 재생 발화에서 발생하는 다양한 오류 유형을 살펴보고, 음악 재생 발화 교정 모델에 대해 소개한다. 해당 모델은 후보 생성 모델과 교정 판별 모델로 이루어져 있다. 후보 생성 모델은 정답 후보들을 생성하고, 교정 판별 모델은 Random Forest를 사용하여 교정 여부를 판별한다. 제안하는 방법으로 음악 재생 발화에서 실제 사용자 만족도를 높일 수 있었다.

  • PDF

안면 인식과 화자 인식을 이용한 스마트 도어락 (A Smart doorlock with recognition of facial and speaker)

  • 김태경;권용국;정재은;전광길
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.569-570
    • /
    • 2017
  • 현재 가장 많이 사용되는 비밀번호 도어락 시스템은 외부 노출의 가능성 때문에 범죄의 위험성이 크다. 이러한 방식을 보완하기 위하여 안면 인식과 음성 인식 두 가지 기술을 결합하여 보안성을 높이는 기술을 구현하였다. 이에 본 논문은 아두이노를 사용하여 사람을 확인하고 인증하는 모듈인 보이저 모듈, 음성인식과 화자인식을 지원하는 아두이노와 그의 음성인식 모듈 Easy VR을 제시한다. 두 가지 기술의 결합으로 보안성을 높여 강력 범죄를 예방한다.

스마트 스피커에서 개인정보 발화에 따른 사용자 동의 UI/UX 개선 연구 (A Study for Improvement of User Consent UI / UX according to Personal Information Utterance in Smart Speaker)

  • 정재은;박효주;양진홍
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.414-417
    • /
    • 2019
  • 스마트 스피커는 기존 서비스와 달리 음성으로 데이터를 수집할 뿐 아니라 수집한 데이터를 기반으로 처리한 정보를 스피커를 통해 발화하는, 즉 소리로 전달하는 특징을 가진다. 이러한 서비스 응답 구조는 스피커에서 음성을 통해 전달되는 정보에 사용자의 개인정보가 포함되어 발화될 수 있는 위험이 존재한다. 구글, 아마존의 스마트 스피커 초기 설정 시 동의 과정 분석을 통해 개인정보 발화 위험을 사용자가 명확히 인지하기 어렵다는 문제를 발견하였다. 이에 본 연구는 스마트 스피커 서비스의 사용자 동의 과정에서 사용자의 개인정보 발화 위험 인식 재고를 위한 UI/UX 개선방안으로 1) 개인정보 발화 위험성 약관 명시 및 별도 화면 제시, 2) 사용자의 자유로운 서비스 동의 허용, 3) 컨트롤러에게 전달되는 개인정보와 스피커를 통해 발화될 수 있는 개인정보를 구분하여 제시, 4) 개인정보 발화 위험에 대한 음성 고지 및 동의 과정 추가를 제안하였다.

베이지안 분류 기반의 입 모양을 이용한 한글 모음 인식 시스템 (Recognition of Korean Vowels using Bayesian Classification with Mouth Shape)

  • 김성우;차경애;박세현
    • 한국멀티미디어학회논문지
    • /
    • 제22권8호
    • /
    • pp.852-859
    • /
    • 2019
  • With the development of IT technology and smart devices, various applications utilizing image information are being developed. In order to provide an intuitive interface for pronunciation recognition, there is a growing need for research on pronunciation recognition using mouth feature values. In this paper, we propose a system to distinguish Korean vowel pronunciations by detecting feature points of lips region in images and applying Bayesian based learning model. The proposed system implements the recognition system based on Bayes' theorem, so that it is possible to improve the accuracy of speech recognition by accumulating input data regardless of whether it is speaker independent or dependent on small amount of learning data. Experimental results show that it is possible to effectively distinguish Korean vowels as a result of applying probability based Bayesian classification using only visual information such as mouth shape features.

Implementing Onetime Password based Access Control System for Secure Sharing Service

  • Kang, Namhi
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제13권3호
    • /
    • pp.1-11
    • /
    • 2021
  • Development of ICT technologies leads exponential growth of various sharing economy over the last couple of years. The intuitive advantage of the sharing economy is efficient utilization of idle goods and services, but there are safety and security concerns. In this paper, we propose a onetime password based access control system to support secure accommodation sharing service and show the implementation results. To provide a secure service to both the provider and the user, the proposed system issues a onetime access password that is valid only during the sharing period reserved by the user, thereafter access returns to the accommodation owner. Especially, our system provides secure user access by merging the two elements of speaker recognition using voice and a one-time password to open and close the door lock. In this paper, we propose a secure system for accommodation sharing services as a use-case, but the proposed system can be applicable to various sharing services utilizing security-sensitive facilities.

이커머스 환경에서 구매와 공유 행동을 이용한 기기 중심 개인화 상품 정보 추천 기법 (Device-Centered Personalized Product Recommendation Method using Purchase and Share Behavior in E-Commerce Environment)

  • 권준희
    • 디지털산업정보학회논문지
    • /
    • 제18권4호
    • /
    • pp.85-96
    • /
    • 2022
  • Personalized recommendation technology is one of the most important technologies in electronic commerce environment. It helps users overcome information overload by suggesting information that match user's interests. In e-commerce environment, both mobile device users and smart device users have risen dramatically. It creates new challenges. Our method suggests product information that match user's device interests beyond only user's interests. We propose a device-centered personalized recommendation method. Our method uses both purchase and share behavior for user's devices interests. Moreover, it considers data type preference for each device. This paper presents a new recommendation method and algorithm. Then, an e-commerce scenario with a computer, a smartphone and an AI-speaker are described. The scenario shows our work is better than previous researches.

OpenWRT 기반 유무선 공유기와 Zigbee 통신을 이용한 홈 네트워크 서비스 구축 (Implementation of Home Network Services Using OpenWRT-based Wireless Access Point and Zigbee Communications)

  • 권기수;이경희
    • 한국정보통신학회논문지
    • /
    • 제22권2호
    • /
    • pp.375-381
    • /
    • 2018
  • 최근 홈 CCTV, 가전기기의 원격제어, 가정용 보안 및 재난 예방 서비스와 같이 편리한 기능을 제공하는 스마트 홈 네트워크 서비스의 보급이 점차 증가됨에 따라, 기업체에서도 이를 위한 홈 게이트웨이, 스마트 스피커 등 제품들을 앞다투어 출시하고 있다. 이러한 서비스들은 제조사 별로 독자적인 플랫폼 상에서 개발된 제품을 통해 제공되고 있으므로, 타사 제품과 통신 방식 혹은 구조가 서로 달라 호환성이 낮은 단점이 있다. 이러한 문제점을 개선하기 위하여 본 논문에서는 오픈 소스 플랫폼을 활용하여 시스템 간 호환성을 보장하는 새로운 서비스 시스템을 제안한다. 본 논문에서는 OpenWRT기반의 유무선 공유기와 Zigbee 통신을 이용하여 전자기기들이 서로 통신하여 사물을 제어할 수 있는 홈 네트워크 서비스를 구축하였다. 유무선 공유기를 홈 네트워크의 게이트웨이로 이용하고, 전자기기들을 컨트롤하는 디바이스로 아두이노를 이용하여 기본적인 IoT 플랫폼과 이를 기반으로 몇 가지 시나리오의 스마트 홈네트워크 서비스를 오픈 플랫폼 상에서 구축하였다.

시각장애인의 라이프 사이클을 지원하는 인공지능 웨어러블 플랫폼 (Artificial intelligence wearable platform that supports the life cycle of the visually impaired)

  • 박시웅;김정은;강현서;박형준
    • Journal of Platform Technology
    • /
    • 제8권4호
    • /
    • pp.20-28
    • /
    • 2020
  • 본 논문에서는 시각장애인의 라이프 사이클을 사전에 학습하여 시각장애인의 자립생활을 돕는 적정기술로 음성인식 기반 스마트 웨어러블 디바이스, 스마트 기기 및 웹 AI서버를 포함하는 음성, 사물 및 문자 인식 플랫폼을 제안하였다. 시각장애인용 웨어러블 기기는 착용편의성과 사물인식기능 효율을 높이기 위해 리버스 넥밴드 구조로 설계하여 제작하였으며, 웨어러블 기기에 부착된 고감도 소형 마이크와 스피커는 웨어러블 기기와 연동된 스마트기기의 앱으로 구성된 음성인식 인터페이스 기능을 지원하도록 구성하였다. 음성, 사물 및 광학문자 인식 서비스는 웹 AI 서버에서 오픈소스 및 구글 API를 활용하였고, 서비스 플랫폼의 음성, 사물 및 광학문자 인식 정밀도는 실험을 통하여 평균 90%이상 달성하였음을 확인하였다.

  • PDF

한국어 음운체계를 고려한 화자적응 실시간 단모음인식에 관한 연구 (Speaker Adapted Real-time Dialogue Speech Recognition Considering Korean Vocal Sound System)

  • 황선민;윤한경;송복희
    • 한국정보전자통신기술학회논문지
    • /
    • 제6권4호
    • /
    • pp.201-207
    • /
    • 2013
  • 음성인식에 관한 연구는 꾸준히 발전되어 다양한 분야에서 제품에 적용되고 있으며, 특히 스마트폰과 차량의 내비게이션 시스템과 같은 정보기기에서의 적용은 매우 활발히 이루어지고 있는 것이 현실임에도 불구하고 음성인식 연구에서 한국어의 음운 특성을 고려한 연구는 미흡한 것도 현실이다. 디지털 콘텐츠에서 일반적으로 립 싱크의 제작은 애니메이터의 수작업을 반드시 필요로 하며, 이는 시간의 투입을 요하는 지루한 작업이다. 립 싱크를 자동 생성하는 응용 소프트웨어를 사용하기도 하나 반드시 수작업으로 수정과 보정 단계가 요구될 뿐만 아니라 영어 기반으로 제작된 립 싱크 자동생성 소프트웨어를 적용하므로 한국어 음운체계가 달라 자연스러운 립 싱크를 얻기 위하여 많은 시간과 노력이 요구된다. 따라서 본 연구에서는 한국어 음운체계를 고려한 가상 오브젝트들의 립 싱크를 자동 생성하기 위한 화자 독립 기반 한국어 단모음 실시간 인식 알고리즘을 개발을 목표로 하며, 그 인식 결과는 립 싱크의 애니메이션 키로 활용하고자 한다.