• 제목/요약/키워드: voice recognition

검색결과 650건 처리시간 0.03초

인두피판술 전.후의 공명파라미터의 비교: 예비연구 (A Comparison of Resonance Parameters before and after Pharyngeal Flap Surgery:A Preliminary Report)

  • 강영애;강낙헌;이태용;성철재
    • 말소리와 음성과학
    • /
    • 제1권3호
    • /
    • pp.133-144
    • /
    • 2009
  • Pharyngeal flap surgery changes the space and shape of the oral cavity and vocal tract, and these changing conditions bring resonance change. The purpose of this study was to determine the most reliable and valuable parameters for evaluating hypernasality to distinguish two patients before and after pharyngeal flap surgery. Each patient was asked to clearly speak the vowels /a/, /i/, /u/, /e/, /o/ for voice recording. There were nine parameters: Formant (F1, F2, F3), Bandwidth (BW1, BW2, BW3), LPC energy slope ($\Delta$ |A2-A1/F2-F1|), and Band Energy (0-500 Hz, 500-1000 Hz) by each vowel. From the results of discrimination analyses on acoustic parameters, the vowels /a/, /e/ appeared to be insignificant but vowels /i/, /u/, /o/ appeared to be efficient in the separation. A 95%, 100%, and 100% recognition score could be reached when vowels /i/, /u/, and /o/ were analyzed. The results showed that F2, BW3, and LPC slope are more important parameters than the others. Finally, there is a relation between perceptual evaluation score and LPC energy slope of acoustic parameters by least square slope.

  • PDF

효율적인 차량 환경을 위한 딥 러닝 기반의 음성인식 상품 구매 시스템 (Deep learning-based voice recognition product purchase system for efficient vehicle environment)

  • 권병욱;강원민;박종혁
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.330-332
    • /
    • 2017
  • 최근 차량사고는 운전자의 운전 행동이 많은 비중을 차지하며 행동이 올바르지 못했을 경우 주의가 분산되어 사고가 발생하고 있다. 자동차 업계에서는 자율주행 기술의 출현으로 운전자의 운전환경이 변화되고 있다. 차량 서비스들은 차량에 부착된 센서들을 이용한 다양한 차량 서비스가 개발되고 있으며 차량 서비스는 도로주변 환경과 운전자의 안전에 집중된 서비스가 대부분이다. 하지만 차량에 부착된 센서들의 성능문제로 인한 기능적 문제점으로 상용화가 늦어지고 있다. 본 논문에서는 사용자에게 효율적인 차량 서비스를 제공하기 위해 사용자의 음성을 활용한 상품구매 시스템을 제안한다. 본 시스템은 딥 러닝 기술이 적용된 DB를 통해 사용자의 음성데이터 분류를 통해 상품을 검색 및 구매할 수 있는 시스템이다. 제안된 시스템은 음성인식을 활용하여 별도의 과정 없이 간편하게 상품을 구매할 수 있으며, 사고의 위험으로부터 벗어날 수 있다.

인공지능 프로세서 기술 동향 (AI Processor Technology Trends)

  • 권영수
    • 전자통신동향분석
    • /
    • 제33권5호
    • /
    • pp.121-134
    • /
    • 2018
  • The Von Neumann based architecture of the modern computer has dominated the computing industry for the past 50 years, sparking the digital revolution and propelling us into today's information age. Recent research focus and market trends have shown significant effort toward the advancement and application of artificial intelligence technologies. Although artificial intelligence has been studied for decades since the Turing machine was first introduced, the field has recently emerged into the spotlight thanks to remarkable milestones such as AlexNet-CNN and Alpha-Go, whose neural-network based deep learning methods have achieved a ground-breaking performance superior to existing recognition, classification, and decision algorithms. Unprecedented results in a wide variety of applications (drones, autonomous driving, robots, stock markets, computer vision, voice, and so on) have signaled the beginning of a golden age for artificial intelligence after 40 years of relative dormancy. Algorithmic research continues to progress at a breath-taking pace as evidenced by the rate of new neural networks being announced. However, traditional Von Neumann based architectures have proven to be inadequate in terms of computation power, and inherently inefficient in their processing of vastly parallel computations, which is a characteristic of deep neural networks. Consequently, global conglomerates such as Intel, Huawei, and Google, as well as large domestic corporations and fabless companies are developing dedicated semiconductor chips customized for artificial intelligence computations. The AI Processor Research Laboratory at ETRI is focusing on the research and development of super low-power AI processor chips. In this article, we present the current trends in computation platform, parallel processing, AI processor, and super-threaded AI processor research being conducted at ETRI.

네트워크 기반 게임 로봇의 설계 및 구현 (Design and Implementation of Game Robot based-on Network)

  • 최찬영;임경미;조석봉;임재현
    • 한국산학기술학회논문지
    • /
    • 제11권7호
    • /
    • pp.2616-2622
    • /
    • 2010
  • 본 논문은 지체장애인을 대상으로 한 네트워크 기반의 장기 게임(Janggi Game) 로봇을 구현하였다. 이를 위해 장기 게임에서 말의 이동은 무선 로봇과 음성인식 기법을 이용하여 설계 및 구현하였으며, 말의 제거와 장애물 처리 등은 물체 이동 알고리즘인 $A^{\ast}$ 알고리즘을 기반으로 하였다. 알고리즘의 구성 요소 및 구현 내용을 통해 지체장 애인의 원활한 장기 게임 진행을 실험하고 물체 이동 알고리즘의 효용성을 증명한다.

NFC 기반 2 Factor 모바일 전자결제를 위한 갤러리-옥션의 사용자인증 모듈 개발 (User certification module development of Gallery-Auction for NFC-based 2 Factor mobile electronic payment)

  • 조원오;차윤석;오수희;최명수;김형종
    • 스마트미디어저널
    • /
    • 제6권3호
    • /
    • pp.29-40
    • /
    • 2017
  • 최근 NFC 기능이 탑재되어있는 스마트폰의 비중이 급속하게 많아지고 있으며, 이로 인해 NFC 관련 기술이 많은 기업들에 의해 만들어지고 있다. NFC기반 2 factor 전자결제시스템의 보안기능 향상과 새로운 서비스를 위해 갤러리-옥션을 개발하였다. XenServer를 이용해 효율적으로 서버를 관리 할 수 있도록 하였으며, 향상된 보안기능은 FIDO 인증기술을 적용하기 위해 지문인식을 통한 사용자 인증 모듈의 개발 및 TTS를 이용한 갤러리-옥션의 전자계약 음성서비스를 개발하였으며, 실제 적용을 통해 테스트 한 결과, NFC 모바일 전자결제를 통한 사용자의 편리하고 간단한 인증방식과 보안성을 강화하였다.

머신러닝과 립 모션을 활용한 지화 번역 시스템 구현에 관한 연구 (A Study on Finger Language Translation System using Machine Learning and Leap Motion)

  • 손다은;고형민;신행용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.552-554
    • /
    • 2019
  • 농아는 청각장애인과 언어장애인을 말하며 청각장애인과 언어장애인은 음성으로 의사소통하는 것에 어려움이 있기 때문에 수화나 구화 등을 이용하여 의사소통을 한다. 그러나 수화는 모든 사람들이 사용하는 통신 수단이 아니기 때문에 수화를 알지 못하는 사람과의 의사소통하는 데 있어 한계가 생길 수밖에 없다. 본 논문에서는 장애인과 비장애인이 어려움 없이 의사소통할 수 있는 수단으로 지화 번역 시스템을 제안하고 설계 및 구현하였다. 립 모션으로 지화를 인식하였고 인식률을 높이기 위해 머신 러닝 기술을 이용하여 지화 데이터를 스스로 학습시켰다. 구현 및 실험 결과를 통해 제안한 알고리즘 적용으로 인식률 개선이 이뤄졌음을 확인하였다.

음성 인식 기반의 모바일 메신저 설계 및 구현 (The Design and Implementation of the Mobile Messenger based on Voice Recognition)

  • 유상철;유병석;김유미;이유진;고훈;윤성현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.1694-1697
    • /
    • 2012
  • 음성 인식은 인간이 발성하는 음성을 컴퓨터 프로그램을 이용하여 문자 정보로 변환하는 기술이다. 음성은 사람마다 각기 다르기 때문에 인식률도 각각 차이가 나게 되어 범용 인터페이스로 사용되기에는 적합하지 않다. 하지만 최근 구글, 다음 등 대형 포털을 중심으로 서버 기반의 음성 인식 서비스가 제공되면서 사용자 인터페이스로 음성을 이용하는 것이 주요 이슈로 부각되고 있다. 카카오톡과 같은 메신저 프로그램은 네트워크를 이용하여 그룹 내의 사용자들 간에 메시지를 주고받는다. 여기에 사용되는 터치 자판은 간격이 좁아서 오타가 많이 발생하고, 긴 문장을 입력할 때 시간이 많이 걸리며, 운전 중에 사용할 경우 사고 위험이 높아지는 단점이 있다. 이러한 문제들을 해결하기 위해서는 음성 인식 인터페이스를 접목하는 것이 이상적이다. 본 논문에서는 음성 인식 기반의 스마트폰용 모바일 메신저 프로그램을 설계 및 구현하였다. 외부의 음성 인식 서버를 이용하여 음성을 인식하고, 인식된 음성을 텍스트로 변환하며, 채팅 서버를 통해 메시지를 전달한다.

키넥트 센서 기반의 매장 주문 어플리케이션 설계 및 구현 (Design and Implementation of Store Order Applications Based on Kinect Sensor)

  • 이원주;오현수;임지섭;황새미;김민수
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2019년도 제59차 동계학술대회논문집 27권1호
    • /
    • pp.109-110
    • /
    • 2019
  • 본 논문에서는 Kinect sensor의 음성 인식 기능을 활용한 매장 주문 어플리케이션을 설계하고 구현한다. 노년층과 유아들은 무인주문결제시스템의 터치스크린 조작 및 사용자 인터페이스에 익숙하지 않기 때문에 매장에서 상품을 주문하고 결제하는데 불편함을 경험하고 있다. 이러한 불편함을 제거하기 위한 하나의 방법으로 키넥트 센서의 음성 인식 기능을 이용하여 음성으로 쉽게 주문을 할 수 있는 매장 주문 어플리케이션을 개발한다. Kinect에는 4개의 오디오 마이크로폰이 있어서 $-50^{\circ}{\sim}50^{\circ}$ 범위의 음성을 인식할 수 있으며 20db 이하의 주위 소음은 무시한다. 이 범위내에서 $10^{\circ}$씩 증가시키면서 음원의 위치를 추적한다.

  • PDF

효과적으로 기부를 받기 위한 인간형 로봇의 외형 디자인 및 행동에 관한 연구 (A Study on the Appearance Design and Behavior of a Humanoid Robot to Receive Donations Effectively)

  • 엄윤설;송현종;김이택;민인준;유동하;한재권
    • 로봇학회논문지
    • /
    • 제14권3호
    • /
    • pp.163-169
    • /
    • 2019
  • Robot ALICE@ERICA is a service robot developed to receive donations and to provide information services. ALICE@ERICA stands for Artificial Learning Intelligence robot for Culture and Entertainment at ERICA. In order to achieve the specific purpose of receiving donations, proper appearance design, appropriate movement and good communication skills are required in terms of HRI. In this paper, we introduce three strategies for developing robots to receive donations effectively. The first is to design a robot that makes people feel intimacy, the second is to approach only one of several people as a donor, and finally the donor communicates with video contents and voice recognition. A survey was conducted on the person who showed the reaction after the robot donated money in public places. Based on the survey results, it is proved that the method presented in this study effectively contributed to fund raising. If robots can perform actions that require high level of HRI, such as donation, robots can contribute more to human society. We hope that this study contributes to the improvement of human happiness.

A Study on Citizen Participation System based on Design Thinking, Design Science - Smart City case

  • SUH, Eung-Kyo
    • 융합경영연구
    • /
    • 제9권2호
    • /
    • pp.11-20
    • /
    • 2021
  • Purpose: The importance of creativity has been emphasized in the transition from industrial society to knowledge-based society. Recently, design thinking has attracted great attention as one of the ways to increase the creativity of the organization. From the perspective of solving urban problems through collaboration between technology and citizens, the active participation of citizens is indispensable for realizing smart cities. Research design, data and methodology: From the perspective of solving urban problems through collaboration between technology and citizens, the active participation of citizens is indispensable for realizing smart cities. Results: Therefore, the purpose of this research was to design a citizen-participation type system and contents using a specific space to realize a smart city. This system utilizes the concept of space as a tool to promote innovation activities with the participation of citizens and makes it easy for users of space to participate based on urban problems derived from living labs and the internal structure and user flow line have been designed. Conclusions: It was been also used voice recognition, artificial intelligence, the Internet of Things, and big data as important technologies for experiencing smart cities. The system and content were designed with an emphasis on allowing citizens to directly recognize and experience smart city technology, especially through space-based information visualization and multi-faceted stimulus elements.