• 제목/요약/키워드: Running Speech

검색결과 36건 처리시간 0.026초

공공도서관 어린이 독서프로그램의 효과 측정 영역 개발에 관한 연구 (A Study of Identifying Areas to Measure the Effectiveness of Public Library Reading Programs for Children)

  • 임여주;정연경
    • 한국문헌정보학회지
    • /
    • 제48권2호
    • /
    • pp.89-107
    • /
    • 2014
  • 본 연구의 목적은 공공도서관에서 이루어지고 있는 어린이 대상 독서프로그램의 효과를 정성적으로 분석하고 이를 바탕으로 독서프로그램의 성과 측정 영역을 개발하는 것이다. 이를 위해 '2013 도서관과 함께 책읽기' 사업에 참여하는 도서관의 독서프로그램 어린이들, 프로그램 담당자들과 면담 및 관찰을 하였고 독서프로그램의 효과를 분석하였다. 연구 결과 '도서관과 함께 책읽기' 프로그램에 참가한 어린이들은 대체로 긍정적인 변화를 보였으며 독서프로그램의 효과 측정 영역이 책 읽기와 책에 대한 태도, 도서관과 사서에 대한 인식, 독서프로그램의 참여도, 소리 내어 읽는 능력, 이야기를 듣고 이해하는 능력, 공격성, 자신의 감정표현 능력, 발표력, 집중력, 잠재력으로 나타났다. 또한 독서프로그램의 효과에 영향을 주는 요소로 사서의 적극적인 노력, 지역아동센터의 환경, 학년 구성, 강사의 수업 구성 방식, 독서프로그램에서 사용하는 책의 선정, 독서프로그램 참가 어린이의 독서능력 및 독서에 대한 관심, 자유시간의 제공 여부를 들 수 있었다.

스파크 기반 딥 러닝 분산 프레임워크 성능 비교 분석 (A Comparative Performance Analysis of Spark-Based Distributed Deep-Learning Frameworks)

  • 장재희;박재홍;김한주;윤성로
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권5호
    • /
    • pp.299-303
    • /
    • 2017
  • 딥 러닝(Deep learning)은 기존 인공 신경망 내 계층 수를 증가시킴과 동시에 효과적인 학습 방법론을 제시함으로써 객체/음성 인식 및 자연어 처리 등 고수준 문제 해결에 있어 괄목할만한 성과를 보이고 있다. 그러나 학습에 필요한 시간과 리소스가 크다는 한계를 지니고 있어, 이를 줄이기 위한 연구가 활발히 진행되고 있다. 본 연구에서는 아파치 스파크 기반 클러스터 컴퓨팅 프레임워크 상에서 딥 러닝을 분산화하는 두 가지 툴(DeepSpark, SparkNet)의 성능을 학습 정확도와 속도 측면에서 측정하고 분석하였다. CIFAR-10/CIFAR-100 데이터를 사용한 실험에서 SparkNet은 학습 과정의 정확도 변동 폭이 적은 반면 DeepSpark는 학습 초기 정확도는 변동 폭이 크지만 점차 변동 폭이 줄어들면서 SparkNet 대비 약 15% 높은 정확도를 보였고, 조건에 따라 단일 머신보다도 높은 정확도로 보다 빠르게 수렴하는 양상을 확인할 수 있었다.

Training of Fuzzy-Neural Network for Voice-Controlled Robot Systems by a Particle Swarm Optimization

  • Watanabe, Keigo;Chatterjee, Amitava;Pulasinghe, Koliya;Jin, Sang-Ho;Izumi, Kiyotaka;Kiguchi, Kazuo
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2003년도 ICCAS
    • /
    • pp.1115-1120
    • /
    • 2003
  • The present paper shows the possible development of particle swarm optimization (PSO) based fuzzy-neural networks (FNN) which can be employed as an important building block in real life robot systems, controlled by voice-based commands. The PSO is employed to train the FNNs which can accurately output the crisp control signals for the robot systems, based on fuzzy linguistic spoken language commands, issued by an user. The FNN is also trained to capture the user spoken directive in the context of the present performance of the robot system. Hidden Markov Model (HMM) based automatic speech recognizers are developed, as part of the entire system, so that the system can identify important user directives from the running utterances. The system is successfully employed in a real life situation for motion control of a redundant manipulator.

  • PDF

주행중인 자동차 환경에서의 고립단어 음성인식 연구 (A Study on Isolated Words Speech Recognition in a Running Automobile)

  • 유봉근
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 2호
    • /
    • pp.381-384
    • /
    • 1998
  • 본 논문은 주행중인 자동차 환경에서 운전자의 안전성 및 편의성의 동시 확보를 위하여, 보조적인 스위치 조작없이 상시 음성의 입, 출력이 가능하도록 한다. 이때 잡음에 강인한 threshold 값을 구하기 위하여, 일정한 시간마다 기준 에너지와 영교차율(Zero Crossing Rate)을 변경하며, 밴드패스 필터(bandpass filter)를 이용하여 1차, 2차로 나누어 실시간 상태에서 자동으로, 정확하게 끝점검출(End Point Detection)을 처리한다. 기준패턴(reference pattern)은 DMS(Dynamic Multi-Section)을 사용하며, 화자의 변별력을 높이기 위하여 2개의 모델사용을 제안한다. 또한 주행중인 차량의 잡음환경에 강인하기 위하여 일반주행(80km/h 이내), 고속주행(80km/h 이상)등으로 나누며 차량의 가변잡음 크기에 따라 자동으로 선택하도록 한다. 음성의 특징 벡터와 인식 알고리즘은 PLP 13차와 One-Stage Dynamic Programming (OSDP)를 이용한다. 실험결과, 자주 사용되는 차량 편의장치 제어명령 33개에 대하여 중부, 영동 고속도로(시속 80Km/h 이상)에서 화자독립 89.75%, 화자종속 90.08%의 인식율을 구하였으며, 경부 고속도로에서는 화자독립 92.29%, 화자종속 92.42%의 인식율을 구하였다. 그리고 저속 주행중인 자동차 환경(80km/h 이내, 시멘트, 아스팔트 등의 서울시내 및 시외독립)에서는 화자독립 92.89%, 화자종속 94.44% 인식율을 구하였다.

  • PDF

STFT와 RNN을 활용한 화자 인증 모델 (Speaker Verification Model Using Short-Time Fourier Transform and Recurrent Neural Network)

  • 김민서;문종섭
    • 정보보호학회논문지
    • /
    • 제29권6호
    • /
    • pp.1393-1401
    • /
    • 2019
  • 최근 시스템에 음성 인증 기능이 탑재됨에 따라 화자(Speaker)를 정확하게 인증하는 중요성이 높아지고 있다. 이에 따라 다양한 방법으로 화자를 인증하는 모델이 제시되어 왔다. 본 논문에서는 Short-time Fourier transform(STFT)를 적용한 새로운 화자 인증 모델을 제안한다. 이 모델은 기존의 Mel-Frequency Cepstrum Coefficients(MFCC) 추출 방법과 달리 윈도우 함수를 약 66.1% 오버랩하여 화자 인증 시 정확도를 높일 수 있다. 새로운 화자 인증 모델을 제안한다. 이 때, LSTM 셀을 적용한 Recurrent Neural Network(RNN)라는 딥러닝 모델을 사용하여 시변적 특징을 가지는 화자의 음성 특징을 학습하고, 정확도가 92.8%로 기존의 화자 인증 모델보다 5.5% 정확도가 높게 측정되었다.

인공지능 딥러링 학습 플랫폼에 관한 선행연구 고찰 (A Review on Deep Learning Platform for Artificial Intelligence)

  • 진찬용;신성윤;남수태
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2019년도 춘계학술대회
    • /
    • pp.169-170
    • /
    • 2019
  • 인공지능이 글로벌 경쟁력 원천 기술로 부각되면서 정부도 자율주행차, 드론, 로봇 등 미래 신산업의 기반 기술이 되는 인공지능을 전략적으로 육성하고 있다. 국내 인공지능 연구 및 서비스는 네이버와 카카오를 중심으로 출시되었으나 해외에 비하면 규모나 수준이 미약한 편이다. 최근, 딥러닝 (deep learning)은 최근 음성인식과 영상인식을 비롯한 다양한 패턴인식 분야에서 혁신적인 성능을 기록하면서 많은 연구가 진행되고 있다. 그 뿐만 아니라 딥러닝은 초창기부터 산업계의 큰 관심을 끌어 구글이나 마이크로소프트, 삼성전자 등 글로벌 정보기술 회사에서 상용제품에 딥러닝 기술을 성공적으로 적용하고 있고 계속 연구개발을 진행하고 있어 대중매체에서도 관심을 가지고 주목하고 있다. 이러한 선행연구를 바탕으로 주목 받고 있는 인공지능에 대해 살펴보도록 하겠다.

  • PDF