• Title/Summary/Keyword: 자동음성시스템

Search Result 264, Processing Time 0.042 seconds

Design and Implementation of PSTN Auto Dialing System for VoIP Services (VoIP 서비스를 위한 PSTN 자동 발신 시스템의 설계 및 구현)

  • 송영호;이호근;권택근
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10c
    • /
    • pp.67-69
    • /
    • 2003
  • 현재 인터넷은 음성을 포함한 실시간 정보의 제공을 기반으로 정보에 대한 욕구를 충족시키고 있으며, 이러한 인터넷의 실시간을 바탕으로 사용자는 새로운 서비스에 대한 요구를 창출하게 되었고, 저렴한 인터넷을 이용하여 Public Switched Telephone Network(PSTN)과 같은 기존 통신망을 대체하는 연구가 활발히 이루어지고 있다. VoIP(Voice over Internet Protocol)는 이러한 요구에 부흥하는 인터넷의 대표적인 서비스로 등장하고 있으며, MGCP, SIP 그리고 H.323 같은 프로토콜을 기반으로 VoIP 서비스를 위한 다각적인 접근과 연구가 진행 중이다. 본 연구는 VoIP 서비스를 위한 여러 프로토콜 중 IETF가 주관하고 있는 MGCP(Media Gateway Control Protocol) 스팩에 따라 MGCP를 구현하였으며, 댁내 서비스를 위한 인터넷에서의 VoIP 신뢰성을 보장하는 방안으로 기존 PSTN망을 백업형태로 지원하는 방안을 연구하여 특정 번호는 Call Agent(CA)와 MGCP 프로토콜로 통신하지 않고 임의 변경 없이 자동으로 기존 망으로의 발신이 가능한 시스템을 설계하고 구현하였다.

  • PDF

Child Traffic Safety Automatic Reversing Smart Car Seat (어린이 교통안전 위한 자동 방향 전환 스마트 카시트)

  • In-Gyung Yun;Se-Hui Lee;Ji-Won Park;In-Soo KIm
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.778-779
    • /
    • 2023
  • 본 논문은 어린이의 불편함을 해소하며 카시트 사용율을 증가시키기 위해 어린이의 안전한 이동과 편의를 제공하는 '어린이 교통안전 위한 자동 방향 전환 스마트 카시트'를 제안한다. 주요 특징은 다음과 같다. 첫째, 카시트에 자녀를 태우고 내리는 과정이 편리하도록 승하차 모드를 제공한다. 둘째, 상황에 맞게 정방향, 역방향 전환이 가능하다. 셋째, 운전자가 운전에 집중할 수 있도록 음성인식으로 모드를 전환할 수 있다. 넷째, 수면인식을 하여 어린이가 차안에서 편안하게 잘 수 있도록 햇빛가리개를 작동한다. 다섯째, 흔들린 아이 증후군 방지를 위해 카시트의 높이와 너비를 조절할 수 있다.

A study on the Automatic Position System Report Using HF band Maritime Communication (단파대 해상통신을 이용한 자동위치보고 시스템에 대한 연구)

  • 조은하;윤재준;최조천
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2004.05b
    • /
    • pp.106-111
    • /
    • 2004
  • A data communication should be carried out by a SSB(Single Side Band) to collect real time position data of fishery ship automatically, and a study on the protocol for exchanging the information with GPS should be made. A research about regional and concentrated maritime information should be first made to obtain ship's voyage data and also, research of the Modem and transmitter-receiver controller for sending voice and data simultaneously through a SSB and of the acquisition of data through a GPS also should be carried out.

  • PDF

Corpus-based Korean Text-to-speech Conversion System (콜퍼스에 기반한 한국어 문장/음성변환 시스템)

  • Kim, Sang-hun; Park, Jun;Lee, Young-jik
    • The Journal of the Acoustical Society of Korea
    • /
    • v.20 no.3
    • /
    • pp.24-33
    • /
    • 2001
  • this paper describes a baseline for an implementation of a corpus-based Korean TTS system. The conventional TTS systems using small-sized speech still generate machine-like synthetic speech. To overcome this problem we introduce the corpus-based TTS system which enables to generate natural synthetic speech without prosodic modifications. The corpus should be composed of a natural prosody of source speech and multiple instances of synthesis units. To make a phone level synthesis unit, we train a speech recognizer with the target speech, and then perform an automatic phoneme segmentation. We also detect the fine pitch period using Laryngo graph signals, which is used for prosodic feature extraction. For break strength allocation, 4 levels of break indices are decided as pause length and also attached to phones to reflect prosodic variations in phrase boundaries. To predict the break strength on texts, we utilize the statistical information of POS (Part-of-Speech) sequences. The best triphone sequences are selected by Viterbi search considering the minimization of accumulative Euclidean distance of concatenating distortion. To get high quality synthesis speech applicable to commercial purpose, we introduce a domain specific database. By adding domain specific database to general domain database, we can greatly improve the quality of synthetic speech on specific domain. From the subjective evaluation, the new Korean corpus-based TTS system shows better naturalness than the conventional demisyllable-based one.

  • PDF

Optimal Feature Parameters Extraction for Speech Recognition of Ship's Wheel Orders (조타명령의 음성인식을 위한 최적 특징파라미터 검출에 관한 연구)

  • Moon, Serng-Bae;Chae, Yang-Bum;Jun, Seung-Hwan
    • Journal of the Korean Society of Marine Environment & Safety
    • /
    • v.13 no.2 s.29
    • /
    • pp.161-167
    • /
    • 2007
  • The goal of this paper is to develop the speech recognition system which can control the ship's auto pilot. The feature parameters predicting the speaker's intention was extracted from the sample wheel orders written in SMCP(IMO Standard Marine Communication Phrases). And we designed the post-recognition procedure based on the parameters which could make a final decision from the list of candidate words. To evaluate the effectiveness of these parameters and the procedure, the basic experiment was conducted with total 525 wheel orders. From the experimental results, the proposed pattern recognition procedure has enhanced about 42.3% over the pre-recognition procedure.

  • PDF

Development of Voice Dialing System based on Keyword Spotting Technique (핵심어 추출 기반 음성 다이얼링 시스템 개발)

  • Park, Jeon-Gue;Suh, Sang-Weon;Han, Mun-Sung
    • Annual Conference on Human and Language Technology
    • /
    • 1996.10a
    • /
    • pp.153-157
    • /
    • 1996
  • 본 논문은 연속 분포 HMM을 사용한 핵심어 추출기법(Keyword Spotting)과 화자 인식에 기반한 음성 다이얼링 및 부서 안내에 관한 것이다. 개발된 시스템은 상대방의 이름, 직책, 존칭 등에 감탄사나 명령어 등이 혼합된 형태의 자연스런 음성 문장으로부터 다이얼링과 안내에 필요한 핵심어를 자동 추출하고 있다. 핵심 단어의 사용에는 자연성을 고려하여 문법적 제약을 최소한으로 두었으며, 각 단어 모델에 대해서는 음소의 갯수 더하기 $3{\sim}4$개의 상태 수와 3개 정도의 mixture component로써 좌우향 모델을, 묵음모델에 대해서는 2개 상태의 ergodic형 모델을 구성하였다. 인식에 있어서는 프레임 동기 One-Pass 비터비 알고리즘과 beam pruning을 채택하였으며, 인식에 사용된 어휘는 36개의 성명, 8개의 직위 및 존칭, 5개 정도의 호출어, 부탁을 나타내는 동사 및 그 활용이 10개 정도이다. 약 $3{\sim}6$개 정도의 단어로 구성된 문장을 실시간($1{\sim}3$초이내)에 인식하고, 약 98% 정도의 핵심어 인식 성능을 나타내고 있다.

  • PDF

Auto Frame Extraction Method for Video Cartooning System (동영상 카투닝 시스템을 위한 자동 프레임 추출 기법)

  • Kim, Dae-Jin;Koo, Ddeo-Ol-Ra
    • The Journal of the Korea Contents Association
    • /
    • v.11 no.12
    • /
    • pp.28-39
    • /
    • 2011
  • While the broadband multimedia technologies have been developing, the commercial market of digital contents has also been widely spreading. Most of all, digital cartoon market like internet cartoon has been rapidly large so video cartooning continuously has been researched because of lack and variety of cartoon. Until now, video cartooning system has been focused in non-photorealistic rendering and word balloon. But the meaningful frame extraction must take priority for cartooning system when applying in service. In this paper, we propose new automatic frame extraction method for video cartooning system. At frist, we separate video and audio from movie and extract features parameter like MFCC and ZCR from audio data. Audio signal is classified to speech, music and speech+music comparing with already trained audio data using GMM distributor. So we can set speech area. In the video case, we extract frame using general scene change detection method like histogram method and extract meaningful frames in the cartoon using face detection among the already extracted frames. After that, first of all existent face within speech area image transition frame extract automatically. Suitable frame about movie cartooning automatically extract that extraction image transition frame at continuable period of time domain.

Micturition training and Automatic feeding system based on Arduino (애완동물 배뇨 훈련 및 먹이 자동 공급 시스템)

  • Yun, hyun young;So, myung seob;Ahn, joon;Lee, boo hyung
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2015.10a
    • /
    • pp.167-170
    • /
    • 2015
  • In this paper, we propose the Micturition training and Automatic feeding system to enable busy modern people can grow pets more efficiently. This system will be able to operate a smart phone application with a Bluetooth, furthermore, by using the Wifi access the Internet from anywhere and to operate remotely. This system is divided micturition board feeding unit. micturition board consists of a water pressure sensor for detecting micturition and recorder module, speaker for voice output, feeding unit consists of two servo motor for auto feeding and Bluetooth sensor for remote control. Both micturition board and feeding unit produced Arduino board and C language-based Arduino sketch program, feeding unit was able to communicate with the library to support Bluetooth communication.

  • PDF

Statistical Analysis of Korean Phonological Variations Using a Grapheme-to-phoneme System (발음열 자동 생성기를 이용한 한국어 음운 변화 현상의 통계적 분석)

  • 이경님;정민화
    • The Journal of the Acoustical Society of Korea
    • /
    • v.21 no.7
    • /
    • pp.656-664
    • /
    • 2002
  • We present a statistical analysis of Korean phonological variations using a Grapheme-to-Phoneme (GPT) system. The GTP system used for experiments generates pronunciation variants by applying rules modeling obligatory and optional phonemic changes and allophonic changes. These rules are derived form morphophonological analysis and government standard pronunciation rules. The GTP system is optimized for continuous speech recognition by generating phonetic transcriptions for training and constructing a pronunciation dictionary for recognition. In this paper, we describe Korean phonological variations by analyzing the statistics of phonemic change rule applications for the 60,000 sentences in the Samsung PBS Speech DB. Our results show that the most frequently happening obligatory phonemic variations are in the order of liaison, tensification, aspirationalization, and nasalization of obstruent, and that the most frequently happening optional phonemic variations are in the order of initial consonant h-deletion, insertion of final consonant with the same place of articulation as the next consonants, and deletion of final consonant with the same place of articulation as the next consonant's, These statistics can be used for improving the performance of speech recognition systems.

Automatic Notification System of Expiration Date Based on YOLO and OCR algorithm for Blind Person (시각 장애우를 위한 YOLO와 OCR 알고리즘 기반의 유통기한 자동 알림 시스템)

  • Kim, Min-Soo;Moon, Mi-kyung;Han, Chang-hee
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2021.07a
    • /
    • pp.697-698
    • /
    • 2021
  • 본 논문에서는 시각 장애우의 식품 안전성 증진을 위해 광학 문자 인식 (optical character recognition, OCR) 및 실시간 객체 인식 (you only look once, YOLO) 알고리즘에 기반한 식품의 유통기한 자동 알림 시스템을 제안한다. 제안하는 시스템은 1) 스마트폰 카메라를 통해 실시간으로 입력되는 영상에서 YOLO 알고리즘을 활용하여 유통기한으로 예측되는 이미지 영역을 검출하고, 2) 검출된 영역에서 OCR 알고리즘을 활용하여 유통기한 데이터를 추출하며, 3) 최종 추출된 유통기한 데이터를 음성으로 변환하여 시각 장애우에게 전달한다. 개발된 시스템은 유통기한 정보를 추출해서 사용자에게 전달하기까지 평균 약 7초 이내의 빠른 응답 속도를 보였으며, 62.8%의 객체 인식 정확도와 93.6%의 문자 인식 정확도를 보였다. 이러한 결과들은 제안하는 시스템을 시각 장애우들이 실용적으로 활용할 수 있다는 가능성을 보여준다.

  • PDF