• Title/Summary/Keyword: 녹음기능

Search Result 70, Processing Time 0.026 seconds

The Study on the Integration method using TDNN and HMM for Korean Digit Speech Recognition (한국어 숫자음 인식을 위한 TDNN과 HMM의 결합방법에 관한 연구)

  • 서원택;조범준
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2001.11a
    • /
    • pp.85-90
    • /
    • 2001
  • 본 논문에서는 한국어 숫자음 인식을 위한 시간 지연 신경망(Time delay neural network-TDNN)과 은닉 마르코프 모델(Midden Markov Model-HMM)의 결합 방법에 대해서 연구하였고 그 성능을 측정하였으며, 기존의 시스템과 비교 평가하였다. 이 알고리즘은 TDNN과 HMM의 구조적인 결합에 기반하고 있는데 TDNN의 두번째 은닉층의 출력이 HMM의 입력으로 들어가도록 구성되었다. 그러면 HMM은 TDNN의 출력으로 각 단어에 대해서 훈련과정을 거치게 된다. 이렇게 구성된 인식알고리즘은 TDNN의 뛰어난 단기간(Short-time)분류 기능과 HMM의 시간 정렬(time-warping) 능력을 동시에 갖게 된다. 위의 과정을 컴퓨터 시뮬레이션을 이용하여 구현하였으며, 한사람의 음성을 녹음하여 실험한 결과 기존의 TDNN만으로 만들어진 인식기보다는 3%, HMM만으로 구성된 인식기 보다는 5.7% 나은 성능을 얻을 수 있었다.

  • PDF

REST based Call/Messaging Open API for Telecommunication Services (통신 서비스를 위한 REST 기반 통화/메시징 Open API)

  • Jung, Soon-Chul;Kang, Mi-Kyung;Choi, Dae-Woo
    • 한국정보통신설비학회:학술대회논문집
    • /
    • 2008.08a
    • /
    • pp.521-524
    • /
    • 2008
  • 기존 지능망 서비스들이 포화 상태에 이르게 됨에 따라 수익이 나는 새로운 서비스를 개발하는 것이 점점 더 어려워지고 있다. 요즈음 전통적인 전화망과 인터넷의 결합이 새로운 경향으로 나타나고 있다. PC와 같은 인터넷 단말은 전화망의 전통적인 단말보다 저장 장치 및 유저 인터페이스 면에서 더욱 더 강력한 능력을 가지고 있다. IT 개발자들은 전화 분야의 전문 지식을 갖고 있지 않아도 Parlay API를 사용하면 새로운 통신 서비스를 쉽게 만들수 있다. HTTP 상의 SOAP을 사용하여 쉽게 두 컴퓨터 노드간의 통신이 가능하게 할 수 있더라도 일반적인 개발자는 현란한 XML 포맷 때문에 SOAP 메시지를 처리하는데 어려움을 느낀다. REST 기반 API는 이러한 것의 좋은 대체재가 될 수 있는데, 추가적인 프로토콜 층이 없이 HTTP 층만 있기 때문이다. 본 논문에서는 통화 및 메시징 서비스를 만들기 위한 REST 기반의 Open APl 를 소개한다. 제안되는 API는 클릭투콜, 미니 컨퍼런스, 통화 녹음, 주문형 오디오 재생, 단문 메시징 및 음성 메시징 기능을 제공한다. 제안되는 API 특징은 전화망과 인터넷의 컨버전스의 강력함을 보여준다.

  • PDF

디지털 오디오의 인티넷 방송 서비스를 위한 저작물 식별 코드 은닉 기술$^{(1)}$

  • 신승원;김종원;최종욱
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2004.05a
    • /
    • pp.103-106
    • /
    • 2004
  • 본 논문은 인터넷을 이용한 방송 서비스에서 저작권 보호 및 저작물 식별을 위한 고유 식별 정보(unique identification)를 삽입, 추출하는 기술을 제안한다. 인터넷을 통한 방송 서비스의 활성화를 위해서는 저작권의 보호와 저작물의 불법 사용 방지, 저작물에 대한 저작권료 지불, 그리고 차후에 불법 사용자의 적발 등을 할 수 있는 기술이 필요하다. 본 논문에서 제안하는 기술은 사용자 관련 정보와 음악의 식별 정보를 저작물에 삽입하여 다운로드 받은 음악 파일이나 또는 청취 중에 녹음한 음악 파일의 불법 복제를 막는 방법이다. 저작물을 불법으로 유통시킬 경우에 유통된 음악 파일에서 삽입된 식별코드를 추출하여 음악 파일의 불법 유통경로를 추적하여 불법 사용자를 적발할 수 있도록 하였다. 이러한 기능을 만족시키기 위해서 인터넷 서비스에서 널리 이용되는 MP3, AAC, WMA 등과 같은 손실 압축을 거친 이후에도 삽입된 워터마크를 검출할 수 있으며, 일반 사용자들이 손쉽게 접할 수 있는 섞어 신호처리에도 강인한 특성을 갖는 기술을 제안한다.

  • PDF

Development of HTML5 based Photo Album/Diary Smartphone Application (HTML5를 활용한 포토앨범/다이어리 스마트폰 어플리케이션 개발)

  • Kim, You-Mi;Seo, Ji-Eun;Oh, Sechang;Hwang, Jihwan;Choi, Min
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.11a
    • /
    • pp.421-423
    • /
    • 2012
  • 본 연구에서 개발한 포토앨범/다이어리 어플리케이션은 아기의 성장과정을 사진/음성으로 기록할 수 있는 다이어리 기능을 제공한다. 또한, 아기와 관련된 각종 기념일(생일, 예방접종일 등)에 대한 일정을 관리할 수 있다. 음성녹음도 지원하기 때문에 아기와 부모의 대화, 그리고 부모의 음성일기 등을 빠짐없이 기록할 수 있다. HTML5기반 하이브리드 애플리케이션(Hybrid Application)은 다중 플랫폼을 지원하기 때문에 한번 개발하면 여러 플랫폼에서 사용할 수 있으므로 개발비용을 절약할 수 있을 뿐더러, HTML5 Device API를 사용함으로써 네이티브 앱과 동일하게 디바이스를 제어할 수 있다. 본 연구에서는 포토앨범/다이어리 스마트폰 애플리케이션을 HTML5 개발하여 아이폰 iOS와 안드로이드를 지원하며, 다양한 스마트폰 센서/장치에 접근할 수 있도록 개발되었다.

다공성 기질 생태 플랫폼을 이용한 해안 및 해저 환경 복원 방안

  • Lee, Tae-Hyeong;O, Yeong-Tak;Gang, Mu-Seok;Lee, Jung-U
    • Proceedings of the Korean Institute of Navigation and Port Research Conference
    • /
    • 2019.11a
    • /
    • pp.147-149
    • /
    • 2019
  • 해수 온도의 상승과 해양 오염의 증가로 근래 국내 해안에서도 갯녹음이 확산되면서 바다숲이 축소되고 있다. 특히, 온난류의 유입에 의한 무절 석회조류의 난입과 해수에 함유 농도가 증가한 칼슘이 석출되고 해저 암반을 뒤덮어 해조류의 포자 활착 공간을 없애는 백화현상이 확산되면서 바다의 사막화 현상이 가속화되고 있다. 본 연구에서는 해조류의 포자가 빠르게 활착하여 안전하게 생장할 수 있는 공간을 제공하기 위한 새로운 방안으로, 먼저 육상에서 모판의 기능을 제공하여 해조류의 포자를 착상하여 성장시킨 후 해저로 이식하는 것으로 바다숲과 해안의 환경을 효과적으로 복원하기 위한 방안으로 다공성 기질 생태 플랫폼을 디자인하고 이의 특성 및 활용 방안을 제시하였다.

  • PDF

Speech Recognition Website for Korean Pronunciation Training - Baleum (한국어 발음 훈련을 위한 음성 인식 웹 사이트 - 바름)

  • Junghye Min;Gyo Jin Kang;In Gi Kim
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2023.07a
    • /
    • pp.29-32
    • /
    • 2023
  • 본 논문에서는 외국인과 발음에 어려움을 겪고 있는 한국인들을 대상으로 음성 녹음을 진행하여 점수를 반환받는 웹 사이트를 소개한다. 이 웹 사이트의 목적은 사용자들의 발음 향상을 돕는 것이다. 음성 인식 API와 발음 평가 API를 사용하여 사용자의 발음을 정확하게 평가하고 피드백을 제공함으로써, 외국어 학습자와 발음에 어려움을 겪는 한국인들이 보다 원활하게 의사소통할 수 있도록 돕는다. 향후 연구로는 이 시스템의 사용자들에게 학습 성취에 대한 동기 부여를 하는 기능을 추가해 학습 효과를 높이도록 개선할 것이다.

  • PDF

Remotely Controllable Smart Mobile System Using Arduino and Raspberry Pi for Infants

  • Park, Hyun-Wook;Shin, Young-Weon;Kim, Jin-Yeob;Kong, Ki-Sok
    • Journal of the Korea Society of Computer and Information
    • /
    • v.25 no.11
    • /
    • pp.17-25
    • /
    • 2020
  • In this paper, we deal with a system that provides temperature, humidity and fine dust data around infants to parents through Arduino and Raspberry Pi. It controls the operation of the mobiles remotely through applications. Android applications can perform the following functions. First, the infant's surrounding temperature, humidity and fine dust data are received. Second, mobile controls the smart mobile remotely. Third, recording and playing the voices of parents and enhancing the convenience of parenting. Through the experiment of measuring the operating time of the remote control module, it was confirmed that the application can quickly access the system. Existing products on the market do not provide environmental information around the infants and application that has various functions. The system covered in this paper is expected to improve child-rearing convenience by providing parents environmental information around infants, remotely controllable function and convenient functions of the application.

A Design and Implementation of Speech Recognition and Synthetic Application for Hearing-Impairment

  • Kim, Woo-Lin;Ham, Hye-Won;Yun, Sang-Un;Lee, Won Joo
    • Journal of the Korea Society of Computer and Information
    • /
    • v.26 no.12
    • /
    • pp.105-110
    • /
    • 2021
  • In this paper, we design and implement an Android mobile application that helps hearing impaired people communicate based on STT(Speech-to-Text) and TTS(Text-to-Speech) APIs and accelerometer sensor of a smartphone. This application provides the ability to record what the hearing-Impairment person's interlocutor is saying with a microphone, convert it to text using the STT API, and display it to the hearing-Impairment person. In addition. In addition, when a hearing-impaired person inputs a text using the TTS API, it is converted into voice and told to the interlocutor. When a hearing-impaired person shakes their smartphone, an accelerometer based background service function is provided to run the application. The application implemented in this paper provides a function that allows hearing impaired people to communicate easily with other people when communicating with others without using sign language as a video call.

Development of Smart Application for English Speaking (영어 말하기 능력 신장을 위한 스마트 앱 개발)

  • Ryu, Miyoung;Han, Seonkwan
    • Journal of The Korean Association of Information Education
    • /
    • v.20 no.4
    • /
    • pp.367-374
    • /
    • 2016
  • In this study, we proposed the development of smart application for English speaking effectively. First, to develop English learning application, we applied the TTS feature to record your own sounds and learning theory repeated listening and speaking that is the basis of English learning. To analyze the effectiveness of the application, we applied a lesson to elementary students for 4 months. In the test result, we found that all students have advanced to the English speaking ability and the test results of the affective factors showed a positive response to most students.

Development of the Remote-Educating Communication Tool using DCOM Voice Module (DCOM 음성 모듈을 이용한 원격 대화식 학습 도구의 개발)

  • Jang, Seung-Ju
    • The KIPS Transactions:PartA
    • /
    • v.10A no.2
    • /
    • pp.173-180
    • /
    • 2003
  • This paper proposes Remote Educating Communication Tool (RECT) that allows students and teachers to communicate using Web-based Bulletin Board System. The distance teaching using DCOM (Distributed Component Object Model) voice module is used to enhance academic accomplishments for students in computer class. The DCOM voice module to be used in distance learning is designed, implemented and applied to teachers and students in the computer class in order to measure and analyze academic results. The RECT server provides Q&A sessions between students and teachers in the BBS using recording and playback functions. The client RECT includes recording and playback functions. The client module of RECT receives and uses DCOM module. When recording, the client transmits voice files with the recorded content to the server.