• Title/Summary/Keyword: 음성효율

Search Result 871, Processing Time 0.03 seconds

Implementation of P2P Communication Program for Multimedia Chatting Using VoIP Technology (VoIP 기술을 이용한 P2P 멀티미디어 채팅용 통신 프로그램의 구현)

  • Yoon, Hyun-Nim;Kim, Yang-Woo;Lee, Pil-Woo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11b
    • /
    • pp.1225-1228
    • /
    • 2002
  • 이제 인터넷은 우리 실생활에서 기본적인 도구로 이용하게 되었다. 이러한 변화로 기존 음성통화에서 사용되던 OFF-LINE 전화통신이 ON-LINE 상으로 빠르게 대체되어 가고 있다. 이에 따라 음성데이터들을 인터넷망을 통하여 효율적으로 전송하는 기술들이 연구되어 왔고, VoIP 기술은 이러한 시도들에 대한 구체적인 방법론이라고 할 수 있다. 본 논문에서는 문자채팅 및 VoIP 기술을 기반으로 일대일 직접 통화가 가능한 음성채팅 프로그램을 구현하였다. 본 논문은 유무선 통합메시징시스템(UMS)의 기술 진척에 기여할 수 있다.

  • PDF

A Study on Efficient Scheduling Algorithm for QoS over VoIP (VoIP망에서 QoS 보장을 위한 효율적인 스케줄링 알고리즘에 관한 연구)

  • Park, Seung-Jun;Lee, Young-Han;Kang, Su-Hun;Lee, Jae-Hwoon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2000.10b
    • /
    • pp.1025-1028
    • /
    • 2000
  • 본 논문에서는 VoIP(Voice over IP)의 광대역 네트워크에서 QoS(Quality of Service)를 지원하기 위한 방안을 스케줄링을 중심으로 하여 연구하였다. 이를 위하여 라우터 중심의 포워딩(forwarding)에 있어서 재생손실(Play Out Loss)이 발생하는 버퍼에 대해서는 음성통신을 제외한 일반 데이터에 할당을 하고 들어오는 음성 데이터에 대해서는 토큰 할당 방식으로 자원을 할당하는 모델에 대해 제안하였다. 또한 음성 데이터에 대해서는 폐기에 대한 방법대신 거절 개념을 포함시켜 이를 EF(Expedited Forwarding)모델과 시뮬레이션을 통하여 분석을 하였다.

  • PDF

A Study on the Speech Recognition Moduleas Design Using HMM Speech Recognition Algorithm (HMM(Hidden Markov Model) 음성인식 알고리즘을 이용한 효율적인 음성인식 모듈 개발 설계에 관한 연구)

  • 김정훈;류홍석;강재명;강성인;이상배
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2002.12a
    • /
    • pp.337-340
    • /
    • 2002
  • 본 논문에서는 휠체어 시스템에 화자 독립 고립단어 인식을 위한 임베디드 시스템 설계에 관한 내용을 서술한다. 실제 환경에서는 잡음이 포함되어 있어 인식률을 저하시키므로, 잡음을 제거하는 방식 중 가장 간단한 방식인 스펙트럼 차감법(Spectral subtraction method)을 사용하여 잡음을 제거했다 전처리 단계에서는 12차 LPC&Cepstrum 방식을 사용했고, 인식 알고리즘은 DHMM (Discrete Hidden Markov Model)을 전반부 인식기로 사용했다. 이 알고리즘을 적용하기 위해서는 데이터 간소화를 위해 벡터양자화(Vector Quantization) 처리가 전제되어야한다 또한 인식알고리즘은 인식률을 향상을 위해 후처리 인식기로 신경망(MLP:Multi-layer Perceptron)을 통해서 인식률을 향상시켰다 화자 독립 시스템에 맞는 인식 단어의 구성은 총 7개단어로 남녀 총 25명 목소리로 구성하였다. 그리고 하드웨어 구성은 32-bits floating point 방식인 TMS320C32를 적용했고, 메모리 부분은 4Mbyte로 설계를 했으며, 메인보드의 설계는 현재 완성 단계에 있다.

A Decoding Program of MPEG TS Packet and A Restoring Program of Data Information (MPEG TS 패킷 분류 프로그램과 데이터 정보의 복원 프로그램)

  • Jung, Myung-Su;Sonh, Seung-Il
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • v.9 no.1
    • /
    • pp.646-650
    • /
    • 2005
  • 요즘 아날로그 방송에서 디지털 방송시대로 변화함에 따라 디지털 방송기술이 많이 발전되었다. 디지털 방송은 방송국으로부터 만들어지는 영상, 음성, 데이터 스트림들이 MPEG을 통해 효율적으로 압축하고 동기식으로 패킷화되어서 MPEG TS 패킷형식으로 서비스 이용자에게 위성 또는 지상파를 통해 전송되어진다. 방송되어지는 데이터 정보는 물론 그 외의 비관련 데이터도 제공되어짐으로써 서비스 이용범위도 많이 늘어나고 특히 기존의 영상과 음성위주의 방송과는 달리 사업자와 이용자간의 쌍방향으로 데이터를 송수신할 수 있는 기술이 고부가가치 사업으로 대두되고 있다. 디지털 방송을 수신해서 보기 위해서는 튜너로부터 수신되어 디지털화된 MPEG TS 패킷들을 분류해주는 과정이 필요하다. 본 연구에서는 실제 디지털 방송되었던 패킷 파일을 가지고 분류하였다. 영상 스트림과 음성 스트림을 분류하고 데이터 스트림을 분리하였다. 그리고 데이터 방송 규격의 데이터 스트림 파일을 별도로 입력하여 데이터를 분류하였다. 프로그램은 Microsoft visual c++6.0을 사용하여 구현하였다.

  • PDF

Design and Verification of Gateway for CC and SIP in Next Generation Mobile Communication Network (차세대 이동통신망에서 CC와 SIP 연동 게이트웨이의 설계 및 검증)

  • Kim, Hyeong-Kuk;Lee, Jeong-Jun;Jung, Woon-Young;Kim, Jeong-Hoon;Park, Seok-Cheon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.04b
    • /
    • pp.1353-1356
    • /
    • 2002
  • 차세대 이동통신망(IMT-2000 : International Mobile Telecommunication-2000)에서는 기존 통신망에서 제공하는 기능을 그대로 제공하면서 여러 향상된 기능을 제공하는 형태로 개발되고 있으며 기존 망 구조를 적절히 수용하면서 현재 제공하고 있는 음성 서비스를 수용할 수 있는 경제적이고 효율적인 통신망의 구축이 필요하다. 그러므로 음성과 데이터의 통합 및 서비스를 제공하는 IP 망에서의 음성 서비스와 차세대 이동통신망과의 연동게이트웨이 개발은 필수적이다. 따라서 본 논문에서는 차세대 이동통신망의 CC(Call Control)와 IP 망의 SIP(Session Initiation Protocol)를 이용한 연동 프로토콜을 설계를 하고 검증하였다.

  • PDF

Defense Techniques of PT-DoS Attacks By Delay Access Control on Mobile PSCN Environment (지연접속 제어를 통한 모바일 PSCN 환경의 PT-DoS 공격에 대한 방어 기법)

  • Joo, Eun-Young
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.11a
    • /
    • pp.910-913
    • /
    • 2012
  • 통신기술의 발달과 스마트 폰의 급격한 보급으로 인하여 모바일 환경은 음성 데이터 기반의 환경에서 인터넷 데이터 기반의 환경으로 급격히 변화되었다. 이로 인하여 음성 서비스 처리 위주의 음성 데이터 기반 모바일 환경은 대용량 동영상 서비스, 인터넷, 메신저 등의 유선 네트워크 환경과 같은 다양한 서비스가 요구되는 환경으로 변화되었다. 이러한 환경 변화로 인하여 모바일 네트워크는 무선 네트워크상의 취약점 뿐 만 아니라 유선환경의 네트워크 취약점을 동시에 지니는 환경으로 변화되었고, 이로 인한 다양한 새로운 취약점들이 부각되기 시작하였다. 본 논문에서는 이와 같이 새롭게 부각되고 있는 모바일 Packet Switched Core Network(PSCN) 환경에서 Service Provider(SP)의 Service Recover로 인해 유발되는 Paging Table Denial of Service(PT-DoS)를 효율적으로 제어하기 위한 Delay Access Control(DAC) 기반의 QoS를 이용한 방법을 설계/구현하였다. 그리고 실험을 통해, PT-DoS를 차단하여 PSCN 공격을 미연에 방지하는 효과를 확인하였다.

Secure Internet Phone Using IPSec (IPSec을 이용한 음성 보안 시스템)

  • 홍기훈;임범진;이상윤;정수환
    • Journal of the Korea Institute of Information Security & Cryptology
    • /
    • v.11 no.2
    • /
    • pp.67-72
    • /
    • 2001
  • An efficient encryption mechanism for transmitting voice packets on the Internet was proposed in this study. The VPN approach of encrypting all the packets through a gateway increases delay and delay jitter that may degrade the quality of service (QoS) in real-time communications. A user-controlled secure Internet phone, therefore. was designed and implemented. The secure phone enables the user to apply encryption to his own call when necessary, and reduces security overheads on the gateway.

Subtitle Highlighting System for Video Streaming using Speech Interface STT (Speech to Text) (음성 인터페이스 STT(Speech to Text)를 활용한 동영상 스트리밍 자막 강조 시스템)

  • Lee, Kang-Chan;Cho, Dae-Soo
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2021.07a
    • /
    • pp.567-568
    • /
    • 2021
  • 자막은 자막을 볼 수 있는 모든 사람들의 정보전달, 의사소통을 할 수 있는 유용한 도구로 사용 되고 있지만 자막은 평범한 텍스트로 있어 자막에서 강조된 부분, 감정 등을 전달 할 수 없다는 단점을 가지고 있다. 그러므로 청각 장애인들은 해당 컨텐츠의 감정, 강조 되는 부분을 알 수 없어 대화의 숨은 의미가 다른 방향으로 이해 할 수 있다는 위험성을 가지고 있다. 본 논문에서는 음성을 텍스트로 변환하는 STT(Speech To Text)를 이용하여 동영상 스트리밍 서비스를 실시간으로 음성을 텍스트로 변환과 동시에 강조하는 부분까지 개발하여 청각장애인 입장에서 기존 자막보다 효율적인 시각적 효과를 주는 미디어 접근을 위한 동영상 스트리밍 자막 서비스를 개발하고자 한다.

  • PDF

A performance evaluation study of a deep learning-based voice synthesis technique using Mel-Conceptual Distortion (MCD). (멜-셉스트럴 왜곡(MCD)를 활용한 딥러닝 기반 목소리 합성 기술의 성능 평가 연구)

  • Jaesang Han;Yunseo Kang;Sangwoo Na;Hayeon Lee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.05a
    • /
    • pp.488-489
    • /
    • 2023
  • 노래 음성 변환(Singing Voice Conversion, SVC)은 오디오 처리 분야에서 최근 활발히 연구되는 분야 중 하나로, 원래의 멜로디와 가사를 유지하면서 소스 가수의 노래 음성을 대상 가수의 음성으로 변환하는 것을 목표로 한다. 본 논문에서는 딥러닝 기반 SVC 모델을 중심으로 멜 셉스트럴 왜곡 지표를 활용해 모델 간 성능 평가를 진행한다. 이를 통해 엔터테인먼트, 교육 등 분야에서 효율적인 SVC 모델을 찾아 활용할 수 있을 것이다.

A Study on the MAC Protocol to Reduce the Delay Time in Aeronautical Mobile Communication (항공이동통신에서의 지연 시간 감소를 위한 MAC 프로토콜에 대한 연구)

  • Kim, Yong Joong;Kang, Seok Yub;Lim, Hyeong Yeol;Park, Hyo Dal
    • Journal of Advanced Navigation Technology
    • /
    • v.6 no.1
    • /
    • pp.1-9
    • /
    • 2002
  • 본 논문은 현재 무선 LAN 환경에서 적용되고 있는 매체접근제어 프로토콜인 IEEE 802.11 CSMA/CA를 이용함으로써, 음성 위주의 항공이동통신에서 음성과 데이터 채널을 통합하여 사용하도록 하고 있다. 또한, 표준으로 제정되어 있는 기존의 CSMA/CA 매체접근제어 프로토콜에 대한 이해를 바탕으로 성능 개선 방안을 제안하였으며, 이를 바탕으로 채널 효율을 향상시켰다. IEEE 802.11 매체접근제어(MAC, Medium Access Control) 프로토콜은 데이터 유형에 따라 채널을 두 개의 구간(PCF와 DCF 구간)으로 나누어 전송하도록 하고 있다. 본 논문에서는, 데이터 유형별로 적용되는 구간 중, DCF 구간에서의 패킷간의 충돌 가능성을 줄임으로써 데이터 전송 효율을 높이는데 주안점을 두고 있다. 제안 방안으로는 경쟁 구간에서의 전송에서 충돌에 따른 손실을 보완할 수 있도록 Wireless Window Protocol(이하, WWP)을 적용한 후 전송 과정을 제어하였다. Hidden 터미널의 영향이 적으므로 가시권내 통신에 적합한 기존의 2-Way CSMA/CA 프로토콜을 항공통신에 적용하여 상태 천이 과정을 5개에서 6개로 세분화하였고, 주어진 확률에 의하여 나누어진 두 개의 그룹별로 상태 천이 과정을 다르게 적용하였다. 따라서, 채널이 한 항공기에 의해 점유되는 PCF를 제외한, DCF 구간에서의 데이터 전송 효율을 높일 수 있었다. 시뮬레이션은 채널 대역폭과 패킷 크기 등을 파라미터 값으로 하여 수행하였으며, 시뮬레이션 결과 CSMA/CA에 비해 새로 제안한 알고리즘이 데이터 전송 과정에서 발생하는 충돌 가능성을 감소시킴으로써 성능이 향상됨을 알 수 있었다.

  • PDF