• 제목/요약/키워드: 음성망

검색결과 877건 처리시간 0.027초

Kalman-Filter를 이용한 음성트래픽 예측 및 회선 교환 격자 구조망 성능 평가 (Voice Traffic Estimation using Kalman-filtering and Performance Evaluation of a Circuit Switched Network with Grid Topology)

  • 문경덕;이정규
    • 한국통신학회논문지
    • /
    • 제17권5호
    • /
    • pp.452-459
    • /
    • 1992
  • 본 논문에서는 kalman-filter 방법을 이용하여 향후 수년간의 음성 트래픽 양을 예측하고, 이 값들을 이용하여 격자 구조로 구성된 회선 교환망에서의 성능을 평가하였다. Kalman-filter 방법은 특적 오차와 모델링 오차를 고려해서 시스템의 상태를 예측하기 때문에 다른 예측 방법들보다 정확하게 시스템의 상태를 예측할 수 있다. 격자 구조 회선 교환망은 우회 경로가 존재하므로 노드들이 다른 구조로 구성되어 있는 통신망보다 높은 신뢰도를 가진다. 본 논문에서는 향 후 수 년간의 예측된 음성 통화량을 이용하여, 회선 교환망 성능 평각의 근간이 되는 호차단(call blocking)확률을 구했다.

  • PDF

드론 소음 환경에서 심층 신경망 기반 음성 향상 기법 적용에 관한 연구 (A study on deep neural speech enhancement in drone noise environment)

  • 김지민;정재희;여찬은;김우일
    • 한국음향학회지
    • /
    • 제41권3호
    • /
    • pp.342-350
    • /
    • 2022
  • 본 논문에서는 재난 환경과 같은 환경에서의 음성 처리를 위해 실제 드론 소음 데이터를 수집하여 오염 음성 데이터베이스를 구축하고 음성 향상 기법인 스펙트럼 차감법과 심층 신경망을 이용한 마스크 기반 음성 향상 기법을 적용하여 성능을 평가한다. 기존의 심층 신경망 기반의 음성 향상 모델인 VoiceFilter(VF)의 성능 향상을 위해 Self-Attention 연산을 적용하고 추정한 잡음 정보를 Attention 모델의 입력으로 이용한다. 기존 VF 모델 기법과 비교하여 Source to Distortion Ratio(SDR), Perceptual Evaluation of Speech Quality(PESQ), Short-Time Objective Intelligibility(STOI)에 대해 각각 3.77 %, 1.66 %, 0.32 % 향상된 결과를 나타낸다. 인터넷에서 수집한 오염 음성 데이터를 75 % 혼합하여 훈련한 경우, 실제 드론 소음만을 사용한 경우에 비해 상대적인 성능 하락률 평균이 SDR, PESQ, STOI에 대해 각각 3.18 %, 2.79 %, 0.96 %를 나타낸다. 이는 실제 데이터를 취득하기 어려운 환경에서 실제 데이터와 유사한 데이터를 수집하여 음성 향상을 위한 모델 훈련에 효과적으로 활용할 수 있음을 확인해준다.

청크 기반 시계열 음성의 감정 인식 연구 (A Study on Emotion Recognition of Chunk-Based Time Series Speech)

  • 신현삼;홍준기;홍성찬
    • 인터넷정보학회논문지
    • /
    • 제24권2호
    • /
    • pp.11-18
    • /
    • 2023
  • 최근 음성 감정 인식(Speech Emotion Recognition, SER)분야는 음성 특징과 모델링을 활용하여 인식률을 개선하기 위한 많은 연구가 진행되고 있다. 기존 음성 감정 인식의 정확도를 높이기 위한 모델링 연구 이외에도 음성 특징을 다양한 방법으로 활용하는 연구들이 진행되고 있다. 본 논문에서는 음성 감정이 시간 흐름과 연관이 있음을 착안하여 시계열 방식으로 음성파일을 시간 구간별로 분리한다. 파일 분리 이후, 음성 특징인 Mel, Chroma, zero-crossing rate (ZCR), root mean square (RMS), mel-frequency cepastral coefficients (MFCC)를 추출하여서 순차적 데이터 처리에 사용하는 순환형 신경망 모델에 적용하여 음성 데이터에서 감정을 분류하는 모델을 제안한다. 제안한 모델은 librosa를 사용하여 음성 특징들을 모든 파일에서 추출하여, 신경망 모델에 적용하였다. 시뮬레이션은 영어 데이터 셋인 Interactive Emotional Dyadic Motion Capture (IEMOCAP)을 이용하여 recurrent neural network (RNN), long short-term memory (LSTM) and gated recurrent unit(GRU)의 모델들의 성능을 비교 및 분석하였다.

전자상거래를 위한 음성 숫자 인식 알고리즘

  • 강홍석;최두현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.523-525
    • /
    • 2000
  • 최근 인터넷의 보급이 대중화되면서 전자상거래 시장이 급속도로 커지고 있다. 또한 무선 이동장비의 보급이 증가하고 무선장비의 인터넷 접속 지원이 보편화되면서 기존의 유선망 전자상거래 개념이 무선망에R지 확장되고 이다. 무선 단말기를 전자상거래에 이용하기 위해서는 음성인식에 관한 연구가 절대적이다. 본 논문에서는 전자상거래 응용에 꼭 필요한 음성 숫자인식 시스템에 대해 다루었다. 제안한 알고리즘은 입력 음성 신호를 주파수와 진폭을 이용하여 몇 개의 그룹으로 나눈 후, 그 그룹 내에서 패턴 비교를 통해 숫자 인식 확률을 높이는 다단계 인식 방법을 제안하고자 한다. 개발된 시스템은 대부분의 개인 정보를 담고 있는 숫자 정보의 음성 입력이 가능하게 하므로 많은 전자상거래 시장에 응용할 수 있을 것이다.

  • PDF

신경회로망을 이용한 화자종속 음성인식 성능에 관한 연구 (A study of speaker dependent speech recognition using neural network)

  • 윤지원;이종수
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 춘계 학술대회 학술발표 논문집
    • /
    • pp.153-156
    • /
    • 2003
  • 본 연구는 화자종속 소어휘 음성인식의 성능을 개선하는 데 그 목적이 있다. 인식에 사용될 음성의 특징을 얻기 위해 Winer 필터와 LPC&Cepstrum을 이용하여 프레임 당 12차 패턴을 추출하였다. 추출된 특징패턴을 인식하는 인식부는 특히 소어휘 음성인식에 우수한 성능을 보이는 기존의 역전파 신경회로망(Backpropagation Neural Network)에 인식율 개선을 위하여 퍼지추론시스템을 결합한 형태로 구현되었다. 실험결과 신경망만을 사용한 경우에 비하여 인식율이 향상됨을 연구하였다.

  • PDF

강화학습을 적용한 EVRC 기반의 음성향상기법에 대한 연구 (A Study on EVRC-based Speech Enhancement by Reinforcement Learning)

  • 김소현;장준혁
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.340-341
    • /
    • 2018
  • 본 논문에서는 음성인식의 성능을 높이기 위해 잡음을 제거하여 음성을 향상시킬 목적으로 심화신경망 기반의 강화학습을 적용한 음성향상 기법을 제안한다. EVRC를 통해 잡음을 제거한 후 강화학습을 적용하여 성능을 비교하며 기존의 음성향상 기법보다 향상된 성능을 가지는 모델을 구현하고자 한다.

음성정보기술 국제 표준화 동향

  • 홍기형
    • 정보처리학회지
    • /
    • 제11권2호
    • /
    • pp.33-41
    • /
    • 2004
  • 언제, 어디서, 어떤 장치를 사용하더라도 정보의 검색이나 접근이 가능해지는 유비쿼터스 환경이 가시화되고 있어, 음성을 사용한 사용자 인터페이스의 중요성이 증대하고 있다. 음성인식, 합성, 화자인증 등 음성 등의 음성처리엔진의 기술 수준이 상용화 단계에 접어들고, 이동 중과 같이 모니터 등 시각적 인터페이스의 사용이 용이하지 않은 상황에서도 정보 접근기 요구가 증대함에 따라 음성은 정보시스템 의 중요한 인터페이스로 자리매김 하고 있다. 음성정보기술은 인간의 가장 자연스러운 상호작용 수단인 음성을 이용하여. 시스템에 명령을 내리고, 시스템의 명령 수행 결과를 음성으로 전달하는 음성을 이용한 정보 시스템 인터페이스를 구현하기 위 한 기술을 의미한다. 또한, 음성정보시스템은 음성을 이용한 사용자인터페이스가 가능한 정보시스템을 뜻하며, (그림 1)과 같이 음성처리엔진, 사용자 접속망, 사용자 프로파일 및 음성응용시스템으로 구성된다.(중략)

  • PDF

시뮬레이션 툴을 활용한 무선망 최적화/엔지니어링 작업 프로세스 (Network Optimization/Engineering Process with Simulation Tool)

  • 전현철
    • 한국정보통신설비학회:학술대회논문집
    • /
    • 한국정보통신설비학회 2004년도 하계학술대회
    • /
    • pp.169-172
    • /
    • 2004
  • 음성 위주의 이동통신 초기 시스템에서부터 데이터 서비스를 제공하는 현재의 시스템에 이르기까지 이동통신 망이 진화해왔듯 무선망을 설계하거나 최적화하기 위한 전파환경 예측 시뮬레이션 툴 또한 발전을 거듭해왔다. 이는 망의 진화로 인해 무선망 설계/관리/최적화 기법이 복잡/다양해지고 그래서 단순한 수작업이나 현장 기술자의 경험만으로는 명쾌한 해답을 내놓기 곤란한 상황이 많아짐을 의미한다. 본 논문에서는 시뮬레이션 툴을 활용한 무선망최적화/엔지니어링 작업 프로세스를 체계적으로 정리하여 소개함으로써 현장 기술자가 보다 효율적이며 경제적인 무선망 최적화 기법에 익숙해질 수 있는 방법론을 제시한다.

  • PDF

VPN 기능을 가진 음성 보안용 IP-PBX 개발 (Development of the IP-PBX with VPN function for voice security)

  • 김삼택
    • 한국인터넷방송통신학회논문지
    • /
    • 제10권6호
    • /
    • pp.63-69
    • /
    • 2010
  • 오늘날 VoIP 기반의 인터넷 전화 서비스는 일반 사용자의 폭발적인 인기에 따라 사용자의 다양한 요구사항이 증가하고 있는데. 그중 가장 중요한 것은 전화서비스의 음성 보안이다. 음성 통화는 사용 목적에 따라 비밀을 유지하여야 되는데 인터넷 전화는 인터넷의 특성상 하나의 망에서 일반 대중들이 동시에 사용할 수 있는 점 때문에 항상 해커들에 의해서 도청에 무방비 상태로 놓여 있을 수 있다. 따라서 본 논문에서는 인터넷 전화기의 도청을 방지 할 수 있도록 SIP를 기반으로 하고 가상사설망의 IPsec을 적용하여 음성데이터의 전송에 터널링 기법을 사용함으로 사용자 인증과 음성 데이터의 기밀성이 강화된 VPN IP-PBX를 개발하고 인터넷 교환기의 성능을 측정하였다. 본 음성 보안용 IP-PBX는 문자 메시지 전송, 게이트웨이 기능 등 다양한 부가 서비스를 갖고 소프트폰과 연동 가능하다.

음성/데이터 통합망 설계를 위한 이행 단계별 성능평가 (Performance Evaluations of the Computer Networks for the Voice/Data Coexisted Network Design)

  • 엄기복;여현
    • 한국정보통신학회논문지
    • /
    • 제7권4호
    • /
    • pp.678-683
    • /
    • 2003
  • 본 연구에서는 컴퓨터 통신망에서 음성/데이터 통합을 위하여 이행단계별 성능평가를 실시하고 최적의 모델을 제안하였다. 먼저 기존에 있는 PBX를 데이터 네트워크에서 수용할 경우3.3ms에서 3.5ms 지연이 발생하였고, IP를 이용한 음성/데이터 네트워크 통합시 0.7ms에서 0.9ms지연이 발생하였다. IP+/ATM를 이용한 음성/데이터 네트워크에서는 0.26ms에서 0.32ms 지연이 발생하였고, 일부 지역 네트워크에 장애를 발생 할 경우 IGRP 라우팅 프로토콜은 1.1ms-1.3ms, OSPF 라우팅 프로토콜은 0.9ms-1.2ms의 지연이 발생하였다. 본 연구에서는 컴퓨터 통신망에서 음성/데이터 통합을 하기 위해서는 음성/데이터 통합망은 IP+ATM를 이용하고, 계층적인 통신망에서 사용하는 라우팅 프로토콜은 OSPF를 사용할 때 최적의 성능을 보장 받을 수 있음을 확인하였다.