• 제목/요약/키워드: 음성신호

검색결과 1,513건 처리시간 0.036초

음성과 소리의 할당 방법 : 가전제품 UI 를 중심으로 (A Method of Arrangement of Voice and Sound : For User Interface of Domestic Appliance)

  • 홍지영;채행석;이승룡;박영현;김준희;류형수;김종완;한광희
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2007년도 학술대회 2부
    • /
    • pp.478-483
    • /
    • 2007
  • 본 연구는 가전제품 사용자 인터페이스에서 음성 신호와 청각 신호의 최적 할당 방법을 기술하였다. 가정에서 수시로 접하는 가전제품에서 음성 유저 인터페이스(Voice User Interface, 이하 VUI) 는 음성을 매개로 일어나는 인간과 기계 간 인터페이스를 뜻한다. 음성 유저 인터페이스의 단독적 적용보다는 소리 신호와 함께 사용하여 사용자들의 인터페이스를 향상시킬 수 있다. 본 연구에서는 주부 사용자들을 대상으로 F.G.I, 실험, Depth Interview 를 수행하여 가전제품의 음성 생성 및 표현 인터페이스에서 음성과 소리 신호의 배치에 대한 사용자들의 니즈 조사 및 실험 결과를 기반으로 최적의 할당 방법을 제시하였다.

  • PDF

음성파형의 진폭분포를 이용한 음소의 정상상태 구간 검출 (On Detecting the Steady State Segments of Phonemes by Using the Magnitude Distribution of Speech Waveforms)

  • 정덕조;배명진;안수길
    • 한국음향학회지
    • /
    • 제10권6호
    • /
    • pp.5-11
    • /
    • 1991
  • 연속음 인식을 위하여 연결된 음향 신호를 음소단위로 분할하는 것이 필요하다. 본 논문에서는 연속 음성에서의 정상상태 구간 검출을 위한 파라미터로서 진폭분포를 이용하는 방법을 제안하였다. 제 안된 진폭분포는 음성신호의 변화특성을 정확히 나타내며 이러한 프레임사이의 진폭분포를 이용하는 방 법을 제안하였다. 제안된 지폭분포는 음성 신호의 변화특성을 정확히 나타내며 이러한 프레임사이의 진 폭 분포 차이값을 비교하여 프레임의 안정구간과 천이구간을 구분할 수 있었다.

  • PDF

ATSC 수신기 시스템 (ATSC Set-Top Box System)

  • 도영수;김상욱
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1999년도 KOBA 방송기술 워크샵
    • /
    • pp.3-8
    • /
    • 1999
  • DTV(Digital Television)라 일컬어지는 방송 방식은 미국의 경우 지상파를 이용하여 압축된 영상신호와 음성신호를 방송 및 수신을 하기 위한 것으로 ATSC(Advanced Television System Committees)가 규격을 제안하고 FCC(Federal Communications Commission)가 수용하여 현실화 되어졌다. ATSC 산하의 다양한 Working Group에서는 방송국, 방송장비업체, 가전업체 등이 제안함으로써 규격화하여 전송부는 VSB(Vestigial Side-band), 영상압축은 MPEG2, 음성압축은 AC3로 결정하였다. 본 고에서는 ATSC의 규격에 따라 송신되어지는 방송을 수신할 수 있도록 채널복조와 영상 및 음성신호를 복호화 할 수 있는 수신 시스템의 구성과 테스트 결과를 살펴보고자 한다.

  • PDF

1차 차분신호의 영비트 제거에 의한 음성신호의 패킷부호화에 관한 연구 (A Study on the Speech Packetized Coding by Zero Bit Reduction of 1'st Order Differences)

  • 신동진;임운천;배명진;안수길
    • 한국음향학회지
    • /
    • 제8권4호
    • /
    • pp.74-82
    • /
    • 1989
  • 본 논문에서는 음성신호의 다중채널 실시간 부호화를 위하여 1차 차분신호의 불필요한 영비트를 제거하고 5개 단위로 음성 패킷을 구성해 주는 패킷 부호화에 관하여 그 실현방법 및 성능을 연구하였다. 제안된 패킷부호화 방법은 알고리즘이 매우 간단하며 수치연산보다는 주로 데이터의 조작에 의해 이루어지므로 많은 정보량의 압축은 기대하기 어려우나, 10가지의 음성 안내문에 적용한 결과 약 $40\%$정도의 정보 압축이 가능하였다. 따라서 제안된 방법을 사용하면 매우 간단하게 음성신호 저장시 메모리를 절약해줄 수 있으며 또한 전송시 전송 효율을 높여줄 수 있고, 특히 알고리즘이 간단하므로 부호화시 채널을 다중좌하기에 유리한 장점이 있다.

  • PDF

잡음환경에서의 바이모달 시스템을 위한 견실한 끝점검출 (Robust Endpoint Detection for Bimodal System in Noisy Environments)

  • 오현화;권홍석;손종목;진성일;배건성
    • 전자공학회논문지CI
    • /
    • 제40권5호
    • /
    • pp.289-297
    • /
    • 2003
  • 음성인식 시스템과 입술독해 시스템을 결합한 하여 음향학적 잡음에 대하여 안정된 성능을 갖는 바이모달(bimodal) 시스템을 구현한다. 바이모달 시스템의 성능은 두 인식 시스템의 성능뿐만 아니라 입력 신호의 끝점검출 성능에도 크게 영향을 받는다. 본 논문에서는 음성신호와 영상신호에서 끝점을 자각 자동 검출하여 입력 음성신호로부터 음성신호에서 추정한 신호대잡음비(signal-to-noise ratio: SNR)로 두 끝점검출 결과를 선택하는 방법을 제안한다. 즉 낮은 SNR에서는 영상신호로부터 검출된 끝점을 선택하고 높은 SNR에서는 음성신호로부터 검출된 끝점을 선택함으로써 음향학적 잡음에 대하여 견실하게 끝점을 검출한다. 제안한 끝점검출 방법이 적용된 바이모달 시스템이 강한 음향학적 잡음에 대하여 만족스러운 인식성능을 나타냄을 실험견과에서 확인할 수 있다.

얼굴 영상 및 음성신호 측정을 통한 신장 수지침 효과 분석 기법의 제안 (A Proposal for Effect Analysis Techniques of Kidney Hand Acupuncture through Face Image and Voice Signal Measurement)

  • 김봉현;조동욱
    • 한국통신학회논문지
    • /
    • 제37권3C호
    • /
    • pp.217-223
    • /
    • 2012
  • 본 논문에서는 얼굴 영상 및 음성신호 변화를 측정하는 기술을 적용하여 신장에 해당하는 수지침 자극에 따른 효과를 분석하는 기법을 제안하고자 한다. 이를 위해 신장 수지침 자극 전과 후의 얼굴 영상과 음성을 각각 수집하고 영상신호 분석 실험에서는 신장 관련 영역인 지각(턱) 부위의 색상 변화를 측정하였다. 또한, 음성신호 분석 실험에서는 신장과 관련된 음성신호 분석 요소인 1 포먼트 주파수 대역폭과 Shimmer값의 변화를 측정하였다. 실험을 통해 신장 수지침 자극에 따른 지각 부위의 흑색, 1 포먼트 주파수 대역폭 및 Shimmer 측정값이 감소하는 현상을 나타냈다. 최종적으로 실험 결과에 대한 통계적 유의성 분석을 통해 얼굴 영상 및 음성신호 측정 기법에 의한 신장 수지침 효과를 객관적으로 입증하고자 한다.

8 kbps G.729A에서 5.3 kbps G.723.1로의 상호부호화 알고리듬 (Transcoding Algorithm from 8 kbps G.729A to 5.3 kbps G.723.1)

  • 윤성완;정성교;박영철;윤대희
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.823-826
    • /
    • 2000
  • 유/무선 통신 시스템에서는 통신망마다 각각 다른 음성 부호화기를 사용하므로 음성신호는 두 번의 부/복호화 과정을 거치게 된다. 이로 인해 음질저하, 계산량 증가, 그리고 전달 지연 증가 등의 문제가 발생된다. 본 논문에서는 위의 문제점들을 개선하기 위하여 패킷 음성통신과 무선 이동 통신에 사용되는 음성 부호화기의 상호부호화를 위한 알고리듬을 제안한다 효율적인 음성 패킷 변환 방법을 제안하였으며, 8 kbps G.729A 패킷을 5.3 kbps G.723.1 패킷으로 변환하는 방법을 제안한다. 제안된 음성 패킷 변환 방법은 LSP 변환과정, 적응코드북 변환과정 그리고 고정 코드북 고속 탐색 과정으로 구성된다. 여러 가지 음성 신호로 모의 실험한 결과, 본 논문에서 제안된 상호부호화 알고리듬이 두 번의 부/복호화 과정을 거친 경우보다 짧은 전달 지연 시간과 적은 계산량으로 동등한 음질의 음성신호로 복호화함을 확인하였다.

  • PDF

이종 기기 간 음성통신을 위한 자동전환장치의 구현 (Implementation of the automatic switching device for the voice communications between heterogeneous devices)

  • 류창국;이배호
    • 한국전자통신학회논문지
    • /
    • 제10권12호
    • /
    • pp.1321-1328
    • /
    • 2015
  • 무전기의 음성통신은 PTT(: Push To Talk)를 이용한 반이중(half-duplex) 방식으로, 송신 시 단일 통화선로를 점유한다. 전화와 무전기간, UHF와 VHF 간의 인터페이스와 같이 서로 다른 이종 장치 간 음성통신을 위해서는 두 장치간의 자동전환장치가 요구되고, 이 장치는 입력 신호로부터 전송해야 할 음성을 검출하는 음성전환장치의 성능에 따라 전송되는 음성신호의 손실여부에 많은 영향을 받는다. 기존방식은 단순 입력신호의 크기 즉, 에너지 레벨을 통해 기준을 정함으로써 잡음에도 반응하는 문제점을 지니고 있다. 본 논문에서는 음성신호처리기법을 이용하여 입력된 신호가 음성임을 판별함으로써, 이종 기기 사이의 음성을 자동으로 전달하는 장치를 구현하였다. 이를 통해 음성 자동전환장치의 성능향상을 확인하였고, 이종 기기 간 음성 손실 없는 전송을 수행할 수 있었다.

MFCC 특징 파라미터를 이용한 인식 알고리즘 (Recognition Algorithm using MFCC Feature Parameter)

  • 최재승
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 추계학술대회
    • /
    • pp.773-774
    • /
    • 2016
  • 배경잡음은 음성신호의 특징을 왜곡하기 때문에 음성인식 시스템의 인식율 향상의 방해요소가 된다. 따라서 본 논문에서는 배경잡음이 존재하는 환경에서의 음성인식을 실시하기 위해서, 신경회로망과 Mel 주파수 켑스트럼 계수를 사용하여 연속음성 식별 알고리즘을 제안한다. 본 논문의 실험에서는 본 알고리즘을 사용하여 배경잡음이 섞인 음성신호에 대하여 음성인식의 식별율 개선을 실현할 수 있도록 연구를 진행하며, 본 알고리즘이 유효하다는 것을 실험을 통하여 명백히 한다.

  • PDF

잡음환경 하에서의 음성의 SNR 개선 (Improvement of Signal-to-Noise Ratio for Speech under Noisy Environment)

  • 최재승
    • 한국정보통신학회논문지
    • /
    • 제17권7호
    • /
    • pp.1571-1576
    • /
    • 2013
  • 본 논문에서는 잡음 환경 하에서 음성신호에 대한 신호대잡음비(SNR)를 개선하기 위한 알고리즘을 제안한다. 본 논문에서 제안하는 알고리즘은 백색잡음 및 자동차잡음 등과 같은 배경잡음으로부터 음성신호의 SNR을 개선할 목적으로 먼저 저역, 중역, 고역 SNR 대역에서 SNR을 추정한다. 다음으로 본 알고리즘은 각 대역에서 스펙트럼을 강조함으로써 잡음으로 오염된 음성신호 속에서 잡음신호를 차감한다. 백색잡음, 자동차잡음에 의하여 오염된 음성에 대하여 본 논문에서 제안한 알고리즘이 스펙트럼 차감 방법과 비교하여 양호한 신호대잡음비 값을 구하였다. 실험결과로부터 스펙트럼 차감 방법과 비교하여 백색잡음에 대하여 최대 4.2 dB, 자동차잡음에 대하여 최대 3.7 dB의 출력 신호대잡음비가 개선된 것을 확인할 수 있었다.