• Title/Summary/Keyword: 음성전달

Search Result 484, Processing Time 0.135 seconds

음성 패킷을 이용한 채널의 에러 정보 전달 (Transmission of Channel Error Information over Voice Packet)

  • 박호종;차성호
    • 한국음향학회지
    • /
    • 제21권4호
    • /
    • pp.394-400
    • /
    • 2002
  • 디지털 음성 통신에서 송신하는 음성 패킷의 전송 에러율을 알면 송신 채널 상황에 적합한 압축 동작을 통하여 전체 통신의 품질을 향상시킬 수 있다. 그러나 현재의 이동통신과 인터넷 통신에서는 음성 패킷의 전송 에러정보를 알려주는 프로토콜이 지원되지 않는다. 본 논문에서는 이를 해결하기 위하여 채널의 전송 에러 정보를 음성 패킷에 삽입하여 실시간으로 전달하는 방법을 제안한다. 제안하는 채널 에러 정보 삽입 방법은 ACELP (algebraic code-excited linear predictin) 코드벡터의 펄스 위치의 상관 관계를 이용하며, 이를 통하여 추가정보 삽입에 의한 음질 저하를 막고 오인식율을 줄일 수 있다. 다양한 음성 데이터를 이용하여 제안한 방법의 성능을 측정하였으며 음질의 저하가 거의 발생하지 않고 정보의 검출 능력과 오인식율에서 만족할 만한 성능을 가지는 것을 확인하였다.

전력선과 조명등을 이용한 음향신호 전달 (Sound Transimitting System using Power Line and Lamp)

  • 주경돈;강민우;구경완;이승권;이명섭
    • 한국전기전자재료학회:학술대회논문집
    • /
    • 한국전기전자재료학회 2002년도 춘계학술대회 논문집 유기절연재료 전자세라믹 방전플라즈마 일렉트렛트 및 응용기술
    • /
    • pp.237-241
    • /
    • 2002
  • 전력선과 조명등을 이용한 음향전달 시스템을 구성하여 어학실습 교육용으로의 활용 가능성을 평가하였다. 음성신호를 변조하여 전력선에 실어 보내는 송신기와 조명등의 빛으로부터 음성신호를 검출하여 이어폰 또는 헤드폰 둥으로 들을 수 있는 수신기로 구성하였다. 제작한 송신기와 수신기의 주파수 특성과 스펙트럼분석을 하였다. 스피커로 출력되는 음질상태는 최적상태는 아니지만 음성이나 노래 등을 이용한 어학실습 교육용으로는 충분한 수준이 었다.

  • PDF

스마트 스피커에서 개인정보 발화에 따른 사용자 동의 UI/UX 개선 연구 (A Study for Improvement of User Consent UI / UX according to Personal Information Utterance in Smart Speaker)

  • 정재은;박효주;양진홍
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.414-417
    • /
    • 2019
  • 스마트 스피커는 기존 서비스와 달리 음성으로 데이터를 수집할 뿐 아니라 수집한 데이터를 기반으로 처리한 정보를 스피커를 통해 발화하는, 즉 소리로 전달하는 특징을 가진다. 이러한 서비스 응답 구조는 스피커에서 음성을 통해 전달되는 정보에 사용자의 개인정보가 포함되어 발화될 수 있는 위험이 존재한다. 구글, 아마존의 스마트 스피커 초기 설정 시 동의 과정 분석을 통해 개인정보 발화 위험을 사용자가 명확히 인지하기 어렵다는 문제를 발견하였다. 이에 본 연구는 스마트 스피커 서비스의 사용자 동의 과정에서 사용자의 개인정보 발화 위험 인식 재고를 위한 UI/UX 개선방안으로 1) 개인정보 발화 위험성 약관 명시 및 별도 화면 제시, 2) 사용자의 자유로운 서비스 동의 허용, 3) 컨트롤러에게 전달되는 개인정보와 스피커를 통해 발화될 수 있는 개인정보를 구분하여 제시, 4) 개인정보 발화 위험에 대한 음성 고지 및 동의 과정 추가를 제안하였다.

한국어 음성인식 후처리를 위한 주의집중 기반의 멀티모달 모델 (Attention based multimodal model for Korean speech recognition post-editing)

  • 정영석;오병두;허탁성;최정명;김유섭
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.145-150
    • /
    • 2020
  • 최근 음성인식 분야에서 신경망 기반의 종단간 모델이 제안되고 있다. 해당 모델들은 음성을 직접 입력받아 전사된 문장을 생성한다. 음성을 직접 입력받는 모델의 특성상 데이터의 품질이 모델의 성능에 많은 영향을 준다. 본 논문에서는 이러한 종단간 모델의 문제점을 해결하고자 음성인식 결과를 후처리하기 위한 멀티모달 기반 모델을 제안한다. 제안 모델은 음성과 전사된 문장을 입력 받는다. 입력된 각각의 데이터는 Encoder를 통해 자질을 추출하고 주의집중 메커니즘을 통해 Decoder로 추출된 정보를 전달한다. Decoder에서는 전달받은 주의집중 메커니즘의 결과를 바탕으로 후처리된 토큰을 생성한다. 본 논문에서는 후처리 모델의 성능을 평가하기 위해 word error rate를 사용했으며, 실험결과 Google cloud speech to text모델에 비해 word error rate가 8% 감소한 것을 확인했다.

  • PDF

음성신호 분석 기반의 습도 변화에 따른 성대 기능 분석 (Analysis of Vocal Cord Function by Humidity Change Based on Voice Signal Analysis)

  • 김봉현;조동욱
    • 한국통신학회논문지
    • /
    • 제37A권9호
    • /
    • pp.792-798
    • /
    • 2012
  • 네트워크 지수가 중요한 현대 사회에서 음성을 통한 전달력 극대화로 대화 상대자로 하여금 호감도를 최대한 끌어 올리는 것이 중요한 사안이 되었다. 이때 공기 중에 포함된 습도는 음성의 전달력에 많은 영향을 미친다. 따라서 본 논문에서는 30%, 50%, 80%의 습도를 일정하게 유지한 환경에서 성대에 미치는 영향을 분석하기 위한 음성신호 분석 기술을 적용한 실험을 수행하여 습도가 음성의 전달력에 미치는 영향을 정량적으로 규명해 보고자 한다. 이를 위해 20대 남성 20명을 대상으로 30%, 50%, 80% 습도 환경을 유지하고 있는 공간에서 1시간동안 노출된 상태에서 음성을 수집하고 성대 진동 변화 및 음성 에너지 크기를 측정한 실험을 수행하였다. 최종적으로 습도 변화에 따른 성대 기능의 특징 요소를 측정하고 통계 분석을 통해 추출된 실험 결과가 통계적 유의성을 갖는지에 대해 분석해 보고자 한다.

머리전달함수가 음상정위에 미치는 영향 (Effect of HRTF on Sound Localization)

  • 김진욱
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.261-264
    • /
    • 1998
  • 본 논문에서는 MIT 머리전달함수(Head-Related Transfer Function; HRTF)와 Neumann의 머리전달함수를 이용하여 머리전달함수가 음성정위에 미치는 영향을 비교분석하였다. 이를 위하여 머리전달함수의 측정조건과 시간 및 주파수특성을 비교 분석하였고 청취실에 헤드폰 재생을 통하여 $10^{\circ}$간격으로 음상정위에 대한 주관평가들 실시하였으며, 주관평가 자료를 이용하여 개인과 전체 평균에 대한 방향 지각 에러(각도)를 계산하였다. 실험결과, MIT 머리전달함수에 비하여 Neumann 머리전달함수를 이용한 음상정위가 양호하게 나타났으며 음질에 대해서도 청취자들은 Neumann 머리전달함수에 의한 재생음이 보다 자연스럽고, 명확한 품질을 갖는다고 답하였다.

  • PDF

T자형 복도 공간의 비상 방송용 확성기 배치별 음압 레벨과 음성 명료도 비교 (Comparison of Sound Pressure Level and Speech Intelligibility of Emergency Broadcasting System at T-junction Corridor Space)

  • 정정호;이성찬
    • 한국화재소방학회논문지
    • /
    • 제33권1호
    • /
    • pp.105-112
    • /
    • 2019
  • 본 연구에서는 T자형의 복도 연결 공간에서 비상 방송음이 명료하고 고르게 전달되는지를 건축음향 시뮬레이션을 이용하여 알아보았다. 복도 공간의 흡음성능 변화, 비상 방송용 확성기의 설치 위치와 간격을 변화시켜 보았으며 변화에 따른 음압 레벨 분포, 음성 전달 지수(STI, RASTI) 분포를 비교하였다. 시뮬레이션 결과 명료한 음성 전달을 위해서는 비상 방송용 확성기를 T자형 복도 연결부의 중심에서 약 10 m를 이격시켜 설치하는 것이 좋은 것으로 나타났다. NFSC의 25 m 설치 간격을 좁히는 경우 더욱 명료하고 충분한 음량을 갖는 비상 방송음이 고르게 전달될 수 있는 것으로 나타났다.

ChipSet을 이용한 VoIP PHONE 시스템 개발 (An Implementation of a VoIP Phone system using ChipSet)

  • 안혁종;황승용;이진형;양희성;이상연;조성호
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.105-108
    • /
    • 2000
  • CTI[1]의 응용 영역 중에서 인터넷 폰이 최근 뜨거운 관심의 대상으로 떠오르고 있다. 인터넷을 이용한 음성전달 기술은 인터넷의 성장 보급과 더불어 나날이발전 하고 있는데, 이러한 음성전달기술을 이용해 개발된 소프트 웨어를 통칭해서 인터넷 폰이라고 부르고 있다. 이러한 변화 속에서 비용의 절감과 비디오 전화, 영상회의와 같은 응용에 적용할 수 있는, 본 개발은 One Encoder One Decoder 지원의 VoIP(Voice over Internet Protocol) Phone에 관한 것으로, 특히 압축하여 인터넷 망에 접속시켜 사용할 수 있는 PC 장착형 One Board 형태의 시스템을 구현하였다. 이 Board에 사용 된 칩셋은 국내 회사인 C&S Technology 사의SEAGUL723이며, PC인터페이스는 PCI(Peripheral Component Interconnect) 버스 방식을 이용하였다. 주요 연구내용에 있어서 하드웨어 부분은 내선제어모듈,PCI 모듈, 칩셋을 이용한 음성신호처리 모듈, Board제어 모듈 등이 있으며, 소프트 웨어 설계 부분에 있어서는 하드웨어 구동을 위한 시스템 드라이브, Application과 인터넷 상의 VoIP 통신을 위한 소프트웨어, 사용자를 위한 User Interface 소프트 웨어 등이 있다.

  • PDF

음성을 이용한 차세대 운전자 지원 시스템 개발 (Development of Advanced Driver Support System by Voice)

  • 최형기;문인섭;김종교
    • 한국음향학회지
    • /
    • 제17권8호
    • /
    • pp.98-102
    • /
    • 1998
  • 본 연구는 인간에게 있어서 정보의 습득으로 가장 쉬운 음성을 이용하여 자동차의 정보를 전달하는 운전자의 지원 시스템의 구현에 관한 내용으로, 제작된 시스템은 여러 가 지 입력 신호(연료량, 엔진 냉각수 온도, 오일 압력, 자동차 속도, 엔진 속도, 문 열림 경고, 안전 벨트 경고, 주차 브레이크 등)에 따라 음성 경고 문장을 발생하게 된다.

  • PDF

신경망필터를 이용한 음질향상 (Speech Enhancement using the Neural Network Filter)

  • 김종우;공성곤
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2000년도 춘계학술대회 학술발표 논문집
    • /
    • pp.102-105
    • /
    • 2000
  • 본 논문에서는 잡음환경에서의 음성신호복원(Speech Enhancement) 시스템 구현을 목적으로 한다 이를 위한 적응필터로서 LMS(Least Mean Square)알고리즘 FIR필터를 제안한다. 또 정밀 필터로서 신경망 필터를 제안한다. 잡음환경에서의 음성신호 복원 시스템은 잡음에 의해 왜곡된 음성신호에서 잡음성분만을 제거함으로써 음성신호를 복원하는 시스템이다. 일반적으로 잡음은 시변특성과, 비선형적인 전달특성을 갖는다. 그러므로 파라미터가 고정된 필터로는 제어하기가 힘들다. 이러한 이유로 본 논문에서는 LMS알고리즘 적응필터를 적용한다. 신경망 필터는 오차 역전파 학습 알고리즘에 의해 오차를 최소화하는 방향으로 필터의 파라미터를 수정한다. 제안한 필터로 잡음환경에서의 음성신호복원 시스템을 구성하고, 실험을 통해 필터의 성능을 확인한다.

  • PDF