• 제목/요약/키워드: 음성전달

검색결과 484건 처리시간 0.025초

담화표지의 음성언어적 특성과 음성합성 시스템에서의 활용 (Characteristics of Spoken Discourse Markers and their Application to Speech Synthesis Systems)

  • 이호준;박종철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.254-260
    • /
    • 2007
  • 음성은 컴퓨터로 대변되는 기계와 사람 그리고 기계를 매개로 한 사람과 사람의 상호작용에서 가장 쉽고 직관적인 인터페이스로 널리 활용되고 있다. 인간에게 음성정보를 제공하는 음성합성 분야에서는 합성결과의 자연스러움과 인식성이 시스템의 주요 평가요소로 활용되고 있는데 이러한 자연스러움과 인식성은 합성결과의 정확성뿐만 아니라 발화환경이나 발화자의 발화특징 혹은 감정상태 등에 의해 많은 영향을 받게 된다. 담화표지는 문장의 명제 내용에는 직접 관여하지 않으면서 화자의 발화 의도나 심리적 태도를 전달하는 구성 요소를 말하는데 본 논문에서는 담화표지가 포함된 대화 음성 데이터를 수집하여 담화표지의 음성언어적인 특징을 분석하고 분석된 결과를 음성합성 시스템에 활용하는 표현방식에 대해 논의한다.

  • PDF

음성 인식 서버를 이용한 모바일 사전 설계 및 구현 (The Design and Implementation of Mobile Dictionary App based on Voice Recognition Server)

  • 유재승;박희태;박미소;송민규;윤성현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.1698-1701
    • /
    • 2012
  • 음성 인식은 사용자의 음성을 문자로 변환하는 기술로 최근 스마트폰의 사용자 인터페이스로 사용되면서 그 활용도가 높아지고 있다. 기존의 스마트폰용 사전 프로그램은 좁은 자판으로 인하여 입력과정에 오타가 많이 발생하고, 찾고자 하는 단어의 발음은 알고 있지만 철자를 알지 못 하는 경우에 검색할 수 없다. 본 논문에서는 음성 명령을 이용한 스마트폰용 영한사전 앱을 설계 및 구현하였다. 외부 음성 인식 서버를 이용하여 음성 명령을 이해하고 클라이언트에 SQLite를 이용하여 사전 데이터 베이스를 구축한다. 클라이언트는 서버로 사용자 음성을 전달하고, 서버는 음성 정보를 텍스트로 변환하여 클라이언트에게 제공한다[1]. 클라이언트는 서버로부터 전송받은 텍스트를 이용하여 사전 데이터베이스를 검색하고, 그 결과를 사용자에게 보여준다.

사용자 프라이버시 보호를 위한 음성 특징 제거 기법 설계 및 구현 (Design and Implementation of the Voice Feature Elimination Technique to Protect Speaker's Privacy)

  • 유병석;임수현;박미소;이유진;윤성현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.672-675
    • /
    • 2012
  • 음성은 가장 익숙하고 편리한 의사 소통 수단으로 스마트폰과 같이 크기가 작은 모바일 기기의 입력 인터페이스로 적합하다. 서버 기반의 음성 인식은 서버를 방문하는 다양한 사용자들을 대상으로 음성 모델을 구축하기 때문에 음성 인식률을 높일 수 있고 상용화가 가능하다. 구글 음성인식, 아이폰의 시리(SiRi)가 대표적인 예이며 최근 스마트폰 사용자의 증가로 이에 대한 수요가 급증하고 있다. 서버 기반 음성 인식 기법에서 음성 인식은 스마트폰과 인터넷으로 연결되어 있는 원격지 서버에서 이루어진다. 따라서, 사용자는 스마트폰에 저장된 음성 데이터를 인터넷을 통하여 음성 인식 서버로 전달해야 된다[1, 2]. 음성 데이터는 사용자 고유 정보를 가지고 있으므로 개인 인증 및 식별을 위한 용도로 사용될 수 있으며 음성의 톤, 음성 신호의 피치, 빠르기 등을 통해서 사용자의 감정까지도 판단 할 수 있다[3]. 서버 기반 음성 인식에서 네트워크로 전송되는 사용자 음성 데이터는 제 3 자에게 쉽게 노출되기 때문에 화자의 신분 및 감정이 알려지게 되어 프라이버시 침해를 받게 된다. 본 논문에서는 화자의 프라이버시를 보호하기 위하여 사용자 음성 데이터로부터 개인의 고유 특징 및 현재 상태를 파악할 수 있는 감정 정보를 제거하는 기법을 설계 및 구현하였다.

스펙트럼 형태 불변 실시간 음성 변환 시스템 (Spectral Shape Invariant Real-time Voice Change System)

  • 김원구
    • 한국지능시스템학회논문지
    • /
    • 제15권1호
    • /
    • pp.48-52
    • /
    • 2005
  • 본 논문에서는 음성의 스펙트럼 형태는 유지하면서 음성을 기계적인 음성으로 변환시키기는 실시간 음성 변환 방법을 제안하였다. 이러한 목적을 위하여 LPC 분석 및 합성 방법을 사용하여 변환된 음성의 스펙트럼은 유지하였고 합성된 음성의 피치는 자유롭게 변경되도록 하였다. 제안된 방법에서는 변환된 음성이 보다 자연스럽게 들리게 하기 위하여 여기 신호 발생기에 이득 정합 방법을 적용하였다. 제안된 방법의 성능을 평가하기 위하여 음성 변환 실험을 수행하였다. 실험 결과에서 원 음성 신호는 원 화자의 신원을 알기가 어려운 기계적인 음성 신호로 바뀌는 것을 알 수 있었고 피치의 심한 변화에도 변환된 음성의 의미는 정확히 전달될 수 있었다. 제안된 시스템은 시스템의 실시간으로 구현될 수 있는지 확인하기 위하여 TI TMS320C6711DSK 보드를 사용하여 구현되었다.

개인용 전자비서 시스템을 위한 음성사서함의 구현 (An Implementation of Voice Mail System for Personal Electronic Secretary)

  • 유형근;김순협
    • 한국음향학회지
    • /
    • 제12권6호
    • /
    • pp.62-69
    • /
    • 1993
  • 본 논문은 개인용 전자 비서 시스템을 위한 음성사서함의 구현에 관한 것이다. 기존의 음성사서함 서비스는 단순한 메시지 축적서비스에 불과하다. 제안된 전자 비서 시스템을 위한 음성사서함은 음성 정보를 관련 데이터 베이스와 연계하여 개인정보관리시스템에 활용할 수 있도록 한 것이다. 본 논문에서는 음성의 저장과 합성에 ADPCM과 LPC 음성 부호화 방식을 적용하였고, 음악합성에는 FM 음원을 사용하였다. 개인용 컴퓨터에 확장카드 형태로 제작된 제안된 시스템의 서비스 기능은 녹음, 편집, 저장 및 재생기능, 자동발신 및 메시지 전달기능, 동보기능, 자동수신 및 부재중 안내기능, 시보안내 및 음악연주 기능, 전화번호 및 스케쥴 관리등으로 구성되었다.

  • PDF

음성인식 기반 컨텐츠 네비게이션 시스템 (Contents Navigation System using Speech Recognition)

  • 김기백;최종호
    • 한국컴퓨터정보학회지
    • /
    • 제15권1호
    • /
    • pp.99-102
    • /
    • 2007
  • 최근 들어 인간의 의지를 각종의 전자시스템에 전달하기 위한 수단으로 음성인식 기술을 이용하고자 하는 연구가 널리 진행되고 있다. 음성인식 인터페이스에서 가장 중요한 이슈는 처리시간의 감소 및 범용 인터페이스의 개발이다. 이러한 문제점을 해결하기 위하여 본 연구에서는 하드웨어 기반의 상용 IC로 생산되고 있는 음성인식프로세서인 RSC-4128이 내장된 음성인식 모듈 VR-STAMP를 사용하였다. 본 연구에서 새롭게 개발한 시스템은 T2SI(Text To Speaker Independent) 기반의 화자(話者)독립 방식으로 음성인식 신호를 컨텐츠 네비게이션 시스템의 제어신호로 활용하여 임베디드 시스템 및 PC 등에 설치된 윈도우즈 기반의 응용 소프트웨어를 제어할 수 있는 시스템이다. 필드 테스트를 통해 그 유용성을 확인한 결과, 본 연구에서 개발한 시스템은 컨텐츠 네비게이션은 물론 가전기기 제어 및 흠 네트워크 등에 널리 응용될 수 있을 것으로 판단된다.

  • PDF

VoIP Firewall/NAT Traversal 문제 해결을 위한 구조 (The Structure of Solving VoIP Firewall/NAT Traversal Problem)

  • 최경호;강부중;노인우;임을규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (D)
    • /
    • pp.229-233
    • /
    • 2007
  • VoIP(Voice over Internet Protocol)란 음성 데이터를 IP 데이터그램 방식으로 기존 인터넷망을 통해 전달해 주는 기술을 말한다. 기존 인터넷망을 이용하여 음성 데이터를 전달해 줌으로써 기존의 음성 전화 서비스에서 사용되던 회선비용을 크게 절감할 수 있다는 점은 VoIP의 장점 중 하나이다. 그런데 VoIP를 기존의 인터넷망에 그대로 적용하기에는 VoIP에서 사용되는 프로토콜의 특성으로 인해 어려움이 따르게 된다. 즉, 기존의 인터넷망에서 사용되고 있는 방화벽과 NAT(Network Address Translator)장비는 보안을 위해서는 필수적인 요소들 이지만, VoIP의 통신 입장에서는 음성 데이터의 원활한 통신을 방해하는 요소로 작용을 하게 된다. 이러한 문제는 VoIP 통신에 사용되는 시그널링 프로토콜인 H.323과 SIP 프로토콜의 연결 설정과 데이터 전송에 사용되는 동작 방식이 방화벽과 NAT장비의 기능에 충돌하는 점 때문에 발생하게 된다. 따라서 기존의 인터넷망을 그대로 사용하면서 VoIP의 통신이 원활하게 이루어지도록 하기 위해서는 이러한 문제의 해결이 반드시 이루어져야 한다. 본 논문에서는 기존에 Firewall/NAT Traversal 문제 해결을 위해 연구되던 기법들에 대해 살펴보고, 새로운 구조를 제시한다.

  • PDF

PSTN에서 BcN으로 전환 후 음성 트래픽 비교에 관한 연구 (The Study of Voice Traffic Comparison From PSTN with the BcN after converting)

  • 이영학;김석;한승조
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2007년도 추계종합학술대회
    • /
    • pp.600-603
    • /
    • 2007
  • 미래 지식정보사회는 컴퓨터, 통신, 방송 등 모든 정보통신 기기가 하나의 네트워크에 연결되는 BcN 기반의 네트워크사회(Broadband Network Society)로 빠르게 진화할 전망이다. BeN은 엑세스망, IP전달망, 제어/서비스망(교환망 IP전환)의 3개 계층을 모두 포함하는 개념이나 엑세스망, IP전달망은 기존과 통일한 IP방식으로 추진 중이어서 IP기반의 제어/서비스망 신규 구축 및 교환망의 IP로의 전환을 협의의 BcN이라 정의 한다. PSTN에서 BcN망으로 전환 시 BeN망의 구성 요소는 소프트스위치, TGW, AGW, SGW, 응용서버, 미디어서버 등이 있다. PSTN망이 BcN망으로 전환시 크게 3단계의 과정을 거친다. 1단계로 2007년 상반기에 전남 목포지역의 지능망 서비스가 불가한 시외교환기가 BcN으로 전환되었다. 전환 후의 IP망을 경유하는 음성호의 트래픽을 측정한 결과는 발생호는 증가하였으며 완료율은0.06% 감소하였지만 관리 기준내의 양호한 수준이었다. 향후 음성호의 통화 품질을 높이기 위해서 품질 측정을 통한 기준 미달 항목을 조치하고 트래픽 측정을 통한 소통율, 완료율 불량 구간에 대한 지속적인 개선 활동을 해야 한다.

  • PDF

청각장애인을 위한 음성인식 기반 메시지 전송 시스템 (Speech Recognition based Message Transmission System for the Hearing Impaired Persons)

  • 김성진;조경우;오창헌
    • 한국정보통신학회논문지
    • /
    • 제22권12호
    • /
    • pp.1604-1610
    • /
    • 2018
  • 음성인식 서비스는 청각장애인에게 화자의 음성을 텍스트로 변환하여 시각화함으로써 의사소통의 보조적인 수단으로 사용되고 있다. 하지만 강의실 및 회의실과 같은 개방된 환경에서는 다수의 청각장애인에게 음성인식 서비스를 제공하기 힘들다. 이를 위해 주변 환경에 따라 음성 인식 서비스를 효율적으로 제공하기 위한 방법이 필요하다. 본 논문에서는 화자의 음성을 인식하여 변환된 텍스트를 다수의 청각장애인에게 메시지로 전달하는 시스템을 제안한다. 제안하는 시스템은 다수의 사용자에게 동시에 메시지를 전달하기 위해 MQTT 프로토콜을 사용한다. MQTT 프로토콜의 QoS level 설정에 따른 제안 시스템의 서비스 지연을 확인하기 위해 종단 간 지연을 측정하였다. 측정 결과 가장 신뢰성이 높은 QoS level 2와 0간의 지연이 111ms로 대화 인식에 큰 영향을 끼치지 않음을 확인하였다.

속도제한시스템(Intelligent Speed Adaptation System) 개발

  • 한민홍
    • 위성통신과 우주산업
    • /
    • 제8권1호통권18호
    • /
    • pp.152-158
    • /
    • 2000
  • 교통사고를 감소시키는 방안으로 과속을 방지하고 주행차선 전방에서 발생하는 교통사고나 노면상황정보를 운전자에게 미리 전달할 필요가 있다. 본 연구에서는 과속시 과속을 운전자에게 주지시키거나 또는 차량 스스로 능동적으로 과속을 제한함으로써 규정속도를 준수토록 한다. 또한 주행주의 상황을 운전자에게 음성과 화면으로서 전달하여 사고예방에 대처할 수 있는 충분한 시간을 제공하기 위함이다.

  • PDF