• 제목/요약/키워드: TTS

검색결과 306건 처리시간 0.033초

콘텐츠 배급을 위한 RSS 기반의 VoiceXML 다이얼로그 시스템 (VoiceXML Dialog System Based on RSS for Contents Syndication)

  • 권형준;김정현;이현구;홍광석
    • 정보처리학회논문지B
    • /
    • 제14B권1호
    • /
    • pp.51-58
    • /
    • 2007
  • 본 논문은 갱신이 잦은 콘텐츠의 배급 및 구독을 위해 등장한 시맨틱 웹의 대표적인 기술인 RSS(RDF Site Summary or Really Simple Syndication)와 인터넷에 존재하는 정보를 음성으로 제공하기 위해 제안된 XML 규격의 W3C 표준 마크업 언어인 VoiceXML을 결합한 시스템의 프로토타입을 제시한다. 제안하는 시스템은 인터넷 기반으로 제공되는 콘텐츠를 유무선 전화망을 통해 음성인식 및 합성기술로 제공하기 위한 것으로서, RSS 서비스를 제공하기 위한 기존의 구성을 수정하지 않고 갱신된 콘텐츠의 구독이 손쉬운 RSS의 장점을 VoiceXML에 적용할 수 있는 특징이 있다. 정보 요청자 측면에서는 RSS로 제공되는 콘텐츠 탐색에 인터넷 환경이 아닌 유무선 전화망을 이용하므로 시공간의 제약을 줄일 수 있으며, 정보 제공자 측면에서는 음성인식 및 합성기술을 이용한 콘텐츠의 배급에 최신 정보의 제공을 위한 별도의 구성요소를 필요로 하지 않는 장점이 있다. 제안하는 시스템의 예로 뉴스 서비스를 구현한 결과, 실제 콘텐츠를 구독하고 탐색할 때에 응답 시간과 음성 인식 측면에서 장애 없이 RSS Feed를 이용해 비주얼 환경으로 제공되는 내용과 동일한 내용을 음성으로 제공받을 수 있었다.

소아의 선천성 및 후천성 식도 질환에서 내시경적 풍선 확장술 (Endoscopic Balloon Dilatation in Children with Congenital and Acquired Esophageal Anomalies)

  • 곽주영;박재홍
    • Pediatric Gastroenterology, Hepatology & Nutrition
    • /
    • 제8권2호
    • /
    • pp.137-142
    • /
    • 2005
  • 목 적: 소아의 선천성 및 후천성 식도 질환의 치료에 있어 내시경적 풍선 확장술의 안전성, 효과 그리고 기술적인 문제들을 평가하였다. 방 법: 1993년부터 10년 동안 선천성 및 후천성 식도 질환의 치료로 부산대학교병원 소아과에서 내시경적 풍선 확장술을 시행한 8명을 대상으로 이들의 의무 기록을 후향적으로 분석하였다. 시술은 풍선 카테터를 내시경 겸자구를 통해 삽입하여 내시경 직시 하에서 시행되었으며 최초로 사용되는 풍선의 크기는 식도의 내경과 협착 부위의 직경에 기초하여 결정하였다. 협착이 아주 심한 경우에는 먼저 유도 철선을 통과시킨 후, 유도 철선을 따라 풍선 카테터를 삽입시켰다. 풍선을 협착 부위에 위치시키고 서서히 확장하면서 목표하는 크기로 풍선이 팽창되면 1분 동안 확장된 상태를 유지하였다가 감압하여 1분 이상의 휴식을 가졌다. 확장 후 합병증이 없으면 풍선의 직경을 1 mm 간격으로 늘리면서 추가 확장하였다. 결 과: 남아가 3명, 여아가 5명이었고, 평균 연령은 4.2세였다. 8명의 환자에서 27회(환자 당 평균 3.2회)의 확장이 시행되었다. 기저 질환의 종류는 선천 성 식도 폐쇄에 대한 수술 후 발생한 식도 협착이 3예, 식도윤이 2예, 그 외 식도 무이완증, 빙초산에의한 부식성 식도염 그리고 고압성 식도 하부 괄약근이 각각 1예였다. 6~15 mm 직경의 풍선을 사용하였고, 최초 풍선의 크기는 협착의 형태와 정도에 따라 결정되었다. 합병증으로는 식도 천공과 심한 호흡 곤란이 각각 1예 있었다. 6예(75%)에서 시술 후 정상적인 음식 섭취를 보였다. 결 론: 내시경적 풍선 확장술은 소아의 선천성 및 후천성 식도 질환을 치료하는데 있어 안전하고 효과적인 방법이다.

  • PDF

시뮬레이터 기반 음성을 이용한 항행정보 안내시스템의 개발 (Development of Voice Information System for Safe Navigation in Marine Simulator)

  • 손남선;김선영
    • 한국해양환경ㆍ에너지학회지
    • /
    • 제5권3호
    • /
    • pp.28-34
    • /
    • 2002
  • 최근에 음성인식 및 음성합성 기술의 발달로 음성을 이용한 정보안내시스템이 다양한 분야에서 개발되어 활용되고 있다. 선박에서도 선교업무의 피로도를 감소시키고, 비상상황시 효과적인 대처를 위해 항행정보안내시스템의 필요성이 커지고 있다. 그러나 음성을 이용한 선박의 정보안내시스템은 목표와는 달리 큰 호응을 얻지 못하고 있다. 주된 이유는 기능 및 인터페이스의 설계가 개발자 위주로 시작되었기 때문에, 사용과정이 복잡하여 실제 항해사가 사용하는데 망설인다는 점이다. 둘째로는 음성인식률이 사람에 따라, 혹은 환경에 따라 변하기 때문에, 시스템의 안정성이 떨어진다는 점이다. 이런 이유로 인해, 현재 IBS에서는 비상상황시 음성경보기능이 활용되고 있을 뿐이다 본 연구에서는 이러한 문제점을 개선하고, 음성기술을 안전운항에 적극적으로 활용하기 위하여, 사용자 중심의 시스템을 설계하였다. 우선, 실제 항해사와의 면담의 피드백과정을 통해 음성을 이용한 항행정보안내시스템의 요구기능을 결정하였다 그리고 음성인식이 사용자에 독립적이며, 안정적인 음성인식엔진을 적용하였다. 여기서, 음성지령과정을 단순화하기 위해 확인과정을 자동화하였고, 음성인식상의 오류는 자동수정기능으로 보완하였다. 본 논문에서 개발한 음성을 이용한 시뮬레이터 기반 항행정보안내시스템은 항해사의 실시간 선박 운항 시뮬레이션을 통해 운용성능을 시험하였다.

  • PDF

다음색 감정 음성합성 응용을 위한 감정 SSML 처리기 (An emotional speech synthesis markup language processor for multi-speaker and emotional text-to-speech applications)

  • 유세희;조희;이주현;홍기형
    • 한국음향학회지
    • /
    • 제40권5호
    • /
    • pp.523-529
    • /
    • 2021
  • 본 논문에서는 감정 마크업을 포함하는 Speech Synthesis Markup Language(SSML) 처리기를 설계하고 개발하였다. 다양한 음색과 감정 표현이 가능한 음성합성 기술이 개발되고 있으며 다양한 음색 및 감정 음성합성의 응용 확대를 위하여 표준화된 음성 인터페이스 마크업 언어인 SSML을 감정 표현이 가능하도록 확장한 감정 SSML(Emotional SSML)을 설계하였다. 감정 SSML 처리기는 그래픽 사용자 인터페이스로 손쉽게 음색 및 감정을 원하는 텍스트 부분에 표시할 수 있는 다음색 감정 텍스트 편집기, 편집 결과를 감정 SSML 문서로 생성하는 감정 SSML 문서 생성기, 생성된 감정 SSML 문서를 파싱하는 감정 SSML 파서, 감정 SSML 파서의 결과인 다음색 감정 합성 시퀀스를 기반으로 합성기와 연동하여 음성 스트림의 합성 을 제어하는 시퀀서로 구성된다. 본 논문에서 개발한 다음색 감정합성을 위한 감정 SSML 처리기는 프로그래밍 언어 및 플랫폼 독립적인 개방형 표준인 SSML을 기반으로 하여 다양한 음성합성 엔진에 쉽게 연동할 수 있는 구조를 가지며 다양한 음색과 감정 음성합성이 필요한 다양한 응용 개발에 활용될 것으로 기대한다.

Back TranScription(BTS)기반 데이터 구축 검증 연구 (A Study on Verification of Back TranScription(BTS)-based Data Construction)

  • 박찬준;서재형;이설화;문현석;어수경;임희석
    • 한국융합학회논문지
    • /
    • 제12권11호
    • /
    • pp.109-117
    • /
    • 2021
  • 최근 인간과 컴퓨터의 상호작용(HCI)을 위한 수단으로 음성기반 인터페이스의 사용률이 높아지고 있다. 이에 음성인식 결과에 오류를 교정하기 위한 후처리기에 대한 관심 또한 높아지고 있다. 그러나 sequence to sequence(S2S)기반의 음성인식 후처리기를 제작하기 위해서는 데이터 구축을 위해 human-labor가 많이 소요된다. 최근 기존의 구축 방법론의 한계를 완화하기 위하여 음성인식 후처리기를 위한 새로운 데이터 구축 방법론인 Back TranScription(BTS)이 제안되었다. BTS란 TTS와 STT 기술을 결합하여 pseudo parallel corpus를 생성하는 기술을 의미한다. 해당 방법론은 전사자(phonetic transcriptor)의 역할을 없애고 방대한 양의 학습 데이터를 자동으로 생성할 수 있기에 데이터 구축에 있어서 시간과 비용을 단축할 수 있다. 본 논문은 기존의 BTS 연구를 확장하여 어떠한 기준 없이 데이터를 구축하는 것보다 어투와 도메인을 고려하여 데이터 구축을 해야함을 실험을 통해 검증을 진행하였다.

연하장애 환자의 혀 운동 및 측정 도구에 대한 고찰 (A Literature Review of Tongue Movement and Measurement Tools for Dysphagia)

  • 김진영;손영수;홍덕기
    • 재활치료과학
    • /
    • 제11권4호
    • /
    • pp.55-68
    • /
    • 2022
  • 서론 : 본 연구는 연하장애 환자의 혀 운동 및 측정 도구들에 대한 고찰을 통해 도구의 원리와 특징을 확인하여 임상 적용을 위한 정보를 제공하고자 하였다. 본론 : 연하재활 분야에서 혀 운동 및 측정 도구로 활용되고 있는 15개의 도구를 확인하였고, 원리에 따라 벌브 센서 원리, 저항 센서 시트 원리, 마우스피스형 센서, 기타 기술의 도구로 분류하였다. 벌브 센서는 IOPI, KSA, TPM-01이 있었으며, 사용방법이 다소 간편하지만 혀의 압력 측정 시 위치 고정에 대한 제한점이 있었다. 저항 센서 시트는 I-SCAN, KEI, IPMD, PRESLA가 있었고, 모두 입천장에 고정이 가능하여 벌브 센서 원리에 비해 안정적인 위치에서 혀 압력 측정이 가능하다. 하지만 제작과정이 복잡하고, 많은 비용이 소모된다는 단점이 있었다. 마우스피스형 원리는 MOST, T-Station, SwallowSTRONG, LFDS가 있었으며, 도구의 특성상 개인의 구강에 맞게 제작되어 혀 압력 측정 시 고정이 가능하고, 안정적인 측정이 가능하다. 하지만 제작 과정에서 많은 비용이 발생하며, 세밀한 움직임의 측정과 내구성에 제한점이 있었다. 기타 도구로는 OPG, TTS, OroPress, TPWA가 있으며, 빛 감지의 원리와 무선 측정이 가능하다는 장점이 있다. 하지만 신뢰도와 타당도가 입증되지 않아 추후 연구가 필요한 실정이다. 결론 : 본 연구는 1990년대부터 현재까지 개발된 혀 운동 및 측정 도구들의 분석을 통해 연하재활 분야에서 활용할 수 있는 정보를 제시하였다. 이에 임상에서 도구의 선택 과정에 도움이 될 것으로 판단된다. 향후에는 기존 도구들의 장단점들을 고려하여 임상뿐만 아니라 가정에서도 활용 가능한 혀 운동 및 측정 도구 개발이 필요하다.