• 제목/요약/키워드: 디지털 음성

검색결과 535건 처리시간 0.026초

DAISY 포맷 기반의 디지털음성도서 개발 및 서비스 방안 연구 (A Study on Revitalization and Development of Digital Talking Book Based on the DAISY Format)

  • 장보성;김규환;이현정
    • 한국도서관정보학회지
    • /
    • 제40권3호
    • /
    • pp.295-315
    • /
    • 2009
  • 본 연구는 국제 표준인 DAISY 포맷 기반의 독서장애인용 디지털음성도서 저작 도구 개발 및 서비스 활성화 방안을 제안하였다. 현재 한국은 시각장애인들 뿐만 아니라 고령화에 따른 저시력자 및 노인인구의 증가로 인쇄매체를 읽는데 불편함이 있는 독서장애인들이 급속히 증가하고 있다. 이런 독서장애인들을 위한 디지털음성도서 서비스의 필요성이 대두되고 있다. 디지털음성도서 서비스를 위해서는 사용자의 편의성을 충족시킬 수 있는 다양한 기능을 구현할 수 있어야 할 뿐만 아니라 저작권 침해의 문제를 해결해야 한다. 이에 본 연구는 디지털음성도서의 제작 포맷으로 사용되는 국제표준인 DAISY 포맷을 소개하고 DAISY 포맷 기반의 디지털음성도서 개발을 위한 저작 툴 개발 방안을 제안하였다. 또한 DAISY 포맷 기반의 디지털음성도서 서비스 활성화를 위하여, 일본의 저작권법 개정사례와 우리나라의 독서장애인을 위한 제도적 지원체계를 포함한 정책적 방안을 제안하였다.

  • PDF

이동통신을 위한 음성 부호화 방식 (Speech Coding Algorithms for Mobile Communication)

  • 이황수
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.3-11
    • /
    • 1998
  • 정보통신 문화가 발달함에 따라 디지털 이동통신이나, 멀티미디어, 음성우편 시스템 등 음성을 이용한 여러 가지 새로운 산업들이 급속히 성장하고 있다. 이 중에서도 특히 디지털 이동통신분야에 대한 연구가 활발한데, 이는 디지털 시스템에서는 부호화기를 사용하여 음성신호를 압축하기 때문에 아날로그 시스템에 비해 패널 증대를 가져올 수 있기 때문이다. 이처럼 음성 부호화기는 실질적인 상업화와 매우 밀접한 관계를 갖고 있기 때문에 그에 대한 연구가 화발히 진행되고 있다. 본 논문에서는 먼저 일반적인 음성부호화 방법들에 대해 살펴본 다음에, 현재 디지털 셀룰라 시스템에서 사용하고 있는 full-rate 음성 부호화기 및 half-rate 음성 부호화기의 표준화 동향과 최근에 여러 응용분야에서 널리 사용되고 있는 음성 부호화기에 대해서 설명하기로 한다. 또한 ITU-T 의 표준화 동향 및 4kbps 이하의 전송률을 갖는 음성 부호화기의 연구추세에 대해서 살펴보기로 한다.

  • PDF

독서장애인용 디지털음성도서를 위한 음성 어노테이션 기법 (A Voice-Annotation Technique in Mobile E-book for Reading-disabled People)

  • 이경희;이종우;임순범
    • 디지털콘텐츠학회 논문지
    • /
    • 제12권3호
    • /
    • pp.329-337
    • /
    • 2011
  • 디지털 음성 도서는 독서장애인의 독서 환경 개선을 위해 개발되었다. 그러나 기존 디지털 음성 도서에서의 어노테이션 기능(도서에 노트나 하이라이트 등의 주석을 표기하는 행위)은 시력을 필요로 하는 화면 인터페이스를 통해서만 가능했기 때문에 독서장애인들에게는 무용지물이었던 것이 사실이다. 이에 본 논문에서는 듣는 능력과 음성만으로도 노트나 하이라이트 달기 같은 어노테이션 기능을 가능하게 해주는 음성 어노테이션 기법을 제안한다. 디지털음성도서 재생 중 입력된 음성 어노테이션이 어느 문장에 해당하는 것인지를 결정하는 기법을 설계하였으며, 이의 효용성을 검증하기 위해 안드로이드 환경에서 구현하였다. 눈가리개를 착용한 복수의 실험자들을 대상으로 실험한 결과 실험자들이 의도했던 위치에 정확히 어노테이션이 삽입된다는 것을 확인하였다.

음성 신호의 디지털 신호처리 (Digital Processing of Speech Signals)

  • 김진현
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 1995년도 제4회 학술대회 심포지움 및 워크샵
    • /
    • pp.103-110
    • /
    • 1995
  • 디지털이라는 말은 우리 일상 생활에서 흔히 듣는다. 시계, 체온계, 체중계, 자동차의 속도계, 혈압계 등 요즘에는 디지털 표시 제품이 아주 많아 졌다 디지털이라는 말을 영어사전에서 찾아보면 '손가락의', '계수형의' 등의 뜻으로 쓰여져 있다. 그리고 측정분야에서 디지털이라는 말은 '이산적', '불연속적' 이라는 뜻이 있으며, 이것은 값이 드문드문 있다는 의미이며, 디지털의 특징으로 미리 정해진 자리수로만 값을 표현할 수 있는 것을 뜻한다. 디지털에 대해 반대 의미를 갖는 것이 아날로그이다. (중략)

  • PDF

음성 인식 디지털 도어락 (Digital Doorlock with Voice Recognition)

  • 허경용;장우영;박준표
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2012년도 제46차 하계학술발표논문집 20권2호
    • /
    • pp.269-270
    • /
    • 2012
  • 본 논문에서는 키패드로만 동작하는 디지털 도어락에 보안을 강화하기 위해 음성 인식 장치를 추가한 음성 인식 디지털 도어락을 설계하고 구현하였다. 비밀번호로만 동작하는 도어락은 비밀번호의 분실 가능성이 있기 때문에 보안을 위해서는 화자의 특징을 인식할 수 있는 화자 종속 방식의 음성인식이 효율적이다. 본 논문에서 제안하는 방식은 가정집뿐만이 아니라 회사에서 보다 높은 수준의 보안이 필요한 곳에서 사용이 가능하다. 또한 구현한 시스템은 장애인을 위해 음성만으로 동작하는 시스템 등으로 쉽게 변경이 가능하다. 제안한 시스템은 ATmega128을 기반으로 키패드, 텍스트 LCD, 음성인식 모듈을 결합하여 구성하였다.

  • PDF

유무선망에서 사용되는 디지털 음성 부호화 기술 동향 (Digital Speech Coding Technologies for Wire and Wireless Communication)

  • 윤병식;최송인;강상원
    • 방송공학회논문지
    • /
    • 제10권3호
    • /
    • pp.261-269
    • /
    • 2005
  • 디지털 음성 부호화기는 디지털 통신 시스템의 음성 압축 수단으로 이용되어 왔으며 심한 채널에러와 한정된 주파수 자원과 같은 디지털 무선 통신 시스템 환경에 적합하게 더욱 발전해왔다. 또한 디지털 통신 기술의 비약적인 발전에 따라 사용자는 더욱 높은 수준에 해당하는 음성 서비스를 요구하게 되고 그로 인하여 단순히 의사 전달에 해당하는 음성 서비스에서 높은 수준의 멀티미디어 콘텐츠들을 수용할 수 있는 음성 및 오디오 부호화기의 기술개발로 급격히 전환 되고 있다. 본 논문에서는 유선 및 무선 디지털망에서 사용되어지는 음성 / 오디오 부호화기의 기술에 대하여 살펴보고 이와 관련된 표준화 활동 및 기술동향에 대하여 알아본다. 또한 향후 유무선 디지털망의 발전에 따른 디지털 음성 / 오디오 부호화기술의 발전 방향에 대하여 언급한다.

디지털 통신 시스템에서의 음성 인식 성능 향상을 위한 전처리 기술 (Pre-Processing for Performance Enhancement of Speech Recognition in Digital Communication Systems)

  • 서진호;박호종
    • 한국음향학회지
    • /
    • 제24권7호
    • /
    • pp.416-422
    • /
    • 2005
  • 디지털 통신 시스템에서의 음성 인식은 음성 부호화기에 의한 음성 신호의 왜곡으로 인하여 성능이 크게 저하된다. 본 논문에서는 음성 부호화기에 의한 스펙트럼 왜곡을 분석하고 왜곡된 주파수 정보를 보상하는 전처리 과정을 통하여 음성 인식 성능을 향상시키는 방법을 제안한다. 현재 널리 사용되는 표준 음성 부호화기인 IS-127 EVRC, ITU G.729 CS-ACELP. IS-96 QCELP를 사용하여 부호화에 의한 왜곡을 분석하고, 모든 음성 부호화기에 공통으로 적용하여 왜곡을 보상할 수 있는 전처리 방법을 개발하였다. 본 논문에서 제안하는 왜곡 보상 방법을 세 종류의 음성부호화기에 각각 적용하였으며, 왜곡된 음성 신호에 대한 음성 인식률에 비하여 최대 $15.6\%$의 인식률 향상을 얻을 수 있었다.

노인음성인식을 위한 전처리에 관한 연구 (A Study on Preprocessing for Elderly Voice Recognition)

  • 박지웅;이승준;권순일
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1646-1648
    • /
    • 2013
  • 고령화 되어 가는 현대 사회에서 노인들이 일반 성인과 동등한 수준에서 정보를 접근 가능하도록 스마트기기의 손쉬운 인터페이스 방법이 요구된다. 음성 인터페이스는 노인들의 스마트기기 활용도를 높여 줄 수 있지만, 성능이 평균적 성인연령 대의 발성행태에 최적화되어 있어, 노인들이 사용할 경우 음성인식률 저하를 초래한다. 그래서 노인 친화형 음성 인터페이스를 개발하기 위한 일환으로 노인음성에 대한 인식률을 향상시켜 줄 수 있는 전처리 알고리즘을 개발하고자 한다. 이를 위해 노인층과 청년층을 대상으로 음성샘플을 수집하여 분석하였고, 그 결과 노인이 청년에 비해 발성속도가 느리며 이는 스마트기기의 음성인식 기능저하로 이어진다는 것을 확인할 수 있었다.

디지털 TV 환경에서 음성인식을 통한 동적 EPG 제어 시스템 설계 및 구현 (Design and Implementation of the Speech Recognition-based Dynamic EPG Control System in Digital Broadcasting environment)

  • 김성원;나희주;시장현;김정환;정문열
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2007년도 학술대회 1부
    • /
    • pp.216-221
    • /
    • 2007
  • 디지털 방송은 수많은 프로그램과 기존의 아날로그 방송에서 볼 수 없었던 다양한 서비스를 제공하며 발전하고 있다. 하지만 시청자들에게는 방송 서비스 채널과 기능이 많아질수록 원하는 채널을 검색하고 전환하는 과정이 어렵고 복잡한 일이 되어 버릴 수 밖에 없을 것이다. 이에 본 논문에서는 이러한 정보 획득과정의 축소를 위해 전통적인 리모콘으로 채널을 검색하고 이동하는 절차를 벗어나 음성인식을 통한 동적 EPG(Electronic Program Guide) 제어 시스템을 설계하고 구현하고자 한다. 이는 EPG정보와 시청자의 TV시청 성향 및 History를 기반으로 구동되는 시스템으로 음성대화의 구조적 정의가 가능한 VXML(VoiceXML) 인터프리터를 활용한다. 본 논문에서 제안하는 대화형 인터페이스는 다양한 디지털방송 서비스에 접목이 가능 할 것이며, 새로운 형태의 디지털 가전기기 파일럿 인터페이스 개발에 도움이 될 것이라 기대한다.

  • PDF

가변전송률 음성부호화기 적용을 위한 음성활성도 측정 알고리즘 설계 (Design of Voice Activity Detection Algorithm for Variable Rate Speech Coders)

  • 김재원
    • 한국통신학회논문지
    • /
    • 제26권9A호
    • /
    • pp.1451-1458
    • /
    • 2001
  • 디지털 이동통신 시스템에서 가장 빈번하게 발생하는 음성 서비스의 궁극적인 목표는 양호한 음성 품질과 높은 주파수 효율의 제공에 있다. 음성은 묵음 구간에 의하여 구분되어진 짧고 간헐적인 음성 에너지의 반복으로 표현 가능하며 실제 음성 통화중 활성 음성이 존재하는 구간은 약 40%, 나머지 60% 구간은 묵음 또는 상대방의 음성을 듣는 구간이다. 이 묵음 구간을 효율적으로 활용함에 의해 시스템의 스펙트럼 이득을 얻을 수 있다. 본 논문에서는 디지털 이동통신 시스템과 같이 다양하게 변화하는 주변 잡음 환경에서도 강건하게 동작 가능하여 10msec 프레임 크기를 갖는 음성부호화기에 적용 가능한 음성 활성도 측정 방안을 설계하였다. 설계된 알고리즘은 음성에너지, 스펙트럼 분포, 영교차율, 그리고 LPC 잔여신호의 Peakiness 측정값을 이용하였다.

  • PDF