• 제목/요약/키워드: 음성의 다양화

검색결과 300건 처리시간 0.025초

지능형 반응공간을 위한 연속적 화자인식에 관한 연구 (A Study of Continuous Speaker Recognition for Intelligent Responsive Space)

  • 권순일
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2007년도 학술대회 1부
    • /
    • pp.293-297
    • /
    • 2007
  • Human Computer Interaction 기술을 구체화 시키기 위한 Intelligent Responsive Space의 개발에 있어서 음성정보는 여러 가지로 유용하게 활용될 수 있다. 음성신호로부터 얻을 수 있는 다양한 정보 중의 하나가 화자인식을 이용한 화자의 신원식별이다. 이 논문에서는 화자인식 인식이 어려운 환경에서도 음성 신호로부터 추출한 특성벡터들을 선택적으로 사용함으로써 화자인식 성능을 높일 수 있는 새로운 방법을 제안하려 한다. 화자를 인식하는데 있어서 인식오류를 발생시킬 가능성이 높은 특성벡터들을 인식을 위한 판단의 대상에서 배제시킴으로써 성능을 향상시킬 수 있다. 실험결과에 의하면 0.25초에서2초 길이의 짧은 음성만으로도 기존의 방법에 비해 20에서 51%의 상대적 성능 향상을 보였다. 새롭게 제안된 방법을 적용하면 기존의 방법들에 비해 세밀하면서도 정확하게 연속적으로 화자들을 인식할 수 있게 된다.

  • PDF

강인한 음성인식을 위한 켑스트럼 거리와 로그 에너지 기반 묵음 특징 정규화 (Cepstral Distance and Log-Energy Based Silence Feature Normalization for Robust Speech Recognition)

  • 신광호;정현열
    • 한국음향학회지
    • /
    • 제29권4호
    • /
    • pp.278-285
    • /
    • 2010
  • 훈련 환경과 인식 환경의 차이가 음성인식 성능저하의 주요요인이다. 이러한 환경의 불일치를 줄이기 위한 방법으로 다양한 묵음특징 정규화 방법이 제안되고 있다. 기존의 묵음특징 정규화 방법은 낮은 SNR (Signal-to-Noise Ratio)에서 묵음구간의 에너지 레벨이 증가하여 음성/묵음 분류의 정확도가 떨어짐으로 인해 인식성능이 저하되는 문제점이 있었다. 본 논문에서는 로그 에너지와 음성/묵음(또는잡음)의 켑스트럼 특징의 분포 특성의 차이를 나타내는 켑스트럼 유클리디언(Euclidean) 거리를 결합하여 음성/묵음을 분류하는 묵음특징 정규화 방법 (Cepstral distance and Log-energy based Silence Feature Normalization)을 제안하였다. 제안한 방법은 높은 SNR에서는 로그 에너지 특징이 잡음의 영향을 적게 받는 특성을 반영하여 기존의 묵음 특징 정규화 (Silence Feature Normalization)방법의 우수성을 그대로 유지하는 반면, 낮은 SNR에서는 로그 에너지 대신 음성/묵음 분류의 분별력이 우수한 켑스트럼 거리 정보를 이용함으로써 인식성능을 향상시킬 수 있다. 인식실험결과 기존의 SFN-I/II, CSFN 방법에 비해 전반적으로 향상된 인식성능을 얻을 수 있어 그 유효성을 확인할 수 있었다.

웨이블렛 필터뱅크를 이용한 자동차 소음에 강인한 고립단어 음성인식 (Robust Speech Recognition with Car Noise based on the Wavelet Filter Banks)

  • 이대종;곽근창;유정웅;전명근
    • 한국지능시스템학회논문지
    • /
    • 제12권2호
    • /
    • pp.115-122
    • /
    • 2002
  • 본 논문에서는 웨이블렛 서브밴드 필터링기법을 이용하여 다중의사 결정기법에 기반을 둔 외부 잡음에 강인한 고립단어 음성인식 알고리즘을 제안하고자 한다. 음성인식에 있어서 외부잡음은 음성인식 알고리듬의 인식률을 저하시키는 주요 원인으로 지적되므로 음성인식기의 성능을 향상시키기 위해서 무엇보다도 잡음에 강인한 음성인식 알고리즘의 개발이 절실히 요구되고 있다. 제안된 알고리즘의 타당성을 검증하기 위하여 다양한 자동차 소음하에서 한국어 단독 숫자음 10단어의 인식률 변동을 알아 보았다. 그 결과 현재 음성인식 기법으로 널리 쓰이고 있는 벡터양자화 알고리즘만을 적용한 경우에 비해 9~25%의 향상된 인식률을 보였다.

프롬프트 레이블링을 이용한 적응형 음성기반 감정인식 프레임워크 (Adaptive Speech Emotion Recognition Framework Using Prompted Labeling Technique)

  • 방재훈;이승룡
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권2호
    • /
    • pp.160-165
    • /
    • 2015
  • 기존의 음성기반 감정인식 기술은 다양한 사용자로부터 수집된 데이터를 기반으로 범용적인 훈련 모델을 생성하고 이를 기반으로 감정을 인식한다. 이러한 음성기반 감정인식 모델링 기술은 개인 사용자의 음성특징을 정확히 고려하기 힘든 방법으로 개인마다 인식 정확도의 편차가 크다. 본 논문에서는 스마트폰 환경에서 프로프트 레이블링 기법을 활용하여 사용자에게 즉각적으로 감정을 피드백 받아 새로운 모델을 생성하여 적용하는 적응형 음성기반 감정인식 프레임워크를 제안한다. 실험을 통하여 제안하는 적응형 음성기반 감정인식 기법이 기존의 범용적인 모델을 사용하였을 때 보다 정확도가 크게 증가됨을 증명하였다.

창의적 모션 타이포그라피를 위한 준 음성정보의 시각화 연구 (The study on the visualization of paralinguistic phonetic information for creative motion typography)

  • 박선미;윤영두
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2006년도 춘계 종합학술대회 논문집
    • /
    • pp.267-272
    • /
    • 2006
  • 영상 문화의 발달과 함께 영상의 그래픽적인 요소인 이미지 일러스트레이션과 타이포그래피 등을 이용하여 정보 전달을 극대화할 수 있는 모션그래픽의 중요성도 날로 강조되고 있으며 최근 의도하는 내용을 창의적인 타이포그래피로 시각화한 사례들을 TV광고, 영화 또는 웹과 같은 다양한 미디어 매체에서 쉽게 찾아 볼 수 있으며 또한 증가 추세에 있다. 이러한 영향으로 모션 타이포그래피에서는 무형의 의미적 개념을 타이포그래피라는 시각적 형식을 통하여 표현하기 위하여 언어적 요소, 시간, 형태, 움직임, 색채 그리고 사운드 등과 같은 다양한 요소들을 응용하여 제작할 수 있는 다양한 방법들이 제안되고 있다. 하지만 실제 의사전달 과정에서 더 큰 영향을 미칠 수 있는 성별, 나이, 건강상태, 병적 상태, 신체 사이즈 등의 생리학적 특징을 들 수 있는데 이것을 의사전달이 시각적 형식으로만 표현되어야 하는 모션 타이포그래피에서도 준언어적 음성의 특성을 창의적으로 활용하여 이러한 생리적인 특성을 적절하게 반영할 수 있다면 빠르게 발전하고 있는 다른 미디어 매체보다 더 효과적인 결과를 얻을 수 있을 것이다.

  • PDF

신세기통신 2000년 전략

  • 정태기
    • 정보와 통신
    • /
    • 제17권1호
    • /
    • pp.58-63
    • /
    • 2000
  • 새 천년을 맞이하여 국내 이동전화 시장은 규모와 기술적 측면에서 놀랄만한 변화 를 겪게 될 것이다. 음성중심의 2세대 이동전화 서비스는 보급율이 50%를 넘어서며 포화수 준에 근접하고 있으며, 앞으로 무선데이타 통화량이 크게 증가하여 3~4년 후에는 총 통화량 의 50% 이상을 점유할 것으로 예측된다. 통신사업자들은 통신망의 광대역화와 글로벌화, IP Network 화를 더욱 강력하게 추진하고 있으며, 올 연말로 예정된 IMT-2000 사업자 선정은 이러한 추세를 더욱 가속화시킬 것으로 전망된다. 특히, 인터넷과 이동전화의 융화는 인간의 삶과 문화를 한순간에 변모시킬 혁명적 위력을 내포하고 있다. 정보화 시대를 향한 정보통 신업계의 대변혁이 그 절정을 향해 가속도를 붙이기 시작한 것이다. 신세기통신은 이러한 변화와 혼돈의 거친 물결 속에서 21세기 '정보통신 업계의 강자'로 도약하기 위한 힘찬 항해 를 진행하고 있다. 2000년 상반기까지 IS-2000시스템을 구축하여 최대 144kbps 수준의 고속 데이타 서비스를 제공하는 한편 i-TOUCH 017 컨텐츠 (Contents)를 한층 다양화, 첨단화 하는 등 본격적인 이동인터넷 사업을 전개해 나갈 것이다. 또 CDMA 국제 자동로밍 서비스 를 일본, 미국, 유럽 등 전세계로 확대하여 017 서비스의 글로벌화를 이룩할 계획이다. 이러 한 통신망 진화와 이동 인터넷 사업의 상당 부분을 SK텔레콤과 함께 추진하게 될 것이며 이러한 양사간의 전략적 제휴에 따른 시너지 효과는 오는 연말 IMT-2000 사업권의 성공적 확보로 이어질 것으로 기대된다. 21세기 정보통신산업은 광대역 통신망으로 대변되는 하드 웨어와 인터넷 컨텐츠로 대변되는 소프트웨어가 서로 융화되는 방향으로 발전할 것이다. 이에 따라 고객의 서비스 만족도나 사업자 선택 기준은 기존 통화물질 중심에서, 사업자가 제공하는 컨텐츠의 다양성이나 편리성으로 변화하는 것이 국적을 바꾸는 것보다 어려운 시 대가 멀지 않은 미래에 도래할 것이다. 신세기 통신 과 SK 텔레콤에는 현재 1,300만명이 넘 는 고객이 있으며. 이들 고객은 어 이상 음성통화 중심의 이동전화 고객이 아니라 신세기 통신과 SK텔레콤이 함께 구축해 나갈 거대란 무선 네트워크 사회에서 정보화 시대를 살아 갈 회원들이다. '컨텐츠의 시대'가 개막되는 것이며, 신세기통신과 SK텔레콤은 선의의 경쟁 과 협력을 통해 이동인터넷 서비스의 컨텐츠를 개발해 나가게 될 것이다.

  • PDF

ITU-T의 차세대 네트워크 QoS기술

  • 김형수
    • 전자공학회지
    • /
    • 제31권3호
    • /
    • pp.57-65
    • /
    • 2004
  • ITU에서 정의하는 차세대네트워크(NGN)의 추진 목적은 음성/데이터/멀티미디어의 다양한 서비스를 단일 패킷 통신망에 수용하고, 전달/제어 기능을 분리함으로써 서비스 수용과 통신망의 운용/유지/보수의 효율성을 제고하는 것으로 정의될 수 있다. 한편 통신망 사업자의 입장에서는 killer applications의 제공을 통한 매출 증대의 목적보다는 통신망 구축을 위한 투자비와 운용 비용의 절감으로 인한 수익 극대화에 초점을 맞추고 있다.(중략)

  • PDF

디지털시대의 도래와 국민생활

  • 한국과학기술단체총연합회
    • 과학과기술
    • /
    • 제32권11호통권366호
    • /
    • pp.43-75
    • /
    • 1999
  • 디지털시대가 활짝 열리고 있다. 디지털이 문자와 음성 그리고 영상을 지배함으로써 다양한 정보가 장소와 시간의 제약없이 눈깜짝할 사이에 옮겨다닌다. 그래서 TV와 PC가 융합, 홈쇼핑이 보편화되고 원격 진료와 강의시대가 열린다. 21C 디지털시대 우리의 생활은 어떻게 바뀌어 갈 것인지 알아 보았다.

  • PDF

멀티미디어컨텐트 산업 시장현황 및 기술동향

  • 신재식
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1998년도 국제 컨퍼런스: 국가경쟁력 향상을 위한 디지틀도서관 구축방안
    • /
    • pp.245-271
    • /
    • 1998
  • ■ 멀티미디어컨텐트의 정의 $\bigcirc$ 멀티미디어컨텐트란 문자, 음성, 화상, 데이터, 영상 등 다양한 정보형태가 디지털화되고 통합되어 정보기기로 생산, 유통, 활용되는 정보 내용물과 양방향성이 추가되어 정보 통신망을 통해 송ㆍ수신되는 정보 내용물을 지칭(중략)

  • PDF

차세대 전기통신망 및 서비스 플랫포옴 구축방안 -지능망과 TMN-

  • 이병철
    • TTA 저널
    • /
    • 통권37호
    • /
    • pp.71-92
    • /
    • 1995
  • 통신망에 대한 고객의 요구는 음성이 대부분을 차지하고 기간통신망은 독점을 유지하였으나, 통신 모드(비음성, 데이터, 화상 등)에 대한 고객의 요구가 다양해지고 통신망은 개방과 경쟁이라는 새로운 위치에 놓이게 되었다. 따라서 이러한 변화에 대처하기 위하여 전세계적으로 차세대 통신망 및 서비스를 제공하기 위한 연구가 활발히 수행되어지고 있다. 이 가운데 가장 중요한 개념은 망요소(network element)를 기능화하고 서비스 빌딩블럭(generic service independent building block)의 집합에 의하여 다양한 미래 통신 서비스에 대한 유연하고(flexible), 일관성(uniform)있는 서비스 제공을 목표로 하는 지능망 구조(Intelligent Network Architecture)와 미래 통신망 및 서비스를 운용, 조절, 유지보수에 필요한 일련의 지원시스팀(support systems) 이상의 관리기능 영역을 제공하기 위한 ITU-T의 TMN(Telecommunication Management Network)이다. 본 연구는, 이 두 개념의 기본적 생각의 간결한 설명 후에, IN과 TMN의 공통점을 분석하고 일반적 통신망 환경에서 미래정보 네트워킹 구조를 위한 기초로써 제공되는 통합 망 및 서비스 관리에 대하여 가능한 통합분야를 명시할 것이다. 즉 지능망의 개념모형(INCM : In Conceptual Model)을 이용하여 TMN과의 상호 연계방안, 지능망 능력 증대 방안 그리고 ETSI 표준화 내용을 살펴봄으로써 향후 지능망 사업 및 통신망 관리 운용 시스팀 구축을 통한 차세대 전기통신망 및 서비스 플랫포옴 구축방안 연구에 도움을 주는 것을 목표로 하였다.

  • PDF