• Title/Summary/Keyword: 음성인식기술

Search Result 687, Processing Time 0.028 seconds

음성인식

  • 김형순
    • Proceedings of the KSPS conference
    • /
    • 1994.02a
    • /
    • pp.156-165
    • /
    • 1994
  • 반도체 및 컴퓨터 응용기술 등의 급속한 발전과 더불어 인간의 가장 자연스러운 의사 전달수단인 음성을 인간과 기계 사이의 의사소통의 매개체로 사용하기 위한 음성인식기술에 관한 연구가 활발히 진행되고 있으며, 일부 상품화된 음성인식 시스템들이 다양한 응용분야에 걸쳐 등장하고 있다. 본 고에서는 지금까지 개발되어온 음성인식기술의 방법론 및 기술적으로 해결해야 할 과제들을 살펴보고, 음성인식기술에 관한 국내외 연구동향과 음성인식의 응용분야, 그리고 앞으로의 전망에 대해 논의한다. 이 과정에서 음성학 및 언어학적 지식이 음성인식에서 차지하는 중요성에 대해서도 일부 언급한다.

  • PDF

New Services based on speech recognition technology (음성인식기술을 이용한 새로운 서비스)

  • 구명완
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1995.06a
    • /
    • pp.47-51
    • /
    • 1995
  • 음성인식기술을 이용한 시스템이 상용화되기 위해서 필요한 기술의 최근 동향과 현재의 기술로 실용화가 이루어지고 있는 서비스등에 대해 알아본다. 최근의 음성인식기술은 실용화를 목표로 음성 인식을 위한 기본 유니트 선정, 화자의 음성을 거절하는 기능, 및 실시간 구현 기술에 대한 연구가 활발히 진행되고 있다. 한편 현재의 기술로 가능한 실용서비스로는 전화번호 안내, 음성 다이얼링 서비스 등과 같이 현재 제공되고 서비스의 비용을 절감시키는 것과 교통안내, 날씨안내, 영화관 예약에 음성인식기술을 적용하여 새로운 서비스를 제공하는 것이 있다.

  • PDF

음성정보처리기술 응용서비스

  • 구명완;김재인
    • Korea Information Processing Society Review
    • /
    • v.11 no.2
    • /
    • pp.17-24
    • /
    • 2004
  • 음성정보처리 기술은 사람의 말을 음향, 언어, 심리학 및 공학적인 측면에서 연구하여 사람과 기계사이의 인터페이스를 자연스럽게 하는 것을 목표로 하고 있으며, 음성인식, 음성합성 및 언어처리 기술로 이루어져 있다. 음성인식기술이란 사람의 말을 이해하는 것뿐만 아니라 화자를 식별하고 인증하는 기술도 포함하고 있으며, 음성합성 기술이란 문자로부터 음성을 생성하는 기술을 의미한다. 그리고 언어처리 기술은 음성인식, 음성합성기술 속에 포함될 수 있으나 최근 마크업 언어를 활용하여 음성인식, 합성 등을 제어하는 경향이 도래함에 따라 언어처리 기술을 따로 분류하기도 한다[1][2].(중략)

  • PDF

Trends of Hardware Accelerator for the Embedded Speech Recognition (내장형 음성인식기를 위한 전용 하드웨어가속기 기술개발 동향)

  • Kim, J.Y.;Kim, T.J.;Lee, J.H.;Eum, N.W.
    • Electronics and Telecommunications Trends
    • /
    • v.29 no.4
    • /
    • pp.91-100
    • /
    • 2014
  • 사람의 말소리를 문자로 변환하여 기기의 제어명령으로 활용하는 것이 음성인식 기술이다. 음성인식에 대한 기술개발 요구는 수십 년 전부터 있어 왔고, 꾸준히 제품화되고 있는 분야라 하겠다. 제품으로의 상용화가 가능한 알고리즘 및 데이터 처리체계는 HMM(Hidden Markov Model)이라는 수학적 모델링으로 정형화되어 있으며, 대규모의 반복적 데이터 수집과 정교한 학습 데이터베이스의 구축이 음성인식기술의 핵심요소라는 것이 일반적인 시각이다. 이러한 이유로 인해, 대용량 음성인식 데이터베이스의 수집, 가공 등이 가능한 인프라를 갖춘 기관 및 업체들이 음성인식기술 시장을 점유할 수 있는 것이다. 그러나, 이러한 음성인식의 서비스 제공 체계는 사물인터넷 또는 웨어러블 디바이스 등으로 음성인식 사용자 인터페이스가 확대되고 통신 및 네트워크가 연결이 불가한 경우 그 한계를 보일 수 있다. 본고에서는 이러한 문제를 해결하기 위한 내장형 음성인식기의 하드웨어가속기 기술개발에 대한 내용과 국내외 현황을 살펴보기로 한다.

  • PDF

음성에 의한 Man-Machine Communication 기술의 현황

  • 은종관
    • The Magazine of the IEIE
    • /
    • v.15 no.2
    • /
    • pp.75-87
    • /
    • 1988
  • 본 논문에서는 음성에 의한 man-machine communication의 핵심기술인 음성인식 및 합성의 전반적인 기술에 관하여 그 현황을 알아본다. 먼저 음성인식에서 해결되어야 할 문제점들을 고찰하고 격리단어 인식, 연결단어 인식, 그리고 연속언어 인식의 기술현황을 기술한다. 격리단어 인식에서는 pattern matching 방법에서 사용되는 입력어휘의 특징 추출, reference와의 유사도 측정, 유사도 측정 결과에 의한 인식결정에 관해서 논한다. 연결단어 및 연속언어 인식에서는 현재 연구가 되고 있는 "bottom-up approach"와 "top-down approach"에 관해서 설명하고 이들 방법의 어려운 점들을 고찰한다. 다음 음성 합성에서는 기존의 여러 가지 합성 방식을 검토하고 이들의 장단점을 기술한다. 마지막으로 한 예로서 한국어 text-to-speech 변환 시스템에 관하여 기술한다.

  • PDF

Noise Reduction in Speech Recognition Using Virtual Studio Technology (음성 인식에서 가상 스튜디오 기술을 이용한 잡음 제거 방법)

  • Kim, Dong Hyun;Yoo, Keun Chang;Lim, Jun Su;Baek, Se In;Lee, Yong Kyu
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.10a
    • /
    • pp.21-24
    • /
    • 2018
  • 최근 음성 인식 기술의 발전으로 음성 인식에 관한 연구가 활발히 진행되고 있다. 음성 인식 기술중에서도 외부의 잡음을 제거하여 음성 인식의 정확도를 높이는 연구의 필요성이 대두되고 있다. 본 논문에서는 음성 인식에서 가상 스튜디오 기술을 사용하여 잡음을 제거하는 방법을 제안한다. 음성 인식의 전처리 단계에서 잡음 소거 기능을 가진 VST 플러그 인을 사용하여 외부의 잡음을 제거한다. 제안한 방법을 통해 음성인식의 전처리 과정에서 정제되지 않은 음성 데이터로 인해 발생하는 오류를 방지하고 음성 인식의 인식률을 높일 것으로 기대한다.

음성인식 연구의 국내외 연구현황과 전망

  • 정현열
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.23-30
    • /
    • 1998
  • 음성인식기술이 어떻게 변천되어 왔는가를 살펴보고, 음성인식 연구에 관한 최근의 국내외 연구동향과 앞으로의 전망에 관하여 논하고자 한다. 국외의 경우 국가적 차원에서 대규모 프로젝트를 중심으로 연구가 진행되어 음성인식 기술이 크게 발전하여 현재 일부 실용화 시스템이 개발되어 사용되고 있다. 국내의 경우 1980년대부터 비교적 활발한 연구가 이루어져 최근 몇 년간 많은 발전을 가져왔다. 최근에는 대어휘 연속음성인식에서도 신뢰할 만한 결과가 많이 보고되고 있으며, 음성 인식 기술 뿐만 아니라 멀티미디어 기술을 이용한 다양한 휴먼 인터페이스를 제공하는 보다 편리한 휴대용 단말기에 관한 연구도 활발해지고 있다.

  • PDF

A policy study for the voice recognition technology based on elderly health care (음성인식기술의 노인간병 적용을 위한 정책연구)

  • Cho, Byung-Chul;Cheon, Sooyoung;Kim, Kab-Nyun;Yuk, Hyun-Seung
    • Journal of Digital Convergence
    • /
    • v.16 no.2
    • /
    • pp.9-17
    • /
    • 2018
  • The purpose of this study is to find out how voice recognition technology can be utilized to solve the elderly problem rapidly aging in Korea. Public support services and civilian nursing services for the elderly are expected to expand in Korea. In this case, voice recognition technology can be used variously for the elderly who are not familiar with the media interface. To this end, our researchers visited Japan and examined the achievements obtained by voice recognition technology in the elderly care. Especially, when caregivers write reports, they have greatly reduced their working hours by replacing the handwritten reports with ones using voice recognition technology. This method can be easily implemented in Korea. In addition, the social cost of the elderly support can be gradually reduced through the development of a robot equipped with voice recognition technology. Consequently, we realize that when voice recognition technology is combined with artificial intelligence programs of various emotion recognition functions and various policy possibilities as well.

신성장동력산업용 대어휘 음성인식 기술 동향 및 응용

  • Gang, Jeom-Ja;Gang, Byeong-Ok;Jeong, Ho-Yeong;Jeong, Hun;Lee, Yun-Geun
    • Electronics and Telecommunications Trends
    • /
    • v.23 no.1 s.109
    • /
    • pp.65-76
    • /
    • 2008
  • 신성장동력산업용 음성인식 기술은 지능형 로봇, 텔레매틱스, 홈네트워크, 차세대 PC, 디지털 콘텐츠 검색 등에 음성인식 기술을 적용하기 위한 것이다. 음성인식 기술은 사람이 일상생활 속에서 사용하는 단말기들의 제어나 정보 서비스를 마우스나 키보드를 사용하지 않고, 사람이 갖는 가장 친화적이면서 편리한 의사소통 도구인 목소리를 사용하여 원하는 단말기의 제어나 정보 서비스를 제공 받을 수 있도록 지원하는 기술을 말한다. 본 고에서는 음성인식 기술의 발전과정을 통한 음성인식 기술의 발전 동향에 대해서 설명하고, 신성장동력산업 분야의 인터페이스로 음성인식 기술을 적용한 핵심 요소 기술에 대한 개발 동향과 응용 사례에 대해서 기술한다.

Development and Enhancement of Automatic Caption Generation System based on Speech-to-Text for the Hearing Impaired (청각장애인을 위한 음성-자막 자동 변환 시스템 개발 및 음성 인식률 고도화)

  • Choi, Mi-Ae;Kim, Seung-Hyun;Jo, Min-Ae;Park, Dong-young;Kim, Yong-Ho;Yoon, Jong-hoo
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.07a
    • /
    • pp.465-468
    • /
    • 2020
  • 인터넷 미디어, OTT, VOD 등 신규미디어가 비장애인의 정보제공 매체로 널리 확대되나, 자막 서비스를 제공하지 않아 청각장애인의 정보 격차가 더욱 심화되고 있다. 청각장애인의 미디어 접근성 제고를 위해 음성인식 서버 및 스마트 폰·태블릿 앱 간 연계를 통해 음성을 인식하여 자동으로 자막을 생성하고 표시하는 음성-자막 자동 변환 시스템을 개발하였고 음성인식률을 높이기 위해 뉴스/시사/다큐 장르 영상 콘텐츠의 음성에 대해 학습용 데이터를 제작하여 음성인식 성능을 고도화 시켰다. 본 논문에서는 청각장애인을 위한 음성-자막 자동 변환시스템 구성과 음성인식률 비교 평가 결과를 보여준다.

  • PDF