• Title/Summary/Keyword: 음성기반

Search Result 2,238, Processing Time 0.029 seconds

스마트 세대의 AI기반 음성인식 서비스 구매의도 영향요인에 관한 연구

  • Park, Hae-Ryong
    • Proceedings of the Korea Technology Innovation Society Conference
    • /
    • 2017.05a
    • /
    • pp.645-645
    • /
    • 2017
  • 이른바 제4차 산업혁명시대에 즈음하여 산업 기술간 융합과 함께 IOT, AI등 첨단 하이테크 제품, 서비스의 수요가 더욱 증가되는 추세이다. 현재의 스마트세대는 1인 가구가 증가 추세이며 나 홀로족인 혼술, 혼밥 등 솔로 마케팅 연구가 많이 진행 되어 지고 있다. 본 연구는 이에 발맞추어 스마트세대를 대상으로 이성적, 감성적 커뮤니케이션과 구매자의 개인적 특성을 중심으로 AI기반 음성인식 서비스의 구매의도 영향을 알아보고자 한다.

  • PDF

A Voice Boundary Detection Method Using Dynamic Parameters Based On Neural Network (신경망 기반의 동적 파라미터들을 이용한 음성 경계 추출)

  • 마창수;김계영;최형일
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10d
    • /
    • pp.616-618
    • /
    • 2002
  • 본 논문에서는 음성인식 성능을 높이기 위한 기본적 단계인 음성과 비음성 부분의 경계를 추출하는 음성 경계 추출 방법을 제안한다. 음성경계 추출을 위한 특징들로는 시간영역 분할 파라미터인 ZCR, MA를 사용하고 주파수 영역 분할 파라미터로 주파수 대역 파워 에너지 (Frequency band power energy), 포만트 계수 (Formant coefficient)를 사용하였고 각 파라미터들을 이용하여 음성 경계를 결정할 때 경험에 의해 임계치를 결정하는 단점을 보안하기 위해서 신경망을 이용한다. 신경망의 가중치와 임계치들은 지도 학습을 통해 최적화 되고, 학습을 통해 구성된 망을 음성과 비음성의 경계치 구분에 사용한다.

  • PDF

Robust Speech Reinforcement Based on Gain-Modification incorporating Speech Absence Probability (음성 부재 확률을 이용한 음성 강화 이득 수정 기법)

  • Choi, Jae-Hun;Chang, Joon-Hyuk
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • v.47 no.1
    • /
    • pp.175-182
    • /
    • 2010
  • In this paper, we propose a robust speech reinforcement technique to enhance the intelligibility of the degraded speech signal under the ambient noise environments based on soft decision scheme incorporating a speech absence probability (SAP) with speech reinforcement gains. Since the ambient noise significantly decreases the intelligibility of the speech signal, the speech reinforcement approach to amplify the estimated clean speech signal from the background noise environments for improving the intelligibility and clarity of the corrupted speech signal was proposed. In order to estimate the robust reinforcement gain rather than the conventional speech reinforcement method between speech active periods and nonspeech periods or transient intervals, we propose the speech reinforcement algorithm based on soft decision applying the SAP to the estimation of speech reinforcement gains. The performances of the proposed algorithm are evaluated by the Comparison Category Rating (CCR) of the measurement for subjective determination of transmission quality in ITU-T P.800 under various ambient noise environments and show better performances compared with the conventional method.

Design and Implementation of SALT-based Voice Browser (SALT 기반 음성 브라우저의 설계 및 구현)

  • Lee, Yong-Hee;Lee, Dong-Woo;Shin, Hee-Sook;Choi, Eun-Jeong;Park, Jun-Seok
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11a
    • /
    • pp.574-576
    • /
    • 2005
  • 정보통신 기기의 발전하면서 소형화, 경량화와 함께 이동성을 갖춘 다양한 차세대 PC 기기들이 나타나고 있다. 기존의 마우스나 키보드를 통한 인터페이스뿐만 아니라 음성, 펜, 제스처 등을 이용한 멀티모달 인터페이스에 대한 요구가 증대되면서 이에 대한 연구가 활발히 이루어지고 있다. 또한 최근의 음성 처리 기술이 발전하고 단말기의 성능이 개선되면서 음성을 이용한 인터페이스에 대한 연구가 활발히 이루어지고 있다. 본 논문에서는 브라우저에서 음성 지원을 위해 제안된 SALT를 기반으로 하여 사용자와 음성 인터페이스가 가능한 음성 브라우저를 설계하고 구현한다.

  • PDF

A Speaker Dependent Speech Recognition Method Using LSP Parameters for Small Training Data (적은 훈련 데이터를 이용한 LSP 파라메터 기반의 화자종속 음성인식에 관한 연구)

  • 곽수주
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06e
    • /
    • pp.373-376
    • /
    • 1998
  • 통신 수단의 발달로 휴대단말기의 사용이 증가하고 있으며, 이와 함께 휴대단말기에서의 음성인식에 대한 수요도 증가하고 있다. 휴대단말기의 경우 저 전송율을 가지는 음성 부호화기를 사용하게 되며, 이러한 저전송율의 음성 부호화기에서의 음성인식을 수행할 경우 인식 성능이 저하되는 현상을 보이게 된다. 본 논문에서는 이러한 문제를 해결하기 위하여 LSP 파라메터 기반의 거리척도에 관하여 비교 검토하였으며, 적은 훈련 데이터에서 사용 가능한 화자 종속 음성인식 방법으로 Dynamic Time Warping(DTW)과 변형된 Hidden Markov Model(HMM)에 관하여 검토하였다. QCELP 음성 부호화기에서 인식 어휘 당 2번의 훈련 데이터만을 이용한 화자종속 인식방법을 사용한 결과 95% 이상의 인식 성능을 얻을 수 있었다.

  • PDF

Statistical Korean Spoken Language Understanding System for Dialog Processing (대화처리를 위한 통계기반 한국어 음성언어이해 시스템)

  • Roh, Yoon-Hyung;Yang, Seong-II;Kim, Young-Gil
    • Annual Conference on Human and Language Technology
    • /
    • 2012.10a
    • /
    • pp.215-218
    • /
    • 2012
  • 본 논문에서는 한국어 대화 처리를 위한 통계기반 음성언어이해 시스템에 대해 기술한다. 음성언어이해시스템은 대화처리에서 음성 인식된 문장으로부터 사용자의 의도를 인식하여 의미표현으로 표현하는 기능을 담당한다. 한국어의 특성을 반영한 실용적인 음성언어이해 시스템을 위해서 강건성과 적용성, 확장성 등이 요구된다. 이를 위해 본 시스템은 음성언어의 특성상 구조분석을 하지 않고, 마이닝 기법을 이용하여 사용자 의도 표현을 생성하는 방식을 취하고 있다. 또한 한국어에서 나타나는 특징들에 대한 처리를 위해 자질 추가 및 점규화 처리 등을 수행하였다. 정보서비스용 대화처리 시스템을 대상으로 개발되고 있고, 차량 정보서비스용 학습 코퍼스를 대상으로 실험을 하여 문장단위 정확률로 약 89%의 성능을 보이고 있다.

  • PDF

Auto-Segmentation of Unsegmented Speech based on HMM and Time-Synchronous Viterbi Algorithm (시간동기형 Viterbi 알고리즘과 HMM에 기반한 음성의 자동 세그멘테이션)

  • 오세진;황철준;김범국;정호열;정현열
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.592-594
    • /
    • 2001
  • 본 연구에서는 음성인식에 있어서 음향모델의 고정도화를 위해 통계적 방법인 HMM과 시간동기형 Viterbi 알고리즘을 기반으로 한 세그멘트되지 않은 음성의 자동 세그멘테이션에 관한 연구를 수행하였다. 본 연구에서는 소량의 세그멘트된 음성에 대해 연속분포형 HMM 기본모델을 작성한 후 이를 표준패턴으로 사용하고, 세그멘트되지 않은 입력음성의 특징 피라미터에 대해 시간동기형 Viterbi 알고리즘의 프레임마다 최대가 되는 지점을 최적경계로 설정하고, 앞에서 구현 최적 경계 정보와 언어학적 지식인 발음사전 정보를 이용하여 음성을 세그멘테이션 하는 것이다. 본 연구와의 비교를 위해 HTK를 이용하여 위와 동일한 과정을 수행하였다. 이렇게 구한 음성의 세그멘테이션 정보를 이용하여 연속분포형 HMM 기본모델과 HTK의 CHMM 기본모델을 각각 작성한 후, 국어공학센터(KLE) 단어 데이터에 대해 단어인식 성능을 평가하였다. 실험결과, KLE 452 남성과 여성에 대해, 본 연구실 인식 시스템은 화자독립 단어인식률 89.4%, 85.1%, HTK의 화자독립 단어인식률 85.1%, 81.9%를 각각 얻었다.

  • PDF

Design & Implementation of Audio Minute System (음성기반 회의록 시스템 설계 및 구현)

  • Pyo, Sang-Ho;Lee, Sang-Hoon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.10a
    • /
    • pp.205-208
    • /
    • 2001
  • 인터넷과 컴퓨터 하드웨어 및 통신망의 발달로 멀티미디어 분야는 고도 정보 사회의 핵심적인 영역으로 부상되고 있으며, 멀티미디어 데이터에 대한 사용자의 요구도 날로 증가하고 있다. 문서, 녹취록, 테이프 형태로 관리되는 멀티미디어 데이터의 경우는 파일의 속성(attribute)에 대한 검색만이 아니라 내용(content)에 대한 검색이 필요하고, 따라서 순차검색 위주인 기존방법은 데이터의 활용 측면에서 문제가 있다. 본 논문에서는 멀티미디어 자료 중 음성 데이터를 저장 관리하는 방안으로 음성 데이터를 화면으로 도시하고 음성의 시작점과 끝점구간을 키로 하여 자동으로 데이터베이스에 삽입한 후 여기에 주석을 입력하는 음성기반 회의록 시스템(Audio Minute System)을 구현하고 그에 따른 기대효과를 제시한다.

  • PDF

Design and Implementation of a Phone System Operating on PDA (PDA기반 음성전화시스템의 설계 및 구현)

  • 안용운;김상철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04a
    • /
    • pp.199-201
    • /
    • 2001
  • 최근 모바일 컴퓨팅 기술이 발전되면서, PDA 등과 같은 소형 컴퓨팅 장치가 빠른 속도로 보급되고 있다. PDA는 이동전화나 무선 LAN 등을 통해서 다른 PDA 또는 일반 컴퓨터에 접속해서 메일 수신, 인터넷, 채팅 등에 사용되고 있다. 우리는 PDA간 또는 PDA와 데스크탑 컴퓨터간의 음성통신 기능을 제공하는 음성 전화 시스템을 개발하였다. 본 논문은 우리가 개발한 음성 전화 시스템의 기능, 구조, 구현을 소개한다. 우리의 음성 전화 시스템은 Windows CE 환경 하에서 동작하고 H.323을 지원하도록 설계되어있다. 또한, 본 논문에서는 음성통신을 위한 송, 수신 버퍼 사용의 효율적인 방법을 제안한다. 우리의 조사에 의하면, Windows CE 기반의 음성전화시스템에 대한 기존 연구가 거의 발표되지 않았다.

The Introducing voice -based public services for strengthening the accessibility of the social vulnerables and open public communication (사회적 약자의 접근성 강화와 열린 공공소통을 위한 음성기반서비스 도입의 발전적 방안과 시사점)

  • Song, Jinsoon
    • Journal of Intelligence and Information Systems
    • /
    • v.28 no.2
    • /
    • pp.279-306
    • /
    • 2022
  • Public institutions and governments develop discussions on the premise that they can facilitate smooth public communication with the socially vulnerable by promoting citizens' welfare by providing voice-based service chatbots to citizens. The purpose of the study is to propose a plan for intelligent governments to provide quick and efficient administrative services by efficiently managing knowledge and information within and outside government organizations based on ICT and facilitating access and use of information for citizens, especially vulnerable groups. This paper confirms that citizens' attitudes, perceptions, and expectations for public institutions ahead of voice-based service provision are positive through small surveys and interviews with experts with knowledge of artificial intelligence, discuss the technical aspects of voice-based services, the significance and necessity of public institutions. In addition, the government and public institutions are considering the implications of using and providing voice-based services. As a result, chatbot's voice-based service is of great significance in providing an opportunity and platform for wider citizens to participate in intelligent government, to strengthen information accessibility, guarantee and strengthen human rights and basic rights of the socially vulnerable.