• 제목/요약/키워드: 음성기반

검색결과 2,238건 처리시간 0.027초

스마트 세대의 AI기반 음성인식 서비스 구매의도 영향요인에 관한 연구

  • 박해룡
    • 한국기술혁신학회:학술대회논문집
    • /
    • 한국기술혁신학회 2017년도 춘계학술대회 논문집
    • /
    • pp.645-645
    • /
    • 2017
  • 이른바 제4차 산업혁명시대에 즈음하여 산업 기술간 융합과 함께 IOT, AI등 첨단 하이테크 제품, 서비스의 수요가 더욱 증가되는 추세이다. 현재의 스마트세대는 1인 가구가 증가 추세이며 나 홀로족인 혼술, 혼밥 등 솔로 마케팅 연구가 많이 진행 되어 지고 있다. 본 연구는 이에 발맞추어 스마트세대를 대상으로 이성적, 감성적 커뮤니케이션과 구매자의 개인적 특성을 중심으로 AI기반 음성인식 서비스의 구매의도 영향을 알아보고자 한다.

  • PDF

신경망 기반의 동적 파라미터들을 이용한 음성 경계 추출 (A Voice Boundary Detection Method Using Dynamic Parameters Based On Neural Network)

  • 마창수;김계영;최형일
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.616-618
    • /
    • 2002
  • 본 논문에서는 음성인식 성능을 높이기 위한 기본적 단계인 음성과 비음성 부분의 경계를 추출하는 음성 경계 추출 방법을 제안한다. 음성경계 추출을 위한 특징들로는 시간영역 분할 파라미터인 ZCR, MA를 사용하고 주파수 영역 분할 파라미터로 주파수 대역 파워 에너지 (Frequency band power energy), 포만트 계수 (Formant coefficient)를 사용하였고 각 파라미터들을 이용하여 음성 경계를 결정할 때 경험에 의해 임계치를 결정하는 단점을 보안하기 위해서 신경망을 이용한다. 신경망의 가중치와 임계치들은 지도 학습을 통해 최적화 되고, 학습을 통해 구성된 망을 음성과 비음성의 경계치 구분에 사용한다.

  • PDF

음성 부재 확률을 이용한 음성 강화 이득 수정 기법 (Robust Speech Reinforcement Based on Gain-Modification incorporating Speech Absence Probability)

  • 최재훈;장준혁
    • 대한전자공학회논문지SP
    • /
    • 제47권1호
    • /
    • pp.175-182
    • /
    • 2010
  • 본 논문에서는 배경 잡음 환경에서 배경 잡음에 의해 저하된 음성 신호의 명료도를 soft decision 기반의 음성 부재 확률을 이용하여 음성 강화 이득을 수정함으로써 음성의 명료도를 보다 향상시키는 기법을 제안한다. 배경 잡음 환경에서 저하된 음성의 명료도를 향상시키기 위한 기존의 음성 강화 기법으로써 soft decision을 이용하여 오염된 음성 신호로부터 깨끗한 음성 신호만 증폭시키는 알고리즘이 제안되었다. 기존의 음성 강화 기법 보다 음성 구간과 비음성 구간 및 전이 구간에서 강인한 음성 강화 이득을 추정하기 위하여 soft decision 기반의 음성 부재 확률 (Speech Absence Probability)을 음성 강화 이득에 통합한 음성 강화 이득 수정 알고리즘을 제안한다. 제안된 음성 강화 기법의 성능은 다양한 배경 잡음 환경에서 ITU-T P.800의 주관적인 음질 측정 방법인 (Comparison Category Rating) 테스트에 의해서 평가되었으며, 기존의 음성 강화 기법과 비교하여 향상된 성능을 보여주었다.

SALT 기반 음성 브라우저의 설계 및 구현 (Design and Implementation of SALT-based Voice Browser)

  • 이용희;이동우;신희숙;최은정;박준석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (1)
    • /
    • pp.574-576
    • /
    • 2005
  • 정보통신 기기의 발전하면서 소형화, 경량화와 함께 이동성을 갖춘 다양한 차세대 PC 기기들이 나타나고 있다. 기존의 마우스나 키보드를 통한 인터페이스뿐만 아니라 음성, 펜, 제스처 등을 이용한 멀티모달 인터페이스에 대한 요구가 증대되면서 이에 대한 연구가 활발히 이루어지고 있다. 또한 최근의 음성 처리 기술이 발전하고 단말기의 성능이 개선되면서 음성을 이용한 인터페이스에 대한 연구가 활발히 이루어지고 있다. 본 논문에서는 브라우저에서 음성 지원을 위해 제안된 SALT를 기반으로 하여 사용자와 음성 인터페이스가 가능한 음성 브라우저를 설계하고 구현한다.

  • PDF

적은 훈련 데이터를 이용한 LSP 파라메터 기반의 화자종속 음성인식에 관한 연구 (A Speaker Dependent Speech Recognition Method Using LSP Parameters for Small Training Data)

  • 곽수주
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 2호
    • /
    • pp.373-376
    • /
    • 1998
  • 통신 수단의 발달로 휴대단말기의 사용이 증가하고 있으며, 이와 함께 휴대단말기에서의 음성인식에 대한 수요도 증가하고 있다. 휴대단말기의 경우 저 전송율을 가지는 음성 부호화기를 사용하게 되며, 이러한 저전송율의 음성 부호화기에서의 음성인식을 수행할 경우 인식 성능이 저하되는 현상을 보이게 된다. 본 논문에서는 이러한 문제를 해결하기 위하여 LSP 파라메터 기반의 거리척도에 관하여 비교 검토하였으며, 적은 훈련 데이터에서 사용 가능한 화자 종속 음성인식 방법으로 Dynamic Time Warping(DTW)과 변형된 Hidden Markov Model(HMM)에 관하여 검토하였다. QCELP 음성 부호화기에서 인식 어휘 당 2번의 훈련 데이터만을 이용한 화자종속 인식방법을 사용한 결과 95% 이상의 인식 성능을 얻을 수 있었다.

  • PDF

대화처리를 위한 통계기반 한국어 음성언어이해 시스템 (Statistical Korean Spoken Language Understanding System for Dialog Processing)

  • 노윤형;양성일;김영길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.215-218
    • /
    • 2012
  • 본 논문에서는 한국어 대화 처리를 위한 통계기반 음성언어이해 시스템에 대해 기술한다. 음성언어이해시스템은 대화처리에서 음성 인식된 문장으로부터 사용자의 의도를 인식하여 의미표현으로 표현하는 기능을 담당한다. 한국어의 특성을 반영한 실용적인 음성언어이해 시스템을 위해서 강건성과 적용성, 확장성 등이 요구된다. 이를 위해 본 시스템은 음성언어의 특성상 구조분석을 하지 않고, 마이닝 기법을 이용하여 사용자 의도 표현을 생성하는 방식을 취하고 있다. 또한 한국어에서 나타나는 특징들에 대한 처리를 위해 자질 추가 및 점규화 처리 등을 수행하였다. 정보서비스용 대화처리 시스템을 대상으로 개발되고 있고, 차량 정보서비스용 학습 코퍼스를 대상으로 실험을 하여 문장단위 정확률로 약 89%의 성능을 보이고 있다.

  • PDF

시간동기형 Viterbi 알고리즘과 HMM에 기반한 음성의 자동 세그멘테이션 (Auto-Segmentation of Unsegmented Speech based on HMM and Time-Synchronous Viterbi Algorithm)

  • 오세진;황철준;김범국;정호열;정현열
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.592-594
    • /
    • 2001
  • 본 연구에서는 음성인식에 있어서 음향모델의 고정도화를 위해 통계적 방법인 HMM과 시간동기형 Viterbi 알고리즘을 기반으로 한 세그멘트되지 않은 음성의 자동 세그멘테이션에 관한 연구를 수행하였다. 본 연구에서는 소량의 세그멘트된 음성에 대해 연속분포형 HMM 기본모델을 작성한 후 이를 표준패턴으로 사용하고, 세그멘트되지 않은 입력음성의 특징 피라미터에 대해 시간동기형 Viterbi 알고리즘의 프레임마다 최대가 되는 지점을 최적경계로 설정하고, 앞에서 구현 최적 경계 정보와 언어학적 지식인 발음사전 정보를 이용하여 음성을 세그멘테이션 하는 것이다. 본 연구와의 비교를 위해 HTK를 이용하여 위와 동일한 과정을 수행하였다. 이렇게 구한 음성의 세그멘테이션 정보를 이용하여 연속분포형 HMM 기본모델과 HTK의 CHMM 기본모델을 각각 작성한 후, 국어공학센터(KLE) 단어 데이터에 대해 단어인식 성능을 평가하였다. 실험결과, KLE 452 남성과 여성에 대해, 본 연구실 인식 시스템은 화자독립 단어인식률 89.4%, 85.1%, HTK의 화자독립 단어인식률 85.1%, 81.9%를 각각 얻었다.

  • PDF

음성기반 회의록 시스템 설계 및 구현 (Design & Implementation of Audio Minute System)

  • 표상호;이상훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.205-208
    • /
    • 2001
  • 인터넷과 컴퓨터 하드웨어 및 통신망의 발달로 멀티미디어 분야는 고도 정보 사회의 핵심적인 영역으로 부상되고 있으며, 멀티미디어 데이터에 대한 사용자의 요구도 날로 증가하고 있다. 문서, 녹취록, 테이프 형태로 관리되는 멀티미디어 데이터의 경우는 파일의 속성(attribute)에 대한 검색만이 아니라 내용(content)에 대한 검색이 필요하고, 따라서 순차검색 위주인 기존방법은 데이터의 활용 측면에서 문제가 있다. 본 논문에서는 멀티미디어 자료 중 음성 데이터를 저장 관리하는 방안으로 음성 데이터를 화면으로 도시하고 음성의 시작점과 끝점구간을 키로 하여 자동으로 데이터베이스에 삽입한 후 여기에 주석을 입력하는 음성기반 회의록 시스템(Audio Minute System)을 구현하고 그에 따른 기대효과를 제시한다.

  • PDF

PDA기반 음성전화시스템의 설계 및 구현 (Design and Implementation of a Phone System Operating on PDA)

  • 안용운;김상철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (A)
    • /
    • pp.199-201
    • /
    • 2001
  • 최근 모바일 컴퓨팅 기술이 발전되면서, PDA 등과 같은 소형 컴퓨팅 장치가 빠른 속도로 보급되고 있다. PDA는 이동전화나 무선 LAN 등을 통해서 다른 PDA 또는 일반 컴퓨터에 접속해서 메일 수신, 인터넷, 채팅 등에 사용되고 있다. 우리는 PDA간 또는 PDA와 데스크탑 컴퓨터간의 음성통신 기능을 제공하는 음성 전화 시스템을 개발하였다. 본 논문은 우리가 개발한 음성 전화 시스템의 기능, 구조, 구현을 소개한다. 우리의 음성 전화 시스템은 Windows CE 환경 하에서 동작하고 H.323을 지원하도록 설계되어있다. 또한, 본 논문에서는 음성통신을 위한 송, 수신 버퍼 사용의 효율적인 방법을 제안한다. 우리의 조사에 의하면, Windows CE 기반의 음성전화시스템에 대한 기존 연구가 거의 발표되지 않았다.

사회적 약자의 접근성 강화와 열린 공공소통을 위한 음성기반서비스 도입의 발전적 방안과 시사점 (The Introducing voice -based public services for strengthening the accessibility of the social vulnerables and open public communication)

  • 송진순
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.279-306
    • /
    • 2022
  • 공공기관과 정부는 시민에게 음성 기반 서비스 챗봇을 제공함으로써 시민 복지를증진하고 사회적 취약계층과 원활한 공공소통을 도모할 수 있다는 전제로 논의를 전개한다. 이 논문의 연구 목적은 지능형 정부가 ICT를 기반으로 조직 내외 지식 및 정보를 데이터화하고 체계화하여 능률적으로 관리하고 시민들, 특히 취약계층의 정보 접근과 활용을 용이하게 하여 신속하고 효율적인 행정서비스를 제공해 줄 방안을 제안하기 위함이다. 연구방법으로 소규모 설문조사를 통해 음성기반 서비스 제공을 앞둔 공공기관에 대한 시민들의 태도, 인식 및 기대가 긍정적임을 확인하고, 인공지능에 관한 지식을 갖춘 전문가들 인터뷰를 통해 음성기반 서비스에 필요한 기술적 측면과 공공기관 음성기반서비스 제공의 의의 및 필요성, 구축시 고려해야 할 제반사항들과 정책적 제언, 시사점을 살펴보고 한계 및 연구발전에 대해 고민해본다. 결과적으로, 챗봇의 음성기반서비스는 더 폭넓은 시민들이 지능형 정부에 참여를 실현하며, 정보 접근성을 강화하고 사회적 취약계층의 인권 및 기본권 보장·강화하는 사회적 배려와 디지털 포용을 실천하는 계기와 발판을 제공함에 큰 의의를 지닌다.