• 제목/요약/키워드: 음성 명령

검색결과 112건 처리시간 0.026초

음절 복원 규칙과 형태소 분석을 이용한 음성인식 후처리 (Post-Processing of Voice Recognition Using Phonologic Rules and Morphologic analysis)

  • 서상현;김재홍;김해진;김미진;이상조
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.495-499
    • /
    • 1997
  • 컴퓨터의 사용이 보편화됨에 따라 컴퓨터와 사용자 사이의 쉽고 자연스러운 의사 소통을 위한 자연어 인터페이스에 대한 연구가 활발히 진행되고 있다. 이 중에서 특히, 음성인식 분야는 음성명령, 받아쓰기 시스템 등 일반적인 컴퓨터 사용자의 요구를 충족시켜 줄 수 있는 분야로 주목을 받고 있다. 그러나 음성인식은 인식 자체만으로는 인식률에 한계가 있으며, 인식 결과를 향상시키기 위해서는 후처리 단계가 필요하다. 본 논문에서는 음성 인식의 성능을 향상시키기 위해 음성 인식의 결과로 들어온 연속된 한국어 음성을 올바른 음절로 복원시켜 주는 시스템을 구현하였다. 이 시스템에서는 어절단위의 연속된 한국어 음성을 입력으로 받아 한국어 발음 규칙을 역으로 적용하여 원래의 음절로 복원시키고, 형태소 분석기를 이용하여 복원된 음절이 올바른지를 확인하고 수정한다. 초등학교 교과서에 나오는 문장을 대상으로 본 시스템의 성능을 실험한 결과, 90.42%의 복원율을 나타내었다. 현재 정확하게 복원이 되지 않는 것 중에는 동음이의어가 차지하는 비중이 크며, 이 문제는 구문분석이나 의미분석을 이용하여 어느 정도 개선할 수 있을 것으로 보인다.

  • PDF

국방 분야에서 전장 소음 환경 하에 음성 인식 기술 연구 (A Study on the Effective Command Delivery of Commanders Using Speech Recognition Technology)

  • 김영훈;권현
    • 융합보안논문지
    • /
    • 제24권2호
    • /
    • pp.161-165
    • /
    • 2024
  • 최근 음성 인식 모델들이 점점 발달하고 있고 이와 더불어 좋은 데이터를 얻기 위한 다양한 음성 처리 기술들도 발전하고 있다. 한편 국방 분야에서도 노이즈가 낀 음성 데이터로부터 노이즈를 제거하고 이를 효과적으로 음성 인식하는 기술을 접목하려고 시도하고 있다. 본 논문에서는 다양한 소음이 존재하는 전장 상황 속에서 음성 인식 기술을 활용하여 효과적으로 지휘관이 명령을 전달할 수 있는 음성 인식방법을 제안하였다. 제안방법은 노이즈가 있는 음성에 대해서 노이즈를 제거 후 OpenAI의 Whisper 모델을 사용하여 텍스트로 변환하는 방법이다. 실험결과로써, 제안 방법은 노이즈를 제거하지 않은 기존 방법에 비해서 글자 오류률(Charactor Error Rate, CER)이 6.17% 감소된 것을 볼 수가 있었다. 추가적으로 제안방법을 이용하여 국방분야에 적용할 수 있는 부분에 대해서도 기술하였다.

5W1H 프로그래밍 모델을 기반으로 한 음성인식 스마트 홈 시스템 (Speech Recognition based Smart Home System using 5W1H Programming Model)

  • 백영태;이세훈;김지성;신보배
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2017년도 제55차 동계학술대회논문집 25권1호
    • /
    • pp.43-44
    • /
    • 2017
  • 본 논문에서는 상용화된 음성-인식 디바이스가 다른 임베디드 모듈과 통신하며 스마트홈 중앙처리 서버역할을 수행하려 할 때 제작사에 의해 개발되어지지 않거나 제한된 모듈과 서비스만을 제공한다는 문제점을 해결하기 위해 사용자가 직접 간단한 작업으로 원하는 기능의 모듈을 개발하여 자유롭게 음성인식명령을 추가할 수 있는 플랫폼을 제안한다. 본 논문에서 제안하는 플랫폼의 개념은 특정 OS에 종속되지 않으므로 다양한 시스템에서 제공될 수 있도록 설계되었으며 실험 플랫폼은 Windows기반으로 제작되었으나 다른 시스템에도 같은 개념을 적용하여 제작할 수 있다.

  • PDF

지능형 홈네트워크 시스템을 위한 가변어휘 연속음성인식시스템에 관한 연구 (A Study on Vocabulary-Independent Continuous Speech Recognition System for Intelligent Home Network System)

  • 이호웅;정희석
    • 한국ITS학회 논문지
    • /
    • 제7권2호
    • /
    • pp.37-42
    • /
    • 2008
  • 본 논문에서는 지능형 홈네트워크의 음성제어를 위한 가변어휘 연속음성인식시스템을 개발하였다. 또한 자연스런 음성명령에 대한 인식을 위해 핵심어 기반의 자연스런 연속어휘에 대한 대화형 시나리오를 작성하였고, 핵심어기반의 인식 엔진 및 데이터베이스를 구축하여 인식엔진의 성능을 최적화하였다.

  • PDF

얼굴인식을 통한 음성 명령 스마트 거울 시스템 (Voice Command through Facial Recognition Smart Mirror System)

  • 이세훈;김수민;박현규
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2019년도 제59차 동계학술대회논문집 27권1호
    • /
    • pp.253-254
    • /
    • 2019
  • 본 논문에서는 가정 등에서 사용자의 행동 반경에 가장 많이 있는 거울에 홈 제어 및 근처 전열 기구들을 보다 쉽게 제어 할 수 있도록 Google Speech API와 Open CV 라이브러리를 사용해 음성인식을 통한 홈 제어 방안을 제시하였다. 이를 통해서 바쁜 아침에 화장 등을 하는 경우 두 손을 자유롭게 사용하면서 디바이스를 음성으로 제어 할 수 있는 편리성을 제공하였다.

  • PDF

이산 지속시간제어 연속분포 HMM을 이용한 연속 음성 인식 (Korean Continuous Speech Recognition Using Discrete Duration Control Continuous HMM)

  • 이종진;김수훈;허강인
    • 한국음향학회지
    • /
    • 제14권1호
    • /
    • pp.81-89
    • /
    • 1995
  • 본 논문에서는 연속분포 HMM에 이산 지속시간제어와 회귀계수를 파라메터로 추가한 이산 지속시간제어 연속분포 HMM 모델을 이용하여 한국어 연속음성 인식 시스템을 구성하였다. 또한 25 문장의 로보트 제어명령문을 유한상태 오토마타에 의해 구문제어를 실시한 One Pass DP법으로 인식 실험을 실시하였다. 4연 숫자음에 대한 인식 실험에서 이산 지속시간 제어와 회귀 계수를 포함한 경우 평균 $93.8\%$의 인식율을, 포함하지 않은 경우 $80.7\%$의 인식율을 얻었다. 로보트 제어 명령문의 인식에서는 구문제어를 실시하지 않은 경우 평균 $90.9\%$, 유한 상태 오토마타에 의한 구문제어를 이용한 경우 평균 $98.4\%$$7.5\%$의 인식율이 향상되었다.

  • PDF

POV 현상을 이용한 프로펠러 디스플레이 (Propeller Display Using POV Phenomenon)

  • 이동욱;가두영;이동호;박용욱
    • 한국전자통신학회논문지
    • /
    • 제17권6호
    • /
    • pp.1181-1186
    • /
    • 2022
  • 본 연구에서는 POV(Persistence of Vision) 현상을 활용한 프로펠러 디스플레이를 제작하여 기존 디스플레이(CRT, LCD, LED 등)를 이용하는 것보다 저전력, 간단한 구성, 더 매력 있는 생김새를 가지는 고효율 디스플레이의 동작 특성을 연구하였다. Hall 센서를 사용하여 기준점을 설정한 후 앱 프로그램을 기반으로 제작한 핸드폰 애플리케이션을 통해 채널 인식 신호 및 음성인식 신호를 Bluetooth를 사용하여 디스플레이에 표시하고 전달받은 동작 명령에 따라 명령을 수행하도록 디스플레이를 설계 제작하였다. 실험 결과, 모터 속도 1,030rpm에서 원하는 정보가 디스플레이 화면상에 최적으로 표현되는 동작 특성을 확인하였다.

독서장애인을 위한 음성 도서 어노테이션 검색 기법 (A Voice Annotation Browsing Technique in Digital Talking Book for Reading-disabled People)

  • 박주현;임순범;이종우
    • 한국멀티미디어학회논문지
    • /
    • 제16권4호
    • /
    • pp.510-519
    • /
    • 2013
  • 본 연구에서는 독서장애인을 위한 모바일 전자책에 저장된 어노테이션을 탐색하고 그 결과를 재생하는 기법을 제안하고, 이를 음성 어노테이션 브라우징 시스템이라 칭하였다. 제안된 음성 어노테이션 브라우징 시스템은 명령 입력, 중요도 분석 및 추천, 검색, 출력 단계로 구성된다. 특히 본 논문에서는 대상 사용자가 청각 의존도가 높은 독서장애인들이기 때문에 완전히 청각에 의존해서 사용할 수 있도록 모든 단계에서 음성인식 인터페이스를 제공한다. 제안된 음성 어노테이션 브라우징 시스템의 효율성을 검증하기 위해 모바일 안드로이드 환경에서 실행되는 전자책 소프트웨어와 음성 어노테이션 브라우징 시스템을 설계하고 구현하였다. 구현된 시스템은 전맹인으로 구성된 다수의 사용자들로 하여금 검증하도록 하였으며, 그 결과 이들이 원하는 어노테이션을 찾는 과정이 성공적으로 이루어 질 수 있음을 확인 하였다.

LabVIEW 기반의 MHA 명령방식 비행종단수신기 점검장비 구현 (Implementation of LabVIEW based Testbed for MHA FTSR)

  • 김명환;황수설;임유철;마근수
    • 항공우주기술
    • /
    • 제13권1호
    • /
    • pp.55-62
    • /
    • 2014
  • 비행종단수신기는 발사체 비행 중 발생할 수 있는 비정상 상태에 대비하여 비행을 중단시키는 지상 명령을 수신하는 장치이다. Secure 톤은 IRIG에서 규정한 7개의 음성 주파수 대역 톤 신호 중 2개의 톤을 조합하여 11개의 연속적인 부호로 명령 포맷을 구성한다. 한국형발사체 탑재를 고려해 개발 중인 비행종단수신기는 Secure 톤에 암호화 기능을 추가한 MHA 명령 방식을 적용하였다. 제작된 비행종단수신기의 성능 및 기능을 점검하기 위해선 동일한 규격의 RF 신호를 발생함과 동시에 수신기의 외부 출력 포트를 모니터링하고 RS-422 통신을 제어하며 시험 데이터 저장 기능을 제공하는 점검장비가 필요하다. 본 논문에서는 비행종단수신기 인터페이스 및 적용된 명령 방식에 대한 간략한 설명과 함께 LabVIEW 기반으로 제작된 점검장비의 하드웨어 구성, 소프트웨어 구현 및 기능 점검 결과에 대해 기술한다.

Vincent6 DSP코어를 이용한 G.728 음성 부호화기의 실시간 구현 (Real-time implementation of the G.728 speech codec using the Vincent6 DSP core)

  • 성호상
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.131-135
    • /
    • 2000
  • 본 논문에서는 고성능 고정 소수점 DSP (Digital Signal Processor) 코어인 Vincent6 코어 [1]를 이용하여 ITU-T C.728 음성 부호화기를 실시간으로 구현하였다 G.728 은 16 kb/s전송률의 ITU-T표준 음성 부호화기이며, 입력신호는 8 kHz로 샘플링되며 샘플 당 16 bit 로 양자화된 PCM 신호이다. G.728 은 LD-CELP(Low Delay Code Excited Linear Prediction)라고도 하며, 알고리 듬 delay는 0.625ms 이다. Vincent6 DSP core 는 VLIW (Very-Long Instruction Word) 특성을 가지므로 다중 명령 (multiple instruction)을 수행할 수 있다 이를 위해서 G.728 annex G를 이용하여 고정 소숫점 연산으로 코드를 작성한 후, 이를 vincent6 어셈블리 코드로 구현하였다. 최종적으로 구현된 코드는 ITU-T 의 test vector 에 대 해 bit exact 한 결과를 보이며 34 MCPS (Million Cycles Per Second)의 계산량을 가지며 사용 메모리크기는 데이터 메모리가 약 9KByte, 프로그램 메모리가 약 57 KByte 이다.

  • PDF