• Title/Summary/Keyword: 음성제어

Search Result 696, Processing Time 0.025 seconds

A Study on Recognition of Korean Continuous Speech using Discrete Duration CHMM. (이산 시간 제어 CHMM을 이용한 한국어 연속 음성 인식에 관한 연구)

  • 김상범
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1994.06c
    • /
    • pp.368-372
    • /
    • 1994
  • 확률적 모델을 이용한 HMM 으로 한국어 연속 음성 인식시스템을 구성하였다. 학습 모델로서는 양자화 DCK가 없는 연속출력 확률밀도를 사용한 연속출력 확률분포 HMM과 과도 구간 및 정상 구간의 시간구조를 충분히 BYGUS할 수 없는 것을 계속시간 확률 파라메터를 추가하여 보완한 이산 지속시간 제어 연속출력 확률분포 HMM을 이용하였다. 인식 알고리즘은 시계열 패턴의 시간축상에서의 비선형 신축을 고려한 에 매칭으로서, 음절의 경계를 자동으로 검출하는 O에을 이용하였다. 실험에서 사용된 연속음성데이타는 4연 숫자음과 연속음성 10문장으로 하였다. 인식 실험 결과 4연 숫자음에서 CHMM은 80.7%, DDCHMM은 92.9%의 인식률을 얻었고, 신문 사설에서 발췌한 연속 음성문장의 경우 CHMM 54.2%, DDCHMM에서는 68.9%을 얻어, 시간장 제어를 고려한 DDCHMM이 CHMM보다 SHB은 인식률을 얻었다.

  • PDF

Chaotic Speech Secure Communication Using Feedback Masking Techniques (피드백 마스킹 기법을 사용한 카오스 음성비화통신)

  • 이익수;여지환
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2002.12a
    • /
    • pp.353-356
    • /
    • 2002
  • 본 논문은 카오스 신호를 이용하여 안전한 음성신호의 전송을 위한 아날로그 비화통신 시스템의 성능분석에 관한 연구이다. 기존의 카오스 동기화 및 카오스 변조통신 알고리즘을 개선하여 실제 통신환경에서 발생하는 다양한 조건들을 적용하여 음성신호의 복원능력을 모의실험으로 분석하였다. 일반적인 PC 제어기법과 제안한 피드백 마스킹 기법을 사용하여 송신단에서 음성신호를 카오스 신호로 마스킹하여 변조하고, 통신채널에 잡음신호를 추가하여 전송하였다. 수신단에서는 카오스 응답시스템을 이용하여 음성신호를 복조하고, 복원성능을 계산하기 위하여 아날로그 복원 에러신호의 평균전력을 제안하여 계산하였다. 실험결과 마스킹 정도, 파라미터들의 민감성, 채널잡음 등에 대하여 PC 제어기법보다 피드백 제어기법의 복원성능이 우수함을 확인할 수 있었다. 또한 로렌쯔 카오스 시스템을 비화통신시스템에 사용할 경우 파라미터들의 조합으로 암호키를 구성해야 하므로 키값들의 선정에 기준이 되는 파라미터 변화율에 대응하는 복원에러율의 관계를 실험 값으로 구하였다.

Speech-Recognition Drone Camera System using OpenPose (OpenPose를 활용한 음성인식기반 드론제어 촬영시스템)

  • Cho, Yu-Jin;Kim, Se-Hyun;Kwon, Ye-Rim;Jung, Soon-Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.11a
    • /
    • pp.1056-1059
    • /
    • 2020
  • 최근 드론과 1인 미디어 시장의 성장으로, 영상 촬영 분야에서의 드론 산업이 활발하게 발전되고 있다. 본 논문에서는 딥러닝 기반 다중 객체 인식 기술인 Openpose를 활용하여 인물촬영을 위한 음성인식 드론 제어 시스템을 제안한다. 해당 시스템은 자연어 처리된 음성명령어를 통해 드론이 각 촬영 객체에 대한 회전, 초점변화 등 실제 영상촬영기법에 사용되는 다수의 동작을 수행할 수 있도록 한다. 최종적으로 96.2%의 정확도로 음성명령에 따라 동작을 수행하는 것을 확인할 수 있다. 이는 누구나 전문적 지식이나 경험 없이 음성만으로 쉽게 드론을 제어할 수 있을 것으로 기대된다.

Voice-assisted Hand-off Control Device for Aircraft Assisted Piloting Environment (항공기 보조 조종 환경을 위한 음성 지원 핸드오프 제어 장치)

  • Park, Myeong-Chul;Cha, Hyun-Jun;Kim, Tae-Hyung
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2021.07a
    • /
    • pp.485-486
    • /
    • 2021
  • 항공기에는 많은 시스템이 있고 다양한 장치들이 있다. 이 장치들은 사용자의 명령을 입력받아 사용되는데 자동을 제외한 거의 모든 시스템들은 사용자의 직접적인 조작으로 작동된다. 하지만 여전히 완전 자동화는 되지 않아 사소하고 섬세한 부분에서 조종사는 수동으로 작동시켜 주어야하는 부분들이 있다. 사소한 부분들을 신경써야 하기에 조종사에게 피로는 필수적을 따라왔다. 본 연구에선 현재의 기술에서 더 나아가 음성인식(STT, TTS)을 활용하여 항공기의 다양한 장치들을 원격제어할 수 있게 개발하여 완전 자동화를 목적으로 한다. 음성을 이용한 방식은 조종사에게 손을 사용하지 않는 편리함을 제공한다. 조종사에게 원거리에서 음성으로 조작할 수 있게 해줌으로써 손을 사용하여 조작하지 않아 편의성을 제공할 수 있고 명령을 통해 컴퓨터가 처리함으로써 조종이 간단해진다. 본 연구로 인해 사소한 부분까지 신경쓸 필요가 없어져 조종사의 실수나 피로로인해 일어나는 사고를 방지할 수 있다.

  • PDF

다중 프로토콜을 지원하는 흠 네트워크 디바이스 간의 서비스 바인딩 구조

  • 박준호;배대호;강순주
    • Korea Information Processing Society Review
    • /
    • v.11 no.3
    • /
    • pp.55-66
    • /
    • 2004
  • 홈 네트워크는 다양한 종류의 가전기기들과 다양한 네트워크가 혼재해 있는 유비쿼터스 네트워크 환경이다. 홈 네트워크를 구성하는 가전기기들은 기능과 특징에 따라 크게 멀티미디어 가전기기, 단순 제어 가전기기로 구분할 수 있다. 멀티미디어 가전기기의 경우 영상 및 음성 정보를 전송하기 위해 큰 대역폭을 가지는 하부 네트워크를 이용하고 있으며 영상 및 음성 정보의 전송과 제어를 위해 많은 제어 모듈을 가지고 있다. 반면 단순 제어 가전기기들은 제어 및 상태 정보의 신뢰성 있는 전송을 위한 하부 네트워크를 사용하고 있으며 단순한 제어 모들을 가지고 있다. (중략)

  • PDF

The design of Speech Recognizer to Implement the Voice Command on the PDA (PDA 상에서 음성명령어를 구현하기 위한 음성인식기의 설계)

  • Kwak Sang-Hun;Kim Cheol;Choi Seung-Ho
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.37-40
    • /
    • 2001
  • 본 논문에서는 PDA상에서 음성으로 명령어를 제어하기 위해 Window CE 3.0 환경에서 음성인식기를 설계하였다. 전처리과정에서 26차 특징파라미터를 추출하고, HTK를 통해 학습하였다. 트라이폰 기반의 가변어휘 음성인식기를 설계하였으며, PDA의 응용프로그램은 Embedded Visual C++언어를 사용하여 22개의 음성명령어를 제어하도록 하였다. 그 결과 PDA상에서 $92\%의 인식률이 나타났으며 이것은 음성인식이 모바일 환경에서도 접근이 가능함을 알 수 있었다.

  • PDF

신성장동력산업용 대어휘 음성인식 기술 동향 및 응용

  • Gang, Jeom-Ja;Gang, Byeong-Ok;Jeong, Ho-Yeong;Jeong, Hun;Lee, Yun-Geun
    • Electronics and Telecommunications Trends
    • /
    • v.23 no.1 s.109
    • /
    • pp.65-76
    • /
    • 2008
  • 신성장동력산업용 음성인식 기술은 지능형 로봇, 텔레매틱스, 홈네트워크, 차세대 PC, 디지털 콘텐츠 검색 등에 음성인식 기술을 적용하기 위한 것이다. 음성인식 기술은 사람이 일상생활 속에서 사용하는 단말기들의 제어나 정보 서비스를 마우스나 키보드를 사용하지 않고, 사람이 갖는 가장 친화적이면서 편리한 의사소통 도구인 목소리를 사용하여 원하는 단말기의 제어나 정보 서비스를 제공 받을 수 있도록 지원하는 기술을 말한다. 본 고에서는 음성인식 기술의 발전과정을 통한 음성인식 기술의 발전 동향에 대해서 설명하고, 신성장동력산업 분야의 인터페이스로 음성인식 기술을 적용한 핵심 요소 기술에 대한 개발 동향과 응용 사례에 대해서 기술한다.

A study on The Guarantee of QoS in the Home Network using Multiple Speech (이동단말에서 다중발화를 이용한 Home network 환경에서의 QoS 보장 연구)

  • 황지수;이창섭;박준석;김유섭;박찬영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10a
    • /
    • pp.811-813
    • /
    • 2004
  • 휴대전화에서 전달되는 음성데이터들이 전달되는 과정에서 잡음 등의 외부 요인으로 인하여 데이터에 손실이 생기는 문제가 발생한다. 이렇게 전달된 음성데이터가 음성 인식기를 통과하면 바로 음성 인식기를 통과했을 때 보다 인식률이 낮아진다. 본 연구에서는 음성인식 알고리즘을 이용하여 홈 네트워크를 제어하는데 있어서 음성 인식율을 향상시키기 위해서 반복적으로 음성 데이터를 입력받아. 이를 유사율 알고리즘을 적용시켜 추출 된 여러 개의 데이터(text)를 이미 구축된 홈 네트워크 용어 관련 사전에 등록된 단어와의 유사성을 검토하여 추출된 결과로 홈 네트워크를 제어하는 방안을 제안한다. 이 결과, 기존의 방법에 비해서 10% 정도의 인식률의 향상을 확인할 수 있었다.

  • PDF

음성정보처리기술 응용서비스

  • 구명완;김재인
    • Korea Information Processing Society Review
    • /
    • v.11 no.2
    • /
    • pp.17-24
    • /
    • 2004
  • 음성정보처리 기술은 사람의 말을 음향, 언어, 심리학 및 공학적인 측면에서 연구하여 사람과 기계사이의 인터페이스를 자연스럽게 하는 것을 목표로 하고 있으며, 음성인식, 음성합성 및 언어처리 기술로 이루어져 있다. 음성인식기술이란 사람의 말을 이해하는 것뿐만 아니라 화자를 식별하고 인증하는 기술도 포함하고 있으며, 음성합성 기술이란 문자로부터 음성을 생성하는 기술을 의미한다. 그리고 언어처리 기술은 음성인식, 음성합성기술 속에 포함될 수 있으나 최근 마크업 언어를 활용하여 음성인식, 합성 등을 제어하는 경향이 도래함에 따라 언어처리 기술을 따로 분류하기도 한다[1][2].(중략)

  • PDF

Speech Data Base Construction at LG Electronics (LG 전자의 음성 DB 구축 현황)

  • 김락용
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1995.06a
    • /
    • pp.280-282
    • /
    • 1995
  • 음성인식시스템 개발을 위해서는 음성 데이터베이스 구축이 필요하며 이를 위해 LG 전자에서 구축한 두 가지 데이터베이스에 관해서 기술한다. LG 전자에서 보유한 음성 데이터 베이스는 차량 및 전화 선로상에 존재하는 잡음이 포함된 상태에서 수집한 숫자음과 제어 단어로 이루어져 있으며 마이크와 핸드셋을 통과한 음서잉 사용되었으며, 화자 독립 음성 인식을 위한 400-500 명분의 화자로 구성되어 있다.

  • PDF