• Title/Summary/Keyword: 인식기능

Search Result 3,371, Processing Time 0.034 seconds

Software Development of an Intelligent Toy with Various Functions Including Speech Recognition (음성인식 등의 복합기능을 가진 지능형 장난감의 소프트웨어 개발)

  • 박상훈;한상훈;조형제
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.589-591
    • /
    • 2001
  • 음성인식은 여러 분야에 적용될 수 있지만 지능형 장난감에 적용된 사례를 보면 다른 시스템에서 적용된 경우와 같이 높은 인식률이 요구된다. 하지만 음성인식의 기능만으로 지능형 장난감의 기능이 다양성을 가지지 못한다. 음성인식기능 뿐만 아니라 다른 여러 가지의 기능을 가진 지능형 장난감의 소프트웨어를 개발하는 것이 다른 시스템과의 차별성을 두는 것이 된다. 본 논문에서는 이 Intelligent Toy에 내장될 음성인식 등의 여러 가지의 기능을 가진 Software를 구현하는 방법 및 결과를 제시한다. 대표적 기능인 음성인식은 화자종속이고 그 인식률은 99%의 높은 인식률을 얻었다. 그외에도 음성합성, 음악합성, 음성녹음 및 재생 등의 기능구현을 하였다. 음성인식을 가진 Intelligent Toy 계열의 시스템과 같은 잡음 환경 하에서 인식률을 비교해 볼 때 그 결과가 우수함을 확인하였다.

  • PDF

Korean Continuous Speech Recognition using Phone Models for Function words (기능어용 음소 모델을 적용한 한국어 연속음성 인식)

  • 명주현;정민화
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.354-356
    • /
    • 2000
  • 의사형태소를 디코딩 단위로 한국어 연속 음성 인식에서의 조사, 어미, 접사 및 짧은 용언의 어간등의 단어가 상당수의 인식 오류를 발생시킨다. 이러한 단어들은 발화 지속시간이 매우 짧고 생략이 빈번하며 결합되는 다른 형태소의 형태에 따라서 매우 심한 발음상의 변이를 보인다. 본 논문에서는 이러한 단어들은 한국어 기능어라 정의하고 실제 의사형태소 단위의 인식 실험을 통하여 기능어 집합 1, 2를 규정하였다. 그리고 한국어 기능어에 기능어용 음소를 독립적으로 적용하는 방법을 제안했다. 또한 기능어용 음소가 분리되어 생기는 음향학적 변이들을 처리하기 위해 Gaussian Mixture 수를 증가시켜 보다 견고한 학습을 수행했고, 기능어들의 음향 모델 스코어가 높아짐에 따른 인식에서의 삽입 오류 증가를 낮추기 위해 언어 모델에 fixed penalty를 부여하였다. 기능어 집합1에 대한 음소 모델을 적용한 경우 전체 문장 인식률은 0.8% 향상되었고 기능어 집합2에 대한 기능어 음소 모델을 적용하였을 때 전체 문장 인식률은 1.4% 증가하였다. 위의 실험 결과를 통하여 한국어 기능어에 대해 새로운 음소를 적용하여 독립적으로 학습하여 인식을 수행하는 것이 효과적임을 확인하였다.

  • PDF

Text/Voice Recognition & Translation Application Development Using Open-Source (오픈소스를 이용한 문자/음성 인식 및 번역 앱 개발)

  • Yun, Tae-Jin;Seo, Hyo-Jong;Kim, Do-Heon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2017.07a
    • /
    • pp.425-426
    • /
    • 2017
  • 본 논문에서는 Google에서 지원하는 오픈소스인 Tesseract-OCR을 이용한 문자/음성 인식 및 번역 앱에 대해 제안한다. 최근 한국어를 포함한 외국어 인식과 번역기능을 이용한 다양한 스마트폰 앱이 개발되어 여행에 필수품으로 자리잡고 있다. 스마트폰의 카메라기능을 이용하여 촬영한 영상을 인식률을 높이도록 처리하고, Crop기능을 넣어 부분 인식기능을 지원하며, Tesseract-OCR의 train data를 보완하여 인식률을 높이고, Google 음성인식 API를 이용한 음성인식 기능을 통해 인식된 유사한 문장들을 선택하도록 하고, 이를 번역하고 보여주도록 개발하였다. 번역 기능은 번역대상 언어와 번역할 언어를 선택할 수 있고 기본적으로 영어, 한국어, 일본어, 중국어로 번역이 가능하다. 이 기능을 이용하여 차량번호 인식, 사진에 포함된 글자를 통한 검색 등 다양한 응용분야에 맞게 앱을 개발할 수 있다.

  • PDF

온라인 문자인식기술

  • 이헌주
    • Information and Communications Magazine
    • /
    • v.11 no.5
    • /
    • pp.23-32
    • /
    • 1994
  • 편입력 기능을 창작한 시스템의 문자입력 기능에서 사용자들의 다양한 형태의 필기문자를 인식하여 사용자의 만족을 극대화 시킬 수 잇는 고성능의 인식기를 만들기 위해서는 상황과 장소에 따라서 변하는 필기형태를 학습할 수 있는 다이나믹한 인식기 개발이 절대적으로 필요하다고 판단된다. 또한 국제 경쟁력을 갖기 위해서는 사용자의 국적(nationality)에 따라 다양한 자종을 인식할 수 잇는 기능이 있어야 한다. 따라서 본 논문에서는 다양한 사용자의 요구를 만족시키기 위하여 인식기 설계시 필요한 design issues와 philosophy를 제시하고, 이를 기초로 학습기능, 국제화, 소형화의 특징을 갖는 학습기능 다중언어(multilingual) 인식기 설계 방법을 제안하고자 한다.

  • PDF

A Study on the Rejection Capability based on Utterance Verification for Speech Recognition (발화 검증에 의한 음성인식 거절기능 연구)

  • 김우성
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06c
    • /
    • pp.67-70
    • /
    • 1998
  • 본 논문에서는 단어독립 음성인식 시스템을 위한 음성인식 거절(rejection)기능에 대해 기술한다. 음성인식 거절 기능은 음성인식기를 제작할 때 정해놓은 인식대상 단어 이외의 단어가 입력되었을 때 그 단어가 인식할 수 없는 단어임을 알려주는 기능이다. 본 연구에서는 단어독립 음성인식 시스템에 적용될 수 있는 발화 검증 방식에 의해 음성인식 거절 기능을 구현하였다. 특히 유사도를 결정함에 있어서 산술평균, 기하평균, 조화평균을 사용하고 각각을 비교하여, 기하 평균을 사용하는 방식이 우수한 성능을 보임을 알 수 있었다. 음성의 신뢰도(confidence score)를 정규화하기 위해서 Sigmoid 함수를 사용하는데 이 함수의 가중치(weight) 상수의 변화에 대해 인식률을 비교함으로써 가장 적절한 가중치 상수값을 결정하였다. 음성인식 테스트 결과에서는 신뢰도 임계치 값을 구하고 이 값을 사용하여 인식률을 계산하였으며, 거절의 오류까지 포함된 음성인식률은 약 76%였다. 이 연구결과는 현재 한국통신에서 시험 서비스 중인 음성인식 증권정보 안내 시스템에 적용될 예정이다.

  • PDF

Intelligent Surveillance System using an Activity Recognition Technique (행동패턴 인식기법을 이용한 지능형 감시 시스템)

  • Park, Jin-Hee;Lee, Joseph S.;Kim, Ho-Joon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2007.11a
    • /
    • pp.63-65
    • /
    • 2007
  • 본 연구에서는 비디오 영상데이터로부터 인간의 행동패턴의 인식기술 및 상황인식 기법을 소개하고 이를 활용한 실용적 응용으로서 지능형 감시시스템을 제안한다. 순차적 영상신호에서 형태기반의 정적 특징과 목표물의 움직임 요소를 측정한 동적 특징을 결합한 형태의 특징 표현 및 추출기법과 행동패턴 및 상황패턴에 대한 인식 모델을 제시하고 구현한다. 모듈구조의 시스템에서 영상처리 모듈과 패턴인식 모듈은 특징추출 및 인식과정을 수행하며, 감시영상에 대한 상황판단 기능은 데이터베이스 모듈과 연동하여 효과적인 검색기능과 경보기능 등을 지원한다. 이러한 기능은 기존의 시스템에서 운영자의 지속적인 감시작업과 상황판단 작업을 보조 또는 대행하여 수행할 수 있을 뿐만 아니라 데이터저장 공간을 획기적으로 줄이고 부수적으로 효율적인 영상의 조회기능 및 추적기능 등의 유용한 인터페이스를 지원한다.

  • PDF

Research on Recognition Network Structures for Non-recognition Sentence Rejection (비인식 대상 문장 거부 기능을 위한 음소 기반 인식 네트워크의 구성에 관한 연구)

  • 이병혁;하진영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.772-774
    • /
    • 2004
  • 음성인식 시스템에서 입력된 음성 데이터에 대해 비인식 대상에 대한 거부기능은 신뢰도 보장 측면에서 상당히 중요하다. 비인식 대상의 단어 거부는 지금까지 여러 연구가 이루어져 왔으나, 문장 거부에 대한 연구는 사실상 부족한 실정이다. 본 논문에서는 비인식 대상 문장 거부기능의 신뢰도를 한층 높일 수 있도록 음소 기반 네트워크에 유성자음(VC), 무성자음(C), 모음(V) 단위의 필러 음향 모델을 생성하여 다양한 음소기반 인식 네트워크의 구성방법을 적용하여 비인식 대상 문장에 대해 거부 기능을 구현하고, 그에 따라 인식률과 거부율이 달라질 수 있음을 보인다. 구현된 시스템에서 제안한 3가지 음소단위 인식 네트워크 중 문장의 각 단어별 필러 모델을 구성했을 때가 가장 좋은 구성임을 알 수 있었다.

  • PDF

An Implementation of the Automatic Switching System using Speech Recognition (음성 인식을 이용한 자동 교환 시스템 구현)

  • 함정표;김현아;박익현
    • Proceedings of the IEEK Conference
    • /
    • 2000.09a
    • /
    • pp.935-938
    • /
    • 2000
  • 본 논문에서는 음성 인식을 이용하여 전화를 교환해주는 자동 교환 시스템을 구현하고, 성능을 평가하였다. 구현된 시스템에는 필수적인 음성인식 이외에도 DSP 진단 기능, 인식 대상 어휘의 추가 및 변경기능, 음성 수집 기능 등이 구현 되었다. SCHMM (Semi-Continuous Hidden Markov Model)을 이용한 전화망에서의 화자 독립 고립 단어 가변 어휘 인식을 대상으로 하였으며, 실시간 구현을 위하여 Texas Instrument 사의 TMS320C32를 사용하였다〔6〕. 인식 어휘는 부서명 및 인명이고 1300여 단어일 때, 인식 성능은 91.5%이다.

  • PDF

Implementation of the Web Service Provider for the Speech Recognition Web Page (음성 인식용 웹페이지를 위한 웹서비스 제공자의 구현)

  • 오지영;김윤중
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2003.11a
    • /
    • pp.257-260
    • /
    • 2003
  • 본 논문은 일반 웹페이지를 음성인식이 가능한 웹페이지로 전환하고, 이 페이지가 사용 될 수 있는 웹서비스를 구현하였다. 본 연구에서 구현한 시스템은 웹서비스 소비자와 웹서비스 제공자로 구성되어 있다. 웹서비스 소비자는 다음에 설명하는 두개의 웹서비스 제공자를 호출하는 기능과 재구성된 웹페이지외 xml 문서를 저장하는 기능, xml 문서로부터 사용자의 음성과 매핑되는 URL을 검색하는 기능을 포함하고 있다. 웹서비스 제공자는 웹페이지를 변환하는 웹서비스 제공자와 음성인식 웹서비스 제공자이다. 웹페이지 변환 웹서비스 제공자는 일반 웹페이지를 분석하여 필요한 태그를 변환하는 기능과 하이퍼링크 값인 URL을 추출하는 기능으로 구성되어 있다. 사용자의 음성을 분석하고 인식하는 음성인식기는 기존의 연구에서 구현된 음성인식 웹서비스 제공자를 이용하였다.

  • PDF

대학생의 창업교육 만족도와 창업지원제도인식, 창업멘토링이 창업의지에 미치는 영향: 창업효능감을 조절효과로

  • Yu, Yeong-Cheol;Lee, Won-Il
    • 한국벤처창업학회:학술대회논문집
    • /
    • 2022.11a
    • /
    • pp.53-57
    • /
    • 2022
  • 본 연구의 목적은 대학에서 직·간접적으로 수행하고 있는 창업교육, 창업지원제도, 창업멘토링의 매개를 통하여 창업의지에 어떻게 영향을 미치는가를 살펴보고 대학생의 창업 가능성을 높일 수 있는 프로그램 개발과 방향성을 제시하기 위함이다. 본 연구는 대학생의 대학 창업교육 만족도, 창업지원제도인식, 창업멘토링이 창업의지에 미치는 영향에서 창업효능감에 따라 창업의지에 어떻게 영향을 미치는지에 대해 분석하였다. 본 연구를 진행하기 위해 채택한 변수는 다음과 같다. 첫째, 대학 창업교육 만족도, 창업지원제도인식, 창업멘토링을 독립변수로 지정하였고, 둘째, 창업의지를 종속변수로 지정하였으며, 셋째, 대학 창업교육 만족도, 창업지원제도인식, 창업멘토링과 창업의지 사이에서 창업효능감을 조절변수로 지정하였다. 넷째, 창업지원제도인식은 정부창업지원정책과 대학창업지원사업으로 창업멘토링은 멘토링 기능(문제해결 기능, 네트워킹 기능, 의사소통 기능, 동기부여 기능)과 멘토 신뢰(인지적 신뢰, 정서적 신뢰)로 구분하였다.

  • PDF