• 제목/요약/키워드: Vocabulary recognition

검색결과 221건 처리시간 0.027초

Maximum Likelihood-based Automatic Lexicon Generation for AI Assistant-based Interaction with Mobile Devices

  • Lee, Donghyun;Park, Jae-Hyun;Kim, Kwang-Ho;Park, Jeong-Sik;Kim, Ji-Hwan;Jang, Gil-Jin;Park, Unsang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권9호
    • /
    • pp.4264-4279
    • /
    • 2017
  • In this paper, maximum likelihood-based automatic lexicon generation using mixed-syllables is proposed for unlimited vocabulary voice interface for East Asian languages (e.g. Korean, Chinese and Japanese) in AI-assistant based interaction with mobile devices. The conventional lexicon has two inevitable problems: 1) a tedious repetition of out-of-lexicon unit additions to the lexicon, and 2) the propagation of errors during a morpheme analysis and space segmentation. The proposed method provides an automatic framework to solve the above problems. The proposed method produces a level of overall accuracy similar to one of previous methods in the presence of one out-of-lexicon word in a sentence, but the proposed method provides superior results with the absolute improvements of 1.62%, 5.58%, and 10.09% in terms of word accuracy when the number of out-of-lexicon words in a sentence was two, three and four, respectively.

Implementation of HMM-Based Speech Recognizer Using TMS320C6711 DSP

  • Bae Hyojoon;Jung Sungyun;Son Jongmok;Kwon Hongseok;Kim Siho;Bae Keunsung
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2004년도 ICEIC The International Conference on Electronics Informations and Communications
    • /
    • pp.391-394
    • /
    • 2004
  • This paper focuses on the DSP implementation of an HMM-based speech recognizer that can handle several hundred words of vocabulary size as well as speaker independency. First, we develop an HMM-based speech recognition system on the PC that operates on the frame basis with parallel processing of feature extraction and Viterbi decoding to make the processing delay as small as possible. Many techniques such as linear discriminant analysis, state-based Gaussian selection, and phonetic tied mixture model are employed for reduction of computational burden and memory size. The system is then properly optimized and compiled on the TMS320C6711 DSP for real-time operation. The implemented system uses 486kbytes of memory for data and acoustic models, and 24.5kbytes for program code. Maximum required time of 29.2ms for processing a frame of 32ms of speech validates real-time operation of the implemented system.

  • PDF

음소 군집화 기법을 이용한 어휘독립음성인식의 음소모델링 (Subword Modeling of Vocabulary Independent Speech Recognition Using Phoneme Clustering)

  • 구동욱;최준기;윤영선;오영환
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 학술발표대회 논문집 제19권 2호
    • /
    • pp.33-36
    • /
    • 2000
  • 어휘독립 고립단어인식은 미리 훈련된 부단어(sub-word) 단위의 음향모델을 이용하여 수시로 변하는 인식대상어휘를 인식하는 것이다. 본 논문에서는 소용량 음성 데이터베이스를 이용하여 어휘독립음성인식 시스템을 구성하였다. 소용량 음성 데이터베이스에서 미관측문맥 종속형 부단어에 대한 처리에 효과적인 백오프 기법을 이용한 음소 군집화 방법으로 문턱값을 변화시키며 인식실험을 수행하였다. 그리고 훈련용 데이터의 부족으로 인하여 문맥 종속형 부단어 모델이 훈련용 데이터베이스로 편중되는 문제를 deleted interpolation 방법을 이용하여 문맥 종속형 부단어 모델과 문맥 독립형 부단어 모델을 병합함으로써 해결하였다. 그 결과 음성인식의 성능이 향상되었다.

  • PDF

코퍼스를 이용한 '호남'과 '영남' 지역신문에서의 '5.18'에 대한 비판적 담화분석 (Critical Discourse Analysis of '5.18' in 'Honam' and 'Yeongnam' Local Newspapers by Using Corpus)

  • 이숙의;진두현
    • 한국어학
    • /
    • 제76권
    • /
    • pp.83-112
    • /
    • 2017
  • In this paper, newspaper articles were collected through '5.18' keyword search results and the news corpus was constructed from the collected data. In the articles of local newspapers 'Honam' and 'Yeongnam', the ideological differences regarding '5.18' were investigated. The ideological differences of local newspaper discourse through objective figures was analyzed.. The subjects of the newspaper articles, the frequency of nouns and predicates were analyzed. The use and meaning of the intended vocabulary were examined. As a result of analyzing the title of the newspaper article, the discourse written in 'Honam' emphasized the necessity of re - recognition of 5.18. In both regions, the word "Gwangju" is often used. However, 'Gwangju' in 'Honam' newspaper means spiritual space, not physical space. In Honam regional newspapers, there are many vocabularies describing the events such as 'shoot' and 'fire', this calls for recollection and memory of '5.18'. In the analysis of newspaper discourse, the analysis of the contrast between the local newspapers was very insignificant, but, this study was conducted to analyze the discourse among local newspapers.

DP 알고리즘에 의한 발음사전 전처리와 문맥종속 자소별 MLP를 이용한 영어 발음사전 생성기의 개선 (Improvements of an English Pronunciation Dictionary Generator Using DP-based Lexicon Pre-processing and Context-dependent Grapheme-to-phoneme MLP)

  • 김회린;문광식;이영직;정재호
    • 한국음향학회지
    • /
    • 제18권5호
    • /
    • pp.21-27
    • /
    • 1999
  • 본 논문에서는 가변어휘 단어 인식기에 사용하기 위한 개선된 MLP 기반 영어 발음사전 생성기를 제안한다. 가변어휘 단어 인식기는 인식대상 도메인이 수시로 바뀌는 상황에서 현재의 인식 도메인에 의해 결정되는 임의의 한국어 어휘들에 대해 처리 할 수 있다. 이 시스템을 영어 단어에 대해서도 처리할 수 있도록 하기 위해서는 미리 정의된 사전에 포함할 수 없는 영어 고유명사와 같은 단어의 발음열을 구할 수 있는 방법이 필요하다. 영어 발음사전 생성기를 구현하기 위하여 본 연구에서는 각 자소를 음소로 변환해 주는 문맥종속 다층 퍼셉트론 구조를 제안한다. 각 자소별 다층 퍼셉트론을 훈련하기 위해서는 표준 발음사전으로부터 각 자소에 대응하는 음소 학습용 데이터를 준비해야 한다. 이를 위해 본 연구에서는 적절한 거리척도를 사용하는 동적 프로그래밍 알고리즘을 사용한다. 훈련 및 평가를 위한 데이터로는 116,191개 영어 단어의 발음사전을 사용하였다. 평가 결과 각각 30~50개의 히든 노드를 가지는 26개 자소별 MLP와 예외 자소 발음사전을 가지고 표준 발음사전에 대하여 72.8%의 단어 정확도를 얻었으며, 이것은 기존의 규칙 에 기반한 발음사전 생성의 정확도인 24.0% 보다 매우 우수한 결과임을 보여주었다.

  • PDF

디자이너와 소비자의 조형요소 인지특성 비교 (Comparison on the recognition characteristic of the designer and consumer about the formative elements)

  • 민경택;허성철
    • 감성과학
    • /
    • 제12권1호
    • /
    • pp.97-108
    • /
    • 2009
  • 제품 디자인에 있어서 조형화 과정은 실체적인 존재를 만들어 내는 과정이며, 최종적으로 제품에 대한 결과를 이끌어 내는 중요한 과정이다. 이러한 조형화 과정은 일반적으로 디자이너의 주도적인 작업에 의해서 이루어지고 있으며, 이 때 다양한 조형 요소들을 활용하여 결과물을 만들어 낸다. 본 연구에서는 제품 디자인 프로세스에 있어서 제품 형태의 조형화 과정에서 다루어지는 요소들이 소비자와 디자이너의 시각 차이에 의해서 생기는 차이에 대해 알아보고 소비자가 제품의 조형화 과정에 직접적인참여를 하는 방법과 소비자의 요구가 보다 효율적으로 조형화 과정에 반영되는 디자인 가이드라인의 제시에 대한 가능성을 고찰하고자 하였다. 이를 위하여 먼저 제품 형태를 구성하는 요소들에 대한 정립을 선행하여 기본적인 제품 조형 구성 체계를 마련하였다. 이를 기반으로 기본적인 제품 조형요소와 제품 조형원리를 일부 설정하여 소비자를 대상으로 55개의 컨셉 제품과 64개의 스피커 제품의 이미지에 대한 반응 실험을 진행하였다. 또한 일부 실험 자극물을 이용하여 디자이너들을 대상으로 동일한 실험을 진행하였는데, 실험 결과 소비자와 디자이너는 형태의 조형 요소에 대해 어느 정도 시각 차이를 보이며 이는 디자이너의 경우 주관적인 디자인 통념에 의해서, 소비자의 경우 제품에 대한 미숙한 시각적 이해에 의해서 차이가 생기는 것으로 나타났다. 이 결과를 바탕으로 디자이너는 소비자의 최종적인 감성반응을 이끌어내는 디자인 과정에 있어서 형태에 대한 시각 차이를 이해하고, 형태 조형원리를 기반으로 하는 조형요소의 구성을 활용 할 수 있다고 본다.

  • PDF

증강현실 기반 어휘 지도에서 동사 목록에 대한 기초 연구 (A Basic Study of Verbs List for Vocabulary Learning Based on Augmented Reality)

  • 황보명;권순복;김선종;신범주
    • 재활복지
    • /
    • 제21권2호
    • /
    • pp.233-246
    • /
    • 2017
  • 본 연구는 디지털 세계와 물리적 세계가 접목하는 증강현실을 언어치료에 적용하기 위한 기초 연구이다. 특히, 아동들에게 동사를 지도할 때 증강현실로 구현한 동사 목록이 해당 움직임을 정확하게 나타내고 있는지와 같은 동작 타당도, 그리고 해당 동사 목록이 어휘 지도 목표로 적절한 것인지에 대한 어휘 타당도를 살펴본 연구이다. 선행 연구들을 참고하여 45개의 동사를 어휘 지도 목록으로 선정하고 이 동사들에 대하여 1급 언어재활사 자격증을 소지한 언어치료학과 교수 3명으로 하여금 어휘 타당도를 평가하도록 하였다. 그 결과, 39개 동사에서 높은 어휘 타당도를 얻었다. 높은 어휘 타당도를 얻은 39개 동사에 대한 동작 타당도를 살펴보기 위하여 언어치료 전공 석사과정 대학원생들에게 각 동사를 증강현실로 구현하여 보여주고 생각나는 동사를 기록하게 하였다. 증강현실로 구현된 동작 애니메이션을 보고 난 후 50% 이상의 대학원생이 해당 동사로 기록한 동사는 32개였다. 이차적으로는 이 32개 동사만 증강현실로 구현하여 87명의 언어치료 전공 대학생들에게 보여주고 Likert 5점 척도로 각 동사와 구현된 동작의 일치도를 평가하게 하였다. 최종적으로 30개 동사가 증강현실로 구현하여 지도하기에 타당한 동사 목록으로 선정되었다. 이 연구 결과를 바탕으로 향후 공인 타당도 및 적용 타당화 연구를 지속하여 증강현실을 활용한 어휘 평가 및 지도가 언어치료 임상 현장에서 활용되기를 기대한다.

경도지적장애 학생의 신조어 능력이 또래인기도에 미치는 영향 (The Effect Of Neologism Ability Of Students With Mild Intellectual Disabilities On Peer Popularity)

  • 김화수;진수미;이지우
    • 디지털융복합연구
    • /
    • 제20권1호
    • /
    • pp.213-220
    • /
    • 2022
  • 본 연구는 경도지적장애 학생과 생활연령 일치집단 일반학생을 대상으로 신조어 사용의 특성과 신조어 사용능력과 또래인기도 간의 관계를 알아보는 것이 목적이다. 생활연령이 14~16세 되는 경도지적장애 학생 4명과 생활연령 일치집단 일반학생 4명, 총 8명으로 하여 대상을 비모수 검정으로 집단 간 비교를 하였다. 신조어의 경우 301개의 신조어 중에서 전문가 내용타당도를 통하여 60개의 신조어를 선택한 후, 60개 신조어 어휘에 대한 인식도와 배경정보를 수집하였다. 연구결과 첫째, 경도지적장애 학생 집단과 생활연령 일치 일반학생 집단 간에 신조어 이해도에서 유의한 차이를 나타냈다. 둘째, 경도지적장애 학생 집단과 생활연령 일치 일반학생 집단 각각에 대하여 신조어 사용과 또래인기도의 상관관계를 비교하였는데 두 집단 모두 신조어 사용과 또래인기도가 높은 정적상관관계를 나타냈다. 그러므로 경도지적장애 학생을 대상으로 어휘 지도를 할 때, 또래와의 관계 및 인기도를 높이기 위해서는 신조어 어휘를 지도할 필요가 있음을 시사한다.

SMS 변형된 문자열의 자동 오류 교정 시스템 (Automatic Error Correction System for Erroneous SMS Strings)

  • 강승식;장두성
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권6호
    • /
    • pp.386-391
    • /
    • 2008
  • 휴대폰과 메신저 등 통신 환경에서 문자 메시지를 전송할 때 표준어가 아닌 왜곡된 어휘들을 사용하고 있으며, 이러한 변형된 어휘들은 음성 인식, 음성 합성, 문서 정보 추출 등 언어처리 및 관련 분야의 응용 시스템에서 많은 문제점을 유발시킨다. 본 논문에서는SMS 문장들의 변형 및 띄어쓰기 오류를 자동으로 교정하여 형태소 분석 및 품사 태깅의 성능 저하 문제를 방지하는 문자열 오류의 교정 방법을 제안하고 시스템을 구현하였다. 시스템의 성능에 가장 큰 영향을 미치는 변형된 문자열 사전을 구축하는 방법으로 (1) 통신 어휘집을 기반으로 수동으로 구축하는 방법, (2) 수작업으로 구축된 말뭉치로부터 자동으로 변형된 문자열을 추출하는 방법, (3) 자동으로 변형된 문자열을 추출할 때 좌우 문맥을 고려하는 방법에 대하여 시스템을 구현하고 실험을 통하여 비교-분석 및 성능 평가 결과를 제시하였다.

초등학교 5학년 영어수업에 적용된 G러닝(게임을 활용한 교수학습 방법)의 학습 효과 (Effectiveness of G-Learning(Teaching and Learning Methodology utilizing Game) adopted in an English Class for 5th Grade Elementary School Students)

  • 원은석;위정현
    • 한국콘텐츠학회논문지
    • /
    • 제12권10호
    • /
    • pp.541-554
    • /
    • 2012
  • 본 연구는 초등학교 5학년 하위권 학생들을 대상으로 수행된 G러닝 방과후학교 영어수업의 효과성을 제시하고 있다. 최근 게임을 활용한 교수학습방법을 의미하는 G러닝이 활성화되면서, 영어교육 분야에서 G러닝을 수용할 수 있는 방법에 대한 연구의 필요성이 강조되고 있다. 본 연구에서는 대전에 소재한 한 초등학교에서 23명의 5학년 영어 성취도 하위권 학생들을 대상으로 12주 동안 G러닝 영어 방과후학교 수업을 진행하였다. G러닝의 효과성을 검증하기 위해 성취도 및 정의적 영역에 대해 두 개의 가설을 설정하여 이를 검증하였다. 가설검증을 위해 수업 전, 후 성취도 평가 및 설문조사를 실시하고 FGI를 통해 참여자의 의견을 수렴하였다. 그 결과 하위권 학생들의 영어 성적이 약 15점 정도 향상되었고, 단어 철자 그리고 의사소통 영역에서 통계적으로 유의미한 향상도를 보였다. 또한, G러닝 수업을 통해 학생들이 영어학습에 대한 자신감과 흥미를 갖게 되었다.