• 제목/요약/키워드: 발화수정

검색결과 24건 처리시간 0.019초

대화형 개인 비서 시스템의 언어 인식 모듈(SLU)을 위한 미등록어(OOV) 처리 기술 (A Out-of-vocabulary Processing Technology for the Spoken Language Understanding Module of a Dialogue Based Private Secretary Software)

  • 이창수;고영중
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.3-8
    • /
    • 2014
  • 대화형 개인 비서 시스템은 사람의 음성을 통해 인식된 음성 인식 결과를 분석하여 사용자에게 제공할 정보가 무엇인지 파악한 후, 정보가 포함되어 있는 앱(app)을 실행시켜 사용자가 원하는 정보를 제공하는 시스템이다. 이러한 대화형 개인 비서 시스템의 가장 중요한 모듈 중 하나는 음성 대화 인식 모듈(SLU: Spoken Language Understanding)이며, 발화의 "의미 분석"을 수행하는 모듈이다. 본 논문은 음성 인식결과가 잘못되어 의미 분석이 실패하는 것을 방지하기 위하여 음성 인식 결과에서 잘못 인식된 명사, 개체명 단어를 보정 시켜주는 미등록어(OOV:Out-of-vocabulary) 처리 모듈을 제안한다. 제안하는 미등록어 처리 모듈은 미등록어 탐색 모듈과 미등록어 변환 모듈로 구성되며, 미등록어 탐색 모듈을 통해 사용자의 발화에서 미등록어를 분류하고, 미등록어 변환 모듈을 통해 미등록어를 사전에 존재하는 유사한 단어로 변환하는 방법을 제안한다. 제안한 방법을 적용하였을 때의 실험 결과, 전체 미등록어 중 최대 52.5%가 올바르게 수정되었으며, 음성 인식 결과를 그대로 사용했을 경우 "원본 문장"과 문장 단위 67.6%의 일치율을 보인 것에 반해 미등록어 처리 모듈을 적용했을 때 17.4% 개선된 최대 85%의 문장 단위 일치율을 보였다.

  • PDF

로봇보조언어교육을 통한 초등 영어 학습자의 운율 변화 (The Prosodic Changes of Korean English Learners in Robot Assisted Learning)

  • 인지영;한정혜
    • 정보교육학회논문지
    • /
    • 제20권4호
    • /
    • pp.323-332
    • /
    • 2016
  • 로봇의 발음인식과 진단 그리고 발음빠르기는 로봇보조언어교육의 가장 중요한 상호작용이다. 이 연구는 한국인 초등 영어 학습자를 위하여 음율적 오류를 수정함으로써 원어민과 같은 억양을 산출하기 위한 로봇음성합성기의 효과성을 측정하기 위한 것이다. 이를 위해 초등 4학년 영어학습자들의 F0 범위값과 발화 속도라는 음성음향적 변수를 측정하여 분석하였고, 그 결과를 정규 영어교육의 시작하지 않은 1학년 학습자와 비교하였다. 로봇음성합성기를 활용한 언어학습에서 두 집단은 F0값보다 발화속도 변인에 반응하였다.

학습자의 오류에 대한 교사의 오류 수정: 학습자 자기 교정 유도를 중심으로 (Teacher's corrective feedback: Focus on initiations to self-repair)

  • 김영은
    • 영어어문교육
    • /
    • 제13권1호
    • /
    • pp.111-131
    • /
    • 2007
  • This study explores teacher's corrective feedback types in an error treatment sequence in Korean EFL classroom setting. Corrective feedback moves are coded as explicit correction, recast, or initiations to self-repair. The frequency and distribution of each corrective feedback type are examined. But the special focus was given on feedback types eliciting learner's self-repair (clarification request, metalinguistic feedback, elicitation, and repetition of error) because initiations to self-repair are believed to facilitate language learning more than other strategies. The results of the study are as follows. First, there was an overwhelming tendency for teacher to use recasts whereas initiations to self-repair were not used as much as recast (52.4% vs. 29.5%). Second, the teacher tended to select feedback types in accordance with error types: namely, recasts after phonological, lexical, and translation errors and initiations to self-repair after grammatical errors though the differences were not significant. Finally, teacher's belief and students' expectation on corrective feedback were compared with actual corrective feedback representations respectively and some mismatches were found. Though both teacher and the students acknowledged the importance and necessity of self-repair, self-repair were not put into practice as such. Therefore, this study suggests more initiations to self-repair be used for effective language learning.

  • PDF

한국어 연결숫자 인식에서의 발화 검증과 대체오류 수정 (Utterance Verification and Substitution Error Correction In Korean Connected Digit Recognition)

  • 정두경;송화전;정호영;김형순
    • 대한음성학회지:말소리
    • /
    • 제45호
    • /
    • pp.79-91
    • /
    • 2003
  • Utterance verification aims at rejecting both out-of-vocabulary (OOV) utterances and low-confidence-scored in-vocabulary (IV) utterances. For utterance verification on Korean connected digit recognition task, we investigate several methods to construct filler and anti-digit models. In particular, we propose a substitution error correction method based on 2-best decoding results. In this method, when 1st candidate is rejected, 2nd candidate is selected if it is accepted by a specific hypothesis test, instead of simply rejecting the 1st one. Experimental results show that the proposed method outperforms the conventional log likelihood ratio (LLR) test method.

  • PDF

상황정보에 기반한 한국어대화의 전산적 처리와 표상구조의 구축 (Computational Processing of Korean Dialogue and the Construction of Its Representation Structure Based on Situational Information)

  • 이동영
    • 정보처리학회논문지B
    • /
    • 제9B권6호
    • /
    • pp.817-826
    • /
    • 2002
  • 한국어대화에서는 존대현상(honorification phenomenon)이 일어나기도 하고, 존대대명사(honorific pronoun)가 사용되기도 하며, 맥락상 되찾을 수 있으면 주어나 목적어가 완전히 생략되기도 한다. 이러한 특징적인 언어현상이 일어나는 한국어대화를 처리하고 그것의 표상구조를 만들기 위해서 대화참석자에 관한 정보, 발화문의 화행에 관한 정보. 대화에 관련된 사람들의 사회적 지위에 있어서의 상대적 순위에 관한 정보, 대화에 나타나는 발화문 사이의 정보흐름 등을 묵시적으로가 아니라 명시적으로 표시하고 이용할 것을 본 논문은 제안한다. 또한. 본 논문은 이러한 상황정보(situational information)를 표시하고 이용하는 방법과 한국어대화의 적절한 표상구조를 제시한다. 본 논문에서 한국어대화표상구조의 설정은 담화표상이론(Discourse Representation Theory)과 분할담화표상이론(Segmented Discourse Representation Theory)을 수정ㆍ확대하여 이루어진다. 나아가서, 본 논문은 한국어대화를 전산적으로 어떻게 처리하고 그것의 표상구조를 구축하는지를 프롤로그 프로그래밍 언어를 사용하여 보여주고 나서, 그러한 표상구조의 타당성을 알아보기 위해 자연발생적 한국어대화에도 적용시켜 본다.

문맥 및 사용 패턴 정보를 이용한 음성인식의 성능 개선 (Performance Improvement of Speech Recognition Using Context and Usage Pattern Information)

  • 송원문;김명원
    • 정보처리학회논문지B
    • /
    • 제13B권5호
    • /
    • pp.553-560
    • /
    • 2006
  • 최근 음성인식에서는 잡음환경에서 좀 더 신뢰성 있는 결과를 얻기 위해 인식 결과 도출 단계에서 여러 가지 정보의 내용들을 융합하거나 이전 인식 결과의 후처리를 통하여 성능을 향상시키는 방법들이 연구되고 있다. 본 논문에서는 잡음 환경에서의 인식률 하락을 보완하기 위해 개인 모바일 기기를 위한 음성 명령어 인식에서 사용자의 사용패턴과 문맥 정보를 사용하는 방법을 제안한다. 기본 인식 결과를 보정하기 위해서 현재 명령어를 발화하기 이전에 사용자가 사용한 순차적 명령어 패턴을 사용하였다. 또한 문맥 정보를 위해서는 사용중인 기기의 현재 기능과 발화된 명령어간의 연관성을 사용하였다. 실험을 통해 제안한 방법이 기본 인식 시스템에서 발생한 오인식의 약 50%를 수정하였음을 보였으며 이로써 제안한 방법의 타당성을 검증하였다.

대화체 연속음성 인식을 위한 한국어 대화음성 특성 분석 (Analysis of Korean Spontaneous Speech Characteristics for Spoken Dialogue Recognition)

  • 박영희;정민화
    • 한국음향학회지
    • /
    • 제21권3호
    • /
    • pp.330-338
    • /
    • 2002
  • 대화체 연속음성은 자연스러운 발화로 낭독체 문장에 비해 잡음, 간투어와 같은 비문법적인 요소가 많고, 발음의 변이가 심하다. 이런 이유로 대화체 연속음성을 인식하기 위해서는 대화 현상을 분석하고 그 특징을 반영하여야 한다. 본 논문에서는 실제 대화음성에 빈번히 나타나는 대화 현상들을 분류하고 각 현상들을 모델링하여 대화체 연속음성 인식을 위한 기본 베이스라인을 구축하였다. 대화 현상을 묵음 구간과 잡음, 간투어, 반복/수정 발화의 디스풀루언시 (disfluencies), 표준전사와 다른 발음을 갖는 발음변이 현상으로 나누었다. 발음변이 현상은 다시 양성음의 음성음화, 음운축약/탈락현상, 패턴화된 발음변이, 발화오류로 세분화하였다. 대화체 음성인식을 위해서 빈번히 나타나는 묵음구간을 고려한 학습과 잡음, 간투어 처리를 위한 음향모델을 각각 추가하였다. 발음변이 현상에 대해서는 출현빈도수가 높은 것들만을 대상으로 발음사전에 다중 발음열을 추가하였다. 대화현상을 고려하지 않고 낭독체 스타일로 음성인식을 수행하였을 때 형태소 에러율 (MER: Morpheme Error Rate)은 31.65%였다. 이에 대한 형태소 에러율의 절대값 감소는 묵음 모델과 잡음 모델을 적용했을 때 2.08%, 간투어 모델을 적용했을 때 0.73%, 발음변이 현상을 반영했을때 0.92%였으며, 최종적으로 27.92%의 형태소 에러율을 얻었다. 본 연구는 대화체 연속음성 인식을 위한 기초 연구로 음향모델과 어휘모델, 언어모델 각각에 대한 베이스라인으로 삼고자 한다.

추력 400 파운드급 액체 로켓엔진 개발 (Development of the Liquid Rocket Engine of 400Ib Thrust)

  • 채연석;윤웅섭;이수용;김영목;오승협;최장섭;우유철;김영수
    • 한국추진공학회:학술대회논문집
    • /
    • 한국추진공학회 1995년도 제5회 학술강연회논문집
    • /
    • pp.49-55
    • /
    • 1995
  • 이원 액체추진제를 사용하는 인공위성용 로켓 추진기관의 개발을 위한 핵심부품별 개념 및 상세설계, 성능해석, 성능실험용 시작품의 제작, 수류 성능실험 및 지상 연소시험이 수행되었다. 인공위성 궤도조종용 로켓 추진기관은 1.38MPa의 연소실 압력으로 4초동안 1780N(400$Ib_f$)의 평균추력을 내도록 설계되었으며, 산화제로는 질산, 연료로는 트리 에틸렌 아민(triethylene amine, TEA)과 자이리딘(xylidine)의 혼합물로 구성된 접촉발화형 이원 액체추진제를 사용하고, 추진제를 가압방식에 의해 연소실에 분사하는 방법으로 분사충돌, 미립화, 그리고 기화 후 연소시키게 된다. 효율적인 설계를 위하여 설계전용 소프트웨어를 개발하였으며, 추진기관의 핵심부품별로 유동 시뮬레이션을 수행하고, 해석결과와 수류 실험결과를 바탕으로 설계를 수정, 보완하였다. 지상 연소시험 및 수류 성능실험을 위하여 추진제 공급장치 및 계측 시스템이 설계, 제작되었고, 시스템의 작동 및 자료처리를 위한 소프트웨어를 개발하여 수류 성능실험 및 지상 연소시험에 사용하였으며, 연소시험결과 지상 평균추력 378$Ib_f$를 발생하였다.

  • PDF

에지 분석에 의한 자동 독화 실험 (Automatic Lip Reading Experiment by the Analysis of Edge)

  • 이경호;금종주;이상범
    • 한국컴퓨터산업학회논문지
    • /
    • 제9권1호
    • /
    • pp.21-28
    • /
    • 2008
  • 본 논문에서는 입술 주위 영상만으로 독화를 위한 에지 파라미터를 추출하였고, 한국어 5모음 'ㅏ/ㅔ/ㅣ/ㅗ/ㅜ'를 인식하는데 효과적임을 보였다. 발화하는 입주위의 이미지를 $5{\times}5$로 나누고, 각 영역에 소벨 연산자를 적용하여 디지털 에지 수를 구한 후, 이 값들의 관찰 오차를 정규화를 통하여 수정하고, 정규화 된 값을 파라미터로 사용하였다. 파라미터의 견인성을 확인하기 위하여, 자동 독화 시스템을 구축하였다. 인식 실험에 정상인 50명이 동원되었고, 10명의 이미지로 분석하고, 다른 40명의 이미지로 인식 실험을 하였다. 500개의 데이터를 분석하고, 이 분석을 바탕으로 신경망 시스템을 구축하였으며, 400개의 데이터로 인식 실험하였다. 신경망 시스템의 최고 인식 결과는 91.1%였다.

  • PDF

중국인 화자의 한국어 파열음 발음 (Korean Plosive Produced by Chinese Speaker)

  • 강반;김지은;이충우
    • 한국콘텐츠학회논문지
    • /
    • 제14권3호
    • /
    • pp.482-489
    • /
    • 2014
  • 본 연구는 중국인 학습자의 한국어 파열음 (/ㄲㄱㅋㄸㄷㅌㅃㅂㅍ/) 발음의 VOT값이 (1) 한국에 거주하며 한국어를 배운 기간에 따라 어떻게 달라지는지 (2) 유의미 단어와 무의미 단어에 따라 달라지는지 (3) 한국인의 이해도와 연관이 있는지를 알아보는 것을 목적으로 한다, 본 연구를 위하여 18명의 중국인 화자들의 한국어 파열음 발음은 음성프로그램으로 분석되었고, 이후 중국인 화자가 발화한 파열음을 한국인 화자가 인지 가능한지 평가하여 이 결과와 VOT값을 비교하여 보았다. 본 실험에 참여한 중국인 화자들의 한국어 VOT값의 평균을 보면, 경음은 한국인 화자들의 VOT값과 큰 차이가 없었으나, 모국어의 영향으로 평음은 한국인 보다 더 짧아, 경음에 가깝게 발음한다는 것을 알 수 있었고, 격음의 VOT도 한국인 보다 더 짧다는 것을 알 수 있었다. 한국에 거주한 시기와 중국어 화자의 한국어 파열음 VOT값의 관계에서는, 중국인 화자의 한국어 발음은 거주 기간이 길어지고 한국어 학습양이 많아져도 쉽게 수정되지 않는 것으로 나타났으며 유의미 단어와 무의미 단어의 차이도 유의미하지 않는 것으로 나타났다.