• 제목/요약/키워드: 오류수정

검색결과 631건 처리시간 0.025초

음성 인식 오류 수정을 위한 Trie 기반 사전을 이용한 Guided Sequence Generation (Guided Sequence Generation using Trie-based Dictionary for ASR Error Correction)

  • 최준휘;류성한;유환조;이근배
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.211-216
    • /
    • 2016
  • 현재 나오는 많은 음성 인식기가 대체로 높은 정확도를 가지고 있더라도, 음성 인식 오류는 여전히 빈번하게 발생한다. 음성 인식 오류는 관련 어플리케이션에 있어 많은 오동작의 원인이 되므로, 음성 인식 오류는 고쳐져야 한다. 본 논문에서는 Trie 기반 사전을 이용한 Guided Sequence Generation을 제안한다. 제안하는 모델은 목표 단어와 그 단어의 문맥을 Encoding하고, 그로부터 단어를 Character 단위로 Decoding하며 단어를 Generation한다. 올바른 단어를 생성하기 위하여, Generation 시에 Trie 기반 사전을 통해 유도한다. 실험을 위해 모델은 영어 TV 가이드 도메인의 말뭉치의 음성 인식 오류를 단순히 Simulation하여 만들어진 말뭉치로부터 훈련되고, 같은 도메인의 음성 인식 문장과 결과로 이루어진 병렬 말뭉치에서 성능을 평가하였다. Guided Generation은 Unguided Generation에 비해 14.9% 정도의 오류를 줄였다.

  • PDF

음성 인식 오류 수정을 위한 Trie 기반 사전을 이용한 Guided Sequence Generation (Guided Sequence Generation using Trie-based Dictionary for ASR Error Correction)

  • 최준휘;류성한;유환조;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.211-216
    • /
    • 2016
  • 현재 나오는 많은 음성 인식기가 대체로 높은 정확도를 가지고 있더라도, 음성 인식 오류는 여전히 빈번하게 발생한다. 음성 인식 오류는 관련 어플리케이션에 있어 많은 오동작의 원인이 되므로, 음성 인식 오류는 고쳐져야 한다. 본 논문에서는 Trie 기반 사전을 이용한 Guided Sequence Generation을 제안한다. 제안하는 모델은 목표 단어와 그 단어의 문맥을 Encoding하고, 그로부터 단어를 Character 단위로 Decoding하며 단어를 Generation한다. 올바른 단어를 생성하기 위하여, Generation 시에 Trie 기반 사전을 통해 유도한다. 실험을 위해 모델은 영어 TV 가이드 도메인의 말뭉치의 음성 인식 오류를 단순히 Simulation하여 만들어진 말뭉치로부터 훈련되고, 같은 도메인의 음성 인식 문장과 결과로 이루어진 병렬 말뭉치에서 성능을 평가하였다. Guided Generation은 Unguided Generation에 비해 14.9% 정도의 오류를 줄였다.

  • PDF

대화형 에이전트의 자기발화수정 전략이 사용자 경험에 미치는 영향 - 과업 중요도와 대화 오류 여부를 중심으로 (Effects of Conversational Agent's Self-Repair Strategy On User Experience - Focused on Task Criticality and Conversational Error)

  • 김환주;김정용;강현민
    • 디지털융복합연구
    • /
    • 제20권2호
    • /
    • pp.251-260
    • /
    • 2022
  • 기술의 발달과 스마트 스피커 보급의 증가에도, 스마트 스피커의 대화 오류로 사용자 만족도는 하락하고 있다. 이 연구는 스마트 스피커의 대화형 에이전트 맥락에서 '자기발화수정 전략'이 과업 중요도 수준과 대화 오류 여부에 따라 사용자 경험에 미치는 영향을 살펴보았다. 대화 오류에 따라 시나리오를 제작하고 과업 중요도 수준에 따라 집단을 나눠 실험을 진행해 신뢰, 지각된 유용성, 지각된 용이성, 수용의도를 측정하였다. 연구 결과, 에이전트의 자기발화수정 전략은 완전한 수행과 비교해 신뢰와 지각된 용이성에 부적 영향을 주며, 과업 중요도와의 상호작용을 통해 수용의도에 영향을 미치는 것을 발견하였다. 이 연구는 대화형 에이전트 연구에서 미흡했던 자기발화수정 전략의 효과를 실증적으로 알아보았고, 자기발화수정 전략의 수용과 관련된 사용자 경험 요인을 살펴보았다는 점에서 의의를 가진다.

생물 II 교과서 광합성 단원의 오류 분석 및 생물 교사의 오류 인지 조사 (Analysis of Mistakes in Photosynthesis Unit in Biology II Textbooks and Survey of Biology Teachers' Recognition on them)

  • 박혜경;윤기순;권덕기
    • 과학교육연구지
    • /
    • 제32권1호
    • /
    • pp.33-46
    • /
    • 2008
  • 본 연구의 목적은 제7차 교육과정 생물II 교과서의 '광합성' 단원에 나타난 내용 오류를 분석하여 수정 예시를 제시함과 아울러 이 오류가 과목 담당 교사들에 의해 어느 정도 지적되고 수정되는지 조사함으로써 오류가 수정 지도될 가능성을 알아보는데 있다. 이를 위해, 제7차 교육과정 생물II 8종 교과서 광합성 단원에서 오류를 분석하고, 오류가 담긴 교과서 내 지문으로 설문문항을 개발하여 교사들의 오류 인지 및 수정정도를 조사하였다. 8종의 교과서 광합성 단원의 13개 학습주제에서 발견된 오류의 수는 총 48개였으며, 1종의 교과서에서 1개의 학습주제에 대해 4가지 오류가 나타나거나 동일한 오류가 여러 교과서에서 각각 나타나기도 하였다. 35명의 생물II 과목 담당 교사를 대상으로 한 설문 조사 결과, 교과서에 나타난 그래프(문항 6번), 잘못된 용어(문항 4-3번), 잘못된 그림(문항 1-2번) 등과 같은 단순오류의 경우를 오류를 정확히 지적하고 수정한 예가 각각 43%, 40%, 32%로 비율이 높았다. 그러나 광합성의 명반응 과정을 설명하는 삽화에서 에너지 준위의 개념이 접목되어야 하는 오류에 대한 지적을 한 사례는 없었다. 이러한 결과는 생물II 광합성 단원에 나타나는 오류는 정확히 수정되어 지도될 가능성이 낮음을 시사한다. 학생들이 광합성에 대한 오개념을 가질 가능성을 낮추려면 오류를 수정 사항에 대한 자료를 교사들에게 배부하거나 교사연수 또는 워크샵 등을 통해 이에 대한 정보를 나눌 기회가 제공되어야 할 것이다.

  • PDF

연속 변수를 사용한 양자 오류 정정 부호

  • 손일권;허준
    • 정보와 통신
    • /
    • 제31권9호
    • /
    • pp.65-69
    • /
    • 2014
  • 연속 변수 양자 오류 정정 부호는 전자의 스핀, 광자의 편광 등으로 나타내는 불연속 변수와는 다르게 빛의 진폭 및 위상처럼 연속적인 값을 가지는 양자 정보의 오류를 수정하는 기법이다. 본 논문에서는 안정 부호 형태를 기반으로 한 연속 변수 양자 오류 정정 부호의 구성을 살펴보고, 불연속 양자 오류 정정 부호와의 차이점을 알아본다.

일반화된 미등록어 처리와 오류 수정규칙을 이용한 혼합형 품사태깅 (Hybrid POS Tagging with generalized unknown word handling and post error-correction rules)

  • 차정원;이원일;이근배;이종혁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.88-93
    • /
    • 1997
  • 본 논문에서는 품사 태깅을 위해 여러 통계 모델을 실험을 통하여 비교하였으며 이를 토대로 통계적 모델을 구성하였다. 형태소 패턴 사전을 이용하여 미등록어의 위치와 개수에 관계없는 일반적인 방법의 미등록어 처리 방법을 개발하고 통계모델이 가지는 단점을 보완할 수 있는 오류 수정 규칙을 함께 이용하여 혼합형 품사 태깅 시스템인 $POSTAG^{i}$를 개발하였다. 미등록어를 추정하는 형태소 패턴 사전은 한국어 음절 정보와 용언의 불규칙 정보를 이용하여 구성하고 다어절어 사전을 이용하여 여러 어절에 걸쳐 나타나는 연어를 효과적으로 처리하면서 전체적인 태깅 정확도를 개선할 수 있다. 또 오류 수정 규칙은 Brill이 제안한 학습을 통하여 자동으로 얻어진다. 오류 수정 규칙의 자동 추출시에 몇 가지의 휴리스틱을 사용하여 보다 우수하고 일반적인 규clr을 추출할 수 있게 하였다. 10만의 형태소 품사 말뭉치로 학습하고 학습에 참여하지 않은 2만 5천여 형태소로 실험하여 97.28%의 정확도를 보였다.

  • PDF

품사 부착 코퍼스 수정 방안에 대하여 (On Correction Guideline of Tagged Corpus)

  • 김은혜;최기선
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 한글 및 한국어 정보처리
    • /
    • pp.361-367
    • /
    • 2000
  • 품사 부착 코퍼스를 구축하기 위해서는 일반적으로 형태소 분석, 자동 품사 태깅, 수동 또는 자동 오류 수정의 단계를 거친다. 이 글은 그 마지막 단계의 일환인 수동으로 오류를 수정하는 과정에서 요구되는 여러 가지 정보의 필요성과 문제점에 대해 기술하고자 한다. 조사와 어미의 처리 문제, 접두사/접미사 처리 문제, 다품사 문제 등은 정밀도 높은 코퍼스를 구축하는 데 중요한 열쇠가 되기 때문이다. 자연 언어 자료인 코퍼스에 일관성 있는 품사 정보가 부착된다면 정보 검색이나 사전 구축 등 언어 정보 처리 연구에 중요한 자료로 사용될 수 있을 것이다.

  • PDF

품사 부착 코퍼스 수정 방안에 대하여 (On Correction Guideline of Tagged Corpus)

  • 김은혜;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2000년도 제12회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.361-367
    • /
    • 2000
  • 품사 부착 코퍼스를 구축하기 위해서는 일반적으로 형태소 분석, 자동 품사 태깅 수동 또는 자동 오류 수정의 단계를 거친다. 이 글은 그 마지막 단계의 일환인 수동으로 오류를 수정하는 과정에서 요구되는 여러 가지 정보의 필요성과 문제점에 대해 기술하고자 한다. 조사와 어미의 처리 문제, 접두사/접미사 처리 문제, 다품사 문제 등은 정밀도 높은 코퍼스를 구축하는 데 중요한 열쇠가 되기 때문이다. 자연 언어 자료인 코퍼스에 일관성 있는 품사 정보가 부착된다면 정보 검색이나 사전 구축 등 언어 정보 처리 연구에 중요한 자료로 사용될 수 있을 것이다.

  • PDF

STEP 모델의 검증 시스템

  • 최영
    • 한국전자거래학회:학술대회논문집
    • /
    • 한국전자거래학회 2000년도 종합학술대회발표논문집
    • /
    • pp.127-136
    • /
    • 2000
  • ■ STEP 데이터 활용의 필요성 ■ STEP 데이터 오류에 의한 연계 프로세스의 단절 ■ 데이터 오류의 종류 및 검증 ■ 오류 발견 후 수정(Healing)에 대한 연구를 계획 중

  • PDF

저밀도 패리티 검사부호에서 오류마루 감소를 위한 수정 합-곱 알고리즘 (A Modified Sum-Product Algorithm for Error Floor Reduction in LDPC Codes)

  • 유석근;강석근;주언경
    • 한국통신학회논문지
    • /
    • 제35권5C호
    • /
    • pp.423-431
    • /
    • 2010
  • 본 논문에서는 저밀도 패리티 검사부호의 복호에서 발생하는 트랩핑 세트에 갇힌 오류를 정정할 수 있는 수정 합-곱 알고리즘을 제안한다. 원래 합-곱 알고리즘과는 달리 제안된 방법은 반복복호의 실패 원인이 트랩핑 세트인지를 판단하는 과정과 트랩핑 세트에 갇힌 오류를 정정하는 2단계 복호과정으로 구성된다. 수정 합-곱 알고리즘에서는 트랩핑 세트에 포함된 변수노드를 검색하기 위하여 실패 검사노드 집합과 경판정 비트들의 천이패턴을 이용한다. 그리고 검색된 변수노드의 정보를 반전시킨 다음 합-곱 알고리즘을 수행함으로써 트랩핑 세트에 갇힌 오류를 정정한다. 모의실험 결과 제안된 복호알고리즘은 신호 대 잡음비의 증가에 따라 지속적으로 향상되는 오류성능을 보인다. 따라서 수정 합-곱 알고리즘은 저밀도 패리티 검사부호에서 발생하는 오류마루 현상을 현저히 감소시키거나 거의 제거할 수 있는 것으로 사료된다.