• 제목/요약/키워드: 분류오류

검색결과 646건 처리시간 0.034초

한국어 음성 인식 시스템의 오류 유형 분류 및 분석 (Categorization and Analysis of Error Types in the Korean Speech Recognition System)

  • 손준영;박찬준;서재형;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.144-151
    • /
    • 2021
  • 딥러닝의 등장으로 자동 음성 인식 (Automatic Speech Recognition) 기술은 인간과 컴퓨터의 상호작용을 위한 가장 중요한 요소로 자리 잡았다. 그러나 아직까지 유사 발음 오류, 띄어쓰기 오류, 기호부착 오류 등과 같이 해결해야할 난제들이 많이 존재하며 오류 유형에 대한 명확한 기준 정립이 되고 있지 않은 실정이다. 이에 본 논문은 음성 인식 시스템의 오류 유형 분류 기준을 한국어에 특화되게 설계하였으며 이를 다양한 상용화 음성 인식 시스템을 바탕으로 질적 분석 및 오류 분류를 진행하였다. 실험의 경우 도메인과 어투에 따른 분석을 각각 진행하였으며 이를 통해 각 상용화 시스템별 강건한 부분과 약점인 부분을 파악할 수 있었다.

  • PDF

띄어쓰기 오류에 강건한 문장 압축 기반 한국어 문장 분류 (Jam-packing Korean sentence classification method robust for spacing errors)

  • 박근영;김경덕;강인호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.600-604
    • /
    • 2018
  • 한국어 문장 분류는 주어진 문장의 내용에 따라 사전에 정의된 유한한 범주로 할당하는 과업이다. 그런데 분류 대상 문장이 띄어쓰기 오류를 포함하고 있을 경우 이는 분류 모델의 성능을 악화시킬 수 있다. 이에 한국어 텍스트 혹은 음성 발화 기반의 문장을 대상으로 분류 작업을 수행할 경우 띄어쓰기 오류로 인해 발생할 수 있는 분류 모델의 성능 저하 문제를 해결해 보고자 문장 압축 기반 학습 방식을 사용하였다. 학습된 모델의 성능을 한국어 영화 리뷰 데이터셋을 대상으로 실험한 결과 본 논문이 제안하는 문장 압축 기반 학습 방식이 baseline 모델에 비해 띄어쓰기 오류에 강건한 분류 성능을 보이는 것을 확인하였다.

  • PDF

MPEG-2 표준을 위한 오류 데이터 분류 (The Taxonomy of Dirty Data for MPEG-2 TS)

  • 곽태희;최병주
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (A)
    • /
    • pp.691-693
    • /
    • 2001
  • DASE(Digital TV Application Software Environment)는 데이터 방송을 위한 국제 표준으로 MPEG-2 TS(Moving Picture Experts Group-2 Transport Stream) 형식의 데이터를 처리한다. 소스코드 대신 입력 데이터 명세 정보만을 공개하는 특성상 DASE 시스템의 오류를 테스트하기 위해서는 테스트 데이터에 오류를 삽입하는 방법이 적합하고 이를 위해 MPEG-2 표준을 위한 오류 항목을 개발이 요구된다. 본 논문에서는 관계형 데이터 베이스를 위한 데이터 분류인 Kim’s et al 분류를 근거로 하여 MPEG-2 표준을 위한 오류 항목을 개발하였다. 이는 DASE 시스템의 오류 삽입 테스트 기법에 유용하게 사용될 수 있을 것이다.

  • PDF

공공도서관 분류오류의 실증적 분석과 대안 (Analysis and Alternative of Classification Errors in Public Libraries)

  • 윤희윤
    • 한국도서관정보학회지
    • /
    • 제34권1호
    • /
    • pp.43-65
    • /
    • 2003
  • 도서관은 오랫동안 분류법을 적용하여 자료를 정리하여 왔다. 그 궁극적 목적은 자료의 체계적 배가와 접근(브라우징)의 편의성을 극대화하는데 있으며, 동일한 자료가 동일한 분류번호에 배정되어야 한다는 원칙을 전제로 한다. 이러한 당위성에도 불구하고 한국십진분류법을 표준도구로 사용하고 있는 국내 공공도서관의 경우, 소위 분류오류가 적지 않은 것으로 판단되어 그 원인이 무엇이며 어느 정도로 심각한지를 실증적으로 분석하였다. 그리고 분류오류를 해소하기 위한 대안, 즉 분류의 중요성에 대한 인식 제고, 학부의 분류교육의 충실화, 사서직 실무교육의 강화. CIP 제도의 정착과 내실화, 분류표의 체계성 및 하위항목의 개선, 재분류(분류수정)팀의 구성과 가동, 분류사이트 운영의 필요성을 제시하였다.

  • PDF

정규혼합에서 분류정확도 측도들의 최적기준 (Optimal Criterion of Classification Accuracy Measures for Normal Mixture)

  • 유현상;홍종선
    • Communications for Statistical Applications and Methods
    • /
    • 제18권3호
    • /
    • pp.343-355
    • /
    • 2011
  • 두 분포함수의 혼합모형을 가정한 자료에서 적절한 분류점을 찾고 평가하는 것은 중요한 문제이다. 분류정확도 측도로 많이 사용하는 아홉 종류의 MVD, Youden지수, (0,1)까지 최단기준, 수정된(0,1)까지 최단 기준, SSS, 대칭점, 정확도면적, TA, TR에 대하여 설명하고, 이 측도들의 관계를 발견하면서 정확도 측도들의 조건을 몇 개의 범주로 군집화한다. 정규혼합분포를 가정하여 군집된 측도들에 기반하는 분류점들을 구하고, 그 분류점에 대응하는 제I종 오류율과 제II종 오류율 그리고 두 종류의 오류율합을 구하여 크기를 비교하고 토론하다. 추정된 혼합분포에 대하여 어떤 분류 정확도 측도의 제I종과 II종 오류율 또는 오류율합이 최소인지를 탐색할 수 있으며 자주 인용하는 정확도 측도의 장점과 단점을 파악할 수 있다.

경험적 구조주의에 의한 수학적 오류의 분류가능성 탐색 (Cognitive Psychological Approaches for Classification of Students' Mathematical Errors on the basis of Experiential Structuralism)

  • 김부미
    • 대한수학교육학회지:수학교육학연구
    • /
    • 제15권4호
    • /
    • pp.461-488
    • /
    • 2005
  • 수학적 오류를 인지구조의 수행 변화와 관련 있는 정신용량으로 설명할 수 있다면, 다양한 과제에 따라 여러 유형으로 발생하는 수학적 오류를 분류할 수 있는 공통적인 기준도 학습자의 인지체계와 정신용량을 관련하여 설명할 수 있다고 볼 수 있다. 본 연구에서는 수학적 오류를 Demetrious et al.(1987, 1993)의 경험적 구조주의를 바탕으로 학생들의 인지구조 및 과제상황에 근거하여 설명하고 다양한 내용과 맥락에 공통적으로 적용이 가능한 오류 분류 기준을 제안하고 실제에의 적용가능성을 탐색한다. 그 결과, 오류 분류 기준은 6가지 자발적 정신용량과 그 요소능력 및 양식적 특성으로 요약될 수 있다 제안한 경험적 구조주의에 기반한 오류 분류 기준을 일차함수과제를 예측과제, 번역과제, 해석과제, 척도과제로 세분화하여 적용한 결과, 오류의 재분류가 가능하였다.

  • PDF

한국어 챗봇에서의 오류에 강건한 한국어 문장 분류를 위한 어절 단위 임베딩 (Eojeol-based Embedding for Korean Erroneous Sentence Classification in Korean Chatbot)

  • 최동현;박일남;신명철;김응균;신동렬
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.43-48
    • /
    • 2019
  • 본 논문에서는 한국어 챗봇에서의 문장 분류 시스템에 대하여 서술한다. 텍스트를 입력으로 받는 한국어 챗봇의 경우, 때때로 입력 문장에 오타나 띄어쓰기 오류 등이 포함될 수 있고, 이러한 오류는 잘못된 형태소 분석 결과로 이어지게 된다. 잘못된 형태소 분석 결과로 인한 문장 분류의 오류를 줄이기 위하여, 본 논문에서는 새로운 통합 어절 임베딩 방식을 제안한다. 통합 어절 임베딩 방식의 단점을 보완하고 성능을 향상시키기 위하여, 두 가지의 말뭉치 노이즈 추가 방법이 별도로 제안되었다. 실험 결과에 따르면, 본 논문에서 제안된 시스템은 오류를 포함한 한국어 문장 분류 문제에서 기존 시스템과 비교하여 문장 단위 정확률 기준으로 23 %p의 성능 향상을 보였다.

  • PDF

공공데이터 품질환경 내 데이터 오류의 발생원인별 보안기술 대응방안에 관한 연구

  • 이원재;김휘강
    • 정보보호학회지
    • /
    • 제30권4호
    • /
    • pp.77-89
    • /
    • 2020
  • 이 연구는 우리나라 정부의 공공데이터 공개 제도에 따른 공공데이터 품질관리체계를 이해하고, 공공기관이 신뢰성 있는 데이터를 위해 품질 점검을 시행하면서도 효과적인 관리를 하기 위한 방안에 관한 것이다. 공공데이터법과 공공데이터 품질관리체계를 이해하고, 저품질 공공데이터의 오류와 발생원인에 대해 알아본다. 오류 데이터 분석을 통한 보안위협에 따른 위험 분류를 통해 효과적인 대응방안을 도출하는 것을 목표로 한다. 이를 위해 공공데이터를 데이터 품질 점검하여 도메인별 오류데이터를 살펴보고, 오류데이터 발생원인에 대한 분석을 통해 보안위협과 공공데이터를 사용하는 사용자 측면과 기관 측면의 보안 문제를 분류하였다. 분류된 오류 발생원인별 보안문제를 기준으로 데이터 품질관리를 통한 개선방향을 제시하고, 품질관리 오류 개선방향별 데이터보안 정책별 보안기술을 비교 정리하여, 데이터 보안기술을 통한 품질관리 오류 개선 연계 대응방안을 제안하였다.

깊은신경망을 이용한 회전객체 분류 연구 (A Study on Rotating Object Classification using Deep Neural Networks)

  • 이용규;이일병
    • 한국지능시스템학회논문지
    • /
    • 제25권5호
    • /
    • pp.425-430
    • /
    • 2015
  • 본 논문은 딥러닝 알고리즘을 적용한 깊은신경망을 이용하여 회전 객체의 분류 효율성을 높이기 위한 연구이다. 회전객체의 분류 실험을 위하여 데이터는 COIL-20을 사용하며 객체의 2/3영역을 학습시키고 1/3영역을 유추하여 분류한다. 연구에 이용된 3가지 분류기는 주성분 분석법을 이용해 데이터의 차원을 축소하면서 특징값을 추출하고 유클리디안 거리를 이용하여 분류하는 PCA분류기와 오류역전파 알고리즘을 이용하여 오류 에너지를 줄여가는 방식의 MLP분류기, 마지막으로 pre-training을 통하여 학습데이터의 관찰될 확률을 높여주고 fine-tuning으로 오류에너지를 줄여가는 방식의 딥러닝을 적용한 DBN분류기이다. 깊은신경망의 구조별 오류율을 확인하기 위하여 은닉층의 개수와 은닉뉴런의 개수를 변경해가며 실험하고 실제로 가장 낮은 오류율을 나타내는 구조를 기술한다. 가장 낮은 오류율을 보였던 분류기는 DBN을 이용한 분류기이다. 은닉층을 2개 갖는 깊은신경망의 구조로 매개 변수들을 인식에 도움이 되는 곳으로 이동 시켜 높은 인식률을 보여줬다.

해양사고를 야기하는 해기사의 인적오류 식별과 분류 및 평가에 관한 기초 연구 (Research on the Identification, Classification and Evaluation for the Human Errors of Deck Officer Contributing Marine Casuality)

  • 조수산;임정빈;양원재;문지웅;박혜리;이상훈;권도언;박은선;조하람
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2012년도 추계학술대회
    • /
    • pp.141-142
    • /
    • 2012
  • 해양사고를 야기하는 인적오류는 일반적으로 규정위반, 실수, 간과, 무기억 등 네 가지 요소로 구분되어 있다. 그러나 실제 해운회사의 사고기록을 조사해 보면, 이러한 네 가지 요소로 분류 불가능한 경우가 있다. 특히, 불합리한 작업의 양, 위기관리 능력의 부족, 오해, 불확실성의 이해 부족, 인적 오류의 미반영 등은 기존 네 가지 분류에 포함될 수 없는 것으로 조사되었다. 본 연구에서는 해양사고를 야기하는 해기사의 인적오류를 식별하고 분류하며 평가하기 위한 방법을 고찰하고, 새로운 분류 요소를 식별하였다. 실험결과, 새로운 식별 요소의 개발이 필요하고, 개발한 식별 요소가 해기사의 인적오류 평가에 유효함을 알았다.

  • PDF