• 제목/요약/키워드: 혼동

검색결과 330건 처리시간 0.026초

나이브 베이즈 분류기와 혼동 행렬을 이용한 OCR에서의 철자 교정 (Using Naïve Bayes Classifier and Confusion Matrix Spelling Correction in OCR)

  • 노경목;김창현;천민아;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.310-312
    • /
    • 2016
  • OCR(Optical Character Recognition)의 오류를 줄이기 위해 본 논문에서는 교정 어휘 쌍의 혼동 행렬(confusion matrix)과 나이브 베이즈 분류기($na{\ddot{i}}ve$ Bayes classifier)를 이용한 철자 교정 시스템을 제안한다. 본 시스템에서는 철자 오류 중 한글에 대한 철자 오류만을 교정하였다. 실험에 사용된 말뭉치는 한국어 원시 말뭉치와 OCR 출력 말뭉치, OCR 정답 말뭉치이다. 한국어 원시 말뭉치로부터 자소 단위의 언어 모델(language model)과 교정 후보 검색을 위한 접두사 말뭉치를 구축했고, OCR 출력 말뭉치와 OCR 정답 말뭉치로부터 교정 어휘 쌍을 추출하고, 자소 단위로 분해하여 혼동 행렬을 만들고, 이를 이용하여 오류 모델(error model)을 구축했다. 접두사 말뭉치를 이용해서 교정 후보를 찾고 나이브 베이즈 분류기를 통해 확률이 높은 교정 후보 n개를 제시하였다. 후보 n개 내에 정답 어절이 있다면 교정을 성공하였다고 판단했고, 그 결과 약 97.73%의 인식률을 가지는 OCR에서, 3개의 교정 후보를 제시하였을 때, 약 0.28% 향상된 98.01%의 인식률을 보였다. 이는 한글에 대한 오류를 교정했을 때이며, 향후 특수 문자와 숫자 등을 복합적으로 처리하여 교정을 시도한다면 더 나은 결과를 보여줄 것이라 기대한다.

  • PDF

문자 인식을 이용한 한글 문서 검색 (Hangul Document Retrieval Using Character Recognition)

  • 안재철;오일석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.544-546
    • /
    • 2001
  • 이 논문은 OCR(Optical Character Reader)로 인식된 한글 문서에서의 오인식 경향을 분석하고, 이를 이용한 한글 단어 검색 방법을 제안한다. OCR로 인식된 많은 야의 한글 문서를 기반으로 자모별 인식 빈도수를 계산하고 이를 바탕으로 초성, 중성, 중성별 인식 혼동 행렬(confusion matrix)을 구성하였다. 또한 인식 정보를 적절히 이용하기 Bayes 정리를 이용하였다. 질의어에 대한 오인식 단어의 검색 방법을 제시하고 혼동 행렬과 이 검색 방법을 바탕으로 OCR 기반 단어 검색 시스템을 구축하였다.

  • PDF

영작문 자동 채점 시스템을 위한 문맥 고려 단어 오류 검사기 (Context-sensitive Word Error Detection and Correction for Automatic Scoring System of English Writing)

  • 최용석;이공주
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권1호
    • /
    • pp.45-56
    • /
    • 2015
  • 본 연구에서는 문맥 정보를 함께 고려해야만 인식할 수 있는 단어 오류에 대하여 오류 인식 방법과 수정 후보 생성 방법을 제안한다. 이 문제는 기존의 영어권에서 이미 많이 다룬 연구 주제이다. 본 연구에서는 영어 자동채점 시스템에서 사용하도록 특화된 방법을 제안한다. 문맥 정보를 고려한 단어 오류 검사에서는 자주 혼동되어 사용되는 단어집합(confusion set)을 활용한다. 비영어권 사용자의 작문 특성을 반영하기 위해 기존의 영어권에서 구축한 혼동집합 이외에 자동으로 혼동집합을 구축하여 실험해 보았다. 또한 품사 중의성으로 인해 기존의 구문오류 검사기가 다루지 못하는 오류를 정의하고 오류 인식과 오류수정 후보를 생성하는 방법을 제안한다. 실제 한국어가 모국어이면서 초/중급 작문 수준의 수험생들이 작성한 영어 문장에 대해 평가해 본 결과, 약 70.48%의 f1 값을 얻어 기존의 영어권 결과에 비해 뒤지지 않는 성능을 보였다.

적응 순항 제어 시스템에서의 모드 혼동에 관한 연구 (A Study on Mode Confusions in Adaptive Cruise Control Systems)

  • 안대룡;양지현;이상헌
    • 대한기계학회논문집A
    • /
    • 제39권5호
    • /
    • pp.473-482
    • /
    • 2015
  • 최근 과학 기술의 발전으로 첨단 자율 기능을 탑재된 차량의 출현이 가능하게 되었으며, 기존 차량에 추가된 첨단 운전자 지원 시스템(Advanced Driver Assistance Systems: ADAS)은 기존 차량에 추가된 이러한 자율 시스템들의 좋은 예라 할 수 있다. 이러한 시스템은 다수의 작동 모드를 가지는데 운전자들이 현재 수행중인 작동 모드를 잘못 인지하게 되면 교통사고가 일어날 수 있음이 관찰되고 있다. 본 연구에서는 적응 순항제어(Adaptive Cruise Control: ACC) 시스템을 장착한 자동화된 자동차의 운전자 인터페이스를 설계하고 이를 정형 기법을 통한 분석과 피실험자를 이용한 실험을 통해 모드 혼동 발생 여부를 검증하고 이를 개선하는 연구를 수행하였다. 이를 통해 모드 혼동을 방지하기 위해서는 시스템에 대한 심성 모델의 정확성과 간결성뿐만 아니라 인터페이스 구현시 디스플레이의 명확성이 또한 매우 중요하다는 것을 확인하였다.

효율적인 순로코드 발생을 위한 고속 한글 주소검색 시스템 개발 (High-Speed Korean Address Searching System for Efficient Delivery Point Code Generation)

  • 김경환;이석구;신미영;남윤석
    • 정보처리학회논문지D
    • /
    • 제8D권3호
    • /
    • pp.273-284
    • /
    • 2001
  • 실제로 사용되는 주소의 분석을 통해 한글주소의 해석방법을 제안하고, 제안한 주소해석 방법을 이용한 주소 검색시스템의 구현에 대하여 서술한다. 주소 상위 및 하위영역의 일치검증을 각각 순차적으로 수행하는 2단계 과정을 통해 최종 배달점에 대한 순로코드를 발생한다. 우편 번호와 주소 상위영역 일치검증 단계에서는 우편버호를 이용하여 주소사전에서 검색된 주소단어와 인식된 문자 후보들과의 비교를 통해 우편 번호를 검증하게 되며, 주소 상위영역과 주소 하위영역이 분리된다. 주소 상위영역 일치검증 과정의 성능향상을 위해 혼동행렬을 제안하고, 주소 인식결과에 혼동행렬을 적용하여 검증 성공률의 향상을 통해 혼동행렬의 유용성을 확인하였다. 주소 하위영역 검증은 번지정보와 건물명 정보를 이용하여 순로코드를 발생하였다. 부분적으로 완성된 광주와 부산지역의 DPF(Delivery Point File)와 레이블링된 데이터를 이용해 분석 가능한 주소에 대해 높은 정확도를 가지고 순로코드를 발생함을 확인할 수 있었다.

  • PDF

생활 환경에서의 인공지능 시스템 성능 개선 및 평가를 위한 리빙랩 및 혼동 매트릭스 (Living Lab and Confusion Matrix for Performance Improvement and Evaluation of Artificial Intelligence System in Life Environment)

  • 하지원;서지석;이성수
    • 전기전자학회논문지
    • /
    • 제24권4호
    • /
    • pp.1180-1183
    • /
    • 2020
  • 최근 들어 IoT와 스마트홈의 발전에 따라 낙상 사고 감지, 화상 위험 감지와 같이 일상 생활에서의 안전 감지 기능이 많이 보급되기 시작했다. 이러한 안전 감지 기능은 대부분 인공지능에 의해 수행된다. 그러나 실험실 환경에서 안전 감지의 정확도만 평가하는 경우에는 실제로 일상 생활 환경에서 체감하게 되는 성능과 꽤 큰 차이를 보이는 경우가 많다. 본 논문에서는 이러한 문제점을 보완하기 위해 사용하는 두 가지 기법인 리빙랩과 혼동 매트리스를 소개한다. 리빙랩은 단순히 일상 생활환경의 모사를 넘어서 사용자가 직접 기술 개발 및 제품 설계에 참여할 수 있는 통로가 된다. 또한 혼동 매트리스에서 도출되는 다양한 성능 척도는 사용 목적에 적합하게 인공지능 시스템의 성능을 평가하는데 큰 도움을 준다.