• 제목/요약/키워드: 문자검출

검색결과 263건 처리시간 0.027초

문서 처리 자동화를 위한 인보이스 이미지의 구조 인식 방법 (Structure Recognition Method of Invoice Document Image for Document Processing Automation)

  • 이동석;권순각
    • 한국산업정보학회논문지
    • /
    • 제28권2호
    • /
    • pp.11-19
    • /
    • 2023
  • 본 논문은 인보이스 문서 이미지에 문서 처리 자동화를 적용하기 위한 문서 구조 인식 방법과 문서 구조 인식 결과를 토대로 스프레드문서 형태로 출력하는 방법을 제안한다. 딥러닝 OCR 엔진을 통해 문서 내 단어 블록들과 해당 블록들의 문자 인식 결과를 얻는다. 단어 블록의 위치 정보들을 통해 같은 행과 같은 열에 존재하는 단어 블록들을 검출한다. 단어 블록들의 배치 정보를 통해 문서 영역을 분할한다. 문서의 구역 정보를 통해 얻어진 문서 구조를 토대로 스프레드시트의 알맞은 위치에 문자 인식 결과를 입력한다. 실험 결과 제안된 방법을 통한 항목 배치는 평균 92.30%의 정확도를 보인다.

내용기반 영상 검색 유효성을 측정하는 방법들에 대한 비교 (Precision/Recall vs. Wilcoxon 순위 방법) (Comparison of Retrieval Effectiveness between Precision/Recall and Wilcoxon Test)

  • 장순자;김형중;여인권
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2001년도 추계학술발표논문집
    • /
    • pp.453-457
    • /
    • 2001
  • 영상검색은 문자위주의 검색을 한계로, 그 내용에 기반 한 특징벡터를 이용하여 검색을 수행한다. 특징벡터간의 거리를 계산하고 그 값들에 순위를 매긴다. 이렇게 얻어진 순위 값들을 가지고 사용된 검색방법의 유효성을 검사하는데 Recall/Precision 방법이 이용되고 있다. 질의영상과 같은 군에 속하는 영상이 얼마나 검출되었는지를 검출된 영상에 기반하여 계산하거나, 영상 군에 기반하여 계산하는 방법들이다. 그러나, 검출되는 순위값의 범위를 정하고, 그 범위 내에 속하는 만족하는 값의 개수를 세는 방법을 이용한다. 따라서 주어진 두 샘플의 전체적인 경향을 비교하지는 못한다. 본 연구에서는 순위를 이용하여 비교하고자 하는 두 샘플의 순위들을 결합하여 순위를 매기고 각 샘플들에 매겨진 순위값들의 평균과 분산을 이용하여 각 샘플들을 전체적으로 비교할 수 있다.

  • PDF

색상과 모양 특징을 이용한 실시간 속도제한 표지판 인식 (Real-time Speed Sign Recognition with Color and Shape Feature)

  • 임광용;김승규;변혜란
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(B)
    • /
    • pp.504-506
    • /
    • 2012
  • 운전자 지원 시스템(ADAS)은 최근 지능형 자동차 분야에서 중요한 이슈로 손꼽히는 기술 중 하나이다. 이 중에서 실시간 표지판 인식 기술은 운전자 지원 시스템의 하나로 운전자의 안전과 직결될 수 있어 높은 정확성과 실시간성이 요구된다. 그동안 표지판 인식 분야는 색상과 현상을 기반으로 연구가 진행되어왔으나, 교통 표지판은 국가별로 그 특징과 형태가 각기 상이하여 적용하는데 한계가 있다. 본 논문에서는 한국의 속도제한 표지판을 실시간으로 검출하고 인식하기 위하여, 1) 영상에서 색상 특징을 이용하여 후보 영역을 검출하고, 2) 형상 정보를 분석하여 표지판의 형태를 검증하고, 3) 검출된 후보영역의 내부문자(숫자)를 분할하고 인식하는 시스템을 제안한다.

도로 동영상에서 차량번호판 인식 (Recognition of License Plate of Car in Vehicle Motion Images)

  • 이향정;이효종;이훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (상)
    • /
    • pp.775-778
    • /
    • 2002
  • 본 논문에서는 도로를 주행하는 차량영상으로부터 번호판의 인식에 대한 연구이다. 차량을 검출하기 위해 두 프레임의 차를 이용하여 도로상에서 차량을 분리하였고, 번호판 영역을 추출하기 위해 명암도 변화의 파형 곡선 결과에 임계값을 적용하여 번호판을 추출하였다. 번호판 영역 검출은 96.05%의 검출결과를 얻었으며, 차량의 번호판 문자인식은 신경망을 통하여 학습 시켰 그 성능은 잭나이프 기법을 통해 측정하였다. 학습데이터에 대해서는 99.85 비학습데이터에 대해서는 88.15%의 인식율을 보였다.

  • PDF

어휘의미패턴을 이용한 음성인식 오류 검출 및 수정 (Error detection and correction in speech recognition by using lexico-semantic patterns)

  • 윤용욱;정한민;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.62-68
    • /
    • 2002
  • 음성인식기를 거친 결과는 오류를 포함할 수 있으며 이를 다른 자연어처리 응용에 이용하기 위해서는 오류의 검출과 수정과정이 필수적이다. 음성인식 오류 후처리는 그 성격상 문자인식 후처리와는 다른 접근 방법을 필요로 하며, 본 인구에서는 잡음환경을 제외한 특정 도메인에 국한된 음성발화 상황에 초점을 맞추고자 한다. 후처리 방법에 있어서는 통계적 접근과 패턴매칭에 의한 접근 방법이 있으며, 본 연구에서는 특정 도메인에서 사용되는 어휘의 의미정보를 포함하는 패턴을 자동으로 생성시켜 이에 의한 오류 검출 및 수정 방안을 제안한다. 본 실험에 사용된 도메인은 차량정보센터용 음성정보 제공 시나리오이며 상용 음성인식기를 후처리를 위한 개발 툴로 사용하였다.

  • PDF

에지기반 세그먼트 영상 생성에 의한 차량 번호판 인식 시스템 (Vehicle License Plate Recognition System By Edge-based Segment Image Generation)

  • 김진호;노덕수
    • 한국콘텐츠학회논문지
    • /
    • 제12권3호
    • /
    • pp.9-16
    • /
    • 2012
  • 스마트시티 프로젝트의 일환으로 실시간 차량 번호판 인식에 관한 연구들이 활발하게 진행되고 있다. 도로상에 설치된 CCTV에서 트리거 신호 없이 주행하는 차량 영상을 획득할 경우에는 번호판의 기하학적 왜곡이나 화질의 저하가 발생하여 번호판 인식이 어려워 질 수 있다. 본 논문에서는 트리거 신호를 이용하지 않은 상태에서 입력되어 기하학적 왜곡이나 화질의 저하가 발생된 차량 영상에도 강한 에지기반 문자 세그먼트 영상생성 기법의 차량 번호판 인식시스템을 제안하였다. 제안한 실시간 차량 번호판 인식 알고리즘을 도로상에 설치된 CCTV에 구현하고 일주일 동안 번호판 인식 실험을 수행해 본 결과 1일 평균 1,535 대의 통과 차량에 대해서 97.5%의 번호판 검출률을 얻을 수 있었으며 검출된 번호판에 기록된 문자들의 99.3%를 인식할 수 있었다.

CW Morse 신호 인식을 위한 신호처리 기법 (Signal Processing Techniques for Recognition of CW Morse Signals)

  • 손영채;임동민;태기철;김청섭;함영권;김창주
    • 한국통신학회논문지
    • /
    • 제27권8A호
    • /
    • pp.763-770
    • /
    • 2002
  • CW Morse 신호의 인식은 톤과 스페이스를 구별하는 신호 검출 과정, 잡음 제거 등의 신호처리 과정, 톤/스페이스를 판별하는 과정, 판별된 톤과 스페이스 순열을 문자로 변환하는 과정, 변환된 문자 메시지를 반복 구문 등을 이용하여 오류정정을 수행하는 과정으로 나눌 수 있다. 본 논문에서는 신호의 페이딩에 효과적으로 대처하기 위하여 주파수 영역에서 피크의 형성 유무로 신호를 검출하는 방법을 제안하고 검출된 다수의 주파수 피크 성분을 합성하고 잔여 신호 성분 및 잡음을 제가하는 방법을 제시한다. 톤/스페이스의 판별에는 LMS 적응 판별법을 이용하였으며 초기치 설정 방법 및 오동작 조건을 분석하였다. 실제 수신된 CW Morse 신호를 이용한 인식 실험을 수행하였으며 제안된 방법이 신호의 페이딩이 심한 경우에도 우수한 인식 성능을 나타냄을 확인하였다.

한글정보처리에서 다음절의 자동식별 (Automatic Discriminating of Monosyllable in Korean Characters)

  • 이주근;남궁재찬
    • 대한전자공학회논문지
    • /
    • 제13권5호
    • /
    • pp.30-34
    • /
    • 1976
  • 24개의 기본요소를 가지고 2-7개 요소로서 한 문자를 구성하는 한글 data의 연속입력으로부터 space code없이 단음절을 자동식별하는 한 system을 제안한다. 3천여자의 한글을 30종의 form으로 form화하고, 그들 form에 대한 7개의 form 특징과 문자구간을 검출하여 단음절을 식별한다. 그 결과 연속입력되는 한글 data의 처리에서 음절분리용 space code를 사용했을 때와 비교하여 컴퓨터의 기억용량이 약 25% 절감되고 처리속도가 약 30% 향상된다.

  • PDF

PGP 기반의 스팸메일 검출 및 차단 시스템 (Spam-mail detection and interception system of PGP base)

  • 최홍식;김중환;김상철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (하)
    • /
    • pp.2379-2382
    • /
    • 2002
  • 요즘 전자우편(E-mail) 서비스를 사용하게 되면서, 스팸 메일이라고 불리 우는 광고성 메일이 무분별하게 전자우편에 침입하고 있다. 요즘과 같이 정보의 중요성과 개인의 사생활이 강조되는 시점에서 다른 사람이 중간에 메일을 가로채어 읽거나 해킹 하여 전혀 다른 내용으로 바꾸어 배포하거나 바뀐 내용을 전송하거나 과도한 스팸메일 때문에 자신의 메일 계정에 부하가 걸려서 중용한 메일을 못 받게 된다면 보통 심각한 일이 아닐 수 없다. 본 논문에서는 이것을 해결하기 위하여, PGP(Pretty Good Privacy)라는 기술과 문자열 처리를 이용하여 전자우편의 보안성 향상과 문자열 처리를 통해 스팸메일을 줄이는 방법을 제안한다.

  • PDF

Multimedia Message Service(MMS)상에서 전송되는 스팸이미지 필터링 시스템 (Multimedia Message Service(MMS) Spam Image Filtering System)

  • 박영만
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.933-935
    • /
    • 2014
  • 휴대전화 사용의 대중화로 인하여 개개인의 휴대전화로 수신되는 스팸메시지의 양도 덩달아 증가하게 되었다. 이것은 휴대전화 사용자가 불법광고 노출의 원인이 되고 있다. 이에 많은 스팸메시지 차단기법이 제시되었지만 이는 텍스트기반의 문자메시지에 특화되어있어 문자가 포함되어있는 이미지스팸에는 차단이 어렵다는 문제점이 존재 한다. 이에 본 논문에서는 휴대전화로 오는 이미지메시지 중 스팸이미지를 검출해 내는 모바일 스팸이미지 필터링 시스템을 제시하고자 한다. 제시하고자 하는 시스템은 스팸이미지를 분석하여 이미지의 패턴을 검사하여 특정 패턴이 포함된 이미지에 대해서 스팸이미지로 분류하여 필터링하게 됨으로써, 실제 휴대전화로 수신되는 스팸이미지를 이용한 실험을 진행하였다. 그 결과 기존 텍스트기반 스팸필터링시스템에서 할 수 없었던 스팸이미지 필터링을 할 수 있음을 확인 하였다.