• Title/Summary/Keyword: OCR

Search Result 471, Processing Time 0.038 seconds

Equalization OCR with Feedback Interference Canceller in T-DMB System (T-DMB 시스템에서 궤환간섭 제거기를 가지는 등화형 OCR)

  • Park, Sung-Ik;Eum, Ho-Min;Park, So-Ra;Kim, Geon;Lee, Yong-Tae;Kim, Heung-Mook
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2008.11a
    • /
    • pp.23-26
    • /
    • 2008
  • 본 논문에서는 T-DMB 시스템의 단일 주파수 망 구성을 위해 궤환신호 제거기를 가지는 등화형 OCR (Equalization On-Channel Repeater, E-OCR)을 제안한다. 제안된 OCR은 송/수신 안테나의 충분치 못한 분리도로 인해 야기된 궤환신호를 궤환간섭 제거기를 통해 제거하여 송신출력을 높일 뿐만 아니라, 송신기와 중계기 사이의 다중경로 신호를 등화기를 통해 제거하여 우수한 출력신호 품질을 보장한다. 또한, 본 논문에서는 전산실험을 통해 제안된 OCR의 성능을 살펴보고 실험실 테스트를 통해 실제 구현된 OCR의 성능을 검증한다.

  • PDF

A Study on the OCR of Korean Sentence Using DeepLearning (딥러닝을 활용한 한글문장 OCR연구)

  • Park, Sun-Woo
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.470-474
    • /
    • 2019
  • 한글 OCR 성능을 높이기 위해 딥러닝 모델을 활용하여 문자인식 부분을 개선하고자 하였다. 본 논문에서는 폰트와 사전데이터를 사용해 딥러닝 모델 학습을 위한 한글 문장 이미지 데이터를 직접 생성해보고 이를 활용해서 한글 문장의 OCR 성능을 높일 다양한 모델 조합들에 대한 실험을 진행했다. 딥러닝 모델은 STR(Scene Text Recognition) 구조를 사용해 변환, 추출, 시퀀스, 예측 모듈 각 24가지 모델 조합을 구성했다. 딥러닝 모델을 활용한 OCR 실험 결과 한글 문장에 적합한 모델조합은 변환 모듈을 사용하고 시퀀스와 예측 모듈에는 BiLSTM과 어텐션을 사용한 모델조합이 다른 모델 조합에 비해 높은 성능을 보였다. 해당 논문에서는 이전 한글 OCR 연구와 비교해 적용 범위를 글자 단위에서 문장 단위로 확장하였고 실제 문서 이미지에서 자주 발견되는 유형의 데이터를 사용해 애플리케이션 적용 가능성을 높이고자 한 부분에 의의가 있다.

  • PDF

Comparative Analysis of Korean Language Recognition Performance in Open Source-Based OCR (오픈소스 기반 OCR의 한국어 인식성능 비교분석에 관한 연구)

  • Jeong-Seob Kim;Hyun-Jung Kim;Sang-Hyun Yoo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.471-472
    • /
    • 2023
  • 문서 전자화 시스템의 도입에 따라 OCR에 관련된 많은 연구가 진행되고 있으며, 현재 넓은 분야에서 OCR을 활용 중이다. 그러나 OCR 라이브러리들의 한국어 인식성능에 어느 정도 차이가 있는지에 대한 의문이 생기고 있다. 본 논문에서는 현재 사용 중인 OCR 라이브러리의 한국어 인식성능을 비교, 분석하였고 Tesseract OCR이 더 인식성능이 좋다는 결과를 얻었다.

Using Naïve Bayes Classifier and Confusion Matrix Spelling Correction in OCR (나이브 베이즈 분류기와 혼동 행렬을 이용한 OCR에서의 철자 교정)

  • Noh, Kyung-Mok;Kim, Chang-Hyun;Cheon, Min-Ah;Kim, Jae-Hoon
    • 한국어정보학회:학술대회논문집
    • /
    • 2016.10a
    • /
    • pp.310-312
    • /
    • 2016
  • OCR(Optical Character Recognition)의 오류를 줄이기 위해 본 논문에서는 교정 어휘 쌍의 혼동 행렬(confusion matrix)과 나이브 베이즈 분류기($na{\ddot{i}}ve$ Bayes classifier)를 이용한 철자 교정 시스템을 제안한다. 본 시스템에서는 철자 오류 중 한글에 대한 철자 오류만을 교정하였다. 실험에 사용된 말뭉치는 한국어 원시 말뭉치와 OCR 출력 말뭉치, OCR 정답 말뭉치이다. 한국어 원시 말뭉치로부터 자소 단위의 언어모델(language model)과 교정 후보 검색을 위한 접두사 말뭉치를 구축했고, OCR 출력 말뭉치와 OCR 정답 말뭉치로부터 교정 어휘 쌍을 추출하고, 자소 단위로 분해하여 혼동 행렬을 만들고, 이를 이용하여 오류 모델(error model)을 구축했다. 접두사 말뭉치를 이용해서 교정 후보를 찾고 나이브 베이즈 분류기를 통해 확률이 높은 교정 후보 n개를 제시하였다. 후보 n개 내에 정답 어절이 있다면 교정을 성공하였다고 판단했고, 그 결과 약 97.73%의 인식률을 가지는 OCR에서, 3개의 교정 후보를 제시하였을 때, 약 0.28% 향상된 98.01%의 인식률을 보였다. 이는 한글에 대한 오류를 교정했을 때이며, 향후 특수 문자와 숫자 등을 복합적으로 처리하여 교정을 시도한다면 더 나은 결과를 보여줄 것이라 기대한다.

  • PDF

Evaluation of OCR in Fine Grained Soil by Piezocone Tests (피에조콘 관입 시험에 의한 OCR 평가)

  • Lim, Beyong-Seock
    • Proceedings of the Korean Geotechical Society Conference
    • /
    • 2000.11a
    • /
    • pp.561-568
    • /
    • 2000
  • 본 연구의 목적은 Piezocone 관입시험을 이용한 연약지반의 OCR 평가에 있어 기존의 여러 가지 해석방법들과 최근에 새롭게 제안된 방법들을 실내 모형토조에서 실측된 피에조콘 관입 실험치에 적용하여 각 해석방법들의 차이와 장단점들을 비교 분석하는데 있다. 본 연구의 연구실험방법으로는, Piezocone 관입을 위한 연약 모형지반 조성을 위하여 초대형 Slurry Consolidometer에 Free Stress 상태의 Slurry를 45일간 압밀시킨후 Automatic Computer Control Calibration Chamber (LSU/CALCHAS; Louisiana Slate University Calibration Chamber System)에 옮긴후 다시한번 압밀시키는 Two-Stage Consolidation Method를 사용하였다. 모형지반은 여러 가지 Boundary Condition들과 Stress Condition 그리고 Stress History등을 달리하여 총 5개의 지반을 조성하였다. 관입시험은 총 25개의 Piezocone 관입이 수행되어졌고, 그중 4개는 Standard 10 cm2 Piezocone이고, 나머지 21개는 Miniature Piezocone이 사용되었다. Piezocone 실험치들에 대한 여러 가지 OCR 해석방법 적용결과, Schmertmann방법은 5개 모형지반 모두에서 과다한 OCR평가를 보였으며, $B_{q}$ 방법은 일부모형지반에서 음의 OCR값으로 계산되어졌다. 그러나, Critical-Stale Soil Mechanics 와 Cavity Expansion 이론에 근거하여 Mayne(1991), Kurup(1993), Tumay et al (1995) 들이 제안한 OCR 평가방법들은 실험치와 잘맞는 경향을 보여주었다. 이와같은 이론 모델값들의 차이는 응력조건(Stress Condition)과 경계조건(Boundary Condition)들에 대한 각 해석방법들의 고려정도에 따른 결과로 판단된다.

  • PDF

Using Naïve Bayes Classifier and Confusion Matrix Spelling Correction in OCR (나이브 베이즈 분류기와 혼동 행렬을 이용한 OCR에서의 철자 교정)

  • Noh, Kyung-Mok;Kim, Chang-Hyun;Cheon, Min-Ah;Kim, Jae-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2016.10a
    • /
    • pp.310-312
    • /
    • 2016
  • OCR(Optical Character Recognition)의 오류를 줄이기 위해 본 논문에서는 교정 어휘 쌍의 혼동 행렬(confusion matrix)과 나이브 베이즈 분류기($na{\ddot{i}}ve$ Bayes classifier)를 이용한 철자 교정 시스템을 제안한다. 본 시스템에서는 철자 오류 중 한글에 대한 철자 오류만을 교정하였다. 실험에 사용된 말뭉치는 한국어 원시 말뭉치와 OCR 출력 말뭉치, OCR 정답 말뭉치이다. 한국어 원시 말뭉치로부터 자소 단위의 언어 모델(language model)과 교정 후보 검색을 위한 접두사 말뭉치를 구축했고, OCR 출력 말뭉치와 OCR 정답 말뭉치로부터 교정 어휘 쌍을 추출하고, 자소 단위로 분해하여 혼동 행렬을 만들고, 이를 이용하여 오류 모델(error model)을 구축했다. 접두사 말뭉치를 이용해서 교정 후보를 찾고 나이브 베이즈 분류기를 통해 확률이 높은 교정 후보 n개를 제시하였다. 후보 n개 내에 정답 어절이 있다면 교정을 성공하였다고 판단했고, 그 결과 약 97.73%의 인식률을 가지는 OCR에서, 3개의 교정 후보를 제시하였을 때, 약 0.28% 향상된 98.01%의 인식률을 보였다. 이는 한글에 대한 오류를 교정했을 때이며, 향후 특수 문자와 숫자 등을 복합적으로 처리하여 교정을 시도한다면 더 나은 결과를 보여줄 것이라 기대한다.

  • PDF

Consumption management application using OCR technology (OCR 기술을 활용한 소비 관리 어플)

  • Jeong, seo-yea;Kim, Seo-hee;Park, eun-byeol;An, cha-rin;Jeong, cha-rim;Kim, ByungWan;Lee, ByongKwon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2021.07a
    • /
    • pp.203-204
    • /
    • 2021
  • 본 논문에서는 OCR기술을 이용하여 나만의 소비패턴을 분석하는 어플을 제안한다. 현재 카드와 간편결제를 많이 쓰는 시대, 사람들은 소비 패턴을 쉽게 분석하고 알 수 없기 때문에 절약과 저축도 쉽게 못하고 있다. 따라서 OCR을 활용한 영수증 인식으로 소비 패턴을 분석하고 나의 소비 생활을 쉽게 알 수 있는 서비스를 통해 소비 문제가 개선될 것이라고 생각한다. 가계부의 핵심 기능은 수입/지출을 표기하는 것이다. 하지만 현재 상용 중인 소비 앱은 너무 많은 기능을 도입해 오히려 사용성이 떨어진다. 이를 해결하기 위해 복잡한 서비스는 빼고, 핵심 기능과 OCR 기능, 예산 관리, 포인트 제도, 카테고리별 지출 관리를 넣었다. 프로젝트의 대상은 평소 과도한 지출을 하는 사람과 자신의 소비를 기록하고 싶은 사람이며, 본 시스템에서 OCR을 이용해 소비시 발생하는 영수증을 인식하여 더욱 편리하게 입력할 수 있다. 또한, 비 계획적인 소비를 효율적으로 해결할 수 있으며, 포인트 제도를 이용해 사용자의 출석률 문제를 효율적으로 해결할 것으로 기대된다.

  • PDF

Equalization On-Channel Repeater for Single Frequency Network of Terrestrial Digital Multimedia Broadcasting (T-DMB의 SFN을 위한 등화형 동일채널 중계기)

  • Park, Sung-Ik;Park, So-Ra;Eum, Ho-Min;Lee, Yong-Tae;Kim, Heung-Mook
    • Journal of Broadcast Engineering
    • /
    • v.13 no.3
    • /
    • pp.365-379
    • /
    • 2008
  • In this paper we consider technological requirements of the on-channel repeater to broadcast the terrestrial digital multimedia broadcasting (T-DMB) signals using single frequency networks (SFN) and propose the configuration and implementation method of the equalization on-channel repeater (OCR) that meet such requirements. The proposed equalization OCR not only has short time delay, but shows high output power and good quality of output signal by removing a feedback signal due to incomplete antenna isolation and multipath signal existing between the main transmitter and the OCR. In addition, computer simulations and laboratory tests results are provided to figure out performance of the proposed equalization OCR.

Determination of the Overconsolidation Ratio using the Piezocone Penetration Test (피에조콘 관입시험에 의한 과압밀비 산정에 관한 연구)

  • Lee, Ki-Se;Shin, Won-Tae;Goo, Nam-Shil;Kim, Hak-Joon
    • The Journal of Engineering Geology
    • /
    • v.17 no.3
    • /
    • pp.351-358
    • /
    • 2007
  • Using the results of the Piezocone Penetration Test(PCPT) which were executed at the Yangsan-Mulgum site, the applicability of the interpretation methods far estimating the OCR(Overconsolidation Ratio) of soft clay was evaluated. At the same time, the results from the laboratory tests using the total of 172 undisturbed soft clay samples taken from the 44 bore holes of the Yangsan-Mulgum site were used to compare the OCR values obtained from the consolidation test with those from the PCPT. The relationship between the predicted overconsolidation ratio($OCR_p$) using the PCPT and the measured overconsolidation ratio($OCR_c$) from the laboratory consolidation tests are investigated and presented in this study. The $OCR_p$ by using the Powell et al.'s method for non-fissured clay from the results of the PCPT shows the best relationship with the $OCR_c$ obtained from the laboratory consolidation test.

Novel Equalization On-Channel Repeater with Feedback Interference Canceller in Terrestrial Digital Multimedia Broadcasting System

  • Park, Sung-Ik;Eum, Ho-Min;Park, So-Ra;Kim, Geon;Lee, Yong-Tae;Kim, Heung-Mook;Oh, Wang-Rok
    • ETRI Journal
    • /
    • v.31 no.4
    • /
    • pp.357-364
    • /
    • 2009
  • In this paper, we propose a novel equalization on-channel repeater (OCR) with a feedback interference canceller (FIC) to relay terrestrial digital multimedia broadcasting signals in single frequency networks. The proposed OCR not only has high output power by cancelling the feedback signals caused by insufficient antenna isolation through the FIC, but also shows better output signal quality than the conventional OCR by removing multipath signals existing between the main transmitter and the OCR through an equalizer. In addition, computer simulations and laboratory test results demonstrate that the proposed OCR successfully cancels feedback signals and compensates channel distortions and provides a higher quality transmitting signal with higher output power than conventional OCRs.