• Title/Summary/Keyword: Korean OCR

Search Result 298, Processing Time 0.03 seconds

A Study on Improvement of Korean OCR Accuracy Using Deep Learning (딥러닝을 이용한 한글 OCR 정확도 향상에 대한 연구)

  • Kang, Ga-Hyeon;Ko, Ji-Hyun;Kwon, Yong-Jun;Kwon, Na-Young;Koh, Seok-Ju
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2018.05a
    • /
    • pp.693-695
    • /
    • 2018
  • In this paper, we propose the improvement of Hangul OCR accuracy through deep learning. OCR is a program that senses printed and handwritten characters in an optical way and encodes them digitally. In the case of the most commonly used Tesseract OCR, the accuracy of English recognition is high. However, Hangul has lower accuracy because it has less learning data for a complex structure. Therefore, in this study, we propose a method to improve the accuracy of Hangul OCR by extracting the character region from the desired image through image processing and using deep learning using it as learning data. It is expected that OCR, which has been developed only by existing alphanumeric and several languages, can be applied to various languages.

  • PDF

Assessment of Overconsolidation Ratio by Depth of Soft Ground: A Case Study in South Korea (국내 연약지반의 심도별 과압밀비 산정에 관한 사례연구)

  • Lee, Jong-Young;Han, Jung-Geun
    • Journal of the Korean Geosynthetics Society
    • /
    • v.20 no.4
    • /
    • pp.9-18
    • /
    • 2021
  • In this study, the overconsolidation ratio (OCR) of soft clay soil was calculated by conducting an indoor physical experiment and a dynamics test using undisturbed soil samples from a soft clay soil field in South Korea. The OCR by depth was predicted by comparing the experimental results with the existing empirical equations. Methods using the liquidity index and the existing empirical equation by the Naval Facilities Engineering Systems Command (NAVFAC) were examined, and the results were compared with the actual measured values. The method using the liquidity index was found to be suitable for estimating the rough OCR of the ground. However, the effect of drying was not considered for the ground above the groundwater level. Therefore, an equation for the correlation equation between the depth and OCR of each region, including the ground above the groundwater level, was proposed. The proposed equation was applied to the OCR prediction of the adjacent area. The predicted values in the area composed of clay (CL, CH) were found to be in good agreement with the actual values. In the region composed of silt (ML), however, the predicted values were not consistent with the actual values. This suggests that the sedimentation and compositional characteristics, rather than the engineering characteristics of the soil, are important factors that affect the OCR prediction.

Implementation and test results of on-channel repeater for ATSC 3.0 systems

  • Ahn, Sungjun;Kwon, Sunhyoung;Kwon, Hae-Chan;Kim, Youngsu;Lee, Jaekwon;Shin, Yoo-Sang;Park, Sung-Ik
    • ETRI Journal
    • /
    • v.44 no.5
    • /
    • pp.715-732
    • /
    • 2022
  • Despite the successful launch of Advanced Television Systems Committee (ATSC) 3.0 broadcasting worldwide, broadcasters are facing obstacles in constructing void-less large-scale single-frequency networks (SFNs). The bottleneck is the absence of decent on-channel repeater (OCR) solutions necessary for SFNs. In the real world, OCRs suffer from the maleficent feedback interference (FI) problem, which overwhelms the desired input signal. Moreover, the undesired multipaths between studio-linked transmitters and the OCR deteriorate the forward signals' quality as well. These problems crucially restrict the feasibility of conventional OCR systems, arousing the strong need for cost-worthy advanced OCR solutions. This paper presents an ATSC 3.0-specific solution of advanced OCR that solves the FI problem and refines the input signal. To this end, the FI canceler and channel equalizer functionalities are carefully implemented into the OCR system. The presented OCR system is designed to be fully compliant with the ATSC 3.0 specifications and performs a fast and efficient signal processing by exploiting the specific frame structure. The real product of ATSC 3.0 OCR is fabricated as well, and its feasibility is verified via field and laboratory experiments. The implemented solution is installed at a commercial on-air site and shown to provide substantial coverage gain in practice.

Equalization OCR with Feedback Interference Canceller in T-DMB System (T-DMB 시스템에서 궤환간섭 제거기를 가지는 등화형 OCR)

  • Park, Sung-Ik;Eum, Ho-Min;Park, So-Ra;Kim, Geon;Lee, Yong-Tae;Kim, Heung-Mook
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2008.11a
    • /
    • pp.23-26
    • /
    • 2008
  • 본 논문에서는 T-DMB 시스템의 단일 주파수 망 구성을 위해 궤환신호 제거기를 가지는 등화형 OCR (Equalization On-Channel Repeater, E-OCR)을 제안한다. 제안된 OCR은 송/수신 안테나의 충분치 못한 분리도로 인해 야기된 궤환신호를 궤환간섭 제거기를 통해 제거하여 송신출력을 높일 뿐만 아니라, 송신기와 중계기 사이의 다중경로 신호를 등화기를 통해 제거하여 우수한 출력신호 품질을 보장한다. 또한, 본 논문에서는 전산실험을 통해 제안된 OCR의 성능을 살펴보고 실험실 테스트를 통해 실제 구현된 OCR의 성능을 검증한다.

  • PDF

Study on OCR Enhancement of Homomorphic Filtering with Adaptive Gamma Value

  • Heeyeon Jo;Jeongwoo Lee;Hongrae Lee
    • Journal of the Korea Society of Computer and Information
    • /
    • v.29 no.2
    • /
    • pp.101-108
    • /
    • 2024
  • AI-OCR (Artificial Intelligence Optical Character Recognition) combines OCR technology with Artificial Intelligence to overcome limitations that required human intervention. To enhance the performance of AI-OCR, training on diverse data sets is essential. However, the recognition rate declines when image colors have similar brightness levels. To solve this issue, this study employs Homomorphic filtering as a preprocessing step to clearly differentiate color levels, thereby increasing text recognition rates. While Homomorphic filtering is ideal for text extraction because of its ability to adjust the high and low frequency components of an image separately using a gamma value, it has the downside of requiring manual adjustments to the gamma value. This research proposes a range for gamma threshold values based on tests involving image contrast, brightness, and entropy. Experimental results using the proposed range of gamma values in Homomorphic filtering suggest a high likelihood for effective AI-OCR performance.

A Study on the OCR of Korean Sentence Using DeepLearning (딥러닝을 활용한 한글문장 OCR연구)

  • Park, Sun-Woo
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.470-474
    • /
    • 2019
  • 한글 OCR 성능을 높이기 위해 딥러닝 모델을 활용하여 문자인식 부분을 개선하고자 하였다. 본 논문에서는 폰트와 사전데이터를 사용해 딥러닝 모델 학습을 위한 한글 문장 이미지 데이터를 직접 생성해보고 이를 활용해서 한글 문장의 OCR 성능을 높일 다양한 모델 조합들에 대한 실험을 진행했다. 딥러닝 모델은 STR(Scene Text Recognition) 구조를 사용해 변환, 추출, 시퀀스, 예측 모듈 각 24가지 모델 조합을 구성했다. 딥러닝 모델을 활용한 OCR 실험 결과 한글 문장에 적합한 모델조합은 변환 모듈을 사용하고 시퀀스와 예측 모듈에는 BiLSTM과 어텐션을 사용한 모델조합이 다른 모델 조합에 비해 높은 성능을 보였다. 해당 논문에서는 이전 한글 OCR 연구와 비교해 적용 범위를 글자 단위에서 문장 단위로 확장하였고 실제 문서 이미지에서 자주 발견되는 유형의 데이터를 사용해 애플리케이션 적용 가능성을 높이고자 한 부분에 의의가 있다.

  • PDF

Comparative Analysis of Korean Language Recognition Performance in Open Source-Based OCR (오픈소스 기반 OCR의 한국어 인식성능 비교분석에 관한 연구)

  • Jeong-Seob Kim;Hyun-Jung Kim;Sang-Hyun Yoo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.471-472
    • /
    • 2023
  • 문서 전자화 시스템의 도입에 따라 OCR에 관련된 많은 연구가 진행되고 있으며, 현재 넓은 분야에서 OCR을 활용 중이다. 그러나 OCR 라이브러리들의 한국어 인식성능에 어느 정도 차이가 있는지에 대한 의문이 생기고 있다. 본 논문에서는 현재 사용 중인 OCR 라이브러리의 한국어 인식성능을 비교, 분석하였고 Tesseract OCR이 더 인식성능이 좋다는 결과를 얻었다.

Evaluation of OCR in Fine Grained Soil by Piezocone Tests (피에조콘 관입 시험에 의한 OCR 평가)

  • Lim, Beyong-Seock
    • Proceedings of the Korean Geotechical Society Conference
    • /
    • 2000.11a
    • /
    • pp.561-568
    • /
    • 2000
  • 본 연구의 목적은 Piezocone 관입시험을 이용한 연약지반의 OCR 평가에 있어 기존의 여러 가지 해석방법들과 최근에 새롭게 제안된 방법들을 실내 모형토조에서 실측된 피에조콘 관입 실험치에 적용하여 각 해석방법들의 차이와 장단점들을 비교 분석하는데 있다. 본 연구의 연구실험방법으로는, Piezocone 관입을 위한 연약 모형지반 조성을 위하여 초대형 Slurry Consolidometer에 Free Stress 상태의 Slurry를 45일간 압밀시킨후 Automatic Computer Control Calibration Chamber (LSU/CALCHAS; Louisiana Slate University Calibration Chamber System)에 옮긴후 다시한번 압밀시키는 Two-Stage Consolidation Method를 사용하였다. 모형지반은 여러 가지 Boundary Condition들과 Stress Condition 그리고 Stress History등을 달리하여 총 5개의 지반을 조성하였다. 관입시험은 총 25개의 Piezocone 관입이 수행되어졌고, 그중 4개는 Standard 10 cm2 Piezocone이고, 나머지 21개는 Miniature Piezocone이 사용되었다. Piezocone 실험치들에 대한 여러 가지 OCR 해석방법 적용결과, Schmertmann방법은 5개 모형지반 모두에서 과다한 OCR평가를 보였으며, $B_{q}$ 방법은 일부모형지반에서 음의 OCR값으로 계산되어졌다. 그러나, Critical-Stale Soil Mechanics 와 Cavity Expansion 이론에 근거하여 Mayne(1991), Kurup(1993), Tumay et al (1995) 들이 제안한 OCR 평가방법들은 실험치와 잘맞는 경향을 보여주었다. 이와같은 이론 모델값들의 차이는 응력조건(Stress Condition)과 경계조건(Boundary Condition)들에 대한 각 해석방법들의 고려정도에 따른 결과로 판단된다.

  • PDF

Consumption management application using OCR technology (OCR 기술을 활용한 소비 관리 어플)

  • Jeong, seo-yea;Kim, Seo-hee;Park, eun-byeol;An, cha-rin;Jeong, cha-rim;Kim, ByungWan;Lee, ByongKwon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2021.07a
    • /
    • pp.203-204
    • /
    • 2021
  • 본 논문에서는 OCR기술을 이용하여 나만의 소비패턴을 분석하는 어플을 제안한다. 현재 카드와 간편결제를 많이 쓰는 시대, 사람들은 소비 패턴을 쉽게 분석하고 알 수 없기 때문에 절약과 저축도 쉽게 못하고 있다. 따라서 OCR을 활용한 영수증 인식으로 소비 패턴을 분석하고 나의 소비 생활을 쉽게 알 수 있는 서비스를 통해 소비 문제가 개선될 것이라고 생각한다. 가계부의 핵심 기능은 수입/지출을 표기하는 것이다. 하지만 현재 상용 중인 소비 앱은 너무 많은 기능을 도입해 오히려 사용성이 떨어진다. 이를 해결하기 위해 복잡한 서비스는 빼고, 핵심 기능과 OCR 기능, 예산 관리, 포인트 제도, 카테고리별 지출 관리를 넣었다. 프로젝트의 대상은 평소 과도한 지출을 하는 사람과 자신의 소비를 기록하고 싶은 사람이며, 본 시스템에서 OCR을 이용해 소비시 발생하는 영수증을 인식하여 더욱 편리하게 입력할 수 있다. 또한, 비 계획적인 소비를 효율적으로 해결할 수 있으며, 포인트 제도를 이용해 사용자의 출석률 문제를 효율적으로 해결할 것으로 기대된다.

  • PDF

Determination of the Overconsolidation Ratio using the Piezocone Penetration Test (피에조콘 관입시험에 의한 과압밀비 산정에 관한 연구)

  • Lee, Ki-Se;Shin, Won-Tae;Goo, Nam-Shil;Kim, Hak-Joon
    • The Journal of Engineering Geology
    • /
    • v.17 no.3
    • /
    • pp.351-358
    • /
    • 2007
  • Using the results of the Piezocone Penetration Test(PCPT) which were executed at the Yangsan-Mulgum site, the applicability of the interpretation methods far estimating the OCR(Overconsolidation Ratio) of soft clay was evaluated. At the same time, the results from the laboratory tests using the total of 172 undisturbed soft clay samples taken from the 44 bore holes of the Yangsan-Mulgum site were used to compare the OCR values obtained from the consolidation test with those from the PCPT. The relationship between the predicted overconsolidation ratio($OCR_p$) using the PCPT and the measured overconsolidation ratio($OCR_c$) from the laboratory consolidation tests are investigated and presented in this study. The $OCR_p$ by using the Powell et al.'s method for non-fissured clay from the results of the PCPT shows the best relationship with the $OCR_c$ obtained from the laboratory consolidation test.