• 제목/요약/키워드: Character Input Method

검색결과 182건 처리시간 0.03초

이미지 내의 텍스트 데이터 인식 정확도 향상을 위한 멀티 모달 이미지 처리 프로세스 (Multi-modal Image Processing for Improving Recognition Accuracy of Text Data in Images)

  • 박정은;주경돈;김철연
    • 데이타베이스연구회지:데이타베이스연구
    • /
    • 제34권3호
    • /
    • pp.148-158
    • /
    • 2018
  • 광학 문자 인식(OCR)은 텍스트를 포함한 이미지에서 텍스트 영역을 인식하고 이로부터 텍스트를 추출하는 기술이다. 전체 텍스트 데이터 중 상당히 많은 텍스트 정보가 이미지에 포함되어 있기 때문에 OCR은 데이터 분석 분야에 있어 중요한 전처리 단계를 담당한다. 대부분의 OCR 엔진이, 흰 바탕의 검정 글씨의 단순한 형태를 가진 이미지와 같은, 텍스트와 배경의 구분이 뚜렷한 저 복잡도 이미지에 대해서는 높은 인식률을 보이는 반면, 텍스트와 배경의 구분이 뚜렷하지 않은 고 복잡도 이미지에 대해서는 저조한 인식률을 보이기 때문에, 인식률 개선을 위해 입력 이미지를 OCR 엔진이 처리하기 용이한 이미지로 변형하는 전처리 작업이 필요하게 된다. 따라서 본 논문에서는 OCR 엔진의 정확성 증대를 위해 텍스트 라인별로 이미지를 분리하고, 영상처리 기법 기반의 CLAHE 모듈과 Two-step 모듈을 병렬적으로 수행하여 텍스트와 배경 영역을 효율적으로 분리한 후 텍스트를 인식한다. 이어서 두 모듈의 결과 텍스트에 대하여 N-gram방법과 Hunspell 사전을 결합한 알고리즘으로 인식률을 비교하여 가장 높은 인식률의 결과 텍스트를 최종 결과물로 선정하는 방법론을 제안한다. 대표적인 OCR 엔진인 Tesseract와 Abbyy와의 다양한 비교 실험을 통해 본 연구에서 제안하는 모듈이 복잡한 배경을 가진 이미지에서 가장 정확한 텍스트 인식률을 보임을 보였다.

관성항법장치 초기정렬시간 단축을 위한 링레이저 자이로 lock-in오차 보상방법의 수치해석적인 분석 (Numerical Research on the Lock-in Compensation Method of a Ring Laser Gyroscope for Reducing INS Alignment Time)

  • 심규민;장석원;백복수;정태호;문홍기
    • 한국항공우주학회지
    • /
    • 제37권3호
    • /
    • pp.275-282
    • /
    • 2009
  • 링레이저 자이로에는 입력각속도가 작은 영역에서 비선형적인 출력현상인 lock-in이 발생하는데 이를 제거하기 위하여 레이저 공진기에 정현파 각진동을 인가하는 방법이 주로 적용된다. 그러나, 그 방법을 적용하는 경우에도 각진동 회귀점에서 lock-in에 의한 오차가 남아있게 되는데, 이들 오차에 의하여 링레이저 자이로의 일반적인 오차특성인 랜덤웍이 발생된다. 이 lock-in에 의한 오차를 제거하기 위한 많은 연구결과 중의 한 방법으로써 lock-in오차 보상방법은 공진기 각진동 회귀점을 통과하기 전과 후의 맥놀이신호 주기를 비교하여 오차를 추정하고 보상하는 방법이다. 본 연구에서는 자이로 모델링 및 수치해석적인 방법으로, 이 lock-in오차 보상방법의 이론적인 적용 가능성을 분석하고, 현재 가능 할 것으로 판단되는 맥놀이 신호주기 측정 분해능을 감안하여 이 방법의 적용 효과를 분석하였다. 그 결과 lock-in오차 보상방법에 의하여 랜덤웍이 약 1/2~1/3로 감소될 수 있음을 알 수 있었다. 그러므로 이 방법은 항법장치의 정렬시간을 획기적으로 단축시킬 수 있는 방법이 될 것으로 기대된다.

농업용 폐비닐을 이용한 이동식 시멘트 연료 제조 장치 및 이를 이용한 시멘트 제조 청정 공정 개발 (Development of moveable instrument for fuel of cement production and of clean process for cement production using waste plastics from agriculture)

  • 서형남;구상서;최영기;민경소;강성구;오희갑
    • 한국자원리싸이클링학회:학술대회논문집
    • /
    • 한국자원리싸이클링학회 2004년도 춘계임시총회 및 제23회 학술대회
    • /
    • pp.109-113
    • /
    • 2004
  • 본 연구에서는 현재 농촌 지역에서 광범위하게 사용되고 있으나 거의 재활용이 안 되어 방치상태에 있는 농업용 폐비닐을 이용하여 시멘트 제조를 위한 고형 연료를 제작할 수 있는 이동식 장치를 개발하려 하였다. 이를 위해 재생연료의 연소 특성 및 2차 오염 발생여부에 대해 조사했으며, 1cm 이하 알갱이 형태의 고형 연료를 제조 가능한 이동식 장치를 개발하였다. 또한 기존의 시멘트 예열탑에서의 투입 방식에서 벗어나, main burner에 적용기술 개발을 통해, NOx 및 O2 발생량의 감소가 나타났고, 0.5ton/hour 투입 시, 0.2-0.3ton/hour 정도 Coal량이 감소하는 연료 단가 절감 효과를 얻을 수 있었다.

  • PDF

Hough Transform과 부분 그래프 패턴을 이용한 한글 인식에 관한 연구 (A Study on the Hangul Recognition Using Hough Transform and Subgraph Pattern)

  • 구하성;박길철
    • 한국정보통신학회논문지
    • /
    • 제3권1호
    • /
    • pp.185-196
    • /
    • 1999
  • 본 논문에서는 부분 그래프 패턴과 신경망을 이용한 새로운 한글 오프라인 인식 시스템을 제안하였다. 문자를 입력으로 받아 세선화를 행한 후 위치에 관한 잡음 제거 기능을 갖는 균형화를 수행하고 인식단의 첫번째 단계에서 순환 성분을 추출하고 인식한다. 부블럭 HT 공간에서 끝점, 굴곡점, 분기점의 특징점을 추출하고 추출된 특징점 사이의 관계를 조사하여 부분 그래프 패턴을 구성한다. 종모음이 올 수 있는 구역을 할당하고 종모음 후보점을 추출하여 미리 조사된 부분 그래프 패턴 사전과 비교하여 종모음을 추출한다. 같은 방법으로 횡모음을 추출한 후 간단한 구조 해석적 방법으로 모음을 인식한다. 본 논문의 성능비교를 위하여 실험은 활자체의 경우 가장 많이 쓰이는 명조체와 고딕체 그리고 필기체를 대상으로 한다. 고딕체의 경우 인식율 98.9%, 명조체의 경우 인식율 98.2%, 필기체의 경우 92.5% 이었다. 다중 자형 인식을 위하여 필기체와 활자체의 구분 없이 구한 전체 시스템의 인식율은 94.8% 이었다.

  • PDF

한국 전통문화 말뭉치구축 및 Bi-LSTM-CNN-CRF를 활용한 전통문화 개체명 인식 모델 개발 (Constructing for Korean Traditional culture Corpus and Development of Named Entity Recognition Model using Bi-LSTM-CNN-CRFs)

  • 김경민;김규경;조재춘;임희석
    • 한국융합학회논문지
    • /
    • 제9권12호
    • /
    • pp.47-52
    • /
    • 2018
  • 개체명 인식(Named Entity Recognition)시스템은 문서로부터 고유한 의미를 가질 수 있는 인명(PS), 지명(LC), 기관명(OG) 등의 개체명을 추출하고 추출된 개체명의 범주를 결정하는 시스템이다. 최근 딥러닝 방식을 이용한 개체명 인식 연구에서 입력 데이터의 앞, 뒤 방향을 고려한 LSTM 기반의 Bi-LSTM 모델로부터 출력 데이터 간의 전이 확률을 이용한 CRF를 결합한 방식의 Bi-LSTM-CRF가 우수한 성능을 보이고, 문자 및 단어 단위의 효율적인 임베딩 벡터생성에 관한 연구와 CNN, LSTM을 활용한 모델에서도 좋은 성능을 보여주고 있다. 본 연구에서는 한국어 개체명 인식시스템 성능 향상을 위해 자질을 보강한 Bi-LSTM-CNN-CRF 모델에 관해 기술하고 전통문화 말뭉치구축 방식에 대해 제안한다. 그리고 구축한 말뭉치를 한국어 개체명 인식 성능 향상을 위한 자질 보강 모델 Bi-LSTM-CNN-CRF로 학습한 결과에 대해 제안한다.

사용자 편의성과 효율성을 증진하기 위한 신뢰도 높은 이미지-텍스트 융합 CAPTCHA (Reliable Image-Text Fusion CAPTCHA to Improve User-Friendliness and Efficiency)

  • 문광호;김유성
    • 정보처리학회논문지C
    • /
    • 제17C권1호
    • /
    • pp.27-36
    • /
    • 2010
  • 웹 서비스 신청 단계에서 신청자가 실제 인간 사용자임을 확인하기 위해 사용되는 텍스트 기반 캡차(text-based CAPTCHA)의 변형된 문자를 광학문자인식 기술로 파악하는 것이 가능하기에 캡차의 신뢰성이 떨어지는 문제가 발생하고 있다. 이 문제를 해결하기 위해 제안되었던 기존의 이미지 기반 캡차(image-based CAPTCHA)에서도 여러 문제점이 존재한다. 인공지능 프로그램을 사용하여 시스템이 보유하고 있는 제한된 수의 이미지 내용을 파악함으로써 신뢰도가 떨어지는 문제가 발생할 수 있으며, 제공된 이미지에 대해 사용자가 다른 유사한 단어를 입력하는 경우에는 오답으로 판정되어 반복적으로 캡차를 시도해야 하는 불편함이 발생 할 수 있으며 또한, 사용자에게 캡차 문제를 제공하기 위해 여러 이미지 파일을 전송해야 하기에 전송 비용의 비효율성 문제가 존재한다. 이러한 기존 이미지 기반 캡차의 문제점들을 해결하기 위해 본 논문에서는 이미지와 관련 키워드 일부를 융합하여 제공하는 이미지-텍스트 융합 캡차를 제안하였다. 본 논문에서 제안한 이미지-텍스트 융합 캡차에서는 이미지와 관련된 단어의 일부분을 힌트로 활용하여 쉽게 정답을 입력할 수 있도록 사용자 편리성을 제공하며 이미지와 텍스트를 한 이미지 파일 내에 융합시켰기 때문에 전송 비용을 절약하여 효율성을 증진할 수 있다. 또한, 캡차 시스템의 신뢰성 증진을 위해 인터넷 검색으로 캡차용 이미지를 대량으로 수집하도록 하였으며 수집되는 캡차 이미지의 정확성을 유지하기 위해 필터링 과정을 거치도록 하였다. 또한, 본 논문에서는 실제 실험을 통해 제안된 이미지-텍스트 융합 캡차가 기존 이미지 기반 캡차보다 사용자에게 편리하고 신뢰성이 증진될 수 있음을 입증하였다.

인조 번호판을 이용한 자동차 번호인식 성능 향상 기법 (Improved Method of License Plate Detection and Recognition using Synthetic Number Plate)

  • 장일식;박구만
    • 방송공학회논문지
    • /
    • 제26권4호
    • /
    • pp.453-462
    • /
    • 2021
  • 자동차 번호인식을 위해선 수많은 번호판 데이터가 필요하다. 번호판 데이터는 과거의 번호판부터 최신의 번호판까지 균형 있는 데이터의 확보가 필요하다. 하지만 실제 과거의 번호판부터 최신의 번호판의 데이터를 획득하는데 어려움이 있다. 이러한 문제를 해결하기 위해 인조 번호판을 이용하여 자동차 번호판을 생성하여 딥러닝을 통한 번호판 인식 연구가 진행되고 있다. 하지만 인조 데이터는 실제 데이터와 차이가 존재하며, 이러한 문제를 해결하기 위해 다양한 데이터 증강 기법을 사용한다. 기존 데이터 증강 방식은 단순히 밝기, 회전, 어파인 변환, 블러, 노이즈등의 방법을 사용하였다. 본 논문에서는 데이터 증강 방법으로 인조데이터를 실제 데이터 스타일로 변환하는 스타일 변환 방법을 적용한다. 또한 실제 번호판 데이터는 원거리가 많고 어두운 경우 잡음이 많이 존재한다. 단순히 입력데이터를 가지고 문자를 인식할 경우 오인식의 가능성이 높다. 이러한 경우 문자인식 향상을 위해 본 논문에서는 문자인식을 위하여 화질개선 방법으로 DeblurGANv2 방법을 적용하여 번호판 인식 정확도를 높였다. 번호판 검출 및 번호판 번호인식을 위한 딥러닝의 방식은 YOLO-V5를 사용하였다. 인조 번호판 데이터 성능을 판단하기 위해 자체적으로 확보한 자동차 번호판을 수집하여 테스트 셋을 구성하였다. 스타일 변환을 적용하지 않은 번호판 검출이 0.614mAP를 기록하였다. 스타일 변환을 적용한 결과 번호판 검출 성능이 0.679mAP 기록하여 성능이 향상되었음을 확인하였다. 또한 번호판 문자인식에는 화질 개선을 하지 않은 검출 성공률은 0.872를 기록하였으며, 화질 개선 후 검출 성능이 0.915를 기록하여 성능 향상이 되었음을 확인 하였다.

The Improvement of Convergence Characteristic using the New RLS Algorithm in Recycling Buffer Structures

  • Kim, Gwang-Jun;Kim, Chun-Suck
    • 한국정보통신학회논문지
    • /
    • 제7권4호
    • /
    • pp.691-698
    • /
    • 2003
  • 적응 횡단선 필터에서 수렴 속도의 개선을 위해 기존의 최소 평균 자승 알고리즘을 확장한 반복적 최소 자승 알고리즘의 탭 가중치 갱신 메커니즘에 재순환 데이터 버퍼를 이용함으로서 수렴특성을 개선시키는 효율적인 기법을 제시하였다. 본 논문은 기존의 적응 횡단선 필터에 데이터 재순환 버퍼 구조를 제안하여 새로운 RLS 탭 가중치 갱신 알고리즘을 유도하여 조화 평균 학습 곡선의 평균 자승 에러 값에 대한 반복수에 대해서 데이터 재순환 버퍼를 사용한 학습 곡선의 수렴 속도가 버퍼가 없는 경우의 재순환 버퍼 RLS 알고리즘의 수렴 속도보다 비례하여 빠르게 수렴한다는 것을 수학적인 연산을 통해 증명하였다. 채널 진폭의 왜곡의 정도와 재순환 데이터 버퍼 수에 따른 평균 자승 에러에 대한 삼차원 시뮬레이션 결과로부터 고유치 확산이 증가함에 따라 특정 값에 수렴하기 위한 요구된 샘플의 반복수가 비례하여 증가하였으며, 재순환 데이터 버퍼 수 B가 증가함에 따라 요구된 샘플의 반복수가 B배만큼 감소함으로서 제안된 구조에서 RLS 가중치 갱신 알고리즘의 수렴특성이 개선됨을 입증하였다.

사례기반 추론을 이용한 실시간 전술 생성 시스템 설계 (Realtime Strategy Generation System using Case-based Reasoning)

  • 박종안;홍철의;김원일
    • 전자공학회논문지CI
    • /
    • 제48권5호
    • /
    • pp.49-54
    • /
    • 2011
  • 사례기반 추론(Case-Based Reasoning, CBR)은 새로운 문제가 주어질 때 과거의 유사한 문제해결 사례를 기반으로 그 해법을 적절히 변용함으로써 새로운 문제에 적합한 해결책을 효율적으로 도출하고자 하는 문제해결 방법으로 인간이 문제를 해결해 나가는 절차와 매우 유사하여 일상생활 속에 널리 사용되고 있다. 본 연구에서는 이러한 사례기반 추론을 국방 전술 시스템에 적용하여, 전투행위 시 과거의 유사한 사례를 기반으로 현재의 상황에 가장 적절한 전술을 사용할 수 있도록 하는 시스템을 설계하고자 한다. 국방 전술 시스템의 경우, 분대원(Non-Player Character, NPC)들이 모여 분대 규모의 작전을 수행할때, 분대는 최종 목표에 도달하기 위해 정해진 작전에 따라서 행동하게 된다. 이 과정에서 공격, 매복, 전술적 이동 등의 행위를 위한 전술이 구성되어야 한다. 다시 말해 주변 환경, 엄폐물의 위치, 적의 위치에 따라 상황에 맞는 새로운 전술이 필요하며 이러한 전술은 분대장 혹은 소대장 등이 교범에서 배운 과정과 경험에서 축적된 지식을 토대로 생성된다. 본 연구는 사례기반 추론을 사용하여 각 지휘통제 에이전트를 통해 정보가 전달되면 사례기반 데이터베이스에 저장되어 있는 사례와 유사도를 측정하고 가장 적절한 사례를 선택하여 사용하며 새로운 사례는 사례 데이터베이스에 저장하여 다음 번 사례검색 시 사용될 수 있도록 시스템을 설계한다.

R&D 및 불완전경쟁과 경제성장 (R&D Activities, Imperfect Competition and Economic Growth)

  • 김병우
    • 기술혁신학회지
    • /
    • 제10권1호
    • /
    • pp.47-72
    • /
    • 2007
  • 아이디어는 소멸하지 않으며 지식생산과정에 수확체감의 법칙이 작용하지도 않는다. 그럼에도 불구하고, 사적측면만을 고려하는 단순한 내생적 성장모형에서는 지속적 경제성장이 달성되지 않게 된다. 그러나, 지식자본의 비전유성을 고려하여 이를 공적자본으로 간주하게 되면 지속적 경제성장은 달성될 수 있게 된다. 우리 경제에 대한 실증분석 결과가 지식의 공적자본으로서의 성격을 강하게 뒷받침함을 확인할 수 있다. 즉, 제품혁신 생산함수에 대한 모든 함수형태에서 지식자본이 사적재화라는 귀무가설을 모두 기각할 수 있다. 이상의 결과로부터 우리 경제는 제품혁신을 통해 지속적 경제성장을 달성할 수 있다는 시사점을 얻을 수 있다.

  • PDF