• 제목/요약/키워드: Online Character Recognition

검색결과 20건 처리시간 0.029초

깊이 영상 기반 적응적 체인 코드를 이용한 한자 학습 시스템 (Depth Image based Chinese Learning Machine System Using Adjusted Chain Code)

  • 김기상;최형일
    • 한국콘텐츠학회논문지
    • /
    • 제14권12호
    • /
    • pp.545-554
    • /
    • 2014
  • 본 논문에서는 깊이 카메라를 이용한 실시간 사용자 한자 학습 시스템을 제안한다. 사용자 학습 방법으로는 사용자가 화면에서 손을 움직여 한자를 입력하고, 입력 제스처와 미리 저장된 템플릿을 매칭하여 사용자가 한자를 올바르게 썼는지 판단한다. 이를 위해 본 논문에서는 손가락 검출 및 검증을 통한 손 영역 검출 및 추적 방법과 스트로크의 연속성을 분석하기 위해 적응적 체인 코드를 제안한다. 손가락 검출로는 깊이 값을 이용하여 손 영역을 검출 후, 손가락의 축을 생성, 손가락의 두께를 이용하여 검증한다. 손 영역 추적으로 생성된 스트로크는 추적된 점들과 순서 그리고 길이 정보가 포함되어 있다. 이들을 이용하여 사용자가 올바른 입력을 했는지 확인하기 위해 적응적 체인 코드 방법을 제안한다. 이 방법은 매칭 속도와 스트로크 안에서 잘못 입력된 부분을 찾는데 매우 효율적이다. 실험 결과에서는 본 논문에서 제안한 시스템이 실시간으로 동작하며 학습 과정과 오류 검출에 매우 효과적임을 보여준다.

비트맵 파라미터를 이용한 온라인 필기체 문자인식 (Online Cursive Handwriting Character Recognition Using a Bitmap Parameter)

  • 석수영;김민정;정호열;정현열
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.421-424
    • /
    • 2001
  • 개별적인 인식기를 하나의 단일 인식 시스템으로 구성하여 음성과 문자를 인식할 수 있는 공용인식시스템의 성능향상을 위해 온라인 필기에서 전역적인 정보를 추출할 수 있는 비트맵 파라미터 추출 방법을 제안하였다. 제안된 방식에서는 고속의 파라미터 추출을 위해 보간법을 이용한 재샘플링 과정 대신에 새로운 시간열을 구성하는 방식을 이용한다. 제안한 비트맵 파라미터를 본 연구실에서 개발한 음성/문자 공용인식 시스템에 적용하기 위하여 67개의 자소를 5상태 10천이 CHMM(Continuous Hidden Markov Model)모델로 구성한 다음 인식알고리즘으로서는 상태단위로 지속 시간 정보를 제어하는 OnePassDP법을 이용하였다. 실험결과, 제안한 방법을 이용한 경우, 자소인식률은 61.3%에서 85.3%로 24%의 인식률 향상을 가져왔으며, 글자인식률은 64.3%에서 82.2%로 17.9%의 인식률 향상을 가져와 제안한 방법의 유효성을 확인할 수 있었다.

  • PDF

Construct OCR on mobile mechanic system for android wireless dynamics and structure stabilization

  • Shih, Bih-Yaw;Chen, Chen-Yuan;Su, Wei-Lun
    • Structural Engineering and Mechanics
    • /
    • 제42권5호
    • /
    • pp.747-760
    • /
    • 2012
  • In today's online social structure, people with electronic devices or network have been closely related to whether any of the activities, work, school, etc., is related to electronic devices, intelligent robot, and network control. The best mobility and the first rich media of these products as smart phones, smart phones rise rapidly in recent years, high speed processing performance and high free way to install software, deeply loved by many business people. However, not only for smart phone business aspects of the use, but also can engage in education of the teachers or the students are learning a great help. This study construct OCR-assisted learning software written by the JAVA made, and the installation is provided by the Android mobile phone users.

인텔리젼트 멀티미디어 단말기를 위한 온라인 한글 인식 (Online Korean Character Recognition for Intelligent Multimedia Terminal)

  • 오준택;이우범;김욱현
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2000년도 하계종합학술대회논문집
    • /
    • pp.229-232
    • /
    • 2000
  • 문자인식은 멀티 모달 인터페이스의 핵심요소로서 이동 환경에서 사용자의 다양한 요구사항을 처리하는 지능형 단말기의 구현을 위해 필수적으로 개발되어야 할 과제이다. 그러나 대부분의 기존 연구는 인식률의 향상만을 위해서 복잡한 획 해석과 백트래킹을 사용하기 때문에 멀티미디어 단말기에 적합하지 못하다. 따라서 본 논문은 멀티미디어 단말기로의 적용을 목적으로 한 새로운 온라인 한글 문자 인식 방법을 제안한다. 제안된 방법은 한글 문자의 특성정보와 획 정보를 기반으로 구축된 한글 데이터 베이스를 사용한다. 또한 획간의 위치관계를 이용한 순차적 자소 분리와 향상된 백트래킹 기법에 의해서 보다 빠른 처리 시간을 보장한다. 제안된 시스템의 성능 평가는 상용 1,200 단어를 이용하여 다수의 필기자가 필기한 한글 600문자를 대상으로 실험한 결과 95% 이상의 인식률을 얻었다.

  • PDF

Smith-Waterman 정렬 알고리즘을 이용한 온라인 필기체 숫자인식 (Online Handwritten Digit Recognition by Smith-Waterman Alignment)

  • 문원호;최연석;이상걸;차의영
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권9호
    • /
    • pp.27-33
    • /
    • 2011
  • 본 논문에서는 필기체 문자의 Convex-Concave한 곡선 특징을 문자로 변환하고 추출된 문자를 Smith-Waterman 정렬 알고리즘을 이용하여 온라인 필기체 숫자 인식 방법을 제안한다. 필기체 숫자 인식을 위한 입력 데이터는 시간에 순서적인 좌표로 순서화하고 전처리의 입력데이터로 적용된다. 필기자의 개성이 표현된 필기체 문자는 크기, 회전, 곡선 비율이 다양한 형태로 나타난다. 따라서 본 논문에서는 곡선의 Convex-Concave 특징을 이용하여 크기, 회전에 강인한 특징을 추출한다. 추출된 특징은 문자로 변환하고 Smith-Waterman 정렬 알고리즘의 입력데이터로 적용한다. 본 논문에서는 실시간 필기체 숫자를 대상으로 실험한 결과, 오류역전파 신경 회로망을 적용한 것과 비교하여 제안된 방법이 좋은 성능을 보였다.

유비쿼터스 환경에 대한 언론보도와 수용자의 인식유형에 관한 연구 (A Study on Media Coverage and Recognition Type of Users about Ubiquitous Environment)

  • 유승관;이제영
    • 한국언론정보학보
    • /
    • 제32권
    • /
    • pp.169-207
    • /
    • 2006
  • 본 논문에서는 디지털 온라인시대의 유비쿼터스 환경에 대해서 언론의 보도 내용 및 태도와 함께 일반대중들이 지니고 있는 다양한 관심이나 주관적인 성향(느낌, 견해)들에 대한 유형을 살펴봄으로써, 유비쿼터스 환경이 어떠한 특성과 의미를 보여주고 있는지를 알아보았다. 이를 위해 유비쿼터스 환경을 미디어가 어떻게 프레이밍 하였는가를 먼저 프레이밍 이론의 시각에서 살펴보고, 이러한 프레이밍이 수용자의 개인적 수준에서의 해석적 프레임으로 볼 수 있는 주관적 인식과 어떤 유사성이나 차이가 존재하는지 그 연결점을 알아보기 위해서 주관성연구를 실시하였다. 유비쿼터스 환경에 대한 일반대중들의 수용형태를 살펴본 결과, 4가지의 유형으로 분류되었는데, 제 1유형(N=11)은 긍정적 보편 주도형(Positive Universality Leading Type), 제 2유형(N=4)은 회의적 신중 선호형(Uncertain Prudence Preference Type), 제 3유형(N=3)은 미래 문화적 향유형(Future Cultural Enjoyment Type), 제 4유형(N=2)은 부정적 효과 전망형(Negative Effect View Type)으로서, 각 유형마다 독특한 특징이 있는 것으로 확인되었다. 결론적으로 수용자들은 대체로 미디어가 제시한 프레임에 의해 유비쿼터스 환경을 인식하고 있었으나, 다른 한편 확고한 주관과 정체성에 기초하여 유비쿼터스 환경을 인식하고 있어 미디어 프레임과 수용자 인식 사이의 관련성이 존재하지만 이외의 중재변인이 또한 존재하여 향후 이에 대한 탐색의 필요성이 있음을 확인할 수 있었다.

  • PDF

웹코믹스의 메타표현에 관한 연구 (Studies of Meta-Expressions in Webcomics)

  • 권경민
    • 만화애니메이션 연구
    • /
    • 통권16호
    • /
    • pp.211-221
    • /
    • 2009
  • <만화의 메타표현>이란, 만화 그 자체로 언급되는 만화 표현으로 만화라는 표상체계의 특질과 한계를 가장 본질적으로 보여주는 표현이라고 말할 수 있다. 예를 들면, 작가로 생각되는 인물이 만화 속에 등장하여 독자에게 직접적으로 만화임을 인식시키는 경우와 컷과 컷을 나누고 있던 궤선이 변형 또는 파괴되거나 다른 것으로 비유됨으로써 만화를 구성하는 컷이 물질적인 존재라는 사실을 독자에게 알려주는 경우가 대표적이다. 지금까지의 만화비평 연구의 어프로치들은 대부분 컷과 말풍선의 사용법, 글과 그림의 관계라는 2차원적인 만화표현방식에 착목하여 만화에 대한 외형적 분석이 이루어졌다. 본 연구에서는 이러한 외형적 성과를 바탕으로 온 오프라인 만화에 표현된 메타표현에 대해 알아보고자 한다. 만화의 메타표현에 대한 연구는 만화라는 장르의 표현형식을 검토하는 매우 흥미로운 주제로 인터넷에서 보이는 웹코믹스의 구조에 대한 보다 본질적인 이해를 도모할 수 있으며 매체상의 표현영역 확장에도 그 근거를 제시할 수 있다고 사료된다.

  • PDF

기계학습 알고리즘 기반 하자 정보 관리 시스템 개발 - 공동주택 전용부분을 중심으로 - (A Developing a Machine Leaning-Based Defect Data Management System For Multi-Family Housing Unit)

  • 박다슬;차희성
    • 한국건설관리학회논문집
    • /
    • 제24권5호
    • /
    • pp.35-43
    • /
    • 2023
  • 공동주택 하자 분쟁의 증가와 함께, 하자관리의 중요성 또한 커지고 있다. 그러나 기존의 연구는 '공용 부분'에 초점을 맞추어 진행되었다. 또한 하자관리의 주체인 '관리사무소'를 위한 시스템 연구도 부족한 실정이다. 이는 관리사무소의 하자관리 능력의 부족과 관리 품질의 저하를 초래한다. 따라서, 본 논문에서는 관리사무소를 위한 기계학습 기반의 하자 정보 관리 시스템을 제안한다. OCR과 NLP 모듈을 사용하여 관리상의 불편한 점을 해소하는 것을 목표로 한다. OCR을 통해 수기로 작성된 하자 정보를 디지털 문서로 변환한다. 이후 언어모델을 이용하여 사용자가 지정한 양식과 함께 하자 정보를 재생성한다. 최종적으로 생성된 텍스트를 데이터베이스에 저장하고 이를 기반으로 통계적 분석을 실행한다. 이러한 일련의 과정을 통해, 관리사무소의 하자관리 역량을 향상할 수 있도록 돕고, 의사결정을 지원할 수 있을 것으로 기대한다.

온라인 쇼핑몰에서 상품 설명 이미지 내의 키워드 인식을 위한 딥러닝 훈련 데이터 자동 생성 방안 (The way to make training data for deep learning model to recognize keywords in product catalog image at E-commerce)

  • 김기태;오원석;임근원;차은우;신민영;김종우
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.1-23
    • /
    • 2018
  • E-commerce 환경의 발전으로 소비자들은 다양한 상품들을 한 자리에서 폭 넓게 비교할 수 있게 되었다. 하지만 온라인 쇼핑몰에 올라와있는 상당량의 주요 상품 정보들이 이미지 형태이기 때문에 컴퓨터가 인지할 수 있는 텍스트 기반 검색 시스템에 반영될 수 없다는 한계가 존재한다. 이러한 한계점은 일반적으로 기존 기계학습 기술 및 OCR(Optical Character Recognition) 기술을 활용해, 이미지 형태로 된 키워드를 인식함으로써 개선할 수 있다. 그러나 기존 OCR 기술은 이미지 안에 글자가 아닌 그림이 많고 글자 크기가 작으면 낮은 인식률을 보인다는 문제가 있다. 이에 본 연구에서는 기존 기술들의 한계점을 해결하기 위하여, 딥러닝 기반 사물인식 모형 중 하나인 SSD(Single Shot MultiBox Detector)를 개조하여 이미지 형태의 상품 카탈로그 내의 텍스트 인식모형을 설계하였다. 하지만 이를 학습시키기 위한 데이터를 구축하는 데 상당한 시간과 비용이 필요했는데, 이는 지도학습의 방법론을 따르는 SSD 모형은 훈련 데이터마다 직접 정답 라벨링을 해줘야 하기 때문이다. 본 연구는 이러한 문제점을 해결하기 위해 '훈련 데이터 자동 생성 프로그램'을 함께 개발하였다. 훈련 데이터 자동 생성 프로그램을 통해 수작업으로 데이터를 만드는 것에 비하여 시간과 비용을 대폭 절감할 수 있었으며, 생성된 훈련용 데이터를 통해 모형의 인식 성능을 높일 수 있었다. 더 나아가 실험연구를 통해 자동으로 생성된 훈련 데이터의 특징별로 인식기 모형의 성능에 얼마나 큰 영향을 끼치는지 알아보고, 성능 향상에 효과적인 데이터의 특징을 분석하였다. 본 연구를 통해서 개발된 상품 카탈로그 내 텍스트 인식모형과 훈련 데이터 자동 생성 프로그램은 온라인 쇼핑몰 판매자들의 상품 정보 등록 수고를 줄여줄 수 있으며, 구매자들의 상품 검색 시 결과의 정확성을 향상시키는 데 기여할 수 있을 것으로 기대한다.

사용자 편의성과 효율성을 증진하기 위한 신뢰도 높은 이미지-텍스트 융합 CAPTCHA (Reliable Image-Text Fusion CAPTCHA to Improve User-Friendliness and Efficiency)

  • 문광호;김유성
    • 정보처리학회논문지C
    • /
    • 제17C권1호
    • /
    • pp.27-36
    • /
    • 2010
  • 웹 서비스 신청 단계에서 신청자가 실제 인간 사용자임을 확인하기 위해 사용되는 텍스트 기반 캡차(text-based CAPTCHA)의 변형된 문자를 광학문자인식 기술로 파악하는 것이 가능하기에 캡차의 신뢰성이 떨어지는 문제가 발생하고 있다. 이 문제를 해결하기 위해 제안되었던 기존의 이미지 기반 캡차(image-based CAPTCHA)에서도 여러 문제점이 존재한다. 인공지능 프로그램을 사용하여 시스템이 보유하고 있는 제한된 수의 이미지 내용을 파악함으로써 신뢰도가 떨어지는 문제가 발생할 수 있으며, 제공된 이미지에 대해 사용자가 다른 유사한 단어를 입력하는 경우에는 오답으로 판정되어 반복적으로 캡차를 시도해야 하는 불편함이 발생 할 수 있으며 또한, 사용자에게 캡차 문제를 제공하기 위해 여러 이미지 파일을 전송해야 하기에 전송 비용의 비효율성 문제가 존재한다. 이러한 기존 이미지 기반 캡차의 문제점들을 해결하기 위해 본 논문에서는 이미지와 관련 키워드 일부를 융합하여 제공하는 이미지-텍스트 융합 캡차를 제안하였다. 본 논문에서 제안한 이미지-텍스트 융합 캡차에서는 이미지와 관련된 단어의 일부분을 힌트로 활용하여 쉽게 정답을 입력할 수 있도록 사용자 편리성을 제공하며 이미지와 텍스트를 한 이미지 파일 내에 융합시켰기 때문에 전송 비용을 절약하여 효율성을 증진할 수 있다. 또한, 캡차 시스템의 신뢰성 증진을 위해 인터넷 검색으로 캡차용 이미지를 대량으로 수집하도록 하였으며 수집되는 캡차 이미지의 정확성을 유지하기 위해 필터링 과정을 거치도록 하였다. 또한, 본 논문에서는 실제 실험을 통해 제안된 이미지-텍스트 융합 캡차가 기존 이미지 기반 캡차보다 사용자에게 편리하고 신뢰성이 증진될 수 있음을 입증하였다.