• 제목/요약/키워드: Character Feature Extraction

검색결과 119건 처리시간 0.022초

몽타주 기법과 음영합성 기법을 이용한 벡터기반 얼굴 생성 (Vector-based Face Generation using Montage and Shading Method)

  • 박연출;오해석
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권6호
    • /
    • pp.817-828
    • /
    • 2004
  • 본 논문에서는 몽타주 기법과 음영합성 기법을 이용한, 디자이너(예술가)의 감각을 살린 벡터 기반의 얼굴 생성 시스템을 제안한다. 제안하는 시스템은 사진으로부터 얼굴의 특징정보를 추출하여 사람의 얼굴과 유사한 얼굴을 자동으로 생성해 주는 시스템이며, 윤곽선만을 사용하던 기존의 얼굴 생성 시스템과 달리 컬러 기반이며, 음영을 사진으로부터 추출하여 이를 이목구비 이미지와 합성하여 생성하는 방식이다. 따라서 실사형에 좀 더 근접한 얼굴을 생성할 수 있다는 장점을 갖는다. 또, 벡터를 기반으로 하기 때문에 사이즈에 제한 얼이 자유로운 변형이 가능할 뿐만 아니라 디자이너 또는 그림 작가의 느낌을 결과물에 그대로 유지할 수 있도록 한다는 점에서 타 접근방식과의 차별성을 갖는다. 또, 2D 아바타에 자유로운 표정을 적용하는 데에도 쉽게 적용이 가능하다.

안면근 신호를 이용한 최소 자판 문자 입력 시스템의 개발 (Development of Character Input System using Facial Muscle Signal and Minimum List Keyboard)

  • 김홍현;김응수
    • 한국정보통신학회논문지
    • /
    • 제14권6호
    • /
    • pp.1338-1344
    • /
    • 2010
  • 사람은 주로 언어를 통해 서로간의 의사를 표현한다. 하지만, 말을 할 수 없는 중증 장애인, 특히 전신마비 증세가 있는 중증 장애인의 경우에는 글을 쓰거나 몸짓을 통한 방법으로도 자신의 의사를 효과적으로 전달하지 못한다는 문제점이 있다. 따라서 본 논문에서는 이러한 중증 장애인이 의사소통을 할 수 있도록 안면근 신호를 이용한 의사 전달기를 구현하였다. 특히, 안면근 신호가 포함된 뇌파의 특징을 추출하여 이를 일반적인 제어 신호로써 변환한 다음, 이 제어 신호와 최소한의 자판을 연동시켜 문자를 선택하도록 함으로써, 중증 장애인이 효과적으로 의사를 전달할 수 있도록 하였다.

Multi-National Integrated Car-License Plate Recognition System Using Geometrical Feature and Hybrid Pattern Vector

  • Lee, Su-Hyun;Seok, Young-Soo;Lee, Eung-Joo
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 ITC-CSCC -2
    • /
    • pp.1256-1259
    • /
    • 2002
  • In this paper, we have proposed license plate recognition system for multi-national vehicle license plate using geometric features along with hybrid and seven segment pattern vectors. In the proposed system, we suggested to find horizontal and vertical relation after going through preparation process with inputted real-time license plate image of Korea and Japan, and then to classify license plate with using characteristic and geometric information of license plates. It classifies the extracted license plate images into letters and numbers, such as local name, local number, classification character and license consecutive numbers, and recognize license plate of Korea and Japan by applying hybrid and seven segments pattern vectors to classified letter and number region. License plate extraction step of the proposed system uses width and length information along with relative rate of Korean and Japanese license plate. Moreover, it exactly segmentation by letters with using each letter and number position information within license plate region, and recognizes Korean and Japanese license plates by applying hybrid and seven segment pattern vectors, containing characteristics related to letter size and movement within segmented letter area. As the result of testing the proposed system in real experiment, it recognized regardless of external lighting conditions as well as classifying license plates by nations, Korea and Japan. We have developed a system, recognizing regardless of inputted structural character of vehicle licenses and external environment.

  • PDF

Development of a Low-cost Industrial OCR System with an End-to-end Deep Learning Technology

  • Subedi, Bharat;Yunusov, Jahongir;Gaybulayev, Abdulaziz;Kim, Tae-Hyong
    • 대한임베디드공학회논문지
    • /
    • 제15권2호
    • /
    • pp.51-60
    • /
    • 2020
  • Optical character recognition (OCR) has been studied for decades because it is very useful in a variety of places. Nowadays, OCR's performance has improved significantly due to outstanding deep learning technology. Thus, there is an increasing demand for commercial-grade but affordable OCR systems. We have developed a low-cost, high-performance OCR system for the industry with the cheapest embedded developer kit that supports GPU acceleration. To achieve high accuracy for industrial use on limited computing resources, we chose a state-of-the-art text recognition algorithm that uses an end-to-end deep learning network as a baseline model. The model was then improved by replacing the feature extraction network with the best one suited to our conditions. Among the various candidate networks, EfficientNet-B3 has shown the best performance: excellent recognition accuracy with relatively low memory consumption. Besides, we have optimized the model written in TensorFlow's Python API using TensorFlow-TensorRT integration and TensorFlow's C++ API, respectively.

OCR 엔진 기반 분류기 애드온 결합을 통한 이미지 내부 텍스트 인식 성능 향상 (Scene Text Recognition Performance Improvement through an Add-on of an OCR based Classifier)

  • 채호열;석호식
    • 전기전자학회논문지
    • /
    • 제24권4호
    • /
    • pp.1086-1092
    • /
    • 2020
  • 일상 환경에서 동작하는 자율 에이전트를 구현하기 위해서는 이미지나 객체에 존재하는 텍스트를 인식하는 기능이 필수적이다. 주어진 이미지에 입력 변환, 특성 인식, 워드 예측을 적용하여 인식된 텍스트에 존재하는 워드를 출력하는 과정에 다양한 딥러닝 모델이 활용되고 있으며, 딥뉴럴넷의 놀라운 객체 인식 능력으로 인식 성능이 매우 향상되었지만 실제 환경에 적용하기에는 아직 부족한 점이 많다. 본 논문에서는 인식 성능 향상을 위하여 텍스트 존재 영역 감지, 텍스트 인식, 워드 예측의 파이프라인에 OCR 엔진과 분류기로 구성된 애드온을 추가하여 기존 파이프라인이 인식하지 못한 텍스트의 인식을 시도하는 접근법을 제안한다. IC13, IC15의 데이터 셋에 제안 방법을 적용한 결과, 문자 단위에서 기존 파이프라인이 인식하는데 실패한 문자의 최대 10.92%를 인식함을 확인하였다.

음성 문자 공용인식기를 위한 SSMS 기반 가변 파라미터 모델 (A Variable Parameter Model based on SSMS for an On-line Speech and Character Combined Recognition System)

  • 석수영;정호열;정현열
    • 한국음향학회지
    • /
    • 제22권7호
    • /
    • pp.528-538
    • /
    • 2003
  • 음성 문자 공용 인식 시스템은 PDA (Personal Digital Assistants)와 같은 휴대용 모빌 환경에서 음성인식과 문자인식을 적용하기에 적합하도록 개발되었다. 공용 인식 시스템은 특징 파라미터 추출에 있어서는 음성과 문자부분이 독립적으로 수행되나, 인식 과정은 단일 엔진으로 수행된다. CHMM (Continuous Hidden Markov Model)을 이용하는 인식엔진은 고정 파라미터 모델 구조 대신에 동일한 인식률을 유지하면서 모델의 파라미터의 수를 효과적으로 줄일 수 있는 가변 파라미터 모델 구조를 사용하는 것이 유리하다. 본 논문에서는 문맥 독립 가변 파라미터 모델을 생성하기 위해 SSMS (Successive State and Mixture Splitting) 방법을 제안한다. SSMS 알고리즘은 시간 방향 분할과 혼합수 방향분할을 통해 적절한 상태수와 각 상태당 적절한 혼합수를 가지는 모델을 생성한다. 음성 인식 실험 결과 동일한 인식성능을 나타내는 경우 SSMS 기반 가변 파라미터 모델이 고정 파라미터 모델에 비해 GOPDD (Gaussian Output Probability Density Distribution)의 수가 40% 감소함을 확인할 수 있었다.

영상 대 영상 매칭을 이용한 한글 문서 영상에서의 단어 검색 (Keyword Spotting on Hangul Document Images Using Image-to-Image Matching)

  • 박상철;손화정;김수형
    • 정보처리학회논문지B
    • /
    • 제12B권3호
    • /
    • pp.357-364
    • /
    • 2005
  • 본 논문에서는 두 단계 이미지 매칭을 이용하여 한글 문서영상에서 사용자 검색어를 빠르고 정확하게 검색할 수 있는 시스템을 제안한다. 본 시스템은 문자 분리, 검색어 영상 생성, 특징 추출 그리고 이미지 매칭 과정으로 구성된다. 매칭 과정에서 차원이 다른 두 가지 특징 벡터를 이용한다. 8쪽 분량의 문서 영상을 한국정보과학회 웹사이트에서 다운로드하였고, 그 문서로부터 1600개의 한글단어 영상을 획득하여 실험데이터로 사용하였다 그 결과 제안한 시스템은 기존에 제안된 영상-기반 한글 단어 검색 시스템보다 성능이 크게 향상되었음을 알 수 있었다.

실사형 캐리커처 생성을 위한 형태 정보 추출 및 음영 함성 (Appearance Information Extraction and Shading for Realistic Caricature Generation)

  • 박연출;오해석
    • 정보처리학회논문지B
    • /
    • 제11B권3호
    • /
    • pp.257-266
    • /
    • 2004
  • 본 논문은 윤곽선만을 추출하여 캐리커처를 생성하던 기존의 시스템과 달리 음영을 윤곽선과 합성하여 캐리커처를 생성하는 캐리커처 생성 시스템을 제안한다. 이 방식을 사용할 경우 얼굴의 텍스추어 정보까지 생성시 고려하기 때문에 좀 더 실사형에 근접한 캐리커처를 생성할 수 있다. 본 논문에서 제안하는 시스템은 벡터를 기만으로 하기 때문에 사이즈에 제한 없이 자유로운 변형이 가능할 뿐만 아니라 2D 캐릭터에 자유로운 표정을 적용하는 데에도 쉽게 적용이 가능하다. 또, 벡터의 특징으로 인해 모바일 상에서도 적은 용량으로 이용 가능하다. 본 논문은 벡터 형태의 캐리커처를 생성하는 방법과 음영을 제작 및 합성하는 방법을 함께 제시한다.

자음의 미적 평가 추출 요소를 이용한 유사도 함수 정의 (A Definition of Similarity Measuring Function using Beauty Evaluation Extraction Factor of the Consonant)

  • 한군희;백순화;연승호;전병민
    • 한국산업융합학회 논문집
    • /
    • 제3권3호
    • /
    • pp.229-236
    • /
    • 2000
  • This paper proposes on the Hanguel character CAI system using image processing. For this, firstly, the characters written by elementary school students or foreigners arc captured by CCD camera. Secondly, Recognition is accomplished by pre-processing, thinning and recognition processes. Thirdly, strokes are separated and beauty evaluation is done by matching feature value of the input image from the similarity measure function. In particular, this paper describe to define the similarity measuring function using extracted factor values after getting the beauty evaluation factor values of the consonant in the entire CAI system. Finally, the effectiveness of the proposed system is demonstrated by experiments.

  • PDF

뇌-컴퓨터 인터페이스를 이용한 의사전달기 (Communication-system using the BCI)

  • 조한범;양은주;음태완;김응수
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 춘계 학술대회 학술발표 논문집
    • /
    • pp.113-116
    • /
    • 2003
  • 사람은 주로 언어를 통해서 서로간의 의사소통을 한다. 그러나 말을 할 수 없는 중증 장애인, 특히 전신마비가 된 장애인의 경우에는 글을 쓰거나 몸짓을 통한 방법으로도 자신의 의사를 전달하지 못한다. 이러한 중증 장애인이 의사소통을 할 수 있도록 뇌파를 이용한 의사전달기를 구현하였다. 안면근 신호가 포함된 뇌파의 특징을 추출하여 이를 일반적인 제어 신호로써 변환하고 이 신호를 통해 문자를 선택하여 의사론 전달할 수 있도록 하였다.

  • PDF