• Title/Summary/Keyword: 영상언어인식

Search Result 94, Processing Time 0.022 seconds

Recognizing that a person doesn't put on a safety cap using DSP. (DSP(Digital signal proccesor)를 이용한 산업현장에서의 안전모 미착용 인식 기술)

  • Lee, Yong-Woog;Song, Kang-Suk;Jeong, Moo-Il;Lim, Chul-Hoo;Moon, Sung-Mo
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2009.10a
    • /
    • pp.530-533
    • /
    • 2009
  • This paper proposes a method of recognizing that a person doesn't put on a safety cap using image processing method in DSP(Digital Signal Processor). It processes inputted images by image input devices that equipped in a industrial settings. If the method recognizes a person that doesn't put on a safety cap, a system transfers relevant recognition result to a supervisor and takes proper measures. If an accident happens and someone doesn't put on a safety cap, additional casualities could be. Proposed method can nip additional casualties in the bud. To recognize that a person don't put on a safety cap, images are processed by object abstraction, removal of noise, decision of a thing or a person, abstraction of a head part in a image, recognizing whether a man puts on a safety cap using HSV color space or not, and so on. Image input and image process are processed by DSP. And C language-based codes are optimized by an eignefunction(Intrinsics) for speed improvement of algorithms.

  • PDF

A Study on High-speed Image Binarization Using SIMD (SIMD를 이용한 영상의 고속 이진화에 관한 연구)

  • Kim, Doo-Sik;Lee, Sang-Ho;Kim, Byeong-Geun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11a
    • /
    • pp.775-778
    • /
    • 2002
  • 영상 이진화란 명도 영상(gray-scaled image)을 이진 영상(bi-leveled image)으로 변환하는 것을 말한다. 영상 이진화는 문서 인식, 비디오 영상 분석 등과 같이 영상처리 분야에서 많이 사용되는 기본적인 영상 처리 과정에 해당한다. 본 논문은 Intel 사의 Pentium 계열 프로세서에서 지원하는 SIMD(Single-Instruction Multiple-Data) 기술을 이용하여 영상 이진화를 고속으로 수행하는 방법을 소개한다. 우편영상에 대하여 실험한 결과, SSE2 명령어로 구현된 프로그램은 기존의 C 언어로 구현된 프로그램에 비하여 4배 이상의 속도 향상을 보였다.

  • PDF

Recognition of Hand gesture to Human-Computer Interaction (손동작 인식을 통한 Human-Computer Interactio 구현)

  • 이래경;김성신
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2000.11a
    • /
    • pp.344-348
    • /
    • 2000
  • 인간의 손동작 인식은 오랫동안 언어로서의 역할을 해왔던 통신수단의 한 방법이다. 현대의 사회가 정보화 사회로 진행됨에 따라 보다 빠르고 정확한 의사소통 및 정보의 전달을 필요로 하는 가운데 사람과 컴퓨터간의 상호 연결 혹은 사람의 의사 표현에 있어 기존의 장치들이 가지는 단점을 보안하며 이 부분에 사람의 두 손으로 표현되는 자유로운 몸짓을 이용하려는 연구가 최근에 많이 진행되고 있는 추세이다. 본 논문에선 2차원의 입력 영상으로부터 동적인 손동작의 인식을 위해 복잡하고 시간이 많이 소요되는 기존의 방법과는 다르게 부가적인 특별한 장치의 사용 없이 손의 특징을 이용한 새로운 인식 알고리즘을 제안하고, 보다 높은 인식률과 실 시간적 처리를 위해 Radial Basis Function Network 및 부가적인 특징점을 통한 손동작의 인식을 구현하였다. 또한 인식된 손동작의 의미를 바탕으로 인식률 및 손동작 표현의 의미성에 대한 정확도를 판별하기 위해 로봇의 제어에 적용한 실험을 수행하였다.

  • PDF

A Variation Measure of Character Image Data Using Entropy Changes (엔트로피 변화를 이용한 문자 영상 데이타의 변형량)

  • Kim, E.J.;Kim, D.H.;Bang, S.Y.
    • Annual Conference on Human and Language Technology
    • /
    • 1993.10a
    • /
    • pp.451-460
    • /
    • 1993
  • 본 논문에서는 문자 인식을 위해 수집된 문자 영상 데이타들의 변형 정도를 측정하는 변형량의 필요성과 변형량이 가져야 할 조건들을 알아본다. 지금까지 연구된 5가지 변형량들이 이 조건을 모두 만족시키지는 않음을 보이고 이 조건을 만족시키는 새로운 변형량, 평균 엔트로피 변화량을 제안한다. 이 변형량은 여백이나 문자의 두께에 무관하며 같은 문자 뿐만아니라 다른 문자 간에도 비교할 수 있는 특성을 가진다.

  • PDF

Computer Control through Recognition of the Hand Movement (손동작 인식을 통한 컴퓨터 제어)

  • Kim, Hee-Sung;Lee, Bong-Hwan;Lee, Kyu-Won
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2014.04a
    • /
    • pp.912-915
    • /
    • 2014
  • 사람과 기계의 의사소통을 위해 기본적으로 개발된 방식은 사람의 문자를 기계어로 바꿔주어 작성된 이진 코드들을 기계가 인식하는 방법이었다.[1] 이는 중간 처리기만 이용하여 쉽게 언어를 변환하는게 가능하였고, 현재까지도 가장 많이 이용되는 방법이다. 하지만 문자를 이용하는 방식 또한 평상시 사람들이 사용하는 언어가 아닌 기계어로의 변환이 용이하도록 미리 정의된 단어들을 사용하기 때문에, 일반적인 사람들이 이용하는 데에는 어려움이 있다. 본 논문에서는 사람의 손동작 영상을 이용한 컴퓨터 제어시스템을 제안하고자 한다.

Recognition of Hand gesture to Human-Computer Interaction (손동작 인식을 통한 Human-Computer Interaction 구현)

  • 이래경;김성신
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.11 no.1
    • /
    • pp.28-32
    • /
    • 2001
  • 인간의 손동작 인식은 오랫동안 언어로서의 역할을 해왔던 통신수단의 한 방법이다. 현대의 사회가 정보화 사회로 진행됨에 따라 보다 빠르고 정확한 의사소통 및 정보의 전달을 필요로 하는 가운데 사람과 컴퓨터간의 상호 연결 혹은 사람의 의사 표현에 있어 기존의 장치들이 가지는 단점을 보안하며 이 부분에 사람의 두 손으로 표현되는 자유로운 몸짓을 이용하려는 연구가 최근에 많이 진행되고 있는 추세이다. 본 논문에선 2차원 입력 영상으로부터 동적인 손동작의 사용 없이 손의 특징을 이용한 새로운 인식 알고리즘을 제안하고, 보다 높은 인식률과 실 시간적 처리를 위해 Radial Basis Function Network 및 부가적인 특징점을 통한 손동작의 인식을 구현하였다. 또한 인식된 손동작의 의미를 바탕으로 인식률 및 손동작 표현의 의미성에 대한 정확도를 판별하기 위해 로봇의 제어에 적용한 실험을 수행하였다.

  • PDF

A study on the lip shape recognition algorithm using 3-D Model (3차원 모델을 이용한 입모양 인식 알고리즘에 관한 연구)

  • 김동수;남기환;한준희;배철수;나상동
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 1998.11a
    • /
    • pp.181-185
    • /
    • 1998
  • Recently, research and developmental direction of communication system is concurrent adopting voice data and face image in speaking to provide more higher recognition rate then in the case of only voice data. Therefore, we present a method of lipreading in speech image sequence by using the 3-D facial shape model. The method use a feature information of the face image such as the opening-level of lip, the movement of jaw, and the projection height of lip. At first, we adjust the 3-D face model to speeching face image sequence. Then, to get a feature information we compute variance quantity from adjusted 3-D shape model of image sequence and use the variance quality of the adjusted 3-D model as recognition parameters. We use the intensity inclination values which obtaining from the variance in 3-D feature points as the separation of recognition units from the sequential image. After then, we use discrete HMM algorithm at recognition process, depending on multiple observation sequence which considers the variance of 3-D feature point fully. As a result of recognition experiment with the 8 Korean vowels and 2 Korean consonants, we have about 80% of recognition rate for the plosives and vowels.

  • PDF

Advanced Auto-Focus and Auto-Exposure Algorithm Detecting Object for Video Camera (피사체 인식을 이용한 비디오 카메라용 자동 초점 및 자동 노출 알고리즘)

  • Lee, Kwang-Hyun;Lee, Sang-Hoon
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2008.02a
    • /
    • pp.147-150
    • /
    • 2008
  • 현재의 비디오 카메라는 인간의 눈으로 볼 수 있는 것과 동일한 화질의 비디오 영상을 얻을 수 없다. 인간의 눈은 움직이는 물체에 중점을 두고 초점을 맞추는 시각적 특성을 가진다. 하지만 현재의 비디오 카메라 시스템은 영상에 대한 인간의 눈의 시각적 특성에 대한 고려 없이 조리개와 렌즈의 조절 작업이 이루어진다. 본 논문은 이러한 비디오 카메라 시스템의 개선을 위해 인간의 눈의 시각적 특성에 기반을 둔 실시간 피사체 적응 비디오 카메라 시스템을 제안한다. 제안하는 알고리즘은 영상내에서 움직임을 가진 물체를 찾아낸 뒤, 이것에 가중치를 두고 조리개와 초점제어 작업의 순서로 이루어진다. 움직이는 물체는 영상 코덱의 움직임 정보를 파악하여 찾아내었다. 제안된 알고리즘은 프로그램언어로 구현되었으며, 초점거리와 조리개제어가 가능한 카메라와 PC를 사용하여 영상을 분석, 검증하였다.

  • PDF

Large-Scale Hangul Font Recognition Using Deep Learning (딥러닝을 이용한 대규모 한글 폰트 인식)

  • Yang, Jin-Hyeok;Kwak, Hyo-Bin;Kim, In-Jung
    • 한국어정보학회:학술대회논문집
    • /
    • 2017.10a
    • /
    • pp.8-12
    • /
    • 2017
  • 본 연구에서는 딥러닝을 이용해 3300종에 이르는 다양한 한글 폰트를 인식하였다. 폰트는 디자인 분야에 있어서 필수적인 요소이며 문화적으로도 중요하다. 한글은 영어권 언어에 비해 훨씬 많은 문자를 포함하고 있기 때문에 한글 폰트 인식은 영어권 폰트 인식보다 어렵다. 본 연구에서는 최근 다양한 영상 인식 분야에서 좋은 성능을 보이고 있는 CNN을 이용해 한글 폰트 인식을 수행하였다. 과거에 이루어진 대부분의 폰트 인식 연구에서는 불과 수 십 종의 폰트 만을 대상으로 하였다. 최근에 이르러서야 2000종 이상의 대용량 폰트 인식에 대한 연구결과가 발표되었으나, 이들은 주로 문자의 수가 적은 영어권 문자들을 대상으로 하고 있다. 본 연구에서는 CNN을 이용해 3300종에 이르는 다양한 한글 폰트를 인식하였다. 많은 수의 폰트를 인식하기 위해 두 가지 구조의 CNN을 이용해 폰트인식기를 구성하고, 실험을 통해 이들을 비교 평가하였다. 특히, 본 연구에서는 3300종의 한글 폰트를 효과적으로 인식하면서도 학습 시간과 파라미터의 수를 줄이고 구조를 단순화하는 방향으로 모델을 개선하였다. 제안하는 모델은 3300종의 한글 폰트에 대하여 상위 1위 인식률 94.55%, 상위 5위 인식률 99.91%의 성능을 보였다.

  • PDF

Architecture design of the straight - line Hough Transform processor for image analysis (영상해석용 직선 Hough Transform 연산기의 아키텍쳐 설계)

  • Park, Young-June;Song, Nag-Un
    • The Transactions of the Korea Information Processing Society
    • /
    • v.4 no.10
    • /
    • pp.2553-2561
    • /
    • 1997
  • In this paper, a hardware architecture to calculate straight-line Hough transform algorithm for image recognition is suggested. This processor consists of the filtering module for gradient calculation and the HT calculation module, and the angle information are stored in memory table. For the suggested architecture, firstly, algorithm simulation is executed using C language to confirm the operation and to decide the precision of calculation, and secondly, architecture simulation is executed using VHDL language for the total blocks. According to C & VHDL simulation results, it is confirmed that the calculated data value is similarly obtained and the calculation defference is decreased as image clarity and bits increase.

  • PDF