• Title/Summary/Keyword: image recognition technology

Search Result 990, Processing Time 0.034 seconds

모바일/임베디드 객체 및 장면 인식 기술 동향 (Recent Trends of Object and Scene Recognition Technologies for Mobile/Embedded Devices)

  • 이수웅;이근동;고종국;이승재;유원영
    • 전자통신동향분석
    • /
    • 제34권6호
    • /
    • pp.133-144
    • /
    • 2019
  • Although deep learning-based visual image recognition technology has evolved rapidly, most of the commonly used methods focus solely on recognition accuracy. However, the demand for low latency and low power consuming image recognition with an acceptable accuracy is rising for practical applications in edge devices. For example, most Internet of Things (IoT) devices have a low computing power requiring more pragmatic use of these technologies; in addition, drones or smartphones have limited battery capacity again requiring practical applications that take this into consideration. Furthermore, some people do not prefer that central servers process their private images, as is required by high performance serverbased recognition technologies. To address these demands, the object and scene recognition technologies for mobile/embedded devices that enable optimized neural networks to operate in mobile and embedded environments are gaining attention. In this report, we briefly summarize the recent trends and issues of object and scene recognition technologies for mobile and embedded devices.

윈도우 기반의 광학문자인식을 이용한 영상 번역 시스템 구현 (An Implementation of a System for Video Translation on Window Platform Using OCR)

  • 황선명;염희균
    • 사물인터넷융복합논문지
    • /
    • 제5권2호
    • /
    • pp.15-20
    • /
    • 2019
  • 기계학습 연구가 발달함에 따라 번역 분야 및, 광학 문자 인식(Optical Character Recognition, OCR) 등의 이미지 분석 기술은 뛰어난 발전을 보였다. 하지만 이 두 가지를 접목시킨 영상 번역은 기존의 개발에 비해 그 진척이 더딘 편이다. 본 논문에서는 기존의 OCR 기술과 번역기술을 접목시킨 이미지 번역기를 개발하고 그 효용성을 검증한다. 개발에 앞서 본 시스템을 구현하기 위하여 어떤 기능을 필요로 하는지, 기능을 구현하기 위한 방법은 어떤 것이 있는지 제시한 뒤 각기 그 성능을 시험하였다. 본 논문을 통하여 개발된 응용프로그램으로 사용자들은 좀 더 편리하게 번역에 접근할 수 있으며, 영상 번역이라는 특수한 환경으로 한정된 번역기능에서 벗어나 어떠한 환경에서라도 제공되는 편의성을 확보하는데 기여할 수 있을 것이다.

A Survey of Face Recognition Techniques

  • Jafri, Rabia;Arabnia, Hamid R.
    • Journal of Information Processing Systems
    • /
    • 제5권2호
    • /
    • pp.41-68
    • /
    • 2009
  • Face recognition presents a challenging problem in the field of image analysis and computer vision, and as such has received a great deal of attention over the last few years because of its many applications in various domains. Face recognition techniques can be broadly divided into three categories based on the face data acquisition methodology: methods that operate on intensity images; those that deal with video sequences; and those that require other sensory data such as 3D information or infra-red imagery. In this paper, an overview of some of the well-known methods in each of these categories is provided and some of the benefits and drawbacks of the schemes mentioned therein are examined. Furthermore, a discussion outlining the incentive for using face recognition, the applications of this technology, and some of the difficulties plaguing current systems with regard to this task has also been provided. This paper also mentions some of the most recent algorithms developed for this purpose and attempts to give an idea of the state of the art of face recognition technology.

키넥트 카메라를 이용한 타이어 문자 인식 및 보정 시스템 설계 (Development of Tire Character Recognition and Compensation System Using the Kinect camera)

  • 김규현;장종욱
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 춘계학술대회
    • /
    • pp.248-251
    • /
    • 2016
  • 본 논문에서는 타이어 표면의 돌출문자를 인식하여 데이터화 및 수집하는 방법에 관하여 논하였다. 본 논문에서는 기존의 문자를 인식 시스템과 달리 타이어의 돌출문자 인식에 대해 전 처리 단계에서 키넥트 카메라 영상을 이미지 데이터로 변환한 후, 문자 영역을 탐색한다. 그 후 이진 영상, 노이즈 필터 등을 통하여 이미지 개선을 하여 숫자 및 글자를 분석한다. 인식 단계에서는 문자의 판별 등을 이용하여 인식 하고 추가적으로 타이어 정보 인식 오류 보정 알고리즘을 통하여 글자의 오류인식에 대한 보정을 하여 타이어의 돌출 문자를 100% 인식하고자 한다. 본 논문에서는 타이어 문자를 인식하는 방법과 기술을 개발하고자 한다. 이미 문자 인식을 하는 많은 방법들이 있지만, 타이어 문자는 일반적인 문자인식과 다르게 추가된 기술을 요구하기 때문에 문자 인식을 하는 추가 기술 방식과 알고리즘을 개발하고자 한다.

  • PDF

Active Discrete Wavelet Transform를 이용한 얼굴 특징 점 추출 (A Study On Face Feature Points Using Active Discrete Wavelet Transform)

  • 전순용;챈즈징;지언호
    • 전자공학회논문지SC
    • /
    • 제47권1호
    • /
    • pp.7-16
    • /
    • 2010
  • 패턴 인식은 얼굴인식 영역에서 중요한 분야로 널리 사용 되고 있으며, 많은 연구가 이루어지고 있다. 얼굴 특징 점의 추출은 얼굴 인식 과정에서 중요한 단계로 정확한 얼굴 특징 추출은 인식기의 인식률에 가장 큰 영향을 미친다. 본 논문 에서는 능동형 이산 웨이브렛 변환을 통한 얼굴 특징 점 추출 방법을 제안했다. PC 카메라를 이용하여 취득된 얼굴 영상을 능동형 이산 웨이브렛 변환을 취하여 얼굴 영상 신호변환을 하였다. 변환된 영상 신호에 대하여 수직, 수평 투영법을 이용하여 얼굴 특징 추출을 하였으며, 추출 결과로부터 얼굴인식을 하였다. 제안된 능동형 이산 웨이브렛 변환은 얼굴 인식률 향상을 가져왔으며, 특징 점을 신속하고 정확하게 추출할 수 있었으며, 기존 이산 웨이브렛 변환을 이용한 특징 점 추출방식에 대하여 향상된 정확도와 안전성을 보였다.

Representing Human Motions in an Eigenspace Based on Surrounding Cameras

  • Houman, Satoshi;Rahman, M. Masudur;Tan, Joo Kooi;Ishikawa, Seiji
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2004년도 ICCAS
    • /
    • pp.1808-1813
    • /
    • 2004
  • Recognition of human motions using their 2-D images has various applications. An eigenspace method is employed in this paper for representing and recognizing human motions. An eigenspace is created from the images taken by multiple cameras that surround a human in motion. Image streams obtained from the cameras compose the same number of curved lines in the eigenspace and they are used for recognizing a human motion in a video image. Performance of the proposed technique is shown experimentally.

  • PDF

3차원 영상인식을 위한 다중영상매핑 시스템에 대한 연구 (A Study on the Multiple Texture Rendering System for 3D Image Signal Recognition)

  • Kim, Sangjune;Park, Chunseok
    • 한국재난정보학회 논문집
    • /
    • 제12권1호
    • /
    • pp.47-53
    • /
    • 2016
  • 본 연구에서 개발 하고자 하는 기술은 3차원 영상인식을 위한 다중 영상매핑 시스템에 관한 연구 로 기존 통합 관제 시스템에 적용하거나 실시간 영상 관제 시스템 구축의 중심기술이 되고자 하는 것을 목적으로 한다. 따라서, 본 연구에서 계획한 다중 영상 매핑 시스템이 개발된다면, CCTV카메라기술과 네트워크 기술만으로도 즉, 다수의 연계된 시스템을 구축하지 않아도 보안담당자가 실제 순찰하면서 관제하는 서비스를 제공할 것이며, 필요하다면 타 시스템과 연계하여 순찰자의 의도를 반영할 수 있는 시스템으로 발전시킬 것이다. 또한, 이러한 시스템이 개발된다면 보안담당자의 재난 및 안전위협을 초래하는 상황에서 벗어날 수 있는 동시에 비교적 소규모의 경제력을 가진 사용자에게도 서비스를 제공할 수 있을 것으로 기대된다.

Recognizing asymmetric moire patterns for human spinal deformity detection

  • Kim, Hyoung-Seop;Hiroshi UENO;Seiji ISHIKAWA;Yoshinori Otsuka
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 1997년도 한국자동제어학술회의논문집; 한국전력공사 서울연수원; 17-18 Oct. 1997
    • /
    • pp.568-571
    • /
    • 1997
  • Recently, the number of techniques for analyzing medical images has been increasing in computer vision, employing X-ray CT images, ultrasound images, MR images, moire topographic images, etc. Spinal deformity is a serious problem especially for teenagers and medical doctors inspect moire topographic images of their backs visually for the primary screening. If a subject is normal, the moire image is almost symmetric with respect to the middle line of the subject's back, otherwise it shows asymmetric shape. In this paper, an image analysis technique is described for discriminating suspicious cases from normal in human spinal deformity by recognizing asymmetric moire images of human backs. The principal axes which are sensitive to asymmetry of the moire image are extracted at two parts on a subject's back and their angles are evaluated with respect to the detected middle line of the back. The two angles compose a 2-D feature space and inspected cases are divided into two clusters in the space by a linear discriminant function based on the Mahalanobis distance. Given 120 cases, 60 normal and 60 abnormal, the leave-out method was applied for the recognition and 75% recognition rate was achieved.

  • PDF

Siamese 네트워크 기반 SAR 표적영상 간 유사도 분석 (Similarity Analysis Between SAR Target Images Based on Siamese Network)

  • 박지훈
    • 한국군사과학기술학회지
    • /
    • 제25권5호
    • /
    • pp.462-475
    • /
    • 2022
  • Different from the field of electro-optical(EO) image analysis, there has been less interest in similarity metrics between synthetic aperture radar(SAR) target images. A reliable and objective similarity analysis for SAR target images is expected to enable the verification of the SAR measurement process or provide the guidelines of target CAD modeling that can be used for simulating realistic SAR target images. For this purpose, this paper presents a similarity analysis method based on the siamese network that quantifies the subjective assessment through the distance learning of similar and dissimilar SAR target image pairs. The proposed method is applied to MSTAR SAR target images of slightly different depression angles and the resultant metrics are compared and analyzed with qualitative evaluation. Since the image similarity is somewhat related to recognition performance, the capacity of the proposed method for target recognition is further checked experimentally with the confusion matrix.

사용자 손 제스처 인식 기반 입체 영상 제어 시스템 설계 및 구현 (Design and Implementation of a Stereoscopic Image Control System based on User Hand Gesture Recognition)

  • 송복득;이승환;최홍규;김성훈
    • 한국정보통신학회논문지
    • /
    • 제26권3호
    • /
    • pp.396-402
    • /
    • 2022
  • 영상 미디어를 위한 사용자 인터랙션은 다양한 형태로 개발되고 있으며, 특히, 인간의 제스처를 활용한 인터랙션이 활발히 연구되고 있다. 그 중에, 손 제스처 인식의 경우 3D Hand Model을 기반으로 실감 미디어 분야에서 휴먼 인터페이스로 활용되고 있다. 손 제스처 인식을 기반으로 한 인터페이스의 활용은 사용자가 미디어 매체에 보다 쉽고 편리하게 접근할 수 있도록 도와준다. 이러한 손 제스처 인식을 활용한 사용자 인터랙션은 컴퓨터 환경 제약 없이 빠르고 정확한 손 제스처 인식 기술을 적용하여 영상을 감상할 수 있어야 한다. 본 논문은 오픈 소스인 미디어 파이프 프레임워크와 머신러닝의 k-NN(K-Nearest Neighbor)을 활용하여 빠르고 정확한 사용자 손 제스처 인식 알고리즘을 제안한다. 그리고 컴퓨터 환경 제약을 최소화하기 위하여 인터넷 서비스가 가능한 웹 서비스 환경 및 가상 환경인 도커 컨테이너를 활용하여 사용자 손 제스처 인식 기반의 입체 영상 제어 시스템을 설계하고 구현한다.