• 제목/요약/키워드: Recognition and Detection

검색결과 2,239건 처리시간 0.031초

A New Endpoint Detection Method Based on Chaotic System Features for Digital Isolated Word Recognition System

  • 장한;정길도
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2009년도 정보 및 제어 심포지움 논문집
    • /
    • pp.37-39
    • /
    • 2009
  • In the research of speech recognition, locating the beginning and end of a speech utterance in a background of noise is of great importance. Since the background noise presenting to record will introduce disturbance while we just want to get the stationary parameters to represent the corresponding speech section, in particular, a major source of error in automatic recognition system of isolated words is the inaccurate detection of beginning and ending boundaries of test and reference templates, thus we must find potent method to remove the unnecessary regions of a speech signal. The conventional methods for speech endpoint detection are based on two simple time-domain measurements - short-time energy, and short-time zero-crossing rate, which couldn't guarantee the precise results if in the low signal-to-noise ratio environments. This paper proposes a novel approach that finds the Lyapunov exponent of time-domain waveform. This proposed method has no use for obtaining the frequency-domain parameters for endpoint detection process, e.g. Mel-Scale Features, which have been introduced in other paper. Comparing with the conventional methods based on short-time energy and short-time zero-crossing rate, the novel approach based on time-domain Lyapunov Exponents(LEs) is low complexity and suitable for Digital Isolated Word Recognition System.

  • PDF

WIPI 플랫폼 기반 얼굴인식 미들웨어 설계 (Design of Middleware for Face Recognition based on WIPI Platform)

  • 배경율
    • 지능정보연구
    • /
    • 제11권3호
    • /
    • pp.117-127
    • /
    • 2005
  • 이동기기를 기반으로 하는 기술이 급격히 발달함에 따라 일반 컴퓨팅 환경의 그래픽이나 영상처리 기술들을 활용한 모바일 컨텐츠 개발이 증가하고 있다. 본 논문에서는 상호 연동성을 지원하는 국내 표준 무선인터넷 플랫폼인 WIPI를 기반으로 하여 영상처리와 얼굴인식 기술을 응용한 얼굴탐지 및 인식 지원 미들웨어를 설계하였다. 생성된 얼굴인식 미들웨어는 휴대폰 카메라를 이용한 인식보안 및 다양한 컨텐츠로 활용될 수 있도록 객체지향 개념을 도입해 각각의 미들웨어가 얼굴인식 미들웨어를 공유할 수 있다. 이는 컨텐츠 설계에 있어 주요 프로세스를 분리함으로써 컨텐츠의 개발 기간 및 비용을 단축시킬 수 있으며, 컨텐츠 보호 및 타 기업과의 기술이전에 적용될 수 있다. 얼굴인식 미들웨어는 서비스에 따라 얼굴탐지 모듈과 얼굴인식 모듈로 구성되며, WIPI 플랫폼 상에서의 얼굴인식 미들웨어 응용 컨텐츠 설계 방법에 대하여 제시한다.

  • PDF

스마트폰을 이용한 얼굴인식 출입관리 시스템 (Gate Management System by Face Recognition using Smart Phone)

  • 권기현;이형봉
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권11호
    • /
    • pp.9-15
    • /
    • 2011
  • 본 논문에서는 스마트폰 얼굴인식을 통해 출입을 관리하는 시스템을 설계하고 구현한다. 이를 위해 스마트폰에서 얼굴인식을 위한 사용가능한 다양한 알고리즘을 조사하였다. 얼굴 인식의 첫 단계는 얼굴검출이며 다음 단계는 얼굴인식이다. 얼굴 검출을 위해서는 컬러 세그멘테이션, 템플릿매칭 등의 알고리즘을 적용하였으며, 얼굴 인식을 위해서는 PCA(Principal Component Analysis)에 기반을 둔 Eigenface와 LDA(Linear Discriminant Analysis)에 기반을 둔 Fisherface를 비교하여 구현하고 적용하였다. 스마트 폰의 제한된 하드웨어에서 얼굴인식시스템을 구현하는 관계로 알고리즘의 정확도와 알고리즘의 계산 복잡도 사이에서 적절한 조절이 필요하였다.

YOLOv2 기반의 영상워핑을 이용한 강인한 오토바이 번호판 검출 및 인식 (Robust Motorbike License Plate Detection and Recognition using Image Warping based on YOLOv2)

  • 당순정;김응태
    • 방송공학회논문지
    • /
    • 제24권5호
    • /
    • pp.713-725
    • /
    • 2019
  • 번호판 자동인식(ALPR: Automatic License Plate Recognition)은 지능형 교통시스템 및 비디오 감시 시스템 등 많은 응용 분야에서 필요한 기술이다. 대부분의 연구는 자동차를 대상으로 번호판 감지 및 인식을 연구하였고, 오토바이를 대상으로 번호판 감지 및 인식은 매우 적은 편이다. 자동차의 경우 번호판이 차량의 전방 또는 후방 중앙에 위치하며 번호판의 뒷배경은 주로 단색으로 덜 복잡한 편이다. 그러나 오토바이의 경우 킥 스탠드를 이용하여 세우기 때문에 주차할 때 오토바이는 다양한 각도로 기울어져 있으므로 번호판의 글자 및 숫자 인식하는 과정이 훨씬 더 복잡하다. 본 논문에서는 다양한 각도로 주차된 오토바이 데이터세트에 대하여 번호판의 문자 인식 정확도를 높이기 위하여 2-스테이지 YOLOv2 알고리즘을 사용하여 오토바이 영역을 선 검출 후 번호판 영역을 검지한다. 인식률을 높이기 위해 앵커박스의 사이즈와 개수를 오토바이 특성에 맞추어 조절하였다. 그 후 기울어진 번호판을 검출한 후 영상 워핑 알고리즘을 적용하였다. 모의실험 결과, 기존 방식의 인식률이 47.74%에 비해 제안된 방식은 80.23%의 번호판의 인식률을 얻었다. 제안된 방법은 전체적으로 오토바이 번호판 특성에 맞는 앵커박스와 이미지 워핑을 통해서 다양한 기울기의 오토바이 번호판 문자 인식을 높일 수 있었다.

가변위치 고음성인식 기술을 이용한 무선 홈 네트워크 시스템 구현에 관한 연구 (A Study on the Realization of Wireless Home Network System Using High-performance Speech Recognition in Variable Position)

  • 윤준철;최상방;박찬섭;김세영;김기만;강석엽
    • 한국정보통신학회논문지
    • /
    • 제14권4호
    • /
    • pp.991-998
    • /
    • 2010
  • 실내 환경에서 음성인식 기술을 이용한 무선 홈 네트워크 시스템 구현에 있어, 잡음과 실내 잔향음은 시스템 성능 저하의 주요 원인이다. 본 연구에서는 실내 인식환경에서 스펙트럼 엔트로피(Spectral entropy) 기반의 음성 구간검출법을 이용하여 잔향음(reverberation) 및 실내잡음에 강인한 음성인식 홈 네트워크 시스템을 구현하고자 한다. 스펙트럼 차감법(Spectral Subtraction)은 잔향으로 인해 왜곡된 신호를 스펙트럼 상에서 제거하여 잔향의 효과를 줄일 수 있고 음성신호와 독립적인 잡음을 제거 할 수 있다. 효과적인 스펙트럼 차감을 위해서는 음성과 비음성 구간의 정확한 구분이 수반되어야 하며 이를 위해서 엔트로피 기반의 음성 구간 검출법을 적용하여 성능을 향상시킨다. 모의 및 실내환경 실험 결과 Spectral entropy 기반의 음성 구간 검출법을 이용할 경우 실내 잔향 및 잡음환경에서 명령어 인식률의 향상이 증명되었다.

SAR 자동표적인식 시스템에서의 탐지특징 결합 방법 개선 방안 (Improved Fusion Method of Detection Features in SAR ATR System)

  • 차민준;김형명
    • 한국군사과학기술학회지
    • /
    • 제13권3호
    • /
    • pp.461-469
    • /
    • 2010
  • In this paper, we have proposed an improved fusion method of detection features which can enhance the detection probability under the given false alarm rate in the prescreening stage of SAR ATR(Synthetic Aperture Radar Automatic Target Recognition) system. Since the detection features have the positive correlation, the detection performance can be improved if the joint probability distribution of detection features is considered in the fusion process. The detection region is designed as a simple piecewise linear function which can be represented by few parameters. The parameters for the detection region can be derived by training the sample SAR images to maximize the detection probability with the given false alarm rate. Simulation result shows that the detection performance of the proposed method is improved for all combinations of detection features.

Development of Pose-Invariant Face Recognition System for Mobile Robot Applications

  • Lee, Tai-Gun;Park, Sung-Kee;Kim, Mun-Sang;Park, Mig-Non
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2003년도 ICCAS
    • /
    • pp.783-788
    • /
    • 2003
  • In this paper, we present a new approach to detect and recognize human face in the image from vision camera equipped on the mobile robot platform. Due to the mobility of camera platform, obtained facial image is small and pose-various. For this condition, new algorithm should cope with these constraints and can detect and recognize face in nearly real time. In detection step, ‘coarse to fine’ detection strategy is used. Firstly, region boundary including face is roughly located by dual ellipse templates of facial color and on this region, the locations of three main facial features- two eyes and mouth-are estimated. For this, simplified facial feature maps using characteristic chrominance are made out and candidate pixels are segmented as eye or mouth pixels group. These candidate facial features are verified whether the length and orientation of feature pairs are suitable for face geometry. In recognition step, pseudo-convex hull area of gray face image is defined which area includes feature triangle connecting two eyes and mouth. And random lattice line set are composed and laid on this convex hull area, and then 2D appearance of this area is represented. From these procedures, facial information of detected face is obtained and face DB images are similarly processed for each person class. Based on facial information of these areas, distance measure of match of lattice lines is calculated and face image is recognized using this measure as a classifier. This proposed detection and recognition algorithms overcome the constraints of previous approach [15], make real-time face detection and recognition possible, and guarantee the correct recognition irregardless of some pose variation of face. The usefulness at mobile robot application is demonstrated.

  • PDF

Intelligent Activity Recognition based on Improved Convolutional Neural Network

  • Park, Jin-Ho;Lee, Eung-Joo
    • 한국멀티미디어학회논문지
    • /
    • 제25권6호
    • /
    • pp.807-818
    • /
    • 2022
  • In order to further improve the accuracy and time efficiency of behavior recognition in intelligent monitoring scenarios, a human behavior recognition algorithm based on YOLO combined with LSTM and CNN is proposed. Using the real-time nature of YOLO target detection, firstly, the specific behavior in the surveillance video is detected in real time, and the depth feature extraction is performed after obtaining the target size, location and other information; Then, remove noise data from irrelevant areas in the image; Finally, combined with LSTM modeling and processing time series, the final behavior discrimination is made for the behavior action sequence in the surveillance video. Experiments in the MSR and KTH datasets show that the average recognition rate of each behavior reaches 98.42% and 96.6%, and the average recognition speed reaches 210ms and 220ms. The method in this paper has a good effect on the intelligence behavior recognition.

Fast Super-Resolution GAN 기반 자동차 번호판 검출 및 인식 성능 고도화 기법 (Improved Method of License Plate Detection and Recognition Facilitated by Fast Super-Resolution GAN)

  • 민동욱;임현석;곽정환
    • 스마트미디어저널
    • /
    • 제9권4호
    • /
    • pp.134-143
    • /
    • 2020
  • 자동차 번호판 인식 기술은 도로의 교통상황 통제, 과속차량 단속, 도주 차량의 추적 등 현대 교통 시설 및 교통 안전망을 책임지고 있는 핵심 기술 중 하나이다. 이 기법은 과거에도 연구되었던 분야였으나 최근 딥러닝 기술의 발전으로 다양한 기법들을 적용하여 향상된 성능을 보이는 분야이며, 크게 자동차 번호판 검출과 번호판 인식으로 나뉜다. 본 연구에서는 다양한 객체 검출 모델과 WPOD-Net(Warped Planar Object Detection Network) 모델을 활용하여 자동차 번호판 검출 성능을 향상시키기 위한 실험을 진행하였으며, 객체 검출 모델을 활용하여 번호판을 검출하는 기존 방식들 대신 차량을 검출한 다음 번호판을 검출하는 방식을 택하여 정확도를 높였다. 특히 Super-Resolution 기법 중 하나인 Fast-SRGAN 모델을 활용하여 이미지 내에 존재하는 노이즈를 제거하는 처리를 통해 최종 성능을 향상시켰다. 결과적으로 92.38%에서 96.72%로 선행 연구 대비 평균 4.34% 향상된 성능이 실험을 통해 확인되었다.

영상객체 spFACS ASM 알고리즘을 적용한 얼굴인식에 관한 연구 (ASM Algorithm Applid to Image Object spFACS Study on Face Recognition)

  • 최병관
    • 디지털산업정보학회논문지
    • /
    • 제12권4호
    • /
    • pp.1-12
    • /
    • 2016
  • Digital imaging technology has developed into a state-of-the-art IT convergence, composite industry beyond the limits of the multimedia industry, especially in the field of smart object recognition, face - Application developed various techniques have been actively studied in conjunction with the phone. Recently, face recognition technology through the object recognition technology and evolved into intelligent video detection recognition technology, image recognition technology object detection recognition process applies to skills through is applied to the IP camera, the image object recognition technology with face recognition and active research have. In this paper, we first propose the necessary technical elements of the human factor technology trends and look at the human object recognition based spFACS (Smile Progress Facial Action Coding System) for detecting smiles study plan of the image recognition technology recognizes objects. Study scheme 1). ASM algorithm. By suggesting ways to effectively evaluate psychological research skills through the image object 2). By applying the result via the face recognition object to the tooth area it is detected in accordance with the recognized facial expression recognition of a person demonstrated the effect of extracting the feature points.