• 제목/요약/키워드: Feature detector

검색결과 191건 처리시간 0.025초

고차 통계를 이용한 잡음 환경에서의 화자식별 (Speaker Identification Using Higher-Order Statistics In Noisy Environment)

  • 신태영;김기성;권영욱;김형순
    • 한국음향학회지
    • /
    • 제16권6호
    • /
    • pp.25-35
    • /
    • 1997
  • 음성 신호 처리에 널리사용되어 온 2차 통계에 의한 음성 분석 방법은 잡음 환경에서 성능이 크게 저하되는 단점을 지닌다. 이에 반하여 고차 통계 방법은 Gaussian 잡음 등을 억제하는 특성을 가지고 있어서 잡음 환경에 상대적으로 강인한 음성 특징 추출을 가능하게 한다. 본 논문에서는 고차 통계에 의한 음성 분석 방법을 이용하여 백색 및 유색 잡음 환경에서의 문맥 독립형(text-independent) 화자식별 시스템을 제안하고, 기존의 2차 통계에 의한 방식과 성능을 비교하였다. 본 논문에서의 화자식별 시스템은 벡터 양자화 방법에 기반을 두고 있으며, 고차 통계 방법에 의한 유성음/무성음 판별을 통해 non-Gaussian 특징을 가지면서도 화자 정보가 집중되어 있는 유성음 부분에 대해서만 음성 특징을 추출하여 인식에 사용하였다. 50명의 화자를 대상으로 한 화자식별 실험 결과, 고차 통계 방법이 2차 통계에 의한 방법보다 잡음 환경에서 상대적으로 우수한 인식 성능을 나타냄을 확인하였다.

  • PDF

얼굴정렬과 AdaBoost를 이용한 얼굴 표정 인식 (Facial Expression Recognition using Face Alignment and AdaBoost)

  • 정경중;최재식;장길진
    • 전자공학회논문지
    • /
    • 제51권11호
    • /
    • pp.193-201
    • /
    • 2014
  • 본 논문에서는 얼굴영상에 나타난 사람의 표정을 인식하기 위해 얼굴검출, 얼굴정렬, 얼굴단위 추출, 그리고 AdaBoost를 이용한 학습 방법과 효과적인 인식방법을 제안한다. 입력영상에서 얼굴 영역을 찾기 위해서 얼굴검출을 수행하고, 검출된 얼굴영상에 대하여 학습된 얼굴모델과 정렬(Face Alignment)을 수행한 후, 얼굴의 표정을 나타내는 단위요소(Facial Units)들을 추출한다. 본 논문에서 제안하는 얼굴 단위요소들을 표정을 표현하기 위한 기본적인 액션유닛(AU, Action Units)의 하위집합으로 눈썹, 눈, 코, 입 부분으로 나눠지며, 이러한 액션유닛에 대하여 AdaBoost 학습을 수행하여 표정을 인식한다. 얼굴유닛은 얼굴표정을 더욱 효율적으로 표현할 수 있고 학습 및 테스트에서 동작하는 시간을 줄여주기 때문에 실시간 응용분야에 적용하기 적합하다. 실험결과, 제안하는 표정인식 시스템은 실시간 환경에서 90% 이상의 우수한 성능을 보여준다.

문자-에지 맵의 패턴 히스토그램을 이용한 자연이미지에서의 텍스트 영역 추출 (Text Region Extraction using Pattern Histogram of Character-Edge Map in Natural Images)

  • 박종천;황동국;이우람;권교현;전병민
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2006년도 추계학술발표논문집
    • /
    • pp.220-224
    • /
    • 2006
  • 자연이미지에 포함된 텍스트는 많은 중요한 정보를 포함하고 있다. 그러므로 자연이미지에서 텍스트를 추출할 수 있다면 다양한 분야에서 활용될 수 있다. 본 논문에서는 문자-에지 맵 패턴 히스토그램 분석함으로서 텍스트 영역을 추출하는 방법을 제안한다. 캐니-에지 검출기로 에지를 추출하여 16가지 에지 맵을 생성하고, 에지 맵을 조합하여 문자 특징을 갖는 8가지 문자-에지 맵을 생성한다. 8가지 문자-에지 맵과 16가지 에지 맵을 이용하여 텍스트 후보 영역을 추출하고, 문자-에지 맵의 패턴 히스토그램 및 텍스트 영역의 구조적 특징을 이용하여 텍스트 후보 영역에 대한 검증을 수행하였다. 제안한 방법은 다양한 종류의 자연이미지를 대상으로 실험하였고, 복잡한 배경, 다양한 글꼴, 다양한 텍스트 컬러로 구성된 자연이미지에서 텍스트 영역을 효과적으로 추출하였다.

  • PDF

누적 히스토그램과 랜덤 포레스트를 이용한 머리방향 추정 (Head Pose Estimation with Accumulated Historgram and Random Forest)

  • 문성희;이칠우
    • 스마트미디어저널
    • /
    • 제5권1호
    • /
    • pp.38-43
    • /
    • 2016
  • 스마트 환경 구축이 보편화됨에 따라 사람과 컴퓨터 사이의 상호작용(HCI)에 관한 연구가 활발히 진행되고 있다. 인간-컴퓨터 상호작용에서 사람의 얼굴과 시선 방향을 안다는 것은 그 사람의 의도나 관심의 대상을 파악하는데 중요한 정보를 제공할 뿐만 아니라 신체 구조를 이해하는데도 하나의 기준이 될 수 있으므로 중요한 연구 테마이다. 본 논문에서는 랜덤 포레스트를 이용하여 얼굴 방향을 미리 정해놓은 각도로 분류하는 방법을 제안한다. 먼저 영상은 전처리를 거친 뒤 회전정보를 얻기 위하여 평균 정면 얼굴과의 차영상을 이용하여 회전정보를 추출한다. 캐니에지 검출법을 이용하여 얼굴의 특징을 검출하고 이를 이용하여 에지 영상을 구한 뒤, 이 영상에 대해 가로 세로축 각각에 대해 픽셀 수를 누적하여 히스토그램을 작성한다. 누적히스토그램을 특징으로 랜덤 포레스트를 생성하였으며, 랜덤 포레스트의 학습과 테스트에는 CAS-PEAL-R1 데이터를 사용하여 80.6%의 인식률을 얻었다.

망막 세포 특성에 의한 영상인식에 관한 연구 (A Study on Image Recognition based on the Characteristics of Retinal Cells)

  • 조재현;김도현;김광백
    • 한국정보통신학회논문지
    • /
    • 제11권11호
    • /
    • pp.2143-2149
    • /
    • 2007
  • 최근 시각 장애인을 위한 인공망막 모델 구현에 관한 연구 중 시피질 자극기 기술은 시각 자극 전달의 중간 단계를 생략하고 직접 뇌세포를 자극하는 것이다. 본 논문에서는 망막에서 시각 피질로 시각정보를 전달할 때 발생하는 시각 피질의 특성, 즉 방향성에 대한 반응 특성을 특징 데이터로 구성하여 인식함으로써 인간 시각 정보 처리와 유사한 영상 추출 및 인식 모델을 제안한다. 제안된 방법은 영상의 특징을 추출 한 후 Delta-bar-delta 기반 오류 역전파 알고리즘을 적용하여 영상의 특징들을 인식한다. 제시된 방법의 성능을 분석하기 위하여 다양한 숫자 패턴들을 대상으로 실험한 결과, 제안된 망막 세포로부터 전달된 정보를 방향성에 대한 민감성을 고려하여 영상의 특성을 추출하여 인식하는 모델이 기존의 영상 추출 및 인식 모델보다 인식률에 있어서는 별 차이가 없지만 다양한 실험에서 확인할 수 있듯이 인간 시각과 같이 인식 성능이 민감하지 않는 것을 알 수 있었다.

Detection of LSB Matching Revisited Using Pixel Difference Feature

  • Li, Wenxiang;Zhang, Tao;Zhu, Zhenhao;Zhang, Yan;Ping, Xin
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제7권10호
    • /
    • pp.2514-2526
    • /
    • 2013
  • This paper presents a detection method for least significant bit matching revisited (LSBMR) steganography. Previous research shows that the adjacent pixels of natural images are highly correlated and the value 0 appears most frequently in pixel difference. Considering that the message embedding process of LSBMR steganography has a weighted-smoothing effect on the distribution of pixel difference, the frequency of the occurrence of value 0 in pixel difference changes most significantly whereas other values approximately remain unchanged during message embedding. By analyzing the effect of LSBMR steganography on pixel difference distribution, an equation is deduced to estimate the frequency of difference value 0 using the frequencies of difference values 1 and 2. The sum of the ratio of the estimated value to the actual value as well as the ratio of the frequency of difference value 1 to difference value 0 is used as the steganalytic detector. Experimental results show that the proposed method can effectively detect LSBMR steganography and can outperform previous proposed methods.

Sign Language Translation Using Deep Convolutional Neural Networks

  • Abiyev, Rahib H.;Arslan, Murat;Idoko, John Bush
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권2호
    • /
    • pp.631-653
    • /
    • 2020
  • Sign language is a natural, visually oriented and non-verbal communication channel between people that facilitates communication through facial/bodily expressions, postures and a set of gestures. It is basically used for communication with people who are deaf or hard of hearing. In order to understand such communication quickly and accurately, the design of a successful sign language translation system is considered in this paper. The proposed system includes object detection and classification stages. Firstly, Single Shot Multi Box Detection (SSD) architecture is utilized for hand detection, then a deep learning structure based on the Inception v3 plus Support Vector Machine (SVM) that combines feature extraction and classification stages is proposed to constructively translate the detected hand gestures. A sign language fingerspelling dataset is used for the design of the proposed model. The obtained results and comparative analysis demonstrate the efficiency of using the proposed hybrid structure in sign language translation.

NON-UNIFORMITY CORRECTION- SYSTEM ANALYSIS FOR MULTI-SPECTRAL CAMERA

  • Park Jong-Euk;Kong Jong-Pil;Heo Haeng-Pal;Kim Young Sun;Chang Young Jun
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2005년도 Proceedings of ISRS 2005
    • /
    • pp.478-481
    • /
    • 2005
  • The PMU (Payload Management Unit) is the main subsystem for the management, control and power supply of the MSC (Multi-Spectral Camera) Payload operation. It is the most important function for the electro-optical camera system that performs the Non-Uniformity Correction (NUC) function of the raw imagery data, rearranges the data from the CCD (Charge Coupled Device) detector and output it to the Data Compression and Storage Unit (DCSU). The NUC board in PMU performs it. In this paper, the NUC board system is described in terms of the configuration and the function, the efficiency for non-uniformity correction, and the influence of the data compression upon the peculiar feature of the CCD pixel. The NUC board is an image-processing unit within the PMU that receives video data from the CEV (Camera Electronic Unit) boards via a hotlinkand performs non-uniformity corrections upon the pixels according to commands received from the SBC (Single Board Computer) in the PMU. The lossy compression in DCSU needs the NUC in on-orbit condition.

  • PDF

모바일 환경 응용을 위한 코너 특징점 기반의 회전 객체 검출 (Rotated object recognition based on corner feature points in mobile environment)

  • 김대환;박금춘;김신덕
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2013년도 제48차 하계학술발표논문집 21권2호
    • /
    • pp.23-26
    • /
    • 2013
  • 최근 모바일 장치의 영상 데이터 처리 능력 확대와 더불어 사용자가 요구하는 다양한 영상 데이터의 효율적인 인식 기술 연구가 요구되어지고 있다. 모바일 환경은 고성능 PC 환경과 달리 저사양의 CPU와 메모리를 탑재하고 있어, 영상에서 원하는 객체를 인식하기 위한 기존의 방법론으로는 사용자 요구를 실시간으로 충족하기 어려운 부분이 존재한다. 이에 모바일 환경에 맞는 객체 인식 방법론의 개발이 요구된다. 모바일 환경에서 실시간으로 객체 인식을 하기 위하여, 본 논문에서는 객체 코너 정보를 이용한 Harris corner detector[1]로부터 객체의 특징점을 추출하고, 이를 바탕으로 하여 영상내의 객체 정보 인식 방법을 제안한다. 제안하는 방법에 의해, 입력 영상에서 객체의 코너 정보를 빠르게 추출, 기존 특징점과의 비교를 통하여 영상 내부의 객체 인식을 진행한다. 일반적으로, 회전된 특징점 객체의 정보는 객체의 회전 정도에 따라 코너 픽셀 색상 정보의 변화가 발생하게 된다. 특징점의 색상값은 객체의 회전 정도에 영향을 받아 주변의 픽셀값과 혼합되는 특성이 존재한다. 본 논문에서는 회전 변경된 픽셀 색상값의 영향을 분석하여, 회전된 객체의 특징점 추출 및 객체 검출에 반영하도록 하여, 영상 내부의 회전된 객체 검출의 수행에 효과적으로 이용될 수 있도록 한다. 특징점의 코너 정보를 이용하여 객체를 인식하는 것은, 객체의 인식률은 다소 감소하더라도 모바일 환경에서 계산량의 감소를 통한 실시간 활용이 가능하도록 한다. 이러한 특성은 저성능 CPU와 메모리에서도 회전된 객체의 인식을 수행할 수 있게 하는데 상당히 효과적이다.

  • PDF

Merging Features and Optical-NIR Color Gradient of Early-type Galaxies

  • 김두호;임명신
    • 천문학회보
    • /
    • 제35권2호
    • /
    • pp.41.1-41.1
    • /
    • 2010
  • It has been suggested that merging plays an important role in the formation and the evolution of early-type galaxies. Optical-NIR color gradients of early-type galaxies in high density environments are found to be less steep than those in low density environment, hinting frequent merger activities in early-type galaxies in high density environment. In order to confirm if the flat color gradient is the result of dry merger, we decided to look deeply to find merging features and get their relation with color gradient. We selected samples which show extreme values of optical-NIR color gradients based on the data of previous study, and observed them at Maidanak observatory 1.5m telescope with long exposure. After masking out overlaid sources, our analysis reveals that these galaxies do not have extreme color gradient values. High degree sky flat technique was used during observation to aid discovery of faint, extended features. However, flatness of detector (SNUCAM) was good enough, so we could not see any marked improvement in image quality compared to those using normal sky flats. Additionally we noticed a feature that looks like merging tidal tail in the CFHT archival image, but this does not show up on the image we obtained. This demonstrates that flatness and correct sky estimation is very important when we look for faint merging features. In future we plan to enlarge the number of the sample.

  • PDF