• 제목/요약/키워드: Image Normalization

검색결과 246건 처리시간 0.02초

독립 성분 특징을 적용한 신경망을 이용한 효율적이고 안정적인 손 검출 (Effective and reliable Hand Detection Using Neural Network with ICA features)

  • 이승준;고한석
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2004년도 학술대회 논문집 정보 및 제어부문
    • /
    • pp.367-369
    • /
    • 2004
  • In this paper we propose an effective and reliable hand detection method using neural network with ICA(Independent Component Analysis) Features. Many algorithms of hand detection have been proposed yet. Among them, ICA is the one of the interesting topics in image processing. ICA can not only separate mixed signals but also efficiently extract low-dimensional features in signals. ICA features are able to represent the characteristic of the images well. The object of this paper is to use effectively ICA that has above advantage. That is, by the proper number of Independent component the arithmetic speed is faster and by normalization of ICA feature the performance of detection is more reliable. For this, we adopt the algorithm, the Proportion of variance, which select the ICA feature by comparing the ratio of variance of ICA feature. By this method, we can extract the feature that is good at classifying hand and non-hand. Our experimental results show that by using ICA features, we obtained a better performance in hand detection than by only training NN on the image. And we can use hand detection system effectively and reliably by our proposal.

  • PDF

전처리의 고속화에 기반한 문자 인식 시스템 (Character Recognition System using Fast Preprocessing Method)

  • 공용해
    • 한국멀티미디어학회논문지
    • /
    • 제2권3호
    • /
    • pp.297-307
    • /
    • 1999
  • 다량의 문자가 온라인으로 실시간 입력되는 문자인식시스템에서는 영상의 전처리가 매우 신속하게 이루어 져야 한다. 또한 크기가 작거나 잡음을 포함하는 문자 영상에 대한 기하학적 정규화나 세선화 등의 영상 변환은 원영상의 정보 유실이나 왜곡을 유발하므로 최소화되어야 한다. 이에 따라 본 연구는 원영상을 변환하지 않은 상태에서 신속하게 인식에 효과적인 특정을 구하고자 하였다. 이를 위해 인식의 관점에서 의미를 가지는 윤곽화소를 정의하고 다양한 영상의 변화를 수용하는 효과적인 특징을 윤곽화소로부터 구하였다. 필기체 자모음과 자동차 번호판 숫자 인식 실험 결과, 제안된 방법이 기존의 방법보다 인식에 보다 효과적이었으며 한번의 영상 주사로 전처리를 완료하므로 소요 시간을 크게 줄일 수 있었다.

  • PDF

Tracking and Face Recognition of Multiple People Based on GMM, LKT and PCA

  • Lee, Won-Oh;Park, Young-Ho;Lee, Eui-Chul;Lee, Hee-Kyung;Park, Kang-Ryoung
    • 한국멀티미디어학회논문지
    • /
    • 제15권4호
    • /
    • pp.449-471
    • /
    • 2012
  • In intelligent surveillance systems, it is required to robustly track multiple people. Most of the previous studies adopted a Gaussian mixture model (GMM) for discriminating the object from the background. However, it has a weakness that its performance is affected by illumination variations and shadow regions can be merged with the object. And when two foreground objects overlap, the GMM method cannot correctly discriminate the occluded regions. To overcome these problems, we propose a new method of tracking and identifying multiple people. The proposed research is novel in the following three ways compared to previous research: First, the illuminative variations and shadow regions are reduced by an illumination normalization based on the median and inverse filtering of the L*a*b* image. Second, the multiple occluded and overlapped people are tracked by combining the GMM in the still image and the Lucas-Kanade-Tomasi (LKT) method in successive images. Third, with the proposed human tracking and the existing face detection & recognition methods, the tracked multiple people are successfully identified. The experimental results show that the proposed method could track and recognize multiple people with accuracy.

눈 영역에 적합한 에지 추출과 밝기값 정보를 이용한 눈 검출 (Detection of eye using optimal edge technique and intensity information)

  • 문원호;최연석;김철기;차의영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2010년도 추계학술대회
    • /
    • pp.196-199
    • /
    • 2010
  • 사람의 눈동자는 얼굴 크기와 비교해 볼 때 상대적으로 일정한 거리를 가지고 있기 때문에 이미지 정규화에 있어서 중요한 지표로 사용된다. 이 논문은 이러한 특징을 이용해 최적화된 세그멘테이션 방법을 사용하여 눈동자 검출의 새로운 접근방법을 소개한다. 눈 검출 방법은 세 가지 중요한 단계로 나눌 수 있다. (1)흑백 영상에서 눈 영역에 적합한 에지 추출 방법, (2)레이블링(labeling) 기법을 이용한 눈 영역 추출, (3)밝기값 정보를 이용한 눈동자 위치 검출. 실험 결과로는 다양한 조명 환경과 얼굴표정을 가진 2408장의 FERET 영상을 이용하여 98.9%의 검출 성능을 보였다.

  • PDF

Generic Training Set based Multimanifold Discriminant Learning for Single Sample Face Recognition

  • Dong, Xiwei;Wu, Fei;Jing, Xiao-Yuan
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권1호
    • /
    • pp.368-391
    • /
    • 2018
  • Face recognition (FR) with a single sample per person (SSPP) is common in real-world face recognition applications. In this scenario, it is hard to predict intra-class variations of query samples by gallery samples due to the lack of sufficient training samples. Inspired by the fact that similar faces have similar intra-class variations, we propose a virtual sample generating algorithm called k nearest neighbors based virtual sample generating (kNNVSG) to enrich intra-class variation information for training samples. Furthermore, in order to use the intra-class variation information of the virtual samples generated by kNNVSG algorithm, we propose image set based multimanifold discriminant learning (ISMMDL) algorithm. For ISMMDL algorithm, it learns a projection matrix for each manifold modeled by the local patches of the images of each class, which aims to minimize the margins of intra-manifold and maximize the margins of inter-manifold simultaneously in low-dimensional feature space. Finally, by comprehensively using kNNVSG and ISMMDL algorithms, we propose k nearest neighbor virtual image set based multimanifold discriminant learning (kNNMMDL) approach for single sample face recognition (SSFR) tasks. Experimental results on AR, Multi-PIE and LFW face datasets demonstrate that our approach has promising abilities for SSFR with expression, illumination and disguise variations.

인공위성 화상데이터를 이용한 솔껍질깍지벌레 피해지역의 추출기법에 관한 연구 (A Study on the Extraction of the Matsucoccus Thunbergianae Miller et Park Damaged Area from Satellite Image Data)

  • 안기원;이효성;서두천
    • 한국측량학회지
    • /
    • 제15권2호
    • /
    • pp.287-298
    • /
    • 1997
  • 본 연구에서는 Landsat-5 TM 데이터를 사용하여, 경상남도 남해군 일대를 대상으로 솔껍질깍지벌레 피해지역과 경년변화를 효율적으로 추출할 수 있는 기법을 연구 제시하였다. 또한 피해상황을 파악하여 피해지역의 지형적 상관관계를 규명하고, 피해확산방향을 예측하여, 인공위성 화상데이터가 산림의 병충해 감시에 유용함을 입증함과 아울러, 효과적인 방제를 위한 기초자료를 제공하는데 그 목적이 있다. 연구결과 수치표고화상을 이용한 BRCT (Backwards Radiance Correction Transformation) 기법을 통하여 지형영향으로 인한 그림자지역을 효과적으로 제거함으로서, 피해지역 추출시 그 유효성을 높일 수 있었다 피해지역과 경년변화 화상을 작성, 분석하여 피해 초기에는 남서사면, 경사도 $7-18^\circ$,산지 최고 표고의 50~70%의 위치에서 집중적으로 발생하여 주로 바람방향(북동방향) 피해가 확대됨을 알 수 있었다.

  • PDF

볼륨 데이터를 위한 셀 기반 웨이브릿 압축 기법 (Cell-Based Wavelet Compression Method for Volume Data)

  • 김태영;신영길
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제26권11호
    • /
    • pp.1285-1295
    • /
    • 1999
  • 본 논문은 방대한 크기의 볼륨 데이타를 효율적으로 렌더링하기 위한 셀 기반 웨이브릿 압축 방법을 제시한다. 이 방법은 볼륨을 작은 크기의 셀로 나누고, 셀 단위로 웨이브릿 변환을 한 다음 복원 순서에 따른 런-길이(run-length) 인코딩을 수행하여 높은 압축율과 빠른 복원을 제공한다. 또한 최근 복원 정보를 캐쉬 자료 구조에 효율적으로 저장하여 복원 시간을 단축시키고, 에러 임계치의 정규화로 비정규화된 웨이브릿 압축보다 빠른 속도로 정규화된 압축과 같은 고화질의 이미지를 생성하였다. 본 연구의 성능을 평가하기 위하여 {{}} 해상도의 볼륨 데이타를 압축하여 쉬어-? 분해(shear-warp factorization) 알고리즘에 적용한 결과, 손상이 거의 없는 상태로 약 27:1의 압축율이 얻어졌고, 약 3초의 렌더링 시간이 걸렸다.Abstract This paper presents an efficient cell-based wavelet compression method of large volume data. Volume data is divided into individual cell of {{}} voxels, and then wavelet transform is applied to each cell. The transformed cell is run-length encoded according to the reconstruction order resulting in a fairly good compression ratio and fast reconstruction. A cache structure is used to speed up the process of reconstruction and a threshold normalization scheme is presented to produce a higher quality rendered image. We have combined our compression method with shear-warp factorization, which is an accelerated volume rendering algorithm. Experimental results show the space requirement to be about 27:1 and the rendering time to be about 3 seconds for {{}} data sets while preserving the quality of an image as like as using original data.

교차참조점에 기반한 정지영상의 워터마크 생성 및 유사성 삽입 기법 (A Technique of Watermark Generation and Similarity Embedding for Still Images Based on Cross Reference Points)

  • 이항찬
    • 전기학회논문지
    • /
    • 제56권8호
    • /
    • pp.1484-1490
    • /
    • 2007
  • The Cross Reference Point(CRP) is a robust method for finding salient points in watermarking systems because it is based on the geometrical structure of a normalized image in order to avoid pointing error caused by digital attacks. After normalization of an image, the 100 CRPs are calculated. Next, the 100 blocks centered by CRPS are formed. These 100 blocks are arranged using a secrete key. Each boundary of 50 out of 100 blocks is surrounded by 8 blocks which are selected by the ordered number of a preceding block. This number is a seed of random number generator for selecting 8 out of 50 blocks. The search area of a center block is formed by a secrete key. The pixels of a center block are quantized to 10 levels by predefined thresholds. The watermarks are generated by the 50 quantized center blocks. These watermarks are embedded directly in the remaining 50 blocks. In other words, 50 out of 100 blocks are utilized to generate watermarks and the remaining 50 blocks are used to watermark embedding. Because the watermarks are generated in the given images, we can successfully detect watermarks after several digital attacks. The reason is that the blocks for the generation and detection of watermarks are equally affected by digital attacks except for the case of local distortion such as cropping.

Adaptive Background Modeling Considering Stationary Object and Object Detection Technique based on Multiple Gaussian Distribution

  • Jeong, Jongmyeon;Choi, Jiyun
    • 한국컴퓨터정보학회논문지
    • /
    • 제23권11호
    • /
    • pp.51-57
    • /
    • 2018
  • In this paper, we studied about the extraction of the parameter and implementation of speechreading system to recognize the Korean 8 vowel. Face features are detected by amplifying, reducing the image value and making a comparison between the image value which is represented for various value in various color space. The eyes position, the nose position, the inner boundary of lip, the outer boundary of upper lip and the outer line of the tooth is found to the feature and using the analysis the area of inner lip, the hight and width of inner lip, the outer line length of the tooth rate about a inner mouth area and the distance between the nose and outer boundary of upper lip are used for the parameter. 2400 data are gathered and analyzed. Based on this analysis, the neural net is constructed and the recognition experiments are performed. In the experiment, 5 normal persons were sampled. The observational error between samples was corrected using normalization method. The experiment show very encouraging result about the usefulness of the parameter.

텍스처 기술자들을 이용한 이질적 얼굴 인식 시스템 (Heterogeneous Face Recognition Using Texture feature descriptors)

  • 배한별;이상윤
    • 한국정보전자통신기술학회논문지
    • /
    • 제14권3호
    • /
    • pp.208-214
    • /
    • 2021
  • 최근 많은 지능형 보안 시나리오 및 범죄수사에서는 사진이 아닌 얼굴 영상과 다수의 정면 사진과의 매칭을 요구한다. 기존의 얼굴 인식 시스템은 이러한 요구를 충분히 충족시킬 수 없다. 본 논문에서는 동일 인물의 스케치와 사진 간의 양식 차이를 줄임으로써, 이질적 얼굴 인식 시스템의 성능을 향상시키는 알고리즘을 제안한다. 제안하는 알고리즘은 텍스처 기술자들(그레이 레벨 동시 발생 행렬, 멀티스케일 지역 이진 패턴)을 통하여 영상의 텍스처 특징들을 각각 추출하고, 이를 바탕으로 고유특징 정규화 및 추출기법을 통해 변환 행렬을 생성하게 된다. 이렇게 생성된 벡터들 간 계산된 스코어 값은 스코어 정규화 방식들을 통하여 최종적으로 스케치 영상의 신원을 인식하게 된다.