• 제목/요약/키워드: image feature extraction

검색결과 1,017건 처리시간 0.03초

LDA를 이용한 얼굴인식에서의 Small Sample Size문제 해결을 위한 Resampling 방법 (A Resampling Method for Small Sample Size Problems in Face Recognition using LDA)

  • 오재현;곽노준
    • 대한전자공학회논문지SP
    • /
    • 제46권2호
    • /
    • pp.78-88
    • /
    • 2009
  • 본 논문에서는 LDA를 이용한 얼굴 인식에서 발생하는 small sample size 문제를 해결하기 위한 효율적인 방법인 resampling 방법을 제안한다. 기존에는 regularization method를 사용하여 small sample size 문제를 해결하였는데, 이 방법을 사용하면 클래스내 분산행렬의 특이성을 없앨 수 있지만, 클래스내 분산행렬과 상수를 곱하는 과정에서 상수 값을 임의로 정해 주어야 하고, 이 상수 값에 따라 인식률이 개선되지 않을 수 있다는 문제점이 발생한다. 제안된 resampling 방법을 이용하여 학습 데이터의 수를 늘리면, regularization method보다 개선된 인식률을 얻을 수 있고, 또한 경험적으로 상수 값을 지정해 주는 과정을 거치지 않아도 되는 장점이 있다.

톨이론에 의한 유사도 계산과 퍼지 관계 행렬을 이용한 정합과정의 수행 - 3차원 영상을 중심으로 (Measure of similarity by toll theory and matching using fuzzy relation matrix - focused on 3-dimensional images)

  • 조동욱;한길성;조용환
    • 한국통신학회논문지
    • /
    • 제22권8호
    • /
    • pp.1698-1706
    • /
    • 1997
  • 본 논문은 2차원 정보, 3차원 정보 그리고 그 밖의 각종 유용한 정보를 취합하여 이를 상호 보완하여 인식하는 멀티미디어 시스템 중의 한 부분으로 이중 3차원 정보를 추출하고 정합 하는 방법을 제안하고자 한다. 우선 거리 영상으로부터 z축 기울기를 이용하여 표면 분류를 행하고 법선 벡터들의 교점을 통해 각 표면들에 대한 특징을 추출한다. 또한 각 표면들로 부터 이루는 각이나 거리등과 같은 특징 관계를 설정한다. 이후 정합 과정을 통해 인식을 수행하게 되는데 정합 과정은 영상인식의 최종 단계로 대단히 중요한 과정중의 하나가 된다. 왜냐하면 멀티미디어 시스템은 각종 정보를 취합하여 정합 과정을 수행해야 하기 때문에 취합한 모든 정보를 보다 보편적이고 효율적으로 정합하는 방법론의 제시가 중요하기 때문이다. 따라서 본 논문에서는 정합 과정 수행에 필요한 보편적 방법론의 제안에 초점을 맞추고자 하며 이중 우선 3차원 물체의 정합과정에 대해 다루고자 한다. 이를 위해 롤이론을 적용하여 유사도를 측정하며 이를 퍼지 관계 행렬을 구성하여 인식을 수행한다. 최종적으로 실험에 의해 본 논문의 유용성을 입증하고자 한다.

  • PDF

영상의 색체 강도 엔트로피를 이용한 나비 종 자동 인식 향상 방법 (A Performance Improvement of Automatic Butterfly Identification Method Using Color Intensity Entropy)

  • 강승호;김태희
    • 한국콘텐츠학회논문지
    • /
    • 제17권5호
    • /
    • pp.624-632
    • /
    • 2017
  • 영상을 이용한 나비 종 자동 인식 기법은 생물종 다양성 연구 및 종의 진화, 발달 과정의 연구를 위한 기초 작업을 돕는 것으로 연구자들의 관심이 높다. 기계학습 기반의 나비 종 인식 시스템은 사용하는 특징 추출 방법에 성능이 크게 좌우되는 성질을 가지고 있다. 본 논문은 나비 영상이 가진 색채 강도의 분포를 이용하는 색채 강도 (Color Intensity) 엔트로피를 제안하고 기존에 제시된 가지 길이 유사성 (Branch Length Similarity) 엔트로피와 함께 사용할 경우 10% 이상의 인식률 향상을 얻을 수 있음을 보인다. 제안한 방법의 신뢰성 있는 성능 평가를 위해 영상 인식에 자주 사용되는 대표적인 특징 추출 방법인 아이겐 이미지, 2D 푸리에 변환, 2D 웨이블릿 변환 방법들을 비교 대상으로 다양한 기계학습을 이용해 성능을 평가한다.

FRS-OCC: Face Recognition System for Surveillance Based on Occlusion Invariant Technique

  • Abbas, Qaisar
    • International Journal of Computer Science & Network Security
    • /
    • 제21권8호
    • /
    • pp.288-296
    • /
    • 2021
  • Automated face recognition in a runtime environment is gaining more and more important in the fields of surveillance and urban security. This is a difficult task keeping in mind the constantly volatile image landscape with varying features and attributes. For a system to be beneficial in industrial settings, it is pertinent that its efficiency isn't compromised when running on roads, intersections, and busy streets. However, recognition in such uncontrolled circumstances is a major problem in real-life applications. In this paper, the main problem of face recognition in which full face is not visible (Occlusion). This is a common occurrence as any person can change his features by wearing a scarf, sunglass or by merely growing a mustache or beard. Such types of discrepancies in facial appearance are frequently stumbled upon in an uncontrolled circumstance and possibly will be a reason to the security systems which are based upon face recognition. These types of variations are very common in a real-life environment. It has been analyzed that it has been studied less in literature but now researchers have a major focus on this type of variation. Existing state-of-the-art techniques suffer from several limitations. Most significant amongst them are low level of usability and poor response time in case of any calamity. In this paper, an improved face recognition system is developed to solve the problem of occlusion known as FRS-OCC. To build the FRS-OCC system, the color and texture features are used and then an incremental learning algorithm (Learn++) to select more informative features. Afterward, the trained stack-based autoencoder (SAE) deep learning algorithm is used to recognize a human face. Overall, the FRS-OCC system is used to introduce such algorithms which enhance the response time to guarantee a benchmark quality of service in any situation. To test and evaluate the performance of the proposed FRS-OCC system, the AR face dataset is utilized. On average, the FRS-OCC system is outperformed and achieved SE of 98.82%, SP of 98.49%, AC of 98.76% and AUC of 0.9995 compared to other state-of-the-art methods. The obtained results indicate that the FRS-OCC system can be used in any surveillance application.

개인 정보가 노출된 목표 객체의 블로킹 알고리즘 (A Blocking Algorithm of a Target Object with Exposed Privacy Information)

  • 장석우
    • 한국산학기술학회논문지
    • /
    • 제20권4호
    • /
    • pp.43-49
    • /
    • 2019
  • 초고속의 유무선 인터넷은 다양한 형태의 미디어 데이터를 손쉽게 획득할 수 있는 유용한 창구이다. 이에 반해, 일반인들이 개인 정보가 노출된 대상 객체를 포함하고 있는 미디어 데이터까지도 인터넷을 통해 용이하게 획득할 수 있으므로 사회적으로 문제가 되고 있다. 본 논문에서는 입력되는 여러 가지 종류의 영상으로부터 개인 정보가 노출된 대상 객체를 학습 알고리즘을 이용해 강인하게 검출하고, 검출된 대상 객체 영역을 효과적으로 블로킹하는 방법을 제안한다. 본 논문에서 제안된 방법에서는 먼저 뉴럴 네크워크 기반의 학습 알고리즘을 사용해 영상으로부터 개인 정보를 포함하고 있는 대상 객체만을 검출한다. 그런 다음, 격자형 모자이크를 생성해 이전 단계에서 검출된 대상 객체 영역 위에 오버랩함으로써 개인 정보를 포함하고 있는 객체 영역을 효과적으로 블로킹한다. 실험 결과에서는 제안된 알고리즘이 입력되는 다양한 영상으로부터 개인 정보가 노출된 대상 영역을 강인하게 검출하고, 검출된 영역을 모자이크 처리를 통해 효과적으로 블로킹한다는 것을 보여준다. 본 논문에서 제시된 객체 블로킹 방법은 객체 보안, 물체 추적, 영상 블로킹 등과 같은 컴퓨터 비전과 관련된 여러 응용 분야에서 유용하게 활용될 것으로 예상된다.

다중 애플리케이션 처리를 위한 경량 인공지능 하드웨어 기반 통합 프레임워크 연구 (A Study of Unified Framework with Light Weight Artificial Intelligence Hardware for Broad range of Applications)

  • 전석훈;이재학;한지수;김병수
    • 한국전자통신학회논문지
    • /
    • 제14권5호
    • /
    • pp.969-976
    • /
    • 2019
  • 경량 인공지능 하드웨어는 다양한 문제의 해결을 위해 멀티모달 센서 데이터를 입력받아 특징 선택, 추출, 차원축소, 정규화 과정을 수행한 후 인공지능 엔진으로 예측 결과를 도출한다. 다양한 애플리케이션에서 높은 성능을 달성하기 위해서는 이러한 경량 인공지능 하드웨어의 초 매개변수와 전체적인 전처리 시스템의 구성을 데이터에 맞춰 최적화할 필요가 있다. 본 논문에서는 경량 인공지능 하드웨어의 효율적인 제어 및 최적화를 위한 통합 프레임워크를 제안한다. 제안된 통합 프레임워크는 데이터 전처리 및 뉴로모픽 기반 경량 인공지능 엔진을 유연하게 재구성할 수 있으며, 최적의 모델을 생성할 수 있다. 기능검증을 위해 손글씨 이미지 데이터 세트와 관성 센서 데이터 기반의 낙상 검출 데이터 세트를 사용하였으며, 실험 결과 제안하는 통합 프레임워크가 각각의 데이터 세트에서 90% 이상의 정확도를 갖는 최적의 모델을 생성함을 확인하였다.

2D-MELPP: A two dimensional matrix exponential based extension of locality preserving projections for dimensional reduction

  • Xiong, Zixun;Wan, Minghua;Xue, Rui;Yang, Guowei
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권9호
    • /
    • pp.2991-3007
    • /
    • 2022
  • Two dimensional locality preserving projections (2D-LPP) is an improved algorithm of 2D image to solve the small sample size (SSS) problems which locality preserving projections (LPP) meets. It's able to find the low dimension manifold mapping that not only preserves local information but also detects manifold embedded in original data spaces. However, 2D-LPP is simple and elegant. So, inspired by the comparison experiments between two dimensional linear discriminant analysis (2D-LDA) and linear discriminant analysis (LDA) which indicated that matrix based methods don't always perform better even when training samples are limited, we surmise 2D-LPP may meet the same limitation as 2D-LDA and propose a novel matrix exponential method to enhance the performance of 2D-LPP. 2D-MELPP is equivalent to employing distance diffusion mapping to transform original images into a new space, and margins between labels are broadened, which is beneficial for solving classification problems. Nonetheless, the computational time complexity of 2D-MELPP is extremely high. In this paper, we replace some of matrix multiplications with multiple multiplications to save the memory cost and provide an efficient way for solving 2D-MELPP. We test it on public databases: random 3D data set, ORL, AR face database and Polyu Palmprint database and compare it with other 2D methods like 2D-LDA, 2D-LPP and 1D methods like LPP and exponential locality preserving projections (ELPP), finding it outperforms than others in recognition accuracy. We also compare different dimensions of projection vector and record the cost time on the ORL, AR face database and Polyu Palmprint database. The experiment results above proves that our advanced algorithm has a better performance on 3 independent public databases.

탁구 로봇을 위한 빠른 자세 분류 시스템 개발 (Development of Fast Posture Classification System for Table Tennis Robot)

  • 진성호;권영우;김윤정;박미영;안재훈;강호선;최지욱;이인호
    • 로봇학회논문지
    • /
    • 제17권4호
    • /
    • pp.463-476
    • /
    • 2022
  • In this paper, we propose a table tennis posture classification system using a cooperative robot to develop a table tennis robot that can be trained like a real game. The most ideal table tennis robot would be a robot with a high joint driving speed and a high degree of freedom. Therefore, in this paper, we intend to use a cooperative robot with sufficient degrees of freedom to develop a robot that can be trained like a real game. However, cooperative robots have the disadvantage of slow joint driving speed. These shortcomings are expected to be overcome through quick recognition. Therefore, in this paper, we try to quickly classify the opponent's posture to overcome the slow joint driving speed. To this end, learning about dynamic postures was conducted using image data as input, and finally, three classification models were created and comparative experiments and evaluations were performed on the designated dynamic postures. In conclusion, comparative experimental data demonstrate the highest classification accuracy and fastest classification speed in classification models using MLP (Multi-Layer Perceptron), and thus demonstrate the validity of the proposed algorithm.

스테레오 영상에서 폐색에 강인하고 축소된 파라미터를 갖는 신경망 (Neural network with occlusion-resistant and reduced parameters in stereo images)

  • 이광엽;전영민;정준모
    • 전기전자학회논문지
    • /
    • 제28권1호
    • /
    • pp.65-71
    • /
    • 2024
  • 본 논문은 스테레오 매칭에서 깊이 맵의 정확도를 높이기 위해 폐색 영역의 매칭 오류를 줄이면서 파라메터의 수를 줄일 수 있는 신경망을 제안한다. 이미지를 이용한 상황인식을 보다 정확하게 하기 위해 많은 분야에서 스테레오 매칭기반 객체인식이 활용된다. 복잡한 이미지에 많은 객체가 있을 때 객체간의 겹침과 배경에 의한 가림으로 폐색영역이 발생하여 깊이 맵의 정확도를 낮추게 된다. 이를 해결하기 위해 context 정보를 만들어 cost volume에 결합하거나 폐색영역에 RoI를 만들어 선택하는 기존 연구 방법은 신경망의 복잡도를 높여서 학습의 어려움과 구현에 비용이 많이 들게 된다. 본 논문에서는 cost volume 생성전에 지역적인 특징추출을 보다 강화하는 depthwise seperable 신경망을 만들어 파라메터의 수를 줄이고 폐색 오류에 강인한 신경망을 제안한다. 제안한 신경망은 PSMNet에 비하여 파라메터 수를 30% 줄이면서 페색오류에서 5.3%, 테스트 손실에서 3.6% 개선하였다.

개선된 영상 정보를 이용한 가혹한 환경에서의 후방 차량 감지 방법 (Rear Vehicle Detection Method in Harsh Environment Using Improved Image Information)

  • 정진성;김현태;장영민;조상복
    • 전자공학회논문지
    • /
    • 제54권1호
    • /
    • pp.96-110
    • /
    • 2017
  • 기존의 차량 검출 연구들의 대부분은 일반렌즈 또는 광각렌즈를 가지는 후방 카메라를 사용하기 때문에 사각지대가 넓으며, 영상에 노이즈 및 다양한 외부 환경에 취약한 부분이 있다. 본 논문에서는 사각지대를 줄이고, 노이즈 및 가혹한 외부 환경에서도 인식이 가능한 검출 방법을 제안한다. 먼저 광각렌즈보다 더 넓은 화각을 가진 어안렌즈를 이용해 사각지대를 최소화한다. 렌즈의 화각이 커진 만큼 비선형 방사왜곡도 커지게 되므로, 정확한 영상 결과를 얻기 위해서 왜곡 상수 초기화와 최적화를 실시한 후 Calibration을 이용하였다. 그리고 Calibration과 동시에 원본 영상을 분석하여 안개가 자욱한 상황과 갑작스러운 조도 변화로 인해 생기는 명순응, 암순응 현상에 의한 시야 방해 상황에서도 인식이 가능하도록 안개 제거와 밝기 보정을 이용하였다. 안개 제거는 일반적으로 계산 시간이 매우 크다. 따라서 계산 시간을 줄이기 위해 대표적인 안개 제거 알고리즘인 Dark channel prior를 기반으로 안개를 제거하였다. 밝기 보정 시에는 Gamma correction을 이용했고, 보정에 필요한 Gamma value를 결정하기 위해 영상에 대한 밝기 및 명암 평가가 수행하였다. 평가는 영상의 전체가 아닌 일부분을 이용하여 할애되는 계산시간을 줄였다. 밝기 및 명암 값이 계산되면 그 값을 이용해 Gamma value를 결정하고 전체 영상에 보정을 실시하였다. 그리고 밝기 보정과 안개 제거로 나누어 병렬 처리한 후, 영상을 하나로 정합함으로써 전 처리 과정의 연산시간을 줄였다. 이후 보정된 영상으로부터 특징추출법인 HOG를 이용하여 차량을 검출하였다. 그 결과 본 논문에서 제안하는 방법의 영상 보정을 이용한 차량 검출을 하는데 1프레임당 0.064초가 걸렸으며, 기존의 차량 검출 방법에 비해 7.5%의 향상된 검출률을 얻었다.