DOI QR코드

DOI QR Code

Design of Robust Face Recognition Pattern Classifier Using Interval Type-2 RBF Neural Networks Based on Census Transform Method

Interval Type-2 RBF 신경회로망 기반 CT 기법을 이용한 강인한 얼굴인식 패턴 분류기 설계

  • Jin, Yong-Tak (Dept. of Electrical Engineering, The University of Suwon) ;
  • Oh, Sung-Kwun (Dept. of Electrical Engineering, The University of Suwon)
  • Received : 2014.11.05
  • Accepted : 2015.04.29
  • Published : 2015.05.01

Abstract

This paper is concerned with Interval Type-2 Radial Basis Function Neural Network classifier realized with the aid of Census Transform(CT) and (2D)2LDA methods. CT is considered to improve performance of face recognition in a variety of illumination variations. (2D)2LDA is applied to transform high dimensional image into low-dimensional image which is used as input data to the proposed pattern classifier. Receptive fields in hidden layer are formed as interval type-2 membership function. We use the coefficients of linear polynomial function as the connection weights of the proposed networks, and the coefficients and their ensuing spreads are learned through Conjugate Gradient Method(CGM). Moreover, the parameters such as fuzzification coefficient and the number of input variables are optimized by Artificial Bee Colony(ABC). In order to evaluate the performance of the proposed classifier, Yale B dataset which consists of images obtained under diverse state of illumination environment is applied. We show that the results of the proposed model have much more superb performance and robust characteristic than those reported in the previous studies.

Keywords

1. 서 론

생체 인식은 살아있는 인간의 신체적 또는 행동학적 특징을 자동화된 장치로 측정하여 개인을 식별하는 기술을 의미한다. 생체 인식의 경우는 암기를 할 필요가 없고 본인이 반드시 있어야 하므로 실생활에서 급속도로 보완 대체되고 있다. 생체 인식 중 얼굴인식은 비 접f식으로 사용자의 불쾌감을 덜 느끼게 해주는 장점을 가지고 있다. 정지 영상이나 동영상으로부터 얼굴을 자동으로 인식하는 기술은 영상 처리나 패턴인식, 컴퓨터 비전과 신경망 같은 다양한 분야에 걸-서 활발히 연결되고 있으며, 상업적, 법적으로 수많은 응용분야를 가지고 있다. 이러한 응용 분야는 여권, 신용카드, 주민등록증, 운전면허증, 그리고 범인의 얼굴 사진 등과 같은 제한된 형태의 정지 영상을 이용하는 방법에서부터 동영상 감시 등과 같은 실시간 인식에 이르기까지 그 종류가 매우 다양하다. 얼굴 영상 인식 기술은 일반적으로 주어진 배경의 정지 영상이나 동영상에 대하여 입력 영상 내에 한 명 이상의 사람이 주어진 데이터베이스 내에 존재하는지 확인하는 것으로 정의 할 수 있으며, 탐색 영역을 좁히기 위해서 인종, 나이, 성별 등과 같은 부수적인 정보들이 사용될 수도 있다. 이러한 얼굴 영상 인식 기술은 크게 얼굴 영역의 분리, 얼굴 특징의 추출, 그리고 분류 과정으로 구성된다. 정면 얼굴 영상을 사용하는 인식 이외에 또 다른 방법으로 측면 얼굴 영상을 사용한 얼굴 인식 기술도 생각해 볼 수 있는데, 이러한 방법에서는 전형적으로 측면 얼굴의 기준점간의 거리를 특징으로 사용한다. 측면 얼굴 영상을 사용한 얼굴 인식 방법은 사진 촬영 시에 가해지는 제약조건 때문에 현재까지는 많은 연구가 되지 않았으나, 정면 얼굴 영상을 사용한 방법보다 정확하기 때문에 죄인의 사진들 중에서 범인을 찾는 등의 문제에 주로 이용되었다. 정지 영상을 사용한 얼굴인식 방법은 몇 가지 장단점을 가지고 있는데, 예를 들어 죄인의 사진들 중에서 범인을 찾아내는 문제를 다룰 경우에는 사진촬영 시 가해지는 여러 가지 제약 조건들에 의해서 얼굴의 분리가 다소 쉬워질 수 있으나, 공항처럼 복잡한 배경의 영상에서는 얼굴의 분리가 어렵다. 반면에 카메라로부터 얻어진 동영상에서는, 사람의 움직임을 단서로 해서 보다 쉽게 얼굴을 분리해 낼 수 있을 것이다. 이러한 배경을 분리하는 문제에 대한 연구가 활발히 진행되어져 왔고, 현재에도 얼굴뿐만이 아닌 움직이는 물채도 분리하는 연구가 활발히 진행 중에 있다.

본 논문에서는 CI 기술의 지능형 모델중 하나인 Radial Basis Function(RBF)를 이용한 신경회로망을 이용한다. RBF 은닉층의 활성함수로 범종형 모양의 형태로 이루어진 함수를 총칭하는 말이다. 기존의 신경회로망은 은닉층 활성함수로 시그모이드 함수를 사용하였지만, RBF 신경회로망은 은닉층에 RBF 활성함수를 사용하며, 그 중 가우시안 함수가 대표적이다. 본 논문에서는 활성함수에 가우시안 함수를 사용하며, Type-2 퍼지 집합 개념을 적용하여 Interval Type-2 RBF 신경회로망을 제안하였다. Type-2 퍼지 집합은 Zadeh에 의해 제안되었으며, 두 개의 멤버쉽 함수로 이루어져있다. 멤버쉽함수 사이의 영역을 Footprint Of Uncertain(FOU)이라 하여 불확실한 영역에 대한 정보에 좀 더 효율적으로 다루었다. 기존 Type-1보다 외란이 포함된 입력정보에 대해 좀 더 안정적인 성능을 나타낸다고 알려져 있다 [1-2].

본 논문에서는 Type-2 퍼지집합과 RBF 신경회로망을 결합하였다. 2장에서는 제안된 분류기의 입력으로 사용될 얼굴데이터의 전처리 과정에 대해 설명한다. 전처리 알고리즘으로 조명에 강인한 CT알고리즘과, 차원축소를 목적으로 사용된 대표적인 선형 특징 추출 알고리즘인 (2D)2LDA에 대해 기술한다. 3장에서는 제안한 Interval Type-2 RBF 신경회로망 설계에 대해 기술한다. 제안된 패턴분류기의 전·후반부의 구성 및 파라미터 동정을 위해 사용된 학습알고리즘에 대해 기술한다. 4장에서는 제안된 모델의 성능평가를 Yale B database를 가지고 실험 결과를 비교분석 해본다. 마지막으로 5장에서는 결론으로 요약한다.

 

2. 얼굴데이터 전처리

본 장에서는 취득된 얼굴이미지를 처리하는 단계로 두 가지 알고리즘으로 구성되어 있다. 첫 번째로는 조명변화에 강인한 특징을 추출하기 위해 사용한 CT알고리즘과 두 번째로 얼굴데이터의 전체적인 특징을 추출하기 위해 사용한 (2D)2LDA에 대하여 기술한다.

2.1 Census Transform(CT) 알고리즘

얼굴인식을 수행하는 과정에서 사용하는 특징은 조명에 의한 영향은 고려하지 않고, 인식하려는 객체의 반사성질에 의한 영향만을 고려된 특징이 가장 이상적이라고 할 수 있다. 그러나 영상에서 객체의 밝기값 I(X)은 조명에 의한 값, L(X)과 객체가 반사하는 성질에 의한 값, R(X)의 곱으로 정의된다. 또 영상을 취득할 때 카메라의 Gaim (g)과 바이어스 값, b도 밝기 값, I(X)에 영향을 준다. 따라서 밝기값, I(X)는 다음과 같이 정의될 수 있다[3-4].

여기서, X는 각 픽셀의 위치 (x,y)를 나타낸다. 식(1)에 의해 조명 L(X)에 대한 어떤 가정이나 지식 없이 R(X)을 구하는 것은 불가능하다. 본 논문에서는 영상의 특징으로 R(X)만을 이용하기 위해 매우 작은 크기의 윈도우내에서 L(X)의 값은 변하지 않는다는 가정을 사용하여 지역적 구조특징이 R(X)에 의한 영향만을 받는다는 가정을 하였다. 이것은 다음에 설명할 CT에 의한 변환이 조명 L(X)에 의한 영향은 받지 않고, 오직 객체의 반사성질 R(X)만을 반영한다는 것을 의미한다. 따라서 CT변환에 의한 객체의 구조를 나타내는 윈도우내의 밝기 값 순서는 조명이 변화하여도 변하지 않는다.

Census Transform은 비 변수화적인 지역 변환으로 중심 픽셀을 기준으로 일정 크기의 윈도우 내에서 주변 픽셀과의 밝기 값의 크기를 비교하는 방법이다. 변환의 결과 값으로 비트 스트링을 얻게 된다. 여기서 주변 픽셀의 범위는 지역적 구조특징이 R(X)에 의한 영향만을 받는다고 가정하기 위해 3×3크기의 윈도우를 사용하였다. CT는 다음과 같은 식에 의해 정의 될 수 있다.

여기서, X는 각 픽셀의 위치 (x,y)를 나타내고, N(X)은 X를 중심으로 3×3크기를 갖는 윈도우 내의 주변 픽셀들의 밝기 값 집합이다. 또한, I(X)는 윈도우의 중심픽셀의 밝기값을 의미하고, I(Y)는 주변픽셀의 밝기값을 의미한다. 위 식에 의해 I(X) < I(Y) 면 1, 아니면 0으로 구조특징의 값을 정의하게 된다. ⊗는 연결연산자로써 윈도우내의 주변 픽셀들의 구조특징 값을 연결해주는 연산자라고 정의한다. 중심 픽셀 밝기 값의 최대 28까지 표현이 되고 CT알고리즘을 통해 얻어진 값은 중심 밝기 값으로 대체가 된다. 그림 1은 CT알고리즘의 연산 과정을 보여준다.

그림 13×3 Census Transform Fig. 1 Example of 3×3 Census Transform

2.2 선형 특징 추출 기법을 이용한 얼굴데이터 차원 축소

본 절에서는 제안한 Interval Type-2 RBF 신경회로망에서 전처리 부분으로 구성된 (2D)2LDA에 대해 소개한다. 기존 LDA에서 확장된 알고리즘으로 얼굴데이터의 차원축소를 위해 사용한다.

2.2.1 Linear Discrininant Analysis(LDA) 알고리즘

선형판별분석(Linear Discrininant Analysis)은 PCA와 더불어 대표적인 특징 벡터 축소 기법 중의 하나이다. LDA를 간단히 정의하면 클래스 간 분산(Between-class Scatter)과 클래스 내 분산(Within-class Scatter)의 비율을 최대화하는 방식으로 데이터에 대한 특징 벡터의 차원을 축소하는 방법이다. PCA 방법은 어떤 집단의 특성을 잘 축약해서 표현하는 데는 유용하지만 집단간을 잘 분리해서 나타내는 데는 취약하다. 얼굴인식에 있어서 얼굴 영상을 잘 축약해서 표현하는 것도 중요하지만 더욱 중요한 것은 서로 다른 개인의 얼굴을 잘 분리해서 표현하는 것이다. 따라서 영상의 변화가 각 얼굴 자체의 변화 때문인지 구분을 할 수 없다. LDA 방법은 바로 이런 개인의 변화와 그 밖의 다른 요인에 의한 변화를 구분할 수 있도록 해준다. LDA 알고리즘은 다음과 같다[5].

[단계 1] 표본 x, y의 평균 벡터를 각각 μ1, μ2라고 하면 사영된 데이터들의 중심 간의 거리를 목적함수로 선택하면 식 (3)과 같다

식 (2.5)의 을 사영 표본의 클래스 내 분산이라고 하면 동일한 클래스의 표본들은 인접하게 사영을 취하고, 동시에 클래스간의 사영은 중심이 가능한 멀리 떨어지게 하는 W를 찾는 것이 목적이다.

[단계 2] 클래스 각각의 분산은 S1, S2로 놓고 S1 + S2 = SW라고 할 때, 사영분산은 식 (4)과 같이 분산 행렬이 포함된 함수로 표현되어 질 수 있다.

마찬가지로 은 식 (6)와 같이 표현할 수 있다.

이때, 행렬 SB를 클래스 간 분산이라 부르며, 두 벡터간의 외적이므로 이 행렬의 랭크(rank)는 1이 된다.

[단계 3] 최종적인 Fisher의 목적함수를 SW와SB항으로 식 (7)과 같이 간략히 정의할 수 있다.

여기서, [단계 3]의 목적함수를 최대로 하는 변환행렬 W를 찾아내는 문제는 최대화 정리, 일반화된 고유 값 문제의 해법을 이용한다.

단계 4] 최대화 정리에 의하여 분자를 클래스 간 평균의 차인 상수로 취급하면, 다음과 같은 최적화된 변환행렬 W*를 구할 수 있다. 식 (8)을 Fisher's Linear Discriminant라고 한다.

2.2.2 2-Directional 2-Dimensional LDA((2D)2LDA) 알고리즘

(2D)2은 2-Directional 2-Dimensional 의 약자로 2-방향 2-차원이라는 뜻을 가지고 있다. 얼굴 인식을 하기 위해 입력받은 이미지는 2차원 픽셀 값을 가지고 있다. (2D)2LDA는 입력받은 2차원 이미지를 1차원 변환 없이 횡과 열 두 방향 그대로 차원 축소하는 것을 의미한다. 이는 공분산의 크기를 감소시키기 때문에 컴퓨팅 시간을 줄여주고, 이미지를 1차원으로 변환하지 않기 때문에 이미지 고유의 정보를 유지 할 수 있는 특징이 있다. 다음은 (2D)2LDA 알고리즘은 다음과 같다[6].

[단계 1] 학습이미지 A를 각 클래스 라벨에 따라 M개의 클래스로 나누어 평균 mk를 구함.

여기서 Nk는 클래스 Ck의 데이터 수, 행렬

[단계 2] RSb(Between Class의 Covariance Matrix)

Between Class의 Covariance Matrix를 구하기 위해서 각 Class의 평균에서 학습이미지의 전체 평균(m)을 차감.

[단계 3] RSw(Within Class의 Covariance Matrix)

Within Class의 Covariance Matrix를 구하기 위해서 학습 이미지에서 각 Class의 평균을 차감.

[단계 4] 이미지의 인식을 위한 고유치 분석을 통해 의 고유치행렬 과 고유벡터행렬 를 선택.

[단계 5] 단계 8에서 구한 고유 값 에 대해 고유 값이 큰 순서대로 d개의 고유치 를 선택, 선택한 고유 값의 대응되는 고유벡터를 가지는 변환행렬 을 생성.

[단계 6] LSb(Between Class의 Covariance Matrix)

[단계 7] LSw(Within Class의 Covariance Matrix)

[단계 8]

[단계 9] 단계4에서 구한 고유값 고유 값이 큰 순서대로 d개의 고유치 를 선택, 선택한 고유 값에 대응되는 고유벡터를 가지는 변환행렬 을 생성.

[단계 10] d만큼 차원을 줄인 고유벡터 와 를 가지고 실제 인식을 하기 위한 전체 이미지를 얻는 방법은 식(16)와 같다.

 

3. Interval Type-2 RBF 신경회로망 패턴 분류기 설계

본 장에서는 Type-2 퍼지 집합과 RBF 신경회로망을 결합한 Interval Type-2 RBF 신경회로망을 설명한다.

3.1 Interval Type-2 RBF 신경회로망 구조

제안된 모델의 구조는 기존의 RBF 신경회로망처럼 크게는 입력층, 은닉층, 출력층 세 개의 층으로 구분 할 수 있다. 좀 더 세분화시키면 은닉층에 Karnik and Mendel(KM)이 적용된 층이 하나 더 추가된 네 개의 층으로 구분할 수 있다. KM알고리즘은 Type reduction 역할을 수행하는 알고리즘으로 출력형태를 Type-2에서 Type-1으로 바꿔준다. Interval Type-2 RBF 신경회로망 구조는 그림 2와 같다[7-8].

그림 2Interval Type-2 RBF 신경회로망 구조 Fig. 2 Architecture of Interval Type-2 RBF Neural Network

입력층의 구조는 기존의 RBF 신경회로망과 동일하다. 전체 입력이 은닉층 각 노드에 입력으로 들어가며, 은닉층 중심점 및 분포상수는 입력변수에 의해 결정된다. 분포상수는 입력변수의 표준편차를 사용한다. 활섬함수는 Type-2 퍼지집합을 사용하며, 그림 3과 같은 가우시안 형태의 활성함수를 사용한다.

그림 3Type-2 가우시안 활성함수 Fig. 3 Type-2 Gaussian Receptive Field

일반적으로 분포상수만을 중심으로 학습하는 모델을 구성하는 방법과 중심점만을 중심으로 학습하는 모델을 구성하는 방법이 있지만 본 논문에서는 퍼지화 계수를 조절하여 FOU영역을 결정하였다. 연결가중치는 1차 선형으로 구성하였으며, yl과 yr을 나누어 식(17)~식(18)과 같이 표현한다.

여기서, j(j=1,…,h)는 은닉층 노드의 수를 나타내며, i(i=1,…,k)는 입력변수의 수를 나타낸다. 와 연결가중치의 파라미터 계수를 나타내며, 와 는 yl과 yr사이의 파라미터 계수의 간격을 나타낸다. 다시 말해, 와 에 식 (19)의 연결가중치가 식(17)~식(18)과 같이 나누어진 것이다.

기존 RBF 신경회로망에서 연결가중치의 파라미터 계수는 최소자승법(LSE)을 사용하여 구하지만 Type-2 퍼지 집합이 적용된 모델은 최소자승법 사용이 불가능하다. 그래서 Back-Propagation(BP) 방법을 사용하여 파라미터 계수를 구해야하며, 이 때 파라미터 계수의 초기값 설정이 매우 중요하다. 일반적으로 초기 파라미터 계수는 임의의 범위 안에서 랜덤하게 생성되는 방법을 사용하나 제안된 모델의 파라미터 계수는 기존의 RBF 신경회로망에서 구한 연결가중치를 가져와서 초기값으로 설정한 후 BP로 한번 더 학습시킨다. 이러한 방법은 초기값을 랜덤하게 생성하는 방법보다 BP의 학습 횟수를 단축시키는 장점이 있다. 학습 횟수를 줄임으로써 모델의 연산시간을 단축시킬 수 있다[9].

3.1.1 Karnik and Mendel(KM) 알고리즘

적합도와 연결가중치를 가지고 최종 모델의 출력을 구해야 한다. KM알고리즘을 이용하여 Type-2를 Type-1으로 바꿔주는 Type Reduction 역할을 한다. KM 알고리즘의 연산과정은 다음과 같이 yl과 yr로 나누어 설명 할 수 있다.

I) yl을 구하기 위한 KM알고리즘

[단계 1] 먼저 을 오름차순으로 정렬한다. 정렬된 인덱스 번호를 기준으로 Upper와 Lower적합도로 다시 정렬한다.

[단계 2] 정렬된 Upper와 Lower 적합도의 평균을 이용하여 Type-1 형태의 적합도로 환산한다.

그리고 환산된 적합도 wj와 을 이용하여 출력 yl′을 계산한다.

[단계 3] 다음 식을 만족하는 스위칭 포인트 p(1 ≤ p ≤ h-1)를 찾는다.

[단계 4] 스위칭 포인트를 기준으로 Upper 와 Lower 의 적합도 위치를 서로 바꾼다.

식 (23)의 적합도를 가지고 한 번 더 출력을 구하며 이때의 출력은 yl″으로 놓는다.

[단계 5] 식(21)과 식(24)이 같으면, yl″이 최종출력이 되고 알고리즘을 종료한다. 그렇지 않으면, 단계 6으로 이동한다.

[단계 6] yl′ = yl″ 을 놓고 단계3 으로 이동하여 알고리즘을 반복 수행한다.

Ⅱ) yr을 구하기 위한 KM알고리즘

[단계 1] 먼저 을 오름차순으로 정렬한다. 정렬된 인덱스 번호를 기준으로 Upper와 Lower 적합도로 다시 정렬한다.

[단계 2] 정렬된 Upper와 Lower 적합도의 평균을 이용하여 Type-1 형태의 적합도로 환산한다.

그리고 환산된 적합도 wj와 을 이용하여 출력 yl′을 계산한다.

[단계 3] 다음 식을 만족하는 스위칭 포인트 p(1 ≤ p ≤h-1)를 찾는다.

[단계 4] 스위칭 포인트를 기준으로 Upper와 Lower의 적합도 위치를 서로 바꾼다.

식 (28)의 적합도를 가지고 한 번 더 출력을 구하며 이때의 출력은 yl″으로 놓는다.

[단계 5] 식(26)과 식(29)이 같으면, yr″이 최종출력이 되고 알고리즘을 종료한다. 그렇지 않으면, 단계 6으로 이동한다.

[단계 6] yr′ = yr″을 놓고 단계3 으로 이동하여 알고리즘을 반복 수행한다.

KM 알고리즘으로 최종 출력 yl, yr 을 구했으면 출력 층에서 이 두 출력의 평균을 모델의 최종 출력으로 결정한다. 기존의 RBF 신경회로망 출력층에서 합계로 모델의 최종출력을 구하지만 제안된 모델은 평균을 이용하여 구한다는 차이점이 있다.

3.2 Interval Type-2 RBF 신경회로망 학습

제안된 모델의 학습은 전반부 학습과 후반부 학습으로 나눌 수 있다. 전반부 학습은 초기 파라미터를 설정하는 부분에 해당하며, 후반부 학습은 파라미터 학습 과정에 해당한다[10].

3.2.1 전반부 학습

은닉층 활성함수의 중심점 및 분포상수의 초기값을 설정해주어야 한다. 활성함수의 중심점과 분포상수를 설정 방법은 min-max 방법, k-means 클러스터링 방법이 있으며, 은닉층을 Fuzzy C-means(FCM)로 대신하여 중심점 및 분포상수를 구하지 않고 바로 활성함수의 적합도를 구하는 FCM 클러스터링 방법이 있다. 본 논문에서는 FCM 클러스터링을 이용하여 전반부를 학습하였다.

3.2.1.1 Fuzzy C-means 알고리즘

FCM 클러스터링 알고리즘도 K-means처럼 데이터의 유사성을 바탕으로 소속정도를 결정하는 알고리즘이다. 하지만 K-means와는 다르게 소속정도가 0과 1사이의 퍼지수를 갖게 된다. FCM 알고리즘의 특징은 중심점을 찾아 활성함수에 적용하지 않고, 각 데이터의 소속정도를 표현한 소속행렬을 바로 활성함수의 적합도로 사용할 수 있다. 다시 말해 은닉층 자체가 FCM 알고리즘이 된다. 알고리즘 순서는 다음과 같다.

[단계 1] 클러스터의 개수, 퍼지화 계수를 선택하고 소속 함수 L(0)를 초기화 한다.

[단계 2] 각 클러스터에 대한 중심 벡터를 구한다.

[단계 3] 중심과 데이터와의 거리를 계산, 새로운 소속함수 U(1)계산

[단계 4] 오차가 허용범위 안에 도달하면 종료하고, 그렇지 않으면 단계 2로 돌아간다.

3.2.2 후반부 학습

후반부 학습은 Back-Propagation(BP)을 이용하여 연결가중치를 학습시키는 부분에 해당한다. 기존에는 경사 하강법(Gradient Descent Method; GDM)을 사용하여 파라미터를 학습시켰지만 제안된 모델에서는 Conjugate Gradient Method(CGM)를 사용하여 학습시킨다. CGM는 경사하강법 보다 빠른 학습시간을 갖는 장점이 있다.

BP는 실제출력 y와 모델의 최종출력 의 오차를 줄이도록 파라미터를 조절하는 학습방법이다. 이 때 오차를 줄이기 위한 식 (36)을 미분하는 방법을 사용한다. 학습을 통한 새로운 파라미터는 식(37)~식(38)와 같다.

여기서, a는 파라미터 계수. s는 연결가중치의 구간 값을 결정하며, 연결가중치와 마찬가지로 학습이 가능하다. D(t)는 방향벡터라 하며, CGM이 적용되어 다음과 식(39)을 사용한다.

여기서, β(t)가 0이면 기존의 경사하강법과 동일한 방법이 된다. CGM과 경사하강법의 차이는 β(t)D(t-1)부분에 있다. D(t-1)는 이전 세대의 방향 벡터를 나타내며, β(t)는 이전 세대의 경사벡터 G(t-1)와 현제 세대의 경사벡터 G(t)을 이용하여 구한다. β(t)을 구하는 방법은 식(40)를 이용하였다.

β(t)가 1을 넘어가면 방향벡터의 값이 커져 결국 성능이 발산하는 경우가 발생한다. 따라서 제안된 모델에서는 β(t)>1이면 강제로 β(t)=1으로 바꿔준다. β(t)가 0이 됨에 따라 방향벡터는 경사 하강법으로 바뀐다. 결론적으로 β(t)의 값에 따라 경사하강법과 CGM을 병행하여 사용함으로써 성능개선 및 안정성을 향상시켰다.

3.3 ABC(Artificial Bee Colony)를 이용한 패턴분류기 최적화

제안된 모델에서는 FCM 알고리즘을 사용하여, 은닉층 자체가 FCM 알고리즘이 된다. 따라서 BP 학습을 통해 활성함수의 중심점 및 분포상수를 학습할 필요가 없다. 하지만 FCM 알고리즘에서 퍼지화 계수를 조절하여 목적함수의 중심점 및 분포상수를 조절할 수 있다. 이는 BP학습으로는 불가능하여 최적화 알고리즘으로 퍼지화 계수를 최적화 시켰다[11-12].

본 논문에서는 2005년 Karaboga에 의해 소개된 꿀벌 집단의 먹이를 수집하는 행동양식에서 아이디어를 얻은 Artificial Bee Colony(ABC) 최적화 알고리즘을 사용하였다. 일 벌, 탐색 벌, 스카우트 벌로 구성된 세 개의 연산자를 사용하여 탐색을 수행한다. 일벌은 탐색공간 내에서 전역탐색을 수행하며, 탐색벌은 적합도가 우수한 해의 위치에서 보다 많은 탐색을 수행하는 지역탐색의 역할에 비중을 두고 있다. 스카우트 벌의 경우 세대를 거쳐 적합도가 가장 낮은 해를 찾아 제거하고 새로운 해를 생성하여 보다 우수한 해를 저장하는 역할을 한다. 알고리즘 순서는 다음과 같다.

[단계 1] 초기 파라미터 설정 및 탐색공간 내에서 임의의 지역해를 생성

[단계 2] 식 (24)을 이용하여 일 벌을 s개 생성하고 목적함수 평가 및 적합도 생성

여기서, Φ는 [-1 1]의 랜덤상수이며, i와 k는 개체의 번호를 나타내고, i≠k를 만족한다.

[단계 3] 식 (44)을 이용하여 적합도를 [0, 1] 사이의 확률 값으로 변환

여기서, i와 j는 개체의 수를 나타낸다.

[단계 4] 위의 식과 확률값 pi를 이용하여 정찰 벌을 s개 생성하고 목적함수를 평가

[단계 5] 스카우트 벌을 통해 제한 조건을 만족하는 해를 판별. 만약 조건을 만족하는 해는 제거되고 새로운 해를 임의로 생성.

[단계 6] 종료조건을 만족할 때까지 [단계 2] ~ [단계 5]를 반복 수행

 

4. 시뮬레이션 및 결과고찰

조명 변화에 대한 얼굴인식 성능을 평가하기 위해 본 논문에서는 Yale B 데이터베이스를 이용하였다. Yale B 데이터베이스는 구성원당 64장씩 38명의 영상으로 구성되어 있다. 구성된 데이터는 총 3가지의 실험을 하였다. 첫 번째로 분류된 Case 별로 데이터를 분할하여 실험한 경우와 두 번째로는 Case 1만을 학습하고 나머지를 테스트로 고정시켜 실험한 경우, 마지막으로 Case 1과 Case 2를 합하여 학습하고 나머지 Case를 실험한 경우이다. 표 1은 데이터베이스를 조명의 방향과 카메라 축사이의 각도에 따라 4가지로 분류한 기준을 나타내고, 표 2∼4는 각 실험별로 사용한 데이터의 수를 나타낸다.

표 1Yale B 데이터베이스 Table 1 Yale B database

그림 4조명 변화에 따른 실험데이터 재구성 Fig. 4 Reconfiguration of experimental data according to illumination changes.

표 2실험 1의 사용된 데이터 Table 2 Used data of experiment 1

표 3실험 2의 사용된 데이터 Table 3 Used data of experiment 2

표 4실험 3의 사용된 데이터 Table 4 Used data of experiment 3

Yale B 데이터베이스의 사진 크기는 192×168로 구성되어 있다. 입력 받은 전체 데이터는 Case별로 각각 따로 실험을 수행하였다. 최적의 모델을 구축하기 위해 Case별 데이터를 각각 3-split(Training, Validation, Testing)으로 분할하였다. 분할된 데이터는 TR:VA:TE=5:3:2의 비율로 설정하였다. 이는 이전의 많은 실험을 통해서 얻은 비율로써 가장 데이터 구조를 보였기 때문이다. 실험 2와 3같은 경우는 Testing 데이터를 고정하였기 때문에 Training 및 Validation의 비율을 6:4로 맞추었다. 3-split의 장점은 오버피팅이 발생하지 않기 때문에 최적화 알고리즘을 통한 최적의 모델을 구축할 수 있게 만들어준다. 또한 근사 모델의 정확도 평가방법으로 5-FCV(Fold Cross Validation)을 사용하였다. FCV는 수집된 샘플들의 검증을 위한 통계적인 분석 방법으로, 전체적으로 특이한 집합이 없는지 확인하는 방식이다. 그림 5는 전체 데이터를 입력받았을 때 처리되는 데이터 수행 절차를 도식화 하였다.

그림 5전체적인 데이터 수행절차 Fig. 5 The overall data procedures

제안된 알고리즘의 우수성을 입증하기 위해 적용된 모델은 총 4개로 세분화 할 수 있으며 표 5와 같다. 4가지 모델의 은닉층은 Fuzzy C-means Clustering으로 구성하였다.

표 5실험에 사용된 모델의 종류 Table 5 Model type to be used experiment

표 6은 후반부 연결가중치 학습을 위해 사용된 BP와 전반부 퍼지화 계수를 동정하기 위해 사용된 ABC알고리즘의 초기 파라미터 설정 값을 나타낸다.

표 6학습 알고리즘의 초기 파라미터 설정값 Table 6 Initial parameters of learning algorithms

연결가중치는 Linear로 설정하였고, FCM의 클러스터수는 6개로 고정하여 실험하였다. 초기 연결가중치의 파라미터 설정값은 매우 중요하다. 일반적으로 초기 파라미터 계수는 임의의 범위안에서 랜덤하게 생성되는 방법을 사용하나 제안된 모델의 파라미터 계수는 기존의 Type-1 RBFNN에서 구한 연결가중치를 가져와서 초기값으로 설정한 후 BP로 한번 더 학습시킨다. 이러한 방법은 초기값을 랜덤하게 생성하는 방법보다 BP의 학습 횟수를 단축시키는 장점이 있다. 학습 횟수를 줄임으로써 모델의 컴퓨팅 시간을 단축시킬 수 있다.

또한 학습률은 heuristic rules을 사용하여 학습 횟수마다 변화 시켰다. 성능지수가 감소하면 학습률을 10% 증가시키고, 성능지수가 증가하면 학습률을 10% 감소시키는 방법을 사용하여 조절하였다. 그림 6은 최적의 모델을 위해 사용한 ABC 알고리즘의 파라미터 탐색 범위를 나타낸다.

그림 6ABC알고리즘의 개체구조 Fig. 6 Structure of particle of ABC

최적화 파라미터는 Type-1과 Type-2가 다르다. Type-1은 하나의 적합도만을 구하기 때문에 하나의 퍼지화계수만 필요하지만, Type-2는 하위 적합도와 상위 적합도를 구해야 하기 때문에 탐색파라미터가 하나 더 추가되었다. 또한 제안된 패턴분류기의 입력의 수는 성능에 많은 영향을 미친다. 정해진 입력의 수가 아닌 (2D)2LDA 알고리즘의 특징을 살려 횡과 열의 입력 벡터의 수를 최적화 하였다. 이는 최적의 입력 조합을 찾을 수 있기 때문에 불필요한 컴퓨팅 시간을 줄여주고, 좀 더 나은 성능을 얻을 수 있기 때문이다.

실험은 총 3가지 단계로 구성하였다. 첫 번째는 각 Case 별로 Training, Validation, Testing으로 나누어 실험하였고, 두 번째는 Case 1 데이터를 Training, Validation으로 나누고 나머지 Case 2~4를 Testing 하였다. 마지막으로는 Case 1과 Case 2를 합하여 Training, Validation으로 나누고 Case 3 및 Case 4를 Testing하였다.

표 7실험 1의 인식성능 결과 Table 7 Recognition performance result of experiment 1 (a) Model 1 : Type-1 RBFNN Without CT

위의 실험 결과를 통해서 얻은 결론은 CT알고리즘의 효율성이다. 이미지가 어두워질수록 CT알고리즘을 통한 성능이 월등히 우수함을 보였다. 뿐만 아니라 Type-1 성능보다 외란에 강인한 특성을 가진 Type-2의 성능이 미세하지만 전체적으로 우수한 성능을 보였다. 표 5는 모델에 따른 Testing 실험 결과를 나타내었다.

위 실험을 통해서 조도가 낮은 영상일수록 CT알고리즘으로 학습 한 경우 더 높은 인식성능을 확인할 수 있었다. 또한 외란에 강인한 특성을 가진 Type-2 모델이 Type-1 모델보다 미세하지만 대체적으로 우수한 인식 성능을 보였다.

실험1의 결과와 Testing 성능만 비교해 보면 확실히 떨어지는 것을 확인할 수 있었다. 조도가 낮은 영상이 학습되지 않았기 때문에 얻을 수 있는 결과이다. 표 8의 결과와는 다르게 조도가 낮은 영상일수록 성능이 떨어지는 것이 차이이다. 너무 밝은 영상만을 학습한 경우 인식성능이 너무 떨어지는 것을 볼 수 있었기 때문에 다음실험에서는 위와 같은 결과를 보안하고자 Case2도 같이 학습을 수행하고 실험을 하였다.

표 8실험 1의 따른 테스트 인식성능 결과 Table 8 Comparison of experimental results of testing data according to experimental 1.

표 9실험 2의 인식성능 결과 Table 9 Recognition performance result of experiment 2

표 10은 마지막 실험 결과를 보여준다. 실험 1 인식성능보다는 떨어지지만 실험 2와는 다르게 Testing 성능이 많이 개선된 점을 볼 수 있다. 실험 1∼3의 인식성능을 비교 분석한 결과 CT 알고리즘은 조도가 낮은 영상을 학습 할수록 높은 성능을 보이며, 외란에 강인한 특성을 가진 Type-2 모델의 인식 성능이 Type-1 모델의 인식성능 보다 전체적으로 우수함을 보였다.

표 10실험3의 인식성능 결과 Table 10 Recognition performance result of experiment 3

 

5. 결 론

본 논문에서는 Interval Type-2 RBF 신경회로망 기반 CT 기법을 이용한 강인한 얼굴인식 패턴 분류기 설계하였다. 입력받은 데이터는 CT알고리즘을 이용하여 조명변화에 강인한 이미지 처리를 하여 인식 성능을 향상시켰고, (2D)2LDA를 이용하여 횡과 열의 특징을 각각 추출하였다. 추출된 특징을 입력으로 Type-2 퍼지집합을 접목시킨 Interval Type-2 RBF 신경회로망을 제안하였다. 제안된 분류기의 은닉층은 기존의 가우시한 함수에서 FCM으로 대체 하여 소속행렬을 적합도로 사용하였고, 연결가중치는 1차 선형식으로 구성하였다. 연결가중치의 파라미터 계수는 BP로 학습하였고, 초기 파라미터 설정은 기존의 Type-1에서 구한 연결가중치를 초기 파라미터로 설정하였다. Type-1의 연결가중치를 바로 사용하기 때문에 BP의 학습 횟수를 많이 줄일 수 있었다. 또한 최적화 알고리즘을 이용해 FCM의 퍼지화 계수, 그리고 횡과 열의 입력의 수를 최적화하였다. 입력의 수는 인식 성능의 가장 큰 영향을 미치기 때문에 횡과 열의 입력 다양한 입력조합을 통해서 최적의 입력을 수를 찾을 수 있었다. 제안된 분류기의 성능평가를 위해서 사용된 데이터는 Yale B database를 사용하였다. 조명변화에 따라 4가지 Case로 분류하였고, Case가 커질수록 조도가 낮은 영상이다. 총 3가지의 실험 결과를 통해 Type-1 모델과 Type-2모델의 성능을 비교 분석하였고, 전처리 알고리즘으로 CT 알고리즘을 이용한 데이터와 이용하지 않은 데이터로 분류하여 실험하였다. 실험 1을 통해 조도가 낮은 영상을 학습할수록 CT 알고리즘의 효율성을 확인할 수 있었다. 실험 2의 결과를 보면 전체적으로 Type-1모델의 성능보다 외란에 강인한 특성을 가진 Type-2모델의 성능이 전체적으로 우수함을 확인할 수 있었다. 마지막으로 실험 3을 통해 조도가 낮은 영상의 인식 성능을 높임으로써 제안된 Type-2 RBF 신경회로망을 통한 얼굴인식 시스템 구현으로의 응용 가능성을 확인하였다.

References

  1. C. Zhou, L. Wang, Q. Zhang, X. Wei "Face recognition based on PCA image reconstruction and LDA" International Journal for Light and Electron Optics, Vol 124, Issue 22, pp 5599-5603, November 2013 https://doi.org/10.1016/j.ijleo.2013.04.108
  2. A. Chakrabarty, H. Jain, A. Chatterjee "Volterra kernel based face recognition using artificial bee colony optimization" Engineering Applications of Artificial Intelligence, Vol 26, Issue 3, pp 1107-1114, March 2013 https://doi.org/10.1016/j.engappai.2012.09.015
  3. T. Chakraborti, A. Chatterjee "A novel binary adaptive weight GSA based feature selection for face recognition using local gradient patterns, modified census transform, and local binary patterns" Engineering Applications of Artificial Intelligence, Vol 33, pp 80-90, August 2014 https://doi.org/10.1016/j.engappai.2014.04.006
  4. S. Perri, P. Corsonello, G. Cocorullo "Adaptive Census Transform: A novel hardware-oriented stereovision algorithm" Computer Vision and Image Understanding, Vol 117, Issue 1, pp 29-41, January 2013 https://doi.org/10.1016/j.cviu.2012.10.003
  5. S. K. Oh, S. H. Yoo, W. Pedrycz, "Design of face recognition algorithm using PCA -LDA combined for hybrid data pre-processing and polynomial-based RBF neural networks : Design and its application." Expert Systems with Applications, Vol 40, Issue 5, pp 1451-1466, April 2013 https://doi.org/10.1016/j.eswa.2012.08.046
  6. Abeer A. M. AL-Shiha, W.L. Woo, S. S. Dlay, "Multi-linear neighborhood preserving projection for face recognition." Pattern Recognition, Vol 47, Pages 544-555, 2014 https://doi.org/10.1016/j.patcog.2013.08.005
  7. S. K. Oh, W. D. Kim, and W. Pedrycz, ‟Polynomial based radial basis function neural networks(P-RBF NNs) realized with the aid of particle swarm optimization,” Fuzzy Sets and Systems, vol. 163, no. 1,pp. 54-77, 2011 https://doi.org/10.1016/j.fss.2010.08.007
  8. S. K. Oh, W. Pedrycz, and S. B. Roh, “Genetically Optimized Hybrid Fuzzy Set-based Polynomial Neural Networks,” Journal of the Franklin Institute, Vol. 348, No. 2, pp. 415-425, 2011. https://doi.org/10.1016/j.jfranklin.2010.11.005
  9. R. A. Aliev, W. Pedrycz, B. G. Guirimov, R. R. Aliev, U. Ilhan, M. Babagil, S. Mammadli "Type-2 fuzzy neural networks with fuzzy clustering and differential evolution optimization" Information Sciences, Vol 181, Issue 9, pp 1591-1608, May 2011 https://doi.org/10.1016/j.ins.2010.12.014
  10. F. Gaxiola, P. Melin, F. Valdez, O. Castillo "Interval type-2 fuzzy weight adjustment for backpropagation neural networks with application in time series prediction" Information Sciences, Vol 260, pp 1-14, March 2014 https://doi.org/10.1016/j.ins.2013.11.006
  11. E. Uzlu, A. Akpınar, H. T. Özturk, S. Nacar, M. Kankal "Estimates of hydroelectric generation using neural networks with the artificial bee colony algorithm for Turkey" Energy, Vol 69, pp 638-647, May 2014 https://doi.org/10.1016/j.energy.2014.03.059
  12. J. Yu, H. Duan "Artificial Bee Colony approach to information granulation-based fuzzy radial basis function neural networks for image fusion" International Journal for Light and Electron Optics, Vol 124, Issue 17, pp 3103-3111, September 2013 https://doi.org/10.1016/j.ijleo.2012.09.033