1. 서 론
과거의 자동차는 주로 탈것이나 물건을 운반하기 위한 것이었지만, 지금의 자동차는 안락함과 많은 정보를 제공해주는 점점 지능화된 시스템으로 되고 있다. 그러나 사고로 인한 차량 내부의 사람들을 위한 안전장치가 개선되어 설치되고 있으나, 차량 외부의 물체나 사람을 보호하기위한 장치는 미비하다. 현재의 지능형 자동차 연구는 보행자와 자동차를 제외한 보행자, 이륜차, 그리고 작은 자동차와 같은 연약한 도로 이용자(vulnerable road users)를 보호하기위한 연구를 확대하고 있다[1-3]. 연약한 도로 이용자를 위한 기계장치는 자동차와 비슷한 속도를 내는 빠른 것부터 노약자를 위한 느리게 움직이는 사륜바퀴 운전용 기계장치까지 다양한 종류가 있다. 이들의 공통점은 자동차와는 다르게 사용자 보호를 위한 헬멧이나 LED부착 등을 제외한 특별한 보호 장치가 이륜차에 부착되어있지 않다는 것이다. 그러므로 도로위의 연약한 도로이용자를 자동차가 보호하기위해 이륜차 검출에 대한 지능형 자동차 연구도 같이 이루어져야한다.
이륜차는 사람과 기구물의 조합(사람+자전거, 사람+모터사이클, 사람+휠체어 등)으로 이루어져있다. 그러므로 보행자 연구에서 사용되고 있는 특징 추출 방법을 이용할 수 있다. 물체 인식 및 보행자의 특징 추출 방법 중 가장 많이 이용하고 있는 HOG(Histogram of Oriented Gradient)[4]는 중심좌표 I (x, y)에 대한 x 방향과 y 방향에 대한 미분 크기와 방향성을 이용한 것이다. 이는 미분에 사용한 좌표 이외의 대각 방향의 4점 정보는 잃어버리고 노이즈에 약한 단점을 가지고 있다. 그러나 이 방법의 장점은 국부적 형상의 특징이 있는 에지나 기울기 구조를 잘 찾아낸다는 것이다. 그리고 이를 응용한 많은 연구가 진행되어 왔다[1,5,6]. Ojala등[7]에 의해 처음 소개된 LBP방법은 빠르고 간단한 계산, 회전에 강인함, 차원 감소 그리고 자세와 조명변화에 둔감함 때문에 텍스쳐 분류에서 뛰어난 성능을 나타내었다. 인식은 얼굴인식 분야에서 많이 사용되어져 왔으며, 최근에 보행자 검출에서도 이용이 확대되고 있다[8]. 이 외에도 Haar-like[9]와 웨이블릿[10] 방법은 단일 특징 벡터를 이용하였다.
보행자 검출을 위한 분류 방법으로는 Random Forests, 선형 SVM분류 그리고 Adaboost 방법 등이 사용되고 있으며 다양한 응용 방법들이 있다[8].
보행자와 달리 이륜차의 큰 특징은 바퀴를 가지고 있다는 것이다. 그래서 본 논문에서는 외곽의 표면 특성을 표면 함수와 같은 수학적 형태로 정의하고자 한다. 임의의 평활 표면은 매개 변수공간에서 제 1기본형과 제 2기본형으로 정의가 가능하며, 이들 기본형 계수들의 조합에 의해 구해지는 곡률 정보는 표면 형태 특성을 잘 설명한다[12]. 그리고 투영은 영상 높은 차원의 시스템을 낮은 차원으로 변환하는 역할을 한다. 이는 영상의 개략적인 형상 정보를 얻을 수 있으며, 수평과 수직 방향으로의 투영 벡터를 얻을 수 있다.
이륜차에 대한 연구는 많이 진행되고 있지 않다. Jung 등[2]에 의해 여러 가지 크기의 셀 HOG 특징을 이용하여 검출하는 방법이 제안되었으며, Cho 등[3]은 다중 영상 기반의 이륜차 검출을 제안하였다. 영상에서 이륜차는 사람과 함께 형상으로 나타내므로 보행자 인식 알고리즘과 유사하게 사용 할 수 있다. 그러나 이륜차는 보는 각도에 따라 다양한 형상을 나타내므로 연구에 어려움이 많다. 이에 본 연구에서 물체가 가지는 최대 곡률과 최소 곡률을 기반으로 하는 국부적 이진패턴 가중치 투영 벡터 방법을 이용하여 특징 벡터를 구하는 알고리즘을 개발하였으며, 제안된 방법은 기존의 제안된 일반적인 방법의 투영 벡터 보다 높은 이륜차 및 비이륜차의 검출 능력을 향상시켰다. 그리고 빠르고 정확한 분류를 실현하기 위하여 전통적인 방법의 Adaboost 알고리즘을 적용하였다.
본 논문의 구성은 다음과 같다. 2장에서 특징 추출을 위한 물체의 표면 곡률 값 계산, 특징 추출을 이한 투영벡터 방법 그리고 LBP(Local Binary Pattern)알고리즘을 기술하며, 3장에서 제안하는 곡률 무게 값이 고려된 특징 벡터 추출 알고리즘을 설명한다. 그리고 4장에서는 분류에 사용된 Adaboost 알고리즘을 서술하며, 실험 및 결과를 5장에 그리고 6장에 결론을 나타내었다.
2. 특징 추출
2.1 표면곡률[12]
물체의 표면 특성을 이용하면 물체 인식을 위한 새로운 특성들을 얻을 수 있다[13]. 본 논문에서는 표면 특성의 성질을 잘 나타내는 표면 곡률 성분을 구하여 이를 HOG 방법에 의해 새로운 곡률-HOG 특성을 얻는다. 표면 특성은 표면 함수와 같은 수학적 형태로 정의되며, 임의의 평활 표면은 매개 변수 공간에서 제 1기본형과 제 2기본형으로 정의가 가능하다. 더욱이 이들 기본형 계수들의 조합에 의해 구해지는 곡률 정보는 표면 형태 특성을 잘 설명하기 때문에 최근에는 이들 곡률 정보를 이용한 거리 영상분석이 많이 연구되고 있다.
표면의 한 점에서 주 곡률은 Fig. 1과 같다. 점 P에서 표면에 수직한 법선 벡터 을 포함하는 법평면이 벡터 을 축으로 회전할 때 곡률 kn 은 변화하고 두 수직한 방향으로 최대, 최솟값을 갖는다. 이 극한치와 이에 대응하는 방향이 주 곡률과 주방향이다. 주곡률은 표면 위의 한 점에서의 표면 특성을 잘 표현하며, 특히 주 곡률의 부호에 따라서 표면을 6가지 기본 유형으로 구분할 수 있는 특징이 있다. 그러나 미분 연산에 의한 잡음 증폭은 특히 경계선 근방에서 올바른 주방향 및 주 곡률의 추정을 어렵게 한다.
Fig. 1.Principal curvatures {k1, k2} and directivity at a point on the surface.
본 논문에서는 물체의 표면을 작은 조각들로 분할(segmentation)을 한 후 조각을 2차원으로 변환하여 근사화 시키는 방법을 사용하였다. 물체의 표면은 영상의 한 점(x, y)에서 거리 값 z (x, y)로 근사화 할 수 있다.
식 (1)의 계수들은 최소 제곱 문제를 사용하여 구한다. 그리고 표면의 한 점은 주어지는 그 점에서의 위치 벡터에 의해 식 (2)과 같이 정의되며,
임의의 평활 표면은 미분 기하학에 의해 매개 변수 공간에서 제 1 기본형과 제 2기본형으로 정의가 가능하다. 제 1기본형Ⅰ과 제 2기본형 Ⅱ는 식 (3)과 식 (4)과 같이 표현된다.
제 1기본형은 변수 공간 (dx, dy)에서의 미소 변화량에 대한 2차원 표면 위의 한 점 (x, y)에서 R의 미소 변화량 즉, |dR|2 을 나타내며, 이 값은 표면의 평행 이동 및 회전과 표면 변수화의 변동에도 불변하는 값으로써 표면 자체 특성에 기인하는 표면의 내적 성질을 표현한다. R은 2차원 표면상의 한 점 R(x, y)에서의 표면 단위법선 벡터이다. 제 2 기본형은 변수 공간(dx, dy)에서의 미소 변화량에 대한 3차원 표면 위의 한 점 (x, y)에서 법선 벡터 변화량 dn과 표면 위치 변화량 dR사이의 상관도를 나타낸다. 이것은 표면이 2차원 공간에서 어떠한 형태로 존재하는가에 의존하므로 표면의 외적 성질을 내포한다. 위의 두 기본형에 의해 2차원 표면은 존재성과 유일성이 보장된다. 따라서 임의의 평활화 표면 형태는 6개의 스칼라 함수 E, F, G, e, f, g에 의해 결정된다. 또한 6개 스칼라 값들의 조합에 의해 구해지는 곡률 정보는 표면 형태 특성을 잘 설명한다. 6개의 스칼라 함수는 아래 식 (5), (6), (7) 그리고 (8)와 같다.
상기에서 구한 스칼라 값들을 이용하여 최소 곡률 k1과 최대 곡률 k2는 아래의 식 (9)과 식 (10)과 같다.
여기서 p1, p2, p3 그리고 p4는
k1과 k2의 값은 고정된 표면에 대해서는 불변의 변수이므로 동일한 조건의 고정된 표면을 위해 전처리 과정으로 정규화를 모두 거쳤기 때문에 x - y 좌표 평면에서 정의되는 픽셀 값들의 방향성은 고려하지 않는다. 그리고 가우스 곡률과 평균 곡률은 이들 1, 2기본형 표면 함수를 결합함으로 유도되는 회전, 평행 이동 및 변수화의 변동에 관계없는 스칼라 표면특징이다. 가우스 곡률(K)와 평균 곡률(M)는 여러 가지 방법에 의해 정의가 가능하지만 그 중에서 대표적인 표면 제 1, 2기본형 계수들의 조합과 1, 2차 편미분 함수들에 의해 구할 수 있다.
앞에서 언급한 주 곡률을 이용하여 가우스 곡률 K는 식 (11)와 같이 나타낼 수 있다.
평균곡률 M은 식 (12)과 같다.
본 논문에서는 주 곡률, K 그리고 M의 부호가 아닌 곡률 값 변화 특성을 이용하고자 한다. K와 M의 정의 식은 위와 같으며 일반 표면 곡률을 k라 할 때, k와 가우스 곡률(K) 및 평균 곡률(M)사이의 관계는 식 (13)과 식 (14)과 같다.
위의 정의로, 만약 표면 곡선이 주어진 방향에서 아래로 볼록하다면, 그 방향에서 표면 곡률 값은 양이 된다. 만약 곡선이 위로 볼록하다면 그 방향에서 표면 곡률 값은 음이 된다.
2.2 투영벡터[14,18]
일반적으로 투영은 높은 차원의 영상 시스템을 낮은 차원으로 변환하는 역할을 한다. 이는 영상의 개략적인 형상 정보를 얻을 수 있는 장점이 있으며, 수평과 수직 방향으로의 투영을 통하여 특징 벡터를 간단하게 얻을 수 있다. 행 방향으로의 투영을 통하여 수평 방향의 투영 벡터를 얻을 수 있고, 열 방향의 투영을 통하여 수직 방향의 투영 벡터를 얻을 수 있다. 이진 영상에 대한 투영 예를 Fig. 2에 나타내었다.
Fig. 2.Example of projection for binary image.
크기가 M × N (가로x세로) 영상을 I (r, c)라 할 때 수평 및 수직 방향의 투영은 식 (15)과 같이 나타낼 수 있다. 여기서 c는 행 방향을 나타내며, r는 열 방향을 나타낸다.
투영 기법을 적용할 경우, 영상의 크기에 따라 생성되는 투영의 크기가 달라지므로 동등한 길이의 벡터를 이용한 비교가 불가능하다는 문제가 있다. 그리고 행과 열의 개 수 만큼 벡터 요소가 비교되어야하므로 색인 데이터가 많아져 대용량의 데이터베이스에서는 많은 시간이 소요되는 단점이 있다. 이러한 단점을 해소하기위해 HOG[4] 특징 벡터를 구할 때 처럼 셀 단위 투영을 적용한다. 이를 다시 블록 단위의 정규화 과정을 거쳐 특징 벡터를 얻을 수 있다. 이는 색인 데이터양을 줄일 수 있으며, 영상의 크기에도 덜 민감하게 사용 할 수 있는 장점이 있다. 128×64 입력영상에 대해, 하나의 셀이 8x8 화소면 128개의 셀이 생성된다. 그리고 블록의 크기가 3x3 셀 이고 블록의 이동이 한 개의 셀 일 경우, 투영 벡터의 개수는 12096개 이다.
2.3 국부적 이진 패턴(LBP)
Ojala 등[7]에 의해 처음으로 제안된 LBP는 조명변화에 강건한 특징을 가지고 있으며, 중심 픽셀과 주변 화소와 관계를 식 (16)와 (17)에 의해 계산된다.
여기서 gc는 중심 화소의 밝기이며, gp는 반지름이 R인 원주 상에 나타나는 P개의 주변 픽셀의 밝기 값이다. 8개를 고려할 경우 LBP는 256차원의 코드를 생성한다. 일반적인 방법의 LBP8,1 예를 Fig. 3에 나타내었다.
Fig. 3.Example of LBP.
Fig. 3은 256개의 패턴 코드 가운데서 하나를 나타낸 것이다. 이러한 이진 코드열을 “1”의 영역 혹은 “0”의 영역으로 나누어 사용하는 것을 단일형태 (uniform pattern)라 말하며, “11111111”와 “00000000”를 제외한 56가지의 경우를 가진다. 예를 들면 “00111100”의 경우는 단일 형태이고 “11010011”는 비단일형태(non-uniform pattern)이다.
3. 특징벡터 추출
입력 영상으로부터 하나의 셀 8x8 픽셀에 대해 투영 벡터를 식 (15)을 이용하여 계산한다. LBP 코드열을 구하기 위하여 투영 벡터의 각 요소의 평균값을 LBP의 문턱치 값으로 사용하여 식 (18)과 (19)에 의해 k번째 셀의 행 투영벡터 LBPH(H(k))와 k번째 셀의 열 투영벡터 LBPV(V(k))을 계산하며, 예제를 Fig. 4에 나타내었다.
Fig. 4.Example of projection vectors for a cell.
여기서 H(k)p와 V(k)p는 행과 열 투영벡터 값이며, H(k)p,avg와 V(k)p,avg는 행 투영벡터의 평균값과 열 투영벡터의 평균값이다. 위에서 구한 행과 열의 LBP 코드열이 단일형태 유무에 따라 식(21)와 (22)에 의해 8x8픽셀에 대한 투영벡터를 계산한다.
여기서 UP는 단일형태를 가질 경우이며, e 아주 작은 값으로서 논문에서는 0.01를 사용하였다. 그리고 H_k1와 V_k1은 수평 방향 최소 곡률의 정규화된 투영 벡터 값과 수직 방향 최소 곡률의 정규화된 투영벡터 값이다.
계산된 특징 값은 3×3 셀을 하나의 블록으로 하여 정규화를 실시한다. 블록은 왼쪽에서 오른쪽 그리고 위에서 아래 방향으로 하나의 셀을 이동시켜가면서 진행하며 Fig. 5에 나타내었다. q번째 블록의 행 방향에 대한 정규화를 식 (23)을 이용하여 계산 할 수 있으며, 열 방향에 대해서도 동일한 방법을 수행 한 후 두 종류의 특징벡터들을 나열하면 최종적인 특징 벡터가 ΠH,V가 구해진다.
Fig. 5.Normalization processing of blocks with 3×3 cells.
128×64화소 영상에 대해 횡 방향으로 6블록, 종방향으로 14블록이 생성되며, 전체 84개의 블록에 대한 정규화가 이루어지므로 “84블록×144차원”의 12096차원 투영 특징 벡터가 얻어진다.
4. 분류화
본 논문은 앞서 실시한 입력 영상에 대한 이륜차의 특징 벡터를 이용하여 입력 영상으로부터 이륜차를 검출 하기위해 약한 분류기(Weak Classifier)를 선형적 결합에 의해 강 분류기(Strong Classifier)로 생성하는 Adaboost알고리즘을 사용하였다[11,16]. 즉 약한 분류기를 학습 시킨 후 올바르게 분류된 데이터에 대해서는 낮은 에러 가중치가 부과되고 올바르지 않게 분류된 데이터에 대해서는 높은 에러 가중치를 부과 하는 것이다. 이륜차를 검출하기위해 Adaboost 알고리즘 과정을 요약해보면 다음과 같다.
1) 입력 - 이륜차(+1)와 비이륜차(-1)
2) 가중치 초기화
3) 반복 t=1⋯T
(1) 가중치 정규화
(2) 약한 분류기(hj)의 에러 계산
(3) 분류기 선택
(4) 가중치 갱신
여기서 만약 입력영상 xi가 정확하게 분류 되었다면 ei = 0 그렇지 않으면 ei = 1이다.
그리고 이다.
(5) 최종적으로 강한 분류기
여기서 αt = log(1/βt)
초기 입력값 x는 훈련 영상이며, y는 이륜차와 비이륜차의 구분을 나타낸다. 2단계에서는 가중치 초기화를 실시한다. 3단계는 약한 분류기를 생성하는 단계이다. 이 단계에서는 최소 에러를 가지는 약한 분류기를 선택하는 단계이며, 이 분류기에 대한 가중치를 부과한다. 가중치 w(i) 에 의해 초기에 선택된 특징들은 쉽게 구별할 수 있는 역할을 담당 하지만 후반 부에 선택된 특징들은 구별이 어려우므로 이를 담당하기 위한 것이다. 이것은 복잡하고 다양한 배경에서 강인하게 이륜차를 추출 할 수 있는 장점을 가지고 있다.
5. 실험 및 결과
도로위에는 자동차외에도 보행자, 자전거, 모터사이클 등 다양한 형태의 이용자들이 존재한다. 특히 자전거나 모터사이클은 자동차와 함께 도로를 이용 하고 있으므로 많은 주의를 요하는 운송 수단이다. 본 논문은 지능형 자동차를 위한 도로 위의 연약한 이용자인 이륜차 검출을 위해 국부적 특성과 텍스쳐 성분을 잘 반영할 수 있는 곡률 기반의 LBP와 투영벡터을 이용한 알고리즘을 구현하였다. 실험 시스템 및 소프트웨어는 펜티엄 3.1GHz의 일반 사용자 컴퓨터 환경과 Visual C++ 6.0환경이다. 실험에 사용된 이륜차 데이터는 도로 위에서 직접 촬영해서 획득된 것과 인터넷으로부터 얻어진 데이터이며, 보는 각도에 따라 여러 가지 모습으로 나타난다. 본 논문에서는 자동차 안에서 보았을 때, 이륜차의 앞모습과 뒷모습에 대해 정면(약 90도, 이하 90˚로 표기) 그리고 약간 기울어진 각도(약 60도 이상, 이하 60˚로 표기)을 사용하였다. 획득된 사진 640×480(가로×세로)으로부터 128×64(가로×세로)크기로 정규화 된 이륜차 2353장을 추출하였으며, 훈련영상과 실험영상으로 나누어 사용하였다. 실험에 사용된 이륜차의 종류 및 개수를 Table 1에 나타내었다. 여기서 B는 자전거, M은 모터사이클 그리고 MB는 자전거와 모터사이클의 혼합을 의미한다. 비이륜차 영상은 일반 도시 거리의 사진(640×480)에서 랜덤하게 추출된 영상 128×64크기를 사용하였다. 훈련과정에 사용된 비이륜차 영상은 이륜차 영상과 같은 개수(1:1)를 사용하였으며, 큰 영상 내에는 이륜차보다 배경이 훨씬 많이 차지하므로 테스트과정의 비이륜차 영상은 3000장을 사용하였다.
Table 1.The number of training and test images
그리고 정면 영상의 개수와 후면 영상의 개수는 훈령영상과 테스트 영상에 대해 거의 1대1로 맞추어서 실험하였다. Fig. 5은 실험에 사용된 이륜차와 비이륜차의 영상 예를 나타내었다. Fig. 5의 첫 번째 행은 자전거 영상 예이며, 두 번째 행은 모터사이클 영상 예이다.
Fig. 5.The example of the positive and negative images.
실험은 보행자 검출 및 물체 인식에서 많이 사용하고 있는 연속 데이터 저장 방법 HOG[11], 일반적인 투영벡터 방법 그리고 논문에서 제안한 방법을 각각 비교 실험하였다. 실험에서 특징벡터 저장은 데이터 연속 저장 방법을 이용하였다. 실험 결과의 분석을 위해 각각의 방법 및 각도에 대해 혼돈행렬(confusion matrix)의 참 긍정률(true positive rate)과 거짓 긍정률(false positive rate)을 이용한 ROC 곡선을 적용하였다. 각각의 방법에 대한 판별을 위해 적용된 문턱치 값의 범위는 -20∼20이며, 각각의 방법에 대한 각도별 실험 결과 분석을 위해 식(29)을 이용하여 정밀도[15]를 Table 2에 나타내었다.
Table 2.Accuracy Rate for each method(%)
여기서 TP는 참 긍정(True Positive), FP는 거짓 긍정(False Positive), TN는 참 부정(True Negative) 그리고 FN는 “거짓 부정(False Negative)”이다.
Table 2에서 PRJ는 일반적인 투영벡터를 나타내며, CU_PRJ는 제안한 방법을 의미한다. 그리고 Bike는 자전거, Moto는 모터사이클 그리고 MB는 자전거와 모터사이클의 혼합을 의미한다. Table 2에서 전체적으로 모터사이클은 자전거보다 높은 정밀도를 나타낸다. 그 이유는 훈련 영상의 개수가 적은 이유도 있지만, 더 큰 원인은 Fig. 5처럼 모터사이클이 자전거보다 등 뒤로 많은 짐이 적재되거나, 정면에서 보는 모습이 자전거보다 복잡성이 떨어져 둔감하게 되었기 때문이라고 생각된다. HOG는 중심좌표에 대해 미분값을 이용하기 때문에 국소적인 특징을 나타낸다. 하지만 PRJ의 경우는 국부적인 셀이 전체를 대표하는 값을 가지기 때문에 좀 더 정확한 구분이 되는 것이다. 그리고 본 논문에서 제안한 방법이 일반적인 PRJ보다 향상된 결과를 나타내는 것은 단일 LBP에 의한 곡률 투영이 무게값으로 잘 반영되었기 때문에 높은 정밀도를 나타내었다. 그리고 문턱치 값 -20~+20사이에 대한 각각의 각도별 실험 결과를 식 (30)를 이용하여 일반적인 방법(HOG와 투영방법)과 제안된 방법을 ROC 곡선으로 Fig. 6, Fig. 7 그리고 Fig. 8에 나타내었다. 제안된 방법은 면적이 1에 가까운 그래프를 나타며, 일반적인 방법은 훨씬 낮은 면적의 그래프를 나타낸다. 1에 가까울수록 높은 성능을 나타낸다. 각도의 방향은 90도의 경우가 높게 나타났다. 이는 회전이 생김으로 인하여 형상의 변화가 다양하게 나타는 원인으로 생각된다.
Fig. 6.The result of experiment for HOG method.
Fig. 7.The result of experiment for projection method.
Fig. 8.The result of experiment for proposed method.
인식 수행 시간은 특징이 추출된 영상 1장에 대해 제안된 방법은 약 20ms로 나타났으며, 다른 방법들도 비슷하게 나타났다.
보행자 검출에 사용된 일반적인 HOG 방법[11]은 화소의 주변에 대한 미분 값을 사용하므로 노이즈에 민감한 반응을 나타낸다. 그러나 본 논문은 국부적 형상 정보를 잘 나타내는 수정된 투영 벡터 방법과 회전과 노이즈에 강인한 단일 이진형태와 물체의 곡률 정보를 이용한 무게값을 적용한 특징 벡터 추출방법을 사용하였기 때문에 보다 향상된 검출 결과를 얻을 수 있었다.
도로 영상(640×480)에서 식 (31)을 적용한 이륜차 검출 결과를 Fig. 9에 나타내었다. 사용한 문턱치 값(TH)은 15.0이다.
Fig. 9.The example result for 640×480 image (by threshold value 15.0) (a) HOG method, (b) General Projection Method, and (c) proposed method.
여기서 ht(x)는 전체 화면에서 t번째 추출된 영상을 의미하며,H(x)는 강분류기 그리고 x는 특징벡터이다. 그리고 ‘1’은 이륜차를 검출한 경우이며, ‘0’는 비이륜차를 검출한 경우이다. Fig. 9는 자전거와 모터사이클, 이륜차의 전면과 후면 그리고 각도60과 각도 90를 혼합한 전체의 경우이다. Fig. 9(a)는 일반적인 연속저장방법 HOG 특징을 사용한 경우이며, (b)는 일반적인 투영 벡터 방법을 사용한 것이고 (c) 제안된 방법의 사용 결과를 나타내었다. 그림에서 나타 낸 것처럼 제안된 알고리즘이 일반적인 HOG 방법보다는 월등히 앞서며, 일반적인 투영벡터 방법을 사용한 것보다도 에러 검출(비이륜차)이 적게 나타났다. 실험에서 오인식은 전봇대와 나무와 같이 기둥이 형성되는 물체가 있는 부분과 벽면이나 도로와 같이 평탄한 면이 있는 부분에서 다수 나타났다. 사람이 이륜차를 타고 있지만 이는 기둥을 가진 물체와 비슷하므로 발생되는 것이라 생각된다. 동영상에서 프레임간의 움직임을 이용하여 후보 영역을 좁히거나 후보 영역에 대한 영역 분할 방법 등을 전처리에서 수행한다면 평탄한 부분과 기둥부분 등이 없어져서 좀더 좋은 결과를 얻을 수 있을 것이다. 그리고 나무와 같이 복잡한 형태인 경우도 오인식으로 나타난다. 문턱치 값이 작을수록 비이륜차 검출이 많이 나타났으며 값이 클수록 비이륜차 검출이 적게 나타났다.
자전거와 모터사이클을 검출하거나 인식하는 연구는 아직 미비하다. 유사한 연구로는 자전거를 타고 있는 사람을 검출하는 방법들을 제안하였다. 자전거를 타고 있는 사람을 감지하기 위해 Jung 등[2]은 HOG 방법을 변형시켜 여러 개의 셀 사이즈를 이용한 MSC-HOG 방법을 동영상 실험에서 정밀도 96%를 나타내었다. Cho 등[3]에 의한 다중 영상 기반 히스토그램 빈의 누적합을 이용한 방법은 동영상에서 빠른 검출을 나타내었으나 검출율(Hit rate)은 65.12%을 나타내었다. 그리고 Cao 등[17]은 HOG의 문제점인 중복성을 피하는 전역특징 추출과 피라미드를 이용한 방법으로 셀을 사용하지 않기 때문에 속도의 향상과 93.9%의 검출율을 나타내었다. 아직은 이륜차를 검출하거나 인식하는 연구가 활발하지 않고, 보행자 인식처럼 정례화 된 데이터베이스도 없으며, 자전거를 타고 있는 사람을 검출하는 연구만이 다소 이루어져왔다. 그러므로 이를 검출하기위한 다양한 알고리즘 개발과 표준화된 데이터베이스가 구축되어져야 할 것이다.
6. 결 론
사회적인 영향(경제 성장, 환경 변화, 고령화 등)에 의해 도로위에는 자전거를 비롯한 다양한 형태의 움직이는 소형 기구들이 점점 증가하고 있다. 본 논문에서는 연약한 도구 가운데서 가장 많이 사용하고 있는 이륜차를 지능형 자동차가 높은 수준의 인지도를 가질 수 있는 알고리즘을 제공한다. 지능형 자동차를 위해 지금까지의 연구에서는 여러 개의 haar-like 특징 혹은 HOG 특징을 추출하여 인식하는 방법을 많이 사용하여 왔다. haar-like 특징은 특징 개수도 많이 늘어나며 이로 인한 비교 시간이 길어지므로 특징 개수가 적은 것에 비해 많은 인식 시간이 소요된다. 그리고 기존의 HOG의 경우는 계산량은 줄어들지만 화소 중심의 미분량을 사용하므로 노이즈에 민감하며, 4개의 화소를 사용하므로 강력한 특징값을 가질 수 없는 등의 원인으로 낮은 인식률을 나타내었다. 본 논문에서는 연약한 도로 이용자인 이륜차 검출을 위해 회전에 강인하고 국부적 텍스쳐의 특징을 잘 반영하는 곡률 기반의 단일 LBP-투영벡터 알고리즘을 제안하였다. 투영 벡터를 작은 셀과 블록으로 이용하여, 지역적 특징을 잘 반영하였다. 그리고 이륜차와 배경 패턴의 분별능력 향상을 위해 곡률 계산을 이용한 무게값을 추가하여 제안된 알고리즘의 높은 성능을 확인하였다. 세 가지 경우의 자세에 대해 실험하였으며, 제안된 방법을 이용한 실험이 기존의 방법과 비교해서 보다 향상된 인식 정확도를 나타내었다. 이륜차의 분류를 위해 Adaboost를 사용하였으며, 다른 분류 시스템과의 성능 비교가 추후 필요할 것이다. 향후과제로는 특징벡터 개수를 줄이면서 검출 능력을 향상시키는 알고리즘 연구가 필요하며, 보다 정확한 연구를 위한 데이터베이스 구축이 이루어져야 할 것이고, 전동 휠체어와 같은 다양한 도로위의 연약자에 대한 연구도 요구되어진다.
References
- M. Pedersoli, J. Gonzalez, X. Hu, and X. Roca, "Toward Real-Time Pedestrian Detection Based on a Deformable Template Model," Intelligent Transportation Systems, Vol. 15, No. 1, pp. 355-364, 2014. https://doi.org/10.1109/TITS.2013.2281207
- H. Jung, Y. Ehara, J. K. Tan, H. Kim, and S. Ishikawa, "Applying MSC-HOG Feature to the Detection of a Human on a Bicycle," Proceeding of 12'th International Conference on Control, Automation and Systems, pp. 514-517, 2012.
- H. Cho, P.E Rybski, and W. Zhang, "Visionbased Bicyclist Detection and Tracking for Intelligent Vehicles," Proceeding of IEEE Intelligent Vehicles Symposium, pp. 454-461, 2010.
- N. Dalal and B. Triggs, "Histogram of Oriented Gradients for Human Detection," Proceeding of Computer Vision and Pattern Recognition, pp. 886-893, 2005.
- T. Watanabe, S. Ito, and K. Yokoi, "Co-occurrence Histogram of Oriented Gradients for Detection," Advances in Image and Video Technology, Vol. 5414, pp. 37-47, 2009. https://doi.org/10.1007/978-3-540-92957-4_4
- X. Y. Wang, T. X. Han, and S. Yan, "An HOG-LBP Human Detector with Partial Occlusion Handling," Proceeding of International Conference on Computer Vision, pp. 32-39, 2009.
- T. Ojala, M. Pietikainnen, and D. Harwood, "A Comparative Study of Texture Measures with Classification based on Features Distribution," Pattern Recognition, Vol. 29, No. 1, pp. 51-59, 1996. https://doi.org/10.1016/0031-3203(95)00067-4
- A. Haldou, X. You, and B. Bogno, "Pedestrian Detection based on Multi-Block Local Binary Pattern and Biologically Inspired Feature," Computer and Information Science, Vol. 7, No. 1, pp. 125-134, 2014.
- S. Pavani, D. Delgado, and A. F. Frangi, “Haar-like Features with Optionally Weighted Rectangles for Rapid Object Detection,” Pattern Recognition, Vol. 43, No. 1, pp.1 60-172, 2010. https://doi.org/10.1016/j.patcog.2009.05.011
- C. Papageorgiou and T. Poggio, "A Trainable System for Object Detection," International Journal of Computer Vision, Vol. 38, No. 1, pp. 15-33, 2000. https://doi.org/10.1023/A:1008162616689
- Y. H. Lee, J. Y. Ko, S. H. Yoon, T. M. Rho, and J. C. Shim, “Pedestrian Recognition using Adaboost Algorithm based on Cascade Method by Curvature and HOG," Journal of Korean Institute of Information Scientists and Engineers, Vol. 16, No. 6, pp. 654-662, 2010.
- Y. H. Lee and D. Marshall, "Curvature based Normalized 3D Component Facial Image Recognition using Fuzzy Integral," Applied Mathematics and Computation, Vol. 205, No. 2, pp. 815-823, 2008. https://doi.org/10.1016/j.amc.2008.05.074
- F.G. Peet and T.S. Sahota, "Surface Curvature as a Measure of Image Texture," IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 7, No. 6, pp. 734-738, 1985. https://doi.org/10.1109/TPAMI.1985.4767733
- S. Umbaugh, Computer Vision and Image Processing:A Practical Approach using CVIPtools, Prentice Hall PTR, Upper Saddle River, New Jersey, 1998.
- Receiver operating Characteristic, http://en.wikipedia.org/wiki/Receiver_operating_characteristic. (accessed August 5, 2015).
- Y. Lee, T. Kim, S. Lee, and J. C. Shim, "New Approach to Two Wheelers Detection using Cell Comparison," Journal of Multimedia Information System, Vol. 1, No. 1, pp. 45-53, 2014.
- T. Li, X. Cao and Y. Xu, "An Effective Crossing Cyclist Detection on a Moving Vehicle," Proceedings of the 8th World Congress on Intelligent Control and Automation, pp. 368-372, 2010.
- Y. H. Lee, J. C. Shim, and T. H. Yi, "3D Face Recognition using Projection Vectors for the Area in Contour Lines," The Journal of Korea Multimedia Society, Vol. 6, No. 2, pp.230-239, 2003.