1. 서론
영상 이진화 과정은 원본 컬러영상을 흑 또는 백의값을 갖는 영상으로 변환하는 것을 의미한다. 그러므로 이진화 변환 과정에 많은 정보손실은 불가피하다. 또한, 고품질의 이진 영상은 원본 컬러영상을 시각적으로 최대한 반영된 영상을 말한다. 더 나아가, 원본 컬러영상에서 시각적으로 인식 불가능한 객체를 변환 과정을 통해 더욱 뚜렷하게 나타나게 하는 것도 의미한다.그래서 본 연구의 기본적인 목표는 정보손실이 적은 이진 영상 취득과 원본 영상에서 인식 불가능한 객체를 뚜렷하게 시각적으로 표현된 이진 영상 취득을 목표로 한다. 이에 본 연구에서는 퍼지의 사다리꼴 유형과 단계별 분할 방법을 이용한다.
기존 이진화 방법은 전역, 지역, 퍼지, 혼합형 방법으로 구분할 수 있다. 전역적인 방법은 보통 하나의 임계치를 설정하여 흑과 백으로 구분한다.장점은 알고리즘이 단순하며 단점은 세밀한 부분 표현이 미흡하다[1-3]. 지역적인 방법은 세밀한 표현은 전역적 방법보다는 뛰어나지만, 영상의 분할된 영역 표시가 뚜렷하게 나타나는 현상으로 전체적 영상의 질은 떨어진다[4-5]. 퍼지 이진화 방법은 주로 삼각형 유형을 이용하며 값에 따라 두 개의 임계치를 설정한다. 특수한 경우에는 좋은 결과를 나타내지만, 범용적으로 좋은 결과를 기대하기는 어렵다[6-7]. 혼합형 방법은 여러 이론을 혼합한 것으로 알고리즘이 복잡하지만, 일반적으로 좋은 결과를 나타낸다[8-10].
임계치 수로 기존방법을 분석해 보면, 전역적인 방법은 1개, 지역적 방법은 분할된 수만큼 설정되며 퍼지 이진화 방법은 두 개의 임계치를 가지는 것이 일반적이었다.본 연구에서는 임계치 수가 적으면 정보손실이 최소화된 이진 영상을 취득하기가 어렵다고 판단하여 많은 임계치를 설정할 것이다. 본 연구에서는 기존방법보다는 알고리즘이 다소 복잡하지만, 단계별 전체 임계치 수를 달리할 것이며 분할된 하나의 블록 내에서는 세밀하게 영역을 구분하기 위해서 명도 영역을 3개의 임계치를 설정할 것이다.
기존 인식 분야에서 이진 영상은 단순하게 객체와 배경을 분리하는 수준에서 머물렀다면 정보손실이 적은 이진 영상은 많은 정보를 포함하여 세밀한 영상인식 분야의 전처리 과정으로 활용될 수 있어 새로운 논리를 적용한 개선된 동적 적응적 이진화 방법을 제안한다.
2. 단계적 분할 및 사다리꼴 영역 분류 2.1 단계적 동적 분할 방법
제안 방법은 원본 영상을 정적으로 하나 혹은 두 개의 임계치를 이용하여 이진화하지 않고 단계별로 조금씩 이진화 영역을 확대하는 동적 방식으로 진행한다. 단계별 이진화 영역은 여러 분할된 영역으로 나누며 분할 영역은 단계별로 블록 수가 달라진다. 블록 내부에는 퍼지 사다리꼴 유형을 이용하여 제안 방법에 맞게 이진화를 과정을 반복한다.
원본 영상에 대하여 단계별 분할 과정은 소수를 이용하여 가로, 세로의 분할 개수를 지정한다
B (1)
식(1)에서 B는 블록의 총 개수를 의미하고, M은 영상의 가로, N은 영상의 세로 수를 의미한다.또한, M과 N은 동일 단계에서는 같은 수를 나타내며 단계별에 따라 1, 2, 3, 5, 7, 11…으로 증가한다. 그래서단계별 총 블록의 개수는 1, 4, 9, 25, 49, 121…으로증가하게 된다.
Fig.1은 단계별 분할 과정을 보여주는 것으로 단계의 분할 과정은 소수를 이용하며 Step(n)에서 n은 1, 2, 3, 5, 7, 11, 13…으로 증가한다.Step(n)은 가로× 세로의 개수가 1×1이고 전체 영상을 의미하며, Step (2)는 2×2, Step(3)은 3×3, Step(4)는 5×5로 영상의 분할을 세분화한다. 영상의 분할에서 소수를 이용하여 얻는 효과는 지역 이진화 방법의 단점인 블록 경계 부분의 뚜렷한 표시를 보완하기 위해서다. 이는전체 영상에서 분할된 경계 지점이 계속 달라져 단계가 증가하도록 더욱 세밀한 영상 표현이 가능하게 된다.
Fig. 1. Image Segmentation process.
2.2 사다리꼴 유형 영역 분류 방법
하나의 블록 내부에는 퍼지의 사다리꼴 유형을 이용하여 명도 히스토그램을 구분한다.
Fig.2에서 가로는 명도(Brightness)를 세로는 퍼지의 소속도(\(\mu(x)\))를 의미하며 \(\alpha-c u t\)값은 1로 설정한다.소속도(\(\mu(x)\))가 1인 부분은 [x1, x3]이며 소속도(\(\mu(x)\))가 0인 부분은 [x1, x2], [x3, x4]명도 구간으로 분리한다. 분리된 명도 구간은 Table1과 같이 3영역으로 세분화한다.
Fig. 2. Application of Trapezoid Type.
Table 1. Classification of Brightness Section.
Table1은 명도 구간에 따른 블록 내부에서 이진화 여부를 설정한 것이다. 소속도(\(\mu(x)\))기준으로 이진화 진행 여부에서 소속도(\(\mu(x)\))0을 가진 구간은 현 단계에서 이진화를 진행하며 소속도(\(\mu(x)\))1을 가진 구간은 다음 단계 이후에서 이진화를 진행하는 구간이다.또한, 블록 내부의 명도 영역이 (x1, x2)인구간은 흑으로 이진화하며 (x3, x4)인 구간은 백으로 이 진화한다.그리고 [x2, x3]구간은 블록 내부에서 가장 가운데에 있는 명도 영역으로 현 단계에서는 이진화하지 않고 다음 단계 이후에서 이진화를 시행한다.
3. 제안 이진화의 설계 방법
제안 방법은 단계별로 나누어진 블록 내부의 화소를 대상으로 명도 히스토그램에서 구간별로 3가지 영역으로 지정한다.3가지 영역은 현 단계에서 이진화를 진행하는 구간과 다음 이후 단계에서 이진화를 진행하는 단계로 구분하며 현 단계에서 이진화를 진행하는 구간은 왼쪽 대각선 구간과 오른쪽 대각선 구간 영역으로 구분한다. 또한, \(\alpha-c u t\)값은 1로 설정하며 사다리꼴 유형 윗변의 길이는 아랫변의 길이의 비율에 따라 현 단계의 이진화 진행률이 달라진다.
Fig.3은 한 개의 블록 내부에 명도 히스토그램을 구하여 사다리꼴 유형을 적용한 것이다. 여기서, 블록마다 아랫변의 제일 왼쪽 지점은 최소 명도(\(B_{\text {min }}\)), 가장 오른쪽 지점은 최대 명도(\(B_{\max }\))로 지정하며 윗변의 왼쪽 꼭짓점은 최소-중간 명도(\(B_{\operatorname{mid} 1}\)), 윗변의 오른쪽 꼭짓점은 최대-중간 명도(\(B_{m i d 2}\))로 지정한다.
\(\begin{aligned} &D_{l}=B_{m i d 1}-B_{m i n}, D_{r}=B_{m a x}-B_{m i d 2} \\ &D_{m i d}=B_{m i d 2}-B_{m i d 1} \end{aligned}\) (2)
Fig. 3. Experiment Result of Cat Image.
식(2)에서는 3가지 구간 영역으로 구분하며 왼쪽 구간 영역(\(D_{1}\)), 오른쪽 구간 영역(\(D_{r}\)), 가운데 구간영역(\(D_{\text {mid }}\))으로 나누어진다.
블록의 명도 영역 \(\left[B_{\min }, B_{\max }\right]\)의 대상 화소(\(B_{i}\))에대하여 소속도(\(\mu(x)\))값을 구하는 식은 식(3)과 같다.
\(\begin{aligned} &\text { if }\left(B_{i} \neq D_{\text {mid }}\right) \text { then } \mu_{(x)}=0 \\ &\text { else } \mu_{(x)}=1 \end{aligned}\) (3)
식(3)에서 소속도(\(\mu(x)\))값 0은 현 단계에서 이진화를 진행하는 구간이며 소속도(\(\mu(x)\))값 1은 다음 이후 단계에서 이진화를 하는 구간을 의미한다. 현 단계에서 이진화되는 화소는 명도 0, 255 값 중에서 하나의 값을 가진다.0과 255 값의 지정 여부는 식(4)에 의해 결정된다.
\(\begin{aligned} &\text { if }\left(\mu_{(x)}=0\right) \text { then } \\ &\quad \text { if }\left(B_{i}<B_{\text {mid1 } 1}\right) \text { then } P\left(X_{i}\right)=0 \\ &\text { else } P\left(X_{i}\right)=255 \end{aligned}\) (4)
식(4)에서 대상 화소\(P\left(X_{i}\right)\))값이 0은 흑, 255는 백을 의미한다.
\(\text { if }\left(P_{b i n-}\right.\) (5)
식(5)에서 \(P_{\text {bin - }}\)는 이진화된 화소의 전체 비율, T는 임계치, M은 영상의 가로 크기, N은 영상의 세로 크기를 의미한다. 단계별로 블록을 생성하는 기준은 이진화된 화소의 전체 비율이 98%이하일 경우이며 98%를 초과하였으면 단계별 블록 생성을 멈춘다. 또한, 이진화되지 않은 화소는 전체 영상에 대하여 평균 명도를 임계치로 설정하여 최종 이진화한다.
4. 실험 결과 및 분석
4.1 실험 환경 및 원본 영상
실험 방법은 WindowsOS환경에서 VisualC#으로 구현하였으며 실험 영상은 다양한 형태의 명도 히스토그램을 형성하는 영상을 무작위로 선택하여 실험하였다.그중에서 실험 결과 영상은 객체의 인식이 목적인 영상과 야간조명의 영향으로 전체 윤곽 의식별이 어려운 영상을 사용하였다.
Fig.4는 실험 영상이며 (a)Cat은 대상 객체의 식별을 목적으로 사용하였으며 (b)Dark영상은 전체윤곽의 파악을 목적으로 사용하였다.
Fig. 4 Original Image for Experiment. (a) Cat and (b) Dark.
Table2는 실험 영상의 해상도(Resolution), 평균 명도(Averagebrightness)를 나타낸 것이다.여기서 Cat영상의 평균 명도는 중간 밝기를 나타내고 Dark 영상의 평균 명도는 일방적으로 흑으로 치우친 것으로 나타냈다.
Table 2. Data for the Original Image.
4.2 실험 결과
실험은 원본 영상을 음영 영상으로 변환한 후, 음영 영상을 대상으로 이진화를 진행하였다.실험에 사용된 이진화 방법은 지역 이진화 방법 중에서 가장 좋은 결과를 나타내는 Otsu이진화, 제안 방법에서 부분적으로 이용하는 평균 이진화 방법, 영상 분할 방법인 지역 이진화, 마지막으로 제안한 방법을 이용하여 실험하였다.
Fig.5에서 (a)Otsu방법은 임계치가 121이 나왔으며 부분적으로 고양이 윤곽이 보인다. (b)Mean 방법은 임계치는 144 나왔는데 전혀 영상이 보이지 않는 결과를 나타냈다. 또한, (c)Iterative방법은 5x5 로 영상을 나누어 실험하였으며 부분적으로 세밀함은 보이지만 전체적으로 분할된 영상의 경계가 뚜렷하게 보인다. 마지막으로 (d) 제안 방법은 고양이의 전체 윤곽과 배경의 갈라진 바닥도 보이는 결과가 나왔다.
Fig. 5. Experiment Result of Cat Image. (a) Otsu, (b) Mean, (c) Iterative and (d) Proposed Method.
Fig.6의 Dark 영상 실험 결과는 (a) Otsu방법은임계치 85가 나왔으며 원본 영상과 같이 전혀 영상 파악이 되지 않으며 (b)Mean방법은 임계치 5가 나왔으며 나름 영상의 윤곽이 파악된 결과가 나왔다. 또한, (c) Iterative 방법은 5x5로 나누어 실험하였으며 부분적으로 세밀함은 보이지만 영상의 전체적인 파악이 되지 않는 결과가 나왔다.마지막으로 (d) 제안방법은 전체적인 조화와 부분적 세밀함을 나타내어 영상이 고딕 양식의 건축물 내부인 것으로 파악된다.
Fig. 6. Experiment Result of Person Image. (a) Otsu, (b) Mean, (c) Iterative and (d) Proposed Method.
4.3 실험 결과 분석
변환 영상의 흑과 백의 비율을 분석하기 위하여 원본 영상의 명도 히스토그램을 살펴보면 다음과 같다.
Fig.7은 실험 원본에 대한 명도 히스토그램을 분석한 것이다. 여기서 (a)Cat원본 영상은 전체적으로 명도 영역이 균형 있게 펴져 있으며 (b) Dark원본영상은 0에 밀집된 것을 볼 수 있다.
Fig. 7. Histogram of the Original Image. (a) Cat Histogram and (b) Dark Histogram.
Table3은 제안 방법의 실험 결과 영상을 흑과 백의 비율을 조사한 결과이다.Cat영상의 흑과 백 비율은 거의 비슷한 결과가 나왔으며 Dark영상의 결과는 흑이 백과 비교하면 두 배 이상 많은 것으로 나타났다. 결과를 좀 더 분석해 보면, 원본 영상 히스토그램에서 화소의 분포도가 균등하게 나타난 영상에서는 흑과 백의 비율도 역시 비슷하게 나오며 화소가 극도로 한쪽으로 치우친 분포도를 보인 원본 영상에서도 흑과 백의 분포도 비율이 균형이 있게 맞춘 것으로 나타냈다.
Table 3. Result image black and white ratio.
결과적으로 제안 방법은 흑과 백의 비율을 비슷하게 맞추는 경향을 나타내는 것으로 파악된다.특히, 특수한 원본 영상에서도 역시 좋은 결과를 보여주어서 지금까지 알려진 다른 방법에 비해 정보손실이 적은 이진 영상을 생성하는 것으로 나타났다.
5. 결론
영상 인식 분야에서 기존의 영상 이진화 방법은 객체와 배경을 구분하는 것에 초점이 맞추어져 있었다. 그러나 현재에는 이진 영상이 인식률 향상을 위해 더욱 정밀한 영상이 요구되고 있다.정밀하게 변환된 이진 영상은 지금까지 인식하지 못한 여러 분야에 적용할 수도 있다고 판단된다. 그래서 본 제안 내용은 이진화 과정에서 발생하는 많은 정보손실을 최소화하는 것과 동시에 원본 영상에서 나타나지 않는 많은 정보를 변환 과정을 통해 분별할 수 있게 하는 것을 목표로 하였다.
제안 방법은 목표를 실현하기 위해 여러 방법을 적용하였다. 적용한 방법은 영상의 지역적 분할 방법과 전역 방법을 응용한 적응적 이진화 방법, 단계적 분할 처리 방법, 퍼지의 사다리꼴 방법을 이용하였다.
단계적 영상 분할은 소수를 이용하여 나누었으며 분할된 영상은 퍼지의 사다리꼴 유형을 이용하여 흑, 백, 이후 단계에서 처리하는 구간으로 분리하여 처리하였다. 영상 분할 기준은 이진화된 화소의 비율로 결정이 되며 비율은 98%를 초과하면 영상 분할 과정을 멈추고 전역적인 방법으로 결정되지 않는 화소를 대상으로 최종적으로 이진화한다.
분할된 하나의 블록 내부 처리 방법은 블록의 이진화되지 않는 화소를 대상으로 최소, 최대 명도를 구하고 \(\alpha-c u t\)값을 1로 설정하여 퍼지의 사다리꼴 유형에 적용한다. 사다리꼴 유형은 3가지 구간으로 구분하며 3가지 구간은 흑, 백, 다음 단계 이후 이진화하는 구간으로 세분화한다.
제안 방법을 이용한 실험 결과는 원본 영상이 균일 명도 영역을 가진 일반적인 영상뿐만 아니라 명도 히스토그램에서 한쪽으로 치우쳐 있는 특수한 영상에도 좋은 결과를 얻을 수 있었다. 특히, 비정상적인 취득과정으로 객체를 인식할 수 없는 영상도 인식 가능한 형태로 변환된 것을 볼 수 있었다.
제안 방법은 여러 이론을 접목하고 복잡한 과정을 통해서 이진 영상을 생성하여 이해하기 힘들며 단계별 분할 과정으로 인하여 수행 시간이 기존 이진화 방법보다 더 걸린다는 단점이 발생한다.그러나 현시스템에서 이러한 단점은 별로 문제가 되지 않으며 인공지능의 인식 방법보다 시간상 빠른 결과를 나타낸다. 따라서, 차후 연구의 방향은 영상 인식률 향상을 위하여 인공지능 방법과 연계할 생각이다. 인공지능 영상 인식 분야와 제안 방법의 연계는 영상 인식 분야의 인식률을 한층 더 높일 수 있는 하나의 방법이 될 수도 있을 것으로 예상한다. 또한, 제안 방법보다 더욱 발전된 범용적 이진화 방법 연구에 매진할 것이다.
References
- N. Otsu, "A Treshold Selection Method from Grey-Level Histogram," Institute of Electrical and Electronics Engineers, Vol. 9, No. 1, pp. 62-66, 1979.
- K.P. Han, "A Light Exposure Correction Algorithm Using Binary Image Segmentation and Adaptive Fusion Weights," Journal of Korea Multimedia Society, Vol. 24, No. 11, pp. 1461-1471, 2021. https://doi.org/10.9717/KMMS.2021.24.11.1461
- S.H. Kwon, "Advanced Image Quality Indexbased Binarization of Gray Images," Journal of Korean Institute of Intelligent Systems, Vol. 30, No. 3, pp. 236-241, 2020. https://doi.org/10.5391/jkiis.2020.30.3.236
- J. Bernsen, "Dynamic Thresholding of GreyLevel Images," International Conference on Pattern Recognition, pp. 1251-1255, 1986.
- H.C. Lee, K.B. Kim, H.J. Park, and E.Y. Cha, "An Improved Adaptive Binarization Algorithm Based on Fuzzy Logic," International Journal of Saftware Engineering and lts Applications, Vol. 10, No. 10, pp. 1-8, 2016.
- H.C. Lee, K.B. Kim, H.J. Park, and E.Y. Cha, "An α-cut Automatic Set based on Fuzzy Binarization Using Fuzzy Logic," Journal of the Korea Institute of Information and Communication Engineering, Vol. 19, No. 12, pp. 2924-2932, 2015. https://doi.org/10.6109/JKIICE.2015.19.12.2924
- K.B. Kim and D.H. Song, "Automatic Defect Detection using Fuzzy Binarization and Brightness Contrast Stretching from Ceramic Images for Non-Destructive Testing," Journal of the Korea Institute of Information and Communication Engineering, Vol. 21, No. 11, pp. 2121-2127, 2017. https://doi.org/10.6109/JKIICE.2017.21.11.2121
- H.C. Lee, "A Method of Binarization with Less Information Loss using Merge and Conquer Approach and Fuzzy," International Information Institute, Vol. 20, No. 8(A), pp. 5595-5600, 2017.
- H.C. Lee, "Fuzzy Logic-based Binarization : A Divide and Conquer Approach," International Information Institute, Vol. 21, No. 2, pp. 687-694, 2018.
- H.C. Lee, "Binarization Method of Night Illumination Image with Low Information Loss Using Fuzzy Logic," Journal of the Korea Institute of Information and Communication Engineering, Vol. 23, No. 5, pp. 540-546, 2019. https://doi.org/10.6109/JKIICE.2019.23.5.540