DOI QR코드

DOI QR Code

Study on the classification system of identification of the enemy in the military border area

군 경계지역에서 피아식별 분류 시스템 연구

  • 이준형 (육군사관학교 AI.데이터과학과) ;
  • 권현 (육군사관학교 AI.데이터과학과)
  • Received : 2024.06.11
  • Accepted : 2024.07.15
  • Published : 2024.09.30

Abstract

The identification and classification of victims in the county border area is one of the important issues. The personnel that can appear in the military border area are comprised of North Korean soldiers, U.S. soldiers, South Korean soldiers, and the general public, and are currently being confirmed through CCTV. They were classified into true categories and learned through transfer learning. The PyTorch machine learning library was used, and the dataset was utilized by crawling images corresponding to each item shared on Google. The experimental results show that each item is classified with an accuracy of 98.7500%. Future research will explore ways to distinguish more systematically and specifically by going beyond images and adding video or voice recognition.

군 경계지역에 피아식별 분류는 중요한 이슈 중에 하나이다. 군 경계지역에 나타날 수 있는 인원으로 북한군, 미군, 한국군, 일반인으로 구성하였고 현재 cctv를 통해 확인하고 있지만, 이를 더욱 효율적이고 체계적으로 구분하기 위해 North Korean Army, South Korean Army, American Army, People의 4진분류로 구분해 전이학습을 통해 학습시켰다. 파이토치 머신러닝 라이브러리를 사용하였고, 데이터셋은 구글에 공유된 각 항목에 해당하는 이미지들을 크롤링하여 활용하였다. 실험결과는 98.75%의 정확도로 각 항목을 구분하는 것을 볼 수 있다. 향후 이미지를 넘어서 동영상이나 음성 인식을 추가해 더욱 체계적이고 구체적으로 구분할 수 있는 연구가 지속될 수 있을 것이다.

Keywords

1. 서론

피아식별을 인식하고 분류하는 것은 GP에서의 감시 임무 중의 큰 과업 중 하나이다. 감시 작전은 군 내에서 가장 중요한 작전으로 적이 침투할 수도 있기 때문에 주야로 확실하고 신중하게 임무에 임해야 한다. 그러나 대한민국의 감시망이 종종 무너지고는 한다. 일례로 2012년도의 ‘북한군 노크귀순 사건’은 대한민국 국민에게 큰 충격을 준 사건이었다. 당시 김관진 국방장관은 15일 이른바 동부전선 북한군 `노크귀순' 사건 관련 대국민 사과문을 통해 "이번 귀순사건을 분석해본 결과 명백한 경계작전 실패와 상황보고 체계상 부실이 있었다"고 자인했다[1]. 다음과 같은 사고가 발생하지 않기 위해서 현재 대한민국은 다양한 cctv를 두고 감시하고 있다[2]. 그러나 사람이 감시하는 방법에 있어서 제한사항이 존재하기 때문에 인공지능 기술이 접목된 감시 체계를 구축하는 것이 필요하다. 예를 들어, 감시 카메라에 사람이 관측됐을 때, 피아식별로 대상인물이 구분할 때 인공지능 기반의 분류시스템이 반영이 되면 보다 효과적으로 감시 임무를 수행할 수가 있다.

본 논문에서 우리는 전이학습 방법[3]을 활용하여 4진 분류 방법을 제안하였다. 제안방법에서 피아식별을 하기 위한 전이학습 모델을 구축하였고 직접 데이터셋을 구축하여 성능을 평가하였다. 데이터셋 구축은 인터넷 상 공개된 이미지를 크롤링하여 구축하였다. 구축된 이미지를 분류하기 위하여 ResNet34 합성곱 신경망[4]을 이용하여 전이학습을 방법으로 제안모델을 구축하였다. 제안방법을 통해서 군 경계작전에서 4진 분류 모델에 대한 가능성을 보여줄 수 있다는 점에 의미가 있다. 또한, 이 연구는 대한전자공학회 하계학술대회[5]에서 일부 내용을 발표하였으며 학술대회 내용을 확장하여 논문 작성하였다.

이 연구에서 2장에서 제안 방법과 관련된 관련 연구를 소개한다. 3장에서 제안방법에 대한 주요 내용을 기술하였다. 4장에서 제안방법의 성능을 검증하기 위한 실험 환경 및 실험결과를 기술하였다. 5장에서 제안방법을 국방분야에 활용 측면에 대한 토론내용을 기술하였다. 6장은 이 논문의 결론으로 구성하였다.

2. 관련연구

2.1 전이학습

전이학습(Transfer Learning)은 이미 한 분야에서 학습된 모델을 비슷하거나 관련 있는 다른 분야에 적용하여 사용하는 학습 방법이다. 이 방법은 대규모 데이터셋으로 사전 학습된 모델을 기반으로 하여, 새로운 작업이나 데이터셋에 대해 모델을 빠르게 학습시키고 성능을 개선하는 데 도움을 준다. 전이학습에는 두 가지 중요한 개념이 존재한다, 첫째는, 사전 학습된 모델(Pre-trained Model)으로 이미 대규모 데이터셋을 사용하여 특정 작업에 대해 학습된 모델이다. 이 모델은 일반적인 특징을 추출하는 능력을 갖추고 있다. 두 번째로 미세 조정(Fine-tuning)은 사전 학습된 모델을 새로운 작업이나 데이터셋에 맞게 조정하는 과정이다. 일반적으로 모델의 마지막 몇 개 층을 새로운 작업에 맞게 재학습시키거나, 때로는 모델의 일부를 동결시켜서 학습시키는 방법을 사용한다. 실제 환경에서 고성능의 딥러닝 모델을 구현할 수 있을 만큼의 학습 데이터를 확보하지 못하는 경우가 많다. 따라서 이를 극복하기 위해 학습 데이터의 수를 늘리거나 전이학습을 이용하여 모델을 구현하는 방법을 많이 사용한다. 특히 전이학습기반의 모델 구현기법은 우수한 성능의 모델을 효율적으로 구현할 수 있다는 장점이 있다.

2.2 합성곱 신경망

합성곱 신경망[6](Convolutional Neural Networks, CNNs)은 주로 이미지 인식, 비디오 분석, 자연어 처리 등의 분야에서 사용되는 딥러닝의 한 형태이다. 이 신경망은 이미지에서 패턴을 인식하고 이해하는 데 특히 효과적이다. 합성곱 신경망은 하나 이상의 합성곱 층(Convolutional Layer)과 그 뒤를 이어지는 일련의 층(layers)으로 구성된다. 이 네트워크는 입력된 이미지에서 특징을 자동으로 추출하고 이를 바탕으로 분류, 인식 등의 작업을 수행한다. 이러한 합성곱 신경망에 전이학습과 연계하여 사용할 경우, 특정 도메인에 fine-tunning된 딥러닝 모델을 구축하기가 용이하다.

3. 제안방법

제안방법은 전이학습 기법을 통해서 군에서 발생할 수 있는 피아식별 모델을 구축하였다. 경계지역에서 발생할 수 있는 피아 상황으로 아군, 북한군, 미군, 일반인으로 4진 분류를 설정하였다. 데이터셋 구축은 크롤링을 통해서 인터넷상 공개된 이미지를 수집하였다. 파이썬 라이브러리인 beautifulsoup[7]를 통해서 웹 상 공개된 이미지를 수집하였다. (그림 1)과 같이, 전이학습 모델로 ResNet34를 이용하였다. 전이학습 모델은 마지막 층에 있는 가중치만 업데이트가 가능하게 하고 나머지 층은 가중치 업데이트가 되지 않도록 설정한다. ResNet34는 ImageNet 데이터셋을 이미 학습한 모델로 1000가지 종류의 실제 이미지를 분류할 수 있으며 파라미터의 수가 적으면서 성능이 좋은 것이 특징이다. 이 모델의 마지막층에 노드 4개인 fully connected layer를 추가하여 모델을 구축하였다.

SOBTCQ_2024_v24n3_203_3_f0001.png 이미지

(그림 1) 제안방법의 구조

4. 실험 및 평가

이 장에서는 제안방법을 검증하기 위하여 실험 환경 및 실험 결과에 대해서 기술하였다. 본 실험을 진행한 실험환경은 Pytorch 머신러닝 라이브러리[8]를 사용하였으며, GPU는 Nvidia Tesla T4을 사용하였다.

4.1 데이터셋

피아식별과 관련된 데이터를 수집하기 위해서는 군 문서를 참고하는 것이 우선적이나, 보안 사유로 군 문서를 이용할 수 없었다. 따라서 'downloader.download'을 사용하여 인터넷 상에 존재하는 데이터들을 수집하였다. 4개의 클래스로 구분했으며, North Korean Army, South Korean Army, American Army, People의 4진분류로 구분하였다. 각 클래스 별 120개의 데이터를 수집하였고, 40장은 테스트 데이터로 사용하였다. 따라서 학습데이터셋과 테스트데이터셋은 3:1 비율로 유지하여 제안방법에 대한 성능을 검증하였다.

4.2 분류 모델

분류모델로 ResNet34를 사용하였다. ResNet34 모델은 residual 모듈을 이용하여 각 층마다 출력값에 대해서 입력값을 더해서 제공하는 방법으로 경사하강법에서 기울기소실 문제 등을 해결 할 수 가 있다. 또한 reception 효과를 가지고 있어서 적은 양의 파라미터로 특징을 추출할 수 있는 장점이있다. 이 ResNet34 모델을 이용하여 분류모델을 구축하였고 마지막 층에 있는 노드 수는 4진 분류이기 때문에 4개 노드로 설정하여 구축하였다. 최적화 알고리즘은 Adam를 사용하였고 학습률은 0.01이고 epoch은 50으로 설정하였다.

4.3 분석 결과

(그림 2)와 같이, num_epochs = 50으로 설정하여 모델을 학습시킬 총 에포크(epoch) 수를 50으로 설정하고 에포크 당 평균 손실과 정확도를 계산했다. 50 이상일 경우, 과적합 현상이 발생하는 경우가 있어 적절히 조절하였다. 전체 학습 데이터 셋을 에포크 수만큼 반복하며, 각 반복마다 모델의 손실을 최소화하고 정확도를 높이기 위해 가중치를 업데이트하는 과정을 보여준다.

SOBTCQ_2024_v24n3_203_4_f0001.png 이미지

(그림 2) 실험 과정

다음 그림은 업데이트된 값들을 보여준다. 정확도가 40번 이후부터는 98%에 수렴하는 것을 알 수 있다. 각 클래스 별 데이터와 학습된 프로그램이 예측한 결과를 비교했을 때 98.75%의 높은 정확도를 보였다. 제안 모델은 임의의 북한군, 한국군, 미군, 일반인의 사진이 입력했을 때, 그 사진이 어떤 클래스의 사진인지 적절히 구분했다. (그림 3)은 그 예시를 제공한다.

SOBTCQ_2024_v24n3_203_4_f0003.png 이미지

(그림 3) 실험 이미지 결과 (예시)

5. 국방 분야에서의 제안방법 활용

제안방법은 군 경계지역에서 발생할 수 있는 피아식별 분류 시스템이다. 군 경계지역에서 발생할 수 있는 인원으로 북한군, 한국군, 일반인이 있으며 JSA와 같은 지역에 미군이 있을 수 있으므로 4개 분류로 지정하였다. 현재 군 과학화 경계시스템에서 딥러닝을 이용한 분류는 사람인지? 동물인지? 차량인지? 분류하는 3진분류로 피아식별 시스템에 대한 분류는 없기 때문에 제안방법의 피아식별은 의미가 있을 것이라고 판단하고 있다.

제안 방법에서 전이학습 기법을 사용한 이유는 데이터셋이 부족할 경우 사용할 수 있는 좋은 기법이기 때문이다. 전이학습 기법은 ImageNet 데이터 셋과 같이 일반적인 그림을 잘 분류하는 VGG 모델이나 ResNet 모델의 파라미터를 대부분 고정하고 사용자가 원하는 특정 이미지를 마지막 층의 파라미터만 업데이트를 하여 분류하는 방법이다. 전이학습 기법의 장점은 데이터셋의 수가 부족하여도 성능이 좋게 나올 수 있는 장점이 있다. Image Net과 같이 백만장 이상의 이미지와 1000개 클래스의 데이터셋을 구축하는 것이 제한되기 때문에 일반적으로 전이학습 기법을 이용하여 사용자가 원하는 특정 이미지 분류 문제해결에 용이하고 각종 경진대회 등에서도 많이 사용되는 기법이다.

제안 방법의 한계점으로 제안 방법에서 사용한 것은 인터넷 상 공개된 데이터를 크롤링하여 구하였다. 실제적으로 군 경계지역에 CCTV에서 취득된 데이터를 수집하고 학습하는 것이 가장 현실성이 높은 방법이나 군 보안 문제로 데이터가 공유가 제한되는 한계점이 있다. 향후 연구에는 군 경계 CCTV 데이터를 이용하는 것이 좀 더 현실성이 있으며 제안방법은 그 가능성을 보여준 것에 의미가 있다고 볼 수가 있다.

6. 결론

본 논문에서는 우리는 전이학습 기법을 적용하여 피아식별 분류 모델을 제안하였다. 제안된 방법은 이미지 크롤링을 활용하여 전이학습으로 시스템을 학습시켰다. 클래스별 120개의 이미지 데이터를 활용하였고 실험결과 98.75% 정확도를 보였다. 본 연구를 통해서 제안 방법을 감시체계에 활용하면 피아식별에 대해서 도움이 될 수 있을 가능성을 보여주었다.

이후 연구를 통해 영상 데이터나 음성 데이터도 인식할 수 있게 모델을 만든다면 실제 대한민국의 안보 환경에도 더욱 효율적으로 운용될 수 있을 것이다.

References

  1. 박창권. "국방정책 2012 회고와 2013 추진방향", 전략연구, pp. 5-37, 2012.
  2. 한창희, 구하림, and 박복기. "AI 모델을 적용한 군 경계체계 지능화 방안", Journal of Internet Computing & Services, 24권, 제3호, 2023.
  3. Iman, Mohammadreza, Hamid Reza Arabnia, and Khaled Rasheed. "A review of deep transfer learning and recent advancements", Technologies, Vol. 11, 2023.
  4. Gao, Le, et al. "The Application of ResNet-34 Model Integrating Transfer Learning in the Recognition and Classification of Overseas Chinese Frescoes", Electronics, Vol. 12, 2023.
  5. 이준형, and 권현. "군 경계지역에서 피아식별 분류시스템", 대한전자공학회 학술대회 (2024): 3127-3129.
  6. Cong, Shuang, and Yang Zhou. "A review of convolutional neural network architectures and their optimizations", Artificial Intelligence Review, Vol. 56, pp. 1905-1969, 2023. https://doi.org/10.1007/s10462-022-10213-5
  7. Abodayeh, Ayat, et al. "Web Scraping for Data Analytics: A BeautifulSoup Implementation", 2023 Sixth International Conference of Women in Data Science at Prince Sultan University, 2023.
  8. Wu, Peng. "Pytorch 2.0: The journey to bringing compiler technologies to the core of pytorch (keynote)", Proceedings of the 21st ACM/IEEE International Symposium on Code Generation and Optimization. 2023.