DOI QR코드

DOI QR Code

A Study on the Industrial Application of Image Recognition Technology

이미지 인식 기술의 산업 적용 동향 연구

  • 송재민 (경희대학교 빅데이터연구센터 연구교수) ;
  • 이새봄 (경희대학교 빅데이터연구센터 연구교수) ;
  • 박아름 (경희대학교 빅데이터연구센터 연구교수)
  • Received : 2020.05.15
  • Accepted : 2020.06.11
  • Published : 2020.07.28

Abstract

Based on the use cases of image recognition technology, this study looked at how artificial intelligence plays a role in image recognition technology. Through image recognition technology, satellite images can be analyzed with artificial intelligence to reveal the calculation of oil storage tanks in certain countries. And image recognition technology makes it possible for searching images or products similar to images taken or downloaded by users, as well as arranging fruit yields, or detecting plant diseases. Based on deep learning and neural network algorithms, we can recognize people's age, gender, and mood, confirming that image recognition technology is being applied in various industries. In this study, we can look at the use cases of domestic and overseas image recognition technology, as well as see which methods are being applied to the industry. In addition, through this study, the direction of future research was presented, focusing on various successful cases in which image recognition technology was implemented and applied in various industries. At the conclusion, it can be considered that the direction in which domestic image recognition technology should move forward in the future.

본 연구는 이미지 인식기술 서비스의 산업 적용 사례를 기반으로 인공지능이 이미지 인식기술에 어떠한 역할을 하고 있는지 살펴보았다. 이미지 인식 기술을 사용하여 위성사진을 인공지능으로 분석해 특정 국가의 원유 저장탱크의 산출 내역을 밝혀내거나, 사용자가 촬영하거나 다운로드한 이미지와 유사한 이미지나 제품을 검색해주기도 하며, 과일의 산출량을 정렬한다거나 식물의 질병을 탐지해 낼 수도 있다. 딥러닝과 신경망 알고리즘을 기반으로 사람의 나이, 성별, 기분까지도 인식할 수 있어 이미지 인식 기술이 다양한 산업에서 적용되고 있음을 확인하였다. 본 연구에서는 국내 및 해외의 이미지 인식 기술의 활용 사례를 살펴보는 것 뿐 아니라, 어떠한 형태로 산업에 적용되고 있는지 확인을 할 수 있다. 또한, 본 연구를 통하여 여러 산업에서 이미지 인식기술을 구현하고 적용하여 발전시킨 여러 성공 사례들을 중심으로 향후 연구의 방향성을 제시했으며, 향후 국내 이미지 인식 기술이 나아가야 할 방향을 고찰해 볼 수 있다.

Keywords

I. 서론

이미지 인식 기술은 인공지능 기술을 기반으로 인간의 시각적인 인식 능력까지 재현하는 단계까지 가능하게 하고 있다. 이미지 인식 기술은 일반적으로 이미지에 나타난 객체를 인식하는 기술을 뜻한다[1]. 이미지 인식 기술은 인공지능의 핵심 기술 중의 하나로 최근에는 이미지 내의 객체 인식뿐만 아니라 영상 데이터 기반 객체인식까지 확장되고 있다. 전 세계 인공지능 시장은 2025년 368억 달러로 성장할 예정이며, 특히 이미지 인식 및 테깅 분야는 약 81억 달러로 시장규모가 크게 증가할 전망이다[2].

이미지넷(ImageNet)의 등장과 함께 대량의 이미지 인식용 데이터가 배포되었고 딥러닝 기술의 발전으로 이미지 인식 기술은 급격하게 성장하였다. 이미지넷은 스탠포드 대학의 Fei-Fei Li 교수가 2009년 이미지에 나타난 객체를 인식하기 위해 데이터를 구축한 프로젝트를 뜻한다. 이미지 데이터베이스를 공개하여 다양한 종류의 사진들을 모든 사람들이 무료로 이용할 수 있도록 하였다. 이미지넷을 통해 인공지능의 컴퓨터 비전 (Computer vision)분야의 교육 데이터 부족 문제를 해결해주고 있다[3]. 딥러닝 기술은 수많은 층(Layer)로 구성된 신경망 구조를 대용량의 데이터를 이용하여 학습시키는 기술을 뜻한다. 딥러닝 기술로 인해 다양한 데이터 환경에서 고성능의 객체인식이 가능하게 되었고 사람의 인지 수준을 뛰어넘어서고 있다[4].

이미지 인식 기술은 이미지 분류, 이미지 찾기, 이미지 인식과 대상분할 4가지로 크게 분류할 수 있다. 이미지 분류(Image classification)는 이미지에서 하나의 객체를 분류하는 것을 뜻하며, 이미지 찾기(Image Localization)는 대상의 위치가 이미지의 어느 영역에 있는지 위치를 표시하는 기술이고, 이미지 인식(Image detection)은 이미지에서 여러 대상을 찾고 위치를 표시해주는 기술이다. 대상분할(Object captioning)은 이미지에 포함된 대상을 정확하게 선으로 분할하는 기술을 뜻한다[5]. 이러한 이미지 인식 기술은 다양한 분야에서 사용되고 있다. 의료이미지를 분석하여 질병을 발견하거나, 제조과정의 결함을 검수작업에서 찾아내기도 한다.

본 연구는 인공지능 기반의 이미지 인식 기술을 활용한 서비스들의 동향을 살펴보고 이미지 인식 기술의 발전사항에 대해 논의해 보고자 한다. 본 연구는 다중 사례연구방법론을 기반으로 사례를 선택하였으며[6], 사례선택방법 중 임의선택방법과 정보중심 선택 방법이 존재하는데[7] 본 연구는 정보중심 선택방법을 택하여 위에서 언급한 이미지 인식 기술 4가지를 기준으로 사례를 선별하였다. 사례 수에 대한 기준은 4~10개가 적절하다는 선행연구[8]의 의견을 따라서 연구를 진행하였다.

Ⅱ. 이론적 배경

1. 컴퓨터 비전 기술 연구

기존 연구는 컴퓨터 비전 기술 개발 연구와 컴퓨터 비전 기술을 활용함에 있어 특정 산업분야에서 제한적으로 연구되고 있다.

컴퓨터 비전 기술은 인공지능의 한 분야로 인간의 눈의 기능을 기계가 수행할 수 있도록 카메라로부터 영상 이미지를 취득하고, 알고리즘을 통하여 분석하고 판별한다[9]. [표 1]은 컴퓨터 비전을 위해 사용되는 최근의 주요 기술을 나타낸다. 특히, 컴퓨터 비전에서 이미지 인식 기술 개발이 중요한데, 카네기 멜론 대학교에서 다중 인물에 대한 제스처를 인식하는 기술인 오픈포즈 (OpenPose)를 개발하였으며, 이는 기존 이미지 인식 기술과 달리 실시간으로 여러 사람의 몸, 손, 및 얼굴의 특징을 포함해 추출할 수 있다. 즉, 실시간으로 다중 행동에 대한 제스처 인식의 성능을 개선하였다. 이미지 객체 감지 알고리즘인 YOLO(You Only Look Once) 는 증강현실이나 자율주행차 연구 등에서 이미지 인식을 활용한 기술 개발에서는 주요 기술로 다뤄지고 있고, 현재 기존 YOLO알고리즘을 개선하거나 연구 상황에 맞춰 제안하는 연구들이 활발하게 진행되고 있다. 생성적 적대 신경망(GAN, Generative Adversarial Networks)을 활용한 연구에서는 인공지능의 창의성을 볼 수 있는 주요 기술로 실제 이미지를 변경해 가짜 이미지를 생성하는 기술로 활용되고 있다.

표 1. 컴퓨터 비전 기술

CCTHCV_2020_v20n7_86_t0001.png 이미지

딥러닝을 이용한 객체 인식 및 검출 기술 동향에 대한 연구는 컴퓨터 비전 기반 물체 인식 및 검출 기술과 관련한 모델과 알고리즘에 대해 소개한다. 딥러닝 기술의 근간이 되는 FCNN(Fully-Connected Neural Network)에서부터 1989년 발표된 CNN, 2012년 Deep CNN모델인 AlexNet가 등장하면서 많은 연구팀들이 딥러닝 기반 알고리즘을 활용하게 되었다. 또한 VGG Net과 GooLeNet은 2014년에 소개되었으며 GooLeNet은 학습과정에서 발생되는 과적합 문제를 해결하기 위해 네트워크 구조를 개선함으로써 우수한 인식률을 보였다. 이후 소개된 ResNet는 딥러닝 네트워크 구조가 깊어질수록 학습과정에서 발생하는 오류 문제를 해결하기 위해 제안된 Residual Learning 머신러닝 학습 방법이다. 이러한 딥러닝 기반 객체 인식 및 검출 기술은 페이스북의 얼굴인식 서비스, 구글의 구글 포토 서비스, 불량품을 선별[5], 스마트 팩토리의 업무 효울화[21], 건설현장의 공정관리, 안전 관리, 생산성 관리, 구조물 유지관리, 역설계, 손상 탐지 및 평가를 위해 활용되고 있다[22].

2. 컴퓨터 비전 기술 응용 연구

딥러닝 기술로 인해 딥러닝 기반 이미지 인식 기술이 적용된 산업분야마다 그 활용목적이 다양하다. 컴퓨터 비전의 주된 활용 목적 중 하나는 영상이나 이미지에서 체의 감지(detection)[15] 를 하거나, 인식(recognition) [16], 분류(segmentation)[17], 및 위치(location)를 파악하고자 하는 것이다. 그 이외에도 연속 영상에서 물체를 추적하거나, 3D 모델로 맵핑(mapping) 하는데 활용되기도 하며, 인간의 팔다리 움직임을 3D로 추정 (estimation)을 하고, 디지털 영상을 콘텐츠에 따라 탐색(content-based image retrieval) 하기 위해 활용되고 있다[18].

이미지 기반의 식물 인식 기술 사례를 조사한 연구에서는 이미지 인식 기술을 ‘이미지 분류, 이미지 찾기, 이미지 인식, 대상 분할’로 구분하고, 식물 분야에서는 특히 이미지 분류 기술이 주로 사용되고 있으며, GAN (Generative Adversarial Network)을 이용한 식물 이미지 생성 기술, 식물 도감 기반 식물 이미지 분류 기술을 소개하면서 관련 기술을 적용한 스마트폰 앱 서비스 사례를 소개하고 있다[1]. 교통분야에서는 자율 주행 자동차 개발 그리고 교통 모니터링의 목적으로 교통안전 향상을 위해 이미지 인식 기술이 활용되고 있다. 자율 주행을 위한 환경 인식 기술은 레이다, 카메라 등의 센서를 사용하여 차량, 보행자 등의 장애물, 도로표식, 신호 등을 인식하는데 활용되고 있다[19]. 민준영은 교통현장에 설치된 CCTV는 정보수집 기능이 없었으나 최근에는 CCTV영상을 기반으로 교통 정보의 세분화, 다양화, 교통시설정보, 도로 등의 안전감지, 교통정보제공, 사고 및 돌발 상황 감지 기술을 사용하여 실시간 교통자료를 바탕으로 교통사고의 원인분석을 하고 있다고 밝혔다[20]. 본 연구는 기존의 연구들이 모델링과 알고리즘 개발과 관련된 기술연구에 중점을 둔 것과 달리, 제한된 영역에 한하여 컴퓨터 비전 기술을 활용하여 비즈니스적 가치를 창출한 사례들을 소개하고자 한다. 따라서 본 연구는 기존의 산업분야 외에 다양한 산업분야에서 컴퓨터 비전 기술이 어떻게 활용되고 있는지 어떤 가치를 창출하는지 분석함으로써 컴퓨터 비전 기술이 다양한 산업분야에서 활용될 수 있도록 하고자 한다.

Ⅲ. 이미지 인식 기술 기반의 서비스

1. 블루리버 테크놀로지(Blueriver technoloty)

블루리버 테크놀로지는 머신러닝 기술을 활용해 토양 상태를 분석하여 제초제와 비료·물을 뿌리는 시기와 양을 조절한다. 또한 트랙터 하단에 설치한 카메라가 토지를 촬영하면 인공지능이 데이터를 분석해 잡초와 작물을 구분하여 잡초에만 정확하게 제초제를 분사하고 작물에는 비료를 떨어뜨려 농작물 수확량을 늘릴 수 있게 도와준다. [그림 1]의 오른쪽 그림은 미국 실리콘 밸리의 인공지능 기업 블루리버 테크놀리지에서 개발한 AI트랙터이다[23].

CCTHCV_2020_v20n7_86_f0002.png 이미지

그림 1. 제초제 살포 화면 [25]

미국에서는 작물 재배 과정에서 제초제를 너무 광범위하게 사용한 결과, 토양 오염이 심각해진 것뿐만 아니라 제초제에 내성을 가진 잡초들이 번식하게 되었다. 하지만 선택적으로 제초제를 사용함으로써 제초제 사용량을 90% 가량 줄여 토양오염을 방지할 수 있게 되었다[24]. 특히 농업분야는 농작물 생산량 증가 속도가 인구 증가 추세를 따라가지 못하고 있는데 인공지능이나 빅데이터 기술이 적극적으로 활용됨으로써 농·축산업의 생산성과 효율성을 향상시켜 인구증가에 따른 식량 부족문제를 해결해 줄 수 있을 것으로 예상된다. 하지만 국내의 경우 스마트 농장 건립을 추진하려는 시도가 있었지만 ‘대기업이 농민 생존권을 침해한다’는 반발로 무산되었다. 국내의 농업분야의 경쟁력을 확보하기 위해서 이러한 기술을 도입함으로써 발생될 수 있는 이해관계자들 간의 갈등을 해결할 수 있는 정부의 정책 및 노력이 필요하다.

2. 케스프리(Kespry)

2013년에 설립된 케스프리는 광산 및 채굴 산업분야 에서 시작하여 산업용 고객에게 가입 기반 드론 서비스를 제공하고 있다. 드론으로부터 포착한 이미지를 바탕으로 비축 양을 체적 측정할 수 있는 도구를 제공하고 있으며, 건설, 보험에 이어 에너지 분야로의 진출을 꾀하고 있다[26]. 특히 드론을 활용할 수 있는 공간에서 실행 가능한 비즈니스 모델을 설계하고 아직 초기시장 임에도 불구하고 광산 채굴 사업이라는 틈새시장을 개척함으로써 세일스포스 벤처스로부터 많은 자금을 조달받을 수 있었다. 2019년 300개 이상의 고객사 중 200개 이상이 광산 채굴 사업 고객으로, 케스프리의 비즈니스 모델은 광산 채굴 산업뿐만 아니라 보험 산업에도 활용가능하다. 드론을 활용한 인공지능 플랫폼을 통해 폭풍 등으로 파손된 지붕의 손상 정도를 자동으로 계산하여 보험사가 고객의 보험 지급액을 결정할 수 있기 때문에 보험회사 직원이 손상 정도를 직접 체크할 필요가 없어 직원의 업무 안전성을 향상시킬 수 있다 [그림 2].

CCTHCV_2020_v20n7_86_f0003.png 이미지

그림 2. 케스프리 드론의 지붕 손상 촬영 [27]

또한 건설사가 건설 현장에 적치한 모래 자재 재고량을 자동으로 확인하는 등 건설기업이 차후 공정 계획을 수립하는데 도움을 줄 수 있을 것으로 예상된다.

3. 오비털 인사이트(Orbital Insight)

위성사진을 인공 지능(AI)으로 분석해 전 세계에서  전개되는 다양한 경제 활동의 최신 흐름을 파악해 주는 정보 서비스를 제공하고 있는 스타트업 기업으로, 비공식 정보들을 인공지능 기술을 활용하여 제공하고 있다.

오비털 인사이트의 AI가 인공위성사진을 바탕으로 사우디의 원유 탱크를 전면 재조사한 결과, 석유 산업의 조사 기관이 과거 산출했던 것보다 2배가 많은 원유 탱크가 있는 것으로 밝혀졌다.

CCTHCV_2020_v20n7_86_f0004.png 이미지

그림 3. 위성에서 촬영된 원유탱크 모습 [28]

뿐만 아니라 오비털 인사이트는 중국 전역의 원유 저장탱크를 찾아내 중국의 원유 저장량이 중국 당국의  공식 발표보다 많다는 사실을  밝혀냈다. 오비털 인사이트는 딥러닝을 비롯한 AI 기술과 이미지 인식기술의 발전을 통해 수천만 장의 위성사진을 분석할 수 있으며, 위성사진 분석을 통한 정보제공이라는 비즈니스 모델의 잠재력을 인정받아 주요 VC로부터 총 8,000만 달러의 투자를 유치하였다[29].

4. 로고그랩(LogoGrab)

로고그랩은(LogoGrab)은 아일랜드에서 시작된 스타트업으로 Google의 연구원들이 개발한 기술로 기업이 소셜 미디어에서 로고 사용을 식별할 수 있도록 하는 서비스를 하고 있다. 핵심 기술은 인공지능 알고리즘을 통해 이미지 및 동영상 혹은 GIF에서 로고와 마크가 포함된 이미지를 찾을 수 있도록 하는 이미지 감지 기술이다. 수백만 개의 이미지와 비디오를 스캔하고 사용자가 찾고자 하는 특정 브랜드 로고를 식별하도록 설계하였다. 이미지를 사용하여 브랜드 인지도 혹은 비즈니스를 유도할 수 있도록 하며, 브랜드, 광고주들은 수익을 창출하기 위해 자신들의 콘텐츠에 어떠한 일이 발생하는지를 이해할 수 있다. 소비자들은 로고그랩의 서비스를 통해 스마트폰에서 브랜드 로고를 스캔하여 제품 정보 및 서비스에 접근할 수 있다.

로고그랩은 로고 감지 API를 사용자의 플랫폼에 통합시켜 소셜미디어에서 공유되는 이미지, 비디오 및 GIF와 같은 콘텐츠를 모니터링 한다. 따라서 사용자에게 정확한 시각적 데이터 분석 및 고객에 대한 통찰력을 제공할 수 있다. 또한 스포츠 스폰서십 모니터링에도 서비스를 사용하고 있다. 브랜드의 투자를 보다 정확하고 대규모 단위로 측정할 수 있게 도와주고 있다. 기업의 독점 콘텐츠가 유통되거나 위조 품목을 식별하는데도 이용이 가능하다[30].

CCTHCV_2020_v20n7_86_f0005.png 이미지

그림 4. LogoGrab의 위조제품 식별 [30]

5. 이마가(Imagga)

이마가(Imagga)는 비주얼 검색(Visual search)을 통해 사용자가 카메라로 촬영한 이미지 혹은 인터넷에서 다운로드 한 이미지를 사용하여 유사한 이미지나 제품을 검색할 수 있는 서비스를 하고 있는 회사이다. 이미지 기반 검색 기능이 핵심이다. Imagga Visual Search API를 통해 이미지 기반 검색을 소프트웨어 시스템 및 응용 프로그램에 구현하여 시각적 데이터의 검색을 가능하게 한다. Imagga의 서비스를 통해 텍스트 검색보다 쉽게 실제 유사성을 기반으로 제품을 검색할수 있다는 장점이 있다. 비주얼 검색은 딥러닝 기술을 통해 이미지에서 메타 데이터를 추출한 후 이미지 색인을 만들고 의미, 색상, 범주 또는 기능적 유사성을 기반으로 최상의 결과를 검색해서 나타낸다.

Imagga의 비주얼 검색 서비스는 사용자가 웹이나 직접 가져온 이미지를 업로드 하여 유사한 항목을 검색할 수 있게 도와주고 딥러닝 기술을 통해 검색 정밀도를 높여주며 유사한 제품을 표시하여 품절 된 제품에 대한 대안을 제공해서 제품의 전환율을 높여주기도 한다[31].

CCTHCV_2020_v20n7_86_f0006.png 이미지

그림 5. Imagga의 visual search [31]

6. BitRefind Group

BitRefind Group은 이미지 인식 기술을 토대로 이미지 및 동영상 전처리 서비스를 하고 있으며, 객체 및 이벤트 감지, 이미지 내용 인식, 장면 분할(scene segmentation), MRI 혹은 X-Ray의 2D 이미지의 3D 장면 재구성 등과 같은 다양한 서비스들을 하고 있다. 이 중에서도 본 연구에서는 농업에서 사용되고 있는 서비스를 소개하고자 한다. 먼저, 식물 질병 탐지(Plant disease detection) 서비스이다. 농작물 질병은 농산물의 품질뿐만 아니라 수량을 심각하게 감소시키기 때문에 매우 중요한 문제이다. BitRefind는 자동 식물성 질병 탐지 시스템으로 식물의 질병을 발견하는 서비스를 제공하고 있다. 차량에 설치된 카메라 및 컴퓨팅 하드웨어로 식물을 촬영하고 카메라에 포착된 이미지 흐름을 검사하여 병든 잎을 감지하고 분류한다. 인공 신경망을 기반으로 하여 식물 잎의 흠집이나 곰팡이와 같은 이상 징후를 인식하고 질병을 구별하는 게 특징이다 [32].

다음으로 과일과 꽃을 자동으로 정렬하는 서비스이다. 과일의 모양, 크기, 색상, 질감, 표면 품질, 성숙도 및 대칭과 같은 여러 가지 시각적 특징을 통해 산출량을 정렬하는데 도움을 주고 있다. 다양한 유형의 카메라를 기반으로 수십 가지 기능을 추출하여 해당 과일의 품질을 결정하고 정렬함으로써 농부들에게 편리성을 제공할 수 있다. 과일 등급을 매기는데 있어 이미지 획득, 이미지 전처리, 기능 추출, 그리고 정렬 및 등급지정 이라는 4단계를 거친다. 특히 특징을 추출해야하는 기능 추출 단계는 가장 복잡한 단계로 인공 신경망 모델을 사용하여 과일마다 다른 모델을 구축해야 한다[33].

CCTHCV_2020_v20n7_86_f0007.png 이미지

그림 6. BitRefind의 식물 질병 탐지 [32]

CCTHCV_2020_v20n7_86_f0008.png 이미지

그림 7. BitRefind의 과일 등급 정렬 [33]

7. 엔비디아(NVIDIA)

엔비디아는 컴퓨터용 그래픽 처리 장치와 멀티미디어 장치를 개발, 제조하는 반도체 회사로 1993년 설립 되었으며, 본사는 캘리포니아주의 샌타클라라에 있다 [34]. 주로 엑스박스와 플레이스테이션 3과 같은 비디오 게임기에 그래픽 카드 칩셋을 공급하였다.

최근 엔비디아가 99%의 높은 정확도로 사람 얼굴을 인식할 수 있는 인공지능 CCTV를 개발했으며, 지금까지 공개된 얼굴인식 CCTV로는 가장 정확도가 높다고 할 수 있다. 중국 정부가 2017년부터 도입하고 있는 얼굴인식 CCTV는 3초 안에 얼굴을 구별하고 정확도는 90% 정도인 것으로 알려졌다. 엔디비아가 이스라엘 얼굴인식 스타트업 애니비전과 공동으로 개발한 이 CCTV는 [그림 8]과 같이 수많은 인파 속에서도 100% 에 가까운 정확도로 얼굴을 인식해 어디로 이동하는지 실시간 추적이 가능하다. CCTV가 얼굴을 찍는 순간 즉시 식별이 가능할 만큼 인식 속도도 빠르다[35].

CCTHCV_2020_v20n7_86_f0009.png 이미지

그림 8. NVIDIA facial recognition [36]

얼굴인식 CCTV는 향후 범죄·테러 용의자를 24시간 감시하는 범죄예방 시스템 구축에 활용될 것으로 보인다. 은행 ATM같은 자동화기기 에도 설치가 가능해 불법 인출도 막을 수 있다. 엔비디아의 인공지능 CCTV 는 기존에 설치된 CCTV 단말기에 별도의 그래픽 칩만 꽂으면 되기 때문에 추가 설치비용도 많이 들지 않는다. 엔비디아는 처음 그래픽, 멀티미디어 장치를 개발하는 기업으로 설립되어 다양한 분야로 사업의 확장을 성공적으로 하고 있으며, 4차 산업혁명시대의 흐름에 맞게 인공지능을 활용한 안면인식 기술에서도 좋은 성과를 보이고 있다. 최근 성공적인 기업들의 경우 기술 및 시대의 흐름을 잘 타고 갈 때 좋은 성과로 이어지는 경향을 볼 수 있다. 한편, 엔비디아의 2020년의 기업 가치는 1천500억 달러이다.

8. 한본

한본은 1998년 중국 베이징에 설립된 기술 기반 기업이다. 한본은 인공지능 기술을 활용해 [그림 9]와 같이 마스크 착용자를 95% 확률로 식별해 내는 안면인식 솔루션을 개발했으며, 현재 베이징 경찰서를 비롯한 공공기관 200여 곳에 배치했다.

CCTHCV_2020_v20n7_86_f0010.png 이미지

그림 9. Hanvon facial recognition [39]

한본이 개발한 안면인식 솔루션은 600만 명의 마스크 미착용자 얼굴 이미지 표본과 소량의 마스크 착용자 얼굴 이미지 표본으로 구축한 데이터로 AI을 학습시키고, 지난 10년 동안 축적해 온 안면인식 기술 노하우를 접목하는 방식으로 개발했다[37].

솔루션은 두 가지 모델이 있는데, 건물 입구에 설치해 개별 통과자를 감식하는 싱글채널 모델과 1초에 30 명을 동시에 감식할 수 있는 멀티채널 모델로 구분된다. 실험 결과 마스크 착용자는 95%, 미착용자는 99.5% 확률로 식별해 냈다. 한본은 마스크와 선글라스를 함께 착용한 사람도 인식할 수 있는 안면인식 기술을 추가로 개발할 계획이며, 범죄자 색출 및 검거에 다양하게 활용 될 수 있을 전망이다[38]. 중국은 최근 범죄자 식별 및 검거를 위한 정부의 노력에 힘입어 규제 또한 다른 국가에 비해 적은편이다. 이미지 인식 기술을 개발하는 기업들은 기술개발에만 집중할 수 있는 조건이 가능해지며 그 성과가 결과물로 나타나고 있다. 한본의 기업 가치는 2020년 기준 7226억 원이다.

9. 사이버링크

사이버링크는 DVD 재생 프로그램, 디지털 홈 등을 개발하는 기업으로 1995년 대만에서 설립되었다[40]. AI 및 안면인식 기술의 선두주자로 떠오른 사이버링크는 2018년 인증, 접근제어, 안전, 보안, 방문자 분석 등 다양한 분야에 활용이 가능한 페이스미라는 AI 안면 인식 기술을 선보였다. 페이스미는 다양한 생체 인증 파라미터를 활용한 세계 최고 수준의 AI 안면인식 엔진으로, 뛰어난 정확성과 성능, 보안성과 응용가능성으로 업계가 주목하는 기술이다. 2018년 말에 페이스미 솔루션을 출시한 이래 사이버링크는 하드웨어 제조업체, 시스템 통합업체, 솔루션 공급업체 등 수많은 파트너와의 협력을 통해 AI 안면 인식 기술을 IoT/AIoT 분야에 탑재해 왔다. 정교한 엣지 기반 아키텍처는 몇 밀리 초 내에 생체 인식 데이터를 로딩할 수 있으며, 다수의 플랫폼과 하드웨어를 지원한다. 딥러닝과 신경망 알고리즘을 기반으로 사람의 나이, 성별, 기분, 얼굴이 향하는 방향 등 다양한 데이터를 실제 얼굴 또는 녹화된 영상으로부터 인식할 수 있으며, 화상 데이터베이스 LFW DB(Labeled Faces in the Wild)에서 99.82%라는 높은 정확도를 기록했다[41]. 한편 사이버링크는 2019년 기준으로 1억달러의 매출액을 기록하였다

안면인식 기술은 스마트 기기의 보안을 위한 모바일 생체 인증이 보편화 되면서 생체인식 시장이 이미 빠르게 커지고 있으며, 연구소나 공공기관 등 보안이 중요한 곳의 출입을 위한 시스템으로도 활용이 가능하다. 향후에는 범죄·테러 용의자 등을 24시간 감시하는 범죄예방 시스템 구축에도 활발하게 활용될 것으로 보인다. 은행 자동화기기(ATM)에도 설치가 가능해 불법 인출도 막을 수 있다. 사이버링크에서도 볼 수 있듯이 안면 인식 기술의 다양한 분야의 활용이 예상될 뿐만 아니라, 기존의 영상보안 카메라에 적용하는 비용도 크지 않아 앞으로의 성장성이 더 클 것으로 기대된다.

Ⅳ. 결론

본 연구는 이미지 인식기술 서비스의 성공사례를 기반으로 인공지능이 이미지 인식기술에 어떠한 가치를 부여하고 있는지 알아보고자 하였다. 블루리버 테크놀로지는 머신러닝 기술을 활용해 토양상태를 분석하여 제초제와 비료, 물 등을 뿌리는 양과 시기를 조절한다. 과도한 제초제나 비료를 살포하지 않는 것이 가능해 손실을 줄일 수 있을 뿐 아니라, 수확량을 늘릴 수도 있어 긍정적이다. 케스프리는 광산 및 채굴 분야에서 드론으로부터 포착한 이미지를 분석하여 비축양을 측정할 수 있도록 하고 있다. 오비털 인사이트는 위성사진을 인공 지능으로 분석해 사우디나 중국의 원유 저장탱크의 산출 내역을 밝혀내는 등 이미지 분석으로 최신 흐름을 파악하는 정보 서비스를 제공하고 있다. 로고그랩은 인공지능 알고리즘을 통해 이미지 및 동영상 혹은 GIF에서 로고 이미지를 분석하여 위조제품을 식별하거나 브랜드 로고를 스캔하여 제품 정보 및 서비스에 접근할 수 있도록 하고 있다. 이마가는 비주얼 검색을 통해 사용자가 촬영하거나 다운로드한 이미지와 유사한 이미지나 제품을 검색해주고 있으며, 딥러닝 기술을 통해 정밀도를 높여주고 있다. BitRefind Group은 이미지 인식 기술을 토대로 객체 및 이벤트 감지, 이미지 내용 인식 등의 서비스를 제공하며, 과일의 산출량을 정렬한 다거나 식물의 질병을 탐지해낼 수도 있다. 엔비디아는 99%의 높은 정확도로 사람 얼굴을 인식할 수 있는 인공지능 CCTV를 개발했으며 범죄·테러 용의자를 24시간 감시하는 범죄예방 시스템 구축에 활용될 수 있다. 한본은 마스크 착용자를 95% 확률로 식별해 내는 안면인식 솔루션을 개발했으며, 마스크와 선글라스를 함께 착용한 사람도 인식할 수 있는 안면인식 기술을 추가로 개발할 계획이 있어 범죄자 색출 및 검거에 활용될 수 있을 전망이다. 사이버링크는 다양한 생체 인증 파라미터를 활용하여 높은 수준의 AI 안면인식 엔진 기술을 보유하고 있으며, 딥러닝과 신경망 알고리즘을 기반으로 사람의 나이, 성별, 기분, 얼굴이 향하는 방향 등을 인식할 수 있어 여러 분야에 적용이 가능할 것으로 예상된다. 본 연구에서는 이미지 인식기술이 다양한 분야에서 적용되는 사례를 조사하고 분석하고자 하였다. 이미지 인식 기술은 크게 이미지 분류, 이미지 찾기, 이미지 인식, 대상분할 등 4가지로 분류를 할 수 있다. 본 연구에서는 다양한 기술들이 산업에 어떻게 적용되어 활용되고 있는지 동향을 파악하는 것에 의미를 두고 진행하였다. 연구를 통해 조사된 다양한 사례와 분석된 결과 내용을 바탕으로 우리나라의 이미지인식 산업에서는 앞으로 어떠한 전략으로 인공지능과 빅데이터 등의 기술과 융합하여 더욱 발전 시켜 나갈 수 있는지 방향성을 제시하고자 하였다,

본 연구의 산업적 시사점은 국내뿐만 아니라 해외의 이미지 인식 기술을 활용한 최신 비즈니스 사례를 살펴 보는 것에 있다. 이미지 인식기술의 현황 파악과 이미지 인식기술이 어떠한 형태로 다양한 산업에서 적용되고 있는지 확인할 수 있었다. 본 연구에서는 인공지능 활용분야 중 이미지인식 기술 분야를 선정하고 국내외 사례들을 살펴봄으로써 이미지인식 기술을 활용한 헬스케어의 최신 이슈사항이 무엇인지 확인하고자 하였다. 안면인식 기술의 경우 국내는 해외에 다소 뒤쳐져있는 모습이었으며, 이미지인식 기술의 농업, 광업 등 1차 산업의 적용에도 해외에 비해 혁신 사례가 부족한 감이 있다. 우리나라에서는 아직 이미지인식 관련 여러 규제로 인해 기술 개발 및 산업 적용이 해외 선진 사례에 비해 더딘 경향이 있다. 본 연구의 결과는 이미지인식 기술 관련 분야에 대해 정부가 장기적인 관점에서 정책적인 지원을 할 필요가 있다는 것을 시사한다. 학문적 시사점으로는 여러 산업에서 이미지 인식기술을 구현하고 적용하여 발전시키기 위해 여러 사례들을 중심으로 향후 연구의 방향성을 제시했다는 것에 있다. 본 연구의 한계점은 인공지능 이미지 인식기술의 성숙도와 기술의 체계적 분류 및 분석에 대한 내용이 미흡 하였다는 점이다. 기술의 체계적인 분류가 없어, 사례 별로 기술의 특징과 기술의 적용 방식을 구체화 하는 것이 부족하였다. 또한 국내의 다양한 분야에서 이미지 인식 기술이 해외에 비해 발전이 더디다는 결론을 내었다. 하지만, 국내의 이미지인식 기술이 뒤쳐져있는 구체적인 이유와 앞으로 어떠한 기술을 어떻게 발전시켜 어떻게 적용해 나갈 수 있을지 심도 있게 논의하지 못하였다. 또한 국내의 이미지 인식 기술이 해외에 비해 발전이 더딘 이유와 앞으로 어떻게 발전 시켜나갈 수 있을지에 대해 심도 있게 논의하지 못하였다. 향후연구에 서는 인공지능 이미지 인식 기술과 관련하여 정책적인 이슈와 기술과 서비스의 개발에 있어 규제 같이 논의함으로써 국내 이미지 인식 기술이 나아가야 할 방향을 고찰해 볼 필요가 있다.

References

  1. 윤여찬, 상종희, 박수명, "이미지 기반의 식물 인식 기술 동향," 전자통신동향분석, 제33권, 제4호, pp.54-60, 2018. https://doi.org/10.22648/ETRI.2018.J.330406
  2. Tractica, Artificial Intelligence Market Forecasts, 2016.
  3. Raymond Perrault, Yoav Shoham, Erik Brynjolfsson, Jack Clark, John Etchemendy, Barbara Grosz, Terah Lyons, James Manyika, Saurabh Mishra, and Juan Carlos Niebles, "The AI Index 2019 Annual Report," AI Index Steering Committee, Human-Centered AI Institute, Stanford University, Stanford, CA, December 2019
  4. 김형일, 문진영, 박종열, "딥러닝 기반 고성능 얼굴인식 기술 동향," 전자통신동향분석, 제33권, 제4호, pp.43-53, 2018. https://doi.org/10.22648/ETRI.2018.J.330405
  5. CS231n (Standord) Lecture Slides, Accessed 209. http://cs231n.stanford.edu/slides/2017/
  6. R. Yin, Case study research : Design and methods, Thousand Oaks, CA : Sage Publishing, 1994.
  7. J. Seawright and J. Gerring, "Case Selection Techniques in Case Study Research : A Menu of Qualitative and Quantitative Options," Political Research Quarterly, Vol.61, No.2, pp.294-308, 2008. https://doi.org/10.1177/1065912907313077
  8. K. M. Eisenhardt, "Better stories and better constructs : The case for rigor and comparative logic," Academy of Management Review, Vol.16, pp.620-627, 1991. https://doi.org/10.2307/258921
  9. 박양재, "컴퓨터 비전 기술을 이용한 볼트 탭 형상 검사 시스템 개발," Journal of Digital Convergence, 제17권, 제3호, pp.303-309, 2018.
  10. Zhe Cao, Tomas Simon, Shih-En Wei, and Yaser Sheikh, "OpenPose: realtime multi-person 2D pose estimation using Part Affinity Fields," Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2017.
  11. Martin Simon, Karl Amende, Andrea Kraus, Jens Honer, and Timo Samann et al, "Complexer-yolo: Real-time 3d object detection and tracking on semantic point clouds," In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition Workshops, 2019.
  12. Qi-Chao, Mao, Hong-Mei Sun, Yan-Bo Liu, and Rui-Sheng Jia, "Mini-YOLOv3: Real-time object detector for embedded applications," IEEE Access, 7, pp.133529-133538, 2019. https://doi.org/10.1109/access.2019.2941547
  13. Y. J. Jo and J. Y. Park, "SC-FEGAN: Face Editing Generative Adversarial Network with User's Sketch and Color," In Proceedings of the IEEE International Conference on Computer Vision, pp.1745-1753, 2019.
  14. He Zhang, Vishwanath Sindagi, and Vishal M. Patel, Image de-raining using a conditional generative adversarial network. IEEE transactions on circuits and systems for video technology, 2019.
  15. Yuequan Bao, Zhiyi Tang, Hui Li, and Yufeng Zhang, "Computer vision and deep learning-based data anomaly detection method for structural health monitoring," Structural Health Monitoring, Vol.18, No.2, pp.401-421, 2019. https://doi.org/10.1177/1475921718757405
  16. Rowan Zellers, Yonatan Bis, Ali Farhadi, and Yejin Choi, "From recognition to cognition: Visual commonsense reasoning," In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pp.6720-6731, 2019.
  17. Xiaolong Liu, Zhidong Deng, and Yuhan Yang, "Recent progress in semantic image segmentation," Artificial Intelligence Review, Vol.52, No.2, pp.1089-1106, 2018. https://doi.org/10.1007/s10462-018-9641-3
  18. Rani Saritha, Varghese Paul, and P. Ganesh Kumar, "Content based image retrieval using deep learning process," Cluster Computing, Vol.22, No.2, pp.4187-4200, 2019. https://doi.org/10.1007/s10586-018-1731-0
  19. 윤종호, 지능형 교통 서비스를 위한 다중 번호판 인식 영역 추출 알고리즘 연구, 한양대학교, 박사학위논문, 2018.
  20. 민준영, "영상처리 기반의 교통정보 수집 및 사고 및 돌발감지 시스템 기술 동향 분석," 전자공학회지, 제39권, 제12호, pp.47-54, 2012.
  21. 홍요훈, 송승준, 장광문, 노정규, "멀티터치 기술과 영상인식 기술 기반의 스마트 팩토리 플랫폼," The Journal of The Institute of Internet, Broadcasting and Communication, 제18권, 제1호, pp.23-28, 2018. https://doi.org/10.7236/JIIBC.2018.18.1.23
  22. 박만우, "건설관리를 위한 컴퓨터 비전 기술의 활용," Review of Architecture and Building Science, 제60권, 제1호, pp.31-36, 2015.
  23. https://biz.chosun.com/site/data/html_dir/2018/06/02/2018060200195.html
  24. 조성환, 이용규, 윤준탁, 권훈, 곽준혁, 임재완, 인공지능 비즈니스 트렌드, 와이즈맵, 2019.
  25. http://www.bluerivertechnology.com/
  26. http://www.irobotnews.com/news/articleView.html?idxno=16782
  27. https://www.kespry.com/
  28. https://orbitalinsight.com/
  29. http://www.nvp.co.kr/news/articleView.html?idxno=122623
  30. https://www.logograb.com/
  31. https://imagga.com/solutions/visual-search
  32. https://bitrefine.group/industries/precision-agriculture/88-industries/agriculture-food/agriculture-solutions/184-plant-disease-detection
  33. https://bitrefine.group/industries/precision-agriculture/88-industries/agriculture-food/agriculture-solutions/178-automatic-fruits-flowers-sorting
  34. https://en.wikipedia.org/wiki/Nvidia
  35. https://m.biz.chosun.com/svc/article.html?contid=2018022000050&Dep0=m.search.naver.com&utm_source=m.search.naver.com&utm_medium=unknown&utm_campaign=biz
  36. https://www.nvidia.com
  37. http://www.aitimes.com/news/articleView.html?idxno=126385
  38. https://news.einfomax.co.kr/news/articleView.html?idxno=4075373
  39. http://www.hanvon.com
  40. https://ko.wikipedia.org/wiki/사이버링크
  41. http://www.aitimes.kr/news/articleView.html?idxno=15034