DOI QR코드

DOI QR Code

Analysis and Design of Social-Robot System based on IoT

사물인터넷 기반 소셜로봇 시스템의 분석 및 설계

  • Cho, Byung-Ho (Dept. of Information and Communication Engineering, Catholic Kwandong University)
  • 조병호 (가톨릭관동대학교 정보통신공학과)
  • Received : 2018.12.17
  • Accepted : 2019.02.08
  • Published : 2019.02.28

Abstract

A core technology of social robot is voice recognition and dialogue engine technology, but too much money is needed for development and an implementation of robot's conversation function is difficult resulting from insufficiency of performance. Dialogue function's implementation between human and robot can be possible due to advance of cloud AI technology and several company's supply of their open API. In this paper, current intelligent social robot technology trend is investigated and effective social robot system architecture is designed. Also an effective analysis and design method of social robot system will be presented by showing user requirement analysis using object-oriented method, flowchart and screen design.

소셜로봇의 핵심기술은 음성인식 및 대화엔진인데 이를 개발하는데 많은 비용이 들고 음성인식률 및 대화엔진의 성능의 부족으로 인한 로봇과의 대화기능 구현이 어려웠다. IoT 기반의 클라우드 인공지능 기술의 발전과 여러 기업이 이들 오픈 API 제공으로 로봇과 인간과의 대화 기능 구현이 가능하게 됐다. 본 논문에서는 기존의 지능형 소셜로봇 기술동향을 조사하고 효율적인 IoT 기반 소셜로봇 시스템 구조를 설계한다. 또한 객체지향방법을 이용한 사용자 요구사항 분석, 플로우 차트 및 화면 설계를 보여줌으로 효과적인 소셜로봇 소프트웨어 분석 및 설계 방법을 제시하고자 한다.

Keywords

Ⅰ. 서론

소셜로봇은 단순히 사람이 하기 힘든 육체적인 일을 대신하는 기존 로봇과 달리 사람과 대화를 하고 교감하는 감성 중심의 로봇을 말한다. 사람이 고립감을 느끼지 않도록 도와주는 역할을 한다. 즉, 인간과 직접 대화하는 물리적 실체를 가진 지능형 로봇비서가 소셜로봇으로 사회가 점점 고령화되고 생활지원의 사회적 욕구가 확대되면서 이를 위한 지능형 서비스 소셜로봇의 필요성이 증가하고, IT의 발전과 더불어 더욱 폭넓은 지능형 소셜로봇의 서비스에 대한 요구가 증가하고 있다. 시대적 요구사항을 배경으로 탄생한 소셜로봇과 같은 지능형로봇은 인공지능, 네트워크 등 IT 기술을 바탕으로 인간과 서로 상호작용 하면서 가사지원, 교육, 엔터테인먼트 등 다양한 형태의 서비스를 제공하는 인간 지향적인 로봇 시장을 형성하기 시작하였다. 세계 각국이 국가 전략 산업으로 육성하는 지능형 로봇산업이 미래로의 핵심산업으로 집중되고 있다. 지능형로봇산업은 기술확산을 통해 연관된 전후방 산업분야를 이끌고 첨단 기술의 혁신을 촉진하는 고부가치 산업으로서 지능형로봇 기술은 지능화, 시스템화 기술로서 타 분야에 대한 기술적 파급효과가 크고, 신기술 분야의 산업화를 촉진한다[3].

지능형 소셜로봇 기술의 가장 핵심은 지능형 대화엔진인데 일반적인 대화엔진은 단순패턴 매칭만을 고려하여 제작된 것으로 발화자의 목적 및 의도를 고려하지 않아 대화 흐름이 부자연스럽다. 본 논문에서는 음성인식에서 인지된 텍스트 문장이 자연어 분석에 의해 토큰과 자질을 추출하여 자질간 가중치를 이용한 기계학습으로 대화엔진의 학습을 통해 더욱 유사한 답변을 찾는 대화엔진을 설계하도록 한다[2].

지능형 소셜로봇 제작에는 IoT 기술이 적용되어 로봇이 하나의 IoT 사물통신 수단으로 인터넷을 통해 인공지능형 소셜로봇이 서비스 되도록 클라우드 서버 단에서 모든 음성인식 및 대화형엔진과 채팅, 콘트롤 신호 등이 인터넷망을 통해 서비스 되는 URC(Ubiquitous Robotic Companion) 개념의 로봇으로 설계한다.

지금까지의 지능형 로봇은 기술력이 우수한 제품이지만 실용성 측면에서는 고가이고 아직 고객들이 원하는 수준에는 못미치는 경우가 많으나 본 논문에서의 소셜로봇은 저가이면서 인간 개인 서비스 로봇으로 실제 시장에서 성공 가능성이 많은 제품으로 제작이 가능하도록 하드웨어 설계를 아두이노와 같은 오픈하드웨어에 가깝게 설계하고 인터넷을 통해 음성인식 및 대화엔진기능이 클라우드 서버를 통해 제공되도록 소프트웨어 기능 구현에 치중하여 전체 시스템을 분석하고 설계한다.

본 논문에서는 이와 같은 소셜로봇 시스템 개발을 위해 소셜로봇의 하드웨어 구조와 IoT에 기반한 전체 소셜시스템 구조와 기능 등을 제시하고 이를 개발하는데 필요한 소프트웨어 제작을 위한 세부적인 분석 및 설계를 위해 객체지향 분석 방법을 이용하여 사용자 요구사항분석 및 화면 설계를 보여줌으로 효과적인 IoT 기반 소셜로봇 시스템의 분석 및 설계 방법을 제시하고자 한다.

본 논문의 구성은 다음과 같다. 2장에서는 기존 지능형 소셜로봇의 기술현황, 3장에서는 소셜로봇 시스템 분석, 4장에서는 소셜로봇 시스템의 설계, 5장에서는 결론을 기술한다.

Ⅱ. 지능형 소셜로봇 기술 현황

지능형 소셜로봇의 기술은 크게 지각(sensing)·처리(processing)·행동(acting) 세가지로 나눈다. 지각은 주의환경을 감지하여 처리부에 알려주는 기술이며, 이러한 지각을 이용하여 행동을 결정하는 것이고, 행동은 결정된 행동을 이용하여 일련의 정해진 행동을 하는 기술이다. 이러한 세 가지 기술을 위해서는 센서, 프로세서 그리고 구동기(actuator) 기술을 필요로 하는데, 이러한 요소기술의 구현이 지능형 로봇의 핵심이다.

1. 지능형 소셜로봇의 핵심 기술[1]

지능형 소셜로봇의 핵심기술들을 기술하면 아래와 같다.

가. 지각기술

지각기술은 크게 이동기능, 상황판단, 인간과의 상호작용을 위한 기술로 나뉜다. 이동기능을 위해 관성측정, 적외선, 레이저, 초음파센서, 상황판단을 위해서 비콘, 촉각센서, 인간과의 상호작용을 위해서 시각 및 청각 센서 등을 사용한다.

센서기반 기술로 이동기능 중에 관성을 이용한 것은 로봇이 움직일 때 발생하는 가속도 및 각속도를 측정, MEMS 기술이 발전하면서 초소형화와 대량생산 가능한데, 마이크로 소프트,소니 혼다 등이 대표적인 개발 기술 기업이다. 적외선 이동기능에 관한 기술로는 미국 에볼루션 로보틱스의 노스스타가 대표적 제품이며 국내는 하기소닉의 스타게이저가 널리 사용된다.

상호작용 기술로는 시각(비전)기술은 환경이나 상호작용을 위해 중추적인 역할을 담당, 주변 물체 존재 유무, 크기, 위치, 색깔 정보 등을 측정한다. 청각(음성) 기능은 마이크로폰과 마이크로프로세서로 구성되며 실리콘 MEMS 기술을 이용하여 생산한다.

나. 처리기술

HRI(Human-Robot Interface) 기술은 다양한 의사소통 채널을 통해 인간과 로봇이 자연스럽게 상호작용 할 수 있는 지능형 서비스 로봇의 핵심 기술로 크게 비디오/오디오 기반 상호작용 기술, 기타 상호작용 통합 및 응용기술로 분류된다. 비디오 기반 상호작용 기술은 로봇 카메라로부터 얻어진 영상정보를 근거하여 얼굴검출, 얼굴인식, 얼굴검증, 얼굴 표정인식, 인간 추출, 사용자 인식, 특정인 추적, 호출자 식별, 제스처 인식, 포스처 인식 등을 수행한다.

오디오 기반 상호작용 기술은 로봇에 부착된 마이크로폰으로부터 얻어진 음성 정보에 근거하여 음성인식, 화자인식, 음원추적, 음원분리 등을 수행한다. 상호작용통합 및 응용 기술로는 멀티모달 사용자 인식, 지적 상호작용 통합, 모바일 단말을 통한 HRI 기술통합 및 응용 등이 있다.

다. 행동기술

로봇 제작 원가에서 70% 이상이 구동 메카니즘(모터+감속기+컨트롤러)이 차지할 정도로 로봇 개발을 위한 핵심분야로 모터와 인공근육이 대표적인 구동기 부품으로 사용된다. 구동기에 있어 가장 중요한 성질은 힘과 유연성이며 로봇산업에 적합한 구동기는 두 성질을 만족시켜야 한다.

모터는 가장 보편적으로 사용되는 구동기로 주로 PMDC 모터, BLDC 모터, 스태핑 모터, 그리고 초음파 모터 등이 사용되고 있다. 현재까지 새로운 소재 개발은 모터에 의해서 효율성이 떨어지며 정확한 제어가 불가능하므로 모터와 결합하여 상호 보완적인 역할을 수행하는 연구가 진행 중이다.

2. 소셜로봇의 기술동향[5]

인류가 꿈꾸는 최종 단계의 로봇은 인간과 같은 모습으로 우리와 완벽하게 교감할 수 있는 로봇일 것입니다. 물론 현재의 기술이 이 단계까지 이르지 못했지만, 최근 로봇은 한 차원 발전한 모습을 보여주고 있는데요. 바로 인간과 정서적으로 소통하고, 도움을 주는 인공지능 ‘소셜 로봇’의 등장입니다.

소셜 로봇은 현재 음성 인식, 감성 표현 등의 기능을 탑재하고 있으며, 사용자의 심리 상태 패턴 분석을 통해 이에 적절한 대응을 하기도 합니다. 일정 수준에서 감성적 교류가 가능하다는 이야기인데요. 특히 최근 등장하고 있는 소셜 로봇은 1인 1로봇 시대를 열 것이라는 기대감을 높이고 있습니다.

가. 지보(JIBO)

지보(JIBO)는 현재 시장에서 가장 큰 관심을 끌고 있는 히트 상품입니다. 지보는 미국 메사추세츠 공과대학(MIT) 신티아 브리아질 교수와 연구진이 가정용으로 개발한 소셜 로봇이다. 현재 메시지 전달, 사진촬영, 리마인딩, 이야기 구연과 듣기, 화상 전화 등 총 6가지 기능이 지보에 탑재되어 있다.

나. 페퍼(Pepper)

2014년 6월 5일 공개된 페퍼(Pepper)는 일본 소프트뱅크 그룹과 그 자회사인 프랑스 안데바란 로보틱스가 함께 개발한 세계 최초 감정을 읽는 가정용 로봇입니다. 페퍼에는 마이크, 카메라, 3D 센서, 터치센서, 음파 센서, 레이저 센서, 자이로스코프 등의 기능이 탑재되어 있는데요. 이를 바탕으로 스스로 주변 상황을 인식하고, 대응할 수 있다.

다. 국내 대표 소셜 로봇, 메로S(MERO-S)

메로S는 한국과학기술연구원(KIST)의 로봇 미디어 연구소에서 개발한 국내 대표 소셜 로봇입니다. 메로S는 음성인식과 얼굴인식, 감성표현 등으로 인간과의 교감 기능을 구현해 한국 로봇을 세계에 알리고 있는데요. 이미 2014년 말부터 상용화가 시작되었습니다. 현재는 노인 치매 예방을 목적으로 만들어진 로봇 ‘실벗’과 함께 주요 대학과 연구소, 해외의 노인 복지관 등에 보급되고 있습니다. 술을 차량에 융합하려는 연구가 활발히 진행되고 있다.

Ⅲ. IoT 기반 소셜로봇 시스템의 분석

전체 IoT 기반 소셜로봇 시스템 구조는 위의 그림 1과 같은데, 시스템의 동작은 아래와 같다. 첫째 사용자(노인, 어린이) 소셜로봇에게 말을 건다. 말은 소리로 음성로봇의 마이크폰에 전달되어진다. 소셜로봇은 말을 마이크로 전송받아 인터넷으로 보낸다. 인터넷을 통해 말이 서버로 음성신호로 전송된다. 이때 음성인식 및 대화엔진 해석을 통해 대답하는 말이 인터넷을 통해 전달된다. 다음으로는 인터넷을 통해 응답이 음성신호로 로봇에게 전달되어지고, 소셜로봇이 응답하는 말을 스피커를 통해 대답을 하게 된다. 둘째, 그 밖의 기능으로 로봇에 달린 카메라를 이용해서 가정에 있는 어린이나 노인의 안전유무를 살펴볼 수 있는 화상감시 서비스나 소셜로봇과의 보이스 채팅 서비스를 제공하는 것으로 스마트폰에서 동영상이나 보이스채팅 요청 신호를 보낸다. 셋째, 인터넷을 통해 서버가 요청신호를 받어서 로봇에서의 감시 동영상 데이터를 스마트폰으로 전달하여 부모가 보도록 하거나 사용자와의 채팅이 소셜로봇을 매체로 보호자와 이루어지도록 한다.

OTNBBE_2019_v19n1_179_f0001.png 이미지

그림 1. 소셜로봇 시스템 구조

Fig. 1. an Architecture of Social Robot System.

1. 요구사항 분석

IoT 기반 소셜로봇 시스템의 소프트웨어 설계 이전의 분석 단계로서 요구사항에 대하여 기술한다. 위에서 언급한 그림 1의 구조를 고려해서 개발하여할 주요 기능들을 기술하면 아래와 같다.

가. 음성인식 기능

(1) 마이크로부터 전달되는 음성신호를 인식하여 텍스트로 변환하여 서버에 전달

(2) 음성인식에 의해 변환된 텍스트를 대화엔진 전송

나. 대화엔진 기능

(1) 음성인식 기능에 텍스트로 변환되어 전송되어온 텍스트에 응답 문장을 해석하는 찾아줌

(2) 응답 텍스트를 음성합성에 의해 음성으로 변환

(3) 인터넷을 통해 음성신호를 소셜로봇에게 전송

다. 보이스 채팅 기능

(1) 사용자의 부모나 보호자가 로봇에게 말을 걸면 로봇의 스피커로 말을 전달함

(2) 사용자의 응답 음성이 인터넷으로 보호자 스마트폰 앱으로 전송되어 보호자에 전달됨

라. 동영상 감시

(1) 로봇 카메라의 캡쳐 동영상을 인터넷으로 스마트폰 앱으로 전송

(2) 스마트폰 앱에서 전송되어온 동영상을 재생

바. 교육용 콘텐츠 재생 기능

(1) 부모가 교육용 콘텐츠를 스마트폰에서 재생하면 로봇으로 전송되어 들려주기

(2) 고객을 스마트폰 앱 콘텐츠로 교육 시킬 때 로봇응답 기능

2. 유스 케이스 다이아그램(Use Case Diagram)[4].

위에서 간략히 기술한 요구사항을 UML(Unified Manipulation Language) 유스케이스 다이아그램(Use Case Diagram)으로 표시하면 그림2와 같다.

OTNBBE_2019_v19n1_179_f0002.png 이미지

그림 2. 유스케이스 다이아그램

Fig. 2. Use Case Diagram

3. 객체지향 클래스 다이어그램[4].

객체지향 분석을 위하여 스마트폰, 서버 및 소셜로봇을 객체로 설정하고 속성(attribute)과 메소드(method)로 구성된 클래스 다이아그램(Diagram)을 그리면 그림3과 같다.

OTNBBE_2019_v19n1_179_f0003.png 이미지

그림 3. 객체지향 클래스 다이아그램

Fig. 3. Object-Oriented Class Diagram

IV. IoT 기반 소셜로봇 시스템의 설계

소셜 로봇 시스템의 소프트웨어를 설계하기 위해서 가장 중요한 기능은 음성인식 처리, 대화엔진을 이용하여 사용자와의 응답 기능을 어떻게 구현하는 것이 중요하다. 실제 음성인식엔진과 대화엔진을 개발하는 것은 매우 어렵고 개발비용이 많이 들어가는 것이여서 구글 음성엔진과 페이스 챗봇엔진을 사용해서 소셜로봇과 사용자간의 대화가 이루어지도록 설계한다[6,7,8,9,10,11,12].

음성인식 및 대화엔진을 API를 이용한 소셜로봇의 대화 기능 구현을 위한 제어 프로그램 개발을 위한 알로리즘 설계를 플로로우차트로 표시하면 아래 그림 4와 같다.

OTNBBE_2019_v19n1_179_f0004.png 이미지

그림 4. 음성인식 및 대화엔진 처리 알고리즘 설계

Fig. 4. Design of Voice Recognition and Dialog Engine Processing Algorithm

OTNBBE_2019_v19n1_179_f0005.png 이미지

그림 5. 대화엔진의 구조 설계

Fig. 5. Architecture Design of Dialog Engine

소셜로봇이 자연스러운 대화를 할 수 있도록 하기 위해서는 음성인식 엔진에서 해석된 음성인식 파일의 텍스트 변환 후에 적합한 대화의 응답을 위한 문장을 찾아야 한다. 통상적으로 모든 질문에 대한 응답을 얻기 어렵고 도메인 중심의 페이스북 챗봇엔진을 사용하여 자연어분석을 통해 얻게 되는 문장에서 가장 유사한 답변을 얻기 위해서 문장에서 의도(intent)가 되는 자질(feature)을 추출하고 자질간의 가중치를 이용한 기계학습으로 대화엔진 DB의 계속적인 확장으로 정확도를 높힌 답변을 얻을 수 있도록 한다.

다른 추가적인 기능들로는 사용자의 보호자가 소셜로봇과 스마트폰으로 사용자와의 보이스 채팅 기능, 동영상 감시, 교육 콘텐츠 재생기능 등이 있는데, 이를 구현하기 위한 스마트폰 앱의 설계는 그림 2, 3을 기반으로 하여 그림 6과 같이 설계하도록 한다.

OTNBBE_2019_v19n1_179_f0006.png 이미지

그림 6. 스마트폰 앱 화면 설계

Fig. 6. Design of Screen for Smartphone App.

V. 결론

제 4대 산업혁명의 핵심 키워드인 인공지능 기술을 기반으로 음성인식 기술이 적용된 가상비서 시스템이 스마트폰 앱으로 동작하고 이를 사용하는 사용자도 늘어나고 있다. 또한 페퍼 등의 소셜로봇이 일본에서 여러 분야에서 활용되고 있는 시대에 직면하고 있다. 국내에서도 인공지능 스피커 등이 대기업에서 개발되어 가정에서도 사용되고 있다. 이들 제품의 기반이 음성인식 기술이 있다. 구글이나 아마존 등에서 클라우드 API 서비스로 음성인식 기술을 사용해서 응용제품 개발에 활용하도록 하고 있고 국내에서도 네이버와 같은 기업이 음성인식 서비스를 이용할 수 있도록 API 기능을 제공하고 있다.

본 논문에서는 이미 개방되어 사용되고 있는 음성인식/음성합성 API 기술과 챗봇 대화엔진 API 기능을 활용해서 저렴한 비용으로 집안에 있는 어린이나 노인에게 유용성이 많은 소셜로봇을 설계하는 방법을 제시하고자 하였다. 이와 같은 IoT 기반 인공지능 기술을 이용한 소셜로봇 제작에 필요한 요구사항을 조사하고 이를 객체지향 분석방법인 UML(Unified Manipulation Language)에 의한 유스케이스 다이아그램과 객체지향 클래스 다이아그램 예로 분석 방법을 제시하였다. 또한 소셜로봇 시스템의 설계 단계에서는 음성인식 및 대화엔진을 이용한 소셜로봇의 대화 기능 구현을 위한 알고리즘 설계로 플로우차트를 사용한 방법을 제시하였다. 그리고 그 중에서 가장 핵심 기능인 대화엔진의 구조를 설계하고 어떻게 이를 이용하여 대화기능을 구현할지에 대하여 기술하였다. 마지막으로는 분석단계에서 얻은 다이아그램을 활용하여 스마트폰 앱에서의 동영상 감시, 보이스 채팅, 교육콘텐츠 재생 등의 기능 구현을 위한 화면 설계 예시를 보여주고자 하였다.

이와 같은 본 논문에서 제시한 사물인터넷 기반 소셜로봇 시스템 분석/설계방법은 실제 소셜로봇 소프트웨어 개발에 있어 매우 유용하고 주요 분석/설계 프로세스를 세우는 기준이 될 수 있으리라 본다. 또한 본 연구에서 제안한 소셜로봇 시스템 분석/설계 방법이 향후 소셜로봇 시스템을 제작하고자 하는 실무자들에게 어떻게 그 소프트웨어를 설계할지에 대한 주요 가이드라인으로 자리매김 할 수 있기를 기대한다.

References

  1. Eom, We-Sub, Kim, Youn-Kyu, Lee, Joo-Hee, Choi, Gi-Hyuk, Sim, Eun-Supyun-Bo Shim, "Development Trend of Intelligent Robots", Current Industrial and Technological Trends in Aerospace, 2013. 7.
  2. J. H. Hong, "Intelligent Dialogue Agent using Complex AI Module", M.S. Paper of Computer Science in YeonSe Univ., 2015.
  3. J. K. Han, "Current State of Affairs and Prospect of Robot and AI", Korea Educational Broading System, 2016. 6.
  4. Cho, W. S., "UML Object-Oriented Analysis and Design", Hongnung Publishing Company, 2000.
  5. P. S. Kim, "Trend of Development and Technology relating Sensitivity Robot Communicating Human", Korea Institute Of Communication Sciences, 2016. 7.
  6. Anand Dersingh, Prerapat Srisakulpinyo, Sakchai Rakkarn, Prin Boonkanit, "Chatbot and Visual Management in Production Process", The Institute of Electronics Engineers of Korea, 2017. 1.
  7. H. S. Park, S. U. kim, M. H. Min, C. D. Yoo, "Trends of the Voice Recognition Technology based on the newest Machine Learning", The Institute of Electronics Engineers of Korea, 2014. 3.
  8. http://storyjava.tistory.com/143
  9. https://slideshare.net/ssusercf5d12/ss-69518853
  10. Sung-Jai Choi,"Design and Implementation of Protype Anti-disaster Remote Control Robot Model using Smart Phone", The Journal of The Institute of Internet, Broadcasting and Communication", 2014. 12. https://doi.org/10.7236/jiibc.2014.14.6.221
  11. B. S. Lee, "A Study on Development of a Smart Wellness Robot Platform",Journal of the Korea Academia-Industrial cooperation Society", 2016. 1. https://doi.org/10.5762/KAIS.2016.17.1.331
  12. Sang-Young Jo* and Jin-Woo Jeong**, "Design and Implementation of Hospital Room Management System Based on IoT CareBots", The Journal of The Institute of Korea Information, Electronics and Communication", 2018.8. http://dx.doi.org/10.17661/jkiiect.2018.11.4.370