DOI QR코드

DOI QR Code

Data-Driven Design Methodology based on Data Science Paradigm Focused on Design Research Case Study of Fine Dust Information App Service

데이터 과학의 방법론을 적용한 데이터 기반 디자인 방법론에 대한 연구 - 미세먼지 정보 서비스 앱의 디자인 리서치 사례를 중심으로

  • 이현진 (홍익대학교 디자인컨버전스학부)
  • Received : 2021.06.10
  • Accepted : 2021.07.29
  • Published : 2021.10.28

Abstract

This study explores research methodologies of design and data science, and applies data science paradigm on design process. Design research methodologies would have benefits of productivity and efficiency by using data driven design methodology. From insights of former studies, a new methodology of data driven design is suggested that design problem is transformed to data set attributes, such as variables, values and data patterns. The fine dust information app design is conducted as a case study to prove this methodology.

본 연구는 데이터 과학의 분석적 연구 방법을 디자인 연구에 활용할 수 있는 방법을 모색, 실증해봄으로써 빅데이터 기반의 디자인 분야에서 데이터 자원을 효과적으로 활용하고, 빅데이터 기술과 디자인이 상생 발전할 수 있는 디자인 연구 방향을 제시하였다. 본 연구의 방법은 먼저 고전적인 디자인 리서치의 방법들과 데이터를 활용한 디자인 리서치의 연구 방법론, 데이터 과학의 연구 방법론을 고찰하고 디자인과 데이터 과학의 선행연구들을 종합하여 데이터 과학의 연구 방법론과 디자인 프로세스를 통합하는 데이터 기반 디자인의 연구 방법론을 개발 제안하였다. 제안된 연구 모델은 데이터 기반 서비스 앱의 디자인 리서치 사례 연구를 수행하여 제안한 방법론의 적용 가능성을 살펴보았으며, 제시한 연구 방법의 적용을 위하여 데이터 큐레이션 방법에 대한 연구와 디자이너의 데이터 문해력 확보가 향후 연구과제로 도출되었다.

Keywords

I. 서론

빅데이터는 기존 데이터베이스 관리 도구의 데이터수집 및 저장, 관리, 분석의 역량을 넘어서는 대량의 정형 또는 비정형 데이터 세트와 이러한 데이터로 부 터 가치를 추출 하고 결과를 분석하는 기술을 말한다. 빅데이터 환경을 기반으로 기존의 비즈니스 환경은 급격한 변화와 혁신을 겪고 있으며, 변화의 내용도 비즈니스 프로세스 혁신, 소비자 니즈 발견, 트렌드 예측, 소비자 맞춤형 비즈니스를 위한 고객 세분화, 자동 알고리즘을 통한 의사결정 지원과 대행, 비즈니스 모델, 서비스의 혁신에 이르기까지 전방위적으로 진화하고 있다 [1]. 이와같이 현대 산업 전반의 구조가 빅데이터를 기반으로 변화되는 흐름에서 서비스와 콘텐츠, 제품 등의 개발과 생산을 지원하는 디자인 분야에서도 데이터는 매우 중요한 도구로 인식되고 있으며, 디자인 연구에서 빅데이터의 관리 및 분석 기술의 필요성도 높아지고 있다[2]. 본 연구에서는 데이터 과학의 연구 방법을 분석하고, 이를 디자인 연구에 활용할 수 있는 방법을 모색, 실증해봄으로써 빅데이터 기반의 프로덕트나 서비스디자인 분야에서 데이터 자원을 효과적으로 활용하고, 빅데이터 기술과 디자인이 상생 발전할 수 있는 디자인 연구 방향을 제시해보고자 한다.

본 연구의 방법은 먼저 고전적인 디자인 리서치의 방법들을 조망하고, 변화의 방향을 살펴보았다. 그리고 데이터를 활용한 디자인 리서치의 연구 방법론을 고찰하고 그 특징을 분석하였다. 한편으로는 전형적인 데이터 과학의 연구 방법론을 고찰하고 디자인 연구 방법론 사이의 차이점과 상호 보완 가능성을 도출하였다. 다음 단계에서는 디자인과 데이터 과학의 선행연구들을 종합하여 데이터 과학의 연구 방법론을 디자인 프로세스에 적용하는 데이터 기반 디자인의 연구 방법론을 개발 제안하였다. 제안된 연구 모델은 데이터 기반 서비스앱의 디자인 리서치 사례 연구를 수행하여 방법론의 적용 가능성을 살펴보았다. 결론에서는 데이터 과학의 패러다임을 적용한 데이터 기반 디자인 연구 모델의 의의와 향후 연구 방향을 제안하였다.

II. 데이터를 활용한 디자인 방법론의 선행 연구

1. 고전적 디자인 연구 방법론들과 특징

디자인 연구는 디자인 대상의 변화와 기술 환경의 변화에 따라 지속적으로 주변 학문 분야의 연구 방법론을 도입하여 디자인 연구 방법론의 범위를 넓혀왔다. 더 복잡하고 전문화되는 디자인 문제를 해결하기 위하여 다양하고 학제적인 연구 방법론들을 연구 목적과 시점에 맞게 선택적으로 사용하는 접근이 일반화되면서, 디자인 연구의 방법은 더욱 다양화되었고, 여러 가지 연구 방법들을 상호 보완적으로 적용하는 종합적 연구 방법(Triangulation)이 일반화되어 있다[3]. 현대 디자인 분야에서 사용하는 디자인 연구 방법들은 100여 가지가 넘는 것으로 알려져 있으나 O’Grady는 다양한 디자인 연구 방법들을 다섯 가지 범주로 나누어 설명하였다. 그 범주는 경쟁자 분석, 에스노그라피 리서치, 마켓리서치, 사용자 테스트, 시각적 탐구이며, 각 범주에 해당하는 디자인 방법론은 [표 1]과 같다[4].

표 1. 디자인 연구의 범주별 디자인 방법론

CCTHCV_2021_v21n10_103_t0001.png 이미지

고전적 디자인 연구 방법론은 선택된 표본을 기반으로 심층연구를 진행하므로, 전체 사용자의 모습을 이해하거나 매우 구체적인 상호 작용의 문제를 도출하는 데는 한계가 존재하며, 대면 관찰 및 실험을 기반으로 하는 연구 방법론들은 시간과 비용 투자도 크다. 한편, 정보 기술 발전과 함께 등장한 디지털 데이터는 고전적 디자인 연구 방법론의 한계를 해결하는 대안으로 사용되고 있다. 본 연구에서는 디자인 연구 과정에서 디지털 데이터를 효과적으로 사용한 선행연구들을 통하여 데이터 기술의 활용 현황을 정리하였다.

2. 데이터 기반의 디자인(Data-Driven Design) 연구사례

King은 디자인 대상과 관련된 방대한 정량화 데이터를 디자인 설계와 의사결정의 근거로 활용하는 방법론 및 정량화 테스트를 통하여 디자인 결과물을 평가, 검증하는 기법을 데이터 기반 디자인(Data-Driven Design)으로 정의하였다[5]. 이 방법은 구글 등 IT 선도 기업들이 디지털 서비스의 개발에 활용하는 방법으로, 디지털 데이터들을 지속적으로 생산하는 웹이나 앱 기반의 서비스에 쉽게 적용된다. 데이터 기반 디자인은 다량의 디지털 데이터를 연구에 사용한다는 점 외에는 디자인 과정이나 연구 방법에 큰 변화를 동반하지 않으며, 정량화된 데이터를 활용함으로써 협업 조직 내 의사 소통에도 효과적이다. 현재의 데이터 기반 디자인 연구들은 대부분 인터넷을 통하여 수집된 데이터를 대상으로 이루어지고 있으나, 향후 IoT(Internet of Things) 센서 데이터 등, 더 다양한 데이터 자원을 활용하여, 직접적이고 실시간적인 사용자 데이터를 사용하는 연구 방향으로 발전하는 시점에 있다. 데이터 기반 디자인 서비스 및 컨설팅은 디자인 연구에서 증가추세에 있으며, 국내 사례로는 웹사이트의 사용자 접속데이터를 시각화하여 사용자 유입 분석, 사용 행태 분석, A/B 테스팅 분석 서비스를 지원하는 포그리트의 뷰저블 서비스가 있다[6].

3. 데이터 주도의 디자인(Data-Enabled Design) 과 제네레이티브 디자인(Generative Design) 연구사례

데이터 기반 디자인 방법론 외에 디자인 분야에 적용되는 데이터 활용 방법론으로는 데이터 주도의 디자인 (Data-Enabled Design)과 제너레이티브 디자인 (Generative Design) 방법론이 있다. Marti는 사용자를 원격으로 관찰하고 분석한 사용자 행동 정보를 빅데이터로 수집하게 되면서 사용자가 디자인에 필요한 정보를 제공하는 데이터 생산자로서, 디자인에 참여하는 데이터 주도 디자인(Data-Enabled Design) 패러다임을 열었으며, 사용자들이 데이터를 통하여 더 적극적으로 디자인에 참여하고 디자이너와 소통함으로써, 사용자 참여 서비스와 사회 혁신을 도모할 수 있음을 주장하였다[7]. 그리고 Kollenburg는 사용자 참여 디자인의 개념으로, 센서가 설치된 프로토타입과 데이터 시각화 대시보드를 활용한 영아 건강 관리 서비스의 참여적 디자인 사례 연구를 통하여 사용자들과 디자이너가 데이터를 통하여 협력적으로 디자인을 전개하는 데이터 주도 디자인 방법론의 효용성을 검증하였다[8]. 데이터 주도 디자인은 데이터 수집 방법에서는 차별점이 있지만 수집된 데이터의 분석 기법은 데이터 기반 디자인과 동일하다.

한편, 디자인 사고의 양과 질을 향상하기 위한 창의적 디자인 방법론의 연구에서는 제너레이티브 디자인 (Generative Design)이 데이터와 알고리즘을 활용한 디자인 방법론으로 활용되고 있다. 제너레이티브 디자인은 디자인을 통해 달성하고자 하는 목표와 디자인 제작에서 발생하는 여러 제한 요소를 입력하면, 소프트웨어가 알고리즘과 인공지능을 통해 다양한 형태를 창조하고, 하나의 디자인을 위한 수백만 가지 잠재적 해결안을 생성하여 자동으로 디자인을 제안해주는 디자인 방법을 말한다[9]. 이 방법은 소프트웨어 서비스 및 제조업의 디자인 및 설계 분야에서 특히 적극적으로 활용되고 있다. Roback이 소개한 제너레이티브 디자인의 대표적 사례를 보면, 인도 장애인 협회의 손목 커넥터 등 의료 기기, 독일 클라우디우스 피터스의 중장비 부품, 오스트리아 디자인 스튜디오의 스포츠용 척추 보호대 디자인에 활용된 사례가 있으며, 스타 디자이너인 필립 스탁이 의자 디자인에 제너레이티브 디자인 기술을 활용하는 등, 3D 프린팅 기술과 결합한 제품 디자인 분야에서 실험되고 있다[10].

이상의 선행연구를 보면 데이터를 활용하는 디자인 연구 방법론은 이미 실천 단계에 있으며, 그 필요성과효용에도 이미 충분한 공감대가 존재한다고 볼 수 있다. 그러나 현재 제시된 연구 방법들은 기존의 디자인 연구 방법 안에서 작업 효과를 높이는 도구로 제한적으로 데이터를 활용하는 측면이 있다. 본 연구에서는 선행 연구가 가지고 있는 데이터에 대한 도구적 접근법에서 벗어나 디자인 프로세스 전체를 데이터 과학적 관점으로 재구성해보고, 이러한 작업을 통하여 디자인 방법론 연구의 새로운 시각을 발굴해보고자 데이터 과학의 연구 방법론에 대한 고찰을 진행하였다.

III. 데이터 과학의 연구 방법론

1. 데이터 문해력(Data Literacy)의 필요성

Bradshaw는 빅데이터를 세상을 이해하고 소통하는 새로운 틀 (Framework)로 이해해야 하며, 기존의 산업과 교육에서 데이터 문해력(Data Literacy)이 새로 필요함을 강조하였다. 빅데이터의 문해력은 데이터를 활용하기 위한 고전적인 능력인 연역적 사고력과 통계적 지식을 넘어서서 데이터를 가치 있고 사용할만한 정보로 전환해내는 능력을 말한다. 그리고 데이터에 관한 논리적 사고와 시각적 스토리텔링 능력은 전문 산업 분야 뿐 아니라 일반 학교 교육에도 확대되어야 한다고 주장 하였다[11]. 이와 같은 데이터 문해력(Data Literacy)의 시각에서 볼 때, 데이터에 대한 이해와 데이터 과학의 활용은 광범위한 산업 및 학문 분야에 적용 가능하며, 디자인 분야에서도 데이터 문해력 향상을 통하여 새로운 연구 방법의 전기를 마련하는 실험과 사례 연구가 필요함을 시사한다.

2. 데이터 과학의 연구 프로세스

Dhar에 의하면, 데이터 과학은 다양한 형태와 크기의 데이터로부터 통찰과 지식을 발견하는 체계적인 연구라고 정의할 수 있으며, 데이터 과학에서 발견하는 통찰은 의미 있는 패턴을 통하여 과거의 현상을 설명하는데 그치지 않고, 높은 예측율을 가지고 현재의 의사결정에 영향을 줄 수 있어야 한다. 그는 특히 디지털 기반 비즈니스에서는 데이터 과학의 예측 모델과 머신러닝이 중요한 역할을 할 것이며, 인간의 전통적 역량과 데이터 과학이 협력할 때 큰 성과를 낼 것으로 예측하였다[12].

수집된 데이터를 정보로 전환하기 위한 활동인 데이터 분석의 유형은 데이터에서 도출하고자 하는 통찰과 지식의 내용에 따라 여러 가지로 나눌 수 있으며, 조민호의 분류에 의하면 서술적 분석, 탐구적 분석, 추정 분석, 예측 분석, 인과 분석, 기계론적 분석으로 나눌 수 있다[13]. 선행 연구의 데이터 기반 디자인 (Data-driven Design)은 서술적 분석과 추정 분석 기법을 주로 사용하고, 데이터 주도 디자인 (Data-enabled Design)은 서술적 분석과 탐구적 분석을 활용하고 있다고 할 수 있다. 예측 분석 기법은 데이터와 알고리즘, 인공지능에 의하여 다양한 디자인 해결안을 도출하는 제너레이티브 디자인(Generative Design) 방법론에서 사용되고 있다. 데이터 분석의 결과는 주로 정량적 수치나 시각화 모델로 표현이 되며, 이것을 패턴화 했을 때, 의사결정과 예측의 근거로 사용할 수 있다.

Wichham은 특히 데이터의 탐구적 분석 방법을 EDA(Explanatory Data Analysis)로 명명하며, 연구 방법을 체계화 하였는데, EDA에서는 문제를 이해하기 위하여 다량의 질문을 도출하고, 질문에 대한 해답들을 통하여 더 가치 있는 질문을 발견한다. 데이터에 대한 질문에서 기본적으로 확인할 내용은 각 변수 별 변동유형과 변수 간의 공변동 유형이다. 이를 통하여 변수별로 일반적인 값과 비정상적인 값의 상태, 변수 간의 상관관계와 구조를 확인할 수 있다. 다음 단계인 데이터 시각화와 변형, 모델링 단계에서는 앞서 발견한 변수 별 변동과 변수 간 공변동 현상을 종합하여 전체 데이터의 모델을 구축한다. 이 모델을 통하여 해당 데이터 셋(set)의 구조를 도출하고 중요 변수, 변수 간의 관계, 주요 패턴을 정의한다[14].

이 방법은 연구 대상인 데이터 과학의 문제와 디자인 문제를 동일한 수준으로 두었을 때, 디자인 과정의 전반부에서 디자인 문제를 다양한 시각으로 수집, 분석하고 이들의 관계를 디자인 문제의 구조로 이해하는 과정과 유사하여, EDA를 디자인 리서치 과정에 방법적으로 적용할 수 있는 가능성을 보여준다. 이상의 내용들을종합하여, 본 연구에서는 디자인 문제의 구성 요소를 데이터의 구성 요소인 변수와 값에 대한 대응 관계로 정의한다면, 디자인 연구 과정 전체를 조망하는 패러다임으로 데이터 과학의 연구 기법을 활용하는 것도 가능할 것이라는 가설을 설정하였다.

IV. 데이터 과학의 방법론을 사용한 디자인 리서치 모델

1. 데이터 과학의 패러다임에 의한 디자인 리서치의 해석

본 장에서는 3장의 논의를 바탕으로 디자인 프로세스를 데이터 과학의 연구모형으로 해석하여 보았다. 연구대상의 디자인 프로세스는 영국 디자인 카운슬의 더블 다이아몬드 디자인 모델을 기반으로 하였다.

먼저 디자인 문제와 데이터 과학의 문제를 동일 선상에서 다루기 위하여, 디자인 문제를 데이터 셋(Data set)으로 이해하는 과정이 필요하다. 디자인 문제는 프로젝트 선언문(Project Statement)에서 해당 디자인 문제가 누구를 대상으로 어떤 사용상황에서 무엇을 서비스하는 디자인을 개발하는지를 제시한다. 이를 통하여 기본적인 사용자(User), 사용 상황(Context), 목표하는 서비스의 내용 및 가치(Measure)를 특정할 수 있으므로, 디자인 문제 데이터 셋의 기본적인 내용은 사용자, 사용상황, 서비스의 내용으로 구성할 수 있다. 이 데이터 셋을 확보하기 위하여 정보 수집 및 사용자 연구를 실시하고 수집된 정보를 정돈된(Tidy) 데이터 셋으로 변형하여 데이터 시각화 및 분석을 실행하면, 디자인 문제를 변수(Variables) 단위로 분해하여 각 변수의 현황과 상관관계, 인과 관계 등을 통계적으로 정의할 수 있으며, 데이터 모델의 구조나 패턴으로 표현할 수 있다. 이 데이터 모델을 디자인 문제의 구조로 대응하면, 데이터 모델의 구조나 변수, 값(Value)의 변경을 통하여 서비스의 내용과 가치(Measure)에 대한 다른결과값을 예측(Simulation)하는 것이 가능하고 서비스의 가치를 높여주는 조합의 데이터 변형을 적용하여 디자인 컨셉 및 디자인 해결안을 도출할 수 있다. 이렇게 제안된 디자인 해결안은 사용자 대상의 통계적 검정 과정을 통하여 디자인을 평가 검증할 수 있으며, 이상의 과정을 종합하면 디자인 문제 해결 과정 전체를 데이터 과학의 문제 해결 방법으로 도출하는 새로운 디자인 방법론으로 정리된다. 이와 같이 데이터 연구의 관점에서 디자인 문제를 이해하면, 다양한 통계적 연구 기법들을 적용하여 디자인 문제에서 발견한 현상의 의미를 도출할 수 있고, 시뮬레이션, 인공지능 등, 빠른 속도로 발전하고 있는 데이터 기술들을 디자인 방법론에 직접 적용하여, 디자인 방법론의 효율과 문제 해결 능력을 높이는 기여를 하게 될 것으로 예상한다.

2. 디자인 프로세스와 데이터 연구 프로세스의 맵핑(Mapping) 및 의미 분석

2.1 디자인 문제의 발견 단계(Discover)의 데이터 연구 방법론 적용

더블 다이아몬드 디자인 프로세스의 발견 단계 (Discover)를 데이터 연구 관점에서 보면, 프로젝트 정의에서 도출된 주요 변수와 관련하여 의미 있는 세부변수들과 데이터들을 수집, 선별하여 데이터 셋을 정의하고, 해당 데이터를 데이터 연구 활동이 가능한 정리된 형태로 가공하는 부분으로 해석할 수 있다. 이 단계는 크게 데이터 큐레이션과 데이터 전처리 과정으로 나눌 수 있는데, Miller는 프로젝트에 필요한 데이터를 선정하고 수집하거나 생성하는 데이터 관리의 과정을 통하여 데이터의 가치를 높이는 행위를 데이터 큐레이션 (Data Curation)이라고 정의하였다[15]. 데이터 큐레이션의 대상인 디자인 정보는 기존의 디자인 연구에서 사용하는 설문 조사, 시장 자료, 웹 서비스 로그 기록 (Log), 앱 사용 데이터 등이 모두 포함될 수 있으며, 필요에 따라 SNS 데이터나 IoT 센서 데이터도 수집한다. 이를 통하여 디자인 주제와 관련한 세부 변수들을 도출하고, 그 값의 현황을 확보한다.

다음 작업은 데이터 전처리(Data Cleaning)라고 하는데, 수집한 데이터들을 분석이 가능한 형태의 표 (Table), 또는 데이터베이스의 형식으로 전환하고, 통계적 분석에 문제가 생기지 않도록 데이터의 결측, 중복, 데이터 타입 불일치 부분들을 삭제, 수정, 대치하는 작업을 수행한다[16]. 이 과정을 통하여 데이터는 정돈된 데이터(Tidy Data)가 되는데, 정돈된 데이터는 데이터 표(Data Frame)의 행이 측정 사례(Case), 열은 변수, 표의 각 셀(Cell)은 해당 측정 사례의 변수별 값을 가지고, 모든 열은 같은 행 수를 갖는 데이터를 말한다. 디자인 프로젝트의 데이터는 이러한 정돈된 데이터 형태의 여러 테이블로 전환 될 수 있으며, 복수의 테이블 사이에는 관계가 형성되면, 테이블 간에 상호 교차 분석이 가능하다.

2.2 디자인 문제의 정의 단계(Define)의 데이터 연구 방법론 적용

디자인 문제의 정의 단계는 디자인 리서치 결과물을 도출하고, 문제의 구조를 모델링하여 중요한 문제를 선정하는 과정인데, 데이터의 현황을 알기 위한 데이터 시각화 작업을 통하여 각 변수의 상황과 변수의 관계를 발견하고, 데이터의 패턴과 모델을 구축하여 데이터 셋의 중요 변수를 선정하는 데이터 분석의 과정으로 대응 할 수 있다.

앞 장의 발견 단계에서 구축한 디자인 문제 관련 변수들의 데이터 셋에서 각 변수가 어떤 분포를 갖는지, 변수 간 상관관계 및 인과 관계의 존재 여부와 그 관계의 강도가 어느 정도인지를 데이터 시각화 기술과 통계적 분석 기술에 의하여 도출한다. 그리고 분석된 결과들을 종합하여 디자인 문제의 변수에 대한 대표적 패턴과 모델을 도출해내고, 서비스의 가치를 높이는 데 중요한 역할을 하는 중요한 변수와 그 값의 패턴을 발견한다. 이 단계에서 발견된 중요 변수와 값의 패턴에 대한 인사이트는 디자인 컨셉과 같이 디자인 해결안에 대한 전략과 방향을 제시한다.

2.3 디자인 해결안의 개발 단계(Develop)의 데이터 연구 방법론 적용

디자인 해결안의 개발 단계는 문제 정의 단계에서 도출한 중요 문제들에 대하여 컨셉을 제시하고 이에 맞는 다양한 디자인 해결안을 탐색하는 단계로서, 창의적인 아이디어를 내고 이를 디자인 해결안으로 발전시키게 된다. 데이터 연구의 관점에서 볼 때 창의적인 아이디어는 중요 디자인 변수가 포함된 데이터 셋의 구조를 바꾸어 새로운 변수를 생성하거나 중요 디자인 변수 간의 관계 및 변수 현황을 변경시키는 방법으로 도출할 수 있으며, 이러한 창의적인 아이디어의 목표는 디자인 해결안에서 추구하는 서비스 가치 변수의 값을 높여주기 위한 데이터 변경 방법을 찾는 것이다. 이 과정에서제너레이티브 디자인 접근법을 사용하거나, 인공지능응용 서비스를 사용하여 최적화 된 데이터 셋의 구성을 도출하고, 제안된 데이터 셋의 구성을 적용하여 디자인의 UI 및 GUI를 개발할 수 있다. 데이터 기술을 사용하면, 매우 빠른 시간에 훨씬 더 많은 디자인 안을 제시할 수 있으며, 서비스의 가치 값도 시뮬레이션 가능하므로, 실험 및 시행착오를 줄이면서 최종 디자인 해결안으로 발전시킬 수 있다.

2.4 디자인 해결안의 구현 및 평가 단계(Deliver)의 데이터 연구 방법론 적용

디자인 해결안의 구현은 최종 디자인 해결안의 세부디자인을 완성하는 부분이고, 평가 단계는 디자인 개발과정에서 제안한 복수의 해결안을 평가하여 하나의 최종 디자인으로 수렴하는 과정이다. 여기에 데이터 연구 방법을 사용한다면, 이미 목표하는 서비스의 가치 값에 대한 달성 정도를 수집된 데이터와 데이터 모델로 예측 가능하고, 가장 좋은 데이터와 모델에 대한 전략 선정도 가능한 상황이므로, 기존의 디자인 프로세스에서 수행하는 복수의 해결안을 낼 필요는 없을 것으로 예상된다. 그러나 데이터 예측이 불가능한 부분이 있거나 불확실성이 큰 경우에는 기존의 데이터 기반 디자인 평가에서 많이 사용해온 A/B 테스팅 방법과 통계적 검증기법으로 평가를 실시하여, 정량적인 방법으로 서로 다른 데이터 전략에 대한 의사결정을 할 수 있다. 그리고 디자인 평가를 통하여 수집된 여러 가지 피드백 정보들을 반영하여 최종 디자인을 완성하는 것처럼, 데이터 과학 기반의 디자인 평가에서도 수집된 피드백 정보들을 데이터 셋의 구성과 데이터 모델에 반영하여 최종디자인을 제작을 위한 데이터 셋으로 완성할 수 있다.

이상의 더블 다이아몬드 모델 기반 디자인 프로세스의 주요 단계별 데이터 연구 방법론의 맵핑(Mapping) 개념은 [표 2]와 같다.

표 2. 디자인 프로세스 각 단계에 대한 데이터 과학 관점의 해석과 단계별 주요 디자인 연구 방법 및 데이터 연구 방법의 비교 맵핑(Mapping)

CCTHCV_2021_v21n10_103_t0002.png 이미지

V. 데이터 과학의 방법론을 사용한 디자인 사례 연구

1. 디자인 리서치를 위한 데이터 셋(Data Set) 구축

데이터 과학의 방법론을 사용한 디자인 방법론의 활용 가능성을 검증하기 위하여 본 연구에서는 서울의 미세먼지 측정 데이터를 기반으로 미세먼지 현황과 예보 안내를 해주는 앱 디자인 사례를 실험해 보았다. 사례실험의 내용을 프로젝트 선언문(Project Statement) 으로 요약하여, “서울의 미세먼지 현황과 예보를 사용자들의 정보 요구에 맞게 안내해주는 앱 서비스를 디자인한다.”로 설정하였다. 이 프로젝트 선언문에서 주요 데이터 변수를 추출하면, 서울의 미세먼지 정보가 필요한 사용자(사용자 데이터), 사용자들의 미세먼지 관련 정보 요구가 발생하는 상황(사용상황 데이터), 정보 요구를 만족하는 미세먼지 현황과 미세먼지 예보 정보(서비스 내용 및 가치)로 주요 변수의 내용을 구성할 수 있다.

먼저 연구 대상 데이터를 확보하기 위하여 사례 서비스 관련한 사용자, 사용상황, 서비스 내용 및 서비스 가치 정보를 포함하는 데이터들을 조사해보았다. 사용자는 서울에 거주하거나, 해당 지역에 방문할 필요가 있으면서 미세먼지 정보에 민감한 사용자들인데, 이들에 관하여 수집 가능한 기존 데이터는 앱 마켓의 미세먼지 관련 앱에 대한 평가 정보나 SNS의 미세먼지 관련 메시지 정보를 활용할 수 있다. 그 외 사용자 대상 설문이나 인터뷰 등을 수행하여 새로 사용자 데이터를 발생시키는 방법도 있으나, 본 사례에서는 이미 수집된 데이터 중 앱 마켓의 주요 미세먼지 앱에 대한 평가 데이터를 수집하였다. 데이터 수집 대상인 미세먼지 정보 서비스의 대표 앱으로 ‘미세미세’와 ‘에어비주얼’ 앱을 선정했고, ‘미세미세’는 2.8만 개, ‘에어비주얼’은 1만 개의 사용자 평가 데이터가 앱스토어에 등록되어있다. 이중 ‘에어비주얼’의 경우 2021년 3월 초 주요 변경 업데이트가 이루어져서, 두 앱 모두 2021년 3월부터 5월까지 3개월 동안 앱스토어에 입력된 평가 데이터를 대상으로 데이터를 수집, 분석하였다. 앱 평가 데이터의 내용을 분류해보면, 앱의 우수성 평가, 감사 인사, 서비스 불만 및 오류 신고, 앱의 장단점, 앱과 관련한 관심 주제로 나눌 수 있었고, 이들을 프로젝트의 주요 데이터 변수로 맵핑하면 [표 3]과 같다.

표 3. 프로젝트의 주요 데이터 변수와 미세먼지 대표 앱(미세미세, 에어비주얼)의 앱스토어 평가 데이터 내용

CCTHCV_2021_v21n10_103_t0003.png 이미지

(데이터 수집 기간: 2021.3.1.-2021.5.31.)

앱스토어의 평가 데이터는 평가내용이 주관식 답변형식으로 되어있고, 조사 기간을 통일할 때 평가 건 수도 서로 달라 두 앱의 정량적 비교는 어려웠다. 데이터 내용을 정성적으로 살펴보면, 사용자 데이터 부분에서는 호흡기 질환과 육아 등 가족 구성원 관련 언급이 있음을 확인하였으나, 언급 비중이 높지 않아서 특정 사용자 집단이 중요하게 구분되지는 않았다. 사용상황 데이터의 앱 사용 시점은 아침 및 외출 활동 전이 자주 언급되었고, 수시확인도 언급되었다. 앱 사용 시점에 대한사용자 관심이 높은 점은 사용 시점이 프로젝트의 주요 변수로 선정되어야 함을 시사한다. 서비스 내용 관련 데이터에서는 앱의 가치에 대한 긍정적 평가 응답이 많았는데, 앱 스토어의 평가 목적이 만족도 평가 및 추천에 있으므로 응답 비중이 높았다. 서비스 불만 및 오류에 대한 의견은 서비스 내용 관련 불만보다는 서비스 작동 오류 관련 부분이 언급되었으며, 구현 기술 관련 오류들에서 새로운 앱 디자인에 참조할 만한 내용은 없었다. 단, 위젯 서비스에 대한 디자인 변경 및 오류 언급이 많아 위젯 형식의 정보 요약 서비스에 대한 관심이 높음이 확인되었다. 앱 평가 데이터에서 가장 의미 있는 발견점은 데이터 신뢰성에 대한 언급과 신뢰성 관련 평가 내용이 많았다는 점이다. 이는 사례 앱의 경우 데이터의 신뢰성이 매우 중요함을 의미하는데, 언급 내용을 보면 사용자들이 어떤 기관의 측정 데이터를 사용하는지에 관심이 높고, 여러 서비스의 정보를 비교해가며 신뢰성 평가를 하고 있었다. 이를 바탕으로 서비스 내용 변수의 주요 가치로 서비스 정보의 신뢰성 확보를 선정하였다.

그리고 각 앱의 장점에 대한 언급을 보면, 정보를 잘 이해할 수 있게 디자인한 부분과 정보에 대한 상세 설명 부분이 공통으로 자주 언급되었고, 각 앱의 디자인 특징을 반영하여, ‘미세미세’ 앱의 캐릭터 사용 부분이나 ‘에어비주얼’의 지도 표현 부분들이 언급되었다. 두 앱은 공통으로 지역별, 일별, 시간별 미세먼지 농도 및 평가 단계 정보를 제공하고 있고, 위젯, 알림, 즐겨찾기 등의 개인화 기능을 제공하는데, 정보의 내용 측면은 차이가 없고, 표현 방법에서 ‘미세미세’는 아이콘 중심, ‘에어비주얼’은 지도 및 그래프 중심으로 정보 전달을 하고 있으나, 정보 디자인 유형을 기준으로 각 서비스가 필요 정보를 정확하고 효과적으로 전달하고 있는지를 앱 평가 데이터를 통하여 비교 확인할 수는 없었다.

한편, 미세먼지 데이터 서비스의 원시 자료인 서울시 미세먼지 측정 데이터를 분석하여 사용자의 정보 요구가 발생하는 사용상황 관련 데이터의 정보 특징을 알아보고자 하였다. 미세먼지 정보 서비스의 자원 데이터는 각 지역 관측소에 시간별로 측정되는 대기오염 측정값들이다. 서울시 미세먼지 정보의 경우 서울시 열린 데이터 광장 사이트에 측정값이 공개된다[17]. 본 연구에서는 미세먼지 데이터의 속성 이해를 위하여 2018년 서울시 대기오염 측정소 관측 정보를 사용하였다. 확보한 데이터 내용은 서울 25개 구별 측정소의 10년간 미세먼지 현황, 2018년 서울 25개 구의 시간별 미세먼지 및 기타 오염물질 측정값, 2018년 서울 중랑구 측정소의 날씨 데이터(온습도, 풍속, 풍향 값), 서울 25개 구별 측정소의 주소 정보이다. 파편화되어 있는 공공 데이터들을 본 연구의 목적에 맞게 재구성하여 전처리하고, 정리한 데이터의(Tidy data) 형식은 [표 4]와 같다.

표 4. 서울시 미세먼지 측정 데이터 및 날씨 측정 데이터의 형식

CCTHCV_2021_v21n10_103_t0004.png 이미지

2. 데이터 시각화에 의한 주요 디자인 변수 현황과 변수 패턴

확보된 측정 데이터 셋의 각 변수에 대한 패턴과 관계를 통계 프로그램 R과 데이터 시각화 패키지 ggplot2를 사용하여 시각화하였고, 이를 앱 평가 데이터에서 도출한 주요 키워드와 연계하여 [표 5]와 같이 서비스의 가치 관련 데이터 질문과 변수 패턴 및 디자인 인사이트를 도출할 수 있었다. 디자인 인사이트에서는 디자인의 가치 변수를 서비스 정보의 신뢰성(정확성) 확보 및 서비스 시점별 정보 표현 방법으로 정하고 이 속성들의 개선과 관련한 의미를 도출하였다. 변수별 데이터 시각화 분석 내용은 [그림 1]에서 [그림 4]까지와 같은 방법으로 수행하였다. 측정 데이터 분석을 통하여 사용자 관련 정보로는 알 수 없는 미세먼지 및 초미세먼지 측정값의 개별 특징과 월, 일, 시간 단위별 값의 데이터 패턴을 발견할 수 있었고, 각 변수 값의 데이터 패턴을 반영하여 사용자가 원하는 신뢰성과 사용 시점별 데이터 표현의 가치를 높이는 정보 표현 방법을 발견할 수 있었다.

표 5. 사례 데이터의 변수 현황 및 디자인 인사이트

CCTHCV_2021_v21n10_103_t0005.png 이미지

CCTHCV_2021_v21n10_103_f0001.png 이미지

그림 1. 2018년 서울시 미세먼지(적색)와 초미세먼지(청색)량의 측정 평균값 현황:월별/ 시즌별 데이터 패턴을 보여준다.

CCTHCV_2021_v21n10_103_f0002.png 이미지

그림 2. 2018년 상반기(1-5월) 일별 미세먼지 측정량:미세먼지 시즌의 일별 측정량 변화를 보여준다. (회색 영역은 한국환경공단 기준 ‘미세먼지 나쁨’ 범위)

CCTHCV_2021_v21n10_103_f0003.png 이미지

그림 3. 2018년 4월 6일(년간 미세먼지가 가장 심했던 날) 의시간별, 구별(지역별) 미세먼지 측정 현황:미세먼지 시즌의 시간별 측정량 변화 패턴을 보여준다. (회색 영역은 한국환경공단 기준 ‘미세먼지 나쁨’ 범위)

CCTHCV_2021_v21n10_103_f0004.png 이미지

그림 4. 2018년 서울시 지역구별 미세먼지 ‘아주 나쁨’ 기준 이상 값이 측정된 횟수:지역별 데이터 패턴과 미세먼지 측정 기준의 적정성을 보여준다.

3. 디자인 해결안 도출을 위한 주요 디자인 변수 패턴의 설정

이상의 데이터 시각화 분석에서 발견된 인사이트를 디자인 프로젝트의 주요 변수 관점에서 재구성하면 [표 6]과 같이 데이터 변수 패턴 기반의 디자인 컨셉을 도출할 수 있다.

표 6. 데이터 변수 패턴 기반의 디자인 컨셉 도출

CCTHCV_2021_v21n10_103_t0006.png 이미지

도출된 컨셉의 내용을 보면, 사용자 데이터 변수 부분과 사용상황 데이터 변수 부분은 기존에 사용하는 설문이나 인터뷰와 같은 디자인 연구 방법론을 사용하여도 출하는 결과의 내용과 차이가 없으나, 설문이나 인터뷰를 하기 위한 투자 시간과 노력보다 훨씬 적은 노력으로 다량, 장기간의 자료를 수집하여 분석할 수 있다는 장점이 있었고, 서비스 내용 데이터 변수의 정보 신뢰성과 정확성 관련한 데이터 패턴은 사용자 연구로는 분석 불가능하고, 미세먼지 정보의 원시 데이터 패턴 분석으로 서비스 신뢰성과 정확성 확보의 핵심 부분을 발견할 수 있어서 기존의 방법론으로는 도출할 수 없는 디자인 컨셉을 제시할 수 있었다. 또한, 사용자 관련 데이터의 분석을 통하여 주요 변수를 추출하고, 주요 변수의 내용과 패턴은 미세먼지 센서의 빅데이터 분석을 실시하여 발견함으로써 디자인 연구에 필요한 데이터셋의 구축 방법도 실험해 볼 수 있었다.

이상의 디자인 컨셉을 활용하여 제너레이티브 디자인 방법으로 수행한다면 주요 컨셉의 내용과 하위 디자인 내용을 디자인 변수와 값의 평가 목표로 설정하고 인공지능이나 소프트웨어적인 방법으로 디자인 모델을 구축하여 최적화 된 디자인 해결안의 데이터 셋 구성을 도출하고, 제안된 데이터 셋의 구성을 적용하여 디자인의 UI 및 GUI를 개발한다. 사례 연구의 경우, 시간별 미세먼지 측정 정보의 효과적으로 표현, 미세먼지와 초미세먼지의 발생 패턴을 반영한 측정값 표기 형식 차별화, 측정 패턴을 반영한 미세먼지 단계 값의 표현 방법디자인, 알림과 위젯으로 시점별 정보 서비스를 제공하는 디자인을 디자인 해결안의 데이터 변수로 사용함으로써, 사용자들이 중요하게 생각하는 서비스 가치인 정보의 신뢰성과 시점별 정보 제공의 편이성을 만족하는 디자인 해결안의 데이터 셋을 도출할 수 있다.

컨셉 설정 이후 제너레이티브 디자인 수행이나 제시된 해결안의 A/B 테스팅 작업은 기존 연구들과 방법이동일 하므로, 본 사례 연구는 디자인 문제를 데이터 셋으로 설정하여 데이터 과학의 관점에서 디자인 컨셉을 도출하는 부분까지만 수행하였다.

본 사례 연구는 디자인 프로젝트의 서비스 구성 내용 정보를 변수로 하여 데이터 분석 방법론에 의한 각 변수의 현황과 변수 패턴을 활용하여 디자인 컨셉을 도출하는 과정을 실증하였으며, 특히 사용자 데이터로 확인할 수 없었던 서비스의 신뢰성 관련 가치 정보를 서비스 사용상황 관련 변수인 서비스 사용 시점 및 서비스 내용과 연계한 정량 데이터 분석으로 보강하였다. 이와 같은 데이터 분석 방법론 기반의 디자인 방법을 활용하기 위해서는 디자인 문제 해결에 적합한 데이터와 데이터 분석 기술의 확보가 필수적으로 요구된다.

VI. 결론

본 연구를 통하여 다음과 같은 결론을 도출할 수 있었다.

첫째, 본 연구는 현재 디자인 프로세스에서 부분적으로 적용되고 있는 데이터를 활용한 연구 방법들을 통합하여 디자인 프로세스 전체에 데이터 과학의 패러다임을 적용하는 개념을 제시하였다. 특히 디자인 문제를 데이터 셋을 구성하는 변수와 값의 상관관계로 정의함으로써, 전체 디자인 프로세스에서 변수와 데이터 패턴의 관리를 통하여 디자인 해결안이 도출되도록 하였으며, 사례 연구를 통하여 제시한 방법론의 연구 효율성과 빅데이터라는 새로운 리서치 자원 활용의 장점을 확인하였고, 디자인 문제 해결을 위한 데이터의 체계적 활용 방안을 검증할 수 있었다.

둘째, 데이터 과학의 패러다임이 디자인에 적용되면 디자인 프로세스를 더 객관적으로 관리할 수 있고, 이를 기반으로 디자인 프로세스에 빅데이터 및 AI 기술을 적극적으로 반영하여 디자인 생산성을 높일 수 있다. 제시한 방법론을 통하여 데이터 과학과 인공지능 등 인접 학문과의 소통이 쉬워지면 대규모화, 시스템화한 디자인 프로젝트를 협업하기 좋은 토대를 마련할 수 있으므로, 디자인 연구 대상이 복잡해지고, 대형화하는 경우의 문제 대응 능력을 확보할 수 있다.

그리고 본 연구를 통하여 향후 디자인 연구와 데이터 과학의 연계를 위해 필요한 선행 조건들을 발견할 수 있었다.

먼저 사례 연구에서 보듯이 서비스 디자인에 필요한 디자인 변수 관련 데이터가 충분히 확보되어야 좋은 결과물을 낼 수 있으므로, 데이터 큐레이션 역량이 중요하고, 데이터 큐레이션의 질에 따라 본 방법론의 적합성이 판단될 수 있다. 본 연구의 방법론을 활용할 경우, 사용 가능한 데이터를 발굴하고 필요 데이터를 생성하여 디자인 변수로 편입시키는 과정이 디자인 프로젝트의 성공에 중요한 역할을 하게 될 것이다. 그러므로 디자인 문제를 정의하는 변수와 관련 데이터를 확보하는 데이터 큐레이션 방법에 대한 심층연구가 필요하다.

그리고 본 연구 방법론은 디자이너에게도 데이터 문해력을 요구한다. 디자이너에게 학제적 소통 능력이 필요한 것은 새로운 논의가 아니지만, 제안하는 디자인방법론을 활용하려면 디자이너 교육을 위한 교과 과정에서 데이터 과학을 심도있게 다루고, 데이터 분석 역량을 실습하는 디자인 실기 교과 내용이 동반되어야 할 것이다.

References

  1. 빅데이터 전략 연구소, 빅데이터 개론, 광문각, pp.54-89, 2019.
  2. H. Sharp, J. Preece, and Y. Rogers, Interaction Design-beyond human computer interaction 5th edition, John Wiley & Sons Ltd, pp.349-365, 2019.
  3. J. Lazar, J. H. Feng, and H. Hochhelser, Research Methods on Human-Computer Interaction, John Wiley & Sons Ltd, pp.5-14, 2010.
  4. J. O'Grady and K. O'Grady, A Designer's Research Manual, Rockport, pp.21-64, 2009.
  5. R. King, E. F. Churchill, and C. Tan, Designing with data, O'reilly, pp.3-6, 2017.
  6. http://www.beausable.net
  7. P. Marti, C. Megens, and C. Hummels. "Data-Enabled Design for Social Change: Two Case Studies," Futrure Internet, Vol.46, No.8, pp.1-16, 2016.
  8. J. Kollenburg, S. Bogers, H. Rutjes, E. Deckers, J. Frens, and C. Hummels, "Exploring the Value of Parent-Tracked Baby Data in Interactions with Healthcare Professionals: A Data-Enabled Design Exploration," CHI 2018 Conference, p.297, 2018.
  9. A. Ravi, What Generative Design Is and Why It's the Future of Manufacturing, New equipment, 2018. (https://www.newequipment.com/research-and-development/article/22059780/what-generative-design-is-and-why-its-the-future-of-manufacturing)
  10. M. Roback, Generative Design: 제조업의 가능성을 재정립하다, Autodesk, pp.3-33, 2020.
  11. L. Bradshaw, The Great Data Revolution-The Future of Data Driven Innovation, The U.S. Chamber of Commerce Foundation, pp.21-27, 2014.
  12. V. Dhar, "Data Science and Prediction," Communications of the ACM, December Vol.56, No.12, pp.64-73, 2013. https://doi.org/10.1145/2500499
  13. 조민호, 데이터분석 전문가를 위한 R 데이터 분석, 정보문화사, pp.117-118, 2019.
  14. D. R. Wichham, for Data Science, Programming Insight, xii-xiv, pp.77-105, 2019.
  15. J. R. Miller, "Big Data Curation," 20th International Conference on Management of Data (COMAD), p.4, 2014.
  16. S. Wu, "A review on coarse warranty data and analysis," Reliability Engineering and System, Vol.1, No.11, p.114, 2013.
  17. http://www.data.seoul.go.kr