1. 서론
오늘날 현대인들의 가장 큰 고민 중 하나는 바로 수면이다. 세계수면학회(World Sleep Society)는 매년 3월 셋째 주 금요일을 ‘수면의 날’로 정해 현대 생활 속에서 간과할 수 있는 수면의 중요성을 강조하며 수면 장애의 예방 및 관리를 통해 사회 경제적 부담을 줄이기 위해 노력하고 있다[1]. 최근 양질의 수면에 대한 요구가 증가함에 따라, ICT 기술과의 융합을 통한 ‘슬립테크(sleep tech)’ 기술이 미래 성장 산업으로 인식되고 있으며, CES 2020~2022에서 소개될 만큼 중요성이 높아지고 있다[2].
최근 세계적인 슬립테크 기업들은 소비자에게 양질의 수면을 보장하기 위해 여러 방향성을 고려하고 있다. 그 중에서도 소비자의 수면 환경을 직접적으로 개선할 수 있는 제품들의 개발이 활발히 진행되고있으며 소비자의 수면 환경을 개선하는 서비스에 있어서 기준점을 제공할 수 있는 사용자 수면 패턴 분석의 연구가 활발히 진행되고 있다.
수면 환경 개선 제품들 중 하나로 대표적인 모션베드는 다양한 모터 및 IoT 센서를 장착하고 있는전동 침대를 의미한다. 모션 베드를 활용하는 예를 들면 장착된 전동 모터를 활용하여 수면 중 사용자의신체 각도를 조절하거나 온도 매트를 활용하여 사용자의 수면 온도를 조절하는 등 사용자의 수면 환경의 직접적인 제어를 수행할 수 있다. 점차 개선된 모션베드가 개발되고 보급됨에 따라서 사용자의 수면 중 모션 베드가 생성하는 사용자의 수면 데이터를 활용하는 방법에 대한 방향성이 제시되었고 기업들은 수면 데이터를 활용하여 수면과 관련된 서비스의 개선을 시도하게 되었으며 이뿐만 아니라 스마트 헬스케어와 같이 여러 ICT 기술이 융합된 분야에서 모션베드를 활용하려는 연구가 활성화되었다. 해당 연구들을 살펴보면 특히 모션 베드의 IoT 센서를 활용하여 수면 중인 사용자 데이터를 모니터링하기 위한 연구와 사용자의 수면 환경 제어를 자동화하기 위한 연구에 주로 방향성을 두고 있음을 확인할 수 있다 [3,4].
또한 수면의 질을 개선하고자 많은 연구 및 방법들이 진행되고 있는데, 그 중에 수면다원검사(PSG, polysomnography)는 수면 검사의 대표적인 방식으로 수면 중에 검사 대상자에게서 발생하는 여러 생체신호를 수집, 동시에 결합하여 수면 이상 증세를 판단하는데 활용되고 있다. 그러나, PSG는 다양한 종류의 센서를 부착한 채로 측정을 수행하여 검사 대상자에게 위화감을 조성하고 소음 정도, 수면 온도 등 변인들이 통제된 검사실이 아닌 일반적인 수면 상황을 재현하기 어렵기 때문에 일상 중 환경에서의 수면패턴의 정확한 파악은 불가능하므로 실제 수면 환경을 반영할 수 있는 측정 방법이 필요하다[5].
본 논문에서는 우리 생활에서 매우 중요한 수면의 질을 향상시키기 위하여 모션 베드 환경에서의 맞춤형 숙면 서비스를 제공할 수 있는 시스템 설계를 제안한다. 제안하는 시스템은 최적의 수면 환경을 제공하기 위해 수면 장애 요소를 탐지하고 최적의 수면서비스를 제공할 수 있도록 설계되었다. 또한, 일상중 환경에서의 수면 패턴 분석을 위하여 수집된 사용자의 수면 데이터를 활용하여 수면 패턴 분석을 수행하였다.
본 논문의 구성은 다음과 같다. 2장에서는 관련 연구를 소개하고, 3장에서는 제안한 모션 베드 환경에서 맞춤형 숙면 서비스를 위한 시스템 설계 및 사용자 수면 패턴 분석에 대하여 설명한다. 그리고 4장에서는 제안한 사용자 수면 패턴 분석 결과 및 기존기법들과 비교하여 제안한 기법의 성능과 유효성을 평가하고 5장에서 결론 및 향후 연구로 맺는다.
2. 관련연구
2.1 맞춤형 숙면 서비스
맞춤형 숙면 서비스는 맞춤형 서비스와 숙면 유도서비스의 합성어이다. 맞춤형 서비스란 사람들의 성향을 파악하여 그들에게 맞춤형 정보를 제공해 주는 것을 말한다[6]. 특히, 빅데이터 및 인공지능 기술의 발전은 맞춤형 서비스에 대한 중요성 및 활용성이 높아지고 있는 현실이다. 숙면 유도 서비스는 음향제어 서비스, 실내 온도 제어 서비스, 조명제어 서비스, 실내 가전기기 제어 서비스[7], 코골이 제어 서비스가 있다.
특히, 최근 출시되고 있는 모션베드는 수면 환경조성을 위해 모션베드의 각도를 조절하여 수면 장애및 하체의 혈액순환 장애 등의 수면의 질 개선 서비스를 제공하고 있다. 그러나 기존 모션베드 제품에는몇 가지 단점이 존재한다. 사용자의 호흡 및 자세 감지 외에 수면에 영향을 줄 수 있는 다른 요인들을 검출할 수 없다는 점이다. 숙면에는 사용자의 호흡과 자세 외에도 더 다양한 요인들이 큰 영향을 미치므로 다른 요인들도 검출할 필요가 있다. 또한, 기존의 모션 베드에서 쾌적한 수면 환경 조성을 위해 조절할 수 있는 요인은 ‘각도’ 한 가지뿐으로 숙면을 위한 환경 조성에 한계점이 있다.
사용자에게 맞춤형 숙면 서비스를 제공하기 위해서는 사용자가 어떤 수면 상황을 겪고 있는지, 사용자가 수면에 장애가 되는 요인을 보유하고 있는지 확인해야 한다. 이때, 스마트폰을 이용해 서비스를 구현하면 개인의 맞춤형이 가능하다는 장점[8]이 있으므로 스마트폰과 실제 베드에 센서를 장착해 데이터를 수집하게 된다. 이후, 수집된 데이터를 처리해 사용자 수면 패턴 분석을 진행하면 효과적인 맞춤형 숙면 서비스 제공이 가능하다. 이 과정에서 데이터수집 및 처리 모듈, 수면 패턴 분석 알고리즘을 탑재한 추천 및 서비스 모듈, 사용자에게 서비스 제공을 위한 하드웨어 및 소프트웨어가 포함된 시스템이 필요한 상황이다. 본 논문에서는 사용자의 수면의 질을 향상시킬 수 있는 맞춤형 숙면 서비스 제공을 위한 시스템 설계 및 사용자 수면 패턴 분석 모델을 제안한다
2.2 데이터 패턴 분석
데이터 분석에 활용되는 대표적인 AI 알고리즘은 다중 선형 회귀(Multiple linear regression)[9,10], 서포트 벡터 머신(Support vector machine)[11,12], 의사 결정 트리(Decision tree)[13,14], 랜덤 포레스트 (Random forest)[15,16], 로지스틱 회귀(Logistic re- gression) 등이 있다. 특히, 로지스틱 회귀는 독립 변수와 종속 변수의 연관성을 분석하고 종속 변수 값의 발생 가능성을 예측한다[17]. 특히 로지스틱 회귀의 경우 독립 변수와 종속 변수의 연관성을 함수로 나타내어 독립 변수의 영향력을 함수로 나타낼 수 있기 때문에 종속 변수에 유의미한 영향력을 끼치는 요인 파악 및 각 독립 변수의 구체적인 영향력 분석, 그리고 종속 변수 값 예측 연구[18,19]에 활용된다.
최근 수면을 개선하기 위하여 웨어러블 기기를 활용한 수면 패턴 분석을 수행하는 연구[20]가 수행되거나 수면의 구조를 세분화하고 수면의 질을 나타내는 지표를 수치화하여 수면의 질에 영향을 끼치는 패턴 분석을 수행하는 연구[21]가 수행되는 등 AI 모델을 기반으로 하는 수면 패턴 분석의 연구가 다양하게 수행되고 있다. 그러나 수면 환경을 제한하는 수면다원검사(PSG)를 활용하는 경우가 상당수 존재하며, 일반적으로 사용할 수 없는 의료 기기나 특수 장비 등을 분석에 활용하는 경우 역시 상당수 존재한다. 그러므로 일반적인 사용자를 위한 수면 패턴 분석은 일상적인 수면 상태에서 발생하는 수면 정보를 기반으로 수면 패턴을 분석할 필요가 있다.
맞춤형 숙면 서비스를 제공하여 사용자의 수면을 개선하기 위한 선행 조건은 사용자의 수면 패턴 분석에 있다. 또한 수면 패턴 분석에 있어서 중요한 점은 사용자의 수면 패턴 분석 모델에 있어서 일정 이상의 정확도를 유지해야 하며, 사용자의 수면에 주변 요인들이 끼치는 영향력에 대한 명확한 판단이 필요하다.
본 논문에서는 일상생활에서 사용자의 수면 패턴을 분석하고 수면 만족도에 영향을 줄 수 있는 요인의 영향력을 파악하여 맞춤형 숙면 서비스 제공을 통해 사용자의 수면 질을 개선하는 것을 목표로 한다. 즉, 독립변수와 종속변수의 관계를 직관적인 함수로 나타내고 각 독립변수(수면 만족도에 영향을 주는 요인)의 영향력을 구체적으로 실험을 통해 검증한다.
3. 모션베드 환경에서 맞춤형 숙면 서비스를 위한 시스템 설계
3.1 서비스 개요
본 논문에서 제안한 모션베드 환경에서 맞춤형 숙면 서비스를 위한 시스템의 서비스 모델은 Fig. 1과 같다.
모션베드에서 사용자들에게 최적화된 수면 환경을 제공하기 위해 전처리 과정과 서비스 과정으로 구분되며, 아래와 같이 6단계로 진행된다.
■ Step 1 사용자 등록 단계
-사용자는 앱을 통해서 사용자 정보를 수면 데이터 처리/관리 서버에 등록
-모바일 기기와 모션베드를 Bluetooth로 연결하여 모바일 앱에서 베드 정보를 수면 데이터 처리/관리 서버에 등록
■ Step 2 사용자 인식 및 시작 단계(사용자의 모션 베드 사용 확인)
-모바일 기기가 모션 베드의 근처에 있다면, Bluetooth로 자동 페어링 되어 모션베드가 사용자의 베드 사용을 감지
-모바일 앱과 모션 베드에서 베드 제어 기능 활성화
-사용자가 4가지 모드(숙면 모드, 휴식 모드, 수동 모드, 안전 모드) 중 서비스 시작 모드설정 (10초간 무응답 지속 시 숙면 모드로 서비스 시작)
■ Step 3 데이터 전송 단계
-숙면 모드, 수동 모드일 때 모션 베드가 수집한 센서 데이터(온도, 습도, 기울기, 조도, CO2)를수면 데이터 처리/관리 서버로 전송
Fig. 1. Service model of customized deep sleep service system.
-수동 모드일 때, 피드백(사용자가 직접 제어) 데이터를 함께 전송
-사용자 코골이 발생 시 코골이 데이터를 함께 전송
■ Step 4 수면 패턴 분석 단계
-수면 데이터 처리/관리 서버가 수집된 데이터를 이용하여, 수면 중 사용자의 상태(코골이, 뒤척 임, 선호 온도 등)을 판단
-서버가 앱을 통해 수집된 사용자 수면 정보를 분석 알고리즘에 적용해 사용자의 수면에 장애를 일으키는 요인 탐색 및 선호하는 수면 환경을 판단
■ Step 5 맞춤형 숙면 콘텐츠 생성 단계
-맞춤형 숙면 콘텐츠 추천 서버가 사용자 상태에 따른 최적 온도/기울기 값, 시각화된 수면 정보 등의 맞춤형 숙면 콘텐츠를 생성
-분석된 사용자 수면 장애 요소를 기반하여 최적의 숙면 콘텐츠 제공
-수면 장애 요소 중 모션 베드를 활용해 해결이 불가능한 경우, 장애 요소를 해결해 수면의 질개선에 도움이 되는 정보를 탐색해 DB에 생성
■ Step 6 맞춤형 숙면 서비스 제공 단계
-추천 콘텐츠 서버가 모바일 앱을 통해 사용자에게 수면 상태 정보 및 수면의 질 개선에 도움을 주는 맞춤형 추천 정보를 제공
-추천 콘텐츠 서버가 모션베드를 통해 사용자에게 최적의 온도 환경을 제공
3.2 맞춤형 숙면 서비스 시스템 설계
제안한 모션베드 환경에서 맞춤형 숙면 서비스를 제공하기 위한 시스템은 Fig. 2와 같다. 서비스 시스템 매니저를 중심으로 데이터 처리/관리 서버, 추천처리/서비스 서버, 모바일 어플리케이션으로 구성된다.
Fig. 2. Configuration diagram of customized deep sleep service.
■ 서비스 시스템 매니저
-서비스 시스템 매니저는 본 논문에서 제안하는 시스템의 개발 환경과 리소스를 관리하고, 데이터/처리 관리 서버와 추천처리/서비스 서버의 자동 및 수동 작업을 관리
■ 데이터 처리/관리 서버
-Sleep contents register: 수면 데이터 DB에 사용자 수면 환경 정보, 수면 상태 정보 및 기본 정보 저장
-Sleep contents compositor: 수집되어 처리된 수면 환경 정보, 수면 상태 정보에 데이터 분석 알고리즘을 적용해 재가공 및 분석
-Data processing & saving: 다양한 수면 데이터수집 시 스키마 정의를 통해 데이터 정제 및 처리
-Feedback manager: 사용자가 모션 베드를 수동조작해 수집되는 데이터를 피드백으로 규정하고, 기존 수면 데이터에 반영 및 DB에 저장해 맞춤형 숙면 서비스 제공에 영향이 큰 피드백 데이터를 집중 관리
■ 추천 처리/서비스 서버
-Analyzed data receiver: 데이터/처리 관리 서버에서 분석이 완료된 데이터를 수신
-Sleep contents recommender: 수집된 데이터를 기반으로 사용자 별 맞춤형 숙면 콘텐츠 생성
-Sleep contents adapter: 생성된 숙면 콘텐츠에 이슈 발생 시 수정 및 삭제를 지원
-Sleep contents & Profile mash-up: 사용자에게 숙면 콘텐츠 제공을 위해 사용자 정보와 숙면콘텐츠 취합
-Customized contents-provider: 숙면 콘텐츠를모션 베드 및 모바일 어플리케이션에 전달해 사용자에게 제공
■ 모바일 애플리케이션
-Contents viewer: 모바일 어플리케이션에서 지원하는 기능들을 시각화해 사용자에게 제공
-Info Visualization: 추천 처리/서비스 서버에서 생성된 사용자 별 수면의 질 개선에 도움을 주는 맞춤형 추천 정보를 수신해 사용자에게 시각화
-Realtime Monitoring: 서버에 송신된 실시간 모션 베드 상태를 전달받아 사용자에게 모니터링
-User Profile(Sleep) Providing: 사용자의 기본정보를 수집하고, 데이터 처리/관리 서버로 데이터 송신
-Remote Control: 모바일 어플리케이션을 통해 모션 베드 원격 제어 기능을 지원
-Feedback Providing: 사용자가 모바일 어플리케이션에서 모션 베드 원격 제어를 시도하면 데이터 처리/관리 서버로 데이터 송신
-Motion Bed Paring: 데이터 처리/관리 서버와 모션 베드 연동을 위한 페어링 기능 수행
3.3 맞춤형 숙면 서비스를 위한 사용자 수면 패턴 분석
본 절은 맞춤형 숙면 서비스를 제공하기 위해 최적의 사용자 수면 패턴 분석 모델에 대하여 제안한 다. 제안한 방법은 로지스틱 회귀 모델을 기반으로하는 사용자의 수면 패턴 분석 모델을 설명한다. 사용자 수면 패턴은 종속변수인 사용자의 수면 만족도와 독립변수인 사용자의 수면 데이터, 수면 환경 데이터 및 개인 정보(프로파일) 데이터 등 간의 연관성 및 유의 수준(Significance level)을 단계적으로 분석하는 방법에 대하여 제안한다.
3.3.1 사용자 수면 패턴 분석 처리
본 논문이 제안하는 맞춤형 숙면 서비스 제공을 위해 Fig. 3과 같이 사용자 수면 패턴 분석 처리를 수행한다.
Fig. 3. Processes of user’s sleep pattern analysis.
사용자 수면 패턴 분석 처리의 프로세스는 크게 데이터 전처리, 로지스틱 회귀 모델 훈련 및 유의미한 독립변수 선택, 사용자의 수면 패턴 분석 수행으로 구성된다.
첫 번째로, 사용자의 수면 데이터를 훈련 데이터로 입력받는다. 훈련 데이터 중 0과 1로 구성된 수면만족도 데이터를 타겟 데이터로 구분하고, 나머지 독립변수인 코골이, 뒤척임, 수면 중 소음 수준, bmi, 수면 시간 등의 데이터를 특성 데이터로 구분한다.
두 번째로, 훈련 데이터에 독립변수 데이터가 존재한다면 로지스틱 회귀 모델을 생성하여 훈련 데이터(타겟 데이터 및 특성 데이터)에 적합시킨다. 여기서, 로지스틱 회귀 모델 내 모든 독립변수(코골이, 뒤척임 등)의 유의수준(p-value)이 0.05보다 작은지 확인한다. 조건에 맞다면 로지스틱 회귀 모델의 훈련을 끝내고, 그렇지 않다면 모델 내에서 가장 유의수준(p-value)의 값이 높은 독립변수를 찾아서 해당 독립변수의 데이터를 특성 데이터에서 제외한 후 두 번째 과정을 다시 수행한다. 로지스틱 회귀 모델 훈련이 끝났을 때, 훈련 데이터 내에 독립변수가 존재한다면 훈련된 회귀 모델을 활용하고 그렇지 않다면 사용자 수면 패턴 분석을 종료한다.
마지막으로, 완성된 단계적 후진 로지스틱 회귀모델 내의 로지스틱 회귀 계수를 기반으로 독립변수 (코골이, 뒤척임 등)와 수면 만족도 간의 연관성을 분석하여 사용자 수면 패턴 정보를 생성하는 사용자수면 패턴 분석을 수행한다.
3.3.2 사용자 수면 패턴 분석 알고리즘
맞춤형 숙면 서비스를 제공하기 위해 로지스틱 회귀 분석을 활용하여 사용자 수면 패턴을 분석 한다. 사용자 수면 패턴 분석은 0과 1로 구성된 이진 종속변수의 확률을 예측하여 0과 1 사이의 값을 산출하는 방식으로 사용하며 먼저 수면 만족도를 “만족”과 “불만족”의 이진 종속변수로 가정하고, 수면 만족도에 대하여 하나 이상의 독립변수 간의 연관성을 분석한다.
수면 패턴 분석은 로지스틱 함수를 활용하여 종속변수와 독립변수 간의 관계를 추정하는 통계기법으로 로지스틱 회귀 분석을 활용한다[22]. 주어진 다수의 독립변수를 X=(X1,X2,X3,...,Xn),종속변수를 Y로 가정할 때, 수면 만족도가 “만족”으로 추정될 반응확률 Py는 다음과 같다.
\(P _ { y } = \frac { 1 } { 1 + e ^ { - ( \beta _ { 0 } + \beta _ { 1 } x _ { 1 } + \beta _ { 2 } x _ { 2 } + \ldots + \beta _ { 1 } x _ { n } ) } }\) (1)
식 (1)에서 β는 로지스틱 회귀계수를 의미하고 각 독립변수에 대하여 최대우도 추정법(Maximum Likelihood Estimation)을 활용하여 추정한 값들을 의미한다[23]. 여기서, 우도(Likelihood)란 관측값의 확률 분포를 추정하는 확률을 의미하며, 모든 관측값의 우도를 최대로 추정했을 때, 관측값이 발생할 확률을 최대화할 수 있다. 따라서, 최대우도 추정법을 통해 로지스틱 회귀계수를 추정하면 확률을 예측하는 적합한 입력 데이터를 계산할 수 있다.
반응확률 Py는 μ(x)로 표현할 수 있으며, 비선형 함수의 형태인 로지스틱 함수를 변형한 로지트 함수를 통해 식 (1)을 변형하여 식 (2)와 같은 β에 대한 선형 함수로 표현할 수 있다[22].
\(\left. \begin{array} { l }{ \operatorname { logit } [ \mu ( x ) ] = \operatorname { ln } ( \frac { \mu ( x ) } { 1 - \mu ( x ) } ) }\\{ = \beta _ { 0 } + \beta _ { 1 } x _ { 1 } + \beta _ { 2 } x _ { 2 } + \ldots + \beta _ { p } x _ { p } } \end{array} \right.\) (2)
여기에서 \(\frac{\mu(x)}{1-\mu(x)}\)는 Py의 정의에 따라 수면 만족도에 대하여 “만족을 추정할 확률 대 불만족을 추정할 확률 비율”인 오즈(Odds)를 의미한다. 또한 (2) 식이 로지스틱 회귀모형의 형태를 보여 회귀 계수가 0 미만인 독립변수는 증가할수록 수면 만족도가 “만족”일 확률을 낮추고 회귀 계수가 0 이상인 독립변수는 증가할수록 수면 만족도가 “만족”일 확률을 높인다는 것을 확인할 수 있다.
사용자 수면 패턴 분석은 먼저, 0과 1로 구성된 종속변수인 Y에 사용자의 수면 만족도를 대입하고수면 만족도와 연관성을 구하고자 하는 독립변수 X 에 코골이, 뒤척임, 수면 중 소음 수준, bmi, 수면 시간을 대입한다. 그리고 최대우도 추정법을 활용하여 수면 만족도와 독립변수 간의 연관성을 나타내는 로지스틱 회귀 계수 β (β0,β1,β2,β3,...,β5)를 구하며, 이를 위한 로지스틱 회귀의 로그 우도를 연산하는 식은 다음과 같다[23].
\(Log \ Likelihood= \sum _ { i = 1 } ^ { N } y _ { i } \operatorname { log } ( P _ { y _ { i } } ) + ( 1 - y _ { i } ) \operatorname { log } ( 1 - P _ { y _ { i } } )\) (3)
식 (3)에서 N은 데이터의 개수이고,Py는 수면 만족도가 “만족”일 확률을 의미한다. 여기서, log함수는 단조함수이므로 위의 식을 최대화하는 Py를 구하면 로지스틱 회귀 모델의 우도를 최대화할 수 있으며, Py는 식 (1)과 같이 로지스틱 회귀 계수 β로 구성된 비선형 함수로 나타낼 수 있다. 또한 식 (1)을 변형하여 식 (2)와 같이 로지스틱 회귀 계수 β에 대한 선형 함수를 표현할 수 있으므로 결론적으로 식 (3)을 최대화하여 로지스틱 회귀 계수 β를 추정할 수 있다.
최대우도 추정법을 통해 추정된 로지스틱 회귀 계수를 식 (1)에 대입하고,X에 예측하고자 하는 독립변수 데이터 x(x1,x2,x3,...,x5)를 대입하면 수면만족도가 “만족”일 확률을 추정하는 회귀를 수행할 수 있으며, 추정된 확률 Py가 0.5 이상인 경우, “만족” 을 의미하는 1, 0.5 미만인 경우, “불만족”을 의미하는 0으로 분류(Classification)를 수행할 수 있다.
또한 식 (2)를 활용하여 로지스틱 회귀 계수 중각 독립변수의 회귀 계수를 통해 수면 만족도와 독립 변수(코골이, 뒤척임 등)와의 연관성을 구할 수 있다. 식 (2)의 우변에서 로지스틱 회귀 계수가 양수인 경우, 독립변수의 값이 증가할수록 오즈에 로그를 취한 값이 증가하는데, 로그 함수는 단조 함수이므로 오즈도 증가한다. 여기서,Py가 증가할수록 오즈도 증가하므로 수면 만족도가 “만족”일 확률도 증가한다. 즉, 로지스틱 회귀 계수가 양수이면 독립변수와 수면 만족도가 “만족”일 확률은 양의 상관관계를 갖고, 음수이면 음의 상관관계를 갖는다. 또한, 로지스틱 회귀계수의 절댓값이 클수록 독립변수가 수면 만족도가 “만족”일 확률에 끼치는 영향력이 크다고 볼 수 있다.
위와 같이 로지스틱 회귀 분석 모델을 통해 각 독립변수(코골이, 뒤척임 등)와 수면 만족도의 연관성을 분석할 수 있으며, 사용자의 수면 패턴 정보를 생성하고 저장한 후 이를 기반으로 사용자 맞춤형 서비스를 제공할 수 있다.
4. 실험 및 분석
4.1 실험 설계
4.1.1 실험 데이터 및 실험 환경
본 절에서는 제안한 사용자 수면 패턴 분석을 검증하기 위하여 총 867명의 사용자의 수면 데이터를 수집하였고, 조사 대상자 중 3개월 이상 2주에 한 번씩 주기적으로 응답해준 233명 중 수면 데이터에 결측치 혹은 이상치가 존재하지 않는 사용자의 수면데이터를 정제하고, Fig. 4와 같이 176명의 수면 패턴을 분석하였다.
Fig. 4. Collected user’s sleep data.
수집된 데이터는 단계별로 정도를 나타내는 범주형 데이터(수면 만족도, 코골이 빈도, 뒤척임, 수면 중소음)와 일정 범위 내에서 연속적인 수치(BMI, 수면 시간)를 나타내는 연속형 데이터로 구성되어 있고 이를 특성별로 나열하면 Table 1과 같이 나타난다.
Table 1. User sleep data features.
수면 만족도, 코골이 빈도, 뒤척임, 수면 중 주변소음의 경우, 각각 정도에 따라 1~5단계, 0~4단계, 0~3단계의 정도를 나타내고 BMI와 수면 시간(분단위)의 경우, 실수형 수치 데이터의 형태로 직접적인 특성값을 나타낸다. 본 논문에서는 사용자의 명확한 주관을 반영하기 위해서 수면 만족도 데이터 중3단계 이하는 “불만족”을 의미하는 0으로, 4단계 이상은 “만족”을 의미하는 1로 변환한다.
실험의 목적에 따라서 수면 데이터는 기간을 구분하여 사용한다. 먼저, 학습을 위한 데이터는 설문 1회차부터 6회차까지의 초반 수면 데이터를 훈련 데이터로 활용한다. 다음으로 사용자 수면 패턴 분석의 성능을 평가하기 위해서는 집단의 독립변수의 값이 변화한 데이터가 필요하므로 훈련 데이터와 가장 멀리 떨어진 기간의 데이터를 활용하는 것이 적절하다. 따라서, 수면 패턴 분석 모델이 분석한 정보를 기준으로 설문 9회차부터 10회차까지의 후반 수면 데이터를 활용한다. 제안한 사용자 수면 패턴 분석에 대한 실험을 위해 Table 2와 같이 실험 환경을 구성하였다.
Table 2. Test environment.
4.1.2 사용자 수면 패턴 분석 모델 성능 평가
본 논문에서 제안한 사용자 수면 패턴 분석 모델의 성능 평가를 위하여 수면 만족도 예측에 대한 검증을 수행하고 기존 예측 알고리즘과의 비교분석을 수행한다. 모델에 대한 검증 방식은 혼동행렬을 이용 하며, 혼동행렬은 아래의 Table 3과 같다.
Table 3. Layout of a confusion matrix.
Table 3의 혼동행렬에서는 모델의 예측과 실제 결과를 긍정과 부정으로 구별하여 예측된 긍정(Pre- dicted positive)과 예측된 부정(Predicted negative), 실제 긍정(Actual positive)과 실제 부정(Actual neg- ative)으로 구분하고 모델의 예측과 실제 결과를 비교하여 서로 같은 경우, 예측의 성공을 의미하는 정답 긍정(TP)과 정답 부정(TN)으로 판단하며 서로다른 경우, 예측의 실패를 의미하는 오답 긍정(FP), 오답 부정(FN)으로 판단하여 정확도를 검증한다.
정확도는 가장 직관적으로 모델의 성능을 평가할 수 있는 지표로 모든 예측 결과(TP + TN + FP + FN)에 대하여 예측에 성공(TP + TN)한 비율을 의미하며 다음과 같이 나타낸다.
\(accuracy = \frac { T P + T N } { T P + F P + T N + F N }\)
Table 4는 수면 만족도 예측의 정확도를 기준으로 제안한 모델과 비교분석을 수행할 기존의 머신러닝 모델이다.
Table 4. Machine running models to perform comparative analysis.
Ensemble learning : Technique for drawing accurate predictions by combining predictions using multiple classifiers
4.a2 실험 결과
본 절에서는 사용자 수면 패턴 분석 처리 및 알고리즘의 실험 결과를 제시한다. 먼저, 5개 모든 독립 변수를 포함한 훈련 데이터를 학습시켜 수면 만족도에 대한 로지스틱 회귀 모델을 구축한 결과는 Table 5와 같다.
Table 5. Results of logistic regression analysis.
B: Regression coefficient, S.E. : Standard error, Wald : (B/S.E)2, df : Degree of freedom, Sig. : Significance level, Exp(B) : Odds ratio
Table 5의 총 5개 독립 변수 중 뒤척임, BMI, 수면시간의 유의 수준(Significance Level, sig)은 0.05값보다 작으므로 수면 만족도 예측 모델 구축에 유의하지만 코골이, 주변 소음의 유의 수준은 0.05값보다크므로 유의하지 않음의 결과를 알 수 있다. 다음으로 Table 5의 모델에 후진 소거법(backward elimi- nation)을 적용하여 유의하지 않은 코골이와 주변 소음 등과 같은 독립변수를 순차적으로 훈련 데이터에서 제외하고 이후 학습을 통해 생성된 수면 만족도에 대한 단계적 후진 로지스틱 회귀(backward stepwise logistic regression) 기법을 적용한 결과는 Table 6과 같다.
Table 6. Results of backward stepwise logistic regression analysis.
B: Regression coefficient, S.E. : Standard error, Wald : (B/S.E)2, df : Degree of freedom, Sig. : Significance level, Exp(B) : Odds ratio
Table 5에서 유의했던 뒤척임, BMI, 수면 시간과 같은 독립 변수들은 후진 소거법을 적용한 Table 6의 모델에서도 유의 수준이 0.05값보다 작은 값이 도출되어 수면 만족도를 예측하는데 영향을 주는 독립 변수로 유의함을 확인할 수 있다. 또한, 유의한 독립변수 중 뒤척임(Moving)의 경우, 회귀 계수(Regres- sion coefficient, B)가 음수이므로 단계가 높아질수록 수면 만족도가 “만족”일 확률을 감소시키고 BMI 와 수면 시간(Sleep_Time)의 경우, 회귀 계수가 양수이므로 단계가 높아질수록 수면 만족도가 “만족”일 확률을 증가시킴을 알 수 있으며, 확률에 대한 상세한 변화는 오즈비(Odds ratio, Exp(B))를 통해 구할수 있다.
본 논문에서 제안한 단계적 후진 로지스틱 회귀 모형 기반의 사용자 수면 패턴 분석 모델의 성능을 평가하기 위하여 수면 만족도에 대한 예측 정확도를 측정하고 비교 분석을 검증한다. 제안한 모델과 기존의 예측 알고리즘을 기반한 모델과 비교 분석한 결과는 Table 7과 같다.
Table 7은 연관관계 확인(Association check)과 정확도(Accuracy)에 대하여 비교 분석 검증한 결과로서, 먼저 각 예측 모델의 수면 만족도의 예측 정확도를 확인하였다. 그리고 연관관계 확인(Associa-tion check)의 경우, 수면 만족도 예측 모델이 코골이, 뒤척임 등과 같은 각각의 독립변수와 수면 만족도의 연관성에 대한 검증으로 “가능함”(Yes), “부분적으로 가능함”(Partly Yes), “불가능함”(No)으로 구분하였다.
Table 7. Result of comparative analysis of prediction models.
Association check : Check whether the association of independent variables can be verified
정확도(Accuracy) 기준에서 다중선형회귀(Mul- tiple linear regression) 모델과 의사결정트리 학습 (Decision tree learning) 모델의 경우, 각각 83.523%, 84.659%로 제안된 모델의 정확도(85.227%)보다 낮은 정확도를 보이고 서포트 벡터 머신(Support vector machine) 모델과 랜덤 포레스트(Random forest) 모델은 각각 85.511%, 86.364%로 제안된 모델보다 높은 정확도로 나타났다.
연관관계 확인(Association check) 기준에서는 다중선형회귀 모델과 제안된 모델은 각 독립변수와 수면 만족도의 연관성을 수치의 형태로 검증할 수 있었고, 의사결정트리 학습 모델도 독립변수의 조건에 한정하여 수면 만족도와의 연관성을 부분적으로 검증이 가능하였다. 반면에 서포트 벡터 머신 모델과 랜덤 포레스트 모델의 경우, 독립변수와 수면 만족도의 연관성에 대한 직관적인 표현을 수행할 수 없고 훈련데이터의 학습을 통하여 수면 만족도의 예측만을 수행할 수 있으므로 “불가능함”으로 나타났다.
사용자의 수면 질을 개선하기 위해 사용자의 수면만족도에 영향을 주는 각 요인(독립 변수)과의 연관성을 검증해야 한다. 따라서, 본 논문에서 제안한 사용자 수면 패턴 분석 모델은 연관 관계 확인이 “Yes” 인 모델 중에서 가장 높은 정확도(85.227%)로 나타났다.
마지막으로 제안하는 사용자 수면 패턴 분석 모델의 연관성을 기반으로 독립변수인 코골이, BMI, 수면 시간의 수면 개선 정도에 대하여 실험하였다. Table 6에서 뒤척임의 경우, 회귀 계수(Regression Coefficients)가 음수이므로 단계가 낮아질수록 수면개선 확률이 높아지며, BMI와 수면 시간의 경우, 회귀 계수가 양수이므로 단계가 높아질수록 수면 개선확률이 높아진다. 따라서, 사용자 수면 패턴 분석 검증을 위한 3개월 이상 응답한 사용자 233명 중에서 뒤척임, BMI, 수면 시간 중 하나 이상의 독립변수가 크게 변화한 사용자 100명씩을 선정하여 독립변수값의 변화에 따른 수면 만족도의 개선 결과는 Fig. 5와 같다.
Fig. 5에서는 사용자의 평균 뒤척임, 평균 BMI, 평균 수면 시간의 변화에 따른 사용자의 평균 수면만족도 개선 정도를 확인하였다. 먼저, 공통적으로 수면에 만족하는 사용자는 각 5명으로 설정하고 실험을 진행하였다. 평균 뒤척임의 경우, 개선 전 5명에 대하여 1차(18명), 2차(41명), 3차(61명)이 수면에 만족하는 것으로 가장 높게 나타났고, 다음으로 평균수면 시간의 경우, 1차(17명), 2차(28명), 3차(43명)이 수면에 만족하였고, 평균 BMI의 경우, 1차(7명), 2차 (8명), 3차(8명)이 수면에 만족하였다.
Fig. 5. Results of user’s sleep improvement.
사용자 수면 만족도 개선 결과에서 뒤척임의 경우, 수면 시간에 비해서 회귀 계수의 절댓값이 더 높은 것으로 나타나기 때문에 수면 개선에 더 큰 영향력을 주는 요인(독립변수)으로 예측할 수 있다. 반면에 BMI의 경우, 수면 시간에 비해 회귀 계수의 절댓값이 더 높음에도 불구하고 수면 만족도 개선 정도가 낮게 나왔는데, 이는 BMI가 수면 시간에 비해 유의성이 낮아 수면 만족도의 개선 및 영향이 낮은 것으로 확인하였다.
5. 결론
현대 사회에서 수면의 중요성이 강조되고 있으며, 양질의 수면에 대한 요구가 증가함에 따라, ICT 기술이 융합된 슬립테크 기술이 미래 성장 산업으로 인식 되고, 그 중요성이 높아지고 있다. 따라서, 본 논문에서는 일상생활 속에서 사용자의 수면의 질을 높이기 위한 모션 베드 환경에서의 맞춤형 숙면 서비스를 제공하기 위한 시스템을 설계하고, 사용자의 수면 만족도를 향상시키기 위해 로지스틱 회귀 기반의 수면패턴 분석 모델을 제안하고 실험을 통해 유의성 및 정확도 검증을 수행하였다.
제안한 수면 패턴 분석 모델 내부의 설명 변수(뒤 척임, BMI 등)들은 그 유의성을 증명하였고, 수면 패턴 분석 모델의 성능을 실험한 결과, 85.227%의 정확도를 보이며 분석 대상 모델 중에서 사용자 수면 패턴 분석에 가장 적합한 모델임을 증명하였다. 또한, 수면 패턴 분석 모델의 설명 변수를 기준으로 수면개선 정도를 확인한 결과, 모델의 설계에 근거한 수면 개선이 이뤄졌음을 확인할 수 있었다. 향후 연구에서는 개발 중인 모션 베드의 각종 센서를 통해 수집되는 사용자들의 수면 정보를 기반으로 수면 패턴분석 및 모델 생성의 고도화를 진행할 예정이다.
References
- C.M. Morin, Y. Inoue, C. Kushida, D. Poyares, and J. Winkelman, "Endorsement of European guideline for the diagnosis and treatment of insomnia by the World Sleep Society," Sleep Medicine, Vol. 81, pp. 124-126, 2021. https://doi.org/10.1016/j.sleep.2021.01.023
- S.M. Yu, "Sleep Tech Trends at CES 2020," KISA Report, Vol 1, pp. 28-33, 2020.
- R. Yousefi, S. Ostadabbas, M. Faezipour, M. Nourani, V. Ng, L. Tamil, and et al., "A smart bed platform for monitoring & Ulcer prevention," 2011 4th International Conference on Biomedical Engineering and Informatics, pp. 1362-1366, 2011.
- Y. Lee, M. Choi, I. Jang, C.Y. Kim, D.S. Choi, M. Kim, and et al., "Research on the Development of Automated Multifunction-Integrated Motion Bed," The Journal of Institute of Internet, Broadcasting and Communication, Vol. 18, pp. 215-222, 2018.
- H. Shin, B. Choi, D. Kim, and J. Cho, "Robust Sleep Quality Quantification Method for a Personal Handheld Device," Telemedicine and e-Health, Vol. 20, No. 6, pp. 522-530, 2014. https://doi.org/10.1089/tmj.2013.0216
- J.D. Kim and S.K. Lee, "Design and Implementation of a User-Customized Platform System for Sensibility/Context- based Contents Service," Journal of Korea Multimedia Society, Vol. 17, No. 3, pp. 364-372, 2014. https://doi.org/10.9717/KMMS.2014.17.3.364
- K.H. Hong, B.M. Lee, and Y.J. Park, "Realtime Individual Identification based on EOG Algorithm for Customized Sleep Care Service," Journal of Convergence for Information Technology, Vol. 9, No. 12, pp. 8-16, 2019. https://doi.org/10.22156/CS4SMB.2019.9.12.008
- J.Y. Ko, S.W. Yoon, and H.K. Kim, "Design and Implementation of Customized Farming Applications using Public Data," Journal of Korea Multimedia Society, Vol. 18, No. 6, pp. 772-779, 2015. https://doi.org/10.9717/KMMS.2015.18.6.772
- L.E. Eberly, "Multiple Linear Regression," Topics in Biostatistics, Vol. 404, pp. 165-187, 2007. https://doi.org/10.1007/978-1-59745-530-5_9
- M. Abuella and B. Chowdhury, "Solar Power Probabilistic Forecasting by Using Multiple Linear Regression Analysis," SoutheastCon 2015, pp. 1-5, 2015.
- M.A. Hearst, S.T. Dumais, E. Osuna, J. Platt, and B. Scholkopf, "Support vector machines," IEEE Intelligent Systems and their Applications, Vol. 13, No. 4, pp. 18-28, 1998.
- K.A. Linn, B. Gaonkar, T.D. Satterthwaite, J. Doshi, C. Davatzikos, and R.T. Shinohara, "Control-Group Feature Normalization for Multivariate Pattern Analysis of Structural MRI Data Using the Support Vector Machine," NeuroImage, Vol. 132, pp. 157-166, 2016. https://doi.org/10.1016/j.neuroimage.2016.02.044
- A.J. Myles, R.N. Feudale, Y. Liu, N.A. Woody, and S.D. Brown, "An Introduction to Decision Tree Modeling," Journal of Chemometrics, Vol. 18, No. 6, pp. 275-285, 2004. https://doi.org/10.1002/cem.873
- H.J. Lee and E.H. Jung, "A Study of Extraction of Variables Affecting the Adolescents' Computer Use Type with Decision Tree," The Journal of Korean Association of Computer Education, Vol. 15, No. 2, pp. 9-18, 2012. https://doi.org/10.32431/KACE.2012.15.2.002
- S.J. Rigatti, "Random Forest," Journal of Insurance Medicine, Vol. 47, No. 1, pp. 31-39, 2017. https://doi.org/10.17849/insm-47-01-31-39.1
- Y. Suh, J.K. Park, and G.Y. Ko, "Exploration of Factors Affecting Life Satisfaction of Older Adults Using Random Forest," Journal of the Korean Gerontological Society 2021, Vol. 41, No. 5, pp. 803-823, 2021. https://doi.org/10.31888/JKGS.2021.41.5.803
- M.P. LaValley, "Logistic Regression," Circulation, Vol. 117, No. 18, pp. 2395-2399, 2008. https://doi.org/10.1161/CIRCULATIONAHA.106.682658
- S.B. Jin and J.W. Lee, "Study on Accident Prediction Models in Urban Railway Casualty Accidents Using Logistic Regression Analysis Model," Journal of the Korean Society for Railway, Vol. 20, No. 4, pp. 482-490, 2017. https://doi.org/10.7782/JKSR.2017.20.4.482
- S. Haghayegh, S. Khoshnevis, M. Smolensky, K. Diller, and R. Castriotta, "Accuracy of Wristband Fitbit Models in Assessing Sleep: Systematic Review and Meta-Analysis," Journal of Medical Internet Research, Vol. 21, No. 11, 2019.
- F. Mendonca, S.S. Mostafa, F. Morgado-Dias, A.G. Ravelo-Garcia, and T. Penzel, "A Review of Approaches for Sleep Quality Analysis," IEEE Access, Vol. 7, pp. 24527-24546, 2019. https://doi.org/10.1109/ACCESS.2019.2900345
- T.H. Lee, C.H. Park, H.H. Park, and D.H. Kwak, "A Study on Accident Prediction Models for Chemical Accidents Using the Logistic Regression Analysis Model," Fire Science and Engineering, Vol. 33, No. 6, pp. 72-79, 2019. https://doi.org/10.7731/KIFSE.2019.33.6.072
- D.R. Cox, "The Regression Analysis of Binary Sequences," Journal of the Royal Statistical Society: Series B (Methodological), Vol. 20, No. 2, pp. 215-232, 1958. https://doi.org/10.1111/j.2517-6161.1958.tb00292.x
- S.A. Czepiel, "Maximum Likelihood Estimation of Logistic Regression Models : Theory and Implementation," Corpus ID: 12795190, 2002.