• 제목/요약/키워드: 지역건강조사 빅 데이터

검색결과 10건 처리시간 0.039초

광역시·도민의 우울경험에 대한 Random Forest 비교분석 (Comparative analysis of random forest on depression experiences of metropolitan and provincial residents)

  • 이동수;김유정
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.321-324
    • /
    • 2023
  • 본 연구는 광역시와 광역도 간의 개인적 요인과 건강수준 정도가 우울경험 여부에 영향을 미치는 변수의 중요도를 파악하고자 시도되었다. 본 연구의 자료는 질병관리청의 2021년 지역사회건강조사 데이터를 활용하였다. 광역시의 데이터는 4,602건을 이용하였고, 광역도는 19,545건의 데이터를 이용하였다. 자료 분석에 활용된 빅데이터는 R 4.3.0 for Windows를 활용하여 단어 빈도 분석과 machine learning기법인 Random Forest분석을 실시하였다. 연구결과, train 데이터와 test 데이터의 과적합(overfitting)의 문제는 발생하지 않았으며, machine learning 기법의 분류모델은 약 94% 수준으로 나타났다. 분석 결과 광역시와 광역도 간의 우울경험여부에 미치는 중요도가 각각 다르게 나타났다. 두 지역의 시민에게 미치는 우울경험의 원인을 다르게 접근함으로써 보다 더 효율적인 정책수립이 가능 할 것으로 판단된다.

  • PDF

클라우드 기반의 공개의료 빅데이터 분석을 통한 삶의 질에 영향을 미치는 요인분석 (An Analysis of Factors Affecting Quality of Life through the Analysis of Public Health Big Data)

  • 김민경;조영복
    • 한국정보통신학회논문지
    • /
    • 제22권6호
    • /
    • pp.835-841
    • /
    • 2018
  • 본 연구에서 공개 의료 빅데이터 분석을 지역사회건강조사 2012~2014년 자료를 이용해 개인의 건강관련 삶의 질 차이와 삶의 질에 영향을 미치는 요인을 분석하였다. 제안논문에서는 공개의료 빅데이터 분석을 위해 Hadoop 기반의 Spack을 이용해 병렬처리 지원을 위한 클라우드 메니저를 구성하고 개인의 삶의 질에 영향을 미치는 요인을 하드웨어의 제약없이 빠르게 분석하였다. 건강관련 삶의 질에 미치는 영향을 개인적 특성과 지역사회 특성으로 구분하여 단계별 다수준 회귀분석(ANOVA, t-test)을 실시하였다. 연구결과 개인별 삶의 질에 영향을 미치는 요인으로는 남자 평균 73.8점, 여자 평균 70.0점으로 남자가 여자보다 건강관련 삶의 질이 높은 것으로 나타났다.

빅데이터 기반 만성질환자의 삶의 질에 미치는 영향분석 (An Analysis of Impact on the Quality of Life for Chronic Patients based Big Data)

  • 김민경;조영복
    • 한국정보통신학회논문지
    • /
    • 제23권11호
    • /
    • pp.1351-1356
    • /
    • 2019
  • 본 연구는 빅데이터 플랫폼을 이용해 만성질환자에 따른 개인적 요인과 지역사회요인이 삶의 질에 미치는 영향을 알아보는데 목적이 있다. 연구방법은 2017년 지역사회건강조사 자료와 통계청 시군구별 2차 자료를 사용하였고, EQ-5D 지수와 개인요인 및 지역사회요인을 구분하여 다수준분석을 실시하였다. 연구결과 남자의 경우, 나이가 어릴수록, 학력이 높을수록, 월가구소득이 많을수록, 경제활동을 하는 경우, 스포츠 인프라가 많은 경우 삶의 질이 높았다. 또한 주관적 건강감이 나쁠수록, 스트레스가 많을수록 삶의 질이 낮았다. 향후 의료 빅데이터 분석을 위해 클라우드와 오픈소스를 활용할 수 있는 하드웨어에 독립적인 플랫폼 제공을 위한 연구가 지속되어야 할 것이다.

빅데이터를 이용한 만성질환 유무에 따른 삶의 질에 미치는 영향 (The effect of Quality of Life by chronic disease using Bigdata)

  • 김민경;조영복
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 추계학술대회
    • /
    • pp.282-285
    • /
    • 2018
  • 본 연구는 빅데이터 플랫폼을 이용해 만성질환유무에 따른 개인적 요인과 지역사회요인이 삶의 질에 미치는 영향을 알아보는데 목적이 있다. 연구방법은 2017년 지역사회건강조사 자료와 통계청 자료를 보건소 단위로 매칭하였다. 연구결과 남자의 경우 나이가 어릴수록, 도시지역에 거주하는 경우 학력이 높은수록, 월가구소득이 많을수록, 경제활동을 하는 경우, 배우자가 있는 경우 삶의 질이 높았다. 지역 사회 요인의 경우 인구밀도가 낮을수록, 고령인구비율이 낮을수록, 의료기관 종사의사주가 많을수록, 재정자주도가 높을수록 삶의 질이 높았다. 지역다음은 요약문 입니다.

  • PDF

Hadoop기반의 공개의료정보 빅 데이터 분석을 통한 한국여성암 검진 요인분석 서비스 (Analysis of Factors for Korean Women's Cancer Screening through Hadoop-Based Public Medical Information Big Data Analysis)

  • 박민희;조영복;김소영;박종배;박종혁
    • 한국정보통신학회논문지
    • /
    • 제22권10호
    • /
    • pp.1277-1286
    • /
    • 2018
  • 본 논문에서는 공개의료정보 빅데이터 분석을 위해 클라우드 환경에서 아파치 하둡 기반의 클라우드 환경을 도입하여 컴퓨팅 자원의 유연한 확장성을 제공하고 실제로, 로그데이터가 장기간 축적되거나 급격하게 증가하는 상황에서 스토리지, 메모리 등의 자원을 신속성 있고 유연하게 확장을 할 수 있는 기능을 포함했다. 또한, 축적된 비정형 로그데이터의 실시간 분석이 요구되어질 때 기존의 분석도구의 처리한계를 극복하기 위해 본 시스템은 하둡 (Hadoop) 기반의 분석모듈을 도입함으로써 대용량의 로그데이터를 빠르고 신뢰성 있게 병렬 분산 처리할 수 있는 기능을 제공한다. 빅데이터 분석을 위해 빈도분석과 카이제곱검정을 수행하고 유의 수준 0.05를 기준으로 단변량 로지스틱 회귀분석과 모델별 의미 있는 변수들의 다변량 로지스틱 회귀분석을 시행 하였다. (p<0.05) 의미 있는 변수들을 모델별로 나누어 다변량 로지스틱 회귀 분석한 결과 Model 3으로 갈수록 적합도가 높아졌다.

세월호 참사 전후 피해지역 주민의 정신건강 및 건강관련 삶의 질 비교연구 (A Comparative Study on the mental health and health-related quality of life in victimized community residences before and after Sewol ferry disaster)

  • 이진숙;이은주;이수경
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제8권10호
    • /
    • pp.895-903
    • /
    • 2018
  • 본 연구의 목적은 세월호 참사 전후 피해지역 주민들의 정신건강 상태 및 건강관련 삶의 질을 비교 분석하여 추후 대형 인적재난의 발생 시 피해지역의 지원근거를 마련하기 위함이다. 본 연구에서는 빅데이터인 지역사회건강조사자료를 이용하여 세월호 피해지역인 안산시와 진도군에 거주하는 주민 총 3,632명(2013년도 1,803명, 2014년도 1,829명)을 대상으로 주관적 건강수준, 적정수면 여부, 주관적 스트레스, 스트레스 상담여부와, 우울감 경험여부, 우울감 상담여부, 건강관련 삶의 질을 참사 전후로 비교하였다. 세월호 사건 후 피해지역 주민들은 주관적 건강수준과 적정수면여부, 주관적 스트레스 정도, 건강관련 삶의 질에서 부정적으로 유의한 차이를 나타냈다. 반면, 스트레스 상담 여부, 우울감 상담 여부는 참사 전과 후에 유의미한 차이를 나타내지 않았다. 본 연구는 대형 인적피해를 가져온 세월호 피해지역의 주민들을 대상으로 세월호 사건 발생 전 후의 정신건강 및 건강관련 삶의 질을 비교하여 추후 재난의 피해지원을 위한 중재 프로그램이나 정책개발의 기초자료로서 의의가 있다. 향후 피해지역 주민들의 정신건강 및 건강관련 삶의 질을 지속적으로 모니터링하고, 지원대책을 마련하기 위해 보다 다양한 후속 연구들이 시행되어야 할 것이다.

한국 성인 직장인의 걷기에 영향을 미치는 생태학적 요인 (The ecological factors affecting walking in korean adult workers)

  • 김명관;서순림
    • 한국산학기술학회논문지
    • /
    • 제18권5호
    • /
    • pp.68-78
    • /
    • 2017
  • 본 연구는 성인 직장인의 건강증진을 위하여 생태학적인 요인에서 개인 수준 요인과 지역 수준 요인이 걷기에 미치는 영향을 주었는지를 파악하여 걷기를 증가시킬 수 있는 방안모색의 기초자료를 제공하고자 한다. 지역사회건강조사 원시 데이터(2011-2013)에 우리나라 지자체 통계연보(2011-2013년 기준)를 접목해 253개의 시군구 단위로 지역 수준 요인 변수를 추출하여 위계적 구조를 가진 융합 빅데이터를 생성하고 위계적 선형 모형으로 다수준 분석을 시행하였다. 개인 수준 요인의 인구 사회적 특성 및 건강행태에 따라 걷기에 유의한 차이가 있었고 이들 개인적 수준을 통제하고도 지역 수준의 사회 문화적 환경 요인 증에서의 공공질서 및 안전 세출예산의 증가, 여가 환경 요인 중의 국토 및 지역개발 세출예산의 증가, 운송환경 요인 중의 각 지자체별 공공 운송수단인 시내버스 등록대수가 걷기에 유의한 영향을 미쳤다. 이 결과로 볼 때 직장인의 걷기 향상에는 개인의 인구사회적 특성이나 행태 뿐 아니라 공공질서 및 안전 그리고 국토 및 지역개발 예산 증가를 통한 지역사회의 사회문화적 환경 개발과 시내버스 운송수단 증가가 중요함을 나타냈다. 그러므로 지역사회 주민인 직장인들의 걷기와 같은 신체활동을 자연스럽게 증가시킬 수 있는 환경조성과 공공 운송수단 개발을 강조할 필요가 있다. 이는 궁극적으로 직장인의 건강수명을 증진시킬 것으로 본다.

자살생각 원인에 따른 우울의 관련 요인 분석: 2021년 지역사회건강조사 자료 활용 (Analysis of Related Factors of Depression According to the Causes of Suicidal Ideation : A Secondary Analysis of Community Health Survey, 2021)

  • 서가원;권명진
    • 산업융합연구
    • /
    • 제21권3호
    • /
    • pp.99-106
    • /
    • 2023
  • 본 연구의 목적은 자살생각 원인에 따른 우울의 영향을 미치는 요인을 파악하는 것이다. 자료는 2021년 지역사회 건강조사 자료를 이용하였다. 연구 대상자는 20~60세 사이의 성인 중 최근 1년간 자살생각이 있었다고 응답한 5,328명이다. 자살생각의 원인은 경제적 어려움, 대인관계 문제와 질병 및 장애군으로 구분하였다. 자료의 분석은 SPSS 25.0 프로그램을 이용하여 복합표본분석을 실시하였다. 연구 결과는 다음과 같다. 1) 경제적 어려움 군에서는 연령, 성별, 교육수준, 경제활동, 코로나로 인한 직업 변화, 생활만족도, 주관적 건강상태, 스트레스, 수면시간과 연간 미충족 의료가 우울의 주요 관련요인으로 나타났다. 2) 대인관계 문제군에서는 연령, 성별, 교육수준, 경제활동, 생활만족도, 주관적 건강상태, 흡연, 음주, 스트레스와 수면시간이 우울의 주요 관련요인으로 나타났다. 3) 질병 및 장애군에서는 연령, 결혼상태, 교육수준, 생활만족도, 흡연, 스트레스, 수면시간, 연간 미충족 의료가 우울의 주요 영향요인으로 나타났다. 따라서 자살률을 낮추고 우울을 예방하기 위해서는 자살생각의 원인과 우울의 영향요인에 따라 다양한 전략을 수립할 필요가 있다.

대사증후군의 인지와 신체활동 실천에 영향을 미치는 요인: 데이터 마이닝 접근 (Factors influencing metabolic syndrome perception and exercising behaviors in Korean adults: Data mining approach)

  • 이수경;문미경
    • 한국산학기술학회논문지
    • /
    • 제18권12호
    • /
    • pp.581-588
    • /
    • 2017
  • 본 연구는 기계 학습법 중 하나인 XGBoost를 이용하여 대사증후군을 인지하고 신체활동을 수행하는 집단을 예측하고자 2014년 7월부터 2015년 12월까지 시도되었다. 이에 2009-2013년 지역사회건강조사를 연구자료로 사용하였고 370,430명의 성인을 분석에 포함하였다. 본 연구의 종속변수는 대사증후군의 인지 및 신체활동 실천정도에 따른 단계로 3단계로 구분하였다:Stage 1(무인지, 무 신체활동), Stage 2(인지, 무 신체활동), and Stage 3(인지, 신체활동). 예측변수로는 5년간의 지역사회건강조사 중 공통으로 수집된 문항으로부터 161개의 특성을 선택하였다. 자료 분석을 위해 R program을 이용하여 XGBoost 알고리즘을 적용하였다. 분석 결과 정확도는 0.735 이었으며, 가장 영향을 미치는 10개의 특성은 나이, 교육수준, 체중조절시도 경험, EQ-5D 운동능력, 영양표시 확인, 개인 건강보험가입 유무, EQ-5D 일상활동, 금연광고경험 여부, 통증유무, 당뇨에 대한 보건기관의 교육 경험 순으로 확인되었다. 본 연구결과는 XGBoost가 보건의료빅데이터를 이용한 질병의 예방과 관리에 영향을 주는 요인을 확인하는데 유용한 도구임을 보여주었다. 또한, 본 연구를 통해 대사증후군에 취약한 계층을 확인하고 이를 위한 교육프로그램 개발에 도움을 줄 수 있을 것으로 보인다.

코로나19 사태와 온라인 정보의 다양성 연구 - 빅데이터를 활용한 글로벌 접근법 (Online Information Sources of Coronavirus Using Webometric Big Data)

  • 박한우;김지은;주우붕
    • 한국산학기술학회논문지
    • /
    • 제21권11호
    • /
    • pp.728-739
    • /
    • 2020
  • 이 연구는 웹보메트릭 빅데이터를 활용하여 코로나바이러스 확진 국가(지역)들의 온라인 정보원의 다양성을 조사했다. 구체적으로 2020년 2월에 코로나바이러스 확진자가 발생한 28개국을 대상으로 웹 데이터를 수집한 결과, 호주, 캐나다, 이탈리아 등의 온라인 가시성이 높게 나타나면서 관련 정보를 가장 많이 생산하고 있었다. 국가별 검색건수(hit counts)와 정보채널의 역할을 하는 도메인(domain) 빈도와는 통계적으로 유의한 상관성이 있었다. 한편 데이터 수집도구인 bing.com의 점유률이 평소에도 높은 국가들을 제외하고 다시 검토한 결과, 당시 확진자 수가 많았던 일본, 중국, 싱가포르 등이 코로나바이러스와 관련된 웹데이터를 주도적으로 올리고 있었다. 온라인 정보원은 n-헬릭스를 활용하여 분류되었다. n-헬릭스는 대학-기업-정부의 3주체간 상호작용과 혁신을 강조하는 트리플헬릭스모델(Triple Helix Model)에 기반한 확장된 분석틀이다. 그 결과, 정부기관이 18.1%를 차지하면서 코로나바이러스 정보의 최대 공급자로 나타났다. 2원성 네트워크 분석결과를 보면 언론사, 대학병원, 공중보건에 특화된 조직 등도 코로나바이러스 연구와 방역 정보의 온라인 유통에 적극적이었다. 웹페이지에 포함된 단어들을 중심으로 내용분석을 해 보니 건강, 학교, 가족, 공공, 방안 등의 단어가 중심성이 높게 나타나 코로나바이러스로 인한 개인별 예방수칙뿐만 아니라 생활 불편과 업무장애로 인한 대처방안 등에 관심이 높다는 것을 알 수 있었다.