• 제목/요약/키워드: 랜덤변수

검색결과 259건 처리시간 0.027초

아로마테라피 손마사지 효과에 대한 메타분석 (A Meta-Analysis of the Effects of Aromatherapy Hand Massge)

  • 박연숙
    • 디지털융복합연구
    • /
    • 제13권1호
    • /
    • pp.469-479
    • /
    • 2015
  • 본 연구의 목적은 아로마테라피 손마사지 간호중재 효과를 체계적, 객관적으로 규명하기 위함이다. 이를 위해 아로마테라피 손마사지 효과에 대한 과학적 지식체의 객관적 근거를 제시하기 위하여 메타분석을 실시하였다. 이를 위해 최종적으로 선정된 논문은 2004년에서 2013년에 걸쳐 국내에서 출판된 총 15편이었으며, 총 연구 대상자는 733명이었다. 연구결과는 모든 측정변수의 유의성 검증 결과 메타분석에 적절하였으며, 아로마테라피 손마사지 효과에 대한 랜덤효과 모형 분석 결과 95%의 신뢰구간에서 유의한 p값을 나타냈다. 실험군과 대조군의 표준화한 평균차는 생리적 변수인 수축기 혈압(d=-9.5320), 이완기 혈압(d=-8.8730), 맥박(d=-9.1241)이며, 심리적 변수인 불안(d=-0.1469), 우울(d=-0.4489)으로 모두 음의 방향으로 유의하게 감소하는 것으로 나타났다. 결론적으로 아로마테라피 손마사지 간호중재 효과에 대한 메타분석 결과, 생리적 변수인 혈압(수축기 혈압, 이완기 혈압)과 맥박을 감소시키고, 심리적 변수인 불안과 우울을 완화시키는 효과가 있음을 입증하였다.

녹차의 항-당뇨 효과에 대한 메타회귀분석 (Meta-regression analysis for anti-diabetic effect of green tea)

  • 윤아름;최기헌
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권4호
    • /
    • pp.717-726
    • /
    • 2011
  • 본 연구는 메타분석을 이용하여 녹차를 투여한 당뇨 유발 쥐들의 체중과 혈액 내 혈당량, 총 콜레스테롤, 중성지방, 고농도지단백 콜레스테롤의 평균비교를 통해 녹차의 항-당뇨 효과에 대해 알아보고자 한다. 헤지의 표준화된 평균차에서 고정효과모형을 적용한 결과 체중은 통계적으로 유의한 증가를 보였으며, 혈액 내 혈당량과 중성지방은 통계적으로 유의한 감소를 보였다. 동질성 검정을 통해 이질성을 보인 모든 변수에 대해 랜덤효과모형을 적용시킨 결과 체중은 유의한 증가를 보였으며, 혈액 내 혈당량은 유의한 감소를 보였다. 또한 녹차의 투여기간이 변수에 영향을 미치는지 알아보기 위해 메타회귀분석을 실시한 결과 모든 변수에 대해 녹차의 투여기간이 유의하지 않았다.

비접촉 초음파를 이용한 비교란, 비접촉 토양수분 센서 개발 (Development of a non-destructive soil moisture sensor using contactless ultrasonic systems)

  • 우동국;도원석
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.24-24
    • /
    • 2022
  • 토양 수분은 육상 생태계를 지배하는 핵심 변수로 널리 간주되어 왔다. 따라서 토양 수분을 모니터링하고 추정하는 것은 수문, 농업, 생화학적, 및 기후 역학을 평가하는 데 필수적이다. 그러나 최대 토양 접촉을 요구하는 기존의 토양 수분 모니터링 방법은, 토양 교란을 최소화하여 토양의 고유 특성을 보전하지 못하는 한계가 있다. 이 문제를 극복하기 위해 본 연구에서는 비접촉 초음파 시스템을 이용하여 토양 수분을 평가 방법을 개발하였다. 이 시스템은 공기-토양 조인트 절반 공간에서 누설 레일리파(Rayleigh wave)를 측정하도록 설계되었다. 토양 수분의 변화에 대한 누설 레일리파의 측정은 통제된 실험 설계에서 모래, 실트, 점토와 같은 세 가지 토양 유형에서 평가하였다. 본 연구 결과에서 세 가지 토양 사례 모두, 누설 레일리파의 에너지와 토양 수분 사이에 밀접한 관계가 있음을 보였다. 그러나 모래에서 얻은 동적 매개변수의 특성은 실트 및 점토의 특성과 다른 형태를 보였다. 이러한 결과는 미세한 토양 입자와 대조적으로 굵은 토양 입자는 증발 과정에서 감소된 토양 강도로 설명될 수 있다. 관측된 누설 레일리파에서 얻은 동적 매개변수를 기반으로 토양 수분을 평가하기 위해 랜덤 포레스트 모형을 이용하였다. 예측된 토양 수분의 정확도는 모든 데이터 및 토양 유형에 관계없이 높은 정확도를 보였다(R2 ≥ 0.98, RMSE ≤ 0.0089 m3 m-3). 즉, 본 연구에서는 레일리파가 토양 교란 없이 토양 수분 변화를 지속적으로 평가할 수 있는 큰 잠재력을 가지고 있음을 보여주었다.

  • PDF

유전자 프로그래밍을 이용한 고속도로 사고예측모형 (A Crash Prediction Model for Expressways Using Genetic Programming)

  • 곽호찬;김동규;고승영;이청원
    • 대한교통학회지
    • /
    • 제32권4호
    • /
    • pp.369-379
    • /
    • 2014
  • 전통적인 사고예측모형은 통계적 회귀분석에 주로 의존하였으나, 이는 자료 분포 및 함수 형태에 대한 가정에 따른 한계를 가지고 있다. 이에 따라 일부 연구는 신경망 등의 비모수적 기법을 모형 구축에 활용하였으나, 이는 독립변수와 종속변수 간의 직접적인 관계 규명이 어렵다는 한계가 있다. 유전자 프로그래밍 기법은 모형 개발에 특별한 가정이 필요없고, 사고요인 규명이 가능하다는 장점이 있다. 따라서 본 연구에서는 고속도로의 사고예측에 유전자 프로그래밍 기법을 적용함으로써 이러한 한계를 극복하고자 하였다. 이를 위하여 경부고속도로에서 최근 3년간(2010-2012년) 구득된 자료를 활용하였으며, 보다 세밀한 사고 특성 규명을 위해 고속도로 구간을 직선 구간과 곡선 구간으로 구분하였다. 사고 발생에 중요한 영향을 미치는 변수를 선택하기 위하여 랜덤 포레스트 기법을 이용하였으며, 최종 선택된 변수들을 활용하여 사고예측을 위한 유전자 프로그래밍 모형을 구축하였다. 구축된 모형의 예측 성능을 평가하기 위해 음이항 회귀모형과 비교해본 결과, 유전자 프로그래밍 모형의 예측 성능이 더 우수한 것으로 나타났다.

시계열 데이터와 랜덤 포레스트를 활용한 시간당 초미세먼지 농도 예측 (Hourly Prediction of Particulate Matter (PM2.5) Concentration Using Time Series Data and Random Forest)

  • 이득우;이수원
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권4호
    • /
    • pp.129-136
    • /
    • 2020
  • 최근 환경 문제에서 중요한 화두로 떠오른 초미세먼지(PM2.5)는 미세먼지(PM10)보다도 작은 부유물질이다. PM2.5는 안구나 호흡기 질환을 일으키며 뇌혈관에까지 침투할 수 있어서 시간별로 수치를 예측하여 대비하는 것이 중요하다. 그러나 PM2.5의 생성과 이동에 관한 명확한 설명이 아직까지는 제시되지 않고 있어서 예측에 어려움이 따른다. 따라서 PM2.5 예측뿐만 아니라 예측 결과에 대한 설명력을 갖는 예측 방법이 제시될 필요가 있다. 본 연구에서는 서울시의 시간당 PM2.5를 예측하고자 하며, 이를 위해 각기 다른 지상관측 데이터를 시계열로 전처리하고 부트스트랩수를 조정한 랜덤 포레스트(Random Forest)를 데이터 학습 및 예측에 사용하는 방법을 제안한다. 이 방법은 예측 모델이 입력 데이터의 시각별 정보를 균형 있게 학습하게 하며 예측 결과에 대한 설명이 가능하다는 장점을 갖는다. 예측 정확도 평가를 위해 기존 모델과의 비교실험을 수행한 결과 제안 방법은 모든 레이블에서 가장 뛰어난 예측 성능을 보였으며, PM2.5의 생성과 관련된 변수와 중국의 영향과 관련된 변수가 예측 결과에 중요한 영향을 미치는 것을 보여주었다.

랜덤포레스트기법을 이용한 분변성대장균 예측모델 개발 (Development of fecal coliform prediction model using random forest method)

  • 서일원;최수연
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2016년도 학술발표회
    • /
    • pp.124-124
    • /
    • 2016
  • 하천에서의 분변성대장균은 분변성 오염 정도를 나타내는 지표로서, 이 농도가 높을수록 오염된 하천수와의 접촉을 통한 호흡기, 소화기 및 피부 관련 질병의 발발 확률이 높다고 알려져 있다. 따라서 하천에서의 수영, 수상스키 등과 같은 입수형 친수활동을 할 때, 분변성대장균 농도가 농도 기준 이하인지를 확인하고 이러한 정보를 친수활동에 이용할 필요가 있다. 그러나 분변성대장균의 경우, 현재 자동수질측정망에서 측정되고 있는 다른 수질인자들과는 달리 실시간 측정이 불가능하다고 알려져 있다. 분변성대장균을 측정하는데 있어 최소 18시간 이상이 필요하며, 이러한 분변성대장균 측정 방식은 하천 이용자들이 안전한 친수활동을 영위하는데 있어 적절한 수질 정보를 제공하지 못한다. 그러므로 분변성대장균을 예측하는 모델을 개발하고, 이를 이용하여 실시간 분변성대장균 정보를 생성하여 하천 이용자들에게 제공할 필요가 있다. 본 연구에서는 친수활동이 활발하게 이루어지는 곳 중 하나인 북한강의 대성리 지점에 대해 데이터 기반 모델을 이용하여 분변성대장균을 예측하였다. 데이터 기반 모델은 물리 기반 모델에서 필요한 지형데이터나 비점오염원 등의 초기 오염물의 양에 대한 데이터를 필요로 하지 않고, 대신 독립변수로 사용되는 기상 및 수질데이터를 필요로 한다. 이러한 기상 및 수질데이터는 기존 기상관측소, 수질관측소에서 매일 자동으로 측정되기 때문에 데이터 기반 모델은 물리 기반 모델에 비해 입력데이터를 구성하기가 쉽다는 장점을 지닌다. 이러한 데이터 기반 모델 중 분류 모델은 회귀 모델과 달리 분변성대장균 농도가 일정 수질기준 이상을 넘는지를 바로 예측할 수 있다. 본 연구에서는 분류 모델 중 높은 예측력을 가진다고 알려진 랜덤포레스트(random forest) 기법을 이용하여 분변성대장균 예측 모델을 개발하였다. 분변성대장균 예측 모델은 주어진 기상 및 수질 조건에 대해 분변성대장균이 200 CFU/100ml가 넘는지를 예측하였다. 예측된 분변성대장균이 기준을 넘는 경우를 2등급, 넘지 않는 경우를 1등급으로 명명하였다. 모델을 개발하기 위하여 북한강 대성리 인근 측정소에서 2010년부터 2015년까지 측정된 기상 및 수질데이터를 수집하였다. 수집한 데이터를 훈련 및 검증데이터로 샘플링하였으며, 이 때 샘플링한 데이터가 기존 데이터가 가지고 있던 등급별 비율을 유지하기 위하여 층화샘플링을 하였다. 본 연구에서는 샘플링에 의한 불확실성을 줄이기 위하여 랜덤하게 50번 샘플링된 각각의 훈련데이터에 대해 모델을 개발하였다. 50개의 모델의 검증 결과를 종합한 결과, 전체 예측률은 0.139로 나타났다.

  • PDF

랜덤포레스트를 이용한 낙동강 본류의 남조류 발생 영향인자 분석 (Analysis of influential factors of cyanobacteria in the mainstream of Nakdong river using random forest)

  • 정우석;김성은;김영도
    • 한국습지학회지
    • /
    • 제23권1호
    • /
    • pp.27-34
    • /
    • 2021
  • 본 연구에서는 랜덤포레스트를 이용하여 8개 보 지점별 남조류 발생 주요 영향인자를 도출하고, 조류경보제 기반의 범주형 예측모델을 개발하였다. 8개 보 지점의 랜덤포레스트의 변수 중요도를 살펴본 결과, 상류의 보 지점들은 남조류 발생에 있어 보 운영에 따른 영향을 직접적으로 받는 것으로 나타났다. 이는 효율적인 보 운영을 통한 남조류 관리가 가능할 수 있다는 것을 의미한다. 중류 구간은 DO와 E.C가 주요 영향인자로 도출되었다. 공간적으로 구미와 김천에 대규모 산업공단들이 밀집되어 있으며, 환경기초시설의 배출량이 큰 영향을 끼치는 구간이다. 따라서 폭염 및 가뭄 시기에 중류 유역에서 배출되는 환경기초시설의 방류는 본류의 E.C를 증가하게 하고 남조류 발생을 촉진 시키는 것으로 나타났다. 중·하류에 위치한 보 지점들은 폭염 및 가뭄의 영향을 가장 많이 받는 지역으로 여름철 가뭄에 따른 남조류 대발생에 대비하여 선제적인 관리가 필요한 지점으로 나타났다. 본 연구를 통해 지점별 남조류 발생 영향인자를 도출하였으며, 맞춤형 조류관리를 위한 정책적 의사결정의 기초자료로 제공될 수 있을 것으로 판단된다.

위계적 선형모형을 이용한 대졸 신규취업자 임금 결정요인 분석 (Determinants of employee's wage using hierarchical linear model)

  • 박성익;조장식
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권1호
    • /
    • pp.65-75
    • /
    • 2015
  • 본 논문에서는 전문대 및 4년제 대졸 신규취업자의 임금을 결정하는 요인을 분석하기 위해 개인수준의 인적특성 변수들과 업종수준의 특성변수들을 사용하였다. 본 논문은 개인수준의 임금이 개인수준의 인적특성 (1-수준)과 업종 수준의 산업특성 (2-수준)에 의해 영향을 받는 다층구조 (multi-level)를 가지게 된다는 점을 주목하였다. 이와 같이 위계적 자료 특성을 가지는 복수의 분석단위 구조가 되면, 전통적인 회귀분석에서와 같이 개인수준의 임금이 독립이라는 가정을 할 수 없게 된다. 따라서 본 논문에서는 개인수준의 임금에 영향을 미치는 다층구조의 특성을 가진 변수들의 영향력을 보다 타당하게 분석하기 위한 방법으로 위계선형모형 (HLM; hierarchical linear model)을 이용하였다. 주요 결과는 다음과 같다. 첫째, 개인수준과 업종수준 변수들 모두를 포함한 다중대응분석의 결과에 의하면, 개인수준의 임금이 서로 다른 그룹에 대응되는 개인 특성 변수값과 업종 특성 변수값이 그룹별로 서로 상이하여 개인특성 변수만이 아니라 업종특성 변수도 개인수준의 임금에 영향을 미치고 있다는 점이 발견되었다. 둘째, 개인수준과 업종수준 변수들 모두를 포함한 의사결정나무분석의 결과에 의하면, 개인수준의 임금에 가장 많은 영향을 미치는 변수가 업종별 임금이고, 그 다음으로는 업종별 근로시간, 연령, 성별 등의 순으로 나타났다. 이와 같이 개인수준의 임금을 결정하는 데 있어서 업종의 특성이 매우 중요한 것으로 나타났다는 점은 위계적 선형모형의 활용이 타당하다는 것을 시사하는 것이다. 셋째, 개인수준의 인적특성과 업종 수준의 산업특성 변수들을 모두 포함한 모형이 다른 모형들에 비해서 모형 적합도가 가장 개선되어 위계적 선형모형이 적합한 것으로 나타났다.

생존분석에서의 기계학습 (Machine learning in survival analysis)

  • 백재욱
    • 산업진흥연구
    • /
    • 제7권1호
    • /
    • pp.1-8
    • /
    • 2022
  • 본 논문은 중도중단 데이터가 포함된 생존데이터의 경우 적용할 수 있는 기계학습 방법에 대해 살펴보았다. 우선 탐색적인 자료분석으로 각 특성에 대한 분포, 여러 특성들 간의 관계 및 중요도 순위를 파악할 수 있었다. 다음으로 독립변수에 해당하는 여러 특성들과 종속변수에 해당하는 특성(사망여부) 간의 관계를 분류문제로 보고 logistic regression, K nearest neighbor 등의 기계학습 방법들을 적용해본 결과 적은 수의 데이터이지만 통상적인 기계학습 결과에서와 같이 logistic regression보다는 random forest가 성능이 더 좋게 나왔다. 하지만 근래에 성능이 좋다고 하는 artificial neural network나 gradient boost와 같은 기계학습 방법은 성능이 월등히 좋게 나오지 않았는데, 그 이유는 주어진 데이터가 빅데이터가 아니기 때문인 것으로 판명된다. 마지막으로 Kaplan-Meier나 Cox의 비례위험모델과 같은 통상적인 생존분석 방법을 적용하여 어떤 독립변수가 종속변수 (ti, δi)에 결정적인 영향을 미치는지 살펴볼 수 있었으며, 기계학습 방법에 속하는 random forest를 중도중단 데이터가 포함된 생존데이터에도 적용하여 성능을 평가할 수 있었다.

시공간 상관성을 고려한 일기산출기 모형을 이용한 4대강 유역별 미래 일기 변수 산출 (Future Weather Generation with Spatio-Temporal Correlation for the Four Major River Basins in South Korea)

  • 이동환;이재용;오희석;이영조
    • 응용통계연구
    • /
    • 제25권2호
    • /
    • pp.351-362
    • /
    • 2012
  • 일기 산출기 모형은 가상의 일기 자료를 생성하는 통계 모형이다. 본 연구는 시공간 상관성이 고려된 다중지점에서의 일기산출 모형을 제안하고, 온실가스 배출 미래 시나리오에 따라 강수량과 평균 기온 일기산출이 가능한 알고리즘을 개발하였다. 제안된 알고리즘은 다단계 일반화 선형모형 하에서 필요한 모수들을 추정하고, 적합된 모형 하에서 일기변수들을 랜덤하게 산출하는 절차이다. 과거 30년간 관측된 우리나라 4대강 유역의 일 강수량 자료와 평균 기온 자료를 가지고 모형을 적합하고, 미래 일별 일기자료 산출에 적용하였다.