• 제목/요약/키워드: Outliers

검색결과 656건 처리시간 0.027초

k-Nearest Neighbors 분류기를 이용한 복합 지표 산불피해 영역 탐지 (Mapping Burned Forests Using a k-Nearest Neighbors Classifier in Complex Land Cover)

  • 이한나;윤공현;김기홍
    • 대한토목학회논문집
    • /
    • 제43권6호
    • /
    • pp.883-896
    • /
    • 2023
  • 인간 활동 영역이 산지 곳곳에 퍼져 있는 한국에서는 산불이 주거지역이나 각종 시설물을 위협하는 경우가 잦다. 따라서 산불 이후 대책 마련과 피해 복구를 위해 피해 범위를 빠르게 파악할 필요가 있으며, 이러한 경우 원격탐사가 유용한 도구가 될 수 있다. 본 연구에서는 2019년 4월에 발생한 고성·속초 산불 피해지역에 k-nearest neighbor (kNN) 알고리즘을 적용하여 피해 범위를 탐지하는 실험을 수행하였다. 다양한 인공지물을 포함하는 지표와 숲이 혼재된 지역 특성을 고려하여 적절한 공간 해상도와 시간 해상도를 제공하는 Sentinel-2 multispectral instrument (MSI) 자료를 사용하였다. Sentinel-2 MSI의 여섯 밴드와 정규식생지수(NDVI), 정규탄화지수(NBR)를 분류 특성으로 사용하였다. 산불 피해지역과 비피해 지역에서 무작위로 추출된 2,000개 지점 정보를 이용하여 kNN 분류기를 훈련시켰다. 분류 성능을 높이기 위해 데이터에서 특이값을 제거하고 임상도를 병용하였다. 다양한 이웃(neighbor) 수와 분류 특성 조합을 적용하여 산불 후 데이터를 이용한 실험과 산불 전후 데이터 차이를 이용한 실험을 수행하였다. 산불 전후 데이터 차이를 이용하였을 때 더 우수한 분류 성과를 얻을 수 있었지만, 산불 후 데이터만을 이용한 경우에도 피해지역의 범위를 파악할 수 있었다.

다변량 선형회귀모형의 벌점화 최소거리추정에 관한 연구 (Penalized least distance estimator in the multivariate regression model)

  • 신정민;강종경;방성완
    • 응용통계연구
    • /
    • 제37권1호
    • /
    • pp.1-12
    • /
    • 2024
  • 동일한 설명변수 집합에 여러 개의 반응 변수들이 종속되어 있는 경우를 많은 실제 자료에서 볼 수 있다. 특히, 여러 개의 반응변수가 서로 상관관계를 가지고 있으면 각각의 반응변수에 대한 개별적인 분석보다는 반응변수들 사이의 상관관계를 고려한 동시 추정(simultaneous estimation)이 매우 효과적이다. 이러한 다변량 회귀분석에서 최소거리추정량(least distance estimator; LDE)은 반응변수들간의 상관관계를 모형 적합 과정에 반영하여 다차원 유클리드 공간에서 각 훈련 개체와 추정값 사이의 거리를 최소화하도록 회귀계수들을 동시에 추정한다. 뿐만 아니라 최소거리추정량은 이상치에 대한 강건성을 제공한다. 본 논문에서는 다변량 선형 회귀분석에서의 최소거리추정법에 대해 살펴보고, 나아가 효율적인 변수선택을 위한 벌점화 최소거리추정량을 제시하였다. 본 연구에서 제안하는 adaptive group LASSO 벌점항을 적용한 AGLDE 기법은 반응변수들간의 상관관계를 모형 적합에 반영함과 동시에 설명변수의 중요도에 따라 효율적으로 변수선택을 수행할 수 있다. 제안 방법의 유용성은 모의실험과 실제 자료 분석을 통해 확인하였다.

웨이블릿 변환과 기계 학습 접근법을 이용한 수위 데이터의 노이즈 제거 비교 분석 (Comparative analysis of wavelet transform and machine learning approaches for noise reduction in water level data)

  • 황유관;임경재;김종건;신민환;박윤식;신용철;지봉준
    • 한국수자원학회논문집
    • /
    • 제57권3호
    • /
    • pp.209-223
    • /
    • 2024
  • 4차 산업혁명 시대에 접어들어 데이터 기반의 의사결정이 보편화되고 있다. 하지만 데이터 품질이 확보되지 않은 채 수행되는 데이터 분석은 왜곡된 결과를 낳을 가능성이 존재한다. 수자원 관리의 기초가 되는 수위 데이터도 마찬가지로 결측, 스파이크, 잡음 등 다양한 품질 문제를 가진다. 본 연구에서는 잡음으로 인해 발생하는 데이터 품질 문제를 해결하고자 하였다. 잡음은 데이터의 트렌드 분석을 어렵게 하고 비정상적인 이상치를 생성할 가능성이 있다. 본 연구는 이러한 문제를 해결하기 위해 Wavelet Transform을 이용한 잡음 제거 접근 방안을 제안한다. Wavelet Transform은 신호처리에 주로 사용되는 방법으로 잡음 제거에 효과적인 것으로 알려져 있으며 수집된 데이터의 정답 데이터(True value) 수집을 요구하지 않으므로 시간과 비용을 줄일 수 있다는 점에서 적용이 용이한 편이다. 본 연구는 Wavelet Transform의 성능 평가를 위해 대표적인 머신러닝 기반 잡음 제거 방법인 Denoising Autoencoder와 성능 비교를 수행하였다. 그 결과 Wavelet Transform 중 Coiflets 함수는, Denoising Autoencoder에 비해 Mean Absolute Error, Mean Absolute Percentage Error, Mean Squared Error 등 모든 측면에서 우수한 성능을 보이는 것으로 나타났다. 이러한 결과는 환경에 맞는 적절한 웨이블릿 함수의 선택을 통한 잡음 문제를 효과적으로 해결할 수 있음을 시사한다. 본 연구는 수위 데이터의 품질을 향상시켜 수자원 관리 결정의 신뢰성에 기여하는 강력한 도구로서 Wavelet Transform의 잠재력을 확인한 의의가 있다.

한국 소아 청소년 정상 혈압 참고치 (Normative blood pressure references for Korean children and adolescents)

  • 이종국;문진수;최중명;남정모;이순영;오경원;김영택
    • Clinical and Experimental Pediatrics
    • /
    • 제51권1호
    • /
    • pp.33-41
    • /
    • 2008
  • 목 적 : 소아 청소년 건강관리에서 혈압 측정의 중요성이 점차 강조되고 있는 시점에서 한국의 소아 청소년들을 위한 정상 혈압 참고 치를 만들고자 하였다. 방 법 : 2005년에 새로운 신체성장 표준치를 만들기 위해 시행한 전국 소아 청소년들의 신체계측사업에 혈압 계측사업을 포함시켜 7-20세에 해당하는 소아 청소년 57,433명(남: 29,443명, 여: 27,990명)에서 신장, 체중 및 혈압 계측치를 얻었다. 혈압은 자동 진동혈압계인 Dinamap Procare 200(GE Inc., Milwaukee, Wi, USA)를 이용하여 측정하였고 앉은 자세에서 안정한 후 우측 팔에서 5분 간격으로 2번 측정하였다. 두 측정치의 평균치를 수축기 혈압과 이완기 혈압으로 기록하여 원 자료로 하였다. 체중이 +3SD 이상인 과체중아들 2,373명의 혈압은 제외하고 분석 하였다. 혈압 백분위수 표는 성별, 연령별, 신장 백분위수별로 만들어 졌으며 통계기법은 2004 Task Force in NHLBI (USA)이 사용한 통계기법을 원용한 고정 변형 LMS 방법을 사용하였다. 결 과 : 성별, 연령별(7-18세), 신장 백분위수별(5th, 10th, 25th, 50th, 75th, 90th, 95th) 혈압 참고치가 완성되었으며 신장 백분위수에 대한 자료는 질병관리본부 홈페이지인 http://www.cdc.go.kr/webcdc/에서 확인 할 수 있다. 고혈압의 기준치는 성별, 연령별, 신장대비에서 95 백분위수 이상으로 하고, 전고혈압 기준치는 90-95 백분위수 또는 수축기 및 이완기 혈압 130/80 mmHg 이상으로 정하였다. 결 론 : 이번에 마련된 우리나라 소아 청소년 정상 혈압 참고치는 처음이기 때문에 사용기준 및 고혈압의 기준은 앞으로 지속적인 논의와 연구가 필요할 것으로 생각된다. 또한 본 혈압 표는 자동 진동혈압계로 마련된 것이기 때문에 수동 수은 혈압계를 이용한 혈압 치를 평가하는 기준표로 사용하는 것은 주의해야 할 것이다.

재태연령 26주 이상 35주 이하 미숙아의 신체계측치의 분석; 1960년대 측정치와의 비교 (Analysis of anthropometric data for premature infants of 26 to 35 weeks of gestation; comparison with the data of 1960's)

  • 엄지아;정희진;허재원;손상희
    • Clinical and Experimental Pediatrics
    • /
    • 제50권6호
    • /
    • pp.543-548
    • /
    • 2007
  • 목 적 : 현재 우리나라에서 가장 많이 사용되고 있는 재태 연령에 따른 출생시 체중, 신장, 두위의 정상 신체 계측치의 기준은 Lubchenco 등에 의해 1960년대에 발표된 것으로 2000년대에 출생한 우리나라 미숙아들에게는 맞지 않는 부분이 많으리라 예상되어 이를 2000년도 이후로 출생한 본원의 미숙아들의 출생시 신체 계측 자료와 비교 분석해 보고자 본 연구를 시행하였다. 방 법 : 2000년 1월부터 2006년 8월까지 본원에서 출생한 재태 연령 26주에서 35주까지의 미숙아 1,010명을 대상으로 하였으며 이들의 재태 연령에 따른 출생시 체중, 신장, 두위의 신체 계측치의 백분위수를 Lubchenco 등의 기준과 비교 분석하였다. 결 과 : 본 연구에서 저자들이 측정한 재태 연령별 출생 체중은 90백분위수가 조사한 전체 재태 연령에 걸쳐 Lubchenco 기준보다 현저하게 작았으며 특히 30주 미만인 경우 Lubchenco 기준의 75백분위수 정도에 해당하였고 10백분위수는 전체 조사 재태 연령에서 Lubchenco 기준보다 크게 나타났다. 저자들이 측정한 재태 연령별 출생 신장과 두위는 90백분위수가 조사한 전체 재태 연령에 걸쳐 Lubchenco 기준보다 현저하게 작아서 Lubchenco 기준의 75백분위수 정도에 해당하였고 10백분위수는 전체 조사 재태 연령에서 Lubchenco 기준보다 크게 나타났다. 결 론 : 40년 전에 만들어진 Lubchenco 기준을 현재의 우리나라 미숙아들에게 적용하는 것은 무리가 있으며 이로 인해 자궁 내 발육 지연 또는 부당 경량아나 부당 중량아들이 과소평가될 위험이 있다. 이러한 과소평가로 인해 진단과 치료가 늦어져서 사망률과 유병율이 높아질 수 있음을 감안해 볼 때 저자들의 미숙아들의 신체 계측치 기준이 미숙아의 사망률과 유병율 감소에 도움이 될 수 있을 것으로 기대된다.

Bootstrap 기법을 이용한 개의 혈청검사 일부 항목의 참고범위 평가 (Evaluation of Reference Intervals of Some Selected Chemistry Parameters using Bootstrap Technique in Dogs)

  • 김으뜸;박선일
    • 한국임상수의학회지
    • /
    • 제24권4호
    • /
    • pp.509-513
    • /
    • 2007
  • 혈청검사항목의 해석기준으로 사용하는 참고범위는 측정 장비와 병원마다 차이를 보이기 때문에 병원 간 정보를 교환하고 해석하는데 어려움이 많다. 또한 동일한 병원에서도 내원한 환자의 특성을 고려하여 참고범위를 재설정하는 것이 일반모집단의 특성을 제대로 반영한다. 본 연구에서는 강원대학교 수의학부대학 동물병원에서 설정한 혈청화학 검사 항목의 참고범위를 재평가하기 위하여 2005-2006년 동안 본원에 내원한 임상적으로 건강한 개 100두(1-8세, 체중 2.2-5.8 kg)의 혈청검사 일부 항목을 모수 및 비모수적 bootstrap 모의시험으로 분석하였다. 평가항목은 BUN(mg/dl), cholesterol(mg/dl), calcium(mg/dl), aspartate aminotransferase(AST, U/L), alanine aminotransferase(ALT, U/L), alkaline phosphatase(ALP, U/L) 및 total protein(g/dl)으로 Ektachem DT 60 분석기(Johnson & Johnson)로 측정하였다. 칼슘을 제외한 모든 항목이 왜곡이 매우 심한 분포를 보였으며 특히 혈청 효소항목의 outlier는 전체 자료의 5-9%, 기타 항목은 1-2%를 보였다. 각 항목의 분포에 상관없이 모수적 방법에 비하여 비모수적 방법으로 추정한 참고범위가 임상적으로 유용하였으며 추정된 참고범위는 BUN 14.7(7.0-24.2), cholesterol 227.3(120.7-480.8), calcium 10.9(8.1-12.5), AST 25.4(11.8-66.6), ALT 25.5(11.7-68.9), ALP 87.7(31.1-240.8), and total protein 6.8(5.6-8.2)로 나타났다. 이러한 결과는 모집단의 특성을 고려하여 참고범위를 재설정하는데 비모수적 모의시험이 매우 유용하며 특히 측정항목의 분포에 무관하게 사용할 수 있는 장점이 있는 것으로 사료된다.

하천 유량 예측 시스템 개선을 위한 강우 예측 자료의 적용성 평가: 플로리다 템파 지역 사례를 중심으로 (Assessing the Benefits of Incorporating Rainfall Forecasts into Monthly Flow Forecast System of Tampa Bay Water, Florida)

  • 황세운;마티네즈 크리스;아세파 터루소
    • 한국농공학회논문집
    • /
    • 제54권4호
    • /
    • pp.127-135
    • /
    • 2012
  • 지속가능한 수자원 관리 시스템을 위한 수문 예측은 안정적인 장단기 용수 공급에 있어 중요한 과제이며, 이를 위해는 다양한 기후 정보를 이용한 시스템의 평가가 우선되어야 한다. 본 연구에서는 미국 플로리다 템파 지역의 연간 월 강우와 하천 유량 예측을 위해 본 시험지역에 운용되고 있는 유량 모의 시스템 (flow modeling system, FMS)을 소개하고, 관측된 강우 자료를 '최적 예측 강우 시나리오 (the best rainfall forecast)'로 가정하여 FMS의 기후 예측 정보에 대한 활용성을 평가하였다. 연구 결과, 기본적으로 FMS에 의해 예측된 월 강우량 앙상블의 중앙값이 관측 강우량을 잘 재현하는 것으로 나타났다. 강우 예측 모델 입력자료로 사용되는 초기 월 강우량은 2개월까지의 예측에 간섭하며 이 후 예측치는 동일한 범주로 수렴하여 관측자료로 부터 추정된 통계치에 의존하는 것으로 나타났다. 이는 예측 모델이 최대 2개월간의 예측 효용성을 가짐을 의미한다. 월 강우량 앙상블을 이용하여 예측된 하천 유량 앙상블은 4-6개월까지의 예측 효용성을 보였다. 예측된 강우량 대신 실제 관측 월강우 시계열 자료를 유량 예측을 위한 강우 입력자료로 적용한 결과, 예측된 유량의 범주가 현저히 감소하였으며 예측의 불확실성이 감소하는 것으로 나타났다. 본 연구 결과는 시험 지역에 대한 신뢰도 높은 강우 예측 자료의 확보가 기존의 수문 예측 시스템 개선에 기여할수 있다는 것을 보여준다.

비선형 유역습윤지수를 이용한 평갈수기 유출모의개선 (Improvement of Mid-and Low-flow Estimation Using Variable Nonlinear Catchment Wetness Index)

  • 현석훈;강부식;김진겸
    • 대한토목학회논문집
    • /
    • 제36권5호
    • /
    • pp.779-789
    • /
    • 2016
  • 강우-유출 모의 과정에서 유효강우는 토양수분을 고려하여 산정되며, 이러한 토양수분을 강우-유출 모형에 반영하기 위해서는 직접 관측된 자료를 활용하거나, 모형 내부에서 간접적으로 산정한다. 본 연구에서 사용한 강우-유출 모형은 유역의 기온에 따른 유역습윤지수(Catchment Wetness Index, CWI)를 산정하고, CWI와 강수량의 조합을 통해 산정되는 토양수분지수(Soil Moisture Index, SMI)를 직접 활용하여 유효강우 및 유출량을 계산하는 IHACRES 모형을 사용하여 연구를 수행했다. 합천댐 유역을 대상으로 CWI와 유효강우 간의 관계가 장기 유출 산정에 미치는 영향에 대해 연구한 결과, CWI와 유효강우는 비선형적인 관계를 가짐을 확인하였으며 이러한 비선형 관계는 장기 유출 모의에 있어 홍수기 보다 비홍수기에서 더 많은 영향을 미침을 확인하였다. CWI가 장기 유출에 미치는 영향을 자세히 분석하고자, 보정기간(2002~2004년)과 검정기간(2005~2007년)으로 나누어 가변 CWI와 일정 CWI 조건하에서 유황에 따른 유출모의성능을 분석하였다. 분석결과 전반적으로 가변 CWI의 결과가 일정 CWI의 결과에 비하여 우수하게 나타났다. 풍수기에서 결정계수는 평수기나 갈수기에 비하여 높은 값을 보이고 있으나 가변 CWI와 일정 CWI간에 차이는 크지 않았다. 이는 강수량이 많은 시기의 유출의 경우 기온에 따른 증발 및 토양수분에 대한 민감도가 상대적으로 작다는 것을 의미한다. 반면, 풍수기에 비해 유출량이 적은 평수기와 갈수기에서는 가변 CWI의 평가지표가 더 우수한 결과를 보이고 있어, 평갈수량을 포함한 장기유출모의시 기온을 고려한 증발과 이에따른 토양수분의 고려가 유출량 산정에 상당한 영향을 미침을 확인할 수 있다. NSE의 경우 풍수기가 평갈수기보다 다소 떨어지는 경향을 볼 수 있으나 NSE가 이상치의 영향을 크게 받는 지표이므로 유량 절대값이 큰 풍수기에서는 당연한 결과라 볼 수 있으며, 그럼에도 전체적으로는 0.9이상의 양호한 수치를 보여주고 있다. 풍수기에는 기온에 따른 CWI가 크게 영향을 미치지 못하지만, 유출량이 적은 평 갈수기에서 CWI의 활용이 장기 유출 모의 정확도를 개선할 수 있을 것이라 사료된다.

민간경비원의 직무스트레스가 조직몰입 및 이직의도에 미치는 영향: 직무소진의 매개효과를 중심으로 (Effects of Private Security Guards' Job Stress on Organizational Commitment and Turnover Intention: focused on mediating effects of job burnout)

  • 조철규;김상진
    • 융합보안논문지
    • /
    • 제15권3_2호
    • /
    • pp.31-42
    • /
    • 2015
  • 이 연구의 목적은 민간경비원의 직무스트레스가 조직몰입 및 이직의도에 미치는 영향에 대한 직무소진의 매개효과를 중심으로 분석하는데 있다. 연구의 분석을 위하여 서울소재 경비업체에 근무하고 있는 민간경비원을 모집단을 설정하였으며, 설문지는 무선표집법(random sampling)에 의하여 700명을 대상으로 배포하였다. 조사기간은 2014년 5월부터 2014년 9월까지 약 4개월간에 걸쳐서 실시하였으며, 설문지는 회수되지 않거나 극단치가 있는 24부를 제외한 총 676부를 최종 데이터로 활용하였다. 데이터 분석을 위하여 이 연구에서는 SPSSWIN 18.0 통계패키지를 활용하였으며, 빈도분석, 요인분석, 신뢰도분석, 상관분석, 다중회귀분석 및 경로분석을 통하여 가설을 검증 하였다. 분석결과 정서적 고갈은 역할갈등, 역할과부하와 조직몰입의 관계에서 부분적으로 매개효과가 있는 것으로 분석되었고 역할모호성은 유의한 영향을 미치지 않은 것으로 나타났다. 그리고 정서적 고갈은 역할갈등과 이직의도와의 관계에서는 완전매개효과가 있는 것으로 분석되었으며, 역할모호성은 유의한 영향을 미치지 않은 것으로 나타났다 또한 역할과부하와 이직의도와의 관계에서는 부분매개효과가 있는 것으로 나타나 가설이 부분적으로 채택되었다. 직무스트레스와 조직몰입의 관계에서 비인간화에 대한 경로분석 결과 역할모호성과 조직몰입의 관계에서는 유의한 영향을 미치지 않은 것으로 나타났고, 역할갈등, 역할과부화는 조직몰입간의 관계에서 부분매개효과가 있는 것으로 분석되었다. 또한 역할모호성과 이직의도의 관계에서 비인간화는 유의한 영향을 미치지 않은 것으로 나타났고, 역할갈등과 역할과부하는 부분매개효과가 있는 것으로 나타나 가설이 부분적으로 채택되었다.

국내 증권형 크라우드펀딩 투자자의 참여의도와 무리행동에 관한 연구: 계획된 행동이론을 중심으로 (A Study on Participation Intention and Herd Behavior on Domestic Securities Type Crowdfunding Investors: Focusing on the Theory of Planned Behavior)

  • 황낙진;이소영
    • 벤처창업연구
    • /
    • 제15권2호
    • /
    • pp.1-18
    • /
    • 2020
  • 본 연구는 계획된 행동이론을 바탕으로 증권형 크라우드펀딩 투자자의 참여의도에 영향을 미치는 주요 변인들의 영향력을 확인하고, 참여 의도와 지각된 행동통제가 투자자의 무리행동에 미치는 영향을 간접효과 분석을 포함하여 살펴보고자 하였다. 본 연구의 궁극적인 목적은 연구 결과를 통해 증권형 크라우드펀딩 투자자들의 투자 행태를 이해하고 관계 당사자들에게 동 제도 활성화 및 투자자 보호를 위한 각종 정책 및 사업계획 수립에 도움을 주기 위함이다. 본 연구 수행을 위해 증권형 크라우드펀딩에 투자한 경험이 있거나 관심이 있는 잠재 투자자들을 대상으로 온라인 설문조사를 실시하여 총 276부의 응답지를 받았다. 이 중 부적합 응답을 제외한 총 261명의 설문이 최종 분석에 사용되었다. 자료 분석은 SPSS 22.0 및 Amos 22.0 통계 패키지를 통한 구조방정식 모형 분석을 실시하였다. 연구 결과 계획된 행동이론의 주요변인 중 태도와 주관적 규범은 증권형 크라우드펀딩 투자자의 참여의도에 정(+)의 영향을 미치는 것으로 확인되었다. 그리고 간접효과 분석 결과 참여의도는 태도, 주관적 규범과 무리행동 사이에서 매개적 역할을 하는 것으로 확인되었다. 그러나 계획된 행동이론에서 행동의도의 주요 변인으로 제시된 지각된 행동통제는 참여의도에 미치는 영향이 통계적으로 비유의적인 것으로 나타났다. 대신 무리행동에는 직접적으로 정(+)의 영향을 미치는 것으로 확인되었다. 이는 투자자들이 증권형 크라우드펀딩에 쉽게 참여할 수 있다고 지각하고 있더라도 증권형 크라우드펀딩은 손실위험이 큰 초기창업기업에 대한 투자행위이기 때문에 참여의도에는 유의적인 영향을 미치지 않는 것으로 보인다. 한편 국내 증권형 크라우드펀딩 투자자는 실제 투자행동을 할 때 플랫폼에서 제공되는 펀딩 진행정보를 일종의 신호로 보고 다수의 다른 투자자를 모방하여 무리행동을 한다는 것을 실증적으로 확인하였다는 점에서 그 의미가 크다고 본다. 본 연구를 통해 국내 증권형 크라우드펀딩 투자자의 참여의도와 무리행동에 영향을 미치는 주요 변인들을 실증적으로 확인함으로써 향후 크라우드펀딩 감독기관의 정책 수립이나 크라우드펀딩 플랫폼 사업자의 사업계획 및 활성화 방안 수립 등에 유의미한 연구 결과로 활용될 수 있을 것이다.