• 제목/요약/키워드: 분위수 방법

검색결과 51건 처리시간 0.022초

빅데이터를 이용한 실시간 민간소비 예측 (Real-time private consumption prediction using big data)

  • 신승준;서범석
    • 응용통계연구
    • /
    • 제37권1호
    • /
    • pp.13-38
    • /
    • 2024
  • 최근 코로나19 등으로 경제 불확실성이 확대됨에 따라 민간 경제주체의 경제상황을 직접적으로 반영하는 민간소비 동향을 신속히 파악할 필요성이 높아지고 있다. 이에 본 연구는 기존 거시경제지표 뿐만 아니라 빅데이터를 종합적으로 활용하여 민간소비를 실시간으로 추정(nowcasting)하는 방법을 제안하였다. 특히 초고차원 빅데이터의 적합을 위해 활용 가능한 다양한 기계학습 방법론을 비교분석하여 민간소비 추정의 정확도를 향상시키고자 하였다. 실증 분석 결과, 빅데이터를 비롯한 가용 공변량의 수가 많은 경우에는 변수를 미리 선별하여 모형적합에 활용하는 것이 민간소비 예측 성능을 향상시킬 수 있음을 확인하였다. 또한 코로나19 이후 빅데이터의 반영이 민간소비 예측 성능을 더욱 크게 향상시킴에 따라 경제 불확실성이 높은 상황일수록 새로운 정보를 적시에 반영할 수 있는 고빈도 빅데이터의 활용가치가 높은 것으로 판단된다.

다변량 정규분포에서 대안적인 VaR의 특성 (Properties of alternative VaR for multivariate normal distributions)

  • 홍종선;이기쁨
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권6호
    • /
    • pp.1453-1463
    • /
    • 2016
  • 가장 선호하는 금융위험 측정 방법은 통계적으로 최대손실금액을 추정하는 VaR (Value at Risk)이다. 포트폴리오를 구성하는 여러 산업에 대한 VaR (Value at Risk)는 분산공분산 행렬과 특정한 포트폴리오가 포함되어 변환된 일변량 위험을 이용하여 추정한다. Hong 등 (2016)은 다변량 분위벡터를 바탕으로 Vector at Risk를 정의하였으며, 특정한 포트폴리오가 설정되면 Vector at Risk 중의 한 점을 최적의 VaR 즉, 대안적인 VaR (AVaR)로 제안하였다. 본 연구에서는 다변량 정규분포에 대하여 AVaR의 특성을 탐색한다. 여러 종류의 분산공분산 행렬과 다양한 포트폴리오 가중값 벡터인 경우의 이변량과 삼변량의 정규분포를 따르는 모의실험 자료와 실증예제를 이용하여 대안적인 최대손실금액인 AVaR을 구하고 VaR과 비교 분석한다. 다변량 분위벡터를 이용한 AVaR는 VaR보다 작게 추정함을 발견하였으며, 이런 특징과 함께 AVaR의 특성을 토론한다.

회귀나무 모형을 이용한 패널데이터 분석 (Panel data analysis with regression trees)

  • 장영재
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권6호
    • /
    • pp.1253-1262
    • /
    • 2014
  • 회귀나무 (regression tree)는 독립변수로 이루어진 공간을 재귀적으로 분할하고 해당 영역에서 종속변수의 최선의 예측값을 찾고자 하는 비모수적 방법론이다. 회귀나무 모형이 제안된 이래 로지스틱 회귀나무모형이나 분위수 회귀나무모형과 같이 유연하고 다양한 모형적합을 위한 연구가 진행되어 왔다. 최근에 들어서는 Sela와 Simonoff (2012)의 RE-EM 알고리즘, Loh와 Zheng (2013)의 GUIDE 등 패널데이터와 관련하여 진일보한 나무모형 알고리즘도 제안되었다. 본 논문에서는 각 알고리즘을 소개하고 특징을 살펴보는 한편, 실험 데이터를 생성하여 평균제곱오차 (mean squared error)를 바탕으로 예측력을 비교하였다. 분석결과, RE-EM 알고리즘의 예측력이 상대적으로 우수하게 나타났다. 이 알고리즘을 통해 기업경기실사지수 업종별 패널자료를 분석한 결과 최근의 업황에 가장 큰 영향을 미치는 요소는 매출 실적으로 나타났으며 매출 상위 그룹의 경우 비제조업이 제조업에 비해 업황에 대한 판단이 긍정적인 것으로 나타났다.

누가차분법을 통한 가뭄 빈도유입량 산정에 관한 이론적 고찰 (Theoretical analysis of quantification of drought frequency inflow series via K-water cumulative difference method)

  • 김지흔;이재황;김영오
    • 한국수자원학회논문집
    • /
    • 제55권9호
    • /
    • pp.701-705
    • /
    • 2022
  • 이상기후로 가뭄이 빈번해짐에 따라 수자원 시설의 가뭄대응력 산정에 대한 필요성이 커지고 있다. 이를 위해서는 신뢰할 수 있는 갈수빈도 유입량 추정 연구가 선행되어야 한다. 본 연구는 기존 K-water의 가뭄 빈도유입량 추정방법인 누가차분법의 세 가지 한계, 즉 음의 값과 역전현상, 그리고 평년 이상으로 과대 산정되는 문제의 발생조건에 대해 각각 2변수 log-normal 분포와 Gumbel 분포를 적용하여 이론적 고찰을 실시하였다. 그 결과, 음의 값은 누가 과정에서 scale parameter보다 location parameter의 변화가 커지는 경우 발생함을 확인하였고, 역전현상 및 평년보다 큰 가뭄유입량은 누가 과정에서 표준편차가 감소하는 경우 발생하는 것으로 분석되었다.

공간확장자료를 이용한 지역빈도분석 : I. 지역홍수빈도분석의 실증적 검토 (Regional frequency analysis using spatial data extension method : I. An empirical investigation of regional flood frequency analysis)

  • 김남원;이정은;이정우;정용
    • 한국수자원학회논문집
    • /
    • 제49권5호
    • /
    • pp.439-450
    • /
    • 2016
  • 본 연구에서는 미계측유역에서의 수공구조물의 설계를 위한 홍수량을 추론하는데 있어, 공간자료 확장기법에 의해 모의된 다지점의 첨두홍수량 자료를 이용한 지역홍수빈도분석의 가능성을 검토하였다. 충주댐 상류유역을 대상으로 지역홍수빈도분석의 표준방법인 지수홍수법을 중심으로 공간확장 자료의 활용에 대한 타당성을 입증하고, 대상유역 내 22개 지점의 확장자료를 이용하여 지역홍수빈도분석을 수행하였다. 지역의 동질성 가정을 구체적으로 검토하기 위해 수문학적 개념의 누가유역과 독립적인 자체유역으로 구분하여 분석을 시도하였다. 자체유역에 대한 지역의 동질성 분석결과는 이질지역으로 평가되었으며, 이러한 가장 큰 원인은 강우의 공간적인 불균등한 분포에서 기인한 것으로 분석되었다. 지역확률분포형을 선정하기 위해 적합성척도와 Floodfreq (Cost action ES0901)에서 제시한 가중이동평균(WMA) 방법으로 검토한 결과, 홍수빈도해석에 널리 이용되는 GEV 분포가 적정 확률분포형으로 채택되었으며, 그에 따른 유역의 무차원 성장곡선(분위수)을 제시하였다. 본 연구는 미계측유역에 대한 빈도홍수량 추정을 위해 지역홍수빈도분석을 중심으로 국내 관측자료의 한계를 극복하기 위한 시도이다.

GIS를 이용한 울산지역 선사유적 입지분석 및 분포예측 (Location Analysis and Distributional Forecast of Prehistoric Sites in Ulsan Region Using GIS)

  • 이한동;김교원
    • 한국지리정보학회지
    • /
    • 제15권3호
    • /
    • pp.23-35
    • /
    • 2012
  • 본 논문은 울산광역시를 대상으로 선사시대 최적의 입지를 GIS를 통한 분위수방법과 자연결점법으로 조사하였고, 등급화 통계분석방법으로 선사유적의 존재가능성을 분석하여 선사유적의 정착 패턴을 규명하였다. 연구에 사용된 변수는 고도, 사면 경사도, 수계 최소거리, 사면방향, 지질, 토양배수등급, 심토토성, 토지이용추천 등이며, 이를 이용하여 입지분석 및 분포예측을 실시하였다. 입지분석결과, 선사유적의 최적 입지환경 중 지형적 환경은 저지대 완경사지의 남향인 지역에 수계를 포함하는 곳이며, 지질 토양환경은 제4계 충적층의 배수상태가 양호하고, 심토토성은 식양질, 토지이용추천은 밭인 곳이 최적의 등급으로 분석되었다. 유적분포 예측결과, 태화강과 동천강이 합류하는 하류지역은 하천과 근접하여 식수이용이 용이하며, 경사도 및 고도가 낮은 지역으로 강 상류로부터 운반 퇴적된 충적층이 넓게 형성되어 농경생활에 적합하여 유적존재 가능성이 높은 것으로 나타났다.

균열 콘크리트에 설치된 M12, M20 내진용 스테인리스스틸 확장식 후설치 앵커 인장 실험 (Pullout Tests on M12&M20 Stainless Steel Post-Installed Expansion Anchor for Seismic Design in Cracked Concrete)

  • 김진규;천성철;안영승
    • 한국구조물진단유지관리공학회 논문집
    • /
    • 제26권1호
    • /
    • pp.29-38
    • /
    • 2022
  • 국내 지진발생의 증가에 따라 구조물 간의 접합 및 비구조물과 구조물의 연결에 사용되는 앵커의 내진설계가 필요하다. 이 논문에서는 지진 발생으로 균열폭이 커지는 경우에도 인장성능을 발현할도록 개발된 내진용 스테인리스스틸 확장식 후설치 앵커의 인장실험을 수행하였다. 현장에서 주로 사용하는 앵커의 지름 중 12 mm와 20 mm 앵커를 사용하였다. 확장식 후설치앵커의 내진성능을 평가하기위해 비균열 콘크리트와 균열 콘크리트에서 실험을 수행하였고 실험 방법은 콘크리트용 앵커 설계법 및 예제집 2판(KCI, 2018)에 따라 수행하였다. 실험변수는 균열의 유무, 콘크리트 압축강도, 앵커의 묻힘깊이 3가지이다. 평가는 콘크리트용 앵커 설계법 및 예제집 2판(KCI, 2018)에 제시된 방법인 유효계수(kc)값에 5% 분위수 안전율을 적용한 특성강도(K5%)를 이용하여 평가하였다. 설계기준에서 정의된 콘크리트브레이크아웃파괴를 위한 특성강도(K5%)는 비균열과 균열콘크리트에서 각각 9.8과 7.0 이다. 실험군에서 설계기준보다 높은 특성강도(K5%)가 발현되어 이 값을 콘크리트브레이크아웃강도로 사용할 수 있다.

일반계 고등학생 사교육비 지출에 대한 베이지안 분위회귀모형 분석 (Bayesian quantile regression analysis of private education expenses for high scool students in Korea)

  • 오현숙
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권6호
    • /
    • pp.1457-1469
    • /
    • 2017
  • 일반계 고등학생의 사교육비 지출은 대학입시와 맞물려 최근 더욱 증가하고 있는 동시에 가구소득 수준, 지역 등에 따라 양극화되고 있다. 기존의 사교육비 연구는 주로 다중회귀모형을 토대로 최소자승법을 이용하였으나 자료가 최소자승법의 기본가정인 정규성과 등분산성을 만족하지 않으면 분석결과의 신뢰성에 대한 문제가 발생된다. 본 연구는 2015년도 사교육실태조사자료에 대하여 정규성과 등분산성이 성립되지 않음을 확인하고 이를 통제할 수 있는 베이지안 분위회귀모형을 적합한 후 깁스 샘플링 방법을 이용하여 사교육비 지출규모 수준 (분위수)에 따라 영향요인들을 분석하였다. 분석결과 학생의 성별, 부모의 나이, 방과후 학교 참여시간과 비용은 사교육비 지출규모에 의미있는 영향을 주지 못하였다. 가구소득은 사교육비 지출규모의 모든 수준에서 동일하게 영향을 주는 요인으로 파악되었다. 그 외, 거주지역, 총사교육시간, 학생의 성적, 부모의 교육정도, 가구의 경제활동주체, 방과후 학교 참여여부, EBS 교재비용은 사교육비 지출 규모의 수준에 따라 다르게 영향을 주었다.

생태축 연결을 고려한 하천습지의 적정 후보지 선정 방안 (A Selection Methodology of the Appropriate Candidate Sites of Riverine Wetlands for Ecological Connection)

  • 강유진;왕원준;이하늘;이준형;이승민;김형수
    • 한국습지학회지
    • /
    • 제25권2호
    • /
    • pp.111-120
    • /
    • 2023
  • 현재 국내에서는 전국내륙습지 일반조사 및 습지보전기본계획 등의 장기적인 계획을 통해 습지 정책이 추진되고 있다. 그러나 대부분의 정책은 습지의 면적, 분포 및 생물다양성 등 현황 파악에 초점을 두고 있으며, 습지 생태계를 하나의 유기체로 보존 및 관리하는 것에 대한 인식이 부족한 상황이다. 따라서 본 연구에서는 홍수터, 생물다양성, 서식지 제공, 관광자원 등의 기능적인 측면을 고려하여 생태축 연결이 가능한 하천습지 후보지 선정을 위한 방법론을 제시하였다. 이를 토대로 본 연구에서는 낙동강 수계에 있는 우포늪, 화포천습지, 주남저수지 3개의 습지와 생태축 연결이 가능한 후보지를 선정하고자 하였다. 본 연구에서는 낙동강 수계의 15개 표준유역 내에 존재하는 63개의 습지와 7개의 후보지를 대상으로 적지 분석을 수행하였고, 산정된 점수를 이용하여 생태축 연결에 가장 적합한 하천습지 후보지를 선정하였다. 후보지 평가를 위해 9개의 평가요소를 선정하고, 해당 평가요소들에 분위수를 이용한 점수화 기법을 적용하여 분석을 실시하였다. 결과적으로, 우포늪2(호포)가 36점으로 가장 높은 점수를 받아 생태축 연결 가능성이 가장 높은 후보지로 선정되었다. 따라서 우포늪2(호포)가 홍수터, 서식지, 생물다양성 증진 및 관광자원으로서 역할이 가능한 동시에 생태축 연결에 가장 적합한 것으로 판단하였다.

의사결정나무 CART 알고리즘을 이용한 청소년 아침결식 예측 모형: 제7기 (2016-2018년) 국민건강영양조사 자료분석 (A prediction model for adolescents' skipping breakfast using the CART algorithm for decision trees: 7th (2016-2018) Korea National Health and Nutrition Examination Survey)

  • 최선아;정성석;노정옥
    • Journal of Nutrition and Health
    • /
    • 제56권3호
    • /
    • pp.300-314
    • /
    • 2023
  • 본 연구는 2016-2018년 국민건강영양조사 자료를 이용하여 청소년의 아침결식과 관련된 요인을 찾고 아침결식 예측모형을 분석하여 청소년의 아침결식 예방 교육 및 정책 수립에 기초 자료를 제공하고자 하였다. 2016-2018년 국민건강영양조사의 참여자는 총 24,269명으로 12-18세의 청소년 중 변수 결측자를 제외한 대상자는 1,024명이며, 이중 아침식사 섭취자 579명, 결식자 445명이었다. 남학생의 49.1%, 여학생의 50.9%가 아침결식자였다. 연령은 아침식사 결식군이 유의적으로 높으며, 결식군의 고등학생 비율이 높았다. 가구소득 4분위수는 아침식사 섭취군의 9.1%, 결식군의 15.4%가 '하'로 유의적인 차이를 보였다. 조사대상자의 신체적 요인은 유의적인 차이를 보이지 않았으나 체중감소를 위해 결식을 하는 경우는 아침식사 결식군의 25.3%, 섭취군의 10.4%로 유의적인 차이를 보였다. 조사대상자의 식습관과 정신건강에서 아침식사 결식군이 섭취군보다 1일 1회이상 외식횟수가 유의적으로 높았으며, 최근 1년간 1주 동안 5-7회 이상의 저녁식사 섭취빈도는 아침섭취군이 유의적으로 높았다. 또한, 아침식사 섭취군은 결식군보다 영양교육 경험이 유의적으로 높았으며, 아침식사 섭취군이 결식군보다 에너지, 단백질, 지방, 탄수화물, 식이섬유, 콜레스테롤, 비타민 A, 비타민 B1, 비타민 B2, 니아신, 비타민 C, 칼슘, 인, 나트륨, 칼륨, 철의 섭취율 및 탄수화물, 단백질, 지방의 섭취비율도 유의적으로 높았다. 아침결식 예측 모형을 도출하기 위해 CART 알고리즘을 사용한 의사결정나무 분석결과, 아침식사 섭취여부를 결정하는 주요인은 투입된 7개의 변수 중 교육수준과 영양교육 경험을 제외한 결식을 통한 체중조절, 가구소득 4분위수, 저녁식사 빈도, 연령, 외식 횟수였다. 체중조절을 위하여 결식을 하는 경우는 아침식사 결식군에서 높았다. 체중조절을 위하여 결식을 하지 않는 대상자는 가구소득 4분위수의 수준에서 소득이 '하', '중하'일 때 아침결식 비율이 높았다. 가구소득수준이 '상', '중상' 대상자의 경우는 저녁식사 빈도가 주 3-4회 이하인 경우 아침결식 비율이 높았다. 저녁식사 빈도가 주 5-7회이더라도 연령이 14.5세 초과인 경우 아침결식을 하고 있으며, 연령이 14.5세 미만인 대상자들은 외식횟수가 일 1회 이상인 경우, 주 6회 이하인 경우 아침결식을 하고 있었다. 따라서 아침결식을 감소시키기 위해서 청소년 대상의 각 그룹의 결식 주요인에 따라 올바른 체중조절 방법, 아침식사 배달, 건강정보에 대한 접근성 높이기, 아침결식과 질병과의 관련성 교육을 위한 토론수업 및 역할놀이 등과 같은 맞춤형 교육이 필요하며, 향후 청소년의 저녁식사 결식 감소 방안에 대한 연구가 추가적으로 진행되어야 하겠다.