• 제목/요약/키워드: 통계적 변수

검색결과 1,046건 처리시간 0.034초

통계적 모형을 이용한 지천 홍수예측 (Tributary Flood Forecasting Using Statistical Analysis Method)

  • 성지연;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2009년도 학술발표회 초록집
    • /
    • pp.1524-1527
    • /
    • 2009
  • 본 연구는 주요지천 홍수예측에 적용된 통계적 모형을 개선하여 예측 결과의 정확성 향상을 도모하는 데 목적이 있다. 중랑천, 탄천, 왕숙천 등 한강수계 주요 지천은 홍수예보 지점으로 유역면적이 작고 도달 시간이 짧아 기존의 대하천 홍수예보에 이용되고 있는 수문학적 홍수예측 모형을 적용하기에는 한계가 있다. 이러한 문제점을 해결하기 위해 주요 지천 홍수예측에 통계적 모형인 다중선형 회귀모형을 이용하는 방법이 제안되어 활용되었다. 본 연구에서는 지천홍수예측에 기 적용된 다중선형 회귀 모형의 다중공선성 문제를 해결하기 위해 독립변수를 조정하고, 10분 단위 관측 자료를 활용한 예측 결과를 얻기 위해 매개변수를 재산정하였다. 그 결과 기존 모형에 비해 적은 수의 독립변수와 재 산정된 매개변수를 이용한 통계적 모형으로 예측 수위의 오차를 줄일 수 있었다.

  • PDF

목적함수에 따른 다지점 NSRP 모형의 극치강우 재현능력 평가 (Evaluation of Characteristics of Simulated Extreme Rainfall Obtained from NSRP model under Different Object Functions)

  • 조혜미;유재웅;문장원;권현한
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.363-363
    • /
    • 2021
  • 수자원설계 및 계획 시 제한된 강우자료로 인해 나타나는 한계를 개선하기 위한 목적으로 추계학적 강수모의 모형을 활용한다. 대표적인 추계학적 강수모형으로 Bartlett-Lewis Rectangular Pulse Modified Model(BLPRM)과 Neyman-Scott Rectangular Pulse Model(NSRPM) 등이 활용되고 있으며, 관측강수량의 통계적 모멘트를 재현할 수 있도록 모형 매개변수를 최적화하는 과정이 필수적으로 요구된다. 기본적으로 모형 매개변수들의 조합을 통해 추정되는 통계적 모멘트와 관측값의 통계적 모멘트를 반복적으로 비교하면서 최적 매개변수를 추정하게 된다. 그러나 상대적으로 적은 관측값을 이용하여 매개변수를 추정하기 때문에, 매개변수 추정이 어려울 뿐만 아니라 매개변수의 불확실성도 큰 특징을 가지고 있다. 모형 매개변수 추정과정에서 다양한 목적함수가 활용되고 있으나, 고려되는 통계적 모멘트가 평균 및 분산 등 2차 모멘트에 제한되고 있어 극치강수량에 대한 재현성은 상대적으로 부족한 부분이 있다. 본 연구에서는 3차 모멘트를 포함한 목적함수를 활용하여 NSRP모형 매개변수를 추정하고, 기존 2차 모멘트를 이용한 매개변수 접근방법과 극치강수량 재현 측면에서 비교를 수행하였다. 최종적으로 유역 단위에서 극치강수량 재현효과를 평가하기 위해서는 면적강수량 추정이 매우 중요하며, 본 연구에서는 이러한 점을 감안하여 강우 지점 간의 상관성을 유지하면서 강우모의가 가능한 다지점 NSRP 모형과 연계하여 극치강우 재현 가능성을 평가하였다.

  • PDF

댐 수위의 확률분포 결정방법에 대한 분석

  • 문영일
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2004년도 분과위원회 연구과업 보고서
    • /
    • pp.1-22
    • /
    • 2004
  • 현재 댐 위험도 분석 등의 사용되는 Monte Carlo Simulation 방법을 이용하는데 있어서 가장 어려운 문제이면서 약점으로 지적되어 온 것이 수리 수문학적 불확실성 변수들에 대해서 정확한 확률분포를 정의할 수 없다는 것이다. 즉 기존 매개변수적 방법들은 모집단 분포의 형태를 가정하고, 분포의 매개변수에 관한 통계적 분석을 하는 방법이다. 조사대상이 되는 모집단 분포에 관한 정보가 부족하기 때문에 어떤 가정이 곤란하거나 부정확한 가정을 전제로 하지 않고, 관측자료로부터 통계량을 분석하여 통계적 추론을 하는 방법이 필요하게 되며, 이를 비매개변수적 방법(nonparametric methods)이라고 한다. (중략)

  • PDF

멀티미디어를 이용한 정보기술 교육훈련의 효율성에 영향을 미치는 링크(Link)수와 노드(Node)크기에 대한 실증적 연구

  • 김대룡
    • 한국정보시스템학회:학술대회논문집
    • /
    • 한국정보시스템학회 2000년도 추계학술대회
    • /
    • pp.29-35
    • /
    • 2000
  • 본 연구는 멀티미디어의 기본 구성요소인 링크와 노드를 처리변수로 하고 사용자의 편의성과 유용성에 대한 인식을 종속변수로 해서 링크의 숫자와 노드의 크기가 사용자의 인식에 어떻게 영향을 미치는지에 대해 밝히고자 했다. 먼저 2x3 팩토리얼 디자인에 따라 각각 다른 처리변수의 조합을 가진 6개의멀티미디어 자료가 구축이 되었으며 경영대 학생들을 대상으로 실험을 하여 자료를 수집했다. 수집된 자료는 타당성 검사와 신뢰성 검사를 거친 뒤 통계적 분석을 하였다. 종속변수에 대한 상관관계가 검사되었으므로 변량 분산 분석으로 처리변수의 종속변수에 대한 통계적 유의성을 검사했으며 단변량 분산분석 중 이원배치분산분석으로 각각의 종속변수에 대한 처리변수의 영향을 검토했다. 인구통계학적 자료의 종속변수에 대한 상관관계가 발견됨에 따라 다변량 공분산분석과 단변량 공분산분석을 통해 인구통계학적 자료의 영향을 조사했다. 마지막으로 평균차이분석을 통해 실험 참가자들의 선호도를 조사했다. 본 연구의결과를 요약하면 처리변수는 사용자 인식 편의성과 인식 유용성에 영향을 미치고 링크 수와 노드 크기가 멀티미디어의 설계에 중요한 요인인 것이 밝혀졌다.

  • PDF

다중계측기 신호의 통계적 추정방법 (Statistical Estimation of Multi-Point Detector Signal)

  • 이은기;김용배
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1999년도 추계학술대회 논문집 학회본부 B
    • /
    • pp.603-605
    • /
    • 1999
  • 본 논문은 통계적 Regression방법인 Alternating Conditional Expectation(ACE) 방법을 적용하여 다중계측기를 이용한 공간 변수의 분포에 대한 추정 혹은 재구성 문제를 분석하는 방법을 제시하고 있다. 한다. 계측기 설치 비용 및 설치 위치의 한계로 인해 완벽하게 이루어지기 힘든 공간 변수의 연속적인 분포 추정은 공정 시스템이나 안전성 관련 변수의 감시분야에 많이 응용되고 있다. 본 논문은 계측기 추가에 따르는 비용을 줄이거나 동일한 수의 계측기로 측정오차를 감소시킬 목적으로 가상계측기의 개념을 도입하고 이를 적용하기 위한 통계적 추정 방법론을 기술하고 있다. 수치모사를 통한 분석결과 본 방법은 비선형성이 큰 변수분포에 대해서도 Robust한 결과를 주는 것을 확인하였다.

  • PDF

로버스트 회귀모형을 이용한 자료결합방법 (Statistical Matching Techniques Using the Robust Regression Model)

  • 전명식;정시송;박혜진
    • 응용통계연구
    • /
    • 제21권6호
    • /
    • pp.981-996
    • /
    • 2008
  • 서로 다른 출처로부터 얻어진 데이터 파일들을 하나의 데이터 파일로 만드는 통계적 자료결합방법은 공통변수와 서로 다른 고유변수를 포함하여 변수들 간에 존재하는 관련성에 대해 살펴볼 수 있다. Robin (1986)이 제안한 일반회귀모형의 예측값을 이용한 통계적 결합방법은 자료에 대한 다변량 정규성을 가정하기 때문에 이 가정을 위반하는 자료를 이용하는 것은 많은 문제를 수반한다. 본 연구는 제공파일의 고유변수에 모분포를 반영하지 못하는 특이점이 존재하는 경우, 일반회귀모형을 이용한 통계적 결합방법의 대안으로 로러스트 회귀추정방법을 이용한 자료결합방법을 제안하였다. 나아가 로버스트 회귀모형을 이용한 결합방법과 일반회귀모형을 이용한 결합방법에서의 상관관계 및 결정계수 보존에 관한 성능을 비교하기 위하여 모의실험을 수행하였다.

선형회귀모델의 변수선택을 위한 다중목적 유전 알고리즘과 응용 (Multi-objective Genetic Algorithm for Variable Selection in Linear Regression Model and Application)

  • 김동일;박정술;백준걸;김성식
    • 한국시뮬레이션학회논문지
    • /
    • 제18권4호
    • /
    • pp.137-148
    • /
    • 2009
  • 본 논문의 목적은 신뢰성 있는 선형회귀모델을 구축하기 위하여 후보독립변수 중 유효변수를 선택하는 알고리즘을 구현하는 것이다. 선형회귀모델을 구축하는데 있어서 데이터 상의 모든 후보독립변수를 포함하는 것은 모델의 통계적 유의성을 감소시킬 수 있으며, 차원의 저주(Curse of dimensionality)를 유발할 수 있고, 데이터의 개수보다 변수의 개수가 많을 경우 모델의 구축이 불가능한 문제점 등이 있다. 이와 같은 문제점을 해결하기 위하여 변수선택의 문제를 조합최적화의 문제로 보고 유전 알고리즘(Genetic Algorithm)을 활용하였다. 일반적으로 선형회귀모델의 통계적 유의성을 평가하는 대표적인 통계량으로는 종속변수에 대한 독립변수의 설명력을 나타내는 결정계수($R^2$), 회귀식의 통계적 유의성을 검정하는 F통계량, 회귀계수의 통계적 유의성을 검정하는 t통계량, 잔차의 표준오차 등이 있다. 모델의 통계적 유의성은 하나의 통계량으로 표현될 수 없으므로 다양한 기준을 고려한 다중목적식(Multi-objective function)을 가지는 유전 알고리즘을 설계하였다. 설계한 알고리즘의 성능평가를 위하여 다양한 조건을 가정한 시뮬레이션 데이터에 적용하였다. 그 결과 구축한 알고리즘이 유효변수를 판단함에 있어 기존의 대표적인 변수선택 알고리즘인 LARS(Least Angle Regression)에 비해 우수한 성능을 보임을 확인할 수 있었다. 또한, 주가 데이터를 이용한 포트폴리오 선택에 적용해 본 결과 우수한 응용문제 해결 능력이 있음을 확인할 수 있었다.

닭-달걀 간 통계적 인과성 논란의 판별 (Identifying the Chickens-Eggs Statistical Lead-Lag Dilemma)

  • 김태호;김민정;이진완
    • 응용통계연구
    • /
    • 제26권3호
    • /
    • pp.401-411
    • /
    • 2013
  • 변수들 간 인과관계는 시차 회귀방정식을 사용한 초기의 검정법 이후 새로운 통계적 기법이 계속 개발되면서 더욱 다양하고 효율적인 분석이 가능하게 되었지만 오랜 논쟁의 대상인 닭과 달걀 간 선행관계에 대한 검정은 의외로 간과되어왔다. 본 연구에서는 현대적 관점에서 두 변수 간 인과관계를 학문적으로 조명해보기 위해 사용가능한 자료를 이용하여 통계적 검정을 실시해 보았다. 두 변수 간 관계에는 구조적 변화가 발생하지 않았음이 입증되면서 사용한 검정법 모두 수준변수 및 정상변수에서 일관된 검정결과를 보이는 것으로 나타났다.

공공기관의 보안 진단을 위한 보안평가모델 설계에 관한 연구 (A Study on an Architecture of Security Assessment Model for Security Diagnostics of a Public Institution)

  • 엄정호;박선호;정태명
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.835-838
    • /
    • 2010
  • 본 논문에서는 공공기관의 효율적인 보안 진단을 위하여 금융 위험평가 시스템에 사용되는 통계적 CAEL 모델을 적용하여 보안평가 모델(SAM)을 설계하였다. SAM은 통계적 CAEL 모델을 기반으로 조직과 관련된 보안변수와 보안지표를 평가요소로 하여 요소별 평가등급 선정 방식과 최종 종합평점 산출 방법으로 보안평가 결과값을 도출한다. SAM은 조직의 보안수준 결과에 중요하게 영향을 미칠 수 있는 모든 요소들을 평가대상으로 하고 정량적인 방법인 보안평가 모델을 활용하여 결과를 산출한다. SAM은 조직의 규모, 특성 등에 따라 보안변수를 변경할 수 있으며, 각 보안 지표별 통계적 자료 값을 수집하여 요구되는 변수만 입력하면 되기 때문에 사용 용이성도 우수하다.

벤처기업정밀실태조사와 한국기업혁신조사 데이터를 활용한 통계적 매칭의 타당성 검증 (The Validity Test of Statistical Matching Simulation Using the Data of Korea Venture Firms and Korea Innovation Survey)

  • 안경민;이영찬
    • 지식경영연구
    • /
    • 제24권1호
    • /
    • pp.245-271
    • /
    • 2023
  • 최근 데이터 경제가 가속화되면서 경영학 분야에서는 데이터 매칭이라는 새로운 기법이 주목받고 있다. 데이터 매칭은 모집단이 같지만 서로 다른 표본에서 수집된 데이터셋을 합치는 기법 또는 처리 과정을 의미한다. 그중에서 통계적 매칭은 서로 다른 데이터를 결합하는데 있어서 사업자 번호와 같이 기준이 되는 변수가 없는 경우 통계적 함수를 활용하여 데이터를 매칭하는 방법이다. 선행연구 검토결과 경제학, 교육학, 보건, 의료 등 다양한 분야에서 통계적 매칭이 많이 사용되고 있는데 반해 경영학 분야는 제한적임을 확인할 수 있었다. 본 연구는 기존 경영학 분야에서 충분히 연구되지 않았던 통계적 매칭의 유용성을 검증하고 활용도를 높이는 방안을 연구하고자 한다. 연구목적을 달성하기 위해 본 연구에서는 2020 벤처기업정밀실태조사와 2020 한국기업혁신조사 자료를 활용하여 통계적 매칭 시뮬레이션을 수행하였다. 먼저, 선행연구를 바탕으로 통계적 매칭에 사용되는 변수를 선정하였다. 공통변수는 업종, 종업원수, 지역, 업력, 상장시장, 매출로 설정하였고, 검증을 위한 고유변수와 제공변수는 중소기업 혁신에서 가장 중요한 연구인력 비율과 R&D 비용으로 각각 설정하였다. 사전 검증을 위해 2020 벤처기업정밀실태조사 자료를 수여자 데이터 30%와 기여자 데이터 70%로 분할하였다. 통계적 매칭에는 마할라노비스 거리와 랜덤 핫덱을 결합한 방식을 사용하였고, 성능평가는 수여자 데이터와 원시 데이터의 평균값 비교와 커널 밀도 함수(Kernel Density Estimation)를 통해 데이터 분포를 비교하였다. 검증결과, 수여자 데이터 30%와 기여자 데이터 70%에서 추출된 매칭 데이터의 평균값이 통계적으로 유의한 차이가 없는 것으로 나타나 유사한 데이터가 매칭된다는 것을 확인하였다. 또한, 두 데이터의 커널 밀도 함수로 도출한 데이터 분포 역시 유사한 형태가 나타나는 것을 확인할 수 있었다. 사후 검증에는 2020 벤처기업정밀실태조사에서 임의로 30%를 수여자 데이터로 추출하고 2020 한국기업혁신조사 자료를 기여자 데이터로 설정하여 통계적 매칭을 수행하고 검증하였다. 사전 검증과 마찬가지로 공통변수는 업종, 종업원수, 지역, 업력, 상장시장, 매출로 설정하였고, 검증을 위한 고유변수는 연구 인력 비율과 R&D 비용으로 정의하였다. 분석 결과, 수여자 데이터의 연구인력 비율의 평균과 기여자 데이터의 평균은 예상과 다르게 통계적으로 차이가 있는 것으로 나타났다. 하지만 커널 밀도 함수에 따른 두 데이터의 분포는 유사한 형태를 보이는 것으로 조사되어 통계적 매칭의 적절성을 확인할 수 있었다. R&D 비용은 통계적 매칭 수행 결과, 수여자 데이터의 R&D 비용 평균과 기여자 데이터의 평균이 통계적으로 차이가 없었고, 커널 밀도 함수도 유사한 분포를 보이는 것으로 조사되었다. 이러한 결과는 모집단은 동일하지만 서로 다른 표본에서 수집된 자료를 통계적으로 결합하여 신뢰할 수 있는 새로운 데이터를 확보할 수 있다는 측면에서 큰 의의가 있다. 또한, 경영학 분야에서 많이 사용되지 않았던 데이터 매칭 방법론을 모의실험을 통해 타당성을 검증함으로써 연구용 데이터 확보와 연구방법론의 확장에 기여했다는 점에서 시사점을 가진다.