• 제목/요약/키워드: 결합회귀분석

검색결과 237건 처리시간 0.038초

기상 레이더를 이용한 실시간 강수산정 기법 적용성 분석 (Analysis of the Applicability of Realtime Rainfall Estimation Methods Using Weather Radar)

  • 김광섭;최규현;김종필
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2008년도 학술발표회 논문집
    • /
    • pp.997-1000
    • /
    • 2008
  • 기상 레이더와 지상강우계를 이용한 실시간 강우산정기법은 전형적인 Marshall-Palmer(M-P) 방법, geostatistic 접근법을 이용한 방법, 회귀분석에 의한 방법, Kalman filter를 이용한 방법 및 실시간 weight mask를 이용한 보정 등 여러 형태가 존재한다. 본 연구에서는 실시간 강우산정을 위한 각 방법의 장단점 및 적용성을 분석하였다. 전형적인 M-P 방법은 잘 알려진 바와 같이 호우사상을 과소 추정하는 단점을 가졌으며 기존 연구자들이 제시한 바와 같이 층운형, 대류형과 같은 강우형태에 따라 다른 Z-R관계식을 가지므로 단일 Z-R관계식으로 강수를 산정함에 있어 한계를 가진다. Geostatistic 기법을 이용한 실시간 강수 산정의 경우, 지상 강우계 정보를 활용하여 강우공간분포를 개선하는 여러 기법 즉 cokriging, external drift 기법 등이 존재함에도 불구하고 과다한 계산시간, 실시간 variogram 산정과 적용상의 문제 등을 내포하고 있다. 실시간 회귀분석을 이용한 강우산정은 실제 적용에 있어 지상 강우계와 레이더 반사도사이의 선형 상관관계에 대한 결정계수가 매우 낮아 기법 적용이 간단한 장점에도 불구하고 적용에 한계를 가진다. Kalman filter기법을 이용한 실시간 레이더 강수산정은 계산시간이 여타 기법보다 많이 소요되어 실시간성을 유지하는데 한계를 가진다. 실시간 weight mask를 이용한 보정기법은 지상강우계 강우강도와 기상레이더 강우강도가 선형상관관계를 가진다는 가정이 대상지역 전체에 균일하게 적용될 수 없음에도 불구하고 기법의 적용이 간편하며 실시간 강우 공간분포를 실제 강우 관측인 지상 강우계 공간 분포 특성을 간접 강우 관측인 기상 레이더 반사도 분포와 결합하여 공간 변화 특성을 잘 나타낸다는 장점을 가지므로 실용적 적용에 있어 장점을 가진다.

  • PDF

드론기반 초분광 영상을 활용한 하천 합류부 부유사 혼합 분석 (Analysis of suspended sediment mixing in a river confluence using UAV-based hyperspectral imagery)

  • 권시윤;서일원;류시완
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.89-89
    • /
    • 2022
  • 하천 합류부에 지천이 유입되는 경우 복잡한 3차원적 흐름 구조를 발생시키고 이로 인해 유사혼합 및 지형 변화가 활발히 발생하게 된다. 특히, 하천 합류부에서 부유사 거동은 하천의 세굴과퇴적, 하천 지형 변화, 하천 생태계, 하천구조물 안정성 등에 직접적으로 영향을 미치기 때문에 이에 대한 정확한 분석이 하천 관리 및 재해 예방에 필수적인 요소이다. 기존의 하천 합류부 부유사 계측 자료들은 재래식 채취 방식으로 수행되어 시공간적 해상도가 매우 낮아서 실측 자료만으로 합류부에서 부유사 혼합을 분석하기에는 한계가 존재하기에 대하천의 부유사 혼합 거동 해석에 수치모형이 주로 활용되어 왔다. 본 연구에서는 하천 합류부에서 부유사 거동을 공간적으로 정밀하게 분석하기 위해 드론 기반초분광 영상을 활용하여 하천 합류부에 최적화된 부유사 계측 방법론을 제시하였다. 현장에서 계측한 초분광 자료와 부유사 농도간의 관계를 구축하기 위하여 기계학습모형인 랜덤포레스트(Random Forest) 회귀 모형과 합류부에서 분광 특성이 다른 두 하천의 특성을 정확하게 반영하기 위한 가우시안 혼합 모형 (Gaussian Mixture Model) 기반 초분광 군집화 기법을 결합하였다. 본 연구에서 구축한 방법론을 낙동강과 황강의 합류부에 적용한 결과, 초분광 군집을 통해 두하천 흐름의 경계층을 명확히 구별하였으며, 이를 바탕으로 지류와 본류에 대해 각각 분리된 회귀 모형을 구축하여 복잡한 합류부 근역 경계층에서의 부유사 거동을 보다 정확하게 재현하였다. 또한 나아가서 재현된 고해상도의 부유사 공간분포를 바탕으로 경계층에서 강한 두 흐름이 혼합되어 발생한 와류(Wake)가 부유사 혼합에 미치는 영향을 규명하였고, 하천 합류부에서 발생하는 전단층의 수평방향 대규모 와류가 부유사 혼합 양상에 지배적 영향을 미치는 것으로 확인하였다.

  • PDF

주식시장(株式市場)의 경기선행성(景氣先行性)에 관한 연구(硏究)

  • 지호준
    • 재무관리연구
    • /
    • 제9권1호
    • /
    • pp.207-222
    • /
    • 1992
  • 본(本) 연구(硏究)는 주식시장의 변화가 경기변동에 대하여 갖는 선행성(先行性)의 유무(有無)와 선행기간(先行期間) 및 선행패턴을 검정하였다. 기존의 경기 정점(peak)과 저점(trough)에 따른 선행시차분석(先行時差分析)이나 주식시장과 경기변동간의 단순회귀모형에 의한 ${\beta}$계수 측정 방법과는 달리, 교차상관관계(交叉相關關係)에 의한 선행 결합여부를 검정하고 Granger 정의에 입각한 인과관계검정(因果關係檢定)을 시도하였다. 1975년부터 1991년까지의 월별자료를 이용하여 교차상관계수(交叉相關係數)에 의한 Ljung-Box Q-통계량 검정을 실시한 결과 주식수익률과 경기동행지수 순환변동치는 선행결합(先行結合)하고 있음을 알 수 있었으며, t-7기의 주식수익률과 t기의 경기동행지수 순환변동치간의 계수가 가장 크게 나타났다. 또한 주식수익률의 lead 1에서 3기까지 보다는 lead 4기 이후에 크게 나타났으며 업종별(業種別)로는 제조업(製造業) 관련분야에서 유의적으로 나타났다. Granger 정의에 의한 인과관계(因果關係) 검정(檢定)을 실시한 결과, 12개월 내지 9개월 전부터 1개월 전까지의 주식수익률을 이용하는 것이 경기동행지수 순환변동치의 과거 정보만을 이용하는 것보다 예측오차를 줄일 수 있는 것으로 나타나 주식수익률이 경기동행지수 순환변동치의 원인변수라 할 수 있을 것이다. 업종별(業種別) Granger 검정결과는 교차상관계수(交叉相關係數)에 의한 Ljung-Box Q-통계량 검정결과와 유사하게 나타났는데 이는 검정결과의 신뢰성을 높여주었다.

  • PDF

주가지수 관계와 유전자 알고리즘을 이용한 주식예측 (Stock Forecasting using Stock Index Relation and Genetic Algorithm)

  • 김상호;김동현;한창희;김원일
    • 한국지능시스템학회논문지
    • /
    • 제18권6호
    • /
    • pp.781-786
    • /
    • 2008
  • 이 논문에서 우리는 선형결합으로 표현된 여러 가지 주가지수의 관계를 찾아내어 주식의 등락을 예측하는 방법을 제안한다. 제안된 방법에서 중요한 점은 전체 주가지수 중에서 예측하는 지수와 관계가 있는 주가지수들을 선택하는 것과 그 주가지수의 적절한 관계를 찾아내는 것이다. 전체 주가지수와의 관계를 설정하는 것은 불가능하기 때문에 밀접한 관계가 있는 주가지수만을 이용하였고 주가지수의 관계를 찾는 방법으로 유전자 알고리즘(GA : Genetic Algorithm)을 사용하였다. 제안된 방법을 이용하여 2005년부터 2007년도까지의 실제 주가지수를 가지고 모의투자 시뮬레이션을 한 결과 모의 투자금액이 230% 증가하는 것을 확인하였다.

시뮬레이티드 어니일링 기반의 랜덤 포레스트를 이용한 기업부도예측 (Predicting Corporate Bankruptcy using Simulated Annealing-based Random Fores)

  • 박호연;김경재
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.155-170
    • /
    • 2018
  • 기업의 금융 부도를 예측하는 것은 전통적으로 비즈니스 분석에서 가장 중요한 예측문제 중 하나이다. 선행연구에서 예측모델은 통계 및 기계학습 기반의 기법을 적용하거나 결합하는 방식으로 제안되었다. 본 논문에서는 잘 알려진 최적화기법 중 하나인 시뮬레이티드 어니일링에 기반한 새로운 지능형 예측모델을 제안한다. 시뮬레이티드 어니일링은 유전자알고리즘과 유사한 최적화 성능을 가진 것으로 알려져 있다. 그럼에도 불구하고, 시뮬레이티드 어니일링을 사용한 비즈니스 의사결정 문제의 예측과 분류에 관한 연구가 거의 없었기 때문에, 비즈니스 분석에서의 유용성을 확인하는 것은 의미가 있다. 본 연구에서는 시뮬레이티드 어니일링과 기계학습의 결합 모델을 사용하여 부도예측모델의 입력 특징을 선정한다. 최적화 기법과 기계학습기법을 결합하는 대표적인 유형은 특징 선택, 특징 가중치 및 사례 선택이다. 이 연구에서는 선행연구에서 가장 많이 연구된 특징 선택을 위한 결합모델을 제안한다. 제안하는 모델의 우수성을 확인하기 위하여 본 연구에서는 한국 기업의 실제 재무데이터를 이용하여 그 결과를 분석한다. 분석결과는 제안된 모델의 예측 정확도가 단순한 모델의 예측 정확성보다 우수하다는 것을 보여준다. 특히 기존의 의사결정나무, 랜덤포레스트, 인공신경망, SVM 및 로지스틱 회귀분석에 비해 분류성능이 향상되었다.

음주교통사고 영향요인과 심각도 분석을 위한 모형설정 (Modeling Traffic Accident Characteristics and Severity Related to Drinking-Driving)

  • 장태연;박현천
    • 대한토목학회논문집
    • /
    • 제30권6D호
    • /
    • pp.577-585
    • /
    • 2010
  • 교통사고는 사람과 자동차, 도로환경 등의 여러 요인들이 결합되어 발생됨으로 요인들에 대한 과학적, 심층적인 조사와 분석을 통해 사고요인을 사전에 제거하여 유사한 형태로 반복되는 사고를 예방하는 것이 중요하다. 특히, 인적요인은 교통사고에 있어 큰 부분을 차지하고 있어 인적요인에 의한 음주교통사고는 경각심을 갖고 해결해야 할 중요한 사회적 문제이다. 연구는 교통사고자료를 활용하여 사고 빈도와 사고 심각성에 영향을 주는 요인에 대해 분석한다. 교통사고를 음주 및 비음주 사고로 분류하고, 비음주 사고에 대한 음주 사고 발생 가능성에 대해 로그선형모형을 이용하여 변수간의 관계성을 분석한다. 음주교통사고 영향요인으로는 여성보다는 남성이, 비승용차 운전자보다는 승용차 운전자가 음주관련 사고 발생가능성이 높은 것으로 나타났다. 연령의 증가, 커브구간, 단일로, 노면 불량상태 등에서도 발생가능성이 높은 것으로 분석되었다. 또한, 음주교통사고의 경중을 고려한 심각성 분석을 위해 순위회귀모형의 적용 가능성을 탐색하였다. 종속변수가 이산적 특성과 함께 순위적 특징을 보일 경우 순위회귀모형이 적용되어야 하는데, 종속변수가 정성적 표현이 아닌 단지 순위를 반영하는데 유익한 모형이다. 사고의 심각성 분석에서 교통사고 발생시간대, 기후, 도로형태, 사고유형, 성별, 차량종류 등에 의해 심각성이 가중됨을 알 수 있었다. 계절적으로는 봄과 겨울이 사고의 심각성이 증대되며 반면에 여름과 가을은 감소될 가능성이 높았다.

Mixture Regression Model을 이용한 재래시장의 세분집단별 고객충성도에 미치는 영향 변수 분석 (Analysis of Variables Affecting on Customer Loyalty by Market Segments for the Korean Open Air Market Using Mixture Regression Model)

  • 김종국;박윤재;박주양;최자영
    • 한국유통학회지:유통연구
    • /
    • 제12권4호
    • /
    • pp.1-25
    • /
    • 2007
  • 본 연구는 우리나라 유통산업환경의 경쟁이 날로 심화되고 있는 가운데 그간 대표적인 소매유통공간이면서도 1996년 유통시장개방 이후 급속하게 경쟁력이 약화되고 매출이 감소하고 있는 재래시장을 대상으로 세분화된 고객집단별로 재래시장에 대한 고객충성도에 미치는 영향을 파악하여 차별화된 마케팅 전략을 제공하는데 그 목적이 있다. 본 연구에서는 재래시장의 특성, 소비자 속성 등을 파악하고 특성에 따라 세분시장별로 고객의 충성도를 결정하는 요인들을 파악하기 위해 결합회귀모델(Mixture Regression Model) 방법을 이용하였다. 이 분석 모델은 재래시장 속성에 대한 가치를 예측변수로, 소득은 공변량으로, 종속 변수는 고객 충성도로 설정하였다. 연구결과, 재래시장 이용 고객은 4개의 집단, 즉 '접근편리성중시'(33.7%), '가격중시'(29.7%), '쇼핑환경중시'(22.0%), '머천다이징중시'(14.5%)로 구분할 수 있다. 또한 재래시장 고객 충성도에 미치는 예측 변수는 소비자가 우선 시하는 가치 및 소득의 크기에 따라 세분화 된 시장별로 차이가 있음을 보여주고 있다. 학문적인 면에서 본 연구는 결합회귀모델 분석을 적용함으로써 기존의 방법론으로는 분석에 어려움이 있었던 세분 집단의 수의 결정, 모수 추정 등에 대해 보다 객관적인 자료를 제공함으로써 고객충성도에 대한 보다 정확한 예측에 기여할 것으로 기대 한다.

  • PDF

특허 인용에 영향을 미치는 요인 분석: 국내의료기기 특허를 중심으로 (Analysis of Factors Influencing Patent Citations: Focused on Korea Medical Device Patents)

  • 윤재웅;이창섭;이석준
    • 정보관리학회지
    • /
    • 제33권2호
    • /
    • pp.103-133
    • /
    • 2016
  • 최근 특허기술의 가치평가가 크게 강조되고 있으며, 특허의 피인용횟수는 특허기술 가치평가에 있어 중요한 척도이다. 본 연구에서는 국내 특허를 대상으로 피인용횟수에 영향을 주는 변수들을 도출하기 위하여 일반화 선형모형 회귀분석을 실시하였다. 총 12개의 변수를 형태적, 기술적 그리고 개념적 요인으로 분류하였고, 국내 의료기기 특허 14개의 분야에 적용하여 분석한 결과 출원인 국적, 출원인 유형, 발명자 수, 출원국가 수, IPC 수, 참고문헌 수, 서지결합도가 특허 피인용횟수에 유의미한 영향을 미치는 것으로 나타났다. 본 연구는 국내 실정에 적용 가능한 연구를 수행함으로써 국내 특허에 대한 인용분석 방법론에 있어서 실질적인 기초적 자료를 제공했다는데 의의가 있다.

유기화합물의 승화열 예측을 위한 QSPR분석 (QSPR analysis for predicting heat of sublimation of organic compounds)

  • 박유선;이종혁;박한웅;이성광
    • 분석과학
    • /
    • 제28권3호
    • /
    • pp.187-195
    • /
    • 2015
  • 승화열은 대기 유기 오염물질의 확산에 관련된 환경적인 문제를 해결하거나, 위험한 화학 물질의 위해성을 평가하는 데에 중요한 변수이다. 하지만 실험적으로 승화열을 측정하려면 많은 시간과 비용이 소모 되며, 그 실험자체도 복잡하고 위험하다. 따라서 본 연구에서는 유기화합물의 승화열을 간단하게 예측하는 모델을 개발하기 위하여 정량적 구조-물성 상관관계 연구를 이용하였다. 군기반 전진선택방법을 적용하여 다중선형회귀방법과 서포트 벡터 머신과 같은 학습방법에 적합한 분자표현자들을 선택하도록 하였다. 개별 모델과 복합모델들은 부스트래핑 방법과 y-임의추출법에 의해 내부검증이 되었다. 외부 테스트 데이터의 예측 성능은 적용범위를 고려하므로서 개선되었다. 다중선형회귀모델에 따르면, 승화열은 분자간의 분산력, 수소결합, 정전기적 상호작용, 쌍극자-쌍극자 상호작용과 관련이 있는 것을 나타낼 수 있었다.

범주형 자료의 결측치 추정방법 성능 비교 (Comparing Accuracy of Imputation Methods for Categorical Incomplete Data)

  • 신형원;손소영
    • 응용통계연구
    • /
    • 제15권1호
    • /
    • pp.33-43
    • /
    • 2002
  • 범주형 데이터의 결측치 추정을 위하여 최빈 범주법, 로지스틱 회귀분석, 연관규칙과 같은 다양한 방법이 연구되어 왔다. 본 연구에서는 이러한 방법의 추정 값을 결합하는 신경망 융합과 투표융합 방법을 제안하고 이의 성능을 시뮬레이션을 이용하여 비교하였다. 실험에 사용된 데이터의 특성을 나타내는 인자로는 (1) 입출력 변수간의 연결함수, (2) 데이터의 크기, (3) 노이즈의 크기 (4) 결측치의 비율, (5) 결측발생 함수를 사용하였다. 분석결과는 다음과 같다. 데이터의 크기가 작고 결측 발생 비율이 높으면 최빈 범주법, 연관규칙, 신경망 융합의 성능이 높게 나타났으며 데이터의 크기가 작고 결측발생 확률이 결측이 안된 나머지 변수에 높은 의존관계가 있으면 로지스틱 회귀분석, 신경망 융합의 성능이 높게 나타났다. 데이터의 크기가 크고, 결측치의 비율이 낮으면서, 노이즈가 크고 결측발생 확률이 결측이 안된 나머지 변수에 높은 의존관계가 있으면 신경망 융합의 성능이 높게 나타났다.