• Title/Summary/Keyword: 변수분석

Search Result 17,171, Processing Time 0.042 seconds

A Study on the Analysis of Fire Patterns using the Decision Tree Analysis Method (의사결정분석방법을 활용한 화재유형분석에 관한 연구)

  • Lee, Hae-Pyeong;Lee, Seung-Chul;Hwang, Me-Jung;Park, Young-Ju;Moon, Kyong-Ae;Kim, Hyo-Beom
    • Proceedings of the Korea Institute of Fire Science and Engineering Conference
    • /
    • 2010.10a
    • /
    • pp.349-353
    • /
    • 2010
  • 본 연구에서는 통계분석방법 가운데 하나인 의사결정분석방법을 활용하여 소방방재청 국가화재정보시스템의 2007년부터 2009년까지 강원지역에서 발생한 화재발생 데이터를 대상으로 화재발생에 대한 유형을 분석하였다. 이와 같은 분석결과는 체계적이고 효율적인 소방정책을 수립하기 위한 기초 자료로 활용될 수 있을 것으로 사료된다. 변수선정은 NFDS의 변수들 가운데 화재유형분석에 영향을 줄 것으로 판단되는 변수들만을 대상으로 요인변수들을 발화환경, 화재원인, 진화요인 등 3개의 그룹으로 분류하였으며, 목적변수로는 화재피해와 화재건수를 선정하였다. 또한 NFDS의 제공 데이터들 이외에도 분석의 신뢰도와 정확도를 높이고자 통계청에서 제공하는 2007년과 2008년 외부데이터를 포함시켰다. 분석방법은 대분류 차원의 화재유형별 분석을 수행하고자 인명피해, 재산피해, 화재건수 등 3개의 목적변수를 대상으로 변수들의 영향력을 고찰하였다.

  • PDF

Input Variable Selection by Principal Component Analysis and Mutual Information Estimation (주요성분분석과 상호정보 추정에 의한 입력변수선택)

  • Jo, Yong-Hyeon;Hong, Seong-Jun
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2006.11a
    • /
    • pp.175-178
    • /
    • 2006
  • 본 논문에서는 주요성분분석과 상호정보 추정을 조합한 입력변수선택 기법을 제안하였다. 여기서 주요성분분석은 2차원 통계성을 이용하여 입력변수 간의 독립성을 찾기 위함이고, 상호정보의 추정은 적응적 분할을 이용하여 입력변수의 확률밀도함수를 계산함으로써 변수상호간의 종속성을 좀더 정확하게 측정하기 위함이다. 제안된 기법을 인위적으로 제시된 각 500개의 샘플을 가지는 6개의 독립신호와 1개의 종속신호를 대상으로 실험한 결과, 빠르고 정확한 변수의 선택이 이루어짐을 확인하였다.

  • PDF

Development of Variable Selection Technique using Stepwise Regression and Data Envelopment Analysis (단계적 회귀법과 자료봉합분석을 이용한 변수선택기법의 개발)

  • Jeong, Min-Eui;Yu, Song-Jin
    • Journal of KIISE:Software and Applications
    • /
    • v.41 no.8
    • /
    • pp.598-604
    • /
    • 2014
  • In this paper, we develop stepwise regression data envelopment model to select important variables. We formulate null hypothesis to understand the importance of each variable and use Kruskal-Wallis test for this purpose. If the Kruskal-Wallis test does reject the null hypothesis this will imply there is significant fluctuation in the efficiency score relative to base model. And therefore we have to further check the pair of variables that causes the fluctuation in order to determine its importance using Conover-Inman test. The proposed models helps understand the extent of misclassification decision making units as efficient/inefficient when variables are retained or discarded alongside provides useful managerial prescription to make improvement strategies.

Review of hydraulic characteristics in River by parameters chang (매개변수 변화에 따른 하도 수리특성 검토)

  • Kim, Mi Jung;Ahn, Seoung Seop
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.294-294
    • /
    • 2017
  • 본 연구에서는 입력 매개변수의 변화에 따른 하천의 수리특성의 변화를 분석하기 위하여 2차원 수리해석 모형의 입력변수들에 대하여 초기 입력값의 15%~ +15% 범위로 변화시켜 해석하였다. 하도내 구조물 주변의 2차원 부정류 해석으로 각각의 매개변수의 입력값에 따라 나타나는 해석결과 최댓값들의 영향을 검토하여 하도내 2차원 분석결과에서 각각의 매개변수의 민감도를 파악하였다. 2차원 수리해석 입력자료의 민감도 분석을 위하여 수온, 밀도, 난류교환계수, 조도계수, MP(Marsh Porosity)에 대한 초기치를 기준으로 $0%{\sim}{\pm}15%$ 변화된 값을 각각 입력하여 하도내 합류부와 구조물 주변에 나타나는 2차원 수리특성 변화를 분석하고 하도구간의 종단 및 횡단에 대해서 각각 매개변수들의 결과 값에 따라 변화되는 특성을 분석하였다.

  • PDF

A Study on Baseflow Parameters Estimation of Tank Model (Tank 모형의 기저유출 매개변수 산정에 관한 연구)

  • Koo, Bo-Young;Jung, Il-Won;Bae, Deg-Hyo
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2006.05a
    • /
    • pp.1970-1974
    • /
    • 2006
  • Tank 모형은 유역을 임의의 저류탱크로 가정하여, 유출공의 높이를 초과하는 저류고를 방출함으로써 유출량을 모의한다. 유출분석의 목적에 따라 직렬 3단 혹은 4단의 탱크로 구성하여 적용하는 것이 일반적인데, 국내의 일 단위 장기유출분석 연구에서는 직렬 4단 Tank 모형이 널리 활용되고 있다. 이러한 Tank 모형은 유역의 강우-유출관계를 모의하는 과정에 black box적인 특성을 지니고 있다. 그러나 각 저류탱크와 관련된 매개변수를 최적화하기 위해서는 매개변수들의 물리적인 의미를 이해하여야 한다. 이런 점을 고려하여 일본의 Sugawara는 경험적으로 매개변수들이 결정되는 범위를 제시한 바 있다. 그러나 기저유출을 모의하는 Tank 모형의 최하단 탱크에서 이러한 매개변수 범위에서는 적합한 값을 갖으나 장기적인 모의시에 저류고 및 유출고가 계속 증가하여 물리적인 유출특성을 반영하지 못하는 문제점이 나타났다. 따라서 본 연구에서는 이러한 문제점의 원인을 분석하기 위해 장기간의 자료가 구축된 소양강댐을 적용 유역으로 선정하여 최하단탱크의 유출공계수의 변화에 따른 유출량과 저류고의 변화를 살펴보았다. 분석결과 매개변수가 $0.0001{\sim}0.001$의 범위에서 장기간의 지속적인 저류고와 유출량의 증가가 나타났다. 그리고 유출공계수가 증가함에 따라 최대저류고는 감소하고, 저류고가 증가하는 지속기간이 짧아지는 것으로 나타났다. 그러나 통계치 변화분석에서는 상관계수, 평균제곱근오차, 모형효율성계수에서 거의 변화가 없는 것으로 나타났으며, 유출용적오차에서도 최대 약 6% 정도 유출용적이 변화하는 것으로 나타났다.mber)과 동일한 위치의 수온자료를 기초로 회귀분석을 실시함으로써 수온추출 알고리즘을 도출하여, 분석데이터의 신뢰도를 검증하였으며, 수온, 클로로필, 투명도 등을 위성원격탐사 자료와 GIS를 이용하여 공간분석을 실시하고, 공간분포도를 작성함으로써 대상해역의 해양환경을 파악하였다. 본 연구결과, 분석된 위성자료가 현장조사에 의한 검증이 이루어지지 않을 경우, 영상자료분석을 통한 표층수온 추출은 대기 중의 수증기와 에어로졸에 의한 계산치의 오차가 반영되기 때문에 실측치 보다 낮게 평가 될 수 있으므로, 반드시 이에 대한 검증이 필요함을 알 수 있었다. 현지관측에 비해 막대한 비용과 시간을 절약할 수 있는 위성영상해석방법을 이용한 방법은 해양수질파악이 가능할 것으로 판단되며, GIS를 이용하여 다양하고 복잡한 자료를 데이터베이스화함으로써 가시화하고, 이를 기초로 공간분석을 실시함으로써 환경요소별 공간분포에 대한 파악을 통해 수치모형실험을 이용한 각종 환경영향의 평가 및 예측을 위한 기초자료로 이용이 가능할 것으로 사료된다.염총량관리 기본계획 시 구축된 모형 매개변수를 바탕으로 분석을 수행하였다. 일차오차분석을 이용하여 수리매개변수와 수질매개변수의 수질항목별 상대적 기여도를 파악해 본 결과, 수리매개변수는 DO, BOD, 유기질소, 유기인 모든 항목에 일정 정도의 상대적 기여도를 가지고 있는 것을 알 수 있었다. 이로부터 수질 모형의 적용 시 수리 매개변수 또한 수질 매개변수의 추정 시와 같이 보다 세심한 주의를 기울여 추정할 필요가 있을 것으로 판단된다.변화와 기흉 발생과의 인과관계를 확인하고 좀 더 구체화하기 위한 연구가 필요할 것이다.게 이

  • PDF

Traffic Accidents Analysis on Expressway using Spatial Autoregressive Model (공간자기회귀모형을 이용한 고속도로 교통사고 분석)

  • 강경우
    • Journal of Korean Society of Transportation
    • /
    • v.15 no.1
    • /
    • pp.5-15
    • /
    • 1997
  • 공간통계분석은 공간적으로 연계된 변수들간의 관계를 분석하는 통계분야이다. 일 반적으로 공간적으로 연계된 변수들간의 관계는 각 변수간의 공간적 분포정도에 따라서 영 향을 받는다. 전통적인 통계 분석의 방법은 동질의 자료발생과정에 의하여 확률적으로 축출 된 표본자료를 가정하고 있으나, 공간적인 자료는 이와 같은 동질의 자료발생과정의 가정을 부정한다. 교통류 및 교통사고 등과 같은 교통분야의 자료는 대부분 공간적인 상관관계에 의하여 축출된 이질적인 표본자료이며 따라서 공간상관관계를 동질적으로 가정한 전통적인 통계적 분석 방법은 오류를 범할 수 있다. 본 논문은 공간적인 관계를 고려한 공간자기상관 분석기법을 이용하여 고속도로상의 교통사고에 관하여 분석하였다. 분석의 결과에 의하면 4 개 고속도로 중 경인고속도로를 제외한 3개의 고속도로상의 교통사고건수는 통계적으로 현 저한 양의 공간적 상관관계가 있음을 알 수 있었다. 이에 따라 공간적 상관관계를 고려한 교통사고분석을 위하여 종속변수로 단위구간별 교통사고건수를 그리고 설명변수로서는 단위 구간별 교통량, I.C. 유무 및 화물차량비율을 이용하여 공간 자기회귀분석을 시도하였다. 분 석의 분석에서는 구간별 교통량과 화물차량의 비율이 호남/남해 고속도로의 경우에는 구간 별 교통량과 I.C. 유무가 통계적으로 유의한 것으로 분석되었다.

  • PDF

인공신경망을 이용한 부실기업예측모형 개발에 관한 연구

  • Jung, Yoon;Hwang, Seok-Hae
    • Proceedings of the Korea Database Society Conference
    • /
    • 1999.06a
    • /
    • pp.415-421
    • /
    • 1999
  • Altman의 연구(1965, 1977)나 Beaver의 연구(1986)와 같은 전통적 예측모형은 분석자의 판단에 따른 예측도가 높은 재무비율을 선정하여 다변량판별분석(MDA: multiple discriminant analysis), 로지스틱회귀분석 등과 같은 통계기법을 주로 이용해 왔으나 1980년 후반부터 인공지능 기법인 귀납적 학습방법, 인공신경망모형, 유전모형 둥이 부실기업예측에 응용되기 시작했다. 최근 연구에서는 인공신경망을 활용한 변수 및 모형개발에 관한 보고가 있다. 그러나 지금까지의 연구가 주로 기업의 재무적 비율지표를 고려한 모형에 치중되었으며 정성적 자료인 비재무지표에 대한 검증과 선정이 자의적으로 이루어져온 경향이었다. 또한 너무 많은 입력변수를 사용할 경우 다중공선성 문제를 유발시킬 위험을 내포하고 있다. 본 연구에서는 부실기업예측모형을 수립하기 위하여 정량적 요인인 재무적 지표변수와 정성적요인인 비재무적 지표변수를 모두 고려하였다. 재무적 지표변수는 상관분석 및 요인분석들을 통하여 유의한 변수들을 도출하였으며 비재무적 지표변수는 조직생태학내에서의 조직군내 조직사멸과 관련된 생태적 과정에 대한 요인들 중 조직군 내적요인으로 조직의 연령, 조직의 규모, 조직의 산업밀도를 도출하여 4개의 실험집단으로 분류하여 비재무적 지표변수를 보완하였다. 인공신경망은 다층퍼셉트론(multi-layer perceptrons)과 역방향 학습(back-propagation )알고리듬으로 입력변수와 출력변수, 그리고 하나의 은닉층을 가지는 3층 퍼셉트론(three layer perceptron)을 사용하였으며 은닉충의 노드(node)수는 3개를 사용하였다. 입력변수로 안정성, 활동성, 수익성, 성장성을 나타내는 재무적 지표변수와 조직규모, 조직연령, 그 조직이 속한 산업의 밀도를 비재무적 지표변수로 산정하여 로지스틱회귀 분석과 인공신경망 기법으로 검증하였다. 로지스틱회귀분석 결과에서는 재무적 지표변수 모형의 전체적 예측적중률이 87.50%인 반면에 재무/비재무적 지표모형은 90.18%로서 비재무적 지표변수 사용에 대한 개선의 효과가 나타났다. 표본기업들을 훈련과 시험용으로 구분하여 분석한 결과는 전체적으로 재무/비재무적 지표를 고려한 인공신경망기법의 예측적중률이 높은 것으로 나타났다. 즉, 로지스틱회귀분석의 재무적 지표모형은 훈련, 시험용이 84.45%, 85.10%인 반면, 재무/비재무적 지표모형은 84.45%, 85.08%로서 거의 동일한 예측적중률을 가졌으나 인공신경망기법 분석에서는 재무적 지표모형이 92.23%, 85.10%인 반면, 재무/비재무적 지표모형에서는 91.12%, 88.06%로서 향상된 예측적 중률을 나타내었다.

  • PDF

인공신경망을 이용한 부실기업예측모형 개발에 관한 연구

  • Jung, Yoon;Hwang, Seok-Hae
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 1999.03a
    • /
    • pp.415-421
    • /
    • 1999
  • Altman의 연구(1965, 1977)나 Beaver의 연구(1986)와 같은 전통적 예측모형은 분석자의 판단에 따른 예측도가 높은 재무비율을 선정하여 다변량판별분석(MDA:multiple discriminant analysis), 로지스틱회귀분석 등과 같은 통계기법을 주로 이용해 왔으나 1980년 후반부터 인공지능 기법인 귀납적 학습방법, 인공신경망모형, 유전모형 등이 부실기업예측에 응용되기 시작했다. 최근 연구에서는 인공신경망을 활용한 변수 및 모형개발에 관한 보고가 있다. 그러나 지금까지의 연구가 주로 기업의 재무적 비율지표를 고려한 모형에 치중되었으며 정성적 자료인 비재무지표에 대한 검증과 선정이 자의적으로 이루어져온 경향이었다. 또한 너무 많은 입력변수를 사용할 경우 다중공선성 문제를 유발시킬 위험을 내포하고 있다. 본 연구에서는 부실기업예측모형을 수립하기 위하여 정량적 요인인 재무적 지표변수와 정성적 요인인 비재무적 지표변수를 모두 고려하였다. 재무적 지표변수는 상관분석 및 요인분석들을 통하여 유의한 변수들을 도출하였으며 비재무적 지표변수는 조직생태학내에서의 조직군내 조직사멸과 관련된 생태적 과정에 대한 요인들 중 조직군 내적요인으로 조직의 연령, 조직의 규모, 조직의 산업밀도를 도출하여 4개의 실험집단으로 분류하여 비재무적 지표변수를 보완하였다. 인공신경망은 다층퍼셉트론(multi-layer perceptrons)과 역방향 학습(back-propagation)알고리듬으로 입력변수와 출력변수, 그리고 하나의 은닉층을 가지는 3층 퍼셉트론(three layer perceptron)을 사용하였으며 은닉층의 노드(node)수는 3개를 사용하였다. 입력변수로 안정성, 활동성, 수익성, 성장성을 나타내는 재무적 지표변수와 조직규모, 조직연령, 그 조직이 속한 산업의 밀도를 비재무적 지표변수로 산정하여 로지스틱회귀 분석과 인공신경망 기법으로 검증하였다. 로지스틱회귀분석 결과에서는 재무적 지표변수 모형의 전체적 예측적중률이 87.50%인 반면에 재무/비재무적 지표모형은 90.18%로서 비재무적 지표변수 사용에 대한 개선의 효과가 나타났다. 표본기업들을 훈련과 시험용으로 구분하여 분석한 결과는 전체적으로 재무/비재무적 지표를 고려한 인공신경망기법의 예측적중률이 높은 것으로 나타났다. 즉, 로지스틱회귀 분석의 재무적 지표모형은 훈련, 시험용이 84.45%, 85.10%인 반면, 재무/비재무적 지표모형은 84.45%, 85.08%로서 거의 동일한 예측적중률을 가졌으나 인공신경망기법 분석에서는 재무적 지표모형이 92.23%, 85.10%인 반면, 재무/비재무적 지표모형에서는 91.12%, 88.06%로서 향상된 예측적중률을 나타내었다.

  • PDF

A Study on Selecting Principle Component Variables Using Adaptive Correlation (적응적 상관도를 이용한 주성분 변수 선정에 관한 연구)

  • Ko, Myung-Sook
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.10 no.3
    • /
    • pp.79-84
    • /
    • 2021
  • A feature extraction method capable of reflecting features well while mainaining the properties of data is required in order to process high-dimensional data. The principal component analysis method that converts high-level data into low-dimensional data and express high-dimensional data with fewer variables than the original data is a representative method for feature extraction of data. In this study, we propose a principal component analysis method based on adaptive correlation when selecting principal component variables in principal component analysis for data feature extraction when the data is high-dimensional. The proposed method analyzes the principal components of the data by adaptively reflecting the correlation based on the correlation between the input data. I want to exclude them from the candidate list. It is intended to analyze the principal component hierarchy by the eigen-vector coefficient value, to prevent the selection of the principal component with a low hierarchy, and to minimize the occurrence of data duplication inducing data bias through correlation analysis. Through this, we propose a method of selecting a well-presented principal component variable that represents the characteristics of actual data by reducing the influence of data bias when selecting the principal component variable.