• 제목/요약/키워드: 다중 선형회귀분석

검색결과 364건 처리시간 0.023초

기본적인 연관평가기준 전부를 고려한 비선형 회귀모형에 의한 연관성 규칙 수의 결정 (Non-linear regression model considering all association thresholds for decision of association rule numbers)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권2호
    • /
    • pp.267-275
    • /
    • 2013
  • 데이터 마이닝 기법들 중에서도 연관성 규칙은 가장 최근에 개발된 기법으로 대용량 데이터베이스에서 각 항목들 간의 관련성을 찾아내며, 두 항목간의 관계를 명확히 수치화함으로써 두 개 이상의 항목간의 관련성을 표시하여 주기 때문에 현장에서 직접 적용이 가능하다. 일반적으로 연관성 규칙 생성 여부를 판단할 때, 각 항목간의 연관성을 반영하는 기준인 지지도, 신뢰도, 향상도 등의 흥미도 측도를 활용하게 된다. 실제적으로 연관성 규칙의 수를 결정하기 위해서는 이들 흥미도 측도들의 평가기준을 정하기 위해 반복적으로 조정 과정을 거쳐야 한다. 본 논문에서는 이러한 문제를 해결하기 위해 연관성 평가기준 모두를 일반적으로 많이 활용되고 있는 비선형 회귀모형에 적용하여 연관성 규칙의 수를 추정하는 방안을 강구하였다. 또한 분산팽창계수를 이용하여 다중공선성 문제를 진단하는 동시에 분산분석 결과와 수정 결정계수를 이용하여 각 모형의 기여도를 비교하여 가장 바람직한 회귀 모형을 구하였다.

다중 선형 모형에서 식별된 다중 이상점과 다중 지렛점의 재확인 방법에 대한 연구 (A Confirmation of Identified Multiple Outliers and Leverage Points in Linear Model)

  • 유종영;안기수
    • 응용통계연구
    • /
    • 제15권2호
    • /
    • pp.269-279
    • /
    • 2002
  • 다중 이상점 과 다중 지렛점의 식별은 가장효과(masking effect)와 편승효과(swamping effect)에 영향을 받으므로 어려움이 존재한다. Rousseeuw와 van Zomeren(1990)은 LMS (Least Median of Squares) 회귀방법과 MVE(Minimum Volume Ellipsoid) 통계량을 이용하여 다중 이상점과 다중 지렛점을 식별하였다. 그러나 이들의 방법은 LMS와 MVE의 강한 로버스트성으로 인하여 이상점과 지렛점이 아닌 점들도 이상점과 지렛점으로 식별하는 경향이 있다. Fung(1993)은 식별된 이상점과 지렛점들에 대하여 재확인방법을 제안하였는데 이 방법은 인근효과(adjacent effect)에 영향을 받아 이상점과 지렛점을 식별하는데 문제가 있는 것으로 분석되었다. 본 논문은 이러한 문제점을 지적하고 새로운 방법을 제안하여 식별된 이상점과 지렛점을 재확인하고자 한다.

지하철 마모 데이터 회귀분석을 통한 궤도 수명 평가 (Evaluation of the Railroad Track Life Cycle Based on the Metro Rail Wear Data Regression Analysis)

  • 정민철;김정훈;이지하;강윤석;공정식
    • 한국구조물진단유지관리공학회 논문집
    • /
    • 제14권4호
    • /
    • pp.86-93
    • /
    • 2010
  • 레일마모는 열차의 주행안전 및 승차감에 미치는 영향이 크고, 소음 진동의 주요원인으로 작용한다. 또한 레일마모가 발생할 경우 궤도구조의 파괴를 촉진시킴으로써 차량 및 궤도유지보수비를 크게 증가시킨다. 따라서 현장에서 발생하는 마모 원인을 체계적으로 분석함으로써 마모를 저감할 수 있도록 차량운행 조건과 선로선형 및 궤도구조를 설계하는 것은 중요한 과제이다. 본 연구에서는 궤도의 효율적인 유지관리를 위해 궤도를 구성하고 있는 레일, 체결구, 침목, 도상 등의 요소를 고려하여 레일 궤도의 생애주기 거동 및 유지관리 특성을 분석하였다. 또한 축적된 진단/검측 데이터로부터 궤도 구성품의 건전도를 평가할 수 있는 방법을 정립하고 잔존수명을 예측하여 효율적 유지관리를 실현할 수 있는 기법 개발을 위하여 지하철 레일단면마모데이터를 이용한 구간 특성에 따른 시간-마모량의 확률적 분포 변화와 다중회귀 분석을 수행하였다.

단일기준국 기반 DGNSS 측위 결과와의 비교를 통한 가상기준국 기반 DGNSS 측위 정확도 분석

  • 김군택;김혜인;박관동
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2011년도 춘계학술대회
    • /
    • pp.321-322
    • /
    • 2011
  • DGNSS 서비스는 보정정보를 제공하는 기준국과 측량지점 간의 기선거리가 멀어질수록 정확도가 저하되는 문제가 있다. 이를 해결하기 위해서는 다수의 기준국을 설치하는 방법이 있지만, 기준국 설치 시 많은 비용이 소요되기 때문에 비효율적이다. 이러한 문제는 기존의 기준국들로 기준망을 구성하고 보간을 통해 측량지점의 보정정보를 생성하는 가상기준국 기반의 방법을 적용함으로써 해결할 수 있다. 이 연구에서는 국토해양부 위성항법중앙사무소에서 운영하는 DGNSS 서비스를 이용하여 가상기준국의 보정정보 생성 알고리즘을 구현하였으며 단일기준국 기반의 DGNSS 측위의 정확도를 평가하여 가상기준국 기반의 DGNSS 측위의 효용성을 검증하였다.

  • PDF

다중 회귀 모델을 이용한 전주시 보행 환경 점수 예측에 관한 연구 (A Study on the Walkability Scores in Jeonju City Using Multiple Regression Models)

  • 이기춘;남광우;이창우
    • 한국산업정보학회논문지
    • /
    • 제27권4호
    • /
    • pp.1-10
    • /
    • 2022
  • 컴퓨터 비전을 활용하여 인간의 시각을 해석하려는 시도가 다양한 분야에서 발전되어 왔다. 본 논문에서는 도로영상으로부터 영상의 의미론적 분할 결과를 통해 보행 환경을 평가하는 방법을 제안한다. 먼저 도로영상을 수집하기 위해 카카오 지도 API를 활용하였으며 전주시지역의 약 5만 점에서 4방향 영상을 수집한다. 수집된 영상의 20%는 크라우드 소싱기반 쌍체 비교를 통해 데이터 셋을 구축하고, 쌍체 비교 데이터를 이용하여 다양한 회귀 모델을 훈련한다. 영상 데이터의 보행성 점수를 도출하기 위해 순위 알고리즘인 Trueskill 알고리즘을 활용하여 랭킹 점수를 계산하고, 구축된 데이터를 활용하여 다양한 회귀모델을 사용한 보행성 평가 및 분석 작업을 수행한다. 본 연구를 통해 사람의 시각이 아닌 픽셀 분포 분류 정보 간의 상관관계를 통해 컴퓨터 시스템만으로 전주시의 보행 환경을 평가하고 점수를 도출해 낼 수 있다는 것을 보여준다.

배 '신고'의 만개일 및 생육기 기상을 이용한 수확일 예측 (Predicting Harvest Date of 'Niitaka' Pear by Using Full Bloom Date and Growing Season Weather)

  • 한점화;손인창;최인명;김승희;조정건;윤석규;김호철;김태춘
    • 원예과학기술지
    • /
    • 제29권6호
    • /
    • pp.549-554
    • /
    • 2011
  • 나주지역에서 '신고' 배나무의 만개일 및 생육기 기상이 수확일에 미치는 영향을 분석하고 과실 생육일수를 추정할 수 있는 다중 직선회귀 모델을 도출하였다. 만개일이 빠른 해일수록 수확일이 빨라지는 경향이었지만 과실 생육일수는 길어지는 경향이었다. 과실 생육기의 $0^{\circ}C$ 기준 일평균기온과 일최고기온의 생육온도일수와 변이계수는 3,565와 2.9% 및 4,463과 2.5%로 해에 따른 편차가 적었다. 과실 생육일수와 생육기의 월별 일평균기온 및 일최고기온의 생육온도 일수와는 관련성이 낮았지만, 만개후 생육일수별 기상요인과는 관련성이 높게 나왔다. 특히 만개후 1-60일과 31-60일까지의 일평균기온 및 일최고기온의 생육온도 일수와는 높은 부(-)의 상관을 나타내었다. 만개일과 만개 후 1일부터 60일까지의 일평균기온 및 일최고기온의 생육온도 일수를 독립변수로 하여 과실 생육일수를 추정하는 다중 선형회귀식으로 0.7212의 높은 결정계수 값을 얻었다. 따라서 나주지역에서 배 '신고'의 과실 생육일수를 다중 직선회귀 모델식에 의해 72%의 정확도로 추정할 수 있다.

회귀분석을 통한 토양 내 Pyr 농도로부터 BaP와 총 PAH의 예측기법 (Prediction of BaP and Total PAH in Soil from Pyr Concentration using Regression Analysis)

  • 이우범;김종오
    • 대한환경공학회지
    • /
    • 제39권3호
    • /
    • pp.118-123
    • /
    • 2017
  • 본 연구에서는 기존에 발표된 PAH 데이터 세트를 이용하여 BaP와 총 PAH의 예측을 위하여 통계적 분석을 시행하였다. 선형회귀 및 다중회귀 분석 결과, Pyr과 BaP ($R^2=0.94$), Pyr과 ${\Sigma}PAH$ ($R^2=0.99$) 사이에 매우 높은 상관성을 보여주었다. 개발된 회귀식을 이용하여 다른 PAH 측정값과 비교하기 위하여 검증과 적용 연구를 시도한 경우, 예측한 PAH 농도는 서로 유사하였다. 통계적 분석을 통해서 Pyr과 BaP가 서로 상관성이 높은 것으로 조사되어 이들 화합물 모두 연소기원 형태로 분류 할 수 있을 것으로 여겨진다. 비록 BaP나 ${\Sigma}PAH$ 예측에 어느 정도가 한계가 있을 수 있으나 개발된 회귀식을 이용할 경우 추가적인 측정 없이 PAH를 빠르게 대략적인 값을 계산 할 수 있는 장점이 있다.

항공 LiDAR 자료를 이용한 산림재적추정 모델 개발 - 봉화군 춘양면 애당리 혼효림을 대상으로 - (Development of Forest Volume Estimation Model Using Airborne LiDAR Data - A Case Study of Mixed Forest in Aedang-ri, Chunyang-myeon, Bonghwa-gun -)

  • 조승완;김용구;박주원
    • 한국지리정보학회지
    • /
    • 제20권3호
    • /
    • pp.181-194
    • /
    • 2017
  • 본 연구의 목적은 산림재적 현장자료와 항공 LiDAR 자료 기반의 산림재적 추정을 위한 회귀모델의 개발이다. 추정 모델은 경상북도 봉화군 지역에서 임의추출법에 의해 선정된 30개의 원형 표본지로부터 산출한 표본지별 산림재적을 반응변수로 하고, 항공 LiDAR 원자료로부터 개별 표본지의 고도분포 백분위수(Height Percentiles, HP) 및 층위 단위 점 개체수 백분율(Height Bin, HB)을 추출하여 예측변수로 사용하여 구성하였다. 단순선형회귀분석, 이차 다항회귀분석 및 단계적 회귀분석 방법을 이용한 다중회귀분석을 실시하여 적합모델들의 후보들을 도출하였으며, 검증을 위하여 각 모델별로 교차 타당성 검증을 실시하여 PRESS 통계치를 구하였다. 모델의 $R^2$ 및 PRESS을 비교하여 적합성을 검토한 결과, $HB_{5-10}$, $HB_{15-20}$, $HB_{20-25}$, $HBgt_{25}$의 다중회귀모델의 $R^2$이 0.509로 가장 높고, $HP_{25}$ 단순회귀모델의 PRESS 값이 122.352으로 가장 낮은 것으로 나타났다. 수직구조가 복잡한 우리나라 산림재적을 추정하는 모델로는 다양한 수직적 정보를 포함하고 있는 $HB_{5-10}$, $HB_{15-20}$, $HB_{20-25}$, $HBgt_{25}$이 상대적으로 보다 적합하다고 사료된다.

DGNSS 기준국 네트워크를 활용한 가상기준국 보정정보 생성 알고리즘에 관한 연구 (A Study on the PRC Generation Algorithms for Virtual Reference Stations Using a Network of DGNSS Reference Stations)

  • 김혜인;박관동
    • 한국측량학회지
    • /
    • 제29권3호
    • /
    • pp.221-228
    • /
    • 2011
  • 국토해양부에서는 DGNSS 서비스의 광역화 및 상용화를 위하여 지상파 DMB를 이용한 가상기준국 기반 DGNSS 서비스를 개발하고 있다. 이 연구에서는 국토해양부에서 개발중인 시스템에 적용할 수 있는 총 세 개의 가상기준국 기반 DGNSS 보정정보 생성 알고리즘을 규현하고 각 알고리즘 적용에 따른 측위정확도 비교를 통해 개발된 알고리즘의 성능을 검증하였다. 가상기준국 기반 DGNSS 보정정보 생성 알고리즘은 역거리 가중법, 1 2차 다중 선형회귀분석법으로 각각 구현되었으며 기준망 구성을 위한 기준국 개수와 알고리즘 종류에 따른 측위정확도를 비교하였다. 그 결과 6개 기준국을 이용하는 경우보다 16개 기준국을 이용할 때 측위정확도가 향상되었으며, 다중 선형회귀분석법을 이용하는 경우가 높은 정확도를 나타냈다. 또한 가상기준국 기반의 DGNSS 측위결과가 단일기준국 기반의 DGNSS 측위결과보다 수평정확도 약 20-23%, 수직정확도 약 20-36% 향상되는 것을 확인하였다.

내재된 인자회귀모형의 베이지안 분석법 (Bayesian analysis of latent factor regression model)

  • 경민정
    • 응용통계연구
    • /
    • 제33권4호
    • /
    • pp.365-377
    • /
    • 2020
  • 선형모형에서 두개 이상의 설명변수들 사이에 존재하는 다중공선성 문제를 변수들 간에 내재되어 있는 공통의 구조인 인자를 구성하고, 인자들을 회귀변수로 사용하여 해결하는 인자회귀모형에 대하여 논의한다. 무한개로 가정 가능한 내재된 인자 중 유의미한 인자적재행렬을 구성하기 위하여 벌점모수의 값이 큰 LASSO 사전분포를 적용하는 베이지안 추정법을 사용한다. 결정된 인자적재행렬과 다른 모수들의 추정값을 각 설명변수의 선형모수로 역변환 하여, 새로운 관측값에 대한 예측 모형으로도 사용한다. 제안한 방법을 제품 서비스 관리 자료에 적용하여 정해진 인자의 개수에 대한 인자가 일반적인 공통인자회귀모형과 동일한 결과를 나타냄을 확인하였고, 일반적인 공통인자회귀모형과 비교를 위해 계산한 평균 제곱 오차값이 더 작다는 것을 알 수 있었다.