• 제목/요약/키워드: 표준화 회귀모형

검색결과 44건 처리시간 0.031초

연관성 규칙 수의 추정을 위한 일반적인 비선형 회귀모형에서의 표준화 향상도 활용 방안 (Generally non-linear regression model containing standardized lift for association number estimation)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권3호
    • /
    • pp.629-638
    • /
    • 2016
  • 최근에 많이 활용되고 있는 데이터 분석을 위한 연관성 규칙 마이닝은 대용량 데이터베이스에 많이 활용되고 있는 서 두 항목간의 관계를 측도화 함으로써 두 개 이상의 항목간의 관련성을 표시하여 주는 기법이다. 연관성 규칙의 여부를 판단하기 위한 연관성 평가 기준에는 지지도, 신뢰도, 그리고 향상도 등이 있으며, 이들 세 가지 기준을 이용하여 연관성 규칙 생성 여부를 판단하게 된다. 이에 대한 기존의 연구 결과는 결정함수를 이용하는 방법과 회귀모형을 이용하는 방법으로 분류할 수 있다. 회귀모형을 이용하여 수행한 연구에는 지지도와 신뢰도에 의한 모형, 세 가지 평가 기준의 쌍에 의한 모형, 표준화 향상도를 포함한 세 가지 평가 기준의 쌍에 의한 모형, 그리고 세 가지 평가 기준 전부를 고려한 모형 등이 있다. 본 논문에서는 기존의 연구를 확장하는 의미에서 표준화 향상도를 포함한 세가지 평가 기준 전부를 고려한 비선형 회귀모형을 이용하여 연관성 규칙의 수를 추정하는 방안에 대해 강구하고자 한다. 또한 분산분석에서의 F 통계량과 수정 결정계수를 이용하여 각 모형의 유의한 정도를 비교하는 동시에 분산팽창계수에 의한 공선성 문제를 진단함으로써 가장 유용한 회귀 모형을 탐색하고자 한다.

다중회귀에서 회귀계수 추정량의 특성 (Comments on the regression coefficients)

  • 강명욱
    • 응용통계연구
    • /
    • 제34권4호
    • /
    • pp.589-597
    • /
    • 2021
  • 단순회귀와 다중회귀에서 회귀계수의 의미는 차이가 있고 회귀계수의 추정값은 같지 않을 뿐 아니라 그 부호가 서로 다른 경우도 발생한다. 회귀모형에서 설명변수의 상대적 기여도의 파악은 회귀분석의 수행의 중요한 부분이다. 표준화 회귀모형에서 표준화 회귀계수는 해당 설명변수를 제외한 나머지 설명변수의 값이 고정되어있는 상황에서 설명변수가 표준편차만큼 증가하였을 때 반응변수가 표준편차를 기준으로 얼마나 변화했는가로 해석할 수 있지만 표준화 회귀계수의 크기가 각 설명변수의 상대적 중요도를 나타내는 척도라고 할 수 없음은 잘 알려져 있다. 본 논문에서는 다중회귀에서 회귀계수의 추정량을 상관계수와 결정계수의 함수로 나타내고 이를 추가적인 설명력과 추가적인 결정계수의 관점에서 생각해 본다. 또한 다양한 산점도에서의 상관계수와 회귀계수 추정값의 관계를 알아보고 설명변수가 두 개인 경우에 구체적으로 적용해 본다.

기업의 표준화활동 결정요인: 우리나라 제조기업에 대한 실증연구

  • 성태경
    • 기술경영경제학회:학술대회논문집
    • /
    • 기술경영경제학회 2009년도 동계학술발표회
    • /
    • pp.333-353
    • /
    • 2009
  • 본 연구에서는 기술표준원이 (주)코리아데이터네트워크에 의뢰하여 작성된 설문조사결과를 활용하여 기업의 표준화활동 결정요인을 분석하였다. 표준화활동을 유형(혹은 범주)에 따라 기업의 전사적 표준경영, 국내표준화활동, 국제표준화활동, 인증획득 등으로 구분하였고, 그 결정요인으로 기술혁신활동(R&D와 특허출원), 기업규모, 수출, 네트워크, 기업조직특성, 산업별 특성 등을 고려하였다. 분석된 표본은 제조업에 속한 636개 기업으로 정성적 분석방법인 로지스틱 회귀모형 (logistic regression)을 사용하였다. 분석결과, 첫째 기술혁신활동 변수 중 R&D집약도는 국제표준화활동을 제외하고 표준화활동에 영향을 미치지 않는 것으로 나타났다. 둘째, 특허출원은 전사적 차원에서의 표준경영과 인증획득활동에 대해 정 (+)의 유의한 효과를 보여 주었다. 셋째, 소기업과 대기업보다는 중간규모의 기업에서 전사적 차원에서의 표준경영과 인증획득활동이 활발하다는 역U자 가설이 성립하는 것으로 분석되었다. 넷째, 표준화에 대한 경영진의 관심은 모든 표준화활동의 유형에 대해서 중요한 결정요인으로 나타났다.

  • PDF

Support Vector Regression을 이용한 이상치 데이터분석 (An Outlier Data Analysis using Support Vector Regression)

  • 전성해
    • 한국지능시스템학회논문지
    • /
    • 제18권6호
    • /
    • pp.876-880
    • /
    • 2008
  • 주어진 데이터에서 대부분의 다른 관측치들에 비해 지나치게 크거나 작은 관측치를 이상치라고 한다. 이상치는 몇 가지 원인에 의해 발생한다. 이상치를 포함한 데이터의 분석결과는 이 값을 포함하지 않은 경우와 크게 달라질 수 있다. 일반적으로 이상치는 탐지를 통하여 찾아내어 제거한 후에 데이터분석을 수행한다. 하지만 사기탐지, 네트워크 침입 등의 데이터 마이닝 분야에서는 이상치가 중요한 정보를 포함하고 있기 때문에 반드시 포함하여 데이터분석을 수행하여야 한다. 본 논문에서 다루는 회귀모형에서는 기존의 단순, 다중 회귀분석은 이상치에 대하여 안정된 모형을 구축하기 어렵기 때문에 표준화 잔차 또는 스튜던트화된 잔차를 이용하여 이상치를 찾아내고 제거한 후의 데이터분석 수행을 추천한다. 본 논문에서는 회귀모형에서 이상치를 포함하여 효과적으로 데이터분석을 수행할 수 있는 한 방법으로 Vapnik이 제안한 통계적 학습이론에 기반한 Support Vector Regression(SVR)을 이용하였다 인공 데이터를 생성한 모의실험 결과 기존의 회귀모형에 비해 SVR의 향상된 결과를 확인할 수 있었다.

헤지의 표준화된 평균차를 이용한 프로폴리스의 항-당뇨 효과 (The anti-diabetic effect of propolis using Hedges' standardized mean difference)

  • 김미진;최기헌
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권3호
    • /
    • pp.447-459
    • /
    • 2010
  • 본 연구는 메타분석에서 헤지의 표준화된 평균차를 이용하여 당뇨에 걸린 쥐들에게 프로폴리스를 투여하여 체중, 혈당량, 콜레스테롤, 트리글리세리드의 평균비교를 통해 프로폴리스의 항-당뇨 효과에 대해 알아보았다. 고정효과모형을 적용시킨 결과 혈당량의 감소, 콜레스테롤 농도의 감소, 트리글리세리드 농도의 감소에 대해 유의한 효과를 보였고, 동질성 검정을 통해 동질성을 만족하지 않은 모든 변수에 대해 랜덤효과모형을 적용시킨 결과 혈당량의 감소와 트리글리세리드 농도의 감소에 대해 유의한 효과를 나타냈다. 또한 프로폴리스의 투여기간과 투여량에 대해 메타회귀분석을 실시한 결과, 투여기간이 체중, 혈당량, 콜레스테롤에 유의한 변수로 나타났다.

녹차의 항-당뇨 효과에 대한 메타회귀분석 (Meta-regression analysis for anti-diabetic effect of green tea)

  • 윤아름;최기헌
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권4호
    • /
    • pp.717-726
    • /
    • 2011
  • 본 연구는 메타분석을 이용하여 녹차를 투여한 당뇨 유발 쥐들의 체중과 혈액 내 혈당량, 총 콜레스테롤, 중성지방, 고농도지단백 콜레스테롤의 평균비교를 통해 녹차의 항-당뇨 효과에 대해 알아보고자 한다. 헤지의 표준화된 평균차에서 고정효과모형을 적용한 결과 체중은 통계적으로 유의한 증가를 보였으며, 혈액 내 혈당량과 중성지방은 통계적으로 유의한 감소를 보였다. 동질성 검정을 통해 이질성을 보인 모든 변수에 대해 랜덤효과모형을 적용시킨 결과 체중은 유의한 증가를 보였으며, 혈액 내 혈당량은 유의한 감소를 보였다. 또한 녹차의 투여기간이 변수에 영향을 미치는지 알아보기 위해 메타회귀분석을 실시한 결과 모든 변수에 대해 녹차의 투여기간이 유의하지 않았다.

기업의 표준화활동 결정요인 : 우리나라 서비스기업에 대한 실증연구 (Determinants of Firms' Standardization Activity: Evidence from the Korean Service Firms)

  • 성태경
    • 경영과정보연구
    • /
    • 제28권2호
    • /
    • pp.95-112
    • /
    • 2009
  • 본 연구에서는 우리나라 서비스기업에 있어서 표준화활동 결정요인을 분석하였다. 표준화활동을 유형(혹은 범주)에 따라 기업의 전사적 표준경영, 국내표준화활동, 국제표준화활동 등으로 구분하였고, 그 결정요인으로 기술혁신활동(R&D와 특허출원), 기업규모, 수출, 네트워크(산업특성), 기업조직특성 등을 고려하였다. 분석된 표본은 서비스업에 속한 102개 기업으로 정성적 분석방법인 로지스틱 회귀모형(logistic regression)을 사용하였다. 분석결과는 다음과 같다, 첫째, R&D집약도는 전사적 차원에서의 표준경영과 국내표준화활동에는 영향을 미치지 않지만, 국제표준화활동에는 정(+)의 영향을 미치는 것으로 나타났다. 이는 우리나라 서비스기업들이 국제적 표준화과정에의 참여를 기술이전의 수단으로 활용하는 경향이 있기 때문인 것으로 해석하였다. 둘째, 특허출원은 전사적 차원에서의 표준경영에 부(-)의 유의한 효과를 보여 주었다. 즉 특허활동이 활발한 서비스기업일수록 표준화를 기술혁신의 관점에서 중시하지 않고, 자사 기술정보의 유출이나 특허침해의 요인으로 간주하는 현상을 발견하였다. 셋째, 기업규모변수는 서비스기업의 경우 표준화 활동과 연관이 없는 것으로 나타났다. 넷째, 표준화에 대한 경영진의 관심은 표준화활동의 유형에 관계없이 표준화활동의 중요한 결정요인으로 분석되었다.

  • PDF

주성분회귀분석을 이용한 한국프로야구 순위 (Predicting Korea Pro-Baseball Rankings by Principal Component Regression Analysis)

  • 배재영;이진목;이제영
    • Communications for Statistical Applications and Methods
    • /
    • 제19권3호
    • /
    • pp.367-379
    • /
    • 2012
  • 야구경기에서 순위를 예측하는 것은 야구팬들에게 관심의 대상이 된다. 이러한 순위를 예측하기 위해서 2011년 한국프로야구 기록 자료를 바탕으로 산술평균방법, 가중평균방법, 주성분분석방법, 주성분회귀분석 방법을 제시한다. 표준화를 통한 산술평균, 상관계수를 이용한 가중평균과 주성분 분석을 이용해서 순위를 예측하고, 최종모형으로 주성분회귀분석 모형이 선택되었다. 주성분 분석으로 축약된 변수를 이용해서 회귀분석을 실시하여, 투수부분, 타자부분, 투수와 타자부분의 순위예측 모형을 제안한다. 예측된 회귀모형을 통해서 2012년도 순위 예측이 가능하다.

우리나라 제조기업의 표준화활동 결정요인 (The Determinants of Firms' Standardization Activity: Evidence from the Korean Manufacturing Industry)

  • 성태경
    • 기술혁신학회지
    • /
    • 제12권3호
    • /
    • pp.564-581
    • /
    • 2009
  • 본 연구에서는 기술표준원이 (주)코리아데이터네트워크에 의뢰하여 작성된 설문조사결과를 활용하여 기업의 표준화활동 결정요인을 분석하였다. 표준화활동을 유형(혹은 범주)에 따라 기업의 전사적 표준경영, 인증획득, 국내표준활용, 국제표준활용 등으로 구분하였고, 그 결정요인으로 기술혁신활동(R&D와 특허출원), 기업규모, 수출, 네트워크(산업특성), 기업조직특성 등을 고려하였다. 분석된 표본은 제조업에 속한 636개 기업으로 정성적 분석방법인 로지스틱 회귀모형(logistic regression)을 사용하였다. 분석결과, 첫째 기술혁신활동 변수 중 R&D집약도는 국제표준활용을 제외하고 표준화활동에 영향을 미치지 않는 것으로 나타났다. 둘째, 특허출원은 전사적 차원에서의 표준경영과 인증획득활동에 대해 정(+)의 유의한 효과를 보여 주었다. 셋째, 상대적으로 소기업과 대기업보다는 중간규모의 기업에서 전사적 차원에서의 표준경영자 인증획득활동이 활발하다는 역U자 가설이 성립하는 것으로 분석되었다. 넷째, 표준화에 대한 경영진의 관심은 모든 표준화활동의 유형에 대해서 중요한 결정요인으로 나타났다.

  • PDF

농업용수의 공급 및 이용을 고려한 유역 물수지 모형 개발 (Development of Water Balance Model for Agricultural Watershed Considering on Water Supply and Use)

  • 윤동현;남원호;신지현;이광야
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.513-513
    • /
    • 2022
  • 국가물관리기본법에 의거하여 통합물관리 정책에 부합하는 농어촌용수 계획 및 관리 요구에 따른 유역 및 용수구역 단위의 물관리 필요하며, 국가수자원계획의 물수급 정책 수립시 농업용수의 공급, 이용 및 관리 특성 고려되어야 한다. 현재 농업용수는 개수로 방식 용수공급체계 및 수문 직접조작에 의한 용수배분체계로 공급량 대비 사용량(벼의 생육에 사용된 수량)의 비율이 48%에 불과하고, 농경지 상류와 하류의 공급량 차이가 크게 발생하며, 경지면적 감소가 공급 필요량 감소로 연결되지 않는다. 현재 국가유역수자원모델 (K-WEAP, K-MODSIM)은 모델이 가진 분석 능력의 한계로 인하여 농업용수 물수급 해석에 왜곡이 발생하기 때문에, 농업용수 특성이 반영된 농업용수 수요·공급 표준화 모형이 필요하다. 본 연구에서는 기존 유역물수지모델 현황 및 농업용수 적용의 한계점을 파악하고, 농업용수의 공급 및 이용을 고려한 유역 물수지 모형 개발을 목표로 한다. 기존 농업용수 물수지 분석은 순물소모량 개념 적용에 따른 회귀수량 획일화와 이에 따른 공급량 왜곡, 유역내 복잡하고 다양한 농업용수 공급체계를 하나의 가상저수지로 단순화 함으로서 유역내 들녘별 농업용수 과부족 분석 불가능, 하천과 저수지 공급 우선순위 현장과 불일치, 노후된 기초자료 등의 한계가 존재하며, 이를 위한 개선방안을 도출하고자 한다. 또한, 농업용수 회귀수량의 경우 실측기반의 회귀수량 산정 방법을 제시하고자 하며, 단일 수원공 및 복합 수원공의농업용수 물수지 분석 방법을 개발하고자 한다. 본 연구의 목적은 농업용수 물수급 특성이 국가수자원계획에 반영할 수 있도록 기본 수자원모델(K-MODSIM)과 연계가능한 농업용수 표준 모형개발로써, 향후 국가수자원계획(국가물관리기본계획, 전국하천유역수자원관리계획, 농어촌용수이용 합리화계획 등) 수립에 반영될 수 있을 것으로 판단된다.

  • PDF