• 제목/요약/키워드: 단계별 변수선택

검색결과 51건 처리시간 0.034초

다중회귀 분석을 이용한 소프트웨어 개발노력추정 (The Estimation of Software Development Effort Using Multiple Regression Method)

  • 정혜정;양해술;신석규;이상운
    • 정보처리학회논문지D
    • /
    • 제11D권7호
    • /
    • pp.1483-1490
    • /
    • 2004
  • 소프트웨어분야에서 성공적인 프로젝트를 완수하기 위해서는 프로젝트를 완수하는데 필요한 개발노력이 정확히 추정되어야 한다. 그러나 이러한 개발노력은 소프트웨어의 크기나 여러 가지 운영환경의 영향으로 인해 프로젝트에 따라서 총 개발 노력의 규모는 차이가 있다. 일반적으로 기존의 연구는 개발노력을 추정하기 위하여 소프트웨어 규모인 기능점수(FP ; Function Point)를 이용하였다. 본 연구를 위해서 1990년대에 개발된 789개의 소프트웨어 개발 프로젝트들에 관련된 데이터를 이용하였다. 실험을 통해서 개발노력에 영향을 미치는 변수를 조사하였다. 또한 변수사이에 선형적인 관계를 조사하기 위하여 다중회귀분석을 실시하였다. 이 경우 전체의 데이터를 이용하는 것이 아니라 프로젝트 인도비율(PDR ; Project Delivery Rate : Hours/FP)을 다단계로 나누어서 각 단계별로 개발노력에 영향을 미치는 변인을 찾아내고 가장 이상적인 회귀식으로 도출하였다.

방화 발생에 영향을 미치는 요인에 관한 연구 (A Study on the Factors Affecting the Arson)

  • 김영철;박우성;이수경
    • 한국화재소방학회논문지
    • /
    • 제28권2호
    • /
    • pp.69-75
    • /
    • 2014
  • 본 연구에서는 방화발생에 영향을 미치는 요인을 도출하기 위하여 발생건수를 종속변수로 하고 경제 인구 사회적 요인을 독립변수로 하는 다중회귀분석을 실시하였다. 다중회귀분석은 선형함수, 준로그함수, 역준로그함수, 이중로그함수 4가지 함수형태에 대해 적용하였으며, 각 단계별로 변수의 선택과 제외를 고려하는 단계적선택 방식을 적용하였다. 다중공선성 문제와 자기상관 문제를 해결하기 위하여 분산확대지수(VIF)와 Durbin-Watson 계수 이용하였으며, 4가지 함수모형에 대하여 수정된 R 제곱(설명력) 값이 0.935 (93.5%)로 가장 값이 높고 통계적으로 유의한 선형함수모형을 최적의 모형으로 결정하고 모형에 대한 해석을 진행하였다. 선형함수모형 결과 방화발생에 영향을 미치는 요인은 범죄발생건수(0.829), 일반이혼율(0.151), 재정자주도(0.149), 소비자물가상승률(0.099) 순으로 도출되었다.

전대수 다항식형 확률강우강도식의 최적차수 결정 및 회귀계수에 대한 유의성 검정 (Determination of optimal order for the full-logged I-D-F polynomial equation and significance test of regression coefficients)

  • 박진희;이재준
    • 한국수자원학회논문집
    • /
    • 제55권10호
    • /
    • pp.775-784
    • /
    • 2022
  • 본 연구에서는 임의지속기간의 확률강우량 산정을 위해 실무에서 주로 사용되고 있는 전대수 다항식형 확률강우강도식의 최적차수 결정을 위하여 경상북도 내 9개 지점을 대상으로 확률강우량을 산정하고 전대수 다항식형 강우강도식의 회귀계수를 추정하였다. 추정된 지점별 다항식을 대상으로 단계선택법을 이용하여 각 지점별 다항식의 최적변수를 선정하고 선정된 변수들의 통계적 유의성을 검토하기 위하여 분산분석을 통한 유의성 검정을 실시하였으며, 이들 결과를 이용하여 각 지점별 통계적으로 적절하게 산정된 강우강도식을 제시하였다. 경북 9개 지점의 전대수 다항식형 강우강도식의 변수선정 결과는 6개 지점에서 1~3차식이 최적식으로 나타났고 1개 지점이 불완전 3차식이 최적식으로 나타났다. 그 중 1차는 Sherman 식, 2차는 General 식의 형태와 유사하므로 독립변수의 수를 증가시켜 적합도를 높이고 사용 편의를 위해 통일된 형태의 강우강도식으로 제시한다면 전대수 다항식형 강우강도식은 3차 회귀식까지만 고려하여도 통계학적으로 문제가 없는 것으로 판단된다.

가구별 소비자료를 이용한 전력수요함수 추정 및 요금제도 변경의 효과 분석 (Electricity Demand and the Impact of Pricing Reform: An Analysis with Household Expenditure Data)

  • 권오상;강혜정;김용건
    • 자원ㆍ환경경제연구
    • /
    • 제23권3호
    • /
    • pp.409-434
    • /
    • 2014
  • 본고는 가구별 전력요금 지출액 자료를 이용해 가정용 전력의 수요함수를 추정하되, 전력요금이 구간별로 달라지는 구조를 명시적으로 반영한다. 기존의 도구변수를 이용한 추정법이나 2변량 이산-연속선택모형 모두 적용에 한계가 있어 본고는 2단계 분석법을 사용하되, 가구특성에 따라 소비구간이 선택되는 과정을 이산선택모형으로 먼저 추정하고, 이어서 각 구간이 선택될 확률의 예측치를 가중치로 이용해 구축된 가격예측치를 사용하여 조건부 전력수요함수를 추정하고 탄력성을 제시한다. 현재의 전력요금제에서는 구간의 수가 너무 많고 구간간 적용요금의 차이도 크다는 비판을 감안하여 구간의 수를 3개로 줄이고 구간 간 요금차이를 조정하되, 전체적으로 전력판매수입은 현재와 달라지지 않도록 하는 모의정책실험을 추정결과를 이용해 실행하면, 전력 다소비 가구의 전력요금이 갑자기 급증하는 현상은 크게 완화할 수 있지만, 대신 낮은 구간의 요금인상이 어느 정도 발생하고 전력 저소비층의 후생감소는 불가피하므로 이에 대한 대책도 필요하다는 결론을 도출한다.

건강기능식품 소비가치와 구매의도의 관계에 대한 건강동기, 건강염려, 식품몰입의 조절효과 (Moderating Effect of Health Motivation, Health Concern and Food Involvement on the Relationship between Consumption Value and Purchasing Intentions of Healthy Functional Food)

  • 차명화;김유경
    • 한국식품영양과학회지
    • /
    • 제37권11호
    • /
    • pp.1435-1442
    • /
    • 2008
  • 본 연구는 건강기능식품 구매의도에 대한 소비가치의 영향력을 파악하고, 이 관계에서 건강동기, 건강염려, 식품몰입과 같은 개인의 개성과 관련된 특성들의 조절효과를 규명하는 것을 목적으로 하였다. 본 연구 결과에 대한 요약은 다음과 같다. 각 측정개념들의 요인분석 결과, 소비가치는 7개의 요인으로 추출되었으며 건강동기, 건강염려, 식품몰입은 각각 1개씩의 요인으로 추출되었다. 각 구성개념들의 신뢰도는 소비가치 중에서 기능적 가치 요인의 경우 .886, 감정적 가치는 .904, 인식적 가치는 .813, 사회적 가치 I는.734, 상황적 가치는 .872, 사회적 가치 II와 III는 각각 .600과 .576이었고, 건강동기의 신뢰도는 .883, 건강염려의 신뢰도는 .834, 식품몰입의 신뢰도는 .883으로 나타나 내적일관성을 확보하였다. 단계적 회귀분석을 통한 소비가치가 건강기능식품의 구매의도에 미치는 영향력 분석에서 사회적 가치(${\beta}=.161$), 감정적 가치(${\beta}=.293$), 기능적 가치(${\beta}=.328$), 인식적 가치(${\beta}=.290$), 상황적 가치(${\beta}=.196$)가 통계적으로 유의한 영향변수들(F=37.582, p<.001)인 것으로 나타났으며, 이 다섯 개의 변수로 이루어진 회귀모형의 설명력은 41.4%였다. 위계적 회귀분석을 통한 조절효과 분석에서 건강염려만이 소비가치 중 사회적 가치 I(SV-I)와 건강기능식품의 구매의도의 관계에서 조절작용이 있는 것으로(F=4.409, p<0.05) 나타났다. 건강기능식품 구매의도에 대해 1단계에 투입된 사회적 가치 I의 $R^2$(.017)와 2단계에 투입된 건강염려 변수의 ${\Delta}R^2$(.025)이 유의적이었으며, 독립변수인 사회적 가치 I와 조절변수인 건강염려와의 상호작용항(SV I * HC)이 투입된 3단계의 ${\Delta}R^2$(.015)도 통계적으로 유의한 것으로 나타났다. 본 연구는 건강기능식품의 구매 및 선택 과정에 대한 소비자 측면의 실증적 연구로서, 이상의 연구결과들은 건강기능식품 구매에 영향을 미치는 변수들을 이용하여 보다 효율적인 건강기능식품 소비자 마케팅 전략 확립에 도움이 될 수 있는 자료를 제공할 수 있다는 점에서 의의가 있다. 또한 식품선택과 관련한 연구영역에서 소비가치 개념의 적용가능성을 확인하였으므로 향후 건강기능식품 및 다양한 식품의 선택 및 구매에 대한 연구에 소비가치 개념이 이용될 수 있을 것이다. 건강염려 변수와 같은 식품관련 개성 특성들이 건강기능식품 구매의도에 조절작용을 갖는 변수임을 확인한 점은 향후 보다 다양한 개성 관련 식품 특성들의 영향력에 대하여 연구할 수 있는 계기로 작용할 것이다. 그리고 본 연구의 결과에서 확립된 회귀모형을 이용하여 실제 건강기능식품 구매 집단과 비구매 집단별 적합성을 향후 연구에서 판별 함수로 검증한다면 본 회귀모형이 보다 정확하게 식품 선택 연구 모형에 적용될 수 있을 것이다. 그러나 본 연구의 지역적 한정성과 연구대상자의 연령층이 대학생으로 제한된 점은 향후 연구에서 보완되어야 할 것이다.

철골조 건물의 탄소배출량 산정을 위한 BIM 라이브러리 구축 (Establishment of CO2 Emission Estimation BIM Library for Steel Structures)

  • 이재철;정종현
    • 한국산학기술학회논문지
    • /
    • 제15권5호
    • /
    • pp.3169-3175
    • /
    • 2014
  • 본 연구에서는 상용 BIM툴에서 기본적으로 제공하는 물량산출 기능을 활용해 탄소배출량을 산정하는 BIM 라이브러리 구축과정을 정립하고 이를 철골조 건물에 적용함으로써 그 타당성을 검증하였다. BIM 라이브러리는 요구되는 부재별 탄소배출계수를 설정한 후 매개변수를 추출하고 Revit Architecture 2013을 활용해 프로젝트 단위 설정, 매개변수 설정, 탄소 배출량 산정식 설정의 절차를 거쳐 구축하였다. 이를 통해 철골부재의 단면종류별 탄소배출계수와 단면크기별 단위무게를 입력해주는 것만으로 별도의 수작업 없이 투입자재량에 따른 탄소배출량을 산정해 낼 수 있음을 확인하였다. 본 연구에서 제시한 BIM 라이브러리 구축과정을 통해 부재별 탄소배출량 산정 라이브러리를 구축함으로써 시공단계의 투입자재량에 따른 탄소배출량을 손쉽게 산정할 수 있으며, 프로젝트 초기 설계단계에서 탄소배출량을 최소화 할 수 있는 설계대안의 선택에 일조함으로써 친환경적 건설사업 수행 및 BIM의 실무적 활용성 향상에 도움을 줄 수 있을 것으로 기대된다.

기상자료를 이용한 마늘 생산량 추정 (Garlic yields estimation using climate data)

  • 최성천;백장선
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권4호
    • /
    • pp.969-977
    • /
    • 2016
  • 야외에서 재배되는 주요 채소류의 생산에 대한 기상변화의 영향력이 점차 커지고 있다. 기상변화로 인한 농작물 생산량의 변화는 공급과 수요의 불안정과 물가안정의 불안요소로 작용하고 있다. 본 논문에서는 패널회귀모형을 이용하여 기상상태에 따른 마늘의 생산량을 추정하였다. 2006년부터 2015년까지의 마늘 주산지 15곳의 10a당 마늘 생산량과 해당 지역의 기상자료를 사용하였다. 7가지 기상요인 (평균기온, 평균최저기온, 평균최고기온, 누적강수량, 누적일조시간, 평균상대습도, 평균지면온도)의 월별 (1월-12월)자료인 총 84개 기상변수중 다중회귀분석 단계선택방법을 통하여 7가지 기상변수를 선택하여 패널회귀모형에 사용하였다. 고정효과 모형과 확률효과 모형을 구분하는 하우스만 검정을 통하여 확률효과 모형으로 분석한 결과 평균최고기온 (1월), 누적강수량 (3월, 10월), 누적일조시간 (4월, 10월)등이 마늘 생산량 추정에 유의한 변수로 나타났다. 또한 연도별로 추정된 생산량 추정값의 추이가 실제 생산량과 동일한 추세를 보이고 있어 제안된 패널 회귀 모형이 잘 적합됨을 확인할 수 있다.

교육용 합성구경레이더 프로세서(eSAR Processor)의 개발과 공개 (Development and Distribution of an Educational Synthetic Aperture Radar(eSAR) Processor)

  • 이훈열
    • 대한원격탐사학회지
    • /
    • 제21권2호
    • /
    • pp.163-171
    • /
    • 2005
  • 합성구경레이더(Synthetic Aperture Radar) 원시 자료(raw data)를 range-Doppler 알고리듬을 이용하여 처리하는 교육용 공개 프로그램을 개발하였다 이 프로그램은 SAR 시스템에 따라 자료처리에 필요한 변수를 자유롭게 조절함으로써, 특정 SAR 시스템에 치우치지 않고 다양한 자료를 처리할 수 있도록 일반화된 알고리듬을 구현하였다. 저가 사양의 컴퓨터에서도 최소 단위의 영상을 선택적으로 처리할 수 있고 자료 처리 중간 단계별로 영상 출력이 가능하기 때문에, 프로그램 작동 상태와 SAR의 원리를 직접 확인할 수 있도록 하였다. 특히 Doppler 변수를 자료 처리 중간 단계의 영상을 보고 직접 구할 수 있도록 고안하여 교육적 효과를 높였다. 또한 자료 처리 알고리듬과 원시프로그램을 모두 공개함으로써, SAR 시스템 원리를 이해하고 응용하는데 도움을 주고자 한다. 이 논문에서는 프로그램의 원리와 작동 환경을 소개하고, ERS-1 원시 자료를 이용한 자료 처리의 예를 보였다.

부산광역권 교통수단선택모형의 정립과 모수추정에 관한 연구 (Model Specification and Estimation Method for Traveler's Mode Choice Behavior in Pusan Metropolitan Area)

  • 김익기;김강수;김형철
    • 대한교통학회지
    • /
    • 제23권3호
    • /
    • pp.7-19
    • /
    • 2005
  • 수단선택모형은 교통 분석 및 수요예측을 위해 필수적 모형이나 그 추정과정이나 실제적인 방법론에 대한 깊이 있는 논의가 우리나라에서는 부족하였다. 1980 년대부터 로짓모형을 이용한 수단선택모형이 광범위하게 이용되고 있지만 기본적인 기초 조사자료 구축에서부터 수단선택 모형설정 및 정산까지 추정과정에 대한 투명하고 상세한 논의가 부족하였다. 그 결과 구축된 교통수단선택모형에 대한 신뢰성이 제기되거나 혹은 구축된 결과를 적용하여 분석에 이용하는데 있어 오류가 발생하는 등 적잖은 부작용도 있었다. 본 논문의 목적은 부산광역권의 통행행태 개별자료를 이용하여 교통수단선택 모형의 정산 및 구축에 대한 상세하고 투명한 제시를 통해 부산광역권 교통정책에 실질적인 적용이 가능한 예측모형을 제시하는 데 있다. 즉 수단선택모형 구축을 위한 조사방법, 변수설정, 모형정산 및 검증 그리고 예측 등의 일련의 과정을 투병하고 명확하게 제시하고, 정책분석에 활용 가능한 모형을 제시함으로써 교통수단선택모형의 구축 방법론 발전에 초석이 되고자 하는 것이 본 연구의 주요 목적이다. 이를 위해, 선택되지 않은 교통수단에 대한 자료가 일반적으로 조사 자료에는 없다는 점을 보완하기 위한 비선택대안의 속성 추정방법을 이 논문에서 제안하였다. 본 논문에서는 1999년 및 2001년 부산울산권의 가구통행실태조사 자료를 활용하여 네스티드 모형구조를 포함하여 총 4개의 모형이 단계별로 구축되었으며 또한 각각 통계적으로 검증되어졌다. 또한 제시된 예측모형의 현실성을 검증하기 위해 효용함수에 의한 시간가치를 계산하여 기존 연구의 시간가치 규모와 비교하였으며, 또한 분류 (classification) 방법에 의한 예측 기법을 이용하여 조사년도의 통행행태를 추정하고 조사 자료와 비교하여 모형의 예측력에 대해서도 검증을 하였다.

패턴인식의 MLP 고속학습 알고리즘 (A Fast-Loaming Algorithm for MLP in Pattern Recognition)

  • 이태승;최호진
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제8권3호
    • /
    • pp.344-355
    • /
    • 2002
  • MLP(multilayer perceptron)는 다른 패턴인식 방법에 비해 여러 가지 훌륭한 특성을 가지고 있어 패턴인식에서 폭넓게 사용되고 있다. 그러나 MLP의 학습에 일반적으로 사용되는 EBP(error backpropagation) 알고리즘은 학습시간이 비교적 오래 걸린다는 단점이 있다. 패턴인식에 사용되는 학습 데이타는 풍부한 중복특성을 내포하고 있으므로 패턴마다 MLP의 내부변수를 갱신하는 온라인 계열의 학습방식이 속도의 향상에 상당한 효과가 있다. 일반적인 온라인 EBP 알고리즘에서는 내부변수 갱신시 고정된 학습률을 적용한다. 고정 학습률을 적절히 선택함으로써 패턴인식 웅용에서 상당한 속도개선을 얻을 수 있지만, 학습률이 고정되고 학습이 진행됨에 따라 학습패턴 영역이 달라지는 학습과정의 각 단계에 효과적으로 대웅하지 못하는 문제가 있다. 이 문제에 대해 본 논문에서는 학습과정을 세 단계로 정의하고, 각 단계별로 필요한 패턴만을 학습에 반영하는 패턴별 가변학습속도 및 학습생략(ILVRS) 방법을 제안한다. ILVRS의 기본개념은 다음과 같다. 학습단계마다 학습에 필요한 패턴의 부분이 달라지므로 이를 구별 하여 학습에 적용할 수 있도록 (1)패턴마다 발생하는 오류치를 적절한 범위 이내로 제한하여 가변 학습률로 사용하고, (2)학습이 진행됨에 따라 불필요한 부분의 패턴을 학습에서 생략한다. 제안한 ILVRS의 성능을 입증하기 위해 본 논문에서는 패턴인식 응용의 한 갈래인 화자증명을 실험하고 그 결과를 제시한다.