• 제목/요약/키워드: 중회귀분석모형

검색결과 840건 처리시간 0.032초

내재된 인자회귀모형의 베이지안 분석법 (Bayesian analysis of latent factor regression model)

  • 경민정
    • 응용통계연구
    • /
    • 제33권4호
    • /
    • pp.365-377
    • /
    • 2020
  • 선형모형에서 두개 이상의 설명변수들 사이에 존재하는 다중공선성 문제를 변수들 간에 내재되어 있는 공통의 구조인 인자를 구성하고, 인자들을 회귀변수로 사용하여 해결하는 인자회귀모형에 대하여 논의한다. 무한개로 가정 가능한 내재된 인자 중 유의미한 인자적재행렬을 구성하기 위하여 벌점모수의 값이 큰 LASSO 사전분포를 적용하는 베이지안 추정법을 사용한다. 결정된 인자적재행렬과 다른 모수들의 추정값을 각 설명변수의 선형모수로 역변환 하여, 새로운 관측값에 대한 예측 모형으로도 사용한다. 제안한 방법을 제품 서비스 관리 자료에 적용하여 정해진 인자의 개수에 대한 인자가 일반적인 공통인자회귀모형과 동일한 결과를 나타냄을 확인하였고, 일반적인 공통인자회귀모형과 비교를 위해 계산한 평균 제곱 오차값이 더 작다는 것을 알 수 있었다.

수문요소를 활용한 감염병 발생모의 연구 (Assessment of Malaria Incidence using Hydroclimatic factor)

  • 곽재원;박정술;이영곤;김태형;최규현
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2016년도 학술발표회
    • /
    • pp.432-432
    • /
    • 2016
  • 말라리아는 Plasmodium 속 원충으로 인하여 적혈구와 간 세포내에 발병하는 감염병으로, 매년 약 3-5억의 발병과 100만 명 이상의 사망자로 인하여 세계보건기구(WHO)가 선정한 6대 열대병 중에서도 가장 중요한 질환으로 고려되고 있다. 우리나라에서도 법정전염병 제3군으로 지정된 중요한 감염병이다. 국내에서는 지난 2000년 이후 감소 추세를 보이던 국내 말라리아 환자발생(현역 군인 포함)이 2005년 1,324명, 2006년 2,021명, 2007년 2,192명으로 2007년 국내 말라리아 환자는 전년대비 8.5%의 증가를 보이고 있다. 일반적으로, 매개체를 통한 감염병은 생태계 내에서의 상호 작용에 영향을 받기 때문 기후 인자와도 큰 영향을 받는 것으로 알려져 있다. 특히, 모기 매개 질병은 기후의 영향을 크게 받으며, 기온, 강수량, 습도 등의 수문기상 요소가 중요한 영향을 미치며, 그 중에서도 말라리아는 매개체에 의한 전염병 중 가장 중요하게 다루어지는 전염병인 동시에 기후변화에 가장 민감한 질병이다. 이 때문에 말리리아와 기후 인자 및 기후변화를 연관 지으려는 연구가 다수 수행되어 왔으며, 특히 최근에는 습지와 기후 인자와 말라리아의 상관관계를 분석하는 등의 다각적인 분석도 이루어지고 있다. 또한, 최근에 기후변화가 현실적인 문제로서 부각되면서 말라리아의 발생 문제에 대한 연구도 다각적으로 수행되고 있다. 본 연구에서는 기후 인자 및 기후변화와 상관성이 높은 감염병 중에서 국내 발병자 수가 많아서 분석이 용이한 말라리아를 주요한 감염병으로 선정하고, 말라리아의 발생과 기후 인자와의 상관관계를 살펴보고, 이를 바탕으로 기후 인자에 따른 말라리아의 발생을 모의할 수 있는 모형을 구축하고, 실제 적용성을 검증하였다. 이를 위하여 2001년부터 2011년까지의 월간 말라리아 감염병 발생 현황과 전국 기상대의 기후인자를 수집하였다. 말라리아와의 상관 분석을 위해서 포함된 기후인자는 평균기온($^{\circ}C$), 상대습도(%), 강수량(mm)을 이용하여 연관성을 분석하였으며, 이를 회귀 모형화 하였다. 연구결과, 구축된 회귀 모형이 말라리아 발생자료에 대한 설명력이 있는 것으로 나타났다.

  • PDF

온도인자를 활용한 Hargreaves 모형 기반의 잠재증발산량 대체 모형 개발 (Surrogate Model for Potential Evapotranspiration Using a difference in Maximum and Minimum Temperature within a Hargreaves Modeling Framework)

  • 김호준;김태정;이강욱;권현한
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2020년도 학술발표회
    • /
    • pp.184-184
    • /
    • 2020
  • 수자원 계획 및 관리 시 증발산량의 정량적 분석은 필수적으로 고려되는 사항 중 하나이다. 일단위 이하의 잠재증발산량 산정은 세계식량기구(FAO)가 Penman-Monteith 방법을 기반으로 개발한 FAO56 PM 방법을 주로 활용하며, 이는 다른 방법에 비하여 높은 정확성과 적용성이 뛰어나다. 그러나 FAO56 PM 방법의 입력 매개변수는 다양한 기상자료이며, 장기간의 신뢰성 높은 자료를 구축하는 것은 어려운 실정이다. 이에 본 연구에서는 증발산량 공식인 Hargreaves 공식을 활용하여 FAO56 PM 방법으로 산정된 잠재증발산량과 기온차 사이의 시계열 관계를 재구성한 회귀분석 기법을 개발하였다. 개발된 모형에 유역면적을 적용하여 유역면적별 잠재증발산량을 산정하였으며, 이를 기존의 잠재증발산량과의 비교를 통해 모형의 적합성을 평가하였다. 결과적으로, 복잡한 잠재증발산량식을 단순한 대체모형(surrogate model)으로 제시함으로써 효율적인 증발산량 정량적 평가와 제한적인 기상자료 조건에 보편적 활용이 가능하다. 향후 연구에서는 회귀분석방법에 Bayesian 추론기법을 활용하여 구성함으로 잠재증발산량의 불확실성을 정량적으로 표현하고자 한다.

  • PDF

투자대상 벤처기업의 선정을 위한 전문가시스템 개발

  • 김성근;김지혜
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 1999년도 추계학술대회-지능형 정보기술과 미래조직 Information Technology and Future Organization
    • /
    • pp.139-148
    • /
    • 1999
  • 오늘날 기술집약적인 벤처기업들에 대한 관심이 집중되고 있다. 소수의 진취적인 벤처기업들이 기술개발 및 신상품 개발 등 두드러진 활약을 보이고 있기 때문이다. 그러나 실제 이 벤처기업의 성공 가능성은 그렇게 높지 않다. 특히 벤처기업 환경이 아직 미약한 국내의 경우 위험부담이 훨씬 더 크다. 이러한 벤처기업 환경에서 투자대상 벤처기업을 선정하는 것은 매우 전략적인 의사결정이다. 일반적으로 일반 벤처투자가들은 관심이 있는 산업에 해당하는 기업의 사업계획서와 기초적인 관련 정보를 토대로 투자여부를 결정한다. 그렇지만 실제로는 이와 같은 분석에 필수적으로 요구되는 정보가 불확실할 뿐만 아니라 기술분야에 대한 전문적 지식도 부족하기 때문에 투자 여부를 결정하는 것은 매우 복잡하고 어려운 문제이다. 그러므로 투자대상 벤처기업의 선정을 효과적으로 지원해주는 체계적인 접근이 필요하다. 특히 벤처 사업과 관련된 기술 동향 및 수준 등에 관련된 전문 지식과 경험이 체계적으로 제공되어야 하고 또한 벤처 투자가의 개인적 경험과 판단이 평가 프로세스에 직접적으로 반영될 수 있어야 한다. 이에 본 연구에서는 전문가의 지식과 경험을 체계화하고 투자가의 개인적 판단을 효과적으로 수용할 수 있는 전문가시스템의 접근방법을 제시하고자 한다. 투자대상 벤처기업의 선정을 위한 전문가시스템을 구축하기 위해 본 연구에서는 다양한 정보수집 과정을 거쳤다. 우선 벤처 투자와 관련된 기존 문헌을 심층 분석하였으며 아울러 벤처 투자 업계에서 활약중인 전문 벤처캐피탈리스트들과의 수차례 인터뷰를 통해 벤처기업 평가의 주요 요인과 의사결정 과정을 파악할 수 있었다. 이러한 과정을 통하여 본 연구에서는 벤처 투자의 90%를 차지하는 정보통신분야에 속한 기법 중에서 투자대상 벤처기업의 선정을 위한 전문가시스템을 구축중이다.의 밀도를 비재무적 지표변수로 산정하여 로지스틱회귀 분석과 인공신경망 기법으로 검증하였다. 로지스틱회귀분석 결과에서는 재무적 지표변수 모형의 전체적 예측적중률이 87.50%인 반면에 재무/비재무적 지표모형은 90.18%로서 비재무적 지표변수 사용에 대한 개선의 효과가 나타났다. 표본기업들을 훈련과 시험용으로 구분하여 분석한 결과는 전체적으로 재무/비재무적 지표를 고려한 인공신경망기법의 예측적중률이 높은 것으로 나타났다. 즉, 로지스틱회귀 분석의 재무적 지표모형은 훈련, 시험용이 84.45%, 85.10%인 반면, 재무/비재무적 지표모형은 84.45%, 85.08%로서 거의 동일한 예측적중률을 가졌으나 인공신경망기법 분석에서는 재무적 지표모형이 92.23%, 85.10%인 반면, 재무/비재무적 지표모형에서는 91.12%, 88.06%로서 향상된 예측적중률을 나타내었다.ting LMS according to increasing the step-size parameter $\mu$ in the experimentally computed. learning curve. Also we find that convergence speed of proposed algorithm is increased by (B+1) time proportional to B which B is the number of recycled data buffer without complexity of computation. Adaptive transversal filter with proposed data recycling buffer algorithm could efficiently reject ISI of channel and in

  • PDF

AHP 분석을 이용한 지식경영 실천 요소의 중요도에 관한 실증적 연구 (A Survey on the Critical Success Factors of Knowledge Management Using AHP)

  • 이영수;박준아;정광식;김진우
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1999년도 춘계공동학술대회: 지식경영과 지식공학
    • /
    • pp.85-94
    • /
    • 1999
  • 지식경영을 효과적으로 수행하기 위해서 기업은 지식경영을 구성하고 있는 요소를 정확히 이해할 필요가 있고, 이러한 중요 요소에 따라 투자가 이루어져야 한다. 본 연구는 지식경영의 중요 요소들을 제시함으로써, 앞으로 지식경영을 계획하고 있는 기업이 효과적으로 지식경영을 추진할 수 있는 활동 지침 및 투자 방향을 제시하고자 한다. 이를 위해, 본 연구에서는 각종 국내외 지식경영 관련 문헌에서 논의된 사항을 중심으로, 지식경영을 구성하는 30개의 중요요소를 추출하고, 분석계층도(AHP)를 이용하여 지식경영을 달성하기 위한 요소들을 위계적 구조로 정리하고, 최종단계에서 238개의 지식경영 구현의 평가기준을 마련하였다. 또한 실제로 지식경영 구현 요소들의 상대적 중요성을 파악하기 위해, 먼저 국내에서 지식경영을 추진하고 있거나 관심을 보이고 있는 48개 기업의 담당자 및 관련 부서원을 대상으로 설문조사를 실시하였고, 동시에 지식경영을 실제로 수행하고 있는 13개 기업의 담당자를 대상으로 각 기업에서 추진하고 있는 지식경영의 현황 파악을 위해 지식경영 실천의 평가기준에 대한 설문을 실시하였다. 이 두 가지 설문 조사 결과를 종합해 볼 때, 기업에서는 지식경영 구현 요소 중에서 인프라 내의 프로세스와 프로세스를 구성하는 지식의 활용과 전파 등이 중요하다고 인식하고 있는 반면, 실제로는 인프라 내의 정보기술과 프로세스를 구성하는 다른 한 축인 지식의 창출과 축적 면에 투자가 이루어진 것으로 나타났다. 이 외에도 지식화, 성과와 가치의 연계 그리고 지식의 가시화 등의 요소들은 상대적 중요도 인식과는 반대로 지식경영 추진에 있어 외면당하고 있는 것으로 나타났다. 따라서 본 연구는 지식 경영의 이러한 불균형을 시정할 수 있는 방향으로 앞으로의 투자가 수행되어야 할 것을 제안하고 있다. 산업의 밀도를 비재무적 지표변수로 산정하여 로지스틱회귀 분석과 인공신경망 기법으로 검증하였다. 로지스틱회귀분석 결과에서는 재무적 지표변수 모형의 전체적 예측적중률이 87.50%인 반면에 재무/비재무적 지표모형은 90.18%로서 비재무적 지표변수 사용에 대한 개선의 효과가 나타났다. 표본기업들을 훈련과 시험용으로 구분하여 분석한 결과는 전체적으로 재무/비재무적 지표를 고려한 인공신경망기법의 예측적중률이 높은 것으로 나타났다. 즉, 로지스틱회귀분석의 재무적 지표모형은 훈련, 시험용이 84.45%, 85.10%인 반면, 재무/비재무적 지표모형은 84.45%, 85.08%로서 거의 동일한 예측적중률을 가졌으나 인공신경망기법 분석에서는 재무적 지표모형이 92.23%, 85.10%인 반면, 재무/비재무적 지표모형에서는 91.12%, 88.06%로서 향상된 예측적 중률을 나타내었다.(ⅱ) managemental and strategical learning to give information necessary to improve the making. program and policy decision making, The objectives of the study are to develop the methodology of modeling the socioeconomic evaluation, and build up the practical socioeconomic evaluation model of the HAN projects including scientific and technological effects. Since the HAN projects consists of 18 subprograms, it is difficult In evaluate all the subprograms

  • PDF

독서교육시스템을 위한 텍스트수준 측정 공식 구성에 관한 연구 (A Study on Modelling Readability Formulas for Reading Instruction System)

  • 최인숙
    • 정보관리학회지
    • /
    • 제22권3호
    • /
    • pp.213-232
    • /
    • 2005
  • 본 고의 목적은 초등학생용 독서자료의 텍스트수준에 영향을 미치는 요인들을 규명하여 텍스트수준 측정 공식을 구성함으로써 텍스트의 수준 평가를 자동화하는 데에 있다. 컴퓨터로 계량화할 수 있는 언어적 요인들을 대상으로 표본집단에 부여된 텍스트수준 점수와의 상관관계를 검토한 결과 글자수, 어절수, 이형어절수, 문장수, 단락수 요인이 텍스트수준을 결정하는 요인으로 드러났다. 단순회귀분석을 통해 도출된 회귀방정식들 중에서 이형어절수 모형이 최적의 공식으로 드러났으나, 중회귀분석을 한 결과 이형어절수요인과 새 어절출현비율요인을 결합한 모형은 설명력이 더욱 향상된 공식으로 밝혀졌다. 공식에 따라 측정된 텍스트수준 점수는 학년 내에서 매우 세분된 단계까지 나타내고 있으므로 각 학생별로 그들의 독서능력에 적합한 자료를 추천할 수 있다.

국내 예능 시청률과 회차 예측 및 영향요인 분석 (A study on entertainment TV show ratings and the number of episodes prediction)

  • 김미림;임소연;장초희;송종우
    • 응용통계연구
    • /
    • 제30권6호
    • /
    • pp.809-825
    • /
    • 2017
  • 오디션, 육아, 버라이어티 등 다양한 예능 프로그램들의 수가 점점 증가하고 있다. 특히 종합편성채널이 개국한 이후에 예능 시장 경쟁이 심화되고 있다. 그에 따라 시청률과 회차에 대한 연구의 필요성이 대두되고 있다. 본 연구의 목적은 예능 프로그램 시청률과 회차의 예측모형을 제시하고 주요요인을 살펴보는 데 있다. 모형 적합 시 선형회귀모형, 로지스틱 회귀모형, LASSO 회귀모형, 랜덤 포레스트, 그래디언트 부스팅, 서포트 벡터 머신 등과 같은 다양한 분석 방법을 고려하였다. 예능 시청률 예측 모형에서는 첫 회가 방영되기 전과 방영된 후 두 가지 모형을 적합하였고, 회차 예측 모형에서는 예능 시청률 예측 모형의 예측치를 추가 변수로 생성하여 모형을 적합하였다. 그 결과 첫 회 방영 전 예능 시청률 예측에서는 방송사, 이전 시즌 시청률, 시작 연도, 기사 수가 큰 영향을 주는 것으로 나타났다. 첫 회 방영 후 예능 시청률 예측에서는 첫 회 시청률, 방송사, 예능 유형이 중요한 변수로 나타났으며, 두 모형 모두 랜덤 포레스트 모형에서 가장 좋은 결과를 보였다. 예능 회차 예측에서는 평균 시청률 예측치, 시작 연도, 예능유형, 방송국 등이 중요한 변수로 나타났다.

범주형 자료 분석을 활용한 사회경제적 가뭄 피해 발생확률 산정 : 충청북도의 적용사례를 중심으로 (Estimation of Occurrence Probability of Socioeconomic Damage Caused by Meteorological Drought Using Categorical Data Analysis)

  • 유지수;유지영;김민지;김태웅
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.348-348
    • /
    • 2021
  • 가뭄 연구의 궁극적 목표는 가뭄 발생의 메커니즘에 대한 이해를 높이고, 예측기술을 향상시켜 선제적 대응이 가능하도록 하는 것이다. 일반적으로 가뭄분석에 활용되는 가뭄지표는 연속형 변수로 간주하여 확률모형을 구축하지만, 가뭄상태와 가뭄피해 자료는 순서형 및 이산형 변수이므로 범주형 자료 분석 기법을 적용하는 것이 더 적절하다. 따라서 본 연구에서는 기상학적 가뭄과 피해발생 사이의 관계를 규명하기 위해 범주형 자료 분석 방법 중 로그선형(log-linear) 모형과 로지스틱(logistic) 회귀모형을 활용하였다. 가뭄피해 예측을 위한 가뭄 피해 정보를 수집하는 것은 매우 어려운 일이다. 가뭄의 영향으로 인해 발생할 수 있는 피해의 종류가 다양하며, 여러 분야의 이해관계자가 받아들이는 가뭄의 피해 양상이 다르기 때문이다. 본 연구에서는 국가가뭄정보포털(drought.go.kr)에서 충청북도의 가뭄피해현황 자료를 수집하였다. 30년(1991~2020년)동안 238개 읍면동 중 34개 행정구역에서 총 272건의 가뭄피해가 발생한 것으로 확인되었다. 표준강수지수(SPI)를 이용하여 분석된 지역별 연평균 가뭄발생횟수는 약 8.44회이며, 가뭄이 가장 많이 발생한 해는 2001년(평균 가뭄발생 18.7회)이었다. 강수의 부족으로 인해 발생하는 기상학적 가뭄이 사회경제적 피해를 야기하는 수문학적 가뭄으로 전이되기까지 몇 주에서 몇 달까지 시간이 소요된다. 이러한 관계를 파악하기 위해 가뭄피해 발생 여부를 예측변수, 가뭄피해 발생 이전의 가뭄상태를 설명변수로 설정하여 기상학적 가뭄 발생에 따른 가뭄피해 발생 확률을 산정하였다. 그 결과 가뭄피해 발생 당시의 가뭄상태보다 그 이전에 연속된 가뭄상태가 있을 경우 가뭄피해 발생 확률이 약 2.5배 상승하는 것으로 나타났다.

  • PDF

엑셀 VBA를 이용한 이분형 로지스틱 회귀모형 교육도구 개발 (An educational tool for binary logistic regression model using Excel VBA)

  • 박철용;최현석
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권2호
    • /
    • pp.403-410
    • /
    • 2014
  • 이분형 로지스틱 회귀분석은 양적 혹은 질적 설명변수를 이용해서 이분형 반응변수를 설명하는 하나의 통계적인 기법이다. 이 모형에서는 반응변수가 1이 될 확률을 설명변수들의 선형결합의 변환(혹은 함수)으로 설명하고자 한다. 이 개념에 대한 이해가 비통계학자들이 이분형 로지스틱 회귀모형을 이해하는데 있어서 넘어야 할 커다란 장벽 중의 하나이다. 이 연구에서는 이분형 로지스틱 회귀모형의 필요성을 엑셀 VBA를 이용하여 설명하는 교육도구를 개발하고자 한다. 반응변수가 1이 될 확률을 설명변수의 선형함수로 모형화 할 때의 문제점과 선형결합에 대한 변환을 통해 이 문제점이 어떻게 해소되는지 보여준다.

Harmonized Landsat Sentinel-2 (HLS) 위성자료를 활용한 클로로필-a 추정 (Estimation of Chlorophyll-a via harmonized landsat sentinel-2 (HLS) datasets)

  • 박종민
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.400-400
    • /
    • 2023
  • 급격한 기후변화로 인해 일사량, 지표면 온도 및 이산화탄소 농도가 꾸준히 상승함에 따라 수문 순환의 불균형을 초래함과 하천 및 호소 내 수질 또한 악화되고 있는 추세이다. 특히, 국내의 경우, 기후변화 및 인위적 요인에 의해 하천 및 호소에서의 수위 감소 및 수온 증가로 인해 부영양화가 증가되고 있고, 이로 인한 유해 녹조의 발생빈도를 높이는 결과를 초래한다. 현재 국내에서는 유인 수질 관측 및 자동 수질관측 시스템을 통해 주요 수질인자를 모니터링 하고 있으나 시·공간적인 변동성을 파악하는데 제한점이 있다. 이러한 한계점을 극복하기 위해 국·내외에서 광학위성을 이용한 수질인자 추정 알고리즘 개발과 관련된 연구들이 진행되고 있다. 이에 따라, 본 연구에서는 NASA에서 제공하는 Landsat-8 위성과 ESA에서 제공하는 Sentinel-2자료가 동화된 Harmonized Landsat Sentinel-2 위성자료를 활용한 클로로필-a (Chl-a)를 추정하고자 한다. 이를 위해, 본 연구에서는 1) 단순 회귀 분석, 2) Akaike information criteria (AIC) 기반 최적화 회귀 분석 및 3) Random forest (RF)를 활용하였다. 또한, HLS 위성 자료의 적용성을 평가하기 위해 미국 오하이오 주에 위치하고 있는 130여개의 중규모 및 대규모 호소에서 2000년부터 2021년까지 수집된 클로로필-a 관측치를 활용하였다. 두 가지 수질 추정 모형에 대한 정확도 검증에 앞서 오하이오 주 내에서의 클로로필-a의 시계열적 변동성에 대하여 분석하였다. 전반적으로, 2000년부터 2016년까지는 Chl-a가 꾸준히 증가하는 경향성을 나타내었으나, 그 이후로는 감소하는 추세를 나타내었다. 이를 기반으로, 각 방법론을 통해서 나온 Chl-a 추정치에 대해서 통계적 검증을 수행하였다. 결과, 단순 회귀 분석을 통해 추청된 Chl-a값의 결정계수는 0.34였지만, AIC 기반 모델과 RF모형을 사용한 결과 결정계수가 각각 0.82와 0.92로 향상된 것을 확인할 수 있었다. 이와 더불어, spatial 및 temporal window와 더불어 호소의 크기에 따른 정확도 분석 또한 수행하였다. 그 결과, temporal window 가 정확도에 가장 큰 영향을 미치는 것으로 나타났으며, 호소의 크기가 작을수록 정확도가 낮아지는 것을 확인 할 수 있었다. 본 연구의 결과를 토대로 추후 국내 호소에 대해 상기 모형들의 적용성 평가를 수행하여 효율적인 수질 모니터링 시스템 구축으로 이어질 수 있을 것으로 기대된다.

  • PDF