• 제목/요약/키워드: 감마 일반화 회귀모형

검색결과 8건 처리시간 0.02초

감마 일반화 선형 모형에서의 가능도비 검정과 F-검정 비교연구 (Comparing the performance of likelihood ratio test and F-test for gamma generalized linear models)

  • 조성일;한정섭;이우주
    • 응용통계연구
    • /
    • 제31권4호
    • /
    • pp.475-484
    • /
    • 2018
  • 감마 일반화 선형모형은 음이 아니며 치우침이 있는 반응변수에 유용한 모형으로 알려져 있다. 그러나 포아송 분포 또는 이항 분포에 기반한 일반화 선형모형에 비해 적은 관심을 받아왔다. 특히, 회귀계수의 유의성 검정에 대해서는 연구가 면밀히 되어 있지 않다. 본 논문에서는 감마 일반화 선형 모형의 검정에 대해 다양한 통계량들을 알아보고 수치 연구를 통해 그들의 성능을 비교한다. 수치 실험의 결과 부분 이탈도 검정 방법의 문제점이 나타났으며, 가능도비 검정 방법과 F-검정 방법이 좋은 성능을 보임을 확인하였다.

Patent Keyword Analysis using Gamma Regression Model and Visualization

  • Jun, Sunghae
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권8호
    • /
    • pp.143-149
    • /
    • 2022
  • 특허문서는 연구 개발된 기술에 대한 상세한 결과를 포함하고 있기 때문에 효과적인 기술분석을 위한 다양한 특허분석 방법에 대한 연구가 진행되고 있다. 특히 통계학과 머신러닝 알고리즘에 의한 정량적인 특허분석에 대한 연구가 최근 활발하게 이루어지고 있다. 정량적 특허분석에서 가장 많이 사용되는 특허 데이터는 기술 키워드이다. 기술 키워드 데이터를 분석하는 기존의 방법은 대부분 음의 무한대부터 양의 무한대까지 실수 공간 전체를 확률변수의 값으로 갖는 가우시안 확률분포에 기반한 모형이었다. 본 논문에서는 이론적으로 0부터 양의 무한대까지의 값을 갖는 특허 키워드의 빈도 데이터를 분석하기 위하여 감마 확률분포를 활용한 모형을 제안한다. 또한 감마 회귀모형의 회귀방정식을 결정하기 위하여 키워드 간의 기술 연관성을 시각화하는 2-모드 네트워크를 구축한다. 제안 방법과 기존의 가우시안 기반의 분석모형 간의 성능평가를 위하여 실제 특허 데이터를 수집하여 분석한다.

점포의 무인화와 소매점 입지: 서울시 무인 편의점과 무인 할인판매점을 대상으로 (Unattended Trends and Retail Locations: Focusing on Unmanned Convenience and Discount Stores in Seoul)

  • 박소현;이금숙
    • 한국경제지리학회지
    • /
    • 제24권4호
    • /
    • pp.411-424
    • /
    • 2021
  • 본 연구의 목적은 새로운 소매환경의 흐름을 형성하며 무인화를 구현하고 있는 소비 업종인 편의점을 대상으로 입지 특성을 파악하고 입지 분포에 영향을 끼친 지리적 속성을 밝히는 것이다. 이를 위해 서울시를 사례로 편의점의 성장과 지역적 분포를 살펴보고, 무인 편의점과 무인 할인판매점의 입지 분포를 설명하는 감마 일반화 회귀모형을 구축한다. 분석 결과, 영업 중인 무인 편의점과 무인 할인판매점은 대중교통시설과 인접하고 상대적으로 인구의 유동은 낮지만 청년층 주거인구가 밀집하고 소매업, 외식업의 점포가 많은 지역을 중심으로 출점하여 분포하였다. 또한, 소매 품목의 범위와 특성에 따라 인구와 가구 속성의 영향력은 서로 다르게 작용하며 입지에 영향을 끼쳤다. 본 연구는 무인화한 점포의 초기 출점 입지 선정과 분포에 영향을 끼친 지리적 속성을 파악한 시작 연구로서 후속 학술 연구의 실증적 토대를 제시한다는 점에서 가치 있다.

이단계 일반화 선형모형을 이용한 은행 고객의 연체성향 분석 (Analysis of Household Overdue Loans by Using a Two-stage Generalized Linear Model)

  • 오만숙;오현탁;이영미
    • 응용통계연구
    • /
    • 제19권3호
    • /
    • pp.407-419
    • /
    • 2006
  • 본 연구에서는 최근 몇 년 동안 한국에서 사회적으로 큰 문제가 되고 있는 카드이용 고객의 연체 방지를 위해 기존 금융권을 이용하는 개인에 대한 연체 성향 분석을 수행한다. 연체 성향 분석의 대상은 현재 한국의 한 특정 은행 고객으로 하였으며, 여러 연체 가운데 신용카드 연체를 중심으로 연구하였다. 연체 성향과 요인이 분석되면 기존 은행 고객에 대한 향후 부실의 정도를 예측할 수 있으며 또한 미래의 고객에 대해서도 신용평가 시스템을 만들 수 있을 것이다. 연체 성향 분석을 위한 통계적 방법으로 연체 유/무에 대한 로지스틱 회귀모형을 적용하였고 연체가 있을시 연체금액에 대한 일반화 선형 모형을 적용하여 자료를 적합한 후, 유의한 설명변수들을 선정하여 반응변수와 설명변수들의 관계를 설명해 보았다. 분석 결과 연령, 건당 현금서비스 평균금액, 타사 현금금액, 수신잔액, 순수익이 연체 유무와 연체금액에 중요한 영향을 미치는 설명변수들임을 알 수 있었다.

특성화고 학생의 수학교과에 대한 태도 조사 (Mathematics education attitude of the students in the specialized high school)

  • 김민석;오광식
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권6호
    • /
    • pp.1173-1181
    • /
    • 2012
  • 특성화고등학교와 일반계고등학교 학생들의 수학교과에 대한 태도를 비교 검토하고, 수학교과의 기초학습능력에 영향을 주는 요인을 파악하여, 특성화고에서 수학교과를 가르치는 교사들에게 효율적으로 수학교과를 교수 학습하는 방안을 마련하는 기초자료를 제공하고자 한다. 고등학생 654명을 대상으로 설문조사를 실시하여 통계분석하였다. 설문지에 대한 타당성과 신뢰성을 검토하고, 그 자료에 대하여 카이제곱검정과 감마값을 통하여 학교급 및 학년과 내 외적 요인들의 관련성을 분석한다. 또한 수학교과 기초학습능력이 학교급과 학년사이에 차이가 있는지 일반화선형모형을 적합해 본다. 그리고 기초학습능력에 영향을 주는 내 외적 요인을 회귀분석의 단계적 변수선택방법을 이용하여 찾아본다.

상대오차예측을 이용한 자동차 보험의 손해액 예측: 패널자료를 이용한 연구 (Predicting claim size in the auto insurance with relative error: a panel data approach)

  • 박흥선
    • 응용통계연구
    • /
    • 제34권5호
    • /
    • pp.697-710
    • /
    • 2021
  • 상대오차를 이용한 예측법은 상대오차(혹은 퍼센트오차)가 중요시되는 분야, 특히 계량경제학이나 소프트웨어 엔지니어링, 또는 정부기관 공식통계 부분에서 기존 예측방법 외에 선호되는 예측방법이다. 그 동안 상대오차를 이용한 예측법은 선형 혹은 비선형 회귀분석 뿐 아니라, 커널회귀를 이용한 비모수 회귀모형, 그리고 정상시계열분석에 이르기까지 그 범위가 확장되어 왔다. 그러나, 지금까지의 분석은 고정효과(fixed effect)만을 고려한 것이어서 임의효과(random effect)에 관한 상대오차 예측법에 대한 확장이 필요하였다. 본 논문의 목적은 상대오차예측법을 일반화선형혼합모형(GLMM)에 속한 감마회귀(gamma regression), 로그정규회귀(lognormal regression), 그리고 역가우스회귀(inverse gaussian regression)의 패널자료(panel data)에 적용시키는데 있다. 이를 위해 실제 자동차 보험회사의 손해액 자료를 사용하였고, 최량예측량과 최량상대오차예측량을 각각 적용-비교해 보았다.

통계적 분포를 통한 주택 화재 심도 추정 (Estimating home fire severity with statistical distributions)

  • 박윤정;송인아;이소연;남광현;오로지;안재윤
    • 응용통계연구
    • /
    • 제36권6호
    • /
    • pp.591-618
    • /
    • 2023
  • 본 논문은 보험 손실 추정을 위한 회귀 설정에서 다양한 분포 가정의 성능을 실제 데이터를 사용하여 비교 분석합니다. 감마 분포는 일반적으로 보험의 손실 분포의 비대칭성을 처리하는 데 사용됩니다. 그러나 최근 연구는 보험자료의 분석에 있어서 손실 분포의 두꺼운 꼬리의 중요성을 강조합니다. 실제 주택 화재 보험 데이터 분석을 통해 우리는 회귀 방법에서 다양한 분포 가정의 효과를 비교합니다. 우리의 결과는 보험손실에 대한 분포 가정의 선택이 "초과 손해 보험" 및 "한도 보험"을 포함한 다양한 보험 상품의 보험료 결정에 중요하다는 것을 보여줍니다. 또한 주택 화재 보험의 통계적 모형설정에 있어서 실제 고려 사항에 대해 논의합니다.

Sentinel-2 위성영상과 강우 및 토양자료를 활용한 벼 수량 추정 (Rice Yield Estimation Using Sentinel-2 Satellite Imagery, Rainfall and Soil Data)

  • 김경섭;정윤재;전병운
    • 한국지리정보학회지
    • /
    • 제25권1호
    • /
    • pp.133-149
    • /
    • 2022
  • 벼 수량 추정에 대한 기존의 국내 연구는 주로 저해상도인 MODIS 위성영상을 사용하여 우리나라 전역을 대상으로 시군 단위에서 수행되었다. 기존 연구와 달리, 본 연구는 전북 김제시를 사례로 중해상도인 Sentinel-2 위성영상과 강우 및 토양자료를 활용하여 읍면동 단위에서 벼 수량을 추정하고 그 정확성을 평가하였다. 전북 김제시를 대상으로 2018년 8월 1일에 촬영된 Sentinel-2 영상으로부터 산출된 NDVI, LAI, EVI2, MCARI1, MCARI2의 다섯 가지 식생지수와 강우량 및 논 토양 유형 자료를 읍면동별로 집계하고 종속변수의 비정규성 문제를 해결하기 위해 다중회귀분석을 확장한 감마 일반화 선형모형으로 벼 수량을 추정하였다. 벼 수량 추정 모형에서 EVI2, 9월 강우일수, 염해답 비율이 유의한 독립변수로 선정되었다. 모형의 적합도를 나타내는 결정계수는 0.68이었고, 모형의 정확성을 나타내는 RMSE는 62.29kg/10a였다. 이 모형으로 2018년 김제시 전역의 쌀 생산량을 추정한 결과는 96,914.6M/T으로 통계연보의 94,470.3M/T과 비교해 0.46%의 오차를 보여 매우 근접한 결과가 도출되었다. 또한, 김제시의 단위면적당 쌀 생산량은 552kg/10a로 도출되어 통계자료의 550kg/10a와 거의 일치하였다. 이러한 결과는 기존 연구들과 유사한 결과로 국내에서 시군 이하 단위에서 Sentinel-2 위성영상을 활용하여 벼 수량을 추정하는 것이 가능하다는 것을 입증하였다.