• 제목/요약/키워드: 이항검정

검색결과 43건 처리시간 0.031초

대중교통체계 개편에 따른 대중교통 이용자들의 통행패턴 변화에 관한 연구 (경산시를 사례로) (A Study on Change of Travel Patterns According to Public Transportation Reform (A Case Study of Gyeongsan City))

  • 윤대식;박현철
    • 대한교통학회지
    • /
    • 제28권1호
    • /
    • pp.51-61
    • /
    • 2010
  • 본 연구에서는 경산시 대중교통체계 개편 전과 후의 통행패턴을 분석하였으며, 통행패턴 변화의 통계적 검정을 위해 카이제곱($x^2$)검정과 t-검정을 실시하였다. 또한 대중교통 이용자들의 통행패턴 변화에 영향을 미치는 요인을 파악하기 위해 이항로짓모형을 추정하였으며, 개편 전 후 교통수단 선택에 영향을 미치는 요인을 비교 분석하기 위해 다항로짓모형을 추정하였다. 이들 두 로짓모형의 추정을 위해 사용된 설명변수로는 통행패턴 변화 및 대중교통체계 개편 전 후의 교통수단 선택에 영향을 미칠 것으로 예상되는 성별, 연령, 직업, 통행목적, 요금지불방법, 목적지, 통행시간의 7개 변수를 사용하였다. 이러한 분석을 통해 대중교통시설 및 환승체계 구축 등 교통정책 수립에 필요한 다양한 시사점과 본 연구의 한계를 제시하였다.

허들음이항모형을 이용한 기업의 혁신선택과 특허성과의 결정요인에 관한 연구 (The Selection and Decision in R&D and Patents: A Hurdle Negative Binomial Approach)

  • 박재민
    • 기술혁신학회지
    • /
    • 제17권3호
    • /
    • pp.449-466
    • /
    • 2014
  • 그동안 기업의 R&D 투자와 기술혁신 성과의 관계에 관해 여러 연구가 있었다. 하지만 지식생산과정에 수반되는 기업의 의사결정 과정은 효과적으로 분석에 반영되지 못하였다. 특히 기업의 특허성과를 분석함에 있어 포와송모형의 한계에 대응해 최근 연구는 음이항모형을 적용해 극복하고자 했지만 기업의 선택과정을 분석하는데는 한계가 있다. 본 논문은 특허권 정보에 내재된 기업체의 의사결정 과정을 보다 효과적으로 반영하는 실증모형을 제시하고, 사업체조사 결과를 적용해 분석하였다. 특히 기업의 대표적 R&D 성과인 특허에 주목하여 특허 출원건수의 결정과정을 살펴보았다. 분석 결과, 과산포의 존재를 확인할 수 있었고, 허들모형과 일반적인 음이항모형의 결과에 유의한 차이가 있음을 제시하였다. 더불어 Wald-검정을 통해 허들의 설정이 타당하였고, 기업의 특허성과 분석에 있어서 기업의 선택과정을 고려할 필요가 있음을 보였다.

가산자료모형(Count Data Model)을 이용한 버스이용횟수추정에 관한 연구 (서울시 통근.통학자를 대상으로) (Count Data Model for The Estimation of Bus Ridership (Focusing on Commuters and Students in Seoul))

  • 문진수;김순관;임강원
    • 대한교통학회지
    • /
    • 제17권5호
    • /
    • pp.123-135
    • /
    • 1999
  • 개인교통수단의 선호로 인한 자가용 승용차의 급증은 서울시의 교통혼잡을 가중시키는 주요한 요인이 되고 있다. 이러한 서울시의 교통혼잡을 완화하기 위해서는 대중교통 중심의 교통체계가 구축되어야 하며 승용차 이용자를 대중교통수단으로 유인할 수 있는 대중교통 활성화정책이 필요하다. 이러한 인식하에 버스를 이용하는 통근 및 통학목적 통행자의 버스이용횟수에 대한 개별행태모형을 통하여 버스 이용에 영향을 미치는 요인을 파악함으로써 승용차 이용자를 대중교통수단으로 유인할 수 있는 정책적인 시사점을 도출하고자 하였다. 본 연구의 목적은 일주일간 버스이용횟수 추정에 적합한 가산자료모형의 적용이다. 국내에서는 가산자료모형을 이용한 연구가 많지 않은 실정이며, 또한 모형의 설정시 과산포(overdispersion)에 대한 검정을 통하여 자료에 적합한 모형을 설정하는 것이 중요함에도 불구하고 적절한 검정없이 일반적으로 사용되고 있는 포와송 회귀모형을 주로 사용하여 왔다. 그러나 본 연구에서는 가산자료모형을 선정하기 전에 과산포에 대한 통계적인 검정을 시행한 결과 음이항 회귀모형이 본 연구의 자료에 적합한 것으로 판정되었으며, 모형설정의 중요성을 살펴보기 위하여 음이항 회귀모형을 이용하여 추정한 결과와 포와송 회귀모형을 이용하여 추정한 결과를 비교하여 보았다.

  • PDF

가산자료(count data)의 과산포 검색: 일반화 과정 (Overdispersion in count data - a review)

  • 김병수;오경주;박철용
    • 응용통계연구
    • /
    • 제8권2호
    • /
    • pp.147-161
    • /
    • 1995
  • 생검실험에서는 다산을 통해 번식하는 쥐와 같은 설치류 동물들을 실험대상으로 하여 이항분포나 포아송분포 하에서 가산자료(count data)를 많이 생성한다. 다산을 통해 태어난 동물들을 독립적인 실험대상으로 간주하여 자료분석을 하면, 同腹仔 효과로 인해 기존의 평균과 분산사이의 관계를 벗어나는 과산포현상이 종종 나타난다. 이러한 현상을 무시했을 때 모수추정치에 대한 분산을 과소추정하고, 이로 인하여 가설검정에서 낮은 검정력을 갖게 된다. 이러한 문제점을 해결하기 위하여 최근 10년간 과산포현상을 검색하는 통계량들과 과산포를 반영하는 모형들이 제시되었는데, 이를 개관하고 이러한 절차들의 일반화 과정을 자료 유형별로 비교분석한다.

  • PDF

로지스틱회귀에서 잔차산점도를 이용한 모형평가 (Model assessment with residual plot in logistic regression)

  • 강명욱
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권1호
    • /
    • pp.141-150
    • /
    • 2015
  • 로지스틱회귀에서 모형을 평가하거나 진단할 때 가설검정이 주로 사용되지만 이것만으로는 놓칠 수 있는 부분이 많고 이에 대한 보완을 위하여 그래픽적 방법의 사용이 요구된다. 그래프를 이용한 모형의 적절성 평가를 위한 도구로 잔차산점도가 널리 이용되고 있으나 적용 범위가 선형회귀에 국한되는 문제점이 있다. 해결 방안으로 주변모형산점도를 이용하여 모형의 적절성을 평가하는 방법이 있으나 역시 문제점을 가지고 있다. 본 논문에서는 주변모형산점도의 대안으로 카이잔차산점도를 제안하고 그 효용성을 알아본다.

가산자료모형을 이용한 서해 태안군 유어객의 편익추정 (Estimating the Economic Value of Recreation Sea Fishing in the Yellow Sea: An Application of Count Data Model)

  • 최종두
    • 자원ㆍ환경경제연구
    • /
    • 제23권2호
    • /
    • pp.331-347
    • /
    • 2014
  • 본 연구는 서해에 위치한 태안군을 방문하는 유어객의 방문 편익을 분석하기 위하여 개별여행비용법과 가산자료모형을 이용하여 수요모형을 추정하고 경제적 가치를 측정하였다. 여행객방문속성을 감안하여 분석모형으로 포아송모형(Poisson Model, PM), 음이항모형(Negative Binomial, NB), 절단된 포아송모형(Truncated Poisson Model, TPM), 절단된 음이항모형(Truncated Negative Binomial, TNB)을 분석에 이용하였다. 분석결과 추정계수들은 통계적으로 유의하게 나타났으며, 경제이론에도 부합되는 결과를 도출하였다. 과산포(overdispersion)현상은 발견되지 않았으며, 모형적합도검정을 통하여 절단된 포아송모형이 적정모형으로 선정되었다. 또한, 서해 태안군 해역내 유어활동의 경제적가치를 추정하기 위하여 유어객의 연평균 출조횟수와 최적모형으로 선정된 절단된포아송모형(TPM)으로 분석한 결과 1인 1회 출조당 경제적 가치는 254,453원이며, 1인당 연간 총 경제적 가치는 1,536,896원으로 도출되었다.

고령운전자 교차로 사고의 특성 및 모형 - 청주시 4지 신호교차로를 중심으로 - (Characteristics and Models of Intersection Accidents by Elderly Drivers in the Case of Cheongju 4-legged Signalized Intersections)

  • 박병호;한상욱;김경환
    • 한국도로학회논문집
    • /
    • 제11권4호
    • /
    • pp.33-40
    • /
    • 2009
  • 이 연구는 고령운전자의 사고를 다루고 있다. 본 논문은 고령운전자와 일반운전자 사이의 교통사고 특성을 비교 분석하고, 사고모형을 개발하는데 목적이 있다. 이를 위해 본 연구에서는 청주시 4지 신호교차로를 중심으로 두 운전자 집단 간의 차이를 검증하고, 포아송 및 음이항 회귀모형을 개발하는데 중점을 두고 있다. 분석된 주요 연구결과는 다음과 같다. 첫째, 고령운전자와 일반운전자 사고의 차이점이 시간대별, 사고유형별 등으로 파악되었다. 둘째, 통계적으로 설명력이 높은 고령 및 일반운전자 총 3개의 사고모형이 개발되었다. 마지막으로 공통변수와 특정변수를 활용하여 고령 일반 운전자 사고모형의 차이가 비교 분석되었다.

  • PDF

랜섬웨어 탐지를 위한 동적 분석 자료에서의 변수 선택 및 분류에 관한 연구 (A study on variable selection and classification in dynamic analysis data for ransomware detection)

  • 이승환;황진수
    • 응용통계연구
    • /
    • 제31권4호
    • /
    • pp.497-505
    • /
    • 2018
  • 최근 랜섬웨어는 일반 PC 사용자에 비해 상대적으로 수준 높은 보안 체계를 갖추고 있는 기업과 정부 기관에 침입하여 상당한 피해를 입히는 등 기존 보안 체계의 허점을 찾아 진화하는 모습을 보이고 있다. 이처럼 계속해서 변화하는 랜섬웨어를 탐지하기 위해 랜섬웨어의 특징을 파악하는 정적 분석과 동적 분석과 관련된 연구가 활발히 이루어지고 있다. 본 연구에서는 582개의 랜섬웨어 샘플과 942개의 정상 샘플 프로그램을 쿠쿠 샌드박스 가상환경 내에서 실행시킨 뒤, PC에서 이루어지는 30,967가지의 행동 여부를 기록한 동적 분석 자료를 활용하여 랜섬웨어 분류에 유의한 변수를 탐색하기 위한 여러 변수 선택 방법의 적용과 랜섬웨어 분류를 위한 기계학습 모형들을 구축하고자 하였다. 변수 선택법으로 LASSO와 이항변수 만으로 이루어진 고차원 자료라는 특성을 활용하기 위한 카이제곱검정을 이용한 변수 선택, 선행 연구에서 이용된 방법인 상호정보를 이용한 변수 선택법을 적용하였으며 기계 학습 모형으로는 능형 로지스틱 회귀, 서포트 벡터 머신, 랜덤 포레스트, XGBoost가 활용되었다. 연구 결과, 정상 프로그램과 구별되는 랜섬웨어 프로그램만의 특징적인 행동을 확인할 수 있었으며 여러 변수 선택법과 기계학습 분류 모형들의 조합 중, 주어진 자료에서 카이제곱검정을 이용한 변수 선택법과 랜덤 포레스트 모형의 조합이 가장 높은 탐지율과 정분류율을 보이는 것을 확인하였다.

한우 수소 고기 관능평가 데이터에 대한 범주형 자료 분석 (Categorical data analysis of sensory evaluation data with Hanwoo bull beef)

  • 이혜정;조수현;김재희
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권5호
    • /
    • pp.819-827
    • /
    • 2009
  • 국립축산과학원에서 수집한 한우 관능 평가 데이터에 대해 사회 인구학적 요인과 한국 소비자들의 맛 평가에 대한 연관성을 연구하고자 한다. 소비자 거주지역, 연령, 성별, 직업, 월수입과 쇠고기 부위를 설명변수로 맛등급 평가를 반응변수로 이항 다중 로지스틱 모형과 다항 다중 로지스틱 모형을 적합하고 회귀계수별 유의성 검정과 적합도 검정을 실시하였다. 단계별 변수 선택으로 최종 모형을 선택하고 반응변수 범주에 대한 오즈비를 계산하여 관련성을 파악한다. 그 결과 거주 지역, 연령, 월수입과 쇠고기 부위 변수들이 선택되었다. 영남에서 맛을 비교적 높게 평가하는 경향이 있으며 수입이 많고 연령이 높을수록 맛을 까다롭게 평가하는 경향을 보인다. 쇠고기 부위별로는 우둔에 비해서 등심이 다른 부위들 중 맛에 대한 차이가 크다고 볼 수 있다.

  • PDF

로지스틱 회귀분석에 의한 도시부 신호교차로 유턴 사고모형 개발 (Development of the U-turn Accident Model at Signalized Intersections in Urban Areas by Logistic Regression Analysis)

  • 강종호;김경환;김성문
    • 대한토목학회논문집
    • /
    • 제34권4호
    • /
    • pp.1279-1287
    • /
    • 2014
  • 본 연구의 목적은 도시부 신호교차로에서의 유턴 사고모형을 개발하는 것이다. 창원시 3지, 4지 신호교차로의 유턴 교통사고 자료에 대한 특성을 분석하고 로지스틱 회귀분석에 의해 사고예측모형을 추정하였다. 먼저 유턴 운영에 의한 교통사고 발생에 차이가 있는지를 검정하기 위해 맨-위트니 U검정으로 평균차이를 검정하였다. 분석 결과 4지 신호교차로의 사고유형별 구분에 있어서는 추돌사고를 제외한 유형에서, 사고위치별에 있어서는 유출부 사고가 유턴구역이 설치된 집단의 사고발생건수가 더 많은 것으로 분석되었다. 교통사고건수에 대한 반응척도를 이항으로 분류하고 사고예측모형을 추정한 결과 상충교통량, 대향차로수와 같은 독립변수가 공통적인 영향요인으로 분석되었으며, 3지 신호교차로에서는 종단 경사, 4지 신호교차로에서는 횡단보도수가 공통영향 이외에 특정변수로 도출되었다. 도시부 신호교차로에서 유턴 운영을 위해서는 유턴 구역 대향차로수가 사고무발생 교차로의 평균차로수인 3.5개 차로 이상이며, 접근부의 종단선형이 상향경사일 경우에 설치를 고려할 수 있을 것으로 제안된다. 또한 유턴 차량의 많은 부분이 횡단보도 시간을 이용하여 회전하는 점을 고려하여 유턴 시기에 대한 지시표지를 설치할 필요가 있다.