• 제목/요약/키워드: 음이항회귀모델

검색결과 5건 처리시간 0.016초

기계학습을 활용한 데이터 기반 경찰신고건수 예측 (The Data-based Prediction of Police Calls Using Machine Learning)

  • 최재훈
    • 한국빅데이터학회지
    • /
    • 제3권2호
    • /
    • pp.101-112
    • /
    • 2018
  • 본 연구는 기계학습의 하나인 신경망 분석과 음이항 회귀분석을 활용하여 경찰신고건수를 예측하고자 2016년 6월부터 2017년 5월까지 충남지방경찰청에 접수된 112신고 데이터를 이용하여 예측모델을 개발하였다. 모델을 개발하기 위해 경찰신고건수에 영향을 줄 수 있는 시간, 휴일, 휴일 전날, 계절, 기온, 강수량, 풍속, 관할면적, 인구, 외국인 수, 단독주택비율, 기타주택비율 변수 등을 활용하였다. 변수의 종류에 따라 몇몇은 경찰신고건수와 양의 상관관계 또는 음의 상관관계가 확인되었다. 사용된 두 개의 방법론을 비교한바, 신경망분석의 예측 결과는 예측 값과 실제 값의 상관계수 0.7702, RMSE 2.557이고, 음이항 회귀분석은 상관계수 0.7158, RMSE 2.831으로 나타났다. 신경망분석은 해석가능성은 낮지만, 음이항 회귀분석에 비해 예측력이 뛰어나다는 것이 확인되었다. 향후 경찰관서에서 본 연구의 예측모델을 기초로 하여 최적의 경찰력 배치를 할 수 있을 것으로 기대된다.

EB기법을 이용한 사고잦은 곳 개선사업 우선순위 판정기법 개발 (Development of Evaluation Model for Black Spot Improvement Priorities by using Emperical Bayes Method)

  • 정성봉;황보희;성낙문;이선하
    • 대한교통학회지
    • /
    • 제27권3호
    • /
    • pp.81-90
    • /
    • 2009
  • 도로 네트워크의 안전 관리는 기본적으로 교통안전 조사를 위한 사이트(교통사고 잦은 지점) 선정, 안전문제에 대한 진단, 잠재적 위험요소들에 대한 가능한 대안 선정, 주어진 예산 제약 하에 대안간의 우선순위 결정과 같은 순서로 이루어진다(Persaud, 2001). 효율적인 안전 조사를 위해 요구되는 지점(교통사고 잦은 지점) 선정에 대한 과정은 매우 중요하다. 이에, 본 연구는 인천시 4지 신호 교차로 중 교통사고 잦은 지점으로 선정된 지점의 3년간(2004~2006년) 사고 자료와 기하구조 자료를 이용하여 EB 기법 이용 시 필요한 사고예측모델을 개발하였다. 또한, 교통사고 잦은 지점을 선정하는데 있어 현재 우리나라에서 적용되고 있는 단순사고건수와 심각도를 고려하여 선정된 우선순위와 단순사고건수 대신 EB 기법을 이용하여 예측된 사고건수를 이용하여 선정된 우선순위 비교를 통해 기존 방법의 한계를 제시하고 합리적인 예측모형 개발 필요성을 보여주고자 하였다. 분석 결과, 총 사고건수 추정 시 기존의 사고 예측 방법인 비선형 회귀모형과 EB 기법의 결과 값 모두 예측력이 높은 것으로 나타났지만 지점별 사고건수 예측력을 함께 고려할 경우엔 EB 기법이 비선형 회귀 모형(포아송)의 결과보다 예측력이 좋은 것으로 나타났다. 또한, 도출된 우선순위 비교 결과 대부분의 지점의 우선순위는 크게 변동이 없었으나, 서해4거리 등 몇 개 지점의 개선우선순위에는 상당한 변동이 발생하는 것으로 나타났다. 이는 실제 사고건수를 이용할 경우 발생하는 RTM문제를 본 연구에서 제안한 기법을 사용할 경우 해결가능하다는 것을 시사한다.

국립공원 방문객 특성을 이용한 핵심수요시장연구 -인구통계학적 변인과 사회경제학적 변인을 중심으로- (Core Demand Market by Visitor's Characteristics of Mountain Types of a National Park -focused on Demographic and Social Economical Factors-)

  • 곽강희
    • 한국콘텐츠학회논문지
    • /
    • 제13권7호
    • /
    • pp.361-368
    • /
    • 2013
  • 본 연구는 무등산 국립공원 방문객들의 인구통계학적 특성 및 사회경제학적 특성을 조사하여 공원방문객 수요증진을 위한 마케팅전략차원의 정보제공을 목적으로 수행되었다. 이 연구를 수행하기 위해서는 적절한 모형설정이 중요하다. 이른바 종속변수가 이산확률분포를 가진 이산형 변수일 경우, 연속확률분포의 자료 분석에 적합한 회귀모형을 설정한다면 추정치에 대한 심각한 오류가 발생하기 때문이다. 따라서 본 연구의 자료 분석은 포아송모델을 통해 수행되었으며, 자료의 특성이 과산포를 보였기 때문에 이를 고려할 수 있는 보다 적합한 모델로 음이항 포아송모델을 설정하여 최종적으로 파라미터를 추정하였다. 그 결과, 수요자의 연령, 직업, 방문선호계절, 동반유형, 주 5일 근무제 그리고 선호관광형태 등이 방문객 수요에 긍정적인 역할을 하고 있는 것으로 파악되었으며, 이 주요영향변수들을 바탕으로 국립공원 측에 핵심시장에 대한 특성과 그들을 위한 마케팅 전략 및 정보 등을 제공할 수 있었다.

특허의 피인용에 영향을 끼치는 요인에 대한 연구: 미국 자동차 특허를 중심으로 (A study of factors affecting citation of patents: Focusing on US automotive patents)

  • 류원림;김영준
    • 디지털융복합연구
    • /
    • 제20권3호
    • /
    • pp.283-295
    • /
    • 2022
  • 특허의 피인용 수는 특허의 질적 가치와 기업의 가치와 긍정적인 상관관계가 있으며, 특허의 질적 가치를 나타내는 지표 중 하나이다. 본 연구는 특허의 피인용 수에 영향을 끼치는 주요 요인을 살펴보기 위하여, 국제특허분류코드인 IPC가 다양한 분야인 자동차 산업을 대상으로, 글로벌 상위 자동차 업체 14개사의 미국 특허 47,354건에 대하여 음이항 모델 회귀분석을 수행하였다. 분석결과, 출원후 경과년도, 특허의 청구항 수, 특허 패밀리 국가 수, 특허 패밀리 수, IPC 코드의 총 수뿐만 아니라, IPC 다양성 수가 특허의 피인용 수에 긍정적인 유의미한 영향을 미치는 것으로 나타났다. 본 연구의 결과는 향후, 대학, 연구소 및 기업의 기술이전이나 라이선싱을 위한 전략을 세우는 데 있어서, IPC 다양성 지표를 함께 고려할 수 있는 기초적 근거를 제공할 수 있을 것으로 기대된다.

온라인 리뷰 유용성에 영향을 미치는 요인: 가격의 조절 효과 (Factors Affecting the Usefulness of Online Reviews: The Moderating Role of Price)

  • 윤지윤;노유나;권보람;장정주
    • 한국전자거래학회지
    • /
    • 제27권2호
    • /
    • pp.153-173
    • /
    • 2022
  • 본 연구는 yelp.com에서 2019년 작성된 온라인 음식점 리뷰를 분석하고, 음식점 소비 의사결정 과정에서 온라인 리뷰의 유용성 결정에 영향을 미치는 요인을 탐색한다. 구체적으로 리뷰 유용성에 영향을 미칠 것으로 예상되는 요인들을 정교화 가능성 모델에 따라 분류하고, 레스토랑의 가격대에 따라 그 영향이 달라질 것이라고 가정하였다. 2020년 2월 yelp.com에서 제공한 데이터 중, 미국 네바다주에 위치한 Food and Restaurant 카테고리에 속하는 업체들의 온라인 리뷰를 분석 대상으로 하였다. 음이항회귀분석 결과, 리뷰 깊이, 가독성을 포함한 중심단서 및 리뷰 일관성, 리뷰어 인기, 리뷰어 노출을 포함한 주변 단서가 리뷰 유용성에 긍정적인 영향을 미치는 것으로 확인되었다. 또한 음식점의 가격대가 높아질수록 리뷰 유용성에 영향을 미치는 선행요인의 영향이 달라지는 것으로 확인되었다. 본 연구는 레스토랑 가격이 리뷰의 유용성에 대한 중심 및 주변 단서의 영향을 조절한다는 것을 밝혔으며, 또한 리뷰 플랫폼과 외식업에 가격에 따라 차별화된 리뷰 관리 전략의 필요성에 대한 시사점을 제공한다.