• 제목/요약/키워드: 로그 회귀분석

검색결과 92건 처리시간 0.025초

통합 로그 분석 시스템을 위한 통계학적 예측 엔진 개발 (Development of Statistical Prediction Engine for Integrated Log Analysis Systems)

  • 고광만;권범철;김성철;이상준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.638-639
    • /
    • 2013
  • Anymon Plus(ver 3.0)은 통합 로그 분석 시스템으로 대용량 로그 및 빅데이터의 실시간 수집 저장 분석할 수 있는 제품(초당 40,000 이벤트 처리)으로서, 방화벽 로그 분석을 통한 비정상 네트워크 행위 탐지, 웹 로그 분석을 통한 사용 패턴 분석, 인터넷 쇼핑몰 사기 주문 분석 및 탐지, 내부 정부 유출 분석 및 탐지 등과 같은 다양한 분야로 응용이 확대되고 있다. 본 논문에서는 보안관련 인프라 로그를 분석하고 예측하여 예상 보안사고 시기에 집중적 경계를 통한 선제적 대응을 모색하기 위해 통계적 이론에 기반한 통합 로그 분석 시스템을 개발하기 위해, 회귀분석 및 시계열 분석이 가능한 예측 엔진 시스템을 설계하고 구현한다.

포아송 반응을 갖는 로그 선형 회귀 모형에 대한 최우추정량과 모의실험 연구

  • 한정혜;조중재
    • Communications for Statistical Applications and Methods
    • /
    • 제2권1호
    • /
    • pp.22-31
    • /
    • 1995
  • 본 논문에서는 포아송 반응을 갖는 로그 선형 회귀 모형에 붙스트랩 방법을 이용하여, 여러가지 통계적 추론을 위한 유용한 확률적 결과들을 연구.소개하고, 모의실험을 통한 소표본 성질들을 다양하게 제시하고자 한다. 특히 로그 선형 회귀 모형에 대한 최우 추정량 $\hat{\beta_n}$ 및 정보행렬 I(${\beta}_0$)의 추정량들 $I_1(\hat{\beta_n}{\cdot}X)$$I_2(\hat{\beta_n}{\cdot}X)$에 대한 일치성 및 정규성등의 확률적 성질들, 그리고 붙스트랩 방법을 적용한 대표본 성질들과 관련하여 여러가지 모의실험 결과들을 분석.연구하였다.

  • PDF

비선형 회귀모형을 이용한 학년별 학생수 추계 (Estimations of the student numbers by nonlinear regression model)

  • 윤용화;김종태
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권1호
    • /
    • pp.71-77
    • /
    • 2012
  • 본 연구는 코호트 조성법에 의해 구성된 진학률들을 사용한 비선형 회귀모형을 이용하여 장래 초등과 중등, 고등학교의 학년별 학생수를 추계 하는데 목적이 있다. 이러한 진학률들의 모형을 분석하기 위하여 경향-외삽법 중 하나인 비선형 회귀모형의 로그모형과 거듭제곱 모형을 이용하였다. 그 결과 로그모형에 의한 예측이 거듭제곱모형에 의한 예측보다 조금 더 신뢰할 수 있고, 학생수도 적게 예측됨을 알 수 있었다.

로그 회귀분석 및 CART를 활용한 수력사업의 CDM 승인여부 예측 모델에 관한 연구 (Predicting the success of CDM Registration for Hydropower Projects using Logistic Regression and CART)

  • 박종호;구본상
    • 한국건설관리학회논문집
    • /
    • 제16권2호
    • /
    • pp.65-76
    • /
    • 2015
  • 청정개발체제(CDM) 사업은 신재생에너지사업의 보조를 통해 지구온난화 가스의 감축을 꾀하는 대표적인 국가 및 기업 간 배출권 거래(cap and trade)제도이다. 재래식 발전 방식에 비해 수익성이 낮은 태양광, 풍력, 수력 등의 사업이 CDM 사업으로 승인을 받으면 매년 탄소배출권(CER)을 제공받고, 이의 판매를 통해 발생한 추가 수익으로 인해 사업 타당성이 향상될 수 있다. 그러나 CDM 사업으로 인정받기 위해서는 환경적, 기술적, 경제적 추가성(Additionality)를 입증해야 하는데, 해당 적용 기술, 베이스라인 측정 방법론, 온실 가스 감축량, 사업 내부 수익률(IRR) 등 다수의 변수에 따라 결과가 달라지기 때문에 사전적으로 승인여부를 파악하기가 어렵다. 본 연구에서는 신재생에너지로 분류되는 수력 사업의 CDM 승인여부를 예측할 수 있는 모델을 개발하는 것을 목표로 하였다. 구체적으로 UNFCCC에서 제공하는 수력 사업 데이터를 활용하여 로그 회귀분석 및 CART 분석을 실시하여 예측모델을 개발하였으며 이와 함께 승인 여부에 유의하게 영향을 미치는 핵심 인자들을 파악하였다. 구축된 로그 회귀 및 CART 예측모델은 AUC가 각각 0.7674 및 0.7231로 예측 정확성이 비교적 높게 나왔다. 또한 수력 사업에서는 온실가스 저감량 대비 투자액, 시간당 발전량 및 내부수익률이 승인여부에 유의한 변수들로 파악되었고, 이에 비해 특정 기술이나 측정 방법론은 영향이 없는 것으로 드러났다. 즉, 특정 기술을 불문하고 온실가스를 투자 대비 가장 효율적으로 저감하는 사업과 수력사업들 중 상대적으로 소규모로 진행되는 사업이 CDM 사업으로 승인될 가능성이 높다는 것으로 해석된다.

중국 도시화율의 재구성과 과잉/과소 도시화 문제의 성격 (Reconstruction of Urbanization Levels and the Nature of Over/underurbanization Problems in China)

  • 전광희
    • 한국인구학
    • /
    • 제27권2호
    • /
    • pp.257-289
    • /
    • 2004
  • 이 연구의 목적은 중국의 도시화율을 재구성하고 그것을 바탕으로 과잉/과소 도시화 논쟁을 재점검하는 것이다. 연구는 과거에 발표된 도시화율에 비하여 2000년 센서스 보고서에 발표된 36.01%의 도시화율이 신뢰할만한 수치인가하는 질문에서 출발한다. 여기에 대한 답은 부정적이다. 따라서 이 연구는 유엔의 도시/농촌 인구성장 예측기법을 사용하여, 도시화율에 관한 두 세트의 시계열 자료를 재구성한다, 이 연구는 그 중 하나인 1982~2000년 자료를 바탕으로 과잉/과소 도시화 문제의 성격을 해명한다. 이 연구는 1인당 국민소득과 도시화의 관계를 해명하기 위한 두 종류의 회귀모형을 개발한다. 세계은행의 자료를 바탕으로 전세계의 경제발전과 도시화 수준에 관계에 관한 회귀방정식을 추정하고, 선형방정식보다 로그방정식이 예측력이 높음을 확인한다. 로그방정식의 추정결과에 따르면, 중국은 1978년 개혁${\cdot}$개방정책 이전에는 과잉 도시화되었고, 최근에 들어 오히려 도시화의 지체로 인한 과소 도시화의 문제가 통계적으로 유의미한 현상이 되고 있다. 분석의 결과는 중국이 1978년 시장경제를 도입한지 15년이 지난 이후에야 도시화 지체현상이 나타나고 있음에 주목하면서, 중국의 각종 도시정책이 도시발전에 강력한 장애물로 규제력을 행사하였음을 강조한다.

생존분석을 위한 통계패키지의 비교 연구 - SAS, SPSS, STATA -

  • 조미순;김순귀
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2003년도 추계 학술발표회 논문집
    • /
    • pp.335-340
    • /
    • 2003
  • 최근 들어 생존분석 기법이 여러 분야에서 관심을 모으고 있을 뿐 아니라 생존자료를 분석하기 위한 여러 패키지들도 개발되어 연구되고 있다. 본고에서는 생존분석의 여러 모형을 간략히 소개하고 생존자료를 분석하기 위하여 널리 사용되고 있는 패키지인 SAS, SPSS, STATA의 기능을 찾아보고 그들의 특징을 비교 조사할 것이다.

  • PDF

Hadoop기반의 공개의료정보 빅 데이터 분석을 통한 한국여성암 검진 요인분석 서비스 (Analysis of Factors for Korean Women's Cancer Screening through Hadoop-Based Public Medical Information Big Data Analysis)

  • 박민희;조영복;김소영;박종배;박종혁
    • 한국정보통신학회논문지
    • /
    • 제22권10호
    • /
    • pp.1277-1286
    • /
    • 2018
  • 본 논문에서는 공개의료정보 빅데이터 분석을 위해 클라우드 환경에서 아파치 하둡 기반의 클라우드 환경을 도입하여 컴퓨팅 자원의 유연한 확장성을 제공하고 실제로, 로그데이터가 장기간 축적되거나 급격하게 증가하는 상황에서 스토리지, 메모리 등의 자원을 신속성 있고 유연하게 확장을 할 수 있는 기능을 포함했다. 또한, 축적된 비정형 로그데이터의 실시간 분석이 요구되어질 때 기존의 분석도구의 처리한계를 극복하기 위해 본 시스템은 하둡 (Hadoop) 기반의 분석모듈을 도입함으로써 대용량의 로그데이터를 빠르고 신뢰성 있게 병렬 분산 처리할 수 있는 기능을 제공한다. 빅데이터 분석을 위해 빈도분석과 카이제곱검정을 수행하고 유의 수준 0.05를 기준으로 단변량 로지스틱 회귀분석과 모델별 의미 있는 변수들의 다변량 로지스틱 회귀분석을 시행 하였다. (p<0.05) 의미 있는 변수들을 모델별로 나누어 다변량 로지스틱 회귀 분석한 결과 Model 3으로 갈수록 적합도가 높아졌다.

로그 회귀분석을 이용한 해외 엔지니어링 사업의 낙찰 성공 요인 분석 - 세계은행의 인도네시아 사업을 중심으로- (Using Logistic Regression for Determining the Factors Affecting Bidding Success in World Bank's International Consulting Projects in Indonesia)

  • 유영수;신병진;구본상;한승헌
    • 한국건설관리학회논문집
    • /
    • 제19권1호
    • /
    • pp.80-89
    • /
    • 2018
  • 세계은행에서 발주하는 사업은 국내 엔지니어링 기업에게 신규 시장 진출의 기회가 될 수 있으며 이에 따른 지역 및 사업 다각화를 가능케 해준다. 그러나 세계은행 사업에 참여하기 위해서는 입찰에 성공하기 위한 중요 요인이 무엇인지 선제적으로 파악해야 한다. 세계은행은 오픈 DB를 통해 전 세계에서 입찰한 사업 정보를 공개하고 있으며, 이는 낙찰 성공요인을 실증적으로 분석할 수 있는 기회를 제공해주고 있다. 본 연구에서는 본 데이터 중 인도네시아 관련 정보를 웹스크레이핑 기술을 활용하여 수집하고 이를 기반으로 로그 회귀분석을 실시하여 낙찰 성공요인을 통계적으로 추정하였다. 그 결과 해당 공종실적, 컨소시엄 구축 여부 및 현지기업과 제휴 여부가 낙찰 성공 여부에 긍정적으로 영향을 주는 것을 파악되었다. 반면, 현지기업이 동 입찰에 참여할 경우 부정적 영향을 주는 것을 볼 수 있었다. 이에 따라 국내 엔지니어링 기업들은 국제적으로 인정받는 공종 실적을 쌓고, 컨소시엄 구성 시 현지 기업을 포함시키는 동시에, 현지기업이 단독으로 수행할 수 있는 비교적 단순 공종 사업에는 참여를 피하는 것이 좋을 것으로 판단된다.

욕구 충족 영상 콘텐츠(브이로그 / ASMR / 먹방) 이용 동기, 수용자 특성, 시청 만족도에 관한 연구 (A Study on Use Motivation, Consumers' Characteristics, and Viewing Satisfaction of Need Fulfillment Video Contents(Vlog / ASMR / Muk-bang))

  • 강미정;조창환
    • 한국콘텐츠학회논문지
    • /
    • 제20권1호
    • /
    • pp.73-98
    • /
    • 2020
  • 본 연구는 메이저 동영상 콘텐츠로 떠오르는 브이로그, ASMR, 먹방 콘텐츠를 '욕구 충족 영상 콘텐츠'로 새롭게 개념 규정하고, 이용과 충족 이론 관점에서 수용자의 이용 동기 및 인구통계학적 특성, 5대 성격, 개인주의-집단주의 성향으로 구성된 수용자 특성과 시청 만족도 간 상관관계를 탐색하였다. 분석에는 해당 콘텐츠 시청 경험이 있는 441명의 표본에 대하여 요인분석, 위계적 회귀분석 등의 통계분석 기법이 활용되었다. 그 결과 욕구 충족 영상 콘텐츠 시청 장르에 영향을 미치는 수용자 특성은 연령, 소득수준, 집단주의로 나타났으며, 이용 동기는 자기 평가 및 향상, 감각 자극 및 안정, 재미 추구, 도피 및 시간보내기, 유행 추구의 5개 하위 요인으로 구성되었다. 아울러 5가지 이용 동기에 영향을 미치는 수용자 특성이 각각 다르게 나타났으며, 각 이용 동기가 시청 만족도에 미치는 영향도 다양하게 확인되었다. 이어 분석 결과를 토대로 본 연구가 갖는 학문적 의의 및 욕구 충족 영상 콘텐츠 산업 발전을 위한 실무적 시사점을 제시하였다.

방향성 공간적 조건부 자기회귀 모형의 베이즈 분석 방법 (Bayesian analysis of directional conditionally autoregressive models)

  • 경민정
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권5호
    • /
    • pp.1133-1146
    • /
    • 2016
  • 공간통계 방법 중 지역에 대한 어떤 집합체 자료나 평균자료들을 분석하는데 일반적으로 공간적 자기회귀 (conditionally autoregressive) 모형을 사용한다. 공간적 자기회귀 모형에 정의되는 공간적 이웃 소지역들은 중점의 거리나 근접성으로 정의된다. Kyung과 Ghosh (2009)는 방향에 따라서 이웃간 자기상관성의 크기가 다른 확장된 공간 모형을 제시하였다. 제안된 방향적 조건부 자기회귀 (directional conditionally autoregressive) 모형은 고유 이방성을 모형화하여 기존의 CAR과정을 일반화한다. 제시한 방향적 조건부 자기회귀모형의 모수추정으로 마르코프 체인 몬테 카를로 방법을 기반으로 한 베이즈 추정법을 제시한다. 제시한 모형을 스코틀랜드 그레이터 글래스고우의 로그변환된 부동산 가격에 적용하여 조건부 자기회귀모형과 비교하였다.