• 제목/요약/키워드: 로그 모형

검색결과 219건 처리시간 0.023초

생존분석을 위한 통계패키지의 비교 연구 - SAS, SPSS, STATA -

  • 조미순;김순귀
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2003년도 추계 학술발표회 논문집
    • /
    • pp.335-340
    • /
    • 2003
  • 최근 들어 생존분석 기법이 여러 분야에서 관심을 모으고 있을 뿐 아니라 생존자료를 분석하기 위한 여러 패키지들도 개발되어 연구되고 있다. 본고에서는 생존분석의 여러 모형을 간략히 소개하고 생존자료를 분석하기 위하여 널리 사용되고 있는 패키지인 SAS, SPSS, STATA의 기능을 찾아보고 그들의 특징을 비교 조사할 것이다.

  • PDF

시간에 따라 변화하는 로그-정규분포와 파레토 합성 분포의 모형 추정 (Time-varying modeling of the composite LN-GPD)

  • 박소진;백창룡
    • 응용통계연구
    • /
    • 제31권1호
    • /
    • pp.109-122
    • /
    • 2018
  • 임계값을 기준으로 그 보다 작은 값은 로그정규분포(lognormal distribution; LN)를, 큰 값은 일반화파레토분포(generalized Pareto distribution; GPD)를 따르는 합성 분포를 LN-GPD 합성분포라 한다. Scollnik (2007)은 LN-GPD 합성분포가 로그정규분포와 GPD를 합성 시킴으로써 자료의 손실 없이 꼬리가 두꺼운 분포에서 좋은 적합력을 가진다고 밝혔다. 본 논문에서는 시간에 따라 변하는 LN-GPD 평균모형을 다루었으며 방법론으로는 국소 다항최대우도법을 기반으로 추정하는 방법에 대해서 연구하였다. 시간에 따라 변하는 분포를 추정함으로써 자료에 대한 훨씬 자세한 이해가 가능하며 이는 곧 상담원 배치나 자원배분과 같은 운영관리에 큰 도움을 줄 수 있다. 본 연구는 GPD 분포만을 고려한 Beirlant와 Goegebeur (2004)를 확장하여 절삭한 로그정규분포를 추가하여 자료의 손실 없이 자료의 특징을 살펴볼 수 있다는데도 의의가 있다. 모의실험을 통해 제안한 방법론의 적절함을 살펴 보았고 실증 자료 분석으로 이스라엘 은행의 콜센터 서비스 시간에 대해 분석하여 상담원 배치와 관련된 흥미로운 결과를 찾을 수 있었다.

동영상 기반 학습 환경에서 머신러닝을 활용한 행동로그의 학업성취 예측 모형 탐색 (Exploration of Predictive Model for Learning Achievement of Behavior Log Using Machine Learning in Video-based Learning Environment)

  • 이정은;김다솜;조일현
    • 컴퓨터교육학회논문지
    • /
    • 제23권2호
    • /
    • pp.53-64
    • /
    • 2020
  • 동영상 강의 중심의 온라인 학습 형태가 보편화 되고 지속적으로 증가됨에 따라 다양한 교육방법을 적용한 동영상 기반 학습 환경도 학습 효과성을 높이기 위해 변화, 발전하고 있다. 온라인 학습 환경에서의 교육 효과성 측정을 위해 학습자 로그 데이터가 대두되었으며, 학습자 맞춤형 학습 처방을 위해 로그 데이터의 다양한 분석 방법이 중요하다. 이를 위해 본 연구에서는 동영상 기반 학습 환경에서의 학습자 행동 데이터 분석, 머신러닝 기법에 따른 학업성취 예측을 실험을 통해 분석하였다. 분석 결과 각 모델에서 공통적으로 동영상 탐색과 코멘트 작성과 같은 상호작용 행동, 학습자 주도적 학습 행동이 학업성취를 예측하였다. 연구 결과를 토대로 동영상 학습 환경 설계에 있어 시사점을 제공하였다.

중국 도시화율의 재구성과 과잉/과소 도시화 문제의 성격 (Reconstruction of Urbanization Levels and the Nature of Over/underurbanization Problems in China)

  • 전광희
    • 한국인구학
    • /
    • 제27권2호
    • /
    • pp.257-289
    • /
    • 2004
  • 이 연구의 목적은 중국의 도시화율을 재구성하고 그것을 바탕으로 과잉/과소 도시화 논쟁을 재점검하는 것이다. 연구는 과거에 발표된 도시화율에 비하여 2000년 센서스 보고서에 발표된 36.01%의 도시화율이 신뢰할만한 수치인가하는 질문에서 출발한다. 여기에 대한 답은 부정적이다. 따라서 이 연구는 유엔의 도시/농촌 인구성장 예측기법을 사용하여, 도시화율에 관한 두 세트의 시계열 자료를 재구성한다, 이 연구는 그 중 하나인 1982~2000년 자료를 바탕으로 과잉/과소 도시화 문제의 성격을 해명한다. 이 연구는 1인당 국민소득과 도시화의 관계를 해명하기 위한 두 종류의 회귀모형을 개발한다. 세계은행의 자료를 바탕으로 전세계의 경제발전과 도시화 수준에 관계에 관한 회귀방정식을 추정하고, 선형방정식보다 로그방정식이 예측력이 높음을 확인한다. 로그방정식의 추정결과에 따르면, 중국은 1978년 개혁${\cdot}$개방정책 이전에는 과잉 도시화되었고, 최근에 들어 오히려 도시화의 지체로 인한 과소 도시화의 문제가 통계적으로 유의미한 현상이 되고 있다. 분석의 결과는 중국이 1978년 시장경제를 도입한지 15년이 지난 이후에야 도시화 지체현상이 나타나고 있음에 주목하면서, 중국의 각종 도시정책이 도시발전에 강력한 장애물로 규제력을 행사하였음을 강조한다.

오감 인터랙션을 활용한 문화유산 디지로그 전시 기법 연구 (A Study on Digilog Exhibition Technique of Cultural Heritage using Five Senses Interaction)

  • 박정연;유정민
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제62차 하계학술대회논문집 28권2호
    • /
    • pp.413-414
    • /
    • 2020
  • 본 논문에서는 수중 문화재를 주제로 오감 인터랙션을 활용한 디지로그 전시 기법을 연구한다. 영상을 활용한 디지털미디어가 중심인 기존의 전시 기법에 시각, 청각, 촉각과 같은 다양한 감각기관을 활용한 인터랙션을 추가함으로써 관람객에게 새로운 경험을 제공하고자 한다. 프로젝션 매핑, 증강현실과 같은 디지털 기술과 난파선과 자갈, 실물 크기의 모형 유물과 같은 아날로그를 결합하여 관람객에게 실재감을 주어 효과적인 몰입감(flow)을 유도하고자 한다.

  • PDF

통계적 공정관리(SPC)를 이용한 무한고장 소프트웨어 신뢰성 모형에 대한 접근방법 연구 (Assessing Infinite Failure Software Reliability Model Using SPC (Statistical Process Control))

  • 김희철;신현철
    • 융합보안논문지
    • /
    • 제12권6호
    • /
    • pp.85-92
    • /
    • 2012
  • 소프트웨어의 디버깅에 오류 발생의 시간을 기반으로 하는 많은 소프트웨어 신뢰성 모델이 제안되어 왔다. 무한고장 모형과 비동질적인 포아송 과정에 의존한 소프트웨어 신뢰성 모형을 이용하면 모수 추정이 가능하다. 소프트웨어를 시장에 인도하는 결정을 내리기 위해서는 조건부 고장률이 중요한 변수가 된다. 유한 고장 모형은 실제 상황에서 다양한 분야에 사용된다. 특성화 문제, 특이점의 감지, 선형 추정, 시스템의 안정성 연구, 수명을 테스트, 생존 분석, 데이터 압축 및 기타 여러 분야에서의 사용이 점점 많아지고 있다. 통계적 공정 관리 (SPC)는 소프트웨어 고장의 예측을 모니터링 함으로써 소프트웨어 신뢰성의 향상에 크게 기여 할 수 있다. 컨트롤 차트는 널리 소프트웨어 산업의 소프트웨어 공정 관리에 사용되는 도구이다. 본 논문에서 NHPP에 근원을 둔 로그 포아송 실행시간 모형, 로그선형 모형 그리고 파레토 모형의 평균값 함수를 이용한 통계적 공정관리 차트를 이용한 제어 메커니즘을 제안하였다.

극값분포 특성에 근거한 소프트웨어 최적 방출시기에 관한 비교 (The Comparative Study of Software Optimal Release Time Based on Extreme Distribution Property)

  • 김희철
    • 전기전자학회논문지
    • /
    • 제15권1호
    • /
    • pp.43-48
    • /
    • 2011
  • 본 연구에서는 소프트웨어 제품을 개발하여 테스팅을 거친 후 사용자에게 인도하는 시기를 결정하는 방출문제에 대하여 연구되었다. 무한고장수를 가진 비동질적인 포아송 과정에 기초하고 수명분포는 최소 및 최대값을 적합 시키는데 효율성을 가진 극값 분포를 이용한 최적 방출시기에 관한 문제를 제시하여 소프트웨어 요구 신뢰도를 만족시키고 소프트웨어 개발 및 유지 총비용을 최소화 시키는 최적 소프트웨어 방출 정책에 대하여 논의 되었다. 본 논문의 수치적인 예에서는 고장 간격 시간 자료를 적용하여 기존의 로그 포아송 실행시간 모형과 로그 파우어 모형의 대안으로서 극값 분포모형이 또 하나의 대안이 될 수 있음을 입증하였다.

분할표 분석을 위한 절사 LAD 추정량과 최적 절사율 결정 (Trimmed LAD Estimators for Multidimensional Contingency Tables)

  • 최현집
    • 응용통계연구
    • /
    • 제23권6호
    • /
    • pp.1235-1243
    • /
    • 2010
  • 다차원 분할표를 구성하는 범주형 변수들의 연관관계를 식별하기 위하여 널리 이용되는 로그선형모형을 위한 절사 LAD(least absolute deviations) 추정방법을 제안하였다. 제안된 방법은 가중 LAD 추정을 반복하여 계산이 수행되므로 분할표 분석을 위해 적용할 수 있는 여러 연관성 모형(association models)에 직접 적용할 수 있다. 또한 붓스트랩을 이용한 최적절사율을 결정하는 방법이 갖는 공분산행렬을 과소추정하는 문제를 해결하기위한 절사율 결정 방법을 제안하였다. 모의실험을 통해 제안된 방법이 붓스트랩 방법에 비하여 항상 우수한 절사율을 보인다는 것을 설명하였으며, 제안된 방법들의 실제 자료분석 결과를 제시하였다.

코스피 지수 자료의 베이지안 극단값 분석 (A Bayesian Extreme Value Analysis of KOSPI Data)

  • 윤석훈
    • 응용통계연구
    • /
    • 제24권5호
    • /
    • pp.833-845
    • /
    • 2011
  • 본 논문에서는 1998.01.03부터 2011.08.31까지 수집된 코스피 지수 자료로부터 계산된 일별 로그수익률과 일별 로그손실률에 대한 극단값 통계분석을 수행하였다. 사용된 극단값 통계분석 모형은 포아송-GPD 모형이고 모수의 추정과 극단분위수의 추정은 최대가능도 방법을 적용하였다. 본 논문에서는 또한 포아송-GPD 모형에 추가적으로 모수의 무정보사전분포를 가정한 베이지안 방법을 고려하였다. 여기서는 마르코프 연쇄 몬테칼로 방법을 적용하여 모수와 극단분위수를 추정하였다. 분석 결과 최대가능도 방법과 베이지안 방법에서 모두, 로그수익률 분포의 오른쪽 꼬리는 정규분포보다 짧은 반면, 로그손실률 분포의 오른쪽 꼬리는 정규분포보다 두텁다는 결론이 얻어졌다. 극단값 분석에서 베이지안 방법을 사용할 때의 장점은 정칙조건이 만족되지 않는 경우에도 최대가능도추정량의 전통적 점근 성질을 걱정할 필요가 없고 예측의 경우에는 모수의 불확실성과 미래 관측치의 불확실성이 모두 반영되는 효과가 있다는 것이다.

대화시스템의 로그를 이용한 대화예제의 자동 확충에 관한 연구 (A Study on Automatic Expansion of Dialogue Examples Using Logs of a Dialogue System)

  • 홍금원;이정훈;신중휘;이도길;임해창
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.257-262
    • /
    • 2009
  • 본 논문은 예제기반 대화시스템의 대화 로그를 분석하여 새로운 대화예제를 자동으로 확충하는 방법에 대해서 논한다. 전통적인 예제기반 대화 시스템에서는 사용자와 챗봇(chatbot)간의 대화예제를 수작업으로 구축 하기 때문에 많은 시간과 비용이 소요되는 단점을 가지고 있다. 대화 로그는 대화 시스템의 서비스가 지속되는 한 끊임없이 생성이 되며, 시간이 지날수록 풍부하고 다양한 대화예제를 획득할 수 있다는 장점을 갖는다. 본 논문은 대화로그로부터 자연스러운 발화쌍을 분류하고, 분류된 발화쌍을 대화예제로 추가하는 방법을 제안한다. 최대 엔트로피모형을 사용한 실험의 결과, 자연스러운 발화를 결정하기 위해서는 발화의 어휘, 품사, 양태와 같은 자질이 유용하게 사용될 수 있음을 관찰하였고, 수작업 구축에만 의존하던 대화예제가 대화 로그를 사용하여 자동으로 확충될 수 있음을 확인하였다.

  • PDF